تقنيات تجزئة الصور [التنفيذ خطوة بخطوة]

نشرت: 2021-02-19

ما الذي تراه أولاً عندما تنظر إلى صورتك الذاتية؟ وجهك صحيح؟ يمكنك تحديد وجهك لأن عقلك قادر على التعرف على وجهك وفصله عن بقية الصورة (الخلفية).

الآن ، إذا كنت تريد أن يتعرف جهاز الكمبيوتر الخاص بك على وجهك في صورة شخصية ، فهل سيكون قادرًا على القيام بذلك؟

نعم ، بشرط أن تتمكن من إجراء تجزئة للصورة.

في مقال اليوم ، سنناقش تقسيم الصور وجميع جوانبها الرئيسية بما في ذلك تقنيات تجزئة الصور المختلفة التي يمكنك استخدامها. ومع ذلك ، فهي قراءة طويلة لذا نوصي بوضع إشارة مرجعية على هذه المقالة حتى تتمكن من العودة إليها لاحقًا.

قبل أن نبدأ في مناقشة التقنيات المختلفة للتجزئة في معالجة الصور ، يجب أن نكتشف أولاً ، "ما هو تجزئة الصورة؟"

جدول المحتويات

ما هو تجزئة الصورة؟

تجزئة الصورة هي فرع من فروع معالجة الصور الرقمية التي تركز على تقسيم الصورة إلى أجزاء مختلفة وفقًا لخصائصها وخصائصها. الهدف الأساسي من تجزئة الصورة هو تبسيط الصورة لتحليل أسهل. في تجزئة الصورة ، تقوم بتقسيم الصورة إلى أجزاء مختلفة لها سمات متشابهة. تسمى الأجزاء التي تقسم الصورة بها كائنات الصورة.

إنها الخطوة الأولى لتحليل الصور. بدون إجراء تجزئة للصورة ، سيكون من المستحيل تقريبًا تنفيذ تطبيقات رؤية الكمبيوتر بالنسبة لك.

باستخدام تقنيات تجزئة الصورة ، يمكنك تقسيم وحدات البكسل الخاصة بالمجموعة من صورة وتعيين تسميات لها وتصنيف وحدات البكسل الإضافية وفقًا لهذه الملصقات. يمكنك رسم خطوط وتحديد الحدود وفصل كائنات معينة (مكونات مهمة) في صورة ما عن باقي الكائنات (مكونات غير مهمة).

في التعلم الآلي ، يمكنك استخدام الملصقات التي أنشأتها من تجزئة الصور للتدريب الخاضع للإشراف وغير الخاضع للإشراف. سيسمح لك هذا بحل العديد من مشاكل العمل.

سيكون من الأفضل فهم كيفية عمل تجزئة الصور على سبيل المثال.

انظر إلى الصورة التالية.

مصدر

هنا ، يمكنك رؤية كرسي موضوع في منتصف الطريق. باستخدام تجزئة الصورة ، يمكنك فصل الكرسي عن الصورة. علاوة على ذلك ، يمكنك استخدام العديد من تقنيات تجزئة الصور للحصول على نتائج مختلفة. على سبيل المثال ، إذا أردت استخدام صورة بها كراسي متعددة ، فسيتعين عليك استخدام التجزئة الدلالية.

من ناحية أخرى ، إذا أردت تحديد كل كرسي موجود في صورة مثل ما يلي ، فسيتعين عليك استخدام تجزئة المثيل:

مصدر

لماذا يعد تجزئة الصور ضروريًا؟

يعد تجزئة الصور جانبًا كبيرًا من رؤية الكمبيوتر وله العديد من التطبيقات في العديد من الصناعات. بعض المناطق البارزة حيث يتم استخدام تجزئة الصور بكثرة هي:

1. التعرف على الوجوه

تستخدم تقنية التعرف على الوجه الموجودة في جهاز iPhone وأنظمة الأمان المتقدمة تجزئة الصور للتعرف على وجهك. يجب أن يكون قادرًا على تحديد الميزات الفريدة لوجهك حتى لا يتمكن أي طرف غير مرغوب فيه من الوصول إلى هاتفك أو نظامك.

2. تحديد رقم اللوحة

تستخدم العديد من إشارات المرور والكاميرات تحديد لوحة الأرقام لفرض الغرامات والمساعدة في عمليات البحث. تسمح تقنية التعرف على لوحة الأرقام لنظام المرور بالتعرف على السيارة والحصول على المعلومات المتعلقة بملكيتها. يستخدم تجزئة الصورة لفصل لوحة الأرقام ومعلوماتها عن بقية الكائنات الموجودة في رؤيتها. لقد عملت هذه التكنولوجيا على تبسيط عملية الغرامة إلى حد كبير بالنسبة للحكومات.

3. البحث القائم على الصور

تستخدم Google ومحركات البحث الأخرى التي تقدم تسهيلات بحث قائمة على الصور تقنيات تجزئة الصور لتحديد الكائنات الموجودة في صورتك ومقارنة نتائجها بالصور ذات الصلة التي يعثرون عليها لتعطيك نتائج البحث.

4. التصوير الطبي

في القطاع الطبي ، نستخدم تجزئة الصور لتحديد وتحديد الخلايا السرطانية ، وقياس أحجام الأنسجة ، وتشغيل محاكاة الجراحة الافتراضية ، وإجراء التنقل داخل الجراحة. تجزئة الصور لها العديد من التطبيقات في القطاع الطبي. يساعد في تحديد المناطق المصابة والتخطيط للعلاجات لنفسها.

بصرف النظر عن هذه التطبيقات ، فإن تجزئة الصور لها استخدامات في التصنيع والزراعة والأمن والعديد من القطاعات الأخرى. نظرًا لأن تقنيات رؤية الكمبيوتر الخاصة بنا أصبحت أكثر تقدمًا ، فستزيد استخدامات تقنيات تجزئة الصور وفقًا لذلك.

على سبيل المثال ، بدأت بعض الشركات المصنعة في استخدام تقنيات تجزئة الصور للعثور على المنتجات المعيبة. هنا ، ستلتقط الخوارزمية المكونات الضرورية فقط من صورة الكائن وتصنفها على أنها معيبة أو مثالية. يقلل هذا النظام من مخاطر الأخطاء البشرية ويجعل عملية الاختبار أكثر كفاءة للمؤسسة.

التطبيقات الشائعة لتصنيف الصور موجودة في Python و C و C ++ و Matlab.

ما هي الأنواع المختلفة لتجزئة الصور؟

يعد تجزئة الصورة موضوعًا واسعًا جدًا وله طرق مختلفة لمتابعة هذه العملية. يمكننا تصنيف تجزئة الصورة وفقًا للمعايير التالية:

1. التصنيف القائم على النهج

بمعناها الأساسي ، تجزئة الصورة هي تعريف الكائن. لا تستطيع الخوارزمية تصنيف المكونات المختلفة دون تحديد كائن أولاً. من التطبيقات البسيطة إلى المعقدة ، تعمل كل تجزئة الصور على أساس تحديد الكائن.

لذلك ، يمكننا تصنيف طرق تجزئة الصور بناءً على الطريقة التي تحدد بها الخوارزميات الكائنات ، مما يعني ، جمع وحدات البكسل المتشابهة وفصلها عن وحدات البكسل غير المتشابهة. هناك طريقتان لأداء هذه المهمة:

النهج القائم على المنطقة (الكشف عن التشابه)

في هذه الطريقة ، تكتشف وحدات بكسل مماثلة في الصورة وفقًا لعتبة محددة ، ودمج المنطقة ، وانتشار المنطقة ، وتزايد المنطقة. تستخدم خوارزميات التجميع والتعلم الآلي المماثلة هذه الطريقة لاكتشاف الميزات والسمات غير المعروفة. تتبع خوارزميات التصنيف هذا النهج لاكتشاف الميزات وفصل مقاطع الصورة وفقًا لها.

النهج القائم على الحدود (كشف عدم الاستمرارية)

النهج القائم على الحدود هو عكس النهج القائم على المنطقة لتحديد الكائن. على عكس الاكتشاف المستند إلى المنطقة ، حيث تجد وحدات البكسل لها ميزات متشابهة ، ستجد وحدات بكسل تختلف عن بعضها البعض في النهج القائم على الحدود. يتبع اكتشاف النقاط واكتشاف الحواف واكتشاف الخط والخوارزميات المماثلة هذه الطريقة حيث يكتشفون حافة وحدات البكسل غير المتشابهة ويفصلونها عن بقية الصورة وفقًا لذلك.

2. التصنيف القائم على التقنية

كلا الأسلوبين لهما تقنيات تجزئة الصور المميزة. نستخدم هذه التقنيات وفقًا لنوع الصورة التي نريد معالجتها وتحليلها ونوع النتائج التي نريد استخلاصها منها.

بناءً على هذه المعلمات ، يمكننا تقسيم خوارزميات تجزئة الصور إلى الفئات التالية:

التقنيات الهيكلية

تتطلب هذه الخوارزميات أن يكون لديك البيانات الهيكلية للصورة التي تستخدمها. يتضمن ذلك وحدات البكسل والتوزيعات والمدرج التكراري وكثافة البكسل وتوزيع الألوان والمعلومات الأخرى ذات الصلة. بعد ذلك ، يجب أن يكون لديك البيانات الهيكلية الخاصة بالمنطقة التي يجب عليك فصلها عن الصورة.

ستحتاج إلى هذه المعلومات حتى تتمكن الخوارزمية الخاصة بك من تحديد المنطقة. تتبع الخوارزميات التي نستخدمها لهذه التطبيقات النهج القائم على المنطقة.

تقنيات العشوائية

تتطلب هذه الخوارزميات معلومات حول قيم البكسل المنفصلة للصورة ، بدلاً من بنية القسم المطلوب من الصورة. نتيجة لذلك ، لا تتطلب الكثير من المعلومات لأداء تجزئة الصورة وتكون مفيدة عندما يتعين عليك العمل مع صور متعددة. تقع خوارزميات التعلم الآلي مثل K-mean clustering وخوارزميات ANN في هذه الفئة.

التقنيات الهجينة

كما يمكنك التخمين من الاسم ، تستخدم هذه الخوارزميات كلاً من الأساليب العشوائية والهيكلية. هذا يعني أنهم يستخدمون المعلومات الهيكلية للمنطقة المطلوبة ومعلومات البكسل المنفصلة للصورة بأكملها لأداء تجزئة الصورة.

ما هي الأنواع المختلفة لتقنيات تجزئة الصور؟

الآن بعد أن عرفنا الأساليب المختلفة وأنواع التقنيات لتجزئة الصور ، يمكننا البدء في مناقشة التفاصيل. فيما يلي الأنواع الأساسية لتقنيات تجزئة الصور:

  1. تجزئة العتبة
  2. تجزئة على أساس الحافة
  3. التقسيم حسب المنطقة
  4. تجزئة مستجمعات المياه
  5. خوارزميات التجزئة القائمة على الكتلة
  6. الشبكات العصبية للانقسام

دعونا نناقش كل واحدة من هذه التقنيات بالتفصيل لفهم خصائصها وفوائدها وقيودها:

1. تجزئة العتبة

إن أبسط طريقة للتجزئة في معالجة الصور هي طريقة العتبة. يقسم البيكسلات في الصورة بمقارنة كثافة البكسل بقيمة محددة (العتبة). يكون مفيدًا عندما يكون للكائن المطلوب كثافة أعلى من الخلفية (الأجزاء غير الضرورية).

يمكنك اعتبار قيمة العتبة (T) ثابتة ولكنها لن تعمل إلا إذا كانت الصورة بها ضوضاء قليلة جدًا (معلومات وبيانات غير ضرورية). يمكنك الحفاظ على قيمة العتبة ثابتة أو ديناميكية وفقًا لمتطلباتك.

تقوم طريقة العتبة بتحويل الصورة ذات المقياس الرمادي إلى صورة ثنائية بتقسيمها إلى جزأين (أقسام مطلوبة وغير مطلوبة).

وفقًا لقيم العتبة المختلفة ، يمكننا تصنيف تجزئة العتبة في الفئات التالية:

عتبة بسيطة

في هذه الطريقة ، تستبدل وحدات البكسل في الصورة إما باللون الأبيض أو الأسود. الآن ، إذا كانت شدة البكسل في موضع معين أقل من قيمة الحد ، يمكنك استبداله باللون الأسود. من ناحية أخرى ، إذا كانت أعلى من الحد الأدنى ، فستستبدلها باللون الأبيض. هذا حد بسيط ومناسب بشكل خاص للمبتدئين في تجزئة الصور.

ثنائيات أوتسو

في عتبة بسيطة ، اخترت قيمة عتبة ثابتة واستخدمتها لأداء تجزئة الصورة. ومع ذلك ، كيف تحدد أن القيمة التي اخترتها كانت صحيحة؟ في حين أن الطريقة المباشرة لذلك هي اختبار قيم مختلفة واختيار واحدة ، إلا أنها ليست الأكثر فاعلية.

التقط صورة مع رسم بياني به قمتان ، واحدة للمقدمة والأخرى للخلفية. باستخدام Otsu binarization ، يمكنك أخذ القيمة التقريبية لمنتصف تلك القمم كقيمة حدية.

في Otsu الثنائي ، يمكنك حساب قيمة الحد من الرسم البياني للصورة إذا كانت الصورة ثنائية النسق.

هذه العملية شائعة جدًا لمسح المستندات ضوئيًا والتعرف على الأنماط وإزالة الألوان غير الضرورية من ملف. ومع ذلك، فإنه يحتوي على العديد من القيود. لا يمكنك استخدامه للصور غير ثنائية النسق (الصور التي تحتوي مخططاتها التكرارية على قمم متعددة).

عتبة التكيف

قد لا يكون الحصول على قيمة حد ثابتة واحدة طريقة مناسبة للتعامل مع كل صورة. الصور المختلفة لها خلفيات وشروط مختلفة تؤثر على خصائصها.

وبالتالي ، بدلاً من استخدام قيمة حد ثابتة واحدة لإجراء التجزئة على الصورة بأكملها ، يمكنك الاحتفاظ بمتغير قيمة الحد. في هذه التقنية ، ستحتفظ بقيم حد مختلفة لأقسام مختلفة من الصورة.

تعمل هذه الطريقة بشكل جيد مع الصور ذات ظروف الإضاءة المختلفة. ستحتاج إلى استخدام خوارزمية تقسم الصورة إلى أقسام أصغر وتحسب قيمة الحد لكل منها.

2. تجزئة على أساس الحافة

يعد التقسيم القائم على الحافة أحد أكثر تطبيقات التجزئة شيوعًا في معالجة الصور. يركز على تحديد حواف الكائنات المختلفة في الصورة. هذه خطوة حاسمة لأنها تساعدك في العثور على ميزات الكائنات المختلفة الموجودة في الصورة حيث تحتوي الحواف على الكثير من المعلومات التي يمكنك استخدامها.

يعد اكتشاف الحواف شائعًا على نطاق واسع لأنه يساعدك في إزالة المعلومات غير المرغوب فيها وغير الضرورية من الصورة. إنه يقلل حجم الصورة بشكل كبير ، مما يسهل تحليلها.

تحدد الخوارزميات المستخدمة في التقسيم المستند إلى الحافة الحواف في الصورة وفقًا للاختلافات في النسيج والتباين ومستوى الرمادي واللون والتشبع وخصائص أخرى. يمكنك تحسين جودة نتائجك عن طريق ربط جميع الحواف بسلاسل حواف تتطابق مع حدود الصورة بدقة أكبر.

هناك العديد من طرق التجزئة القائمة على الحافة المتاحة. يمكننا تقسيمها إلى فئتين:

كشف الحواف المعتمد على البحث

تركز طرق اكتشاف الحواف المستندة إلى البحث على حساب مقياس قوة الحافة والبحث عن الحد الأقصى للاتجاه المحلي لحجم التدرج من خلال تقدير محسوب للتوجه المحلي للحافة.

كشف الحواف المعتمد على الصفر

تبحث طرق اكتشاف الحواف المستندة إلى الصفر عن تقاطعات صفرية في تعبير مشتق تم استرداده من الصورة للعثور على الحواف.

عادة ، سيتعين عليك معالجة الصورة مسبقًا لإزالة التشويش غير المرغوب فيه وتسهيل اكتشاف الحواف. يعد Canny و Prewitt و Deriche و Roberts Cross من أشهر مشغلي اكتشاف الحواف. إنها تجعل من السهل اكتشاف الانقطاعات والعثور على الحواف.

في الاكتشاف القائم على الحافة ، هدفك هو الحصول على حد أدنى من التجزئة الجزئية حيث يمكنك تجميع كل الحواف المحلية في صورة ثنائية. في صورتك الثنائية التي تم إنشاؤها حديثًا ، يجب أن تتطابق سلاسل الحافة مع المكونات الحالية للصورة المعنية.

3. التقسيم على أساس المنطقة

تقسم خوارزميات التجزئة القائمة على المنطقة الصورة إلى أقسام ذات ميزات متشابهة. هذه المناطق ليست سوى مجموعة من وحدات البكسل وتجد الخوارزمية هذه المجموعات من خلال تحديد نقطة البداية أولاً والتي يمكن أن تكون جزءًا صغيرًا أو جزءًا كبيرًا من صورة الإدخال.

بعد العثور على النقاط الأولية ، ستقوم خوارزمية التجزئة القائمة على المنطقة إما بإضافة المزيد من البكسلات إليها أو تقليصها حتى تتمكن من دمجها مع نقاط أولية أخرى.

بناءً على هاتين الطريقتين ، يمكننا تصنيف التجزئة على أساس المنطقة إلى الفئات التالية:

المنطقة المتنامية

في هذه الطريقة ، تبدأ بمجموعة صغيرة من وحدات البكسل ثم تبدأ في دمج المزيد من وحدات البكسل بشكل متكرر وفقًا لظروف تشابه معينة. ستختار خوارزمية نمو المنطقة بكسلًا أوليًا تعسفيًا في الصورة ، ومقارنتها مع وحدات البكسل المجاورة وتبدأ في زيادة المنطقة من خلال إيجاد تطابق مع نقطة البداية.

عندما لا تستطيع منطقة معينة النمو أكثر ، ستختار الخوارزمية بكسلًا أوليًا آخر قد لا ينتمي إلى أي منطقة موجودة. يمكن أن تحتوي منطقة واحدة على سمات كثيرة جدًا مما يجعلها تستحوذ على معظم الصورة. لتجنب مثل هذا الخطأ ، تنمو خوارزميات المنطقة المتنامية مناطق متعددة في نفس الوقت.

يجب عليك استخدام خوارزميات زيادة المنطقة للصور التي تحتوي على الكثير من الضوضاء لأن الضوضاء ستجعل من الصعب العثور على الحواف أو استخدام خوارزميات العتبة.

تقسيم المنطقة ودمجها

كما يوحي الاسم ، فإن الطريقة المركزة لتقسيم المنطقة ودمجها ستؤدي عملين معًا - تقسيم ودمج أجزاء من الصورة.

سيكون أولاً الصورة في مناطق لها سمات متشابهة ودمج الأجزاء المجاورة المتشابهة مع بعضها البعض. في تقسيم المنطقة ، تأخذ الخوارزمية في الاعتبار الصورة بأكملها بينما في نمو المنطقة ، ستركز الخوارزمية على نقطة معينة.

تتبع طريقة تقسيم ودمج المنطقة منهجية فرق تسد. يقسم الصورة إلى أجزاء مختلفة ثم يطابقها وفقًا لشروطها المحددة مسبقًا. اسم آخر للخوارزميات التي تؤدي هذه المهمة هو خوارزميات دمج الانقسام.

4. تجزئة مستجمعات المياه

في معالجة الصور ، فإن مستجمعات المياه عبارة عن تحول في صورة ذات تدرج رمادي. يشير إلى مستجمعات المياه الجيولوجية أو فجوة الصرف. ستتعامل خوارزمية مستجمعات المياه مع الصورة كما لو كانت خريطة طبوغرافية. يعتبر سطوع البكسل ارتفاعه ويجد الخطوط التي تمتد على طول الجزء العلوي من تلك النتوءات.

مستجمعات المياه لديها العديد من التعريفات الفنية ولها العديد من التطبيقات. بصرف النظر عن تحديد حواف وحدات البكسل ، فإنه يركز على تحديد الأحواض (عكس التلال) ويغمر الأحواض بعلامات حتى تلتقي بخطوط مستجمعات المياه التي تمر عبر التلال.

نظرًا لأن الأحواض بها الكثير من العلامات بينما لا توجد حواف ، يتم تقسيم الصورة إلى مناطق متعددة وفقًا لـ "ارتفاع" كل بكسل.

تحوّل طريقة مستجمعات المياه كل صورة إلى خريطة طبوغرافية. تعكس طريقة تجزئة مستجمعات المياه التضاريس من خلال القيم الرمادية لوحدات البكسل الخاصة بها.

الآن ، من المؤكد أن المناظر الطبيعية ذات الوديان والتلال لها جوانب ثلاثية الأبعاد. سوف يأخذ مستجمعات المياه في الاعتبار التمثيل ثلاثي الأبعاد للصورة وإنشاء مناطق وفقًا لذلك ، والتي تسمى "أحواض تجميع المياه".

يحتوي على العديد من التطبيقات في القطاع الطبي مثل التصوير بالرنين المغناطيسي والتصوير الطبي وما إلى ذلك. يعد تجزئة مستجمعات المياه جزءًا بارزًا من تجزئة الصور الطبية ، لذا إذا كنت ترغب في دخول هذا القطاع ، فيجب عليك التركيز على تعلم هذه الطريقة للتجزئة في معالجة الصور بشكل خاص.

5. خوارزميات التجزئة القائمة على الكتلة

إذا كنت قد درست خوارزميات التصنيف ، فلا بد أنك صادفت خوارزميات التجميع. إنها خوارزميات غير خاضعة للإشراف وتساعدك في العثور على البيانات المخفية في الصورة التي قد لا تكون مرئية للرؤية العادية. تتضمن هذه البيانات المخفية معلومات مثل المجموعات والهياكل والظلال وما إلى ذلك.

كما يوحي الاسم ، تقسم خوارزمية التجميع الصورة إلى مجموعات (مجموعات منفصلة) من وحدات البكسل التي لها ميزات مماثلة. سيفصل عناصر البيانات إلى مجموعات حيث تكون العناصر الموجودة في الكتلة أكثر تشابهًا مقارنة بالعناصر الموجودة في المجموعات الأخرى.

تتضمن بعض خوارزميات التجميع الشائعة خوارزميات c غامضة (FCM) ، و k-mean ، وخوارزميات k-mean المحسنة. في تجزئة الصور ، ستستخدم في الغالب خوارزمية التجميع k-mean لأنها بسيطة وفعالة للغاية. من ناحية أخرى ، تضع خوارزمية FCM وحدات البكسل في فئات مختلفة وفقًا لدرجات العضوية المتفاوتة.

أهم خوارزميات التجميع للتجزئة في معالجة الصور هي:

K- يعني التجميع

K-mean هي خوارزمية تعلم آلي بسيطة غير خاضعة للإشراف. يصنف الصورة من خلال عدد محدد من المجموعات. يبدأ العملية بتقسيم مساحة الصورة إلى k بكسل التي تمثل k مجموعة centroids.

ثم يقومون بتعيين كل كائن للمجموعة بناءً على المسافة بينهم وبين النقطه الوسطى. عندما تقوم الخوارزمية بتعيين جميع وحدات البكسل لجميع المجموعات ، يمكنها نقل وإعادة تعيين النقط الوسطى.

وسائل Fuzzy C

باستخدام طريقة التجميع غير الواضحة للوسائل c ، يمكن تجميع وحدات البكسل في الصورة في مجموعات متعددة. هذا يعني أن البكسل يمكن أن ينتمي إلى أكثر من مجموعة واحدة. ومع ذلك ، سيكون لكل بكسل مستويات متفاوتة من أوجه التشابه مع كل مجموعة. تحتوي خوارزمية الوسيلة c الضبابية على وظيفة تحسين تؤثر على دقة نتائجك.

يمكن أن تهتم خوارزميات التجميع بمعظم احتياجات تجزئة الصور الخاصة بك. إذا كنت ترغب في معرفة المزيد عنها ، فراجع هذا الدليل حول ما هو التجميع والأنواع المختلفة من خوارزميات التجميع .

6. الشبكات العصبية للانقسام

ربما لا تريد أن تفعل كل شيء بنفسك. ربما تريد أن يكون لديك ذكاء اصطناعي يقوم بمعظم مهامك ، وهو ما يمكنك بالتأكيد القيام به مع الشبكات العصبية لتجزئة الصور.

يمكنك استخدام الذكاء الاصطناعي لتحليل صورة وتحديد مكوناتها المختلفة مثل الوجوه والأشياء والنص وما إلى ذلك. الشبكات العصبية التلافيفية شائعة جدًا لتجزئة الصور لأنها تستطيع تحديد بيانات الصورة ومعالجتها بسرعة وكفاءة.

أنشأ الخبراء في Facebook AI Research (FAIR) بنية تعليمية عميقة تسمى Mask R-CNN والتي يمكن أن تصنع قناعًا بحجم البكسل لكل كائن موجود في الصورة. إنها نسخة محسّنة من بنية أسرع لاكتشاف كائن R-CNN. يستخدم Faster R-CNN قطعتين من البيانات لكل كائن في الصورة ، وإحداثيات المربع المحيط وفئة الكائن. باستخدام Mask R-CNN ، تحصل على قسم إضافي في هذه العملية. يقوم Mask R-CNN بإخراج قناع الكائن بعد إجراء التجزئة.

في هذه العملية ، ستقوم أولاً بتمرير صورة الإدخال إلى شبكة ConvNet التي تنشئ خريطة الميزة للصورة. ثم يقوم النظام بتطبيق شبكة اقتراح المنطقة (RPN) على خرائط الميزات ويقوم بإنشاء مقترحات الكائن مع درجات الهدف الخاصة بها.

بعد ذلك ، يتم تطبيق طبقة تجمع Roi على المقترحات لتقليص حجمها إلى حجم واحد. في المرحلة النهائية ، يمرر النظام المقترحات إلى الطبقة المتصلة من أجل التصنيف ويولد المخرجات باستخدام المربعات المحيطة لكل كائن.

تعرف على المزيد حول التجزئة في معالجة الصور

يعتبر التقسيم في معالجة الصور بالتأكيد موضوعًا واسعًا يحتوي على الكثير من الأقسام الفرعية. من تقنيات تجزئة الصور المختلفة إلى الخوارزميات ، هناك الكثير لنتعلمه في هذا التخصص. مع وجود الكثير من الأرض لتغطيتها ، يمكنك بسهولة أن تضيع وتشوش.

لهذا السبب نوصي بأخذ دورة في التعلم الآلي والذكاء الاصطناعي للتغلب على هذه المشكلات. ستعلمك دورة في هذا الموضوع الأساسيات وكذلك المفاهيم المتقدمة لتجزئة الصور والقطاعات ذات الصلة. سوف تتعرف على مفاهيم التعلم الآلي المختلفة المتعلقة بمعالجة الصور وتجزئة الصور ورؤية الكمبيوتر.

ستجعل دورات AI & ML من السهل عليك تعلم جميع المفاهيم ذات الصلة لأنك ستحصل على منهج منظم للدراسة منه. في upGrad ، نقدم دورات متعددة في التعلم الآلي.

فيما يلي الدورات الأساسية التي نقدمها في التعلم الآلي والذكاء الاصطناعي:

  • ماجستير العلوم في التعلم الآلي والذكاء الاصطناعي
  • برنامج الدراسات العليا التنفيذي في التعلم الآلي والذكاء الاصطناعي
  • ماجستير العلوم في التعلم الآلي والذكاء الاصطناعي
  • شهادة PG في التعلم الآلي والتعلم العميق
  • شهادة PG في التعلم الآلي و البرمجة اللغوية العصبية

تتيح لك كل هذه الدورات التعلم من خبراء الصناعة الذين يحلون شكوكك والإجابة على أسئلتك في جلسات مباشرة. ستدرس عبر الإنترنت ، مما يعني أنك لن تضطر إلى الذهاب إلى أي مكان أو إزعاج وظيفتك أثناء أخذ هذه الدورات.

تمنحك هذه الدورات إمكانية الوصول إلى ركن نجاح الطلاب في upGrad والذي يوفر العديد من المزايا الإضافية بما في ذلك ملاحظات السيرة الذاتية الشخصية والتحضير للمقابلة والاستشارات المهنية. بنهاية الدورة ، ستكون محترفًا في مجال الذكاء الاصطناعي / التعلم الآلي جاهزًا للوظيفة ومجهزًا بجميع المهارات اللينة والصعبة اللازمة.

خاتمة

تقسيم الصورة هو بالتأكيد موضوع معقد ومتقدم. جميع تقنيات تجزئة الصور المختلفة التي ناقشناها في هذه المقالة لها مزاياها وقيودها المحددة. من خلال التعرف عليهم ، ستحصل على فكرة عن المكان الذي يجب أن تستخدم فيه أحدهما وأين يجب تجنب استخدام الآخر.

مع كل المهارات المكتسبة ، يمكنك أن تصبح نشطًا على منصات تنافسية أخرى أيضًا لاختبار مهاراتك والحصول على مزيد من التدريب العملي.

ما هي بعض التطبيقات الهامة لتجزئة الصورة؟

يعد تجزئة الصور جزءًا كبيرًا من رؤية الكمبيوتر ، ويتم استخدامه في العديد من الشركات المختلفة. يتم استخدام تجزئة الصور بواسطة تقنية التعرف على الوجه في هاتفك وأنظمة الأمان المتقدمة للتعرف على وجهك. يمكن لنظام المرور التعرف على السيارة والحصول على معلومات حول مالكها باستخدام تقنيات تحديد لوحة الأرقام. يتم استخدام خوارزميات تجزئة الصور بواسطة Google ومحركات البحث الأخرى القائمة على الصور للتعرف على العناصر الموجودة في صورتك ومقارنة استنتاجاتهم بالصور ذات الصلة التي يكتشفونها لتزويدك بنتائج البحث. نحن نستخدم تجزئة الصور في المجال الطبي للعثور على الخلايا السرطانية وتحديدها ، وقياس حجم الأنسجة ، وإجراء محاكاة جراحية افتراضية ، والتنقل أثناء العملية.

ما هي أنواع تجزئة الصور؟

نهج العتبة هو طريقة تجزئة معالجة الصور الأساسية. يفصل بين وحدات البكسل في الصورة بمقارنة كثافة كل بكسل بقيمة محددة مسبقًا (الحد الأدنى). يُقال ببساطة ، العتبة هي عملية استبدال وحدات البكسل في صورة إما باللون الأسود أو الأبيض. يمكنك الاحتفاظ بالحد المحدد مرنًا بدلاً من استخدام قيمة ثابتة واحدة للتجزئة عبر الصورة بأكملها. العتبة التكيفية هي اسم هذه الطريقة. يعد التقسيم القائم على الحافة أحد أكثر أنواع تجزئة معالجة الصور شيوعًا. يركز على التعرف على حواف الأشياء المختلفة في الصورة.

ما هي خوارزمية التجزئة القائمة على الكتلة؟

ربما تكون قد صادفت خوارزميات التجميع إذا كنت قد بحثت عن خوارزميات التصنيف. إنها خوارزميات غير خاضعة للإشراف تساعدك في تحديد موقع البيانات المخفية في صورة غير مرئية للعين المجردة. المجموعات ، الهياكل ، الظلال ، وغيرها من المعلومات هي من بين البيانات المخفية. تقوم خوارزمية التجميع بفصل الصورة إلى مجموعات (مجموعات منفصلة) من وحدات البكسل ذات الخصائص المماثلة ، كما يوحي الاسم. سيقسم عناصر البيانات إلى مجموعات ، حيث تكون المكونات في مجموعة واحدة أكثر تشابهًا مع العناصر الموجودة في المجموعات الأخرى.