الدليل الشامل لاكتشاف الأشياء باستخدام التعلم العميق [2022]

نشرت: 2021-01-08

جدول المحتويات

مقدمة

يعد اكتشاف الكائن ، بعبارات بسيطة ، طريقة تُستخدم للتعرف على الكائنات المختلفة الموجودة في صورة أو مقطع فيديو واكتشافها وتسميتها لتصنيف هذه الكائنات. عادةً ما يستخدم اكتشاف الكائنات خوارزميات مختلفة لإجراء هذا التعرف على الكائنات وتوطينها ، وتستخدم هذه الخوارزميات التعلم العميق لتوليد نتائج ذات مغزى.

كشف الكائن

تساعد تقنية اكتشاف الكائن في التعرف على المثيلات المرئية المتعددة للكائنات في صورة أو مقطع فيديو واكتشافها وتوطينها. إنه يوفر فهماً أفضل بكثير للكائن ككل ، بدلاً من مجرد تصنيف أساسي للكائن. يمكن استخدام هذه الطريقة لحساب عدد مثيلات الكائنات الفريدة وتحديد مواقعها بدقة ، إلى جانب وضع العلامات. مع مرور الوقت ، تحسن أداء هذه العملية أيضًا بشكل ملحوظ ، مما يساعدنا في حالات الاستخدام في الوقت الفعلي. الكل في الكل ، يجيب على السؤال: "ما هو الشيء وأين وكم منه هناك؟".

مصدر

ما هو الشيء؟

الكائن هو عنصر يمكن تمثيله بصريًا. لا تحتوي الخصائص الفيزيائية للكائن على نطاق واسع من التباين. يجب أن يكون الجسم شبه صلب لاكتشافه وتمييزه.

تاريخ اكتشاف الأشياء

في العشرين عامًا الماضية ، مر تقدم اكتشاف الأشياء عمومًا بفترتين هامتين من التطوير ، بدءًا من أوائل العقد الأول من القرن الحادي والعشرين:

1. الكشف عن الأشياء التقليدية - أوائل العقد الأول من القرن الحادي والعشرين إلى عام 2014.

2. الاكتشاف القائم على التعلم العميق - بعد عام 2014.

بدأ التطور التقني لاكتشاف الأشياء في أوائل العقد الأول من القرن الحالي وأجهزة الكشف في ذلك الوقت. لقد اتبعوا الرؤية ذات المستوى المنخفض والمتوسط ​​واتبعوا طريقة "التعرف على المكونات". مكّنت هذه الطريقة من اكتشاف الكائن كقياس للتشابه بين مكونات الكائن والأشكال والخطوط ، والسمات التي تم أخذها في الاعتبار هي تحويلات المسافات وسياقات الشكل وعديمة الحواف وما إلى ذلك. بدأوا في الظهور في الصورة لحل هذه المشكلة.

كان من المقرر إجراء الكشف متعدد المقاييس عن الأشياء من خلال أخذ تلك الكائنات في الاعتبار ذات "أحجام مختلفة" و "نسب أبعاد مختلفة". كان هذا أحد التحديات التقنية الرئيسية في اكتشاف الأشياء في المراحل المبكرة. ولكن بعد عام 2014 ، مع زيادة التقدم التقني ، تم حل المشكلة. قادنا هذا إلى المرحلة الثانية من اكتشاف الأشياء ، حيث تم إنجاز المهام باستخدام التعلم العميق .

مصدر

مفهوم

المفهوم الرئيسي وراء هذه العملية هو أن كل كائن سيكون له ميزاته. يمكن أن تساعدنا هذه الميزات في فصل الكائنات عن الكائنات الأخرى. تستخدم منهجية اكتشاف الكائن هذه الميزات لتصنيف الكائنات. يتم استخدام نفس المفهوم لأشياء مثل اكتشاف الوجه واكتشاف بصمات الأصابع وما إلى ذلك.

لنأخذ مثالاً ، إذا كانت لدينا سيارتان على الطريق ، باستخدام خوارزمية اكتشاف الكائنات ، فيمكننا تصنيفها وتسميتها.

المصدر :

تعريف

إن اكتشاف الكائن هو عملية العثور على جميع الأمثلة الممكنة لأجسام العالم الحقيقي ، مثل الوجوه البشرية ، والزهور ، والسيارات ، وما إلى ذلك في الصور أو مقاطع الفيديو ، في الوقت الفعلي وبدقة قصوى. تستخدم تقنية اكتشاف الكائن الميزات المشتقة وخوارزميات التعلم للتعرف على جميع تكرارات فئة الكائن. تطبيقات العالم الحقيقي لاكتشاف الأشياء هي استرجاع الصور ، والأمن والمراقبة ، وأنظمة مساعدة السائق المتقدمة ، والمعروفة أيضًا باسم ADAS ، وغيرها الكثير.

قراءة: أفضل 10 تقنيات للتعلم العميق

وصف عام لاكتشاف الكائن

يمكننا نحن البشر اكتشاف العديد من الأشياء الموجودة أمامنا ويمكننا أيضًا تحديدها جميعًا بدقة. من السهل جدًا بالنسبة لنا عد وتحديد كائنات متعددة دون أي جهد. أدت التطورات الأخيرة في التقنيات إلى توفر كميات كبيرة من البيانات لتدريب الخوارزميات الفعالة ، لجعل أجهزة الكمبيوتر تقوم بنفس مهمة التصنيف والكشف.

هناك العديد من المصطلحات المتعلقة بالتعرف على الأشياء مثل رؤية الكمبيوتر ، وتوطين الكائن ، وتصنيف الكائنات ، وما إلى ذلك ، وقد يربكك ذلك كمبتدئ ، لذلك أخبرنا بكل هذه المصطلحات وتعريفاتها خطوة بخطوة:

  • الرؤية الحاسوبية: هي مجال ذكاء اصطناعي يمكننا من تدريب أجهزة الكمبيوتر على فهم وتفسير مرئيات الصور ومقاطع الفيديو باستخدام الخوارزميات والنماذج.
  • تصنيف الصور: يتضمن الكشف عن الصور وتصنيفها باستخدام الذكاء الاصطناعي. يتم تصنيف هذه الصور باستخدام الميزات التي قدمها المستخدمون.
  • توطين الكائن: يتضمن اكتشاف كائنات مختلفة في بصري معين ورسم حدود حولها ، في الغالب مربع ، لتصنيفها.
  • اكتشاف الكائن: يتضمن كل من هاتين العمليتين ويصنف الكائنات ، ثم يرسم حدودًا لكل كائن ويصنفها وفقًا لميزاتها.

كل هذه الميزات تشكل عملية التعرف على الكائن.

كيف يعمل كشف الأشياء؟

الآن بعد أن مررنا باكتشاف الكائن واكتسبنا المعرفة حول ماهيته ، حان الوقت الآن لمعرفة كيفية عمله ، وما الذي يجعله يعمل. يمكن أن يكون لدينا مجموعة متنوعة من الأساليب ، ولكن هناك طريقتان رئيسيتان - نهج التعلم الآلي ونهج التعلم العميق. كلتا الطريقتين قادرتان على تعلم وتحديد الأشياء ، لكن التنفيذ مختلف تمامًا.

اقرأ أيضًا: البرنامج التعليمي للكشف عن كائن TensorFlow

طرق الكشف عن الأشياء

يمكن الكشف عن الأشياء من خلال نهج التعلم الآلي ونهج التعلم العميق. يتطلب نهج التعلم الآلي تحديد الميزات باستخدام طرق مختلفة ثم استخدام أي تقنية مثل آلات المتجهات الداعمة (SVM) للقيام بالتصنيف. وحيث إن نهج التعلم العميق يجعل من الممكن القيام بعملية الكشف بأكملها دون تحديد صريح للميزات للقيام بالتصنيف. يعتمد نهج التعلم العميق بشكل رئيسي على الشبكات العصبية التلافيفية (CNNs).

طرق التعلم الآلي

  1. تحويل الميزات غير المتغيرة (SIFT)
  2. رسم بياني لميزات التدرجات الموجهة (HOG)
  3. إطار عمل الكشف عن كائن فيولا-جونز

طرق التعلم العميق

  1. مقترحات المنطقة (R-CNN ، Fast R-CNN ، أسرع R-CNN)
  2. أنت تنظر مرة واحدة فقط (YOLO)
  3. شبكات تلافيفية مشوهة
  4. شبكة عصبية للتحسين لاكتشاف الأشياء (RefineDet)
  5. شبكية العين

سنتعرف على طرق التعلم العميق بالتفصيل ، ولكن أولاً ، دعنا نعرف ما هو التعلم الآلي ، وما هو التعلم العميق ، وما هو الفرق بينهما.

ما هو التعلم الآلي؟

التعلم الآلي هو تطبيق للذكاء الاصطناعي لجعل أجهزة الكمبيوتر تتعلم من البيانات المعطاة لها ثم تتخذ قراراتها بنفسها مثل البشر. يمنح أجهزة الكمبيوتر القدرة على التعلم والتنبؤ بناءً على البيانات والمعلومات التي يتم تغذيتها وأيضًا من خلال التفاعلات والملاحظات في العالم الحقيقي. التعلم الآلي ، في الأساس ، هو عملية استخدام الخوارزميات لتحليل البيانات ثم التعلم منها لعمل تنبؤات وتحديد الأشياء بناءً على البيانات المقدمة.

يمكن لخوارزميات التعلم الآلي أن تتخذ قرارات بشأن نفسها دون أن تتم برمجتها بشكل صريح. تصنع هذه الخوارزميات نماذج رياضية بناءً على البيانات المعطاة ، والمعروفة باسم "مجموعة التدريب" ، لعمل التنبؤات. في خوارزميات التعلم الآلي ، نحتاج إلى توفير الميزات للنظام ، لجعلها تقوم بالتعلم بناءً على الميزات المحددة ، تسمى هذه العملية هندسة الميزات.

الأمثلة اليومية لتطبيقات التعلم الآلي هي المساعد الصوتي ، وتصفية البريد الإلكتروني العشوائي ، وتوصيات المنتج ، وما إلى ذلك.

ما هو التعلم العميق؟

التعلم العميق ، والذي يسمى أحيانًا التعلم المنظم العميق ، هو فئة من خوارزميات التعلم الآلي. يستخدم التعلم العميق نهجًا متعدد الطبقات لاستخراج ميزات عالية المستوى من البيانات المقدمة إليه. لا يتطلب توفير الميزات يدويًا للتصنيف ، بدلاً من ذلك ، يحاول تحويل بياناته إلى تمثيل مجرد. إنه يتعلم ببساطة من خلال الأمثلة ويستخدمها في التصنيف المستقبلي. يتأثر التعلم العميق بالشبكات العصبية الاصطناعية (ANN) الموجودة في أدمغتنا.

تقوم معظم طرق التعلم العميق بتطبيق الشبكات العصبية لتحقيق النتائج. تتطلب جميع نماذج التعلم العميق قوى حسابية ضخمة وكميات كبيرة من البيانات المصنفة لتعلم الميزات مباشرة من البيانات. التطبيقات اليومية للتعلم العميق هي تجميع الأخبار أو اكتشاف أخبار الاحتيال ، والتعرف المرئي ، ومعالجة اللغة الطبيعية ، وما إلى ذلك.

تقنيات التعلم الآلي والتعلم العميق للتعرف على الأشياء. مصدر

اكتشاف الكائن باستخدام التعلم العميق

الآن بعد أن عرفنا عن اكتشاف الأشياء والتعلم العميق جيدًا ، يجب أن نعرف كيف يمكننا إجراء اكتشاف الكائنات باستخدام التعلم العميق .

هذه هي أكثر نماذج التعلم العميق استخدامًا للكشف عن الأشياء:

1. عائلة نموذج R-CNN: وهي تعني الشبكات العصبية التلافيفية القائمة على المنطقة

    • آر سي إن إن
    • سريع R-CNN
    • أسرع R-CNN

2. عائلة نموذج YOLO: إنها تعني أنك تنظر مرة واحدة فقط

    • يولوف 1
    • YOLOv2 و YOLOv3

دعونا ننظر إليهم واحدة تلو الأخرى ونفهم كيف يعملون.

تتضمن عملية اكتشاف الكائن الخطوات التالية التي يجب اتباعها:

  1. أخذ المرئي كمدخل ، إما عن طريق صورة أو فيديو.
  2. قسّم المدخلات المرئية إلى أقسام أو مناطق.
  3. خذ كل قسم على حدة ، واعمل عليه كصورة واحدة
  4. تمرير هذه الصور إلى شبكتنا العصبية التلافيفية (CNN) لتصنيفها إلى فئات ممكنة.
  5. بعد التصنيف ، يمكننا دمج جميع الصور وإنشاء صورة الإدخال الأصلية ، ولكن أيضًا مع الكائنات المكتشفة وتسمياتها.

عائلة الشبكات العصبية التلافيفية القائمة على المنطقة (R-CNN)

توجد عدة نماذج لاكتشاف الكائنات ضمن عائلة R-CNN. تعتمد نماذج الكشف هذه على هياكل اقتراح المنطقة. لقد حققت هذه الميزات تطورًا كبيرًا بمرور الوقت ، مما أدى إلى زيادة الدقة والكفاءة.

النماذج المختلفة تحت R-CNN هي:

  • آر سي إن إن

تستخدم طريقة R-CNN عملية تسمى البحث الانتقائي لاكتشاف الكائنات من الصورة. تولد هذه الخوارزمية عددًا كبيرًا من المناطق وتعمل بشكل جماعي عليها. يتم فحص مجموعات المناطق هذه للتأكد من وجود كائنات إذا كانت تحتوي على أي كائن. يعتمد نجاح هذه الطريقة على دقة تصنيف الكائنات.

  • سريع RCNN

تستخدم طريقة Fast-RCNN بنية R-CNN جنبًا إلى جنب مع SPP-net (Spatial Pyramid Pooling) لجعل نموذج R-CNN البطيء أسرع. يستخدم Fast-RCNN شبكة SPP لحساب تمثيل CNN للصورة بأكملها مرة واحدة فقط. ثم يستخدم هذا التمثيل لحساب تمثيل CNN لكل رقعة تم إنشاؤها بواسطة نهج البحث الانتقائي لـ R-CNN. يجعل Fast-RCNN عملية التدريب من البداية إلى النهاية.

يتضمن نموذج Fast-RCNN أيضًا انحدار الصندوق المحيط جنبًا إلى جنب مع عملية التدريب. هذا يجعل كل من عمليتي التوطين والتصنيف في عملية واحدة ، مما يجعل العملية أسرع.

  • أسرع RCNN

تعتبر طريقة Faster-RCNN أسرع من طريقة Fast-RCNN. كانت Fast-RCNN سريعة ولكن عملية البحث الانتقائي وتم استبدال هذه العملية في Faster-RCNN بتنفيذ RPN (شبكة اقتراح المنطقة). يجعل RPN عملية الاختيار أسرع من خلال تنفيذ شبكة تلافيفية صغيرة ، والتي بدورها تولد مناطق الاهتمام. إلى جانب RPN ، تستخدم هذه الطريقة أيضًا Anchor Boxes للتعامل مع نسب العرض إلى الارتفاع المتعددة وحجم الكائنات. يعد Faster-RCNN أحد أكثر خوارزميات اكتشاف الكائنات دقة وفعالية.

آر سي إن إن سريع RCNN أسرع RCNN
وقت الاختبار لكل صورة 50 ثانية 2 ثانية 0.2 ثانية
سرعة 1x 25 ضعفًا 250 ضعفًا

أنت تنظر مرة واحدة فقط (YOLO) عائلة

يركز نهج R-CNN الذي رأيناه أعلاه على تقسيم الصورة المرئية إلى أجزاء والتركيز على الأجزاء التي لديها احتمالية أكبر لاحتواء كائن ما ، بينما يركز إطار عمل YOLO على الصورة بأكملها ككل ويتوقع المربعات المحيطة ، ثم تحسب احتمالات فئتها لتسمية المربعات. عائلة إطارات YOLO عبارة عن كاشفات كائن سريعة جدًا.

تتم مناقشة نماذج YOLO المختلفة أدناه:

  • يولوف 1

يُطلق على هذا النموذج أيضًا اسم YOLO الموحد ، لأن هذا النموذج يوحد اكتشاف الكائن ونموذج التصنيف معًا كشبكة كشف واحدة. كانت هذه هي المحاولة الأولى لإنشاء شبكة تكتشف الكائنات في الوقت الفعلي بسرعة كبيرة. تتوقع YOLO فقط عددًا محدودًا من المربعات المحيطة لتحقيق هذا الهدف.

  • YOLOv2 و v3

YOLOv2 و YOLOv3 هما الإصداران المحسنان من إطار عمل YOLOv1. يسمى YOLOv2 أيضًا YOLO9000. يرتكب إطار عمل YOLOv1 العديد من أخطاء الترجمة ، ويعمل YOLOv2 على تحسين ذلك من خلال التركيز على الاستدعاء والترجمة. يستخدم YOLOv2 تطبيع الدُفعات ، وصناديق التثبيت ، والمصنفات عالية الدقة ، والميزات الدقيقة ، والمصنفات متعددة المستويات ، و Darknet19. كل هذه الميزات تجعل v2 أفضل من v1. يحتوي مستخرج ميزة Darknet19 على 19 طبقة تلافيفية ، و 5 طبقات تجميع كحد أقصى ، وطبقة softmax لتصنيف الكائنات الموجودة في الصورة.

طريقة YOLOv3 هي الطريقة الأسرع والأكثر دقة لاكتشاف الأشياء. يصنف الكائنات بدقة باستخدام المصنفات اللوجستية مقارنة بنهج softmax المستخدم بواسطة YOLOv2. هذا يجعلنا قادرين على عمل تصنيفات متعددة العلامات. يستخدم YOLOv3 أيضًا Darknet53 كمستخرج ميزة ، والذي يحتوي على 53 طبقة تلافيفية ، أكثر من Darknet19 التي يستخدمها الإصدار 2 ، وهذا يجعله أكثر دقة. كما يستخدم أيضًا كاشفًا صغيرًا للأجسام لاكتشاف جميع الكائنات الصغيرة الموجودة في الصورة ، والتي لا يمكن اكتشافها باستخدام الإصدار 1.

يجب أن تقرأ : طرق خطوة بخطوة لبناء نظام الذكاء الاصطناعي الخاص بك اليوم

ملخص

آمل أن تكون النظرة العامة أعلاه على اكتشاف الكائنات وتنفيذها باستخدام التعلم العميق مفيدة لك وجعلتك تفهم الفكرة الأساسية لاكتشاف الكائن وكيف يتم تنفيذها في العالم الحقيقي باستخدام طرق مختلفة وعلى وجه التحديد باستخدام التعلم العميق.

يمكن استخدام اكتشاف الكائنات في العديد من المجالات لتقليل الجهود البشرية وزيادة كفاءة العمليات في مختلف المجالات. يعد اكتشاف الأشياء ، وكذلك التعلم العميق ، من المجالات التي ستزدهر في المستقبل وستجعل وجودها في العديد من المجالات. هناك الكثير من المجالات في هذه المجالات وهناك أيضًا العديد من الفرص للتحسين.

الدورات التي تقدمها upGrad

طور u pGrad برامج تدريب شاملة عبر الإنترنت حول التعلم العميق بالإضافة إلى التعلم الآلي بما يتماشى مع توقعات الصناعة. تساعد الوحدات التدريبية ونهج التعليم في upGrad الطلاب على التعلم بسرعة والاستعداد لأي مهمة.

البرامج التعليمية الرئيسية التي تقدمها upGrad مناسبة للالتحاق بمستوى منتصف الحياة المهنية

1. دبلومة PG في التعلم الآلي والذكاء الاصطناعي : وهي مناسبة للمهنيين العاملين الذين يرغبون في تعلم التعلم الآلي من البداية وتحويل أدوارهم المهنية إلى مهندس تعلم الآلة أو عالم بيانات أو مهندس ذكاء اصطناعي أو محلل أعمال أو محلل منتج.

2. ماجستير العلوم في التعلم الآلي والذكاء الاصطناعي: إنه برنامج شامل مدته 18 شهرًا يساعد الأفراد على الحصول على درجة الماجستير في هذا المجال واكتساب المعرفة بهذا المجال إلى جانب الخبرة العملية العملية في عدد كبير من المشاريع.

3. شهادة متقدمة في التعلم الآلي والحوسبة السحابية من IIT Madras: إنها دورة متقدمة مقدمة من IIT Madras لمجالات التعلم الآلي والتقنيات السحابية.

4. شهادة PG في التعلم الآلي والتعلم العميق: تركز هذه الدورة على التعلم الآلي والتعلم العميق. مع هذه الدورة ، يمكن للطلاب التقدم لشغل وظائف مثل مهندس التعلم الآلي وعالم البيانات.

5. شهادة PG في التعلم الآلي و البرمجة اللغوية العصبية: إنها دورة جيدة التنظيم لتعلم الآلة و معالجة اللغة الطبيعية. فرص العمل للمتعلمين هي عالم البيانات ومحلل البيانات.

طورت upGrad منهج هذه البرامج للتعلم الآلي والتعلم العميق مع مراعاة مبادئ التعلم الآلي والجوانب والمكونات الرئيسية للتعلم الآلي وفرص العمل بحيث يتم تطوير المهارات من البداية. بعد الانتهاء من البرنامج من upGrad ، تنتظرك فرص وظيفية هائلة للتعلم الآلي في مجالات متنوعة وأدوار مختلفة.

الخط السفلي

يمكن للطلاب اتخاذ أي من المسارات المذكورة أعلاه لبناء حياتهم المهنية في التعلم الآلي والتعلم العميق. يساعد دعم التوظيف في upGrad الطلاب على تعزيز آفاقهم الوظيفية من خلال فرص وظيفية مثيرة على بوابة الوظائف ومعارض التوظيف و Hackathons بالإضافة إلى دعم التوظيف. إن مستقبل التعلم العميق أكثر إشراقًا مع زيادة الطلب وآفاق النمو ، وكذلك العديد من الأفراد الراغبين في الحصول على وظيفة في هذا المجال. احصل على أي من هذه الدورات وأكثر من ذلك بكثير التي تقدمها upGrad للغوص في الفرص الوظيفية للتعلم الآلي التي تنتظرك.

ما هي خوارزميات التعلم العميق المستخدمة في الكشف عن الأشياء؟

اكتشاف الكائن هو مهمة رؤية الكمبيوتر والتي تشير إلى عملية تحديد وتحديد كائنات متعددة في الصورة. تكتشف خوارزميات التعلم العميق مثل YOLO و SSD و R-CNN الأشياء على صورة باستخدام الشبكات العصبية التلافيفية العميقة ، وهي نوع من الشبكات العصبية الاصطناعية المستوحاة من القشرة البصرية. الشبكات العصبية العميقة التلافيفية هي أكثر فئات خوارزميات التعلم العميق شيوعًا لاكتشاف الأشياء. يتم تدريب الشبكات التلافيفية العميقة على مجموعات بيانات كبيرة. يمكن لهذه الشبكات اكتشاف الكائنات بكفاءة ودقة أكبر بكثير من الطرق السابقة.

ما الخوارزمية الأفضل لاكتشاف الكائن؟

هناك العديد من الخوارزميات لاكتشاف الكائنات ، بدءًا من المربعات البسيطة إلى الشبكات العميقة المعقدة. معيار الصناعة الآن هو YOLO ، وهو اختصار لـ You Only Look One. YOLO هي شبكة عصبية بسيطة وسهلة التنفيذ تصنف الكائنات بدقة عالية نسبيًا. باختصار ، الشبكة العصبية هي نظام من الطبقات المترابطة التي تحاكي كيفية تواصل الخلايا العصبية في الدماغ. تحتوي كل طبقة على مجموعة من المعلمات الخاصة بها ، والتي يتم تعديلها وفقًا للبيانات المقدمة. يتم تغذية البيانات التي تخرج من كل طبقة في الطبقة التالية ، وهكذا ، حتى نحصل على توقع نهائي كإخراج.

ما هي الصعوبات التي واجهتها في تحديد الكائن؟

هناك العديد من الصعوبات التي نواجهها أثناء تحديد الكائن. إحدى الصعوبات هي عندما يكون الكائن عبارة عن صورة لمشهد. في مثل هذه الحالات ، نحتاج إلى معرفة موضع الكاميرا في الماضي ويجب علينا تقدير موضع الجسم المتحرك. نظرًا للتغييرات مع مرور الوقت ، قد نحصل على صورة مختلفة تمامًا ولا يمكن مطابقتها. تتمثل إحدى طرق حل هذه المشكلة في الاستعانة بتقدير الحركة. طريقة أخرى هي إعادة الحساب مع فارق التوقيت.