دليل المبتدئين للشبكات العصبية التلافيفية (CNN): شرح خطوة بخطوة
نشرت: 2022-06-06سهّل التعلم العميق طرقًا متعددة لرؤية الكمبيوتر والحساب المعرفي والمعالجة الدقيقة للبيانات المرئية. أحد هذه الأمثلة هو استخدام CNN أو الشبكات العصبية التلافيفية لتصنيف الكائنات أو الصور. توفر خوارزميات CNN ميزة هائلة في التصنيف المرئي من خلال تمكين الآلات من إدراك العالم من حولهم (في شكل وحدات بكسل) كما يفعل البشر.
CNN هي في الأساس خوارزمية التعرف التي تسمح للآلات بالتدريب الكافي لمعالجة أو تصنيف أو تحديد العديد من المعلمات من البيانات المرئية عبر الطبقات. هذا يعزز التعرف المتقدم على الكائن وتصنيف الصور من خلال تمكين الآلات أو البرامج من تحديد الكائنات المطلوبة بدقة من بيانات الإدخال.
تتعلم الأنظمة المستندة إلى CNN من بيانات التدريب القائمة على الصور ويمكنها تصنيف صور الإدخال المستقبلية أو البيانات المرئية على أساس نموذج التدريب الخاص بها. طالما أن مجموعة البيانات المستخدمة للتدريب تحتوي على مجموعة من الإشارات المرئية المفيدة (البيانات المكانية) ، فسيكون مصنف الصورة أو الكائن دقيقًا للغاية.
تعد CNN واحدة من أكثر أساليب التعلم العميق شيوعًا المستخدمة اليوم في التطبيقات الشائعة مثل نظام تصنيف الصور في Google Lens أو في المركبات ذاتية القيادة مثل Teslas. ويرجع ذلك بشكل خاص إلى التعرف الموثوق على الأنماط والذي يكون ممكنًا بمساعدة CNN ، إلى جانب اكتشاف الكائنات.
تعلم التعلم الآلي عبر الإنترنت من أفضل الجامعات في العالم - الماجستير ، وبرامج الدراسات العليا التنفيذية ، وبرنامج الشهادات المتقدمة في ML & AI لتسريع حياتك المهنية.
تطبيقات CNN
يمكن رؤية استخدام الأنظمة المستندة إلى CNN في أنظمة الأمن وأنظمة الدفاع والتشخيص الطبي وتحليل الصور وتصنيف الوسائط وبرامج التعرف الأخرى. على سبيل المثال ، يمكن استخدام CNN مع RNN (الشبكة العصبية المتكررة) لإنشاء برنامج التعرف على الفيديو أو أدوات التعرف على الإجراءات.
هذا تطبيق أكثر تقدمًا لتصنيف الفيديو يمكن أن يسمح للأنظمة بتحديد الكائنات في الوقت الفعلي من مقاطع الفيديو عن طريق تحليل المعلومات المكانية المتوفرة في الإطارات التي تشكل الفيديو بالتتابع.
يحتوي تسلسل هذه الإطارات أيضًا على معلومات زمنية تساعد على نمذجة البيانات من خلال المعالجة المكانية والزمانية ، مما يسمح باستخدام بنية هجينة تتكون من كل من الالتفافات والطبقات المتكررة. تستخدم سيارات Tesla ومركبات Waymo شبكة CNN للتعرف على جوانب مختلفة من الطرق والأشياء أو المركبات الواردة وتصنيفها بمساعدة البيانات التي تلتقطها الكاميرات في الوقت الفعلي.
استكشف دوراتنا التدريبية حول التعلم الآلي والذكاء الاصطناعي
شهادة متقدمة في التعلم الآلي والحوسبة السحابية من IITM | ماجستير العلوم في التعلم الآلي والذكاء الاصطناعي من جامعة جون مورس بليفربول | برنامج الدراسات العليا التنفيذية في التعلم الآلي والذكاء الاصطناعي من IITB |
برنامج شهادة متقدم في تعلم الآلة و البرمجة اللغوية العصبية من IIITB | برنامج الشهادة المتقدم في التعلم الآلي والتعلم العميق من IIITB | برنامج الشهادة المتقدم في الذكاء الاصطناعي للمديرين من IITR |
تعمل الشبكات العصبية على تمكين أنظمة المركبات من خلال اكتشاف الخطوط وتجزئة البيئة والملاحة والقيادة الآلية. تسمح هذه القدرات للسيارات المستقلة باتخاذ قرارات معقدة بناءً على أنماط التصنيف مثل تجنب الأجسام أو تغيير الممرات أو الإسراع أو التباطؤ أو التوقف تمامًا عن طريق الكبح إذا لزم الأمر.
ومع ذلك ، فهذه تطبيقات أكثر تقدمًا لـ CNN تتطلب أجهزة وأجهزة استشعار مثل GPS و RADAR و LiDAR بالإضافة إلى كميات هائلة من بيانات التدريب وبيئات المعالجة عالية الأداء. تساعد هذه النماذج التعلم العميق في أن تصبح أنظمة صنع القرار التي تعالج البيانات الواردة من أجهزة الاستشعار في الوقت الفعلي وتتخذ الإجراءات ذات الصلة.
باستخدام البيانات من المستشعرات ، توفر رؤية الكاميرا أيضًا تصورًا ثلاثي الأبعاد للبيئة (إعادة البناء المرئي وتحليل العمق وما إلى ذلك) ويمكنها تحليل المسافة بدقة (من خلال الليزر). وبالتالي ، يمكن للنموذج أن يتنبأ بالموقع المستقبلي للمركبات أو الأشياء ، ويقرر أخيرًا أفضل مسار للعمل.
تعتمد نماذج CNN على التصنيف والتجزئة والتوطين ثم بناء التنبؤات. هذا يسمح لهذه السيارات بالتفاعل تقريبًا مثل أدمغة البشر في أي موقف معين أو في بعض الأحيان بشكل أكثر فعالية من السائقين البشر.
تعمل CNN حقًا على سد الفجوة بين الآلات والبشر ، خاصة عندما يتعلق الأمر برؤية الكمبيوتر واكتشاف الهدف. ومع ذلك ، لفهم شبكات CNN ، يجب علينا أولاً التعرف على الشبكات العصبية والبدء باستخدام خوارزميات CNN للبيانات المرئية ثنائية الأبعاد.
ما هي الشبكة العصبية في التعلم العميق؟
يعد التعلم العميق أحد أهم فروع التعلم الآلي ويستخدم شبكات ANN أو الشبكات العصبية الاصطناعية (ANN) ليتم تنفيذها كمنهجية للتعلم الآلي خاضعة للإشراف أو غير خاضعة للإشراف أو شبه خاضعة للإشراف. تعتمد هذه الأنواع من نماذج التعلم الآلي على طبقات متعددة من المعالجة من أجل العمل على ميزات ذات مستوى أعلى في البيانات.
الطبقات هي في الأساس عدة عقد أو كتل مكدسة معًا كوحدات حسابية. تحاكي هذه الطبقات الخلايا العصبية البشرية بشكل فعال وتعمل بنفس طريقة عمل الدماغ البشري. من خلال البناء التدريجي للطبقات ، يمكن أن يصبح النموذج أكثر تقدمًا من طبقة الإدخال الأولية التي احتوت فقط على البيانات التي تمت معالجتها مسبقًا.
تقوم خوارزميات الشبكة العصبية باستخراج المخرجات التي يمكن أن تغذي الطبقات المستقبلية بالحسابات حتى يتم الوصول إلى طبقة الإخراج النهائية. هذا يشكل شبكة حيث يتم توصيل جميع العقد من كل طبقة لاحقة بعقدة واحدة من الطبقة السابقة. عندما تستخدم النماذج أكثر من طبقتين ، يتم تصنيفها على أنها شبكات عصبية عميقة (DNNs). لا تشكل هذه الشبكات دورة وتسمح بطبقات متعددة من الإدراك ، وبالتالي تقدم أبعادًا مختلفة للتنبؤات ومعالجة البيانات أيضًا.
اقرأ مقالاتنا الشائعة المتعلقة بالتعلم الآلي والذكاء الاصطناعي
إنترنت الأشياء: التاريخ والحاضر والمستقبل | دروس تعلم الآلة: تعلم ML | ما هي الخوارزمية؟ بسيط سهل |
راتب مهندس الروبوتات في الهند: جميع الأدوار | يوم في حياة مهندس التعلم الآلي: ماذا يفعلون؟ | ما هو إنترنت الأشياء (إنترنت الأشياء) |
التقليب مقابل الجمع: الفرق بين التقليب والجمع | أهم 7 اتجاهات في الذكاء الاصطناعي وتعلم الآلة | التعلم الآلي باستخدام R: كل ما تحتاج إلى معرفته |
فيما يلي بعض الأطر الشائعة المستخدمة في التعلم العميق:
- TensorFlow
- كيراس
- اباتشي MXNet
ما هي الشبكة العصبية التلافيفية؟
الشبكات العصبية التلافيفية هي نوع من الشبكات العصبية الاصطناعية التي تستخدم بشكل أساسي للعمل على بيانات البكسل لمعالجة الصور أو للتعرف على الصور. تُستخدم شبكات CNN في التعلم العميق للمهام التوليدية والوصفية التي تستخدم رؤية الآلة والأنظمة القائمة على التوصيات.
CNN هي شبكة ANN أكثر كفاءة تشبه DNNs ولكنها لا تزال تقلل من تعقيدات الشبكة العصبية Feedforward. هذا لأن CNN تعتمد بشكل عام على طبقتين ، طبقة خريطة المعالم وطبقة استخراج المعالم. يستخرج إدخال كل عقدة الميزة المحلية من حقل الاستقبال المحلي للطبقة السابقة.
يتم رسم العلاقة الموضعية بين المعالم المحلية والميزات الأخرى أو تعيينها بمجرد اكتمال الاستخراج. لجعل الدقة النهائية أكثر دقة ، تتبع طبقات الالتفاف طبقات حسابية تحسب المتوسطات المحلية والاستخراج الثانوي للخصائص. على الرغم من أن شبكات CNN تعمل في الغالب مع طبقتين ، إلا أن التنبؤات دقيقة للغاية بسبب دمج الاستخراج متعدد الميزات وتشويه الثبات.
يمكن أن تتعلم العقد الموجودة في نفس مستوى خريطة المعالم بشكل متزامن بسبب مشاركة الأوزان. هذا يقلل من التعقيدات في الشبكة ويسمح بدخول صور المدخلات متعددة الأبعاد. على عكس الشبكات العصبية الأخرى ، لا تتطلب شبكات CNN تحويل الصور إلى صور ذات دقة أقل لأن متطلبات المعالجة منخفضة.
يشبه هذا النموذج التصورات متعددة الطبقات ، باستثناء شبكات CNN ليست عرضة لتجهيز البيانات بشكل زائد ، مما يجعلها أقل تعقيدًا. يتم ذلك من خلال تنظيم نهج الإدراك متعدد الطبقات من خلال معاقبة المعلمات أو قطع الاتصالات التي تم تخطيها.
تستخدم شبكات CNN النمط الهرمي في البيانات لتجميع الأنماط حسب مستوى تعقيدها. بالكاد تتطلب الشبكات العصبية التلافيفية أي معالجة مسبقة مقارنة بخوارزميات التصنيف الأخرى ، خاصة للصور والفيديو. باستخدام البرمجة اللغوية العصبية ، يمكن للمرء استخدام شبكات CNN لتطبيقات أكثر تقدمًا في مجال الروبوتات والتشخيص الطبي والأتمتة. تعمل شبكات CNN بشكل رائع مع معظم تقنيات التعلم الآلي غير الخاضعة للإشراف وتستمر بشكل مستقل في تحسين عوامل تصفية النموذج من خلال منهجيات التعلم الآلي.
فيما يلي بعض الهياكل المتاحة لشبكات CNN
- GoogLeNet
- AlexNet
- لينيت
- ZFNet
- ResNet
- شبكة VGGNet
فيما يلي مثال على تطبيق CNN
لنفترض أنه يتعين علينا تصنيف الطيور والقطط والكلاب والسيارات والبشر من مجموعة عشوائية من الصور. للبدء ، يجب أن نجد أولاً مجموعة بيانات تدريبية يمكن استخدامها كمعيار للحسابات المستقبلية. من الأمثلة على مجموعة بيانات التدريب الجيدة مجموعة بيانات تبلغ 50000 صورة بدقة 64 × 64 بكسل للطيور والقطط والكلاب والسيارات والبشر.
كل من هذه الأهداف سوف تصبح تسميات فئة مع القيم الصحيحة المرتبطة بها. ستكون ملصقات الفصل هي "طيور" و "قطط" و "كلاب" و "سيارات" و "بشر" بقيم 0 و 1 و 2 و 3 و 4. بمجرد تدريب نموذج CNN باستخدام مجموعة البيانات هذه والمعايير ، سيكون قادرًا على تحديد الإشارات المرئية من بيانات الإدخال العشوائي ثم تصنيفها وفقًا لتسمياتها. يمكن للنموذج النهائي تحديد الأنواع الخمسة المختلفة للكائنات (الملصقات) بدقة من مجموعة عشوائية من الصور التي تعرض هذه الكائنات.
فيما يلي الخطوات اللازمة لبناء نموذج CNN
- تحميل مجموعة البيانات.
- تحضير بيانات البكسل.
- تحديد النموذج.
- تقييم النموذج.
- تقديم النتائج.
- أخذ العينات الكامل.
- تطوير نموذج أساسي.
- تطبيق تقنيات التنظيم لتحسين النموذج.
- زيادة البيانات.
- وضع اللمسات الأخيرة على النموذج والمزيد من التقييم.
يعد CNN Deep Learning مجالًا واعدًا يتمتع بآفاق وظيفية ممتازة. إذا كنت تخطط لبناء مهنة في CNN ، فيمكنك الاطلاع على برنامج الشهادة المتقدمة upGrad's في برنامج التعلم الآلي والتعلم العميق .
ما الفرق بين الشبكات العصبية الكلاسيكية (شبكات ANN الأخرى) و CNN؟
يكمن الاختلاف الأساسي بين الشبكات العصبية الكلاسيكية مثل الشبكة العصبية الاصطناعية (ANN) و CNN في حقيقة أن الطبقة الأخيرة فقط من شبكة CNN متصلة تمامًا وفي ANN ، كل خلية عصبية متصلة بكل خلية عصبية أخرى.
ما هي الشبكات العصبية العميقة؟
يأتي التعلم العميق من مجموعة أوسع من المفاهيم المتعلقة بالتعلم الآلي والتي تعتمد بشكل أكبر على الشبكات العصبية الاصطناعية مع التعلم التمثيلي.
هل يمكن استخدام البرمجة اللغوية العصبية مع CNN؟
على غرار تصنيف الجملة ، يمكن استخدام CNN في العديد من مهام البرمجة اللغوية العصبية مثل تصنيف المشاعر والترجمة الآلية والتلخيص النصي واختيار الإجابة وما شابه.