كيف تستخدم السيارات ذاتية القيادة رؤية الكمبيوتر في الرؤية؟

نشرت: 2021-02-08

في عالم اليوم ، يزداد الطلب على الروبوتات أو المركبات المستقلة بمعدل أسي ، ويحظى تطبيق التعريب المتزامن ورسم الخرائط (SLAM) باهتمام أوسع. أولاً ، تحتوي المركبات ذاتية القيادة على مجموعة من أجهزة الاستشعار مثل الكاميرات و Lidar و Radar وما إلى ذلك.

تقوم هذه المستشعرات بتحليل البيئة المحيطة بالمركبة قبل أن تتخذ السيارة أي قرار حاسم فيما يتعلق بحالة حركتها التالية. يتم إنشاء خريطة الترجمة من Lidar وبيانات الكاميرا. يمكن أن تكون خريطة ثنائية الأبعاد أو ثلاثية الأبعاد. الغرض من الخريطة هو تحديد الكائنات الثابتة حول السيارة المستقلة مثل المباني والأشجار وما إلى ذلك. تتم إزالة جميع الكائنات الديناميكية عن طريق إزالة جميع نقاط Lidar الموجودة داخل المربع المحيط بالكائنات الديناميكية المكتشفة. تعرف على المزيد حول تطبيقات الذكاء الاصطناعي

تتم أيضًا إزالة الأجسام الثابتة التي لا تتداخل مع السيارة مثل الأسطح القابلة للقيادة أو أغصان الأشجار. مع إنشاء الشبكة ، يمكننا التنبؤ بمسار خالٍ من الاصطدامات للمركبة. أحد العناصر المهمة في SLAM هو 3DMapping للبيئة التي تسهل الروبوتات المستقلة لفهم البيئة مثل الإنسان الذي أثبتت العديد من كاميرات العمق أو كاميرات RGB-D قيمتها.

لكي تتمكن المركبات المستقلة من التنقل بكفاءة ، فإنها تتطلب إطارًا مرجعيًا ومراقبة البيئة المحيطة باستخدام خوارزميات رؤية الكمبيوتر لتخطيط خريطة محيطها واجتياز المسار. تتضمن إعادة الإعمار ثلاثي الأبعاد استخدام رؤية الكمبيوتر لمراقبة المحيط الخارجي باستخدام سحابة نقطية ثلاثية الأبعاد تعتمد على العمق.

لذلك ، فإن المبدأ الأساسي هو نقطة اتصال بين إعادة الإعمار ثلاثي الأبعاد والتنقل المستقل. زيادة الاهتمام بطلبات الحلول ثلاثية الأبعاد لحل كامل يمكنه إدراك المناطق المحيطة وبناء إسقاط ثلاثي الأبعاد للمحيط المقابل.

كانت ممارسة خوارزميات الرؤية الحاسوبية لتحقيق الأتمتة في الروبوتات أو إنتاج تصميمات ثلاثية الأبعاد شائعة جدًا. استمرت معضلة التوطين ورسم الخرائط المتزامنة لفترة طويلة ويتم إجراء الكثير من الأبحاث لإيجاد منهجيات فعالة للتعامل مع مشكلة رسم الخرائط.

يستخدم البحث الحالي في هذا المجال كاميرات باهظة الثمن لإنتاج خرائط التباين والعمق التي بالرغم من أنها أكثر دقة ، لكنها لا تزال باهظة الثمن. تتضمن الطرق المختلفة استخدام كاميرات الرؤية المجسمة لتحديد عمق الكائنات المحيطة والتي تُستخدم أيضًا لإنتاج غيوم نقطية ثلاثية الأبعاد.

جدول المحتويات

أنواع خرائط تمثيل البيئة

  • خرائط التعريب: يتم إنشاؤها باستخدام مجموعة من نقاط LIDAR أو ميزات صورة الكاميرا أثناء تحرك السيارة. يتم استخدام هذه الخريطة جنبًا إلى جنب مع GPU و IMU وقياس المسافات بواسطة وحدة التعريب لتقدير الموقع الدقيق للمركبة المستقلة. عند استلام بيانات LIDAR والكاميرا الجديدة ، تتم مقارنتها بخريطة الترجمة ويتم إنشاء قياس موقع السيارة المستقلة عن طريق محاذاة البيانات الجديدة مع الخريطة الحالية.
  • خريطة شبكة الإشغال : تستخدم هذه الخريطة مجموعة متصلة من نقاط LIDAR لإنشاء بيئة خريطة تشير إلى موقع جميع الكائنات الثابتة التي تُستخدم لتخطيط مسار آمن خالٍ من الاصطدامات للمركبة المستقلة.

من المهم ملاحظة أن وجود كائنات ديناميكية في سحابة النقطة ، يعيق إعادة البناء الدقيقة لسحابة النقاط. تمنع هذه الكائنات الديناميكية إعادة البناء الفعلي للمحيط. للغرض نفسه ، من المهم صياغة حل يعالج هذه المشكلة.

الهدف الرئيسي هو تحديد هذه الكائنات الديناميكية باستخدام التعلم العميق. بمجرد تحديد هذه الكائنات ، يمكن تجاهل النقاط التي تحيط بالمربع المحيط. بهذه الطريقة ، سيكون النموذج المعاد بناؤه بالكامل من كائنات ثابتة.

يمكن لكاميرا RGB-D قياس العمق باستخدام مستشعر الأشعة تحت الحمراء. الناتج الذي تم الحصول عليه هو بيانات الصورة (قيم RGB) وبيانات العمق (نطاق الكائن من الكاميرا). نظرًا لأن العمق يجب أن يكون دقيقًا ، فإن أي عدم تطابق يمكن أن يتسبب في وقوع حادث مميت. لهذا السبب ، يتم معايرة الكاميرات بطريقة تعطي قياسًا دقيقًا للمحيط. تُستخدم خرائط العمق عادةً للتحقق من دقة قيم العمق المحسوبة.

خريطة العمق هي ناتج تدرجات رمادية من المناطق المحيطة حيث تمتلك الكائنات الأقرب للكاميرا وحدات بكسل أكثر سطوعًا وتلك البعيدة تحتوي على وحدات بكسل أغمق. يتم تمرير بيانات الصورة التي يتم الحصول عليها من الكاميرا إلى وحدة اكتشاف الكائن التي تحدد الكائنات الديناميكية الموجودة في الإطار.

لذا ، كيف نحدد هذه الكائنات الديناميكية التي قد تطلبها؟

هنا ، يتم تدريب شبكة عصبية التعلم العميق لتحديد الكائنات الديناميكية. يتم تشغيل النموذج المدرب على كل إطار تم استلامه من الكاميرا. إذا كان هناك كائن ديناميكي محدد ، يتم تخطي تلك الإطارات. لكن هناك مشكلة في هذا الحل. تخطي الإطار بأكمله لا معنى له. المشكلة هي - الاحتفاظ بالمعلومات.

لمعالجة هذا الأمر ، يتم حذف وحدات البكسل المحيطة فقط بينما يتم الاحتفاظ بالبكسل المحيط. ومع ذلك ، في التطبيقات المتعلقة بالمركبات ذاتية القيادة والطائرات بدون طيار ذاتية القيادة ، ينتقل الحل إلى مستوى آخر. تذكر ، لقد ذكرت أننا حصلنا على خريطة ثلاثية الأبعاد للمحيط باستخدام مستشعرات LIDAR.

بعد ذلك ، يتم استخدام نموذج التعلم العميق (3D CNN) لإزالة الكائنات في إطار ثلاثي الأبعاد (محاور x ، y ، z). نماذج الشبكة العصبية هذه لها مخرجات من شكلين. الأول هو ناتج التنبؤ وهو احتمال أو احتمال للكائن المحدد. والثاني هو إحداثيات المربع المحيط. تذكر أن كل هذا يحدث في الوقت الفعلي. لذلك من المهم للغاية وجود بنية تحتية جيدة لدعم هذا النوع من المعالجة.

بصرف النظر عن هذا ، تلعب رؤية الكمبيوتر أيضًا دورًا مهمًا في تحديد لافتات الشوارع. هناك نماذج تعمل جنبًا إلى جنب للكشف عن إشارات الشوارع هذه بأنواعها المختلفة - حد السرعة ، والحذر ، وقاطع السرعة ، وما إلى ذلك مرة أخرى ، يتم استخدام نموذج التعلم العميق المدرب لتحديد هذه العلامات الحيوية حتى تتمكن السيارة من التصرف وفقًا لذلك.

بالنسبة لاكتشاف خط الحارة ، يتم تطبيق رؤية الكمبيوتر بطريقة مماثلة

المهمة هي إنتاج معاملات معادلة خط الممر. يمكن تمثيل معادلة خطوط الممر باستخدام معاملات الدرجة الأولى أو الثانية أو الثالثة. المعادلة البسيطة من الدرجة الأولى هي ببساطة معادلة خطية من النوع mx + n (خط مستقيم). أن تكون المعادلات عالية الأبعاد ذات قوة أو ترتيب أكبر يمثل المنحنيات.

لا تكون مجموعات البيانات متسقة دائمًا وتقترح معاملات خط الممر. علاوة على ذلك ، قد نرغب أيضًا في تحديد طبيعة الخط (صلب ، متقطع ، إلخ). هناك العديد من الخصائص التي قد نرغب في اكتشافها ومن المستحيل تقريبًا لشبكة عصبية واحدة تعميم النتائج. من الطرق الشائعة لحل هذه المعضلة استخدام نهج التجزئة.

في التجزئة ، الغرض هو تعيين فئة لكل بكسل من الصورة. في هذه الطريقة ، يشبه كل حارة فئة ويهدف نموذج الشبكة العصبية إلى إنتاج صورة بممرات تتكون من ألوان مختلفة (سيكون لكل حارة لونه الفريد).

اقرأ أيضًا: موضوعات وأفكار مشروعات الذكاء الاصطناعي

خاتمة

ناقشنا هنا التطبيقات العامة للرؤية الحاسوبية في مجال المركبات ذاتية القيادة. آمل أن تكون قد استمتعت بهذا المقال.

إذا كنت مهتمًا بمعرفة المزيد حول التعلم الآلي والذكاء الاصطناعي ، فراجع IIIT-B & upGrad's دبلوم PG في التعلم الآلي والذكاء الاصطناعي المصمم للمهنيين العاملين ويقدم أكثر من 450 ساعة من التدريب الصارم ، وأكثر من 30 دراسة حالة ومهمة ، حالة خريجي IIIT-B ، أكثر من 5 مشاريع تكميلية عملية ومساعدة وظيفية مع أفضل الشركات.

تعلم دورة ML من أفضل الجامعات في العالم. احصل على درجة الماجستير أو برنامج PGP التنفيذي أو برامج الشهادات المتقدمة لتسريع مسار حياتك المهنية.

ما هي الرؤية الحاسوبية المستخدمة؟

رؤية الكمبيوتر هي فرع متخصص من الذكاء الاصطناعي يساعد أجهزة الكمبيوتر على استخراج بيانات ذات مغزى من المدخلات المرئية وتشكيل القرارات بناءً على المعلومات المشتقة. الرؤية الحاسوبية هي في الواقع مجموعة فرعية متعددة التخصصات من الذكاء الاصطناعي والتعلم الآلي الذي يستخدم تقنيات متطورة وخوارزميات التعلم العامة. بمساعدة رؤية الكمبيوتر ، يمكن لأجهزة الكمبيوتر رؤية وفهم المدخلات مثل مقاطع الفيديو والصور الرقمية واتخاذ الإجراءات اللازمة كما تمت برمجتها. تمامًا مثل الذكاء الاصطناعي الذي يساعد أجهزة الكمبيوتر على التفكير ، تمكنهم رؤية الكمبيوتر من الملاحظة والفهم. بمساعدة رؤية الكمبيوتر ، يمكن لأجهزة الكمبيوتر استخراج أقصى استفادة من البيانات المرئية بكفاءة لرؤية الصورة وفهم المحتوى.

هل السيارات ذاتية القيادة آمنة؟

عندما يتعلق الأمر بسلامة هذه السيارات الأوتوماتيكية ، لا يمكن للمرء أن ينكر صراحة بعض الجوانب التي تبدو محفوفة بالمخاطر. أولاً وقبل كل شيء ، تتبادر إلى الذهن مخاوف الأمن السيبراني. يمكن أن تكون المركبات ذاتية القيادة عرضة للهجمات الإلكترونية حيث يخترق الأوغاد برنامج السيارة لسرقة السيارة أو التفاصيل الشخصية لمالكها. بعد ذلك ، تعتبر الثغرات غير المسبوقة في البرامج أو مخاطر اعتماد السائق بالكامل على السيارة للاستجابة في المواقف غير المتوقعة ، مما يؤدي إلى وقوع حوادث ، من المخاطر المحتملة أيضًا. ومع ذلك ، هناك العديد من الفوائد للسيارات ذاتية القيادة ، والتي يمكن أن توازن بين المخاطر الظاهرة. تعتبر السيارات ذاتية القيادة صديقة للبيئة وآمنة للغاية في حالات القيادة تحت تأثير الكحول ، حيث يمكن للسائقين الاعتماد على السيارة في تنقلات آمنة.

ما هي الشركات التي أطلقت سيارات ذاتية القيادة اعتبارًا من اليوم؟

السيارات ذاتية القيادة أو ذاتية القيادة هي بالفعل جزء من الواقع اليوم وواحدة من أهم مواضيع المناقشة. مع تقدم التكنولوجيا ، تتطور السيارات ذاتية القيادة أيضًا وتطرح نماذج من الدرجة الأولى التي تتفوق كثيرًا مع كل مرة تمر. أطلقت شركات السيارات العملاقة في جميع أنحاء العالم بالفعل سيارات ذاتية القيادة بالكامل من إصداراتها السابقة للمركبات شبه المستقلة. بعض الشركات الجديرة بالملاحظة التي أطلقت سيارات ذاتية القيادة هي Tesla و Waymo و Pony.ai وغيرها.