รถยนต์ที่ขับเองใช้ Computer Vision ในการดูอย่างไร

เผยแพร่แล้ว: 2021-02-08

ในโลกปัจจุบัน ความต้องการหุ่นยนต์หรือยานพาหนะที่ขับเคลื่อนด้วยตนเองเพิ่มขึ้นในอัตราแบบทวีคูณ และการประยุกต์ใช้ Simultaneous Localization And Mapping (SLAM) กำลังได้รับความสนใจมากขึ้น ประการแรก ยานยนต์ไร้คนขับมีชุดเซ็นเซอร์ เช่น กล้อง, Lidar, Radar เป็นต้น

เซ็นเซอร์เหล่านี้จะวิเคราะห์สภาพแวดล้อมรอบ ๆ รถก่อนที่รถจะทำการตัดสินใจที่สำคัญเกี่ยวกับสถานะการเคลื่อนไหวครั้งต่อไป จาก Lidar และข้อมูลกล้องจะมีการสร้างแผนที่โลคัลไลเซชัน อาจเป็นแผนที่ 2 มิติหรือ 3 มิติ จุดประสงค์ของแผนที่คือเพื่อระบุวัตถุที่อยู่นิ่งรอบๆ รถยนต์ไร้คนขับ เช่น สิ่งปลูกสร้าง ต้นไม้ ฯลฯ วัตถุไดนามิกทั้งหมดจะถูกลบออกโดยการลบจุด Lidar ทั้งหมดที่พบในกล่องขอบเขตของวัตถุไดนามิกที่ตรวจพบ เรียนรู้เพิ่มเติมเกี่ยวกับ แอปพลิเคชันของ AI

วัตถุที่อยู่นิ่งที่ไม่รบกวนรถจะถูกลบออกเช่นกัน เช่น พื้นผิวที่ขับได้หรือกิ่งไม้ เมื่อสร้างตารางแล้ว เราสามารถคาดการณ์เส้นทางที่ไม่มีการชนกันของรถได้ องค์ประกอบที่สำคัญอย่างหนึ่งของ SLAM คือ 3DMapping ของสภาพแวดล้อมซึ่งช่วยให้หุ่นยนต์อิสระเข้าใจสภาพแวดล้อมเหมือนมนุษย์ซึ่งกล้อง Depth หรือกล้อง RGB-D จำนวนมากพิสูจน์ได้ว่ามีค่า

เพื่อให้ยานยนต์ไร้คนขับสามารถนำทางได้อย่างมีประสิทธิภาพ พวกเขาต้องการกรอบอ้างอิงและสังเกตสภาพแวดล้อมโดยรอบโดยใช้อัลกอริธึมการมองเห็นด้วยคอมพิวเตอร์เพื่อร่างแผนที่ของบริเวณโดยรอบและสำรวจเส้นทาง การสร้าง 3D ใหม่รวมถึงการใช้คอมพิวเตอร์วิทัศน์เพื่อสังเกตสภาพแวดล้อมภายนอกโดยใช้คลาวด์พอยต์ 3 มิติแบบเชิงลึก

ดังนั้น หลักการพื้นฐานคือจุดเชื่อมต่อระหว่างการสร้าง 3 มิติและการนำทางอัตโนมัติ ความสนใจที่เพิ่มขึ้นสำหรับโซลูชัน 3 มิติร้องขอโซลูชันที่สมบูรณ์ซึ่งสามารถรับรู้สภาพแวดล้อมโดยรอบและสร้างการฉายภาพ 3 มิติของสภาพแวดล้อมที่เกี่ยวข้อง

การฝึกใช้อัลกอริธึมการมองเห็นด้วยคอมพิวเตอร์เพื่อทำให้เกิดระบบอัตโนมัติในวิทยาการหุ่นยนต์หรือการผลิตการออกแบบ 3 มิตินั้นเป็นเรื่องธรรมดา ปริศนาการโลคัลไลซ์เซชั่นและการทำแผนที่พร้อมกันได้ดำเนินไปเป็นเวลานานและมีการวิจัยจำนวนมากกำลังดำเนินการเพื่อค้นหาวิธีการที่มีประสิทธิภาพในการแก้ไขปัญหาการทำแผนที่

การวิจัยในปัจจุบันในโดเมนนี้ใช้กล้องราคาแพงเพื่อสร้างแผนที่ความต่างและความลึกที่ถึงแม้จะแม่นยำกว่า แต่ก็ยังมีราคาแพงอยู่ วิธีการต่างๆ เกี่ยวข้องกับการใช้กล้องบันทึกภาพสเตอริโอเพื่อกำหนดความลึกของวัตถุรอบข้าง ซึ่งจะนำไปใช้ในการผลิตเมฆแบบจุด 3 มิติต่อไป

สารบัญ

ประเภทของแผนที่ตัวแทนสิ่งแวดล้อม
ดังนั้น เราจะระบุวัตถุไดนามิกเหล่านี้ที่คุณอาจถามได้อย่างไร
สำหรับ Lane Line Detection นั้น Computer Vision ถูกนำมาใช้ในลักษณะเดียวกัน
บทสรุป
คอมพิวเตอร์วิทัศน์ใช้ทำอะไร?
รถยนต์ที่ขับเองปลอดภัยหรือไม่?
บริษัทใดบ้างที่ได้เปิดตัวรถยนต์ไร้คนขับ ณ วันนี้

ประเภทของแผนที่ตัวแทนสิ่งแวดล้อม

แผนที่โลคัลไลเซชัน: มันถูกสร้างขึ้นโดยใช้ชุดจุด LIDAR หรือคุณสมบัติภาพของกล้องในขณะที่รถเคลื่อนที่ แผนที่นี้พร้อมกับ GPU, IMU และการวัดระยะทางถูกใช้โดยโมดูลการแปลเพื่อประเมินตำแหน่งที่แม่นยำของยานพาหนะที่เป็นอิสระ เมื่อได้รับข้อมูล LIDAR และข้อมูลกล้องใหม่แล้ว ระบบจะนำไปเปรียบเทียบกับแผนที่โลคัลไลเซชัน และการวัดตำแหน่งของยานพาหนะอัตโนมัติจะถูกสร้างขึ้นโดยการจัดข้อมูลใหม่ให้สอดคล้องกับแผนที่ที่มีอยู่
Occupancy Grid Map : แผนที่นี้ใช้ชุดจุด LIDAR อย่างต่อเนื่องเพื่อสร้างสภาพแวดล้อมของแผนที่ที่ระบุตำแหน่งของวัตถุคงที่ทั้งหมด ซึ่งใช้ในการวางแผนเส้นทางที่ปลอดภัยสำหรับการชนกันของรถยนต์ที่เป็นอิสระ

สิ่งสำคัญคือต้องสังเกตว่าการมีอยู่ของออบเจกต์ไดนามิกใน point cloud จะเป็นอุปสรรคต่อการสร้าง point cloud ขึ้นมาใหม่อย่างแม่นยำ ออบเจ็กต์ไดนามิกเหล่านี้ป้องกันการเปลี่ยนแปลงที่แท้จริงของสภาพแวดล้อมโดยรอบ เพื่อจุดประสงค์เดียวกัน การกำหนดแนวทางแก้ไขปัญหานี้เป็นสิ่งสำคัญ

ความตั้งใจหลักคือการระบุวัตถุแบบไดนามิกเหล่านี้โดยใช้การเรียนรู้เชิงลึก เมื่อระบุวัตถุเหล่านี้แล้ว จุดที่อยู่ล้อมรอบกล่องขอบเขตนั้นสามารถละทิ้งได้ ด้วยวิธีนี้ โมเดลที่สร้างขึ้นใหม่จะเป็นวัตถุแบบคงที่ทั้งหมด

กล้อง RGB-D สามารถวัดความลึกโดยใช้เซ็นเซอร์ IR ผลลัพธ์ที่ได้คือข้อมูลภาพ (ค่า RGB) และข้อมูลความลึก (ช่วงของวัตถุจากกล้อง) เนื่องจากความลึกจะต้องแม่นยำ ความไม่ตรงกันอาจทำให้เกิดอุบัติเหตุร้ายแรงได้ ด้วยเหตุนี้ กล้องจึงได้รับการปรับเทียบในลักษณะที่ให้การวัดบริเวณโดยรอบที่แม่นยำ แผนที่ความลึกมักจะใช้เพื่อตรวจสอบความถูกต้องของค่าความลึกที่คำนวณได้

แผนที่ความลึกเป็นเอาต์พุตระดับสีเทาของสภาพแวดล้อม โดยที่วัตถุที่อยู่ใกล้กล้องจะมีพิกเซลที่สว่างกว่า และวัตถุที่อยู่ไกลออกไปจะมีพิกเซลที่มืดกว่า ข้อมูลภาพที่ได้รับจากกล้องจะถูกส่งต่อไปยังโมดูลการตรวจจับวัตถุที่ระบุวัตถุไดนามิกที่อยู่ในเฟรม

ดังนั้น เราจะระบุวัตถุไดนามิกเหล่านี้ที่คุณอาจถามได้อย่างไร

ที่นี่ โครงข่ายประสาทเทียมการเรียนรู้เชิงลึกได้รับการฝึกฝนเพื่อระบุวัตถุไดนามิก โมเดลที่ได้รับการฝึกมามากจะวิ่งผ่านแต่ละเฟรมที่ได้รับจากกล้อง หากมีวัตถุไดนามิกที่ระบุ เฟรมเหล่านั้นจะถูกข้าม แต่มีปัญหากับวิธีแก้ปัญหานี้ การข้ามเฟรมทั้งหมดไม่สมเหตุสมผล ปัญหาคือ – การเก็บรักษาข้อมูล

เพื่อแก้ไขปัญหานี้ เฉพาะพิกเซลของกล่องที่มีขอบเขตเท่านั้นที่จะถูกตัดออก ในขณะที่พิกเซลโดยรอบจะยังคงอยู่ อย่างไรก็ตาม ในการใช้งานที่เกี่ยวข้องกับยานยนต์ไร้คนขับและโดรนขนส่งอัตโนมัติ การแก้ปัญหาถูกยกระดับไปอีกระดับหนึ่ง โปรดจำไว้ว่า ฉันได้กล่าวว่าเราได้รับแผนที่ 3 มิติของบริเวณโดยรอบโดยใช้เซ็นเซอร์ LIDAR

หลังจากนั้น โมเดลการเรียนรู้เชิงลึก (3D CNN) จะถูกใช้เพื่อกำจัดวัตถุในเฟรม 3 มิติ (แกน x,y,z) โมเดลโครงข่ายประสาทเทียมเหล่านี้มีเอาต์พุต 2 รูปแบบ หนึ่งคือผลลัพธ์การทำนายซึ่งเป็นความน่าจะเป็นหรือความน่าจะเป็นของวัตถุที่ระบุ และที่สองคือพิกัดของกรอบ จำไว้ว่า ทั้งหมดนี้เกิดขึ้นแบบเรียลไทม์ ดังนั้นจึงเป็นสิ่งสำคัญอย่างยิ่งที่จะมีโครงสร้างพื้นฐานที่ดีเพื่อรองรับการประมวลผลประเภทนี้

นอกจากนี้ คอมพิวเตอร์วิทัศน์ยังมีบทบาทสำคัญในการระบุป้ายถนน มีโมเดลที่ทำงานร่วมกันเพื่อตรวจจับป้ายถนนประเภทต่างๆ เช่น การจำกัดความเร็ว ข้อควรระวัง เบรกเกอร์ความเร็ว ฯลฯ อีกครั้งหนึ่ง โมเดลการเรียนรู้เชิงลึกที่ได้รับการฝึกฝนมาใช้เพื่อระบุสัญญาณชีพเหล่านี้เพื่อให้ยานพาหนะสามารถดำเนินการตามนั้นได้

สำหรับ Lane Line Detection นั้น Computer Vision ถูกนำมาใช้ในลักษณะเดียวกัน

ภารกิจคือการสร้างสัมประสิทธิ์ของสมการของเส้นเลน สมการของเส้นช่องจราจรสามารถแสดงได้โดยใช้สัมประสิทธิ์ลำดับที่หนึ่ง สอง หรือสาม สมการอันดับหนึ่งอย่างง่ายคือสมการเชิงเส้นประเภท mx+n (เส้นตรง) สมการมิติสูงที่มีกำลังมากกว่าหรือลำดับที่แสดงถึงเส้นโค้ง

ชุดข้อมูลไม่สอดคล้องกันเสมอไปและแนะนำค่าสัมประสิทธิ์ช่องทางเดินรถ นอกจากนี้ เราอาจต้องการระบุลักษณะของเส้นเพิ่มเติม (ทึบ เส้นประ ฯลฯ) มีลักษณะเฉพาะหลายอย่างที่เราอาจต้องการตรวจจับ และแทบจะเป็นไปไม่ได้เลยที่โครงข่ายประสาทเทียมเดียวจะสรุปผลลัพธ์ได้ วิธีการทั่วไปในการแก้ไขปัญหานี้คือการใช้วิธีการแบ่งส่วน

ในการแบ่งส่วน มีวัตถุประสงค์เพื่อกำหนดคลาสให้กับแต่ละพิกเซลของรูปภาพ ในวิธีนี้ ทุกเลนจะมีลักษณะคล้ายกับคลาส และโมเดลโครงข่ายประสาทเทียมมีจุดมุ่งหมายเพื่อสร้างภาพที่มีเลนซึ่งประกอบด้วยสีต่างๆ (แต่ละเลนจะมีสีเฉพาะตัว)

อ่านเพิ่มเติม: แนวคิดและหัวข้อโครงการ AI

บทสรุป

ในที่นี้ เราได้กล่าวถึงการใช้งานทั่วไปของคอมพิวเตอร์วิทัศน์ในโดเมนของยานยนต์ไร้คนขับ หวังว่าคุณจะสนุกกับบทความนี้

หากคุณสนใจที่จะเรียนรู้เพิ่มเติมเกี่ยวกับแมชชีนเลิร์นนิงและ AI โปรดดูที่ IIIT-B & upGrad's PG Diploma in Machine Learning & AI ซึ่งออกแบบมาสำหรับมืออาชีพที่ทำงานและมีการฝึกอบรมที่เข้มงวดมากกว่า 450 ชั่วโมง กรณีศึกษาและการมอบหมายมากกว่า 30 รายการ สถานะศิษย์เก่า IIIT-B โครงการหลัก 5 โครงการและความช่วยเหลือด้านงานกับบริษัทชั้นนำ

เรียนรู้ หลักสูตร ML จากมหาวิทยาลัยชั้นนำของโลก รับ Masters, Executive PGP หรือ Advanced Certificate Programs เพื่อติดตามอาชีพของคุณอย่างรวดเร็ว

คอมพิวเตอร์วิทัศน์ใช้ทำอะไร?

คอมพิวเตอร์วิทัศน์เป็นสาขาเฉพาะของปัญญาประดิษฐ์ที่ช่วยให้คอมพิวเตอร์ดึงข้อมูลที่มีความหมายจากอินพุตภาพและสร้างการตัดสินใจตามข้อมูลที่ได้รับ คอมพิวเตอร์วิทัศน์เป็นชุดย่อยสหสาขาวิชาชีพของปัญญาประดิษฐ์และการเรียนรู้ของเครื่องที่ใช้เทคนิคที่ซับซ้อนและอัลกอริธึมการเรียนรู้ทั่วไป ด้วยความช่วยเหลือของคอมพิวเตอร์วิทัศน์ คอมพิวเตอร์สามารถดูและเข้าใจอินพุต เช่น วิดีโอและภาพดิจิทัล และดำเนินการที่จำเป็นตามที่โปรแกรมไว้ เช่นเดียวกับปัญญาประดิษฐ์ช่วยให้คอมพิวเตอร์คิด การมองเห็นด้วยคอมพิวเตอร์ช่วยให้พวกเขาสังเกตและเข้าใจ ด้วยความช่วยเหลือของคอมพิวเตอร์วิทัศน์ คอมพิวเตอร์สามารถดึงข้อมูลภาพได้อย่างมีประสิทธิภาพสูงสุดเพื่อดูภาพและทำความเข้าใจเนื้อหา

รถยนต์ที่ขับเองปลอดภัยหรือไม่?

เมื่อพูดถึงความปลอดภัยของรถยนต์อัตโนมัติเหล่านี้ เราไม่อาจปฏิเสธแง่มุมที่อาจดูเหมือนเสี่ยงได้โดยสิ้นเชิง ประการแรกและสำคัญที่สุด ข้อกังวลด้านความปลอดภัยในโลกไซเบอร์ต้องคำนึงถึง รถยนต์ไร้คนขับอาจเสี่ยงต่อการถูกโจมตีทางไซเบอร์ โดยที่ผู้ร้ายจะแฮ็กซอฟต์แวร์รถยนต์เพื่อขโมยรถหรือข้อมูลส่วนตัวของเจ้าของรถ ต่อมา ความผิดพลาดของซอฟต์แวร์ที่ไม่เคยเกิดขึ้นมาก่อนหรืออันตรายของผู้ขับขี่ที่ต้องพึ่งพารถอย่างเต็มที่เพื่อตอบสนองต่อสถานการณ์ที่ไม่คาดคิดซึ่งส่งผลให้เกิดอุบัติเหตุก็มีความเสี่ยงเช่นกัน อย่างไรก็ตาม รถยนต์ที่ขับด้วยตนเองมีประโยชน์มากมาย ซึ่งสามารถปรับสมดุลอันตรายที่ดูเหมือน รถยนต์ขับเคลื่อนอัตโนมัติเป็นมิตรกับสิ่งแวดล้อมและปลอดภัยอย่างยิ่งในกรณีที่เมาแล้วขับ ซึ่งผู้ขับขี่สามารถพึ่งพารถได้เพื่อความปลอดภัยในการเดินทาง

บริษัทใดบ้างที่ได้เปิดตัวรถยนต์ไร้คนขับ ณ วันนี้

รถยนต์ไร้คนขับหรือขับเคลื่อนอัตโนมัติเป็นส่วนหนึ่งของความเป็นจริงในปัจจุบันและเป็นหนึ่งในหัวข้อสนทนาที่ร้อนแรงที่สุด ในขณะที่เทคโนโลยีก้าวหน้า รถยนต์ที่ขับเคลื่อนด้วยตัวเองก็มีการพัฒนาและเปิดตัวรถรุ่นระดับบนที่เหนือชั้นกว่าทุกครั้งที่ผ่านมา บริษัทรถยนต์ยักษ์ใหญ่ทั่วโลกได้เปิดตัวรถยนต์ไร้คนขับเต็มรูปแบบจากรถยนต์กึ่งอัตโนมัติรุ่นก่อนหน้านี้ บริษัทที่โดดเด่นที่สุดบางแห่งที่เปิดตัวรถยนต์ขับเคลื่อนอัตโนมัติ ได้แก่ Tesla, Waymo, Pony.ai และอื่นๆ