Cum folosesc mașinile care se conduc singure viziunea computerizată pentru a vedea?

Publicat: 2021-02-08

În lumea de astăzi, cererea de roboți sau vehicule autonome crește într-un ritm exponențial, iar aplicarea Simultaneous Localization And Mapping (SLAM) primește o atenție mai largă. În primul rând, vehiculele autonome au un pachet de senzori precum camere, Lidar, Radar etc.

Acești senzori analizează mediul din jurul vehiculului înainte ca acesta să ia orice decizie crucială cu privire la următoarea sa stare de mișcare. Din Lidar și datele camerei se creează o hartă de localizare. Poate fi o hartă 2D sau 3D. Scopul hărții este de a identifica obiectele statice din jurul vehiculului autonom, cum ar fi clădiri, copaci, etc. Toate obiectele dinamice sunt eliminate prin eliminarea tuturor punctelor Lidar care se găsesc în caseta de delimitare a obiectelor dinamice detectate. Aflați mai multe despre aplicațiile AI

Obiectele statice care nu interferează cu vehiculul sunt, de asemenea, îndepărtate, cum ar fi suprafața rulabilă sau ramurile copacilor. Cu grila stabilită, putem prezice o cale fără coliziuni pentru vehicul. Unul dintre elementele semnificative ale SLAM este maparea 3DM a mediului care facilitează roboților autonomi să înțeleagă mediul ca un om pentru care multe camere Depth sau camere RGB-D se dovedesc valoroase.

Pentru ca vehiculele autonome să navigheze eficient, acestea au nevoie de un cadru de referință și de a observa mediul înconjurător folosind algoritmi de viziune computerizată pentru a contura o hartă a împrejurimilor și a traversa traseul. Reconstrucția 3D include utilizarea viziunii computerizate pentru a observa împrejurimile exterioare folosind un nor de puncte 3D bazat pe adâncime.

Prin urmare, principiul de bază este un punct de joncțiune între reconstrucția 3D și navigația autonomă. Creșterea interesului pentru soluțiile 3D solicită o soluție completă care să poată percepe împrejurimile și să construiască o proiecție 3D a împrejurimilor corespunzătoare.

Practica algoritmilor de viziune computerizată pentru a realiza automatizarea în robotică sau pentru a produce modele 3D a fost destul de comună. Enigma de localizare și cartografiere simultană a continuat de mult timp și se desfășoară o mulțime de cercetări pentru a găsi metodologii eficiente pentru a aborda problema cartografierii.

Cercetările actuale în acest domeniu folosesc camere scumpe pentru a produce hărți de disparitate și adâncime care, deși, sunt mai precise, dar totuși costisitoare. Diferite metode implică utilizarea camerelor de vedere stereo pentru a determina adâncimea obiectelor din jur, care este folosită în continuare pentru a produce nori de puncte 3D.

Cuprins

Tipuri de hărți de reprezentare a mediului

  • Hărți de localizare: este creată folosind un set de puncte LIDAR sau caracteristici de imagine ale camerei pe măsură ce mașina se mișcă. Această hartă împreună cu GPU, IMU și odometria este utilizată de modulul de localizare pentru a estima poziția precisă a vehiculului autonom. pe măsură ce sunt primite date noi LIDAR și camere, acestea sunt comparate cu harta de localizare și măsurarea poziției vehiculului autonom este creată prin alinierea noilor date cu harta existentă.
  • Harta grilă de ocupare : această hartă folosește un set continuu de puncte LIDAR pentru a construi un mediu de hartă care indică locația tuturor obiectelor statice pe care este folosită pentru a planifica o cale sigură fără coliziuni pentru vehiculul autonom.

Este important de remarcat faptul că prezența obiectelor dinamice în norul de puncte, împiedică reconstrucția precisă a noului de puncte. Aceste obiecte dinamice împiedică remodelarea propriu-zisă a mediului înconjurător. În același scop, este important să se formuleze o soluție care să abordeze această problemă.

Intenția principală este de a identifica aceste obiecte dinamice folosind învățarea profundă. Odată ce aceste obiecte sunt identificate, punctele care înconjoară acea casetă de delimitare pot fi aruncate. În acest fel, modelul reconstruit va fi complet din obiecte statice.

Camera RGB-D poate măsura adâncimea folosind un senzor IR. Ieșirea astfel obținută este datele de imagine (valorile RGB) și datele de adâncime (gama obiectului de la cameră). Deoarece adâncimea trebuie să fie precisă, orice nepotrivire poate provoca un accident fatal. Din acest motiv, camerele sunt calibrate astfel încât să ofere o măsurare precisă a mediului înconjurător. Hărțile de adâncime sunt de obicei utilizate pentru a valida acuratețea valorilor de adâncime calculate.

Harta de adâncime este o ieșire în tonuri de gri a împrejurimilor în care obiectele care sunt mai aproape de cameră posedă pixeli mai strălucitori, iar cele mai îndepărtate dețin pixeli mai întunecați. Datele de imagine care sunt obținute de la cameră sunt transmise la modulul de detectare a obiectelor care identifică obiectele dinamice prezente în cadru.

Deci, cum identificăm aceste obiecte dinamice pe care le puteți întreba?

Aici, o rețea neuronală de învățare profundă este antrenată pentru a identifica obiectele dinamice. Modelul astfel antrenat parcurge fiecare cadru primit de la cameră. Dacă există un obiect dinamic identificat, acele cadre sunt sărite. Dar, există o problemă cu această soluție. Sări peste întregul cadru nu are sens. Problema este – reținerea informațiilor.

Pentru a rezolva acest lucru, numai pixelii casetei de delimitare sunt eliminați, în timp ce pixelii din jur sunt păstrați. Cu toate acestea, în aplicațiile legate de vehicule cu conducere autonomă și drone de livrare autonomă, soluția este dusă la un alt nivel. Amintiți-vă, am menționat că obținem o hartă 3D a împrejurimilor folosind senzori LIDAR.

După aceea, modelul de învățare profundă (3D CNN) este utilizat pentru a elimina obiectele dintr-un cadru 3D (axele x,y,z). Aceste modele de rețele neuronale au ieșiri de 2 forme. Unul este rezultatul predicției, care este o probabilitate sau probabilitate a obiectului identificat. Și al doilea sunt coordonatele casetei de delimitare. Amintiți-vă, toate acestea se întâmplă în timp real. Deci este extrem de important să existe o infrastructură bună pentru a sprijini acest tip de procesare.

În afară de aceasta, viziunea computerizată joacă, de asemenea, un rol important în identificarea indicatoarelor stradale. Există modele care rulează împreună pentru a detecta aceste semne stradale de diferite tipuri - limită de viteză, precauție, întrerupător de viteză etc. Din nou, un model de deep learning este utilizat pentru a identifica aceste semne vitale, astfel încât vehiculul să poată acționa în consecință.

Pentru detectarea liniei de bandă, viziunea computerizată este aplicată într-un mod similar

Sarcina este de a produce coeficienții ecuației unei linii de bandă. Ecuația liniilor benzii poate fi reprezentată folosind coeficienți de ordinul întâi, al doilea sau al treilea. O ecuație simplă de ordinul întâi este pur și simplu o ecuație liniară de tipul mx+n (o linie dreaptă). Ecuațiile de dimensiuni mari să fie de putere mai mare sau de ordine care reprezintă curbe.

Seturile de date nu sunt întotdeauna consistente și sugerează coeficienți ai liniilor de bandă. În plus, este posibil să dorim în plus să identificăm natura liniei (solidă, întreruptă etc.). Există numeroase caracteristici pe care putem dori să le detectăm și este aproape imposibil ca o singură rețea neuronală să generalizeze rezultatele. O metodă comună pentru rezolvarea acestei dileme este utilizarea unei abordări de segmentare.

În segmentare, scopul este de a atribui o clasă fiecărui pixel al unei imagini. În această metodă, fiecare bandă seamănă cu o clasă, iar modelul rețelei neuronale își propune să producă o imagine cu benzi formate din culori diferite (fiecare bandă va avea culoarea sa unică).

Citește și: Idei și subiecte de proiecte AI

Concluzie

Aici am discutat despre aplicațiile generale ale vederii computerizate în domeniul vehiculelor autonome. Sper că v-a plăcut acest articol.

Dacă sunteți interesat să aflați mai multe despre învățarea automată și inteligența artificială, consultați Diploma PG în Învățare automată și inteligență artificială a IIIT-B și upGrad, care este concepută pentru profesioniști care lucrează și oferă peste 450 de ore de pregătire riguroasă, peste 30 de studii de caz și sarcini, Statut de absolvenți IIIT-B, peste 5 proiecte practice practice și asistență pentru locuri de muncă cu firme de top.

Învață cursul ML de la cele mai bune universități din lume. Câștigă programe de master, Executive PGP sau Advanced Certificate pentru a-ți accelera cariera.

Pentru ce se folosește viziunea computerizată?

Viziunea computerizată este o ramură specializată a inteligenței artificiale care ajută computerele să extragă date semnificative din intrările vizuale și să ia decizii bazate pe informațiile derivate. Viziunea computerizată este de fapt un subset multidisciplinar de inteligență artificială și învățare automată care utilizează tehnici sofisticate și algoritmi de învățare generali. Cu ajutorul viziunii computerizate, computerele pot vedea și înțelege intrări precum videoclipuri și imagini digitale și pot lua acțiunile necesare așa cum sunt programate. La fel cum inteligența artificială ajută computerele să gândească, viziunea computerizată le dă putere să observe și să înțeleagă. Cu ajutorul viziunii computerizate, computerele pot extrage eficient maximum de date vizuale pentru a vedea o imagine și a înțelege conținutul.

Sunt mașinile care se conduc singure în siguranță?

Când vine vorba de siguranța acestor mașini automate, nu se poate nega în mod categoric unele aspecte aparent riscante. În primul rând, ne vin în minte preocupările legate de securitatea cibernetică. Vehiculele autonome pot fi vulnerabile la atacuri cibernetice, în care răufăcătorii pirata software-ul mașinii pentru a fura mașina sau datele personale ale proprietarului acesteia. În continuare, erorile software fără precedent sau pericolele ca șoferul să se bazeze în întregime pe mașină pentru a răspunde în situații neașteptate, care duc la accidente, sunt, de asemenea, riscuri probabile. Cu toate acestea, există multe beneficii ale mașinilor cu conducere autonomă, care pot echilibra pericolele aparente. Mașinile autonome sunt ecologice și extrem de sigure în cazurile de conducere în stare de ebrietate, unde șoferii se pot baza pe vehicul pentru o călătorie sigură.

Ce companii au lansat mașini autonome începând de astăzi?

Mașinile cu conducere autonomă sau autonome fac deja parte din realitate astăzi și unul dintre cele mai fierbinți subiecte de discuție. Pe măsură ce tehnologia avansează, mașinile cu conducere autonomă evoluează și lansează modele de top care devin cu mult superioare cu fiecare timp care trece. Giganții de automobile din întreaga lume au lansat deja mașini complet autonome din versiunile lor anterioare de vehicule semi-autonome. Unele dintre cele mai remarcabile companii care au lansat mașini autonome sunt Tesla, Waymo, Pony.ai și altele.