6 tipuri de învățare supravegheată despre care trebuie să știți în 2022

Publicat: 2021-01-10

Învățarea automată este una dintre cele mai comune aplicații ale inteligenței artificiale. O mașină învață să execute sarcini din datele furnizate în ea. Și cu experiență, performanța sa într-o anumită sarcină se îmbunătățește. Învățarea automată include tehnici de învățare supravegheată, nesupravegheată și consolidată. Citiți mai multe despre tipurile de învățare automată.

În acest articol, ne vom uita la diferite tipuri de învățare supravegheată.

Cuprins

Ce este învățarea supravegheată?

În Învățare supravegheată, o mașină este antrenată folosind date „etichetate”. Se spune că seturile de date sunt etichetate atunci când conțin atât parametri de intrare, cât și de ieșire. Cu alte cuvinte, datele au fost deja etichetate cu răspunsul corect.

Deci, tehnica imită un mediu de clasă în care un elev învață în prezența unui supervizor sau a unui profesor. Pe de altă parte, algoritmii de învățare nesupravegheați le permit modelelor să descopere informații și să învețe pe cont propriu.

Învățarea automată supravegheată este extrem de utilă în rezolvarea problemelor de calcul din lumea reală. Algoritmul prezice rezultate pentru datele neprevăzute prin învățarea din datele de antrenament etichetate. Prin urmare, este nevoie de oameni de știință de date cu înaltă calificare pentru a construi și a implementa astfel de modele. De-a lungul timpului, oamenii de știință din date își folosesc și expertiza tehnică pentru a reconstrui modelele pentru a menține integritatea informațiilor oferite.

Cum functioneazã?

De exemplu, doriți să instruiți o mașină să prezică timpul de navetă între birou și casă. Mai întâi, veți crea un set de date etichetat, cum ar fi vremea, ora din zi, ruta aleasă etc., care ar cuprinde datele dvs. de intrare. Iar rezultatul ar fi durata estimată a călătoriei dumneavoastră înapoi acasă într-o anumită zi.

Odată ce creați un set de antrenament bazat pe factorii corespunzători, mașina va vedea relațiile dintre punctele de date și le va folosi pentru a determina timpul necesar pentru a vă întoarce acasă. De exemplu, o aplicație mobilă vă poate spune că timpul dvs. de călătorie va fi mai lung atunci când sunt ploi abundente.

Aparatul poate vedea și alte conexiuni în datele dvs. etichetate, cum ar fi timpul în care plecați de la serviciu. Puteți ajunge acasă mai devreme dacă începeți înainte ca traficul în orele de vârf să ajungă pe drumuri. Citiți mai multe dacă sunteți curios să aflați cum funcționează învățarea automată nesupravegheată.

Acum, să încercăm să înțelegem învățarea supravegheată cu ajutorul unui alt exemplu din viața reală. Să presupunem că ai un coș cu fructe și că antrenezi mașina cu toate tipurile de fructe. Datele de antrenament pot include următoarele scenarii:

Dacă obiectul este de culoare roșie, de formă rotundă și are o depresiune în partea de sus, etichetați-l drept „Măr”.
Dacă articolul are o culoare galben-verzuie și are forma unui cilindru curbat, marcați-l ca „Banana”

Apoi, dați un nou obiect (date de testare) și cereți mașinii să identifice dacă este o banană sau un măr. Va învăța din datele de antrenament și va aplica cunoștințele pentru a clasifica fructele în funcție de culorile și formele introduse.

Diferite tipuri de învățare supravegheată

1. Regresia

În regresie, o singură valoare de ieșire este produsă folosind datele de antrenament. Această valoare este o interpretare probabilistică, care se constată după luarea în considerare a puterii corelației dintre variabilele de intrare. De exemplu, regresia poate ajuta la prezicerea prețului unei case în funcție de localitatea, dimensiunea acesteia etc.

În regresia logistică, rezultatul are valori discrete bazate pe un set de variabile independente. Această metodă se poate frământa atunci când are de-a face cu granițe de decizie neliniare și multiple. De asemenea, nu este suficient de flexibil pentru a captura relații complexe în seturile de date.

2. Clasificare

Aceasta implică gruparea datelor în clase. Dacă vă gândiți să acordați credit unei persoane, puteți utiliza clasificarea pentru a determina dacă o persoană ar fi sau nu un debitor al împrumutului. Când algoritmul de învățare supravegheată etichetează datele de intrare în două clase distincte, se numește clasificare binară. Clasificări multiple înseamnă clasificarea datelor în mai mult de două clase.

3. Model Bayesian naiv

Modelul Bayesian de clasificare este utilizat pentru seturi mari de date finite. Este o metodă de atribuire a etichetelor de clasă folosind un grafic aciclic direct. Graficul cuprinde un nod părinte și mai multe noduri copii. Și se presupune că fiecare nod copil este independent și separat de părintele.

Arbori de decizie

Un arbore de decizie este un model asemănător unei organigrame care conține declarații de control condiționat, cuprinzând decizii și consecințele lor probabile. Rezultatul se referă la etichetarea datelor neprevăzute.

În reprezentarea arborelui, nodurile frunză corespund etichetelor de clasă, iar nodurile interne reprezintă atributele. Un arbore de decizie poate fi folosit pentru a rezolva probleme cu atribute discrete, precum și cu funcții booleene. Unii dintre algoritmii notabili ai arborelui de decizie sunt ID3 și CART.

4. Modelul forestier aleatoriu

Modelul forestier aleatoriu este o metodă de ansamblu. Funcționează prin construirea unei multitudini de arbori de decizie și produce o clasificare a arborilor individuali. Să presupunem că doriți să preziceți care studenți vor avea rezultate bune în GMAT - un test luat pentru admiterea în programele de management postuniversitar. Un model de pădure aleatoare ar îndeplini sarcina, având în vedere factorii demografici și educaționali ai unui set de elevi care au susținut anterior testul.

5. Rețele neuronale

Acest algoritm este conceput pentru a grupa intrările brute, pentru a recunoaște tipare sau pentru a interpreta datele senzoriale. În ciuda multiplelor avantaje, rețelele neuronale necesită resurse de calcul semnificative. Poate deveni complicat să potriviți o rețea neuronală atunci când există mii de observații. Este, de asemenea, numit algoritmul „cutie neagră”, deoarece interpretarea logicii din spatele predicțiilor lor poate fi dificilă.

Citiți : Top 10 arhitecturi de rețele neuronale în 2020

6. Suport mașini vectoriale

Support Vector Machine (SVM) este un algoritm de învățare supravegheat dezvoltat în anul 1990. Se bazează pe teoria învățării statistice dezvoltată de Vap Nick.

SVM separă hiperplanele, ceea ce îl face un clasificator discriminativ. Ieșirea este produsă sub forma unui hiperplan optim care clasifică noi exemple. SVM-urile sunt strâns legate de cadrul kernelului și sunt utilizate în diverse domenii. Unele exemple includ bioinformatica, recunoașterea modelelor și regăsirea informațiilor multimedia.

Avantaje și dezavantaje ale învățării supravegheate

Mai multe tipuri de învățare supravegheată vă permit să colectați și să produceți date din experiența anterioară. De la optimizarea criteriilor de performanță până la abordarea problemelor din lumea reală, învățarea supravegheată a apărut ca un instrument puternic în domeniul AI. Este, de asemenea, o metodă mai de încredere în comparație cu învățarea nesupravegheată, care poate fi complexă din punct de vedere computațional și mai puțin precisă în unele cazuri.

Cu toate acestea, învățarea supravegheată nu este lipsită de limitări. Sunt necesare exemple concrete pentru formarea clasificatorilor, iar limitele de decizie pot fi supraantrenate în absența exemplelor potrivite. De asemenea, cineva poate întâmpina dificultăți în clasificarea datelor mari.

Rezumând

Durata și scurtă a învățării supravegheate este că folosește date etichetate pentru a antrena o mașină. Tehnicile de regresie și algoritmii de clasificare ajută la dezvoltarea modelelor predictive care sunt foarte fiabile și au aplicații multiple.

Învățarea supravegheată necesită experți pentru a construi, scala și actualiza modele. În absența competențelor tehnice, forța brută poate fi aplicată pentru a determina variabilele de intrare. Și acest lucru ar putea produce rezultate inexacte. Deci, selectarea caracteristicilor relevante de date este esențială pentru ca învățarea supravegheată să funcționeze eficient.

Ar trebui mai întâi să decideți ce date sunt necesare pentru setul de antrenament, să continuați să structurați funcția învățată și algoritmul și, de asemenea, să adune rezultatele de la experți și măsurători. Astfel de bune practici pot contribui în mare măsură în sprijinirea acurateței unui model.

Pe măsură ce inteligența artificială și învățarea automată cresc în ritm în lumea de astăzi orientată spre tehnologie, cunoașterea tipurilor de învățare supravegheată poate fi un factor de diferențiere semnificativ în orice domeniu. Explicațiile de mai sus te-ar ajuta să faci primul pas!

Dacă sunteți interesat să aflați mai multe despre învățarea automată, consultați Diploma PG de la IIIT-B și upGrad în Învățare automată și AI, care este concepută pentru profesioniști care lucrează și oferă peste 450 de ore de pregătire riguroasă, peste 30 de studii de caz și sarcini, IIIT- B Statut de absolvenți, peste 5 proiecte practice practice și asistență pentru locuri de muncă cu firme de top.

Învață cursul ML de la cele mai bune universități din lume. Câștigă programe de master, Executive PGP sau Advanced Certificate pentru a-ți accelera cariera.

Care este sensul învățării supravegheate?

O mașină învață folosind date „etichetate” în Învățare supravegheată. Atunci când un set de date are atât parametrii de intrare, cât și de ieșire, este considerat a fi etichetat. Cu alte cuvinte, informațiile au fost deja etichetate cu răspunsul corect. În provocările de calcul din lumea reală, învățarea automată supravegheată este destul de utilă. Sistemul învață din datele de antrenament etichetate pentru a prezice rezultatele pentru datele neprevăzute. Ca rezultat, construirea și implementarea unor astfel de modele necesită expertiza unor oameni de știință de date cu înaltă calificare. Oamenii de știință de date își folosesc cunoștințele tehnice pentru a construi modele de-a lungul timpului, pentru a păstra validitatea informațiilor furnizate.

Care este diferența dintre clasificare și regresie?

Folosind datele de antrenament, regresia produce o singură valoare de ieșire. Aceasta este o interpretare probabilistică care este determinată luând în considerare puterea corelației dintre variabilele de intrare. Regresia, de exemplu, poate ajuta la estimarea prețului unei case în funcție de locația, dimensiunea și alți factori. Actul de clasificare a datelor presupune împărțirea acestora în categorii. Puteți utiliza clasificarea pentru a evalua dacă o persoană va rămâne sau nu neîndeplinită de un împrumut dacă vă gândiți să îi oferiți credit. Clasificarea binară are loc atunci când un algoritm de învățare supravegheată clasifică datele de intrare în două clase separate. Clasificările multiple se referă la împărțirea informațiilor în mai mult de două grupuri.

Ce este o pădure aleatorie?

O metodă de ansamblu este modelul forestier aleatoriu. Funcționează prin crearea unui număr mare de arbori de decizie și apoi prin clasificarea arborilor individuali. Să presupunem că vrei să știi care studenți se vor descurca bine la GMAT, un examen necesar pentru intrarea la programele de management de absolvire. Având în vedere caracteristicile demografice și educaționale ale unui grup de elevi care au susținut anterior testul, un model de pădure aleatoare ar putea finaliza sarcina.