Ce este învățarea automată supravegheată? Algoritm, exemplu

Publicat: 2021-06-22

Învățarea automată este peste tot – de la agenții guvernamentale, servicii de vânzare cu amănuntul și instituții financiare până la sectoarele de sănătate, divertisment și transport. Este în mod complex asociat cu viața noastră de zi cu zi, fie că este vorba de Netflix sau Amazon care oferă recomandări online sau deblocarea smartphone-ului tău cu tehnologia de detectare a feței, învățarea automată și inteligența artificială au câștigat avânt ca niciodată.

Având în vedere că învățarea automată este una dintre cele mai populare tendințe tehnologice în prezent, devine imperativ să cunoaștem una dintre abordările cheie pentru crearea inteligenței artificiale - învățarea automată supravegheată.

Cuprins

Ce este învățarea automată supravegheată?

Învățarea automată supravegheată este un tip de învățare automată în care un algoritm de computer este antrenat folosind date de intrare etichetate, iar computerul, la rândul său, prezice ieșirea pentru date neprevăzute. Aici, „etichetat” înseamnă că unele date vor fi deja etichetate cu răspunsurile corecte pentru a ajuta mașina să învețe. În învățarea supravegheată, datele de intrare furnizate computerului funcționează ca un supervizor sau un profesor pentru a antrena mașina să obțină rezultate precise prin detectarea modelelor și corelațiile subiacente dintre datele de intrare și etichetele de ieșire.

Tipuri de algoritmi de învățare supravegheată

Există diferite tipuri de algoritmi de învățare supravegheată pentru a obține rezultate specifice. Să aruncăm o privire la unele dintre cele mai comune tipuri.

1. Clasificare

Algoritmii de clasificare folosesc date de antrenament etichetate pentru a sorta intrările într-un număr dat de clase sau categorii. Aici, variabila de ieșire este o categorie precum „Da” sau „Nu” și „Adevărat” sau „Fals”. Clasificarea rapoartelor medicale în pozitive (boală) sau negative (fără boală) sau clasificarea filmelor în diferite genuri sunt câteva cazuri în care algoritmii de clasificare sunt aplicabili.

2. Regresia

Modelele de regresie sunt utilizate atunci când există o relație numerică între variabilele de intrare și de ieșire. Algoritmii de regresie care se încadrează în domeniul învățării supravegheate includ regresia liniară, regresia neliniară, arbori de regresie, regresia polinomială și regresia liniară bayesiană. Astfel de modele sunt utilizate în principal pentru a prezice variabile continue, cum ar fi specularea tendințelor pieței, prognoza meteo sau predeterminarea ratelor de clic în reclamele online la anumite momente ale zilei.

Alăturați-vă cursului online de învățare automată de la cele mai bune universități din lume – masterat, programe executive postuniversitare și program de certificat avansat în ML și AI pentru a vă accelera cariera.

3. Rețele neuronale

Algoritmii de rețea neuronală sunt utilizați pentru interpretarea datelor senzoriale, recunoașterea tiparelor sau gruparea intrărilor brute. Deși acest algoritm are mai multe avantaje, poate fi destul de dificil să folosești o rețea neuronală atunci când există prea multe observații. Aplicațiile populare din viața reală ale rețelelor neuronale includ extragerea informațiilor, clasificarea textului, recunoașterea vorbirii și a caracterelor, rezumarea mai multor documente, generarea de limbi și multe altele.

4. Model Bayesian naiv

Naive Bayes Classifiers nu este un singur algoritm, ci o colecție de algoritmi bazați pe teorema lui Bayes. Principiul standard care stă la baza acestor algoritmi este că fiecare pereche de caracteristici clasificate este independentă una de alta. Etichetele claselor sunt atribuite folosind un grafic aciclic direct care cuprinde mai multe noduri copii și un nod părinte. Fiecare nod copil este considerat separat și independent de părinte. Aplicațiile populare din viața reală ale algoritmului naiv bayesian includ filtrarea spamului și analiza sentimentelor.

5. Arborele de decizie

Arborele de decizie sunt modele asemănătoare unei diagrame de flux care conțin declarații de control condiționat pentru a compara deciziile și posibilele consecințe ale acestora. Un arbore de decizie implică un grafic asemănător unui arbore în care nodurile interne reprezintă punctul în care alegem un atribut și punem o întrebare, nodurile frunză reprezintă etichetele clasei sau rezultatul real, iar marginile reprezintă răspunsurile la întrebări.

6. Suport Vector Machine

Support Vector Machine (SVM) se bazează pe teoria de învățare statistică dată de Vap Nick și a fost dezvoltată încă din 1990. În cei mai simpli termeni, mașinile de vector de suport sunt un set de metode de învățare supravegheată utilizate pentru regresie, clasificare și detectarea valorii aberante. Ele sunt strâns asociate cu rețeaua nucleului și găsesc aplicații în diverse domenii, cum ar fi recunoașterea modelelor, bioinformatica și regăsirea informațiilor multimedia.

7. Model forestier aleatoriu

Modelul forestier aleatoriu constă dintr-un ansamblu de arbori de decizie individuali în care fiecare arbore individual oferă o predicție de clasă, iar clasa cu voturi maxime este predicția modelului. Ideea din spatele conceptului de model de pădure aleatoare este că un număr mare de arbori sau modele relativ necorelați care operează într-un ansamblu vor produce predicții mai precise decât oricare dintre predicțiile individuale. Acest lucru se datorează faptului că copacii se protejează reciproc de erori independente.

Cum functioneazã?

Învățarea supravegheată implică modele de instruire care utilizează seturi de date etichetate, astfel încât să poată afla despre fiecare tip de date. După finalizarea antrenamentului, modelului i se oferă date de testare pentru a identifica și prezice rezultatul.

Să ne uităm la un exemplu simplu pentru a clarifica mai mult conceptul.

Să presupunem că ți se oferă o ladă formată din diferite tipuri de legume. În abordarea învățării automate supravegheate, primul pas va fi să familiarizați mașina cu toate legumele diferite, una câte una, în acest fel:

  • Dacă obiectul este ca un bec și este roz-violet, acesta va fi etichetat ca – Ceapă.
  • Dacă obiectul este cu frunze și de culoare verde, atunci va fi etichetat ca – Spanac.

Odată ce ați antrenat mașina, îi dați o legumă separată de ladă (să zicem, ceapă) și cereți să o identifice. Acum, deoarece aparatul a aflat deja despre legume din datele anterioare, va clasifica noul obiect pe baza formei și culorii sale și va confirma rezultatul ca o ceapă. În acest fel, mașina învață sau se antrenează din datele de antrenament (ladă care conține legume) și aplică cunoștințele la date noi, neprevăzute (legumă nouă).

La fel ca exemplul de legume pe care l-am folosit mai sus, să vedem un alt exemplu de învățare supravegheată pentru a înțelege cum funcționează.

Să presupunem că avem un set de date format din diferite forme, cum ar fi triunghiuri, pătrate și pentagoane. Primul pas este să antrenați modelul pentru fiecare figură în următorul mod:

  • Dacă forma are trei laturi, atunci va fi etichetată ca – Triunghi
  • Dacă forma are patru laturi egale, atunci va fi etichetată ca – Pătrat
  • Dacă forma are cinci laturi, atunci va fi etichetată ca – Pentagon

Odată ce antrenamentul este finalizat, testăm modelul utilizând date de testare, iar sarcina modelului ar fi să identifice forma pe baza cunoștințelor de antrenament. Prin urmare, atunci când modelul găsește o nouă formă, o clasifică pe baza numărului de laturi și dă o ieșire.

Avantaje și provocări

Inutil să spun că învățarea supravegheată are mai multe avantaje în implementarea modelelor de învățare automată. Unele dintre beneficiile sale sunt enumerate mai jos:

  • Modelele de învățare supravegheată pot prezice cu precizie rezultatele pe baza experiențelor anterioare.
  • Învățarea supravegheată ajută la optimizarea performanței folosind experiența.
  • Învățarea supravegheată ne oferă o idee clară și precisă despre clasele de obiecte.
  • Nu în ultimul rând, algoritmii de învățare supravegheată sunt incredibil de cruciali pentru rezolvarea diferitelor probleme din lumea reală și pentru a găsi aplicații în diverse sectoare.

Fără îndoială, algoritmii de învățare supravegheată sunt extrem de benefice, mai ales în ceea ce privește potențialul lor de a aborda provocările în timp real. Cu toate acestea, construirea unui model de învățare supravegheată durabilă și eficientă vine cu propriul set de provocări. Deci haideți să aruncăm o privire:

  • Întregul proces de formare a modelelor de învățare supravegheată este un proces care necesită timp.
  • Modelele de învățare de supraveghere necesită adesea un anumit nivel de expertiză și resurse pentru a structura și funcționa cu acuratețe.
  • Spre deosebire de modelele de învățare nesupravegheată, modelele de învățare supravegheată nu pot clasifica sau grupa datele singure.
  • Șansele ca erorile umane să se strecoare în seturile de date sunt destul de mari, ceea ce poate duce la antrenamentul incorect al algoritmilor.

Cele mai bune practici cu exemple

Care sunt unele dintre cele mai bune practici pe care ar trebui să le țineți cont înainte de a vă aventura să începeți un proiect folosind învățarea automată supravegheată? Aruncă o privire mai jos.

  • Asigurați-vă că sunteți clar cu privire la tipul de date pe care îl veți folosi ca set de date de antrenament.
  • Colectați rezultate corespunzătoare fie de la măsurători standard, fie de la experți umani.
  • Decideți structura algoritmului de învățare.

Merită să vorbim în sfârșit despre unele dintre cele mai bune și mai populare exemple din viața reală de învățare automată supravegheată.

  • Analiza predictivă : un caz de utilizare pe scară largă al utilizării modelelor de învățare supravegheată pentru analiza predictivă oferă informații semnificative și acționabile asupra diferitelor puncte de date de afaceri. Ca rezultat, întreprinderile pot prevedea anumite rezultate pe baza unei anumite variabile de ieșire pentru a justifica și susține deciziile.
  • Recunoașterea obiectelor și a imaginilor : algoritmii de învățare supravegheați își găsesc uzul în localizarea și clasificarea obiectelor în imagini și videoclipuri - o cerință frecventă în analiza imaginilor și în diferite tehnici de viziune computerizată.
  • Detectarea spamului : tehnicile de detectare și filtrare a spamului folosesc algoritmi de clasificare supravegheați pentru a antrena bazele de date, astfel încât acestea să poată recunoaște modele în date noi pentru o segregare eficientă a e-mailurilor spam și non-spam.
  • Analiza sentimentelor : o modalitate excelentă de a stimula eforturile de implicare a mărcii este să înțelegeți interacțiunile cu clienții. Învățarea automată supravegheată poate ajuta în acest sens prin extragerea și clasificarea informațiilor critice din seturi mari de date, cum ar fi emoțiile, intențiile, preferințele clienților etc.

Învață învățarea automată cu upGrad

Doriți să o faceți mare în domeniul învățării automate și AI? Începeți-vă călătoria cu programul Executive PG al upGrad în Învățare automată și AI . Este un curs cuprinzător de certificare online, conceput pentru profesioniștii care doresc să învețe abilități solicitate, cum ar fi Deep Learning, Reinforcement Learning, NLP și modele grafice.

Iată câteva momente importante ale cursurilor pe care nu le poți rata:

  • Certificat de finalizare a cursului de la IIIT Bangalore.
  • Peste 450 de ore de învățare pline cu sesiuni live, sarcini de codare, studii de caz și proiecte.
  • Acoperire cuprinzătoare a 20 de instrumente, limbaje de programare și biblioteci.
  • Cursuri de codare live și ateliere de creare a profilului.

Concluzie

Cel mai recent raport de cercetare de piață realizat de Technavio, intitulat Piața de învățare automată după utilizator final și geografie – Prognoză și analiză 2020-2024 , prezice că dimensiunea pieței globale a învățării automate va înregistra o creștere de 11,16 miliarde USD în perioada de prognoză 2020-2024. În plus, creșterea constantă de la an la an a creșterii va alimenta impulsul de creștere a pieței.

Atât tendințele actuale, cât și previziunile viitoare indică faptul că învățarea automată este aici pentru a rămâne. Algoritmii de învățare supravegheată sunt fundamentale pentru orice proiect de învățare automată care implică în primul rând probleme de clasificare și regresie. În ciuda provocărilor sale, algoritmii de învățare supravegheată sunt cei mai utili pentru prezicerea rezultatelor pe baza experiențelor.

Conduceți revoluția tehnologică condusă de inteligența artificială

Aplicați pentru Master of Science în Machine Learning și AI