Diferența dintre învățarea supravegheată și nesupravegheată

Publicat: 2022-09-26

Cuprins

Introducere

Tehnologii precum învățarea automată, inteligența artificială și analiza datelor prosperă pe date pentru a automatiza sarcini complexe. Utilizarea datelor nu se limitează doar la procesare și interpretare pentru a rămâne în fața concurenților, pentru a oferi servicii mai bune pentru clienți și pentru a construi strategii de afaceri eficiente, dar și pentru a instrui, testa și evalua modelele. În învățarea automată, datele sunt clasificate în trei categorii, date de antrenament, date de validare și date de testare. După cum sugerează și numele, datele de antrenament antrenează un model sau un algoritm în învățarea automată. Modelul învață din seturile de date de antrenament de intrare și de ieșire și prezice clasificarea sau realizează sarcini specifice. Folosim date de antrenament atât pentru învățarea supravegheată, cât și pentru învățarea nesupravegheată a unui algoritm.

Programele noastre AI și ML în SUA

Master of Science în Machine Learning și AI de la LJMU și IIITB	Program Executive PG în învățare automată și inteligență artificială de la IIITB
Pentru a explora toate cursurile noastre, vizitați pagina noastră de mai jos.
Cursuri de învățare automată

Acest blog discută aceste două categorii mari de învățare automată – învățarea supravegheată și nesupravegheată și diferențele lor în detaliu.

Obțineți certificare de învățare automată de la cele mai bune universități din lume. Câștigă programe de master, Executive PGP sau Advanced Certificate pentru a-ți accelera cariera.

Ce este învățarea supravegheată?

Învățarea supravegheată, un subset de învățare automată și inteligență artificială, este o tehnică de predare a algoritmilor care utilizează date etichetate pentru a antrena algoritmi. Îi învață pe algoritmi cum să efectueze sarcini precum clasificarea și regresia în seturile de date. În învățarea supravegheată, algoritmul primește mostre de antrenament de intrare-ieșire și utilizează aceste eșantioane pentru a stabili o relație între seturile de date. Deoarece furnizăm algoritmului date de antrenament etichetate pentru a efectua sarcini sub supraveghere, denumim aceasta învățare supravegheată. Obiectivul principal al învățării supravegheate este de a furniza date algoritmului pentru a înțelege relația dintre intrare și ieșire. Odată ce algoritmul stabilește o conexiune între intrare și ieșire, poate oferi cu precizie rezultate proaspete din intrări mai noi.

Să înțelegem cum funcționează învățarea supravegheată. Să presupunem că într-un algoritm de învățare automată avem o intrare X și o ieșire Y. Alimentam sau furnizăm intrarea X unui sistem de învățare într-un model. Acest sistem de învățare va furniza o ieșire Y'. Un arbitru din sistem verifică diferența dintre Y și Y' și produce un semnal de eroare. Acest semnal trece la sistemul de învățare care înțelege diferența dintre Y și Y' și ajustează parametrii pentru a reduce diferența dintre Y și Y'. Aici, Y este datele etichetate.

Procesul de învățare supravegheată implică mai mulți pași.

Inițial, trebuie să determinăm tipul setului de date de antrenament și apoi să colectăm datele de antrenament etichetate. De asemenea, trebuie să aranjam datele în mod diferit pentru clasificare sau regresie.
Următorul pas este să utilizați un algoritm pentru învățarea supravegheată, cum ar fi o mașină vectorială de suport sau un arbore de decizie și apoi să determinați caracteristicile de intrare pentru modelul de învățare.
Acum, executați procesul de învățare și ajustați sau controlați parametrii.
Ultimul pas implică testarea acurateței modelului.

Întregul proces de învățare supravegheat antrenează sistemul de învățare să ajusteze parametrii, astfel încât algoritmul oferă o diferență minimă de ieșire. Învățarea supravegheată facilitează două procese complexe în data mining – clasificarea și regresia. În clasificare, datele sunt clasificate sau etichetate în diferite clase, pe baza unor atribute similare, cum ar fi filtrele de spam. Folosim regresia pentru a prezice observații continue, de exemplu, bursa sau ritmul cardiac. Regresia dă valori ale numerelor reale.

Următoarele sunt diferitele tipuri de algoritmi de învățare supravegheată:

Naive Bayes:- Clasificatorul Naive Bayes se bazează pe teorema Bayes. Acest algoritm presupune că toate caracteristicile unei clase sunt independente unele de altele. Clasificatorul Naive Bayes folosește metoda probabilității condiționate pentru a prezice clasificarea.
Support Vector Machine: este un algoritm popular de învățare automată pentru sarcini de clasificare și regresie.
Regresia liniară: algoritmul de regresie liniară folosește învățarea supravegheată pentru a prezice rezultatele viitoare. Stabilește o relație între o variabilă dependentă și două sau mai multe variabile independente.
Regresia logistică: - Folosim un algoritm de regresie logistică atunci când avem variabile în diferite categorii, cum ar fi da sau nu și adevărat sau fals. Utilizăm în principal un algoritm de regresie logistică pentru a rezolva probleme de clasificare binară.

În concluzie, învățarea supravegheată este utilizată pentru a antrena un model folosind date cunoscute de intrare și ieșire pentru a genera predicții pentru un nou set de intrări.

Ce este învățarea nesupravegheată?

Spre deosebire de învățarea supravegheată, nu avem date etichetate în învățarea nesupravegheată. Nu există o relație predefinită între seturile de date sau un rezultat prezis. Spre deosebire de învățarea supravegheată, învățarea nesupravegheată necesită intervenție umană minimă. Prin urmare, o numim învățare nesupravegheată. Modelul folosește o colecție de observații ale setului de date și descrie proprietățile datelor date. Învățarea nesupravegheată se bazează pe un cadru de grupare, deoarece identifică diferite grupuri dintr-un set de date.

Să înțelegem cum funcționează învățarea nesupravegheată. Să presupunem că avem o serie de intrări numite X1, X2, X3…….Xt, dar nicio ieșire țintă. În acest caz, aparatul nu primește niciun feedback din mediul său. Cu toate acestea, ea dezvoltă un cadru formal și prezice rezultate viitoare. În învățarea nesupravegheată, modelul utilizează intrări pentru luarea deciziilor și construirea reprezentărilor. Nu putem folosi învățarea nesupravegheată pentru procesele de clasificare și regresie din cauza absenței datelor de ieșire. Utilizarea principală a învățării nesupravegheate este de a descoperi structura de bază a setului de date de intrare. Mașina aranjează datele în diferite grupuri pe baza interpretării după găsirea structurii. Ultimul pas este reprezentarea setului de date într-un format comprimat.

Inginerii folosesc în principal învățarea nesupravegheată în două scopuri: analiza exploratorie și reducerea dimensionalității. Analiza exploratorie realizează investigații inițiale asupra datelor pentru a le aranja în diferite grupuri, a construi ipoteze și a descoperi modele. Procesul de reducere a dimensionalității reduce numărul de intrări într-un set de date dat. Cel mai semnificativ avantaj al învățării nesupravegheate include găsirea de perspective relevante. Învățarea nesupravegheată este folosită în principal pentru a construi aplicații AI, deoarece necesită intervenție umană minimă.

Învățare supravegheată vs. nesupravegheată

Acum că știți ce sunt învățările supravegheate și nesupravegheate, să ne uităm la cele mai semnificative diferențe ale acestora.

Date – Învățarea supravegheată utilizează date etichetate, în timp ce învățarea nesupravegheată nu utilizează date etichetate. De asemenea, oferim date de ieșire modelului în învățarea supravegheată. Cu toate acestea, în cazul învățării nesupravegheate, datele de intrare nu sunt disponibile.
Feedback- Modelul preia feedback și ajustează parametrii în învățarea supravegheată. Nu se întâmplă în învățarea nesupravegheată.
Scop – Obiectivul principal al învățării supravegheate este de a antrena modelul folosind datele de antrenament. Deci, atunci când este disponibilă o nouă intrare, mașina poate prezice rezultatul precis. Cu toate acestea, deoarece rezultatul nu este disponibil în învățarea nesupravegheată, este folosit pentru a aduna informații relevante sau modele ascunse în datele date.
Clasificare și regresie – Putem clasifica învățarea supravegheată în clasificare și regresie, ceea ce nu se întâmplă în învățarea nesupravegheată.
Inteligență artificială – Învățarea supravegheată nu este relevantă pentru inteligența artificială, deoarece trebuie să introducem datele de antrenament în model. Cu toate acestea, învățarea nesupravegheată este mai benefică pentru inteligența artificială, deoarece necesită intervenție umană minimă.
Algoritmi – Algoritmii de învățare supravegheați includ Support Vector Machine, Naive Bayes, regresie liniară și regresie logistică. Algoritmii de învățare nesupravegheați includ gruparea și K-nearest neighbor (KNN).
Precizia rezultatelor – Pe măsură ce modelul primește rezultate predeterminate în procesul de învățare supravegheată, acesta oferă rezultate mai precise. Cu toate acestea, rezultatele învățării nesupravegheate sunt subiective și dau rezultate mai puțin precise.

Bloguri populare de învățare automată și inteligență artificială

IoT: istorie, prezent și viitor	Tutorial de învățare automată: Învățați ML	Ce este algoritmul? Simplu și Ușor
Salariu inginer robotic în India: toate rolurile	O zi din viața unui inginer de învățare automată: ce fac ei?	Ce este IoT (Internet of Things)
Permutare vs combinație: diferența dintre permutare și combinație	Top 7 tendințe în inteligența artificială și învățarea automată	Învățare automată cu R: tot ce trebuie să știți

Concluzie

Învățarea supravegheată și nesupravegheată sunt conceptele de bază ale învățării automate, punând bazele învățării conceptelor complexe. Dacă sunteți interesat de învățarea automată și doriți să vă construiți o carieră în acest sens, puteți urma un Master of Science în învățarea automată și AI de la upGrad.

Liderii din industrie predau acest curs pentru a vă ajuta să obțineți cunoștințe teoretice aprofundate despre învățarea automată și perspective practice despre tehnologia învățării automate. În plus, aveți oportunități de a lucra la mai multe studii de caz și proiecte privind învățarea automată pentru a vă ajuta să dobândiți abilități relevante.

Când poți folosi învățarea nesupravegheată?

Este o provocare să aduni seturi de date de antrenament cu intrare și ieșire definite. În astfel de cazuri, este mai bine să folosiți învățarea nesupravegheată. În învățarea nesupravegheată, modelele fac inferențe din datele de intrare dacă datele de ieșire nu sunt furnizate sau dacă nu sunt date etichete. Prin urmare, puteți utiliza învățarea nesupravegheată în cazurile în care aveți intrări, dar nu aveți o ieșire definită. Una dintre cele mai bune utilizări ale învățării nesupravegheate este dezvoltarea aplicațiilor de inteligență artificială.

Când ar trebui să folosiți învățarea supravegheată?

Algoritmii de învățare supravegheată sunt utilizați atunci când aveți seturi de date de intrare și de ieșire definite. Puteți optimiza criteriile de performanță ale modelului de învățare automată prin ajustarea parametrilor. Învățarea supravegheată ajută la rezolvarea problemelor de calcul din viața reală și la construirea de aplicații pentru recunoașterea vorbirii și a textului, analiza predictivă și detectarea spamului.

Ce sunt datele etichetate în învățarea supravegheată?

Date etichetate înseamnă un set de date marcat sau clasificat în funcție de proprietăți sau caracteristici specifice. În învățarea supervizată, datele de antrenament pe care le folosim ca reper pentru antrenarea modelului de învățare se numesc date etichetate.