6 tipi di apprendimento supervisionato che devi conoscere nel 2022

Pubblicato: 2021-01-10

L'apprendimento automatico è una delle applicazioni più comuni dell'Intelligenza Artificiale. Una macchina impara a eseguire compiti dai dati inseriti in essa. E con l'esperienza, le sue prestazioni in un determinato compito migliorano. L'apprendimento automatico include tecniche di apprendimento supervisionato, non supervisionato e rinforzato. Ulteriori informazioni sui tipi di apprendimento automatico.

In questo articolo, esamineremo diversi tipi di apprendimento supervisionato.

Sommario

Che cos'è l'apprendimento supervisionato?

In Supervised Learning, una macchina viene addestrata utilizzando dati "etichettati". Si dice che i set di dati siano etichettati quando contengono sia parametri di input che di output. In altre parole, i dati sono già stati contrassegnati con la risposta corretta.

Quindi, la tecnica imita un ambiente di classe in cui uno studente impara in presenza di un supervisore o di un insegnante. D'altra parte, gli algoritmi di apprendimento senza supervisione consentono ai modelli di scoprire informazioni e apprendere da soli.

L'apprendimento automatico supervisionato è estremamente utile per risolvere i problemi computazionali del mondo reale. L'algoritmo prevede i risultati per dati imprevisti imparando dai dati di addestramento etichettati. Pertanto, sono necessari data scientist altamente qualificati per creare e distribuire tali modelli. Nel tempo, i data scientist utilizzano anche la loro esperienza tecnica per ricostruire i modelli per mantenere l'integrità delle informazioni fornite.

Come funziona?

Ad esempio, vuoi addestrare una macchina a prevedere il tuo tempo di pendolarismo tra il tuo ufficio e casa. Innanzitutto, creeresti un set di dati etichettato come il tempo, l'ora del giorno, il percorso scelto, ecc. che comprenderebbe i tuoi dati di input. E l'output sarebbe la durata stimata del tuo viaggio di ritorno a casa in un giorno specifico.

Una volta creato un set di allenamento basato sui fattori corrispondenti, la macchina vedrà le relazioni tra i punti dati e la utilizzerà per accertare la quantità di tempo necessaria per tornare a casa. Ad esempio, un'applicazione mobile può dirti che il tuo tempo di viaggio sarà più lungo in caso di forti piogge.

La macchina potrebbe anche vedere altre connessioni nei tuoi dati etichettati, come l'ora in cui esci dal lavoro. Puoi arrivare a casa prima se inizi prima che il traffico dell'ora di punta raggiunga le strade. Leggi di più se sei curioso di sapere come funziona l'apprendimento automatico senza supervisione.

Ora, proviamo a comprendere l'apprendimento supervisionato con l'aiuto di un altro esempio di vita reale. Supponiamo di avere un cesto di frutta e di addestrare la macchina con tutti i diversi tipi di frutta. I dati sull'allenamento possono includere questi scenari:

  • Se l'oggetto è di colore rosso, di forma rotonda e presenta una depressione sulla parte superiore, etichettalo come "Mela"
  • Se l'oggetto ha un colore giallo-verdastro e ha la forma di un cilindro curvo, contrassegnalo come 'Banana'

Successivamente, fornisci un nuovo oggetto (dati di prova) e chiedi alla macchina di identificare se si tratta di una banana o di una mela. Imparerà dai dati dell'allenamento e applicherà le conoscenze per classificare il frutto in base ai colori e alle forme immessi.

Diversi tipi di apprendimento supervisionato

1. Regressione

Nella regressione, viene prodotto un singolo valore di output utilizzando i dati di addestramento. Questo valore è un'interpretazione probabilistica, che viene accertata dopo aver considerato la forza della correlazione tra le variabili di input. Ad esempio, la regressione può aiutare a prevedere il prezzo di una casa in base alla sua località, dimensione, ecc.

Nella regressione logistica, l'output ha valori discreti basati su un insieme di variabili indipendenti. Questo metodo può fallire quando si tratta di confini decisionali non lineari e multipli. Inoltre, non è sufficientemente flessibile per acquisire relazioni complesse nei set di dati.

2. Classificazione

Implica il raggruppamento dei dati in classi. Se stai pensando di estendere il credito a una persona, puoi utilizzare la classificazione per determinare se una persona sarebbe o meno inadempiente sul prestito. Quando l'algoritmo di apprendimento supervisionato etichetta i dati di input in due classi distinte, si parla di classificazione binaria. Classificazioni multiple significa classificare i dati in più di due classi.

3. Modello bayesiano ingenuo

Il modello bayesiano di classificazione viene utilizzato per grandi set di dati finiti. È un metodo per assegnare etichette di classe utilizzando un grafico aciclico diretto. Il grafico comprende un nodo padre e più nodi figli. E si presume che ogni nodo figlio sia indipendente e separato dal genitore.

Alberi decisionali

Un albero decisionale è un modello simile a un diagramma di flusso che contiene istruzioni di controllo condizionale, comprendendo le decisioni e le loro probabili conseguenze. L'output si riferisce all'etichettatura di dati imprevisti.

Nella rappresentazione ad albero, i nodi foglia corrispondono alle etichette di classe e i nodi interni rappresentano gli attributi. Un albero decisionale può essere utilizzato per risolvere problemi con attributi discreti e funzioni booleane. Alcuni dei notevoli algoritmi dell'albero decisionale sono ID3 e CART.

4. Modello di foresta casuale

Il modello di foresta casuale è un metodo di insieme. Opera costruendo una moltitudine di alberi decisionali e produce una classificazione dei singoli alberi. Supponiamo di voler prevedere quali studenti universitari si esibiranno bene in GMAT, un test sostenuto per l'ammissione ai programmi di gestione dei laureati. Un modello forestale casuale assolverebbe il compito, dati i fattori demografici ed educativi di un insieme di studenti che hanno precedentemente sostenuto il test.

5. Reti neurali

Questo algoritmo è progettato per raggruppare input grezzi, riconoscere modelli o interpretare dati sensoriali. Nonostante i loro molteplici vantaggi, le reti neurali richiedono risorse computazionali significative. Può diventare complicato adattare una rete neurale quando ci sono migliaia di osservazioni. Viene anche chiamato algoritmo "scatola nera" poiché interpretare la logica dietro le loro previsioni può essere difficile.

Leggi : Le 10 migliori architetture di reti neurali nel 2020

6. Supporta le macchine vettoriali

Support Vector Machine (SVM) è un algoritmo di apprendimento supervisionato sviluppato nell'anno 1990. Si basa sulla teoria dell'apprendimento statistico sviluppata da Vap Nick.

SVM separa gli iperpiani, il che lo rende un classificatore discriminatorio. L'output viene prodotto sotto forma di un iperpiano ottimale che classifica nuovi esempi. Le SVM sono strettamente connesse al framework del kernel e utilizzate in diversi campi. Alcuni esempi includono la bioinformatica, il riconoscimento di modelli e il recupero di informazioni multimediali.

Pro e contro dell'apprendimento supervisionato

Diversi tipi di apprendimento supervisionato consentono di raccogliere e produrre dati dall'esperienza precedente. Dall'ottimizzazione dei criteri di prestazione alla gestione dei problemi del mondo reale, l'apprendimento supervisionato è emerso come un potente strumento nel campo dell'IA. È anche un metodo più affidabile rispetto all'apprendimento non supervisionato, che può essere computazionalmente complesso e in alcuni casi meno accurato.

Tuttavia, l'apprendimento supervisionato non è privo di limiti. Sono necessari esempi concreti per addestrare i classificatori e i confini decisionali possono essere superati in assenza degli esempi giusti. Si possono anche incontrare difficoltà nella classificazione dei big data.

Riassumendo

Il lungo e il corto dell'apprendimento supervisionato è che utilizza dati etichettati per addestrare una macchina. Le tecniche di regressione e gli algoritmi di classificazione aiutano a sviluppare modelli predittivi altamente affidabili e con molteplici applicazioni.

L'apprendimento supervisionato richiede agli esperti di costruire, scalare e aggiornare modelli. In assenza di competenza tecnica, la forza bruta può essere applicata per determinare le variabili di input. E questo potrebbe rendere i risultati imprecisi. Pertanto, la selezione delle caratteristiche dei dati rilevanti è essenziale affinché l'apprendimento supervisionato funzioni in modo efficace.

Si dovrebbe prima decidere quali dati sono necessari per il set di addestramento, continuare a strutturare la funzione e l'algoritmo appresi e anche assemblare i risultati di esperti e misurazioni. Tali best practices possono fare molto per supportare l'accuratezza di un modello.

Con l'aumento dell'intelligenza artificiale e dell'apprendimento automatico nel mondo orientato alla tecnologia di oggi, conoscere i tipi di apprendimento supervisionato può essere un elemento di differenziazione significativo in qualsiasi campo. Le spiegazioni di cui sopra ti aiuterebbero a fare il primo passo!

Se sei interessato a saperne di più sull'apprendimento automatico, dai un'occhiata al Diploma PG di IIIT-B e upGrad in Machine Learning e AI , progettato per i professionisti che lavorano e offre oltre 450 ore di formazione rigorosa, oltre 30 casi di studio e incarichi, IIIT- B Stato di ex alunni, oltre 5 progetti pratici pratici e assistenza sul lavoro con le migliori aziende.

Impara il corso ML dalle migliori università del mondo. Guadagna master, Executive PGP o programmi di certificazione avanzati per accelerare la tua carriera.

Qual è il significato dell'apprendimento supervisionato?

Un machine learning utilizza i dati "etichettati" in Supervised Learning. Quando un set di dati ha parametri di input e output, viene considerato etichettato. Per dirla in altro modo, le informazioni sono già state etichettate con la risposta corretta. Nelle sfide computazionali del mondo reale, l'apprendimento automatico supervisionato è piuttosto utile. Il sistema apprende dai dati di addestramento etichettati per prevedere i risultati per i dati imprevisti. Di conseguenza, la creazione e l'implementazione di tali modelli richiede l'esperienza di data scientist altamente qualificati. I data scientist utilizzano le loro conoscenze tecniche per costruire modelli nel tempo al fine di mantenere la validità delle informazioni fornite.

Qual è la differenza tra classificazione e regressione?

Utilizzando i dati di addestramento, la regressione produce un unico valore di output. Questa è un'interpretazione probabilistica che viene determinata tenendo conto della forza della correlazione tra le variabili di input. La regressione, ad esempio, può aiutare a prevedere il prezzo di una casa in base alla sua posizione, dimensione e altri fattori. L'atto di classificare i dati comporta la suddivisione in categorie. Puoi utilizzare la categorizzazione per valutare se una persona sarà o meno inadempiente su un prestito se stai pensando di offrire loro un credito. La classificazione binaria si verifica quando un algoritmo di apprendimento supervisionato classifica i dati di input in due classi separate. Le classificazioni multiple si riferiscono alla divisione delle informazioni in più di due gruppi.

Cos'è una foresta casuale?

Un metodo di insieme è il modello di foresta casuale. Funziona creando un gran numero di alberi decisionali e quindi classificando i singoli alberi. Diciamo che vuoi sapere quali studenti universitari andranno bene al GMAT, esame richiesto per l'ingresso ai corsi di laurea specialistica. Date le caratteristiche demografiche ed educative di un gruppo di studenti che hanno precedentemente sostenuto il test, un modello forestale casuale potrebbe completare il compito.