Che cos'è l'ipotesi nell'apprendimento automatico? Come formulare un'ipotesi?

Pubblicato: 2021-03-12

Il test delle ipotesi è un argomento ampio che è applicabile a molti campi. Quando studiamo le statistiche, il test di ipotesi coinvolge i dati di più popolazioni e il test consiste nel vedere quanto sia significativo l'effetto sulla popolazione.

Ciò comporta il calcolo del valore p e il confronto con il valore critico o l'alfa. Quando si tratta di Machine Learning, Hypothesis Testing si occupa di trovare la funzione che meglio si avvicina alle caratteristiche indipendenti dell'obiettivo. In altre parole, mappare gli ingressi alle uscite.

Alla fine di questo tutorial, saprai quanto segue:

Che cos'è l'ipotesi nelle statistiche rispetto all'apprendimento automatico
Che cos'è lo spazio delle ipotesi?
Processo di formazione di un'ipotesi

Sommario

Ipotesi in statistica

Un'ipotesi è un presupposto di un risultato che è falsificabile, nel senso che può essere smentito da alcune prove. Un'ipotesi può essere rifiutata o rifiutata. Non accettiamo mai alcuna ipotesi in statistica perché è tutta una questione di probabilità e non siamo mai certi al 100%. Prima dell'inizio dell'esperimento, definiamo due ipotesi:

1. Ipotesi nulla: dice che non vi è alcun effetto significativo

2. Ipotesi alternativa: dice che c'è qualche effetto significativo

Nelle statistiche, confrontiamo il valore P (che viene calcolato utilizzando diversi tipi di test statistici) con il valore critico o alfa. Maggiore è il valore P, maggiore è la probabilità, che a sua volta significa che l'effetto non è significativo e concludiamo che non riusciamo a rifiutare l'ipotesi nulla .

In altre parole, è molto probabile che l'effetto si sia verificato per caso e non vi è alcuna significatività statistica. D'altra parte, se otteniamo un valore P molto piccolo, significa che la probabilità è piccola. Ciò significa che la probabilità che l'evento si verifichi per caso è molto bassa.

Partecipa al corso ML e AI online dalle migliori università del mondo: master, programmi post-laurea esecutivi e programma di certificazione avanzato in ML e AI per accelerare la tua carriera.

Livello di significatività

Il livello di significatività viene impostato prima di iniziare l'esperimento. Questo definisce quanto è la tolleranza di errore ea quale livello l'effetto può essere considerato significativo. Un valore comune per il livello di significatività è 95%, il che significa anche che c'è una probabilità del 5% di farci ingannare dal test e commettere un errore. In altre parole, il valore critico è 0,05 che funge da soglia. Allo stesso modo, se il livello di significatività fosse fissato al 99%, significherebbe un valore critico dello 0,01%.

Valore P

Viene effettuato un test statistico sulla popolazione e sul campione per scoprire il valore P che viene poi confrontato con il valore critico. Se il valore P risulta essere inferiore al valore critico, allora possiamo concludere che l'effetto è significativo e quindi rifiutare l'ipotesi nulla (che ha detto che non vi è alcun effetto significativo). Se il valore P risulta essere superiore al valore critico, possiamo concludere che non vi è alcun effetto significativo e quindi non riuscire a respingere l'ipotesi nulla.

Ora, poiché non possiamo mai essere sicuri al 100%, c'è sempre la possibilità che i nostri test siano corretti ma i risultati siano fuorvianti. Ciò significa che o rifiutiamo il nulla quando in realtà non è sbagliato. Può anche significare che non rifiutiamo il null quando è effettivamente falso. Questi sono errori di tipo 1 e di tipo 2 del test di ipotesi.

Esempio

Considera che stai lavorando per un produttore di vaccini e il tuo team sviluppa il vaccino per Covid-19. Per dimostrare l'efficacia di questo vaccino, è necessario dimostrare statisticamente che è efficace sugli esseri umani. Pertanto, prendiamo due gruppi di persone di uguali dimensioni e proprietà. Diamo il vaccino al gruppo A e diamo un placebo al gruppo B. Effettuiamo analisi per vedere quante persone nel gruppo A si sono infettate e quante nel gruppo B si sono infettate.

Lo testiamo più volte per vedere se il gruppo A ha sviluppato un'immunità significativa contro Covid-19 o meno. Calcoliamo il valore P per tutti questi test e concludiamo che i valori P sono sempre inferiori al valore critico. Quindi, possiamo tranquillamente rifiutare l'ipotesi nulla e concludere che c'è davvero un effetto significativo.

Leggi: Spiegazione dei modelli di apprendimento automatico

Ipotesi nell'apprendimento automatico

L'ipotesi in Machine Learning viene utilizzata quando in un Supervised Machine Learning è necessario trovare la funzione che meglio associa l'input all'output. Questo può anche essere chiamato approssimazione di funzione perché stiamo approssimando una funzione di destinazione che mappa al meglio la caratteristica alla destinazione.

1. Ipotesi(h): un'ipotesi può essere un singolo modello che mappa le caratteristiche sull'obiettivo, tuttavia, possono essere i risultati/le metriche. Un'ipotesi è indicata da “ h ”.

2. Spazio ipotesi (H): uno spazio ipotesi è una gamma completa di modelli e dei loro possibili parametri che possono essere utilizzati per modellare i dati. È indicato da “ H ”. In altre parole, l'ipotesi è un sottoinsieme dello spazio ipotesi.

Processo di formazione di un'ipotesi

In sostanza, abbiamo i dati di allenamento (caratteristiche indipendenti e il target) e una funzione target che mappa le funzionalità sul target. Questi vengono quindi eseguiti su diversi tipi di algoritmi utilizzando diversi tipi di configurazione del loro spazio iperparametrico per verificare quale configurazione produce i risultati migliori. I dati di addestramento vengono utilizzati per formulare e trovare la migliore ipotesi dallo spazio delle ipotesi. I dati del test vengono utilizzati per convalidare o verificare i risultati prodotti dall'ipotesi.

Considera un esempio in cui abbiamo un set di dati di 10000 istanze con 10 funzionalità e un obiettivo. L'obiettivo è binario, il che significa che è un problema di classificazione binaria. Ora, diciamo, modelliamo questi dati usando la regressione logistica e otteniamo una precisione del 78%. Possiamo tracciare la retta di regressione che separa entrambe le classi. Questa è un'ipotesi(h). Quindi testiamo questa ipotesi sui dati del test e otteniamo un punteggio del 74%.

Ora, supponiamo ancora una volta di adattare un modello RandomForests agli stessi dati e ottenere un punteggio di precisione dell'85%. Questo è già un buon miglioramento rispetto alla regressione logistica. Ora decidiamo di ottimizzare gli iperparametri di RandomForests per ottenere un punteggio migliore sugli stessi dati. Eseguiamo una ricerca nella griglia ed eseguiamo più modelli RandomForest sui dati e ne controlliamo le prestazioni. In questo passaggio, stiamo essenzialmente cercando lo spazio dell'ipotesi (H) per trovare una funzione migliore. Dopo aver completato la ricerca della griglia, otteniamo il miglior punteggio dell'89% e terminiamo la ricerca.

Ora proviamo anche più modelli come XGBoost, Support Vector Machine e il teorema di Naive Bayes per testare le loro prestazioni sugli stessi dati. Quindi scegliamo il modello con le migliori prestazioni e lo testiamo sui dati del test per convalidarne le prestazioni e ottenere un punteggio dell'87%.

Checkout: Progetti e argomenti di apprendimento automatico

Prima che tu vada

L'ipotesi è un aspetto cruciale di Machine Learning e Data Science. È presente in tutti i domini dell'analisi ed è il fattore decisivo per l'introduzione o meno di un cambiamento. Che si tratti di prodotti farmaceutici, software, vendite, ecc. Un'ipotesi copre il set di dati di formazione completo per verificare le prestazioni dei modelli dallo spazio delle ipotesi.

Un'ipotesi deve essere falsificabile, il che significa che deve essere possibile verificare e dimostrare che è sbagliata se i risultati sono contrari. Il processo di ricerca della migliore configurazione del modello richiede molto tempo quando è necessario verificare molte configurazioni diverse. Esistono anche modi per accelerare questo processo utilizzando tecniche come la ricerca casuale di iperparametri.

Se sei interessato a saperne di più sull'apprendimento automatico, dai un'occhiata al programma Executive PG di IIIT-B e upGrad in Machine Learning e AI , progettato per i professionisti che lavorano e offre oltre 450 ore di formazione rigorosa, oltre 30 casi di studio e incarichi, IIIT -B Status di Alumni, oltre 5 progetti pratici pratici e assistenza sul lavoro con le migliori aziende.

Perché dovremmo fare progetti open-source?

Ci sono molte ragioni per fare progetti open-source. Stai imparando cose nuove, stai aiutando gli altri, sei in rete con gli altri, stai creando una reputazione e molti altri. L'open source è divertente e alla fine otterrai qualcosa in cambio. Uno dei motivi più importanti è che crea un portafoglio di ottimi lavori che puoi presentare alle aziende e farti assumere. I progetti open source sono un modo meraviglioso per imparare cose nuove. Potresti migliorare la tua conoscenza dello sviluppo del software o potresti imparare una nuova abilità. Non c'è modo migliore per imparare che insegnare.

Posso contribuire all'open source come principiante?

Sì. I progetti open source non discriminano. Le comunità open source sono fatte di persone che amano scrivere codice. C'è sempre un posto per un principiante. Imparerai molto e avrai anche la possibilità di partecipare a una varietà di progetti open source. Imparerai cosa funziona e cosa no e avrai anche la possibilità di far utilizzare il tuo codice da una vasta comunità di sviluppatori. C'è un elenco di progetti open source che sono sempre alla ricerca di nuovi contributori.

Come funzionano i progetti GitHub?

GitHub offre agli sviluppatori un modo per gestire i progetti e collaborare tra loro. Serve anche come una sorta di curriculum per gli sviluppatori, con l'elenco dei contributori, della documentazione e delle versioni di un progetto. I contributi a un progetto mostrano ai potenziali datori di lavoro che hai le capacità e la motivazione per lavorare in team. I progetti sono spesso più del codice, quindi GitHub ha un modo per strutturare il tuo progetto proprio come strutturare un sito web. Puoi gestire il tuo sito web con una filiale. Una filiale è come un esperimento o una copia del tuo sito web. Quando vuoi sperimentare una nuova funzionalità o correggere qualcosa, crei un ramo e sperimenti lì. Se l'esperimento ha esito positivo, puoi unire nuovamente il ramo nel sito Web originale.