Regressione logistica binaria: panoramica, capacità e ipotesi

Pubblicato: 2021-10-05

Una delle definizioni più accettate di Machine Learning è più o meno questa:

"Si dice che un programma per computer impari dall'esperienza E rispetto a una classe di compiti T e alla misura delle prestazioni P, se le sue prestazioni nei compiti in T, misurate da P, migliorano con l'esperienza E."

Ora, per migliorare le prestazioni della macchina nel tempo sulla stessa classe di attività, vengono utilizzati algoritmi diversi per ottimizzare l'output della macchina e avvicinarla ai risultati desiderati. L'analisi di regressione è una delle tecniche di base e più utilizzate per far sì che la macchina migliori le sue prestazioni.

Consiste in una serie di tecniche di apprendimento automatico per prevedere una variabile di output continua in base ai valori di una o più variabili predittive. L'analisi di regressione mira a sviluppare un'equazione matematica in grado di definire la variabile continua in funzione della variabile predittiva.

In uno dei nostri articoli precedenti, abbiamo esaminato la regressione logistica e come implementare la regressione logistica in Python. Abbiamo anche parlato brevemente dei tre diversi tipi di regressioni logistiche nell'apprendimento automatico. In questo articolo, ti offriamo una panoramica leggermente dettagliata della regressione logistica binaria insieme alla sua panoramica, capacità e ipotesi.

Sommario

Panoramica della regressione logistica binaria

La regressione logistica binaria o binomiale può essere intesa come il tipo di regressione logistica che si occupa di scenari in cui i risultati osservati per le variabili dipendenti possono essere solo binari, cioè possono avere solo due tipi possibili. Questi due tipi di classi possono essere 0 o 1, passare o fallire, vivi o morti, vincere o perdere e così via.

La regressione logistica multinomiale funziona in scenari in cui l'esito può avere più di due tipi possibili – malattia A vs malattia B vs malattia C – che non sono in un ordine particolare. Ancora un altro tipo di regressione logistica è la regressione logistica ordinale che tratta le variabili dipendenti in modo ordinato.

Nella regressione logistica binaria, i possibili output sono generalmente definiti come 0 o 1 poiché ciò si traduce nell'interpretazione e nella comprensione più semplici del modello di regressione. Se un risultato particolare per qualsiasi variabile dipendente è il risultato positivo o degno di nota, viene codificato come 0 e se non riesce o fallisce, viene codificato come 0.

In termini semplici, la regressione logistica binaria può essere utilizzata per prevedere in modo accurato e accurato le probabilità di essere un caso in base ai valori dei predittori o delle variabili indipendenti.

Capacità di regressione logistica binaria: tipi di domande a cui può rispondere

Come accennato in precedenza, la regressione logistica binaria è ideale per scenari in cui l'output può appartenere a una delle due classi o gruppi. Di conseguenza, la regressione logistica binaria è più adatta per rispondere a domande della seguente natura:

La probabilità di ammalarsi di cancro cambia per ogni kg in più che una persona è in sovrappeso?
La suddetta probabilità varia per ogni pacchetto di sigarette fumato al giorno?
Il peso corporeo, l'assunzione di grassi, l'apporto calorico e l'età influenzano la probabilità di avere un infarto?

Come puoi vedere, le risposte a tutte e tre le domande precedenti possono essere sì o no, 0 o 1. La regressione logistica binaria può quindi essere utilizzata per rispondere con precisione a queste domande.

Assunzione principale della regressione logistica binaria

Come con qualsiasi altro algoritmo di Machine Learning, anche la regressione logistica binaria funziona su alcuni presupposti. Ecco quelli:

La variabile dipendente è dicotomica. Cioè, è presente o assente, ma mai entrambi contemporaneamente.
Non dovrebbero esistere valori anomali nei dati.
Non dovrebbe esserci un'elevata correlazione o multicollinearità tra i diversi predittori. Questo può essere valutato utilizzando una matrice di correlazione tra diversi predittori.

In conclusione

La regressione logistica binaria aiuta in molti casi d'uso di Machine Learning. Dall'individuazione degli inadempienti sui prestiti all'assistenza alle aziende per fidelizzare i clienti, la regressione logistica binaria può essere estesa per risolvere anche i problemi aziendali più complessi. Tuttavia, dovresti ricordare che questo è solo uno degli oceani delle tecniche di algoritmi di Machine Learning. Una volta che hai imparato l'analisi di regressione, sei sulla buona strada per affrontare argomenti più complessi e sfumati.

Se, tuttavia, stai ancora lottando per dare un senso all'analisi di regressione e iniziare il tuo percorso di Machine Learning, ti consigliamo il nostro elenco di corsi di Machine Learning . In upGrad, abbiamo una base di studenti in oltre 85 paesi, con oltre 40.000 studenti pagati in tutto il mondo e i nostri programmi hanno avuto un impatto su oltre 500.000 professionisti che lavorano.

Il nostro Master of Science in Machine Learning e Intelligenza artificiale , offerto in collaborazione con la Liverpool John Moores University, è progettato per aiutare gli studenti a iniziare da zero e acquisire abbastanza apprendimento per lavorare su progetti di vita reale. La nostra assistenza professionale a 360 gradi ti assicurerà di essere completamente preparato per ricoprire ruoli di primo piano nel settore. Quindi contattaci oggi e sperimenta il potere dell'apprendimento tra pari e del networking globale!

A cosa serve il modello statistico bayesiano?

I modelli statistici bayesiani si basano su procedure matematiche e utilizzano il concetto di probabilità per risolvere problemi statistici. Forniscono prove affinché le persone facciano affidamento su nuovi dati e facciano previsioni basate sui parametri del modello.

Che cos'è l'inferenza bayesiana?

È una tecnica utile in statistica in cui ci affidiamo a nuovi dati e informazioni per aggiornare la probabilità di un'ipotesi usando il teorema di Bayes.

I modelli bayesiani sono unici?

I modelli bayesiani sono unici in quanto a tutti i parametri in un modello statistico, osservati o meno, viene assegnata una distribuzione di probabilità congiunta.