Regresie logistică binară: prezentare generală, capacități și ipoteze

Publicat: 2021-10-05

Una dintre cele mai acceptate definiții ale învățării automate este cam așa:

„Se spune că un program de calculator învață din experiența E cu privire la o anumită clasă de sarcini T și măsura performanței P, dacă performanța sa la sarcinile din T, măsurată de P, se îmbunătățește cu experiența E.”

Acum, pentru a îmbunătăți performanța mașinii de-a lungul timpului pe aceeași clasă de sarcini, sunt utilizați diferiți algoritmi pentru a optimiza rezultatul mașinii și a-l aduce mai aproape de rezultatele dorite. Analiza de regresie este una dintre tehnicile de bază și cele mai utilizate pentru a determina mașina să-și îmbunătățească performanța.

Constă dintr-o serie de tehnici de învățare automată pentru a prezice o variabilă de ieșire continuă pe baza uneia sau mai multor valori ale variabilelor predictoare. Analiza de regresie își propune să dezvolte o ecuație matematică care poate defini variabila continuă ca o funcție a variabilei predictoare.

Într-unul dintre articolele noastre anterioare, am analizat regresia logistică și cum să implementăm regresia logistică în Python. De asemenea, am vorbit pe scurt despre cele trei tipuri diferite de regresii logistice în învățarea automată. În acest articol, să vă oferim o prezentare ușor detaliată a regresiei logistice binare, împreună cu privirea de ansamblu, capacitățile și ipotezele acesteia.

Cuprins

Prezentare generală a regresiei logistice binare

Regresia logistică binară sau binomială poate fi înțeleasă ca tipul de regresie logistică care se ocupă de scenarii în care rezultatele observate pentru variabilele dependente pot fi doar binar, adică poate avea doar două tipuri posibile. Aceste două tipuri de clase ar putea fi 0 sau 1, trece sau nu, mort sau viu, câștig sau pierde și așa mai departe.

Regresia logistică multinomială funcționează în scenarii în care rezultatul poate avea mai mult de două tipuri posibile – boala A vs boala B vs boala C – care nu sunt într-o anumită ordine. Un alt tip de regresie logistică este regresia logistică ordinală care se ocupă de variabilele dependente într-o manieră ordonată.

În regresia logistică binară, rezultatele posibile sunt, în general, definite ca 0 sau 1, deoarece aceasta are ca rezultat interpretarea și înțelegerea cea mai simplă a modelului de regresie. Dacă un anumit rezultat pentru orice variabilă dependentă este rezultatul de succes sau demn de remarcat, acesta este codificat ca 0, iar dacă nu are succes sau eșec, este codificat ca 0.

În termeni simpli, regresia logistică binară poate fi folosită pentru a prezice cu atenție și exact șansele de a fi un caz pe baza valorilor predictorilor sau variabilelor independente.

Capacități de regresie logistică binară – tipuri de întrebări la care poate răspunde

După cum sa menționat mai sus, regresia logistică binară este ideală pentru scenariile în care rezultatul poate aparține oricăreia dintre cele două clase sau grupuri. Ca urmare, regresia logistică binară este cea mai potrivită pentru a răspunde întrebărilor de următoarea natură:

Se schimbă probabilitatea de a face cancer pentru fiecare kg suplimentar pe care o persoană este supraponderală?
Variază probabilitatea menționată pentru fiecare pachet de țigări fumat pe zi?
Greutatea corporală, aportul de grăsimi, aportul de calorii și vârsta influențează probabilitatea de a avea un atac de cord?

După cum puteți vedea, răspunsurile la toate cele trei întrebări de mai sus pot fi fie da, fie nu, 0 sau 1. Regresia logistică binară poate fi, prin urmare, utilizată pentru a răspunde precis la aceste întrebări.

Ipoteza majoră a regresiei logistice binare

Ca și în cazul oricărui alt algoritm de învățare automată, regresia logistică binară funcționează și pe anumite ipoteze. Iată acelea:

Variabila dependentă este dihotomică. Adică este fie prezent, fie absent, dar niciodată ambele deodată.
Nu ar trebui să existe valori aberante în date.
Nu ar trebui să existe o corelație mare sau multicoliniaritate între diferiții predictori. Acest lucru poate fi evaluat folosind o matrice de corelație între diferiți predictori.

În concluzie

Regresia logistică binară ajută în multe cazuri de utilizare a învățării automate. De la identificarea debitorilor de credit până la asistența companiilor pentru a păstra clienții – Regresia logistică binară poate fi extinsă pentru a rezolva chiar și problemele de afaceri mai complexe. Cu toate acestea, ar trebui să vă amintiți că aceasta este doar una dintre tehnicile oceanului de algoritmi de învățare automată. Odată ce ați stăpânit analiza de regresie, sunteți pe cale de a trata subiecte mai complexe și mai nuanțate.

Dacă, totuși, încă vă lupți să înțelegeți analiza de regresie și să vă începeți călătoria în materie de învățare automată, vă recomandăm lista noastră de cursuri de învățare automată . La upGrad, avem o bază de cursanți în peste 85 de țări, cu peste 40.000 de cursanți plătiți la nivel global, iar programele noastre au afectat peste 500.000 de profesioniști care lucrează.

Masteratul nostru în învățare automată și inteligență artificială , oferit în colaborare cu Universitatea John Moores din Liverpool, este conceput pentru a ajuta cursanții să înceapă de la zero și să dobândească suficientă învățare pentru a lucra la proiecte din viața reală. Asistența noastră în carieră la 360 de grade vă va asigura că sunteți pe deplin pregătit pentru a prelua roluri de top în industrie. Așadar, contactați-ne astăzi și experimentați puterea învățării de la egal la egal și a rețelei globale!

Pentru ce este folosit modelul statistic bayesian?

Modelele statistice bayesiene se bazează pe proceduri matematice și folosesc conceptul de probabilitate pentru a rezolva probleme statistice. Ele oferă dovezi pentru ca oamenii să se bazeze pe date noi și să facă previziuni bazate pe parametrii modelului.

Ce este inferența bayesiană?

Este o tehnică utilă în statistică în care ne bazăm pe date și informații noi pentru a actualiza probabilitatea pentru o ipoteză folosind teorema lui Bayes.

Modelele bayesiene sunt unice?

Modelele bayesiene sunt unice prin faptul că tuturor parametrilor dintr-un model statistic, indiferent dacă sunt observați sau neobservați, li se atribuie o distribuție de probabilitate comună.