Ghid pentru începători pentru inferența bayesiană: Ghid complet

Publicat: 2021-11-26

Aplicațiile de învățare automată au crescut cu aplicabilitate largă în cercetare, social media, publicitate etc. Cu toate acestea, aplicațiile se ocupă în cea mai mare parte cu predicția care implică o cantitate imensă de date. Statisticile sunt adesea folosite pentru cuantificarea măsurării valorilor incertitudinii. Dacă avem evenimente diferite, atunci trei abordări pot determina probabilitatea evenimentului.
Aceste trei metode sunt:

Clasic
Bayesian
frecventist

Să luăm în considerare un exemplu de aruncare a unui zar pentru a afla probabilitatea dacă va arăta fața lui „patru”. Va ajuta la înțelegerea celor trei tipuri de metode de determinare a probabilității. Să presupunem că luați în considerare metoda clasică de estimare a probabilității. În acest caz, se va crede că vor exista un total de șase rezultate, iar probabilitatea ca orice rezultat să apară va fi aceeași. Într-o astfel de ipoteză, probabilitatea ca rezultatul să fie patru va fi 1/6. Metoda clasică funcționează de obicei bine atunci când rezultatele au rezultate la fel de probabile. Dar când rezultatele devin mai subiective, această metodă nu poate fi folosită.

Dacă luăm în considerare metoda Frecventistă, se cere să existe o succesiune infinită a unui eveniment care este ipotetică. Apoi necesită căutarea frecvenței relevante în succesiunea infinită ipotetică. Luând în considerare exemplul de mai sus de zaruri, dacă zarurile sunt aruncate de un număr infinit de ori, rezultatul, adică 1/6, putem obține rezultatul ca patru. Prin urmare, probabilitatea ca rezultatul să fie patru în zarurile cu șase fețe va fi de 1/6 conform definiției metodei frecventiste.

Acum venind spre abordarea bayesiană, vă oferă câteva avantaje. Conform perspectivei acestei metode, puteți încorpora o credință personală în procesul de luare a deciziilor. Aceasta înseamnă că va lua în considerare lucruri precum informațiile cunoscute cu privire la problemă. Faptul că diferiți indivizi pot avea convingeri diferite este de asemenea luat în considerare în această abordare. De exemplu, să presupunem că dacă cineva menționează că probabilitatea de a ploua va fi de 90% mâine, pentru o altă persoană, probabilitatea de a ploua ar putea fi de 60%. Prin urmare, metoda abordării bayesiene este subiectivă. Cu toate acestea, rezultatele sunt mai intuitive în comparație cu metoda Frequentist.

Cuprins

Inferența Bayesiană

Inferența bayesiană este folosită mai ales pentru problema inferenței statistice. În aceste cazuri, există întotdeauna o cantitate necunoscută (date) care trebuie estimată. Și apoi, din date, urmează să fie estimată suma dorită. Mărimea necunoscută este denumită θ. Există o presupunere că θ este o mărime aleatorie și există câteva presupuneri inițiale pentru valorile lui θ. Acest tip de distribuție este denumit distribuție anterioară. Actualizarea valorii se face de obicei prin regula Bayes. Prin urmare, abordarea este denumită abordare bayesiană.

Teorema Bayes

Aplicarea inferenței bayesiene depinde de înțelegerea teoremei lui Bayes.

Luați în considerare că există două seturi de rezultate, cum ar fi Setul A și setul B. Aceste seturi sunt numite și evenimente. Să notăm probabilitatea pentru evenimentul A ca P(A) și evenimentul B ca P(B). Acestea au fost probabilitățile evenimentelor în mod individual. Cu toate acestea, o probabilitate comună poate fi definită prin termenul P(A, B). Probabilitățile condiționate pot fi extinse astfel:

P(A,B) = P(A|B)P(B),

Aceasta înseamnă că, în timp ce B este dat, probabilitatea condiționată a lui A și B are ca rezultat probabilitatea comună a celor două evenimente.

P(A,B) = P(B|A)P(A)

În ambele ecuații de mai sus, partea stângă a ecuațiilor este aceeași, deci partea dreaptă a ecuațiilor ar trebui să fie egală.

P(A|B)P(B) = P(B|A)P(A)

P(A|B) = P(B|A)P(A)/P(B)

Această ecuație este cunoscută sub numele de teorema lui Bayes.

În domeniul științei datelor, teorema lui Bayes poate fi scrisă într-un fel ca

P(ipoteză|date) = P(date|ipoteză) P(ipoteză)/p(date)

Numitorul, care este dovada, asigură că distribuția posterioară din partea stângă a ecuației este densitatea de probabilitate validă. Aceasta se mai numește și o constantă de normalizare.

Există trei componente în ecuația teoremei Bayes.

înainte
Probabilitate
Posterior

Distribuție prealabilă

Unul dintre factorii cheie în metoda inferenței bayesiene este distribuția anterioară. Prin aceasta, puteți încorpora convingerile personale în procesul de luare a deciziilor. De asemenea, puteți încorpora judecățile bazate pe diferite persoane în studiu. Acest lucru se realizează printr-o expresie matematică. Un parametru necunoscut, reprezentat de θ, este folosit pentru a-și exprima credința. Pentru exprimarea acestor convingeri se folosește o funcție de distribuție, care este distribuția anterioară. Prin urmare, înainte de a rula orice experiment, distribuția este aleasă.

Ghid pentru începători pentru inferența bayesiană

1. Alegerea priorului

O distribuție cumulată este de obicei definită pentru parametrul θ. Acele evenimente cu valoarea probabilității anterioare ca zero vor avea valoarea probabilității posterioare ca zero. Și pentru acele evenimente care au valoarea probabilității anterioare, se va avea valoarea probabilității posterioare ca una. Prin urmare, un cadru bun al abordării bayesiene nu va defini anumite estimări punctuale ale acelor evenimente care au avut loc deja sau nu există informații despre apariția acesteia. Există anumite tehnici de alegere a priorului. O tehnică care este utilizată pe scară largă pentru alegerea anterioară este utilizarea funcțiilor de distribuție. Se folosește familia tuturor funcțiilor. Aceste funcții ar trebui să fie flexibile și vor putea reprezenta convingerile indivizilor.

2. Probabilitate

Să considerăm θ ca fiind parametrul necunoscut care trebuie estimat. Corectitudinea unei monede poate fi exprimată prin θ, luând în considerare exemplul de inferență bayesiană . Moneda este răsturnată la infinit pentru a-și verifica corectitudinea. Așadar, de fiecare dată când se învârte, fie va fi capul, fie o coadă. Valorile care sunt atribuite evenimentelor sunt 0 și 1. Acest lucru este denumit și încercările Bernoulli. Toate rezultatele sunt considerate independente. Acest lucru poate fi exprimat printr-o ecuație care definește conceptul de probabilitate. Probabilitatea este o funcție de densitate care este o funcție a lui θ. Pentru maximizarea probabilității, valoarea lui θ ar trebui să aibă ca rezultat cea mai mare valoare de probabilitate. Metoda de estimare este, de asemenea, cunoscută sub denumirea de Estimarea cu probabilitatea maximă.

3. Distribuția posterioară

Rezultatul teoremei Bayes este cunoscut sub numele de distribuție posterioară. Este probabilitatea actualizată a oricărui eveniment care are loc după luarea în considerare a noilor informații.

4. Mecanismul de inferență bayesiană

După cum am văzut mai sus, metoda inferenței bayesiene tratează conceptul de probabilitate ca un anumit grad de credință. Aceste convingeri sunt asociate cu faptul că evenimentul ar putea avea loc în baza unor astfel de dovezi. Prin urmare, parametrul theta „θ” este considerat a fi o variabilă aleatorie.

5. Aplicarea inferenței bayesiene în riscul financiar

Există o mulțime de algoritmi în care poate fi aplicată Inferența Bayesiană. Unii dintre algoritmi sunt rețele neuronale, pădure aleatoare, regresie etc. Metoda și-a găsit popularitate și în sectorul financiar. Poate fi folosit pentru modelarea riscului operațional al mai multor bănci. Datele băncilor care arată pierderea operațiunilor arată unele evenimente care s-au pierdut. Aceste evenimente pierdute au avut o frecvență scăzută, dar au avut o severitate ridicată. Prin urmare, în astfel de cazuri, Inferența Bayesiană se dovedește a fi destul de utilă. Acest lucru se datorează faptului că, în această metodă, nu sunt necesare, de asemenea, multe date pentru analiză.

Alte metode de analiză statistică, precum metodele frecventiste, au fost aplicate anterior și pentru modelarea riscurilor operaționale. Dar a existat o problemă în estimarea parametrului de incertitudine. Prin urmare, inferența bayesiană a fost considerată a fi cea mai eficientă metodă. Acest lucru se datorează faptului că opiniile experților și datele pot fi utilizate pentru derivarea distribuțiilor posterioare. În acest tip de sarcină, datele de pierdere internă a băncilor sunt împărțite în mai multe fragmente mai mici, iar apoi frecvența fiecăruia dintre fragmente este estimată prin judecata expertă. Aceasta este apoi încadrată în distribuțiile probabilității.

Alăturați-vă Cursului de învățare automată online de la cele mai bune universități din lume – Master, Programe Executive Postuniversitare și Program de Certificat Avansat în ML și AI pentru a vă accelera cariera.

Concluzie

În statistică și învățare automată, cele două abordări principale care pot fi aplicate sunt metodele de inferență frecventă și bayesiană. Am discutat despre metoda Bayesian Inference în articol, unde probabilitățile sunt calculate ca credințe subiective. Odată cu datele, convingerile personale ale oamenilor sunt, de asemenea, încorporate la estimarea probabilităților. Acestea fac ca modelul să fie mult mai larg acceptat în multe studii de estimare. Prin urmare, tehnicile de inferență bayesiană specifică metodele sau modalitățile de a aplica convingerile tale la observarea datelor. Mai mult, în multe tipuri de aplicații cu multe date zgomotoase, poate fi utilizată tehnica Bayesian Inference. Prin urmare, puterea care se află în regula lui Bayes se poate raporta la o cantitate care poate fi calculată la cea care poate fi folosită pentru a răspunde la întrebări de natură arbitrară.

Îmbunătățiți-vă cariera în învățarea automată și inteligența artificială

Aplicați acum pentru EPGP în Machine Learning și AI