Clasificatorul naiv Bayes explicat

Publicat: 2022-09-28

Cuprins

Introducere

Dacă sunteți interesat de învățarea automată, inteligența artificială sau știința datelor, trebuie să cunoașteți importanța ipotezelor. Învățarea automată sau alte modele bazate pe risc sunt dezvoltate pe baza anumitor ipoteze și convenții predefinite care permit dezvoltatorilor să obțină rezultatele dorite. Dacă dezvoltatorii nu iau în considerare ipotezele în timp ce construiesc modele, aceasta poate interfera cu datele și poate duce la rezultate inexacte. Clasificatorul naiv Bayes este unul dintre exemplele clasice de ipoteze matematice din modelele statistice.

Programele noastre AI și ML în SUA

Master of Science în Machine Learning și AI de la LJMU și IIITB Program Executive PG în învățare automată și inteligență artificială de la IIITB
Pentru a explora toate cursurile noastre, vizitați pagina noastră de mai jos.
Cursuri de învățare automată

Acest blog explică teorema Bayes, Clasificatorul Naive Bayes și diferitele sale modele.

Ce este Naive Bayes Clasifier?

Clasificatorul naiv Bayes se bazează pe teorema Bayes propusă de Thomas Bayes, un matematician britanic. Deci, înainte de a înțelege Clasificatorul Bayes naiv, este pertinent să cunoașteți teorema Bayes. Teorema Bayes, cunoscută și sub numele de Legea lui Bayes sau Regula lui Bayes, determină șansele de apariție sau neapariție a oricărui eveniment. În termeni simpli, spune probabilitatea ca un eveniment să aibă loc.

Teorema Bayes este folosită în mod popular în învățarea automată pentru a prezice clasele cu precizie. Acesta calculează probabilitatea condiționată a sarcinilor de clasificare în învățarea automată. Sarcinile de clasificare se referă la activitățile efectuate de algoritmii de învățare automată pentru a rezolva probleme. Puteți înțelege mai bine acest lucru cu exemplul e-mailurilor spam. Algoritmul de învățare automată învață să clasifice e-mailurile ca spam sau nu ca spam. Prin urmare, într-un model de învățare automată, teorema Bayes este utilizată pentru a prezice activitățile de clasificare sau segregare.

Teorema Naive Bayes este un subset al teoremei Bayes. Deoarece funcția sa principală este clasificarea sarcinilor, ne referim la el și ca Naive Bayes Clasifier. Teorema face, de asemenea, o presupunere naivă că toate trăsăturile clasei nu sunt dependente unele de altele, de unde termenul de teoremă Bayes naivă. Dacă discutăm despre învățarea automată, Clasificatorul Naive Bayes este un algoritm care aplică teorema Bayes pentru a prezice un eveniment presupunând în același timp că atributele unei anumite clase sunt independente unele de altele. Aceste atribute sunt, de asemenea, considerate egale și pot exista fără a depinde de o altă caracteristică.

Putem folosi Naive Bayes Clasifier pentru multe funcții, cum ar fi diagnosticarea unei anumite boli dacă este disponibil un set de simptome, prognoza meteo, umiditatea, temperatura și alți factori. Cu cuvinte simple, puteți utiliza algoritmul naiv Bayes pentru orice proces de date care necesită clasificare binară sau multiclasă. Naive Bayes Classifier lucrează pe conceptul de probabilitate condiționată. Înseamnă că probabilitatea ca un eveniment să aibă loc depinde de apariția oricărui alt eveniment. De exemplu, probabilitatea condiționată de apariție a evenimentului A depinde de apariția evenimentului B.

Obțineți certificare de învățare automată de la cele mai bune universități din lume. Câștigă programe de master, Executive PGP sau Advanced Certificate pentru a-ți accelera cariera.

Funcționarea Clasificatorului Naive Bayes

Clasificatorul Naive Bayes este utilizat pentru a găsi probabilitatea de ieșire dacă intrarea este disponibilă. Naive Bayes Classifier rezolvă problemele de modelare a predicțiilor prin clasificarea claselor folosind diferite etichete. Algoritmii de învățare automată bazați pe un model de probabilitate pot rezolva astfel de provocări complexe.

De exemplu, există etichete de clasă y1, y2, y3…….yn și variabile de intrare x1, x2, x3……xk într-o problemă de clasificare. În primul rând, trebuie să calculăm probabilitatea condiționată a unei etichete diferite de clasă y în cazul intrărilor x. Apoi considerăm caracteristica cu cea mai mare probabilitate condiționată ca fiind cea mai potrivită clasificare.

Diferite modele de Naive Bayes Classifier

Acestea sunt trei tipuri de clasificatoare Bayes naive.

  • Gaussian Naive Bayes - Gaussian Naive Bayes utilizează distribuția normală sau Gaussiană pentru a susține date continue. Teorema distribuției normale analizează datele dacă există probabilitatea ca datele continue să fie distribuite egal peste sau sub medie.
  • Multinomial Naive Bayes – Folosim clasificatorul multinomial Naive Bayes atunci când este necesară clasificarea caracteristicilor discrete, de exemplu, numărul de cuvinte pentru clasificarea textului. Analizează statistic conținutul unui document și îl atribuie unei clase.
  • Bernoulli Naive Bayes - Bernoulli Naive Bayes este similar cu Multinomial Naive Bayes. Este folosit și pentru date discrete. Cu toate acestea, acceptă doar caracteristici binare – 0 și 1. Deci, în cazul caracteristicilor binare din setul de date, trebuie să folosim Bernoulli Naive Bayes.

Avantajele și dezavantajele clasificatorului naiv Bayes

Cea mai semnificativă caracteristică a Naive Bayes Classifier este că poate gestiona atât date continue, cât și discrete. Precizia Clasificatorului Naive Bayes crește odată cu cantitatea de date, deoarece oferă rezultate mai precise dacă este utilizat un set de date mare. Iată câteva avantaje și dezavantaje ale Clasificatorului Naive Bayes.

Avantajele Clasificatorului Naive Bayes

  • Foarte scalabil – Unul dintre cele mai semnificative avantaje ale Clasificatorului Naive Bayes este că este foarte scalabil datorită presupunerii sale naive.
  • Mai puțină perioadă de antrenament – ​​Avem nevoie de o cantitate mică de date de antrenament pentru a antrena Naive Bayes Classifier. Deci, perioada de antrenament este relativ scurtă în comparație cu alți algoritmi.
  • Simplu – Un alt avantaj semnificativ al Clasificatorului Naive Bayes este că este simplu de construit. De asemenea, poate fi utilizat cu ușurință pentru a clasifica seturi mari de date.

Dezavantajele Clasificatorului Naive Bayes

  • Limitări în utilizările din lumea reală – Clasificatorul Naive Bayes face o presupunere naivă că diferitele caracteristici ale unei clase sunt independente unele de altele. Deoarece acest fenomen se întâmplă rar în lumea reală, algoritmul poate fi utilizat în scopuri limitate.
  • Problemă cu frecvența zero – Dacă setul de date de antrenament a avut o valoare adăugată lipsă mai târziu, Naive Bayes Clasifier marchează acea valoare ca zero din cauza lipsei de frecvență. Deci, atunci când probabilitățile diferitelor valori sunt înmulțite, probabilitatea bazată pe frecvență ajunge la zero, deoarece algoritmul a atribuit valori zero datelor lipsă, ceea ce poate duce la rezultate inexacte.

Utilizarea Clasificatorului Bayes naiv în învățarea automată și inteligența artificială

Algoritmul Naive Bayes este benefic în învățarea automată și în inteligența artificială, deoarece presupune că toate atributele unei clase nu depind unele de altele. Iată câteva utilizări practice ale Clasificatorului Naive Bayes în învățarea automată și inteligența artificială:

  • Predicția cancerului de colon – Cercetătorii au sugerat utilizarea unui model Naive Bayes Clasifier pentru a prezice cancerul de colon. Poate fi una dintre cele mai remarcabile utilizări ale Naive Bayes Classifier. Poate fi posibil cu date despre cancerul de colon, cum ar fi intervalul de hemoglobină, iar celulele roșii și albe din sânge se numără în corpul pacienților de colon ca date de antrenament pentru model. Algoritmul poate prezice cancerul de colon dacă hemoglobina și celulele sanguine ale unui pacient se încadrează în același interval.
  • Gestionarea riscului de trafic – Clasificatorul Naive Bayes poate fi folosit și pentru gestionarea riscului de trafic. Clasificatorul Naive Bayes poate prezice riscul de conducere al șoferului și traficul rutier pe baza datelor de antrenament.

Bloguri populare de învățare automată și inteligență artificială

IoT: istorie, prezent și viitor Tutorial de învățare automată: Învățați ML Ce este algoritmul? Simplu și Ușor
Salariu inginer robotic în India: toate rolurile O zi din viața unui inginer de învățare automată: ce fac ei? Ce este IoT (Internet of Things)
Permutare vs combinație: diferența dintre permutare și combinație Top 7 tendințe în inteligența artificială și învățarea automată Învățare automată cu R: tot ce trebuie să știți

Concluzie

Naive Bayes Classifier este un algoritm prietenos pentru începători care simplifică clasificarea în învățarea automată și inteligența artificială. Algoritmul Naive Bayes este utilizat pentru diverse aplicații practice, cum ar fi protecția împotriva spamului, prognozele meteo și diagnosticarea medicală folosind ML și Ai. Deci, dacă sunteți interesat de învățarea automată și doriți să urmați o carieră în acest domeniu, trebuie să știți despre Naive Bayes Classifier și alți algoritmi de bază. Puteți urma un master în învățare automată și inteligență artificială de la upGrad pentru a învăța în profunzime algoritmi și alte abilități ML și AI. Cursul oferă, de asemenea, o oportunitate de a lucra la proiecte de învățare automată din viața reală, permițându-vă să dobândiți abilități, să vă îmbunătățiți CV-ul și să profitați de mai multe oportunități de angajare în AI și ML.

Putem folosi teorema Naive Bayes pentru regresie?

Da, Naive Bayes Clasifier poate fi folosit pentru regresie. Anterior, aplicarea sa era limitată la sarcini de clasificare. Cu toate acestea, cu modificări treptate, îl putem folosi acum pentru regresie, ceea ce înseamnă că Clasificatorul Naive Bayes poate fi aplicat atât clasificării generative, cât și discriminative.

Este Naive Bayes Classifier mai bun decât regresia logistică?

Atât regresia logistică, cât și Naive Bayes Classifier sunt algoritmi de clasificare liniară care utilizează date continue. Cu toate acestea, dacă există o părtinire sau caracteristici distincte în clasă, Naive Bayes Clasifier va oferi o precizie mai bună decât regresia logistică din cauza presupunerii naive.

Ce sarcini de învățare automată poate îndeplini Naive Bayes Classifier?

Naive Bayes Classifier facilitează sarcinile de învățare supravegheată în învățarea automată. Algoritmul clasifică datele în funcție de datele de antrenament date mai devreme. Algoritmul Naive Bayes prezice clasificarea formată pe baza input-output sau experiență anterioară.