Le classificateur naïf de Bayes expliqué

Publié: 2022-09-28

Table des matières

Introduction

Si vous êtes intéressé par l'apprentissage automatique, l'intelligence artificielle ou la science des données, vous devez connaître l'importance des hypothèses. L'apprentissage automatique ou d'autres modèles basés sur les risques sont développés sur la base de certaines hypothèses et de conventions prédéfinies qui permettent aux développeurs d'obtenir les résultats souhaités. Si les développeurs ne tiennent pas compte des hypothèses lors de la construction de modèles, cela peut interférer avec les données et conduire à des résultats inexacts. Le classificateur Naive Bayes est l'un des exemples classiques d'hypothèses mathématiques dans les modèles statistiques.

Nos programmes d'IA et de ML aux États-Unis

Master of Science en Machine Learning & AI de LJMU et IIITB Programme exécutif PG en apprentissage automatique et intelligence artificielle de l'IIITB
Pour explorer tous nos cours, visitez notre page ci-dessous.
Cours d'apprentissage automatique

Ce blog explique le théorème de Bayes, le classificateur Naive Bayes, et ses différents modèles.

Qu'est-ce que le classificateur naïf de Bayes ?

Le classificateur Naive Bayes est basé sur le théorème de Bayes proposé par Thomas Bayes, un mathématicien britannique. Donc, avant de comprendre le classificateur naïf de Bayes, il est pertinent de connaître le théorème de Bayes. Le théorème de Bayes, également connu sous le nom de loi de Bayes ou règle de Bayes, détermine les chances d'occurrence ou de non-occurrence de tout événement. En termes simples, il indique la probabilité qu'un événement se produise.

Le théorème de Bayes est couramment utilisé dans l'apprentissage automatique pour prédire les classes avec précision. Il calcule la probabilité conditionnelle des tâches de classification dans l'apprentissage automatique. Les tâches de classification font référence aux activités effectuées par les algorithmes d'apprentissage automatique pour résoudre des problèmes. Vous pouvez mieux comprendre cela avec l'exemple des spams. L'algorithme d'apprentissage automatique apprend à classer les e-mails comme spam ou non spam. Par conséquent, dans un modèle d'apprentissage automatique, le théorème de Bayes est utilisé pour prédire les activités de classification ou de ségrégation.

Le théorème de Naive Bayes est un sous-ensemble du théorème de Bayes. Étant donné que sa fonction principale est la classification des tâches, nous l'appelons également le classificateur Naive Bayes. Le théorème fait également l'hypothèse naïve que toutes les caractéristiques de classe ne dépendent pas les unes des autres, d'où le terme théorème naïf de Bayes. Si nous discutons de l'apprentissage automatique, le Naive Bayes Classifier est un algorithme qui applique le théorème de Bayes pour prédire un événement tout en supposant que les attributs d'une classe particulière sont indépendants les uns des autres. Ces attributs sont également considérés comme égaux et peuvent exister sans dépendre d'une autre caractéristique.

Nous pouvons utiliser le classificateur Naive Bayes pour de nombreuses fonctions, telles que le diagnostic d'une maladie spécifique si un ensemble de symptômes est disponible, les prévisions météorologiques, l'humidité, la température et d'autres facteurs. En termes simples, vous pouvez utiliser l'algorithme naïf de Bayes pour tout traitement de données nécessitant une classification multiclasse binaire ou multi-usage. Naive Bayes Classifier fonctionne sur le concept de probabilité conditionnelle. Cela signifie que la probabilité qu'un événement se produise dépend de l'occurrence de tout autre événement. Par exemple, la probabilité conditionnelle que l'événement A se produise dépend de l'occurrence de l'événement B.

Obtenez une certification d'apprentissage automatique des meilleures universités du monde. Gagnez des programmes de maîtrise, Executive PGP ou Advanced Certificate pour accélérer votre carrière.

Fonctionnement du classificateur Naive Bayes

Le classificateur Naive Bayes est utilisé pour trouver la probabilité de sortie si l'entrée est disponible. Naive Bayes Classifier résout les problèmes de modélisation de prédiction en catégorisant les classes à l'aide de différentes étiquettes. Les algorithmes d'apprentissage automatique basés sur un modèle de probabilité peuvent résoudre des problèmes aussi complexes.

Par exemple, il existe des étiquettes de classe y1, y2, y3…….yn et des variables d'entrée x1, x2, x3……xk dans un problème de classification. Tout d'abord, nous devons calculer la probabilité conditionnelle d'une étiquette de classe y différente dans le cas de x entrées. Ensuite, nous considérons la caractéristique avec la probabilité conditionnelle la plus élevée comme la classification la plus appropriée.

Différents modèles de classificateur Naive Bayes

Ce sont trois types de classificateurs Naive Bayes.

  • Gaussian Naive Bayes - Le Gaussian Naive Bayes utilise une distribution normale ou gaussienne pour prendre en charge les données continues. Le théorème de la distribution normale analyse les données s'il existe une probabilité que les données continues soient également distribuées au-dessus ou au-dessous de la moyenne.
  • Multinomial Naive Bayes - Nous utilisons le classificateur multinomial Naive Bayes lorsque la classification de caractéristiques discrètes est requise, par exemple, le nombre de mots pour la classification de texte. Il analyse statistiquement le contenu d'un document et l'affecte à une classe.
  • Bernoulli Naive Bayes - Le Bernoulli Naive Bayes est similaire au Multinomial Naive Bayes. Il est également utilisé pour les données discrètes. Cependant, il n'accepte que les caractéristiques binaires - 0 et 1. Ainsi, dans le cas des caractéristiques binaires dans l'ensemble de données, nous devons utiliser Bernoulli Naive Bayes.

Avantages et inconvénients du classificateur Naive Bayes

La caractéristique la plus importante du classificateur Naive Bayes est qu'il peut gérer à la fois des données continues et discrètes. La précision du classificateur Naive Bayes augmente avec la quantité de données car il donne des résultats plus précis si un grand ensemble de données est utilisé. Voici quelques avantages et inconvénients du classificateur Naive Bayes.

Avantages du classificateur Naive Bayes

  • Hautement évolutif - L'un des avantages les plus importants du classificateur Naive Bayes est qu'il est hautement évolutif en raison de son hypothèse naïve.
  • Moins de période de formation - Nous avons besoin d'une petite quantité de données de formation pour former le classificateur Naive Bayes. Ainsi, la période de formation est relativement courte par rapport à d'autres algorithmes.
  • Simple - Un autre avantage important du classificateur Naive Bayes est qu'il est simple à construire. En outre, il peut être facilement utilisé pour classer de grands ensembles de données.

Inconvénients du classificateur Naive Bayes

  • Limitations dans les utilisations réelles - Le classificateur Naive Bayes fait l'hypothèse naïve que les différentes caractéristiques d'une classe sont indépendantes les unes des autres. Étant donné que ce phénomène se produit rarement dans le monde réel, l'algorithme peut être utilisé à des fins limitées.
  • Problème de fréquence zéro - Si l'ensemble de données d'entraînement avait une valeur ajoutée manquante plus tard, le classificateur Naive Bayes marque cette valeur comme zéro en raison de l'absence de fréquence. Ainsi, lorsque les probabilités de différentes valeurs sont multipliées, la probabilité basée sur la fréquence est nulle car l'algorithme a attribué des valeurs nulles aux données manquantes, ce qui peut conduire à des résultats inexacts.

Utilisation du classificateur Naive Bayes dans l'apprentissage automatique et l'intelligence artificielle

L'algorithme Naive Bayes est bénéfique dans l'apprentissage automatique et l'intelligence artificielle en raison de son hypothèse selon laquelle tous les attributs d'une classe ne dépendent pas les uns des autres. Voici quelques utilisations pratiques du classificateur Naive Bayes dans l'apprentissage automatique et l'intelligence artificielle :

  • Prédire le cancer du côlon - Les chercheurs ont suggéré d'utiliser un modèle de classificateur Naive Bayes pour prédire le cancer du côlon. Il peut s'agir de l'une des utilisations les plus remarquables du classificateur Naive Bayes. Cela peut être rendu possible avec des données sur le cancer du côlon telles que la plage d'hémoglobine et le nombre de globules rouges et blancs dans le corps des patients du côlon en tant que données d'entraînement pour le modèle. L'algorithme peut prédire le cancer du côlon si l'hémoglobine et les cellules sanguines d'un patient se situent dans la même fourchette.
  • Gestion des risques liés au trafic – Le classificateur Naive Bayes peut également être utilisé pour la gestion des risques liés au trafic. Le classificateur Naive Bayes peut prédire le risque de conduite du conducteur et le trafic routier en fonction des données de formation.

Blogs populaires sur l'apprentissage automatique et l'intelligence artificielle

IdO : histoire, présent et avenir Tutoriel d'apprentissage automatique : Apprendre le ML Qu'est-ce que l'algorithme ? Simple et facile
Salaire d'ingénieur en robotique en Inde: tous les rôles Une journée dans la vie d'un ingénieur en apprentissage automatique : que font-ils ? Qu'est-ce que l'IoT (Internet des objets)
Permutation vs combinaison : Différence entre permutation et combinaison Top 7 des tendances en matière d'intelligence artificielle et d'apprentissage automatique Apprentissage automatique avec R : tout ce que vous devez savoir

Conclusion

Naive Bayes Classifier est un algorithme adapté aux débutants qui simplifie la classification dans l'apprentissage automatique et l'intelligence artificielle. L'algorithme Naive Bayes est utilisé pour diverses applications pratiques telles que la protection anti-spam, les prévisions météorologiques et les diagnostics médicaux utilisant ML et Ai. Donc, si vous avez un vif intérêt pour l'apprentissage automatique et que vous souhaitez poursuivre une carrière dans ce domaine, vous devez connaître Naive Bayes Classifier et d'autres algorithmes de base. Vous pouvez poursuivre une maîtrise ès sciences en apprentissage automatique et intelligence artificielle de upGrad pour apprendre en profondeur les algorithmes et d'autres compétences en ML et en IA. Le cours offre également l'opportunité de travailler sur des projets d'apprentissage automatique réels, vous permettant d'acquérir des compétences, d'améliorer votre CV et de saisir plusieurs opportunités d'emploi en IA et ML.

Pouvons-nous utiliser le théorème de Naive Bayes pour la régression ?

Oui, le classificateur Naive Bayes peut être utilisé pour la régression. Auparavant, son application était limitée aux tâches de classification. Cependant, avec des modifications progressives, nous pouvons maintenant l'utiliser pour la régression, ce qui signifie que le classificateur Naive Bayes peut être appliqué à la fois à la classification générative et discriminative.

Le classificateur Naive Bayes est-il meilleur que la régression logistique ?

La régression logistique et le classificateur Naive Bayes sont des algorithmes de classification linéaire qui utilisent des données continues. Cependant, s'il existe un biais ou des caractéristiques distinctes dans la classe, le classificateur Naive Bayes fournira une meilleure précision que la régression logistique en raison de l'hypothèse naïve.

Quelles tâches d'apprentissage automatique le classificateur Naive Bayes peut-il effectuer ?

Naive Bayes Classifier facilite les tâches d'apprentissage supervisé dans l'apprentissage automatique. L'algorithme classe les données en fonction des données d'apprentissage fournies précédemment. L'algorithme Naive Bayes prédit la classification formée sur les entrées-sorties ou l'expérience précédentes.