Apprendre la classification bayésienne dans l'exploration de données [2022]
Publié: 2021-03-10Si vous étudiez l'exploration de données depuis un certain temps, vous devez avoir entendu parler du terme « classification bayésienne ». Vous vous demandez ce que cela signifie et quelle est son importance en tant que concept dans l'exploration de données ?
Cet article répondra à ces questions tout en explorant ce qu'est la classification bayésienne dans l'exploration de données. Commençons:
Table des matières
Qu'est-ce que la classification bayésienne ?
Au cours de l'exploration de données, vous constaterez que la connexion entre la variable de classe et l'ensemble d'attributs est non déterministe. Cela signifie que nous ne pouvons pas supposer l'étiquette de classe d'un enregistrement de test avec une certitude absolue, même si l'ensemble d'attributs est le même que les exemples de formation.
Cela peut se produire en raison de la présence de facteurs d'influence particuliers ou de données bruyantes. Supposons que vous souhaitiez prédire si une personne présente un risque de maladie cardiaque en fonction de ses habitudes alimentaires. Bien que les habitudes alimentaires d'une personne soient un facteur important pour déterminer si elle souffrira ou non de problèmes cardiaques, il peut y avoir d'autres raisons à l'apparition de la même chose, telles que la génétique ou une infection.
Ainsi, votre analyse pour déterminer si la personne serait à risque de maladies cardiaques en fonction de ses seules habitudes alimentaires serait erronée et pourrait entraîner de multiples problèmes.
Ensuite, la question se pose : "Comment résolvez-vous ce problème dans le domaine de l'exploration de données ?" La réponse est la classification bayésienne.
Vous pouvez utiliser la classification bayésienne dans l'exploration de données pour résoudre ce problème et prédire l'occurrence de tout événement. Les classificateurs bayésiens consistent en des classificateurs statistiques utilisant des compréhensions de probabilité bayésiennes.
Pour comprendre le fonctionnement de la classification bayésienne dans l'exploration de données, vous devrez commencer par le théorème de Bayes.
Théorème de Bayes
Le mérite du théorème de Bayes revient à Thomas Bayes qui a utilisé la probabilité conditionnelle pour créer un algorithme qui utilise des preuves pour calculer les limites de paramètres inconnus. Il a été le premier à proposer cette solution.
Mathématiquement, le théorème de Bayes ressemble à ceci :
P(A/B) = P(B/A)P(A) P(B)
Ici, A et B représentent les événements et P(B) ne peut pas être égal à zéro.
P(B) 0
P(B/A) est une probabilité conditionnelle qui explique l'occurrence de l'événement B lorsque A est vrai. De même, P(A/B) est une probabilité conditionnelle qui explique l'occurrence de l'événement A lorsque B est vrai.
P(B) et P(A) sont les probabilités d'observer B et A indépendamment et sont appelées probabilités marginales.
Interprétation bayésienne
Dans l'interprétation bayésienne, la probabilité calcule un degré de croyance. Selon le théorème de Bayes, le degré de croyance en une hypothèse avant d'examiner la preuve est lié au degré de croyance en une hypothèse après l'avoir considérée.
Supposons que vous ayez une pièce de monnaie. Si vous lancez la pièce une fois, vous obtiendrez pile ou face et la probabilité que les deux se produisent est de 50 %. Cependant, si vous lancez la pièce plusieurs fois et observez les résultats, le degré de croyance peut augmenter, diminuer ou rester stable en fonction des résultats.
Si vous avez la proposition A et la preuve B alors :
P(A) est le degré primaire de croyance en A. P(A/B) est le degré postérieur de croyance après prise en compte de B. Le quotient P(B/A)/P(B) montre le soutien que B offre à A. .
Vous pouvez dériver le théorème de Bayes de la probabilité conditionnelle :
P(A/B) = P(A B) P(B) , si P(B) 0
P(B/A) = P(B A) P(A) , si P(A) 0
Ici P(A B) est la probabilité conjointe que A et B soient vrais car :
P (B UNE) = P(A B)
OU, P(A B) = P( UNE B )P(B) = P( B UNE )P(A)
OU, P( UNE B ) = P( B UNE )P(A) P(B) , SI P(B) 0
Réseau bayésien
Nous utilisons des réseaux bayésiens (également connus sous le nom de réseaux de croyance) pour montrer les incertitudes à travers des DAG (Directed Acyclic Graphs). Un graphe acyclique dirigé montre un réseau bayésien comme n'importe quel autre graphe statistique. Il contient un groupe de nœuds et de liens où les liens indiquent la connexion entre les nœuds respectifs.
Chaque nœud d'un graphe acyclique dirigé représente une variable aléatoire. Les variables peuvent être des valeurs continues ou discrètes et peuvent correspondre à l'attribut réel donné aux données.
Un réseau bayésien permet de définir des indépendances conditionnelles de classe entre sous-ensembles de variables. Il vous donne un modèle graphique de la relation sur laquelle vous effectueriez des implémentations.
Outre DAG, un réseau bayésien possède également un ensemble de tables de probabilités conditionnelles.
Conclusion
Vous devez maintenant être familiarisé avec les bases de la classification bayésienne dans l'exploration de données. Comprendre le théorème derrière les applications des implémentations d'exploration de données est essentiel pour progresser.
Que pensez-vous de la classification bayésienne en data mining ? As-tu essayé de l'implémenter ? Partagez vos réponses dans les commentaires. Nous aimerions recevoir de vos nouvelles.
Si vous êtes curieux d'en savoir plus sur la science des données, consultez le diplôme PG de IIIT-B & upGrad en science des données qui est créé pour les professionnels en activité et propose plus de 10 études de cas et projets, des ateliers pratiques, un mentorat avec des experts de l'industrie, 1- on-1 avec des mentors de l'industrie, plus de 400 heures d'apprentissage et d'aide à l'emploi avec les meilleures entreprises.
Qu'est-ce que la classification et la régression dans l'apprentissage automatique ?
La classification et la régression sont des types d'algorithmes d'apprentissage supervisés utilisés dans l'apprentissage automatique. Mais il existe des différences distinctes spécifiques entre ces algorithmes. Un algorithme de régression dans l'apprentissage automatique est utilisé pour estimer la valeur continue d'une variable en fonction de variables d'entrée particulières. Cet algorithme est utilisé pour calculer des variables continues telles que la taille, le revenu, le poids, les scores, la météo, etc. C'est-à-dire qu'il ne peut être utilisé que pour calculer des valeurs discrètes au format entier. Un algorithme de classification est utilisé pour calculer les valeurs des variables discrètes. Fait intéressant, les techniques de classification peuvent traiter à la fois des variables discrètes et des variables à valeur réelle, mais elles doivent être classées en catégories distinctes classées ou étiquetées.
L'exploration de données et l'apprentissage automatique sont-ils identiques ?
Quels sont les avantages de l'exploration de données ?
L'exploration de données offre efficacement des moyens de résoudre les problèmes liés aux données ou aux informations dans ce monde centré sur les données. Il aide les entreprises à recueillir des informations utiles et fiables. En conséquence, les entreprises peuvent fonder leurs décisions ou modifier des opérations qui, en fin de compte, génèrent plus de profits. L'exploration de données joue un rôle crucial en aidant les entreprises à prendre des décisions éclairées, à détecter et à atténuer les risques et à minimiser les incidents de fraude. Les scientifiques des données peuvent parcourir rapidement des volumes massifs de données quotidiennes à l'aide de techniques d'exploration de données rentables et efficaces.