Bayessche Klassifikation im Data Mining lernen [2022]

Veröffentlicht: 2021-03-10

Wenn Sie sich schon länger mit Data Mining beschäftigen, haben Sie sicher schon einmal von dem Begriff „Bayessche Klassifikation“ gehört. Fragen Sie sich, was es bedeutet und wie wichtig es als Konzept im Data Mining ist?

Dieser Artikel beantwortet diese Fragen, während Sie untersuchen, was die Bayessche Klassifikation im Data Mining ist. Lass uns anfangen:

Inhaltsverzeichnis

Was ist die Bayes'sche Klassifikation?

Beim Data Mining werden Sie feststellen, dass die Verbindung zwischen der Klassenvariablen und dem Attributsatz nicht deterministisch ist. Das bedeutet, dass wir die Klassenbezeichnung eines Testdatensatzes nicht mit absoluter Sicherheit annehmen können, selbst wenn der Attributsatz derselbe ist wie in den Trainingsbeispielen.

Dies kann aufgrund des Vorhandenseins bestimmter Einflussfaktoren oder verrauschter Daten geschehen. Angenommen, Sie möchten vorhersagen, ob eine Person aufgrund ihrer Essgewohnheiten einem Risiko für Herzerkrankungen ausgesetzt ist. Während die Essgewohnheiten einer Person ein großer Faktor bei der Bestimmung sind, ob sie an Herzproblemen leiden oder nicht, kann es auch andere Gründe für das Auftreten derselben geben, wie z. B. Genetik oder Infektion.

Daher wäre Ihre Analyse zur Feststellung, ob die Person allein aufgrund ihrer Essgewohnheiten einem Risiko für Herzkrankheiten ausgesetzt wäre, fehlerhaft und könnte zu mehreren Problemen führen.

Dann stellt sich die Frage: „Wie löst man dieses Problem beim Data Mining?“ Die Antwort ist die Bayes'sche Klassifikation.

Sie können die Bayes'sche Klassifizierung beim Data Mining verwenden, um dieses Problem anzugehen und das Eintreten eines beliebigen Ereignisses vorherzusagen. Bayessche Klassifikatoren bestehen aus statistischen Klassifikatoren, die Bayessche Wahrscheinlichkeitsverständnisse verwenden.

Um die Funktionsweise der Bayes'schen Klassifikation im Data Mining zu verstehen, müssen Sie mit dem Satz von Bayes beginnen.

Satz von Bayes

Der Verdienst des Bayes-Theorems geht an Thomas Bayes, der die bedingte Wahrscheinlichkeit verwendete, um einen Algorithmus zu erstellen, der Beweise zur Berechnung von Grenzen für unbekannte Parameter verwendet. Er war der Erste, der diese Lösung gefunden hat.

Mathematisch sieht das Bayes Theorem so aus:

P(A/B) = P(B/A)P(A) P(B)

Hier stellen A und B die Ereignisse dar und P(B) kann nicht gleich Null sein.

P(B) 0

P(B/A) ist eine bedingte Wahrscheinlichkeit, die das Eintreten von Ereignis B erklärt, wenn A wahr ist. Ebenso ist P(A/B) eine bedingte Wahrscheinlichkeit, die das Eintreten von Ereignis A erklärt, wenn B wahr ist.

P(B) und P(A) sind die Wahrscheinlichkeiten, B und A unabhängig voneinander zu beobachten, und sie werden Randwahrscheinlichkeiten genannt.

Bayessche Interpretation

In der Bayes'schen Interpretation berechnet die Wahrscheinlichkeit einen Grad an Überzeugung. Nach dem Bayes-Theorem ist der Grad des Glaubens an eine Hypothese vor Berücksichtigung der Beweise mit dem Grad des Glaubens an eine Hypothese nach Berücksichtigung derselben verbunden.

Angenommen, Sie haben eine Münze. Wenn Sie die Münze einmal werfen, erhalten Sie entweder Kopf oder Zahl, und die Wahrscheinlichkeit für beides liegt bei 50 %. Wenn Sie jedoch die Münze mehrmals werfen und die Ergebnisse beobachten, kann der Grad des Glaubens basierend auf den Ergebnissen zunehmen, abnehmen oder konstant bleiben.

Wenn Sie Vorschlag A und Beweise B haben, dann:

P(A) ist der primäre Grad der Überzeugung von A. P(A/B) ist der spätere Grad der Überzeugung nach Berücksichtigung von B. Der Quotient P(B/A)/P(B) zeigt die Unterstützung, die B für A bietet .

Aus der bedingten Wahrscheinlichkeit lässt sich das Bayes-Theorem ableiten:

P(A/B) = P(A B) P(B) , falls P(B) 0

P(B/A) = P(B A) P(A) , falls P(A) 0

Hier ist P(A B) die gemeinsame Wahrscheinlichkeit, dass sowohl A als auch B wahr sind, weil:

P (B A) = P (A B)

ODER, P(A B) = P( A B )P(B) = P( B A )P(A)

ODER, P( EIN B ) = P( B EIN )P(A) P(B) , WENN P(B) 0

Bayes'sches Netzwerk

Wir verwenden Bayes'sche Netzwerke (auch bekannt als Belief-Netzwerke), um Unsicherheiten durch DAGs (Directed Acyclic Graphs) darzustellen. Ein gerichteter azyklischer Graph zeigt ein Bayes'sches Netzwerk wie jeder andere statistische Graph. Es enthält eine Gruppe von Knoten und Links, wobei die Links die Verbindung zwischen den jeweiligen Knoten bezeichnen.

Jeder Knoten in einem gerichteten azyklischen Diagramm repräsentiert eine Zufallsvariable. Die Variablen können kontinuierliche oder diskrete Werte sein und können dem tatsächlichen Attribut entsprechen, das den Daten gegeben wird.

Ein Bayes'sches Netzwerk ermöglicht es, klassenbedingte Unabhängigkeiten zwischen variablen Teilmengen zu definieren. Es gibt Ihnen ein grafisches Modell der Beziehung, auf der Sie Implementierungen durchführen würden.

Abgesehen von DAG hat ein Bayes'sches Netzwerk auch einen Satz bedingter Wahrscheinlichkeitstabellen.

Fazit

Sie müssen inzwischen mit den Grundlagen der Bayes'schen Klassifikation im Data Mining vertraut sein. Das Verständnis des Theorems hinter den Anwendungen von Data-Mining-Implementierungen ist entscheidend, um Fortschritte zu erzielen.

Was halten Sie von der Bayes'schen Klassifikation im Data Mining? Haben Sie versucht, es umzusetzen? Teile deine Antworten in den Kommentaren. Wir würden uns freuen, von Ihnen zu hören.

Wenn Sie neugierig sind, etwas über Data Science zu lernen, schauen Sie sich das PG Diploma in Data Science von IIIT-B & upGrad an, das für Berufstätige entwickelt wurde und mehr als 10 Fallstudien und Projekte, praktische Workshops, Mentoring mit Branchenexperten, 1- on-1 mit Mentoren aus der Branche, mehr als 400 Stunden Lern- und Jobunterstützung bei Top-Unternehmen.

Was ist Klassifizierung und Regression beim maschinellen Lernen?

Klassifizierung und Regression sind Arten von überwachten Lernalgorithmen, die beim maschinellen Lernen verwendet werden. Es gibt jedoch spezifische deutliche Unterschiede zwischen diesen Algorithmen. Ein Regressionsalgorithmus beim maschinellen Lernen wird verwendet, um den kontinuierlichen Wert einer Variablen basierend auf bestimmten Eingabevariablen zu schätzen. Dieser Algorithmus wird verwendet, um kontinuierliche Variablen wie Größe, Einkommen, Gewicht, Punktzahlen, Wetter usw. zu berechnen. Das heißt, er kann nur verwendet werden, um diskrete Werte im ganzzahligen Format zu berechnen. Ein Klassifizierungsalgorithmus wird verwendet, um die Werte diskreter Variablen zu berechnen. Interessanterweise können Klassifizierungstechniken sowohl mit diskreten als auch mit realen Variablen umgehen, aber sie müssen in verschiedene klassifizierte oder gekennzeichnete Kategorien eingeteilt werden.

Sind Data Mining und maschinelles Lernen dasselbe?

Was sind die Vorteile von Data Mining?

Data Mining bietet effektiv Mittel, um Probleme im Zusammenhang mit Daten oder Informationen in dieser datenzentrierten Welt zu lösen. Es hilft Unternehmen, Informationen zu sammeln, die nützlich und zuverlässig sind. Infolgedessen können Unternehmen ihre Entscheidungen stützen oder Betriebsabläufe ändern, die letztendlich zu höheren Gewinnen führen. Data Mining spielt eine entscheidende Rolle, wenn es darum geht, Unternehmen dabei zu unterstützen, fundierte Entscheidungen zu treffen, Risiken zu erkennen und zu mindern und Betrugsfälle zu minimieren. Data Scientists können mit kostengünstigen und effizienten Data-Mining-Techniken schnell große Mengen täglicher Daten durchsuchen.