Binäre logistische Regression: Überblick, Fähigkeiten und Annahmen

Veröffentlicht: 2021-10-05

Eine der am meisten akzeptierten Definitionen des maschinellen Lernens lautet ungefähr so:

„Ein Computerprogramm lernt aus der Erfahrung E in Bezug auf eine Klasse von Aufgaben T und ein Leistungsmaß P, wenn sich seine Leistung bei Aufgaben in T, gemessen an P, mit der Erfahrung E verbessert.“

Um nun die Leistung der Maschine bei der gleichen Aufgabenklasse im Laufe der Zeit zu verbessern, werden verschiedene Algorithmen verwendet, um die Leistung der Maschine zu optimieren und näher an die gewünschten Ergebnisse zu bringen. Die Regressionsanalyse ist eine der grundlegenden und am häufigsten verwendeten Techniken, um die Maschine dazu zu bringen, ihre Leistung zu verbessern.

Es besteht aus einer Reihe von maschinellen Lerntechniken, um eine kontinuierliche Ausgabevariable basierend auf den Werten einer oder mehrerer Prädiktorvariablen vorherzusagen. Die Regressionsanalyse zielt darauf ab, eine mathematische Gleichung zu entwickeln, die die kontinuierliche Variable als Funktion der Prädiktorvariablen definieren kann.

In einem unserer früheren Artikel haben wir uns mit der logistischen Regression und der Implementierung der logistischen Regression in Python befasst. Wir haben auch kurz über die drei verschiedenen Arten von logistischen Regressionen beim maschinellen Lernen gesprochen. Lassen Sie uns in diesem Artikel eine leicht detaillierte exemplarische Vorgehensweise der binären logistischen Regression zusammen mit ihrer Übersicht, ihren Funktionen und Annahmen geben.

Inhaltsverzeichnis

Überblick über die binäre logistische Regression

Binäre oder binomiale logistische Regression kann als die Art der logistischen Regression verstanden werden, die sich mit Szenarien befasst, in denen die beobachteten Ergebnisse für abhängige Variablen nur binär sein können, dh es kann nur zwei mögliche Typen geben. Diese beiden Arten von Klassen können 0 oder 1, Bestanden oder Nicht bestanden, Tot oder Lebendig, Gewinnen oder Verlieren usw. sein.

Die multinomiale logistische Regression funktioniert in Szenarien, in denen das Ergebnis mehr als zwei mögliche Typen haben kann – Krankheit A vs. Krankheit B vs. Krankheit C – die in keiner bestimmten Reihenfolge vorliegen. Eine weitere Art der logistischen Regression ist die ordinale logistische Regression, die abhängige Variablen in geordneter Weise behandelt.

Bei der binären logistischen Regression werden die möglichen Ausgaben im Allgemeinen als 0 oder 1 definiert, da dies zur einfachsten Interpretation und zum einfachsten Verständnis des Regressionsmodells führt. Wenn ein bestimmtes Ergebnis für eine abhängige Variable das erfolgreiche oder bemerkenswerte Ergebnis ist, wird es als 0 codiert, und wenn es nicht erfolgreich oder fehlgeschlagen ist, wird es als 0 codiert.

Einfach ausgedrückt kann die binäre logistische Regression verwendet werden, um die Wahrscheinlichkeit, dass es sich um einen Fall handelt, sorgfältig und genau vorherzusagen, basierend auf den Werten der Prädiktoren oder unabhängigen Variablen.

Fähigkeiten der binären logistischen Regression – Arten von Fragen, die sie beantworten kann

Wie oben erwähnt, eignet sich die binäre logistische Regression ideal für Szenarien, in denen die Ausgabe zu einer der beiden Klassen oder Gruppen gehören kann. Aus diesem Grund ist die binäre logistische Regression am besten geeignet, um Fragen der folgenden Art zu beantworten:

  • Ändert sich die Wahrscheinlichkeit an Krebs zu erkranken mit jedem zusätzlichen KG Übergewicht?
  • Ändert sich die besagte Wahrscheinlichkeit für jede Packung Zigaretten, die pro Tag geraucht wird?
  • Beeinflussen Körpergewicht, Fettaufnahme, Kalorienaufnahme und Alter die Wahrscheinlichkeit, einen Herzinfarkt zu erleiden?

Wie Sie sehen können, können die Antworten auf alle drei oben genannten Fragen entweder ja oder nein, 0 oder 1 lauten. Die binäre logistische Regression kann daher verwendet werden, um diese Fragen präzise zu beantworten.

Hauptannahme der binären logistischen Regression

Wie jeder andere Algorithmus für maschinelles Lernen basiert auch die binäre logistische Regression auf einigen Annahmen. Hier sind die:

  • Die abhängige Variable ist dichotom. Das heißt, es ist entweder vorhanden oder abwesend, aber niemals beides gleichzeitig.
  • Es sollten keine Ausreißer in den Daten vorhanden sein.
  • Zwischen den verschiedenen Prädiktoren sollte keine hohe Korrelation oder Multikollinearität bestehen. Dies kann anhand einer Korrelationsmatrix zwischen verschiedenen Prädiktoren bewertet werden.

Abschließend

Die binäre logistische Regression hilft bei vielen Anwendungsfällen des maschinellen Lernens. Von der Ermittlung von Kreditsäumigen bis hin zur Unterstützung von Unternehmen bei der Kundenbindung – die binäre logistische Regression kann erweitert werden, um auch komplexere Geschäftsprobleme zu lösen. Sie sollten jedoch bedenken, dass dies nur eine der vielen Algorithmentechniken des maschinellen Lernens ist. Sobald Sie die Regressionsanalyse beherrschen, sind Sie auf dem Weg, sich mit komplexeren und nuancierteren Themen zu befassen.

Wenn Sie jedoch immer noch Schwierigkeiten haben, die Regressionsanalyse zu verstehen und Ihre Reise zum maschinellen Lernen zu beginnen, empfehlen wir Ihnen unsere Liste der Kurse zum maschinellen Lernen . Bei upGrad haben wir eine Lernbasis in über 85 Ländern mit über 40.000 bezahlten Lernenden weltweit, und unsere Programme haben mehr als 500.000 Berufstätige beeinflusst.

Unser Master of Science in maschinellem Lernen und künstlicher Intelligenz , der in Zusammenarbeit mit der Liverpool John Moores University angeboten wird, soll Lernenden dabei helfen, bei Null anzufangen und sich genug Wissen anzueignen, um an realen Projekten zu arbeiten. Unsere 360-Grad-Karriereunterstützung stellt sicher, dass Sie bestens darauf vorbereitet sind, Spitzenpositionen in der Branche zu übernehmen. Wenden Sie sich noch heute an uns und erleben Sie die Kraft des Peer-Learning und der globalen Vernetzung!

Wofür wird das Bayessche Statistikmodell verwendet?

Bayessche statistische Modelle basieren auf mathematischen Verfahren und verwenden das Konzept der Wahrscheinlichkeit, um statistische Probleme zu lösen. Sie liefern den Beweis dafür, dass Menschen sich auf neue Daten verlassen und Prognosen auf der Grundlage von Modellparametern treffen können.

Was ist Bayessche Inferenz?

Es ist eine nützliche Technik in der Statistik, bei der wir uns auf neue Daten und Informationen stützen, um die Wahrscheinlichkeit für eine Hypothese unter Verwendung des Satzes von Bayes zu aktualisieren.

Sind Bayes'sche Modelle einzigartig?

Bayes'sche Modelle sind insofern einzigartig, als allen Parametern in einem statistischen Modell, ob beobachtet oder unbeobachtet, eine gemeinsame Wahrscheinlichkeitsverteilung zugewiesen wird.