二元邏輯回歸:概述、能力和假設

已發表: 2021-10-05

機器學習最被接受的定義之一是這樣的:

“如果計算機程序在任務 T 中的性能(以 P 衡量)隨著經驗 E 而提高,則可以說計算機程序從經驗 E 中學習某類任務 T 和性能度量 P。”

現在,為了隨著時間的推移提高機器在同一類任務上的性能,使用不同的算法來優化機器的輸出並使其更接近預期的結果。 回歸分析是使機器提高性能的基本和最常用的技術之一。

它由一系列機器學習技術組成,用於根據一個或多個預測變量的值來預測連續輸出變量。 回歸分析旨在開發一個數學方程,可以將連續變量定義為預測變量的函數。

在我們之前的一篇文章中,我們研究了邏輯回歸以及如何在 Python 中實現邏輯回歸。 我們還簡要討論了機器學習中三種不同的邏輯回歸。 在本文中,讓我們稍微詳細地介紹一下二元邏輯回歸及其概述、功能和假設。

目錄

二元邏輯回歸概述

二元或二項式 Logistic 回歸可以理解為處理其中因變量的觀察結果只能是二元的場景的 Logistic 回歸類型,即它只能有兩種可能的類型。 這兩種類型可以是 0 或 1,通過或失敗,死或活,贏或輸,等等。

多項 Logistic 回歸適用於結果可能有兩種以上的可能類型——疾病 A、疾病 B 和疾病 C——它們沒有任何特定順序的情況。 另一種邏輯回歸是有序邏輯回歸,它以有序的方式處理因變量。

在二元邏輯回歸中,可能的輸出通常定義為 0 或 1,因為這會導致對回歸模型最直接的解釋和理解。 如果任何因變量的特定結果是成功或值得注意的結果,則將其編碼為 0,如果它不成功或失敗,則將其編碼為 0。

簡單來說,二元邏輯回歸可用於根據預測變量或自變量的值仔細準確地預測成為案例的機率。

二元邏輯回歸的能力——它可以回答的問題類型

如上所述,二元邏輯回歸非常適合輸出可以屬於兩個類或組中的任何一個的場景。 因此,二元邏輯回歸最適合回答以下性質的問題:

  • 一個人超重每增加一公斤,患癌症的可能性就會改變嗎?
  • 每天抽的每包香煙的上述概率是否不同?
  • 體重、脂肪攝入量、卡路里攝入量和年齡會影響心髒病發作的可能性嗎?

如您所見,以上三個問題的答案可以是是或否,0 或 1。因此可以使用二元邏輯回歸來精確回答這些問題。

二元邏輯回歸的主要假設

與任何其他機器學習算法一樣,二元邏輯回歸也適用於一些假設。 以下是那些:

  • 因變量是二分的。 也就是說,它要么存在要么不存在,但絕不會同時存在。
  • 數據中不應存在異常值。
  • 不同預測變量之間不應存在高度相關或多重共線性。 這可以使用不同預測變量之間的相關矩陣來評估。

綜上所述

二元邏輯回歸有助於跨越許多機器學習用例。 從找出貸款違約者到協助企業留住客戶——二元邏輯回歸可以擴展到解決更複雜的業務問題。 但是,您應該記住,這只是機器學習算法技術的海洋之一。 一旦你掌握了回歸分析,你就可以處理更複雜和微妙的話題了。

但是,如果您仍在努力理解回歸分析並開始您的機器學習之旅,我們向您推薦我們的機器學習課程列表 在 upGrad,我們在 85 多個國家/地區擁有學習者基礎,在全球擁有 40,000 多名付費學習者,我們的計劃影響了超過 500,000 名在職專業人士。

我們與利物浦約翰摩爾斯大學合作開設的機器學習和人工智能理學碩士課程旨在幫助學習者從零開始,並獲得足夠的知識來從事現實生活中的項目。 我們的 360 度職業幫助將確保您充分準備好在行業中擔任頂級職位。 所以今天就聯繫我們,體驗同行學習和全球網絡的力量!

貝葉斯統計模型有什麼用?

貝葉斯統計模型基於數學程序並採用概率概念來解決統計問題。 它們為人們依賴新數據並根據模型參數進行預測提供了證據。

什麼是貝葉斯推理?

這是統計學中的一種有用技術,我們依靠新數據和信息來使用貝葉斯定理更新假設的概率。

貝葉斯模型是獨一無二的嗎?

貝葉斯模型的獨特之處在於統計模型中的所有參數,無論它們是觀察到的還是未觀察到的,都被分配了一個聯合概率分佈。