您需要了解的不同類型的回歸模型

已發表: 2022-01-07

回歸問題在機器學習中很常見,解決它們的最常用技術是回歸分析。 它基於數據建模,涉及找出最佳擬合線,該線穿過所有數據點,使線與每個數據點之間的距離最小。 雖然存在許多不同的回歸分析技術,但線性回歸和邏輯回歸是最突出的。 我們使用的回歸分析模型的類型最終將取決於所涉及數據的性質。

讓我們進一步了解回歸分析和不同類型的回歸分析模型。

目錄

什麼是回歸分析?

回歸分析是一種預測建模技術,用於確定數據集中因(目標)變量和自變量之間的關係。 它通常在目標變量包含連續值且因變量和自變量共享線性或非線性關係時使用。 因此,回歸分析技術可用於確定變量之間的因果關係、時間序列建模和預測。 例如,可以使用回歸分析最好地研究公司的銷售和廣告支出之間的關係。

回歸分析的類型

我們可以使用許多不同類型的回歸分析技術來進行預測。 此外,每種技術的使用都受到諸如自變量數量、回歸線形狀和因變量類型等因素的驅動。

讓我們了解一些最常用的回歸分析方法:

1. 線性回歸

線性回歸是最廣為人知的建模技術,它假設因變量 (Y) 和自變量 (X) 之間存在線性關係。 它使用回歸線(也稱為最佳擬合線)建立這種線性關係。 線性關係由方程 Y = c+m*X + e 表示,其中“c”是截距,“m”是直線的斜率,“e”是誤差項。

線性回歸模型可以是簡單的(具有一個因變量和一個自變量)或多個(具有一個因變量和多個自變量)。

資源

2. 邏輯回歸

當因變量是離散的時,可以使用邏輯回歸分析技術。 換句話說,該技術用於估計互斥事件的概率,例如通過/失敗、真/假、0/1 等。因此,目標變量只能具有兩個值之一,而 sigmoid 曲線表示它與自變量的關係。 概率值介於 0 和 1 之間。

資源

3. 多項式回歸

多項式回歸分析技術對因變量和自變量之間的非線性關係建模。 它是多元線性回歸模型的修改形式,但通過所有數據點的最佳擬合線是彎曲的而不是直線的。

資源

4. 嶺回歸

當數據顯示多重共線性時,使用嶺回歸分析技術; 也就是說,自變量高度相關。 儘管多重共線性中的最小二乘估計是無偏的,但它們的方差大到足以使觀察值偏離真實值。 嶺回歸通過在回歸估計中引入一定程度的偏差來最小化標準誤差。

嶺回歸方程中的 lambda (λ) 解決了多重共線性問題。

資源

資源

5. 套索回歸

與嶺回歸一樣,套索(最小絕對收縮和選擇算子)回歸技術會懲罰回歸係數的絕對大小。 此外,套索回歸技術使用變量選擇,這導致係數值向絕對零收縮。

資源

6.分位數回歸

分位數回歸分析技術是線性回歸分析的擴展。 當不滿足線性回歸的條件或數據存在異常值時使用。 分位數回歸在統計學和計量經濟學中得到應用。

資源

7. 貝葉斯線性回歸

貝葉斯線性回歸是機器學習中的一種回歸分析技術,它利用貝葉斯定理來確定回歸係數的值。 這種技術不是找出最小二乘,而是確定特徵的後驗分佈。 因此,該技術比簡單的線性回歸具有更高的穩定性。

資源

8. 主成分回歸

主成分回歸技術通常用於分析具有多重共線性的多重回歸數據。 與嶺回歸技術一樣,主成分回歸方法通過對回歸估計施加一定程度的偏差來最小化標準誤差。 該技術有兩個步驟——首先,將主成分分析應用於訓練數據,然後使用轉換後的樣本來訓練回歸量。

9. 偏最小二乘回歸

偏最小二乘回歸技術是一種快速有效的基於協方差的回歸分析技術。 對於自變量數量較多且變量之間可能存在多重共線性的回歸問題,它是有益的。 該技術將變量減少為一組較小的預測變量,然後用於執行回歸。

10. 彈性網絡回歸

彈性網絡回歸技術是嶺回歸模型和套索回歸模型的混合體,在處理高度相關的變量時非常有用。 它使用嶺回歸和套索回歸方法的懲罰來正則化回歸模型。

資源

概括

除了我們在這裡討論的回歸分析技術之外,機器學習中還使用了其他幾種類型的回歸模型,例如生態回歸、逐步回歸、折刀回歸和穩健回歸。 所有這些不同類型的回歸技術的具體用例取決於可用數據的性質和可以達到的準確度水平。 總體而言,回歸分析有兩個核心優勢。 這些如下:

  • 它表示因變量和自變量之間的關係。
  • 它顯示了自變量對因變量的影響強度。

前進方向:獲得機器學習和人工智能理學碩士學位

您是否正在尋找一個全面的在線計劃來為機器學習和人工智能事業做好準備?

upGrad與利物浦約翰摩爾斯大學和 IIIT 班加羅爾聯合提供機器學習和人工智能理學碩士學位,以培養多才多藝的人工智能專業人士和數據科學家。

為期 20 個月的綜合在線課程專為希望掌握深度學習、NLP、圖形模型、強化學習等高級概念和技能的在職專業人士而設計。 此外,該計劃旨在提供堅實的統計學基礎以及 Python、Keras、TensorFlow、Kubernetes、MySQL 等關鍵編程語言和工具。

節目亮點:

  • 利物浦約翰摩爾斯大學碩士學位
  • 來自 IIIT 班加羅爾的執行 PGP
  • 40 多個現場會議、12 多個案例研究和項目、11 個編碼作業、六個頂點項目
  • 25+ 場與行業專家的指導課程
  • 360 度的職業幫助和學習支持
  • 點對點網絡機會

upGrad 擁有世界一流的教師、教學法、技術和行業專家,已成為南亞最大的高等教育科技平台,並影響了全球 500,000 多名在職專業人士。 今天註冊 成為 upGrad 遍布 80 多個國家/地區的 40,000 多名全球學習者群的一員!

1.什麼是回歸測試定義?

回歸測試被定義為一種軟件測試,用於驗證軟件中的代碼更改是否對現有產品的功能沒有影響。 它確保產品在新功能或對其現有功能的任何更改方面表現良好。 回歸測試涉及對先前執行的測試用例的部分或全部選擇,這些測試用例被重新執行以檢查現有功能的工作條件。

回歸模型的目的是什麼?

回歸分析是出於兩個目的之一進行 - 在有關自變量的一些信息可用的情況下預測因變量的值或預測自變量對因變量的影響。

回歸分析是出於兩個目的之一進行 - 在有關自變量的一些信息可用的情況下預測因變量的值或預測自變量對因變量的影響。

適當的樣本量對於確保結果的準確性和有效性至關重要。 儘管沒有經驗法則來確定回歸分析中的適當樣本量,但一些研究人員認為每個變量至少有 10 個觀察值。 因此,如果我們使用三個自變量,最小樣本量將是 30。許多研究人員還遵循統計公式來確定樣本量。