協方差與相關性:[您需要知道的一切]

已發表: 2021-11-05

在機器學習和人工智能等技術的幫助下解釋數據時,需要進行大量的排列組合。 它有助於預測不同情況下的不同結果。 這些排列和組合是在變量的幫助下廣泛完成的。

變量是可以在數據集中測量的項目、數量或數字。 這個項目或數量不是固定的,可以通過內部或外部因素在不同情況下發生變化。 每當元素的確切值未知時,我們將其稱為變量。 因此,變量通常被稱為未知量的佔位符。 變量被定義為一個可變值,它取決於計算機程序的命令或計算機和編程語言的輸入。

例如,在包含客戶購買的電子商務數據集中,客戶偏好或未來訂購特定產品的可能性是一個變量。 這取決於客戶的需求、收入、年齡和其他因素。 讓我們更多地了解變量如何發揮作用以及如何確定兩個變量之間的關係。

目錄

什麼是協方差?

協方差衡量兩個變量之間的關係或相互依賴關係。 它確定如果另一個變量更改相同的數據集,一個變量將向哪個方向移動。

協方差有兩種類型——正的和負的。 當一個變量發生變化而第二個變量向同一方向移動時,稱為正協方差。 如果第二個變量向相反方向移動,則稱為負協方差。

較高的協方差值表示兩個變量的相關性。 正協方差意味著變量成正比並且將朝相同方向移動。 負協方差值告訴我們,這兩個隨機變量是間接相關的,並且向相反的方向移動。 這意味著如果一個變量的數量增加,另一個變量的數量將減少。

什麼是相關性?

在給定的情況或數據集中可以有多個變量。 這些變量可能完全相關,也可能彼此不相關。 在確定有利結果的同時,推導出兩個變量之間的關係以保持準確性至關重要。 這被稱為相關性,一種表示兩個變量之間關係的統計量度。

相關性解釋了兩個變量之間的線性關係,並展示了一個變量在另一個變量變化時的移動。

如果有兩個變量 X 和 Y,並且 X 發生了變化,則相關性將衡量由於 X 的變化而導致的 Y 的變化。它計算 Y 會隨著 X 的變化而呈現正變化還是負變化.

與協方差類似,存在三種相關性——正相關、負相關和零相關。 在正相關中,當一個變量在圖表上上升時,另一個變量也會上升。 在負相關中,如果一個變量上升,另一個變量下降。 在正負相關中,變量按比例或線性上升和下降。 如果相關性為零,則變量不相關,不存在線性圖。

相關性是在皮爾遜係數的幫助下測量的。 相關係數的值在 -1 到 1 之間。

協方差和相關性有什麼區別?

術語協方差和相關性通常可以互換使用。 但是,它們並不相同。 人們很難弄清楚兩者之間的區別。 讓我們詳細了解協方差與相關性。

1. 它測量什麼

協方差和相關性非常相似且令人困惑。 兩者都是變量的度量。 然而,兩者之間的一個顯著區別是協方差衡量了變量之間的變化。 它說明了兩個變量如何相互關聯,以及它們是沿相同方向還是相反方向移動。 協方差不定義變量如何變化。 它只是確認變量是否相互關聯。

另一方面,變量變化的程度或程度是在相關性的幫助下確定的。 它是協方差的函數。

2. 價值觀

相關值的範圍在 -1 到 1 之間。另一方面,協方差的值可以是任意數字。 它的值介於無窮大的負冪和正冪之間。 相關性具有標準化值,而協方差的重要性並不確定。 如果我們知道協方差係數,我們可以推導出相關值。

3.規模變化

這意味著當變量乘以一個常數值時,輸出會發生變化。 尺度的變化不會影響相關性的值。 即使變量乘以常數,相關性也將保持不變。 但是,這不是協方差的情況。 它受規模變化的影響。 如果變量乘以一個常數,協方差會相應地改變。

協方差和相關在機器學習中的用途是什麼?

機器學習中有各種變量——目標變量、獨立變量、中等變量、混雜變量和控制變量。 這些變量執行不同的功能,並在 ML 算法和技術中發揮重要作用。 變量的主要工作是在算法中添加缺失值。 由於數據並不總是以結構化​​形式提供,因此可能會缺少元素。 算法不能在信息不完整的情況下運行。 因此,軟件工程師或開發人員使用機器學習中的變量來填補缺失值。

機器學習的職業機會是什麼?

機器學習和人工智能技術的關鍵組成部分之一是變量的依賴性或兩個隨機變量之間的關係。 ML 和 AI 算法通過識別兩個變量之間的關係來提供結果。 因此,如果您想在機器學習方面建立職業生涯,您必須了解協方差和相關概念。

要深入了解機器學習和人工智能,您可以報名參加upGrad的機器學習和人工智能理學碩士課程

這是面向工程師、IT 和數據專業人員的在線課程,可幫助他們獲得機器學習和 AI 知識。 該計劃還為學習者提供利物浦約翰摩爾斯大學和班加羅爾國際信息技術學院的校友身份。

該課程允許您與來自 Flipkart 和 Zee5 的行業專家建立聯繫。 您還將有機會執行大量行業項目,以獲得相關技能,例如深度學習和預測分析以及統計。

以下是機器學習和人工智能領域的兩個最佳職業機會:

1. 數據科學家

2012 年,哈佛商業評論指出,隨著對數據科學家的需求急劇增長,數據科學家是 21 世紀最性感的工作。 即使在今天,許多行業都缺乏數據科學家。 如果您發現數據很有趣,那麼您就有一份理想的高薪工作在等著您。 印度數據科學家平均年薪接近 70 萬盧比。 擁有多年專業知識的數據專業人員每年可賺取高達 170 萬盧比的收入。

2. 人工智能架構師

另一個在業界引起轟動的工作是 AI 架構師。 就像建築師為客戶提供解決方案一樣,AI 建築師也為他們的客戶提供 AI 解決方案。 他們了解客戶的需求並建議正確的技術。 人工智能架構師平均年薪為 60 萬盧比。

學習世界頂尖大學的數據科學在線課程獲得行政 PG 課程、高級證書課程或碩士課程,以加快您的職業生涯。

結論

變量在機器學習和人工智能的數據分析和決策中起著至關重要的作用。 相關性和協方差有助於確定兩個變量之間是否存在關係。 然後,公司可以預測預期的結果並做出相應的決策。 它是機器學習中最複雜但最重要的概念之一。 要獲得有關機器學習和 AI 的專業知識,您可以攻讀 upGrad 的 ML 和 AI 課程。

協方差和相關是一回事嗎?

不,協方差和相關性不是同一個概念,儘管它們密切相關。 協方差決定了兩個隨機變量之間的線性關係,相關性衡量了兩個變量之間的相關程度。

協方差和相關性在機器學習中是否相關?

是的,協方差和相關性在機器學習中是必不可少的,因為 ML 算法解釋變量之間的關係並相應地提供輸出。 因此,您必須了解協方差和相關性。

從事機器學習和人工智能職業需要哪些技能?

為了在 ML 或 AI 行業找到一份工作,您應該擅長數據分析、概率和統計、計算機編程、軟件開發、線性回歸、信號處理、自然語言處理等。