用現實生活應用解釋條件概率
已發表: 2021-09-28目錄
什麼是條件概率?
在概率論中,條件概率被定義為一個事件發生的可能性的度量,假設另一個事件或結果之前已經發生過。 它表示為先前發生的事件的概率與連續發生的條件事件的概率的乘積。
因此,如果我們有 P(B)>0 的事件 A 和 B,我們計算 B 已經發生時 A 的條件概率,P(A | B) 為
P(A | B)=P(A∩B)P(B)
- | 用於表示“發生另一個事件的情況”中的“給定”
- ∩ 用於表示交集
在計算條件概率時,假設我們知道事件 B 的結果。這特別有用,因為實驗結果的信息通常是未知的。
讓我們通過一個例子來理解這一點:
- 我們有一個事件 A,我們假設已申請大學的個人將被接受。 他們被接受的概率是70%。
- 我們還有另一個活動 B,被錄取的學生有 50% 的機會被分配到宿舍。
因此,我們將條件概率計算為,
概率(錄取的學生和分配的宿舍)= P(分配的宿舍 | 錄取的學生)× P(錄取的學生)
= (0.50)*(0.70) = 0.35
使用條件概率,我們正在研究事件 A 和 B,以及他們之間的關係,其中學生都被大學錄取並被分配宿舍。
相反,無條件概率被定義為衡量一個事件發生的概率,無論它是否先於另一個事件或有其他條件。
條件概率的實際應用
條件概率在保險和微積分等不同領域得到廣泛應用。 它也適用於政治。 讓我們假設有一個預期的總統連任。 結果將取決於有資格投票的人的偏好以及電視廣告活動結果的可能性。
在另一個示例中,假設您所在地區下雨的概率為 40%,具體取決於天氣。 然而,這一結果在很大程度上取決於:
- 您所在地區是否有云形成
- 冷鋒是否有可能抵達您所在的地區
- 雲是否被另一條鋒線推開
條件概率將取決於上述每個事件。
貝葉斯定理
由數學家托馬斯貝葉斯介紹,貝葉斯定理或貝葉斯規則或貝葉斯定律是一個有助於計算條件概率的數學方程。 使用貝葉斯定理,我們可以在新證據或附加信息出現時修改(更新)現有的概率度量。
貝葉斯定理在財務中得到應用,會計師使用它來確定向借款人借錢的風險。 除此之外,它在統計和歸納邏輯中也很有用。
貝葉斯統計基於貝葉斯定理,可以根據新證據預測事件,從而產生更加動態和準確的估計。
加入來自世界頂級大學的在線機器學習課程——碩士、高級管理人員研究生課程和 ML 和 AI 高級證書課程,以加快您的職業生涯。
Python 條件概率示例
在此示例中,我們將使用條件概率來確定學生在物理中獲得 A 級 (80%+) 的概率,前提是他們至少跳過 10 節課。
首先,檢查您從kaggle下載的數據集:
將熊貓導入為 pd
df = pd.read_csv('student-alcohol-consumption/student-mat.csv')
df.head(3)
遍歷記錄數:
長度(df)
#=> 395
我們只會考慮以下列:缺勤次數和最終成績。
現在,創建一個新的布爾列grade_A 來顯示學生的最終分數是否為 80% 或更高。
乘以 5:
df['grade_A'] = np.where(df['G3']*5 >= 80, 1, 0)
創建一個新的布爾列 high_absense ,其值為 1 表示至少錯過了 10 節課的學生。
df['high_absenses'] = np.where(df['absences'] >= 10, 1, 0)
創建另一列,以便我們可以輕鬆構建數據透視表:
df['count'] = 1
刪除所有其他列:
df = df[['grade_A','high_absenses','count']]
df.head()
構建數據透視表:
pd.pivot_table(
df,
值='計數',
索引=['grade_A'],
列=['high_absenses'],
aggfunc=np.size,
填充值=0
)
現在,我們可以繼續我們的計算:
- P(A) 表示學生獲得 A 級(80% 或更高)的概率。
- P(B) 是學生至少錯過 10 節課的概率。
- P(A|B) 是學生在至少錯過 10 節課的情況下獲得 80% 以上成績的概率。
P(A) = (35 + 5) / (35 + 5 + 277 + 78) = 0.10126…
P(B) = (78 + 5) / (35 + 5 + 277 + 78) = 0.21012…
P(A ∩ B) = 5 / (35 + 5 + 277 + 78) = 0.0126582…
P(A|B) = P(A ∩ B) / P(B) = 0.06
根據我們的計算,如果學生錯過了至少 10 節課,他/她獲得 80% 以上成績的概率至少為 6%。
獨立事件的條件概率
我們也有事件,比如 A 和 B,它們都是獨立的事件,這意味著事件 A 的發生與事件 B 的發生無關。
在這種情況下,條件概率 P(B|A) 本質上是 P(B)。
P(B|A)= P(B)
類似地,條件概率 P(A|B) 本質上是 P(A)。
P(A|B)= P(A)
互斥事件的條件概率
根據概率論,當我們談論不能同時發生的事件時,我們談論的是互斥的。 簡單來說,如果事件 A 發生了,事件 B 不可能同時發生。 因此,在這種情況下,概率始終為零。
P(B|A)= 0 和 P(A|B)= 0
全概率定律
我們使用乘法規則來確定複雜情況的概率。
根據乘法規則,假設事件 F 已經被觀察到,我們通過乘以觀察事件 F 和觀察事件 E 的概率來計算事件 E 和 F 的概率,這兩個事件都是觀察事件。
P( E1 ⋂ E2 ⋂….. ⋂En)=P( E1) P(E2 | E1)…………P(En | E1…………En-1)
現在,假設我們有一個包含三個不相交事件 X、Y、Z 的樣本空間 S。因此,
P(A)=P(A ⋂ X) +P(A ⋂ Y) +P(A ⋂ Z)
現在,根據乘法規則,總概率定律可以表示為
P(A)= P(A|X) P(X) +P(A|Y) P(Y) +P(A|Z) P(Z)
結論
了解條件概率對於掌握使用貝葉斯定理進行的複雜概率估計是必要的。 如果您想深入了解條件概率和貝葉斯定理,我們建議您加入我們的IIT 機器學習高級證書課程。
upGrad 的 40,000+ 平台為頂級公司的點對點協作和 360° 工作協助提供了機會。 通過實踐項目、案例研究、現場講座的嚴格培訓,學生可以掌握複雜的概率概念,並利用它們部署機器學習模型。
引領人工智能驅動的技術革命。 現在申請!
什麼是聯合概率?
它是衡量兩個事件在同一時間點同時發生的概率。 簡單來說,聯合概率就是事件 B 與事件 A 在同一時間點發生的可能性。
條件概率是否可交換?
它不是可交換的。
什麼是條件概率?
條件概率使基於依賴於第一原理的條件證據更容易估計事件的概率。