用现实生活应用解释条件概率

已发表: 2021-09-28

什么是条件概率？

在概率论中，条件概率被定义为一个事件发生的可能性的度量，假设另一个事件或结果之前已经发生过。它表示为先前发生的事件的概率与连续发生的条件事件的概率的乘积。

因此，如果我们有 P(B)>0 的事件 A 和 B，我们计算 B 已经发生时 A 的条件概率，P(A | B) 为

P(A | B)=P(A∩B)P(B)

| 用于表示“发生另一个事件的情况”中的“给定”
∩ 用于表示交集

在计算条件概率时，假设我们知道事件 B 的结果。这特别有用，因为实验结果的信息通常是未知的。

让我们通过一个例子来理解这一点：

我们有一个事件 A，我们假设已申请大学的个人将被接受。他们被接受的概率是70%。
我们还有另一个活动 B，被录取的学生有 50% 的机会被分配到宿舍。

因此，我们将条件概率计算为，

概率（录取的学生和分配的宿舍）= P（分配的宿舍 | 录取的学生）× P（录取的学生）

= (0.50)*(0.70) = 0.35

使用条件概率，我们正在研究事件 A 和 B，以及他们之间的关系，其中学生都被大学录取并被分配宿舍。

相反，无条件概率被定义为衡量一个事件发生的概率，无论它是否先于另一个事件或有其他条件。

条件概率的实际应用

条件概率在保险和微积分等不同领域得到广泛应用。它也适用于政治。让我们假设有一个预期的总统连任。结果将取决于有资格投票的人的偏好以及电视广告活动结果的可能性。

在另一个示例中，假设您所在地区下雨的概率为 40%，具体取决于天气。 然而，这一结果在很大程度上取决于：

您所在地区是否有云形成
冷锋是否有可能抵达您所在的地区
云是否被另一条锋线推开

条件概率将取决于上述每个事件。

贝叶斯定理

由数学家托马斯贝叶斯介绍，贝叶斯定理或贝叶斯规则或贝叶斯定律是一个有助于计算条件概率的数学方程。使用贝叶斯定理，我们可以在新证据或附加信息出现时修改（更新）现有的概率度量。

贝叶斯定理在财务中得到应用，会计师使用它来确定向借款人借钱的风险。除此之外，它在统计和归纳逻辑中也很有用。

贝叶斯统计基于贝叶斯定理，可以根据新证据预测事件，从而产生更动态和更准确的估计。

加入来自世界顶级大学的在线机器学习课程——硕士、高级管理人员研究生课程和 ML 和 AI 高级证书课程，以加快您的职业生涯。

Python 条件概率示例

在此示例中，我们将使用条件概率来确定学生在物理中获得 A 级 (80%+) 的概率，前提是他们至少跳过 10 节课。

首先，检查您从kaggle下载的数据集：

将熊猫导入为 pd

df = pd.read_csv('student-alcohol-consumption/student-mat.csv')

df.head(3)

遍历记录数：

长度（df）

#=> 395

我们只会考虑以下列：缺勤次数和最终成绩。

现在，创建一个新的布尔列grade_A 来显示学生的最终分数是否为 80% 或更高。

乘以 5：

df['grade_A'] = np.where(df['G3']*5 >= 80, 1, 0)

创建一个新的布尔列 high_absense ，其值为 1 表示至少错过了 10 节课的学生。

df['high_absenses'] = np.where(df['absences'] >= 10, 1, 0)

创建另一列，以便我们可以轻松构建数据透视表：

df['count'] = 1

删除所有其他列：

df = df[['grade_A','high_absenses','count']]

df.head()

构建数据透视表：

pd.pivot_table（

df,

值='计数'，

索引=['grade_A'],

列=['high_absenses'],

aggfunc=np.size，

填充值=0

)

现在，我们可以继续我们的计算：

P(A) 表示学生获得 A 级（80% 或更高）的概率。
P(B) 是学生至少错过 10 节课的概率。
P(A|B) 是学生在至少错过 10 节课的情况下获得 80% 以上成绩的概率。

P(A) = (35 + 5) / (35 + 5 + 277 + 78) = 0.10126…

P(B) = (78 + 5) / (35 + 5 + 277 + 78) = 0.21012…

P(A ∩ B) = 5 / (35 + 5 + 277 + 78) = 0.0126582…

P(A|B) = P(A ∩ B) / P(B) = 0.06

根据我们的计算，如果学生错过了至少 10 节课，他/她获得 80% 以上成绩的概率至少为 6%。

独立事件的条件概率

我们也有事件，比如 A 和 B，它们都是独立的事件，这意味着事件 A 的发生与事件 B 的发生无关。

在这种情况下，条件概率 P(B|A) 本质上是 P(B)。

P(B|A)= P(B)

类似地，条件概率 P(A|B) 本质上是 P(A)。

P(A|B)= P(A)

互斥事件的条件概率

根据概率论，当我们谈论不能同时发生的事件时，我们谈论的是互斥的。简单来说，如果事件 A 发生了，事件 B 不可能同时发生。 因此，在这种情况下，概率始终为零。

P(B|A)= 0 和 P(A|B)= 0

全概率定律

我们使用乘法规则来确定复杂情况的概率。

根据乘法规则，假设事件 F 已经被观察到，我们通过乘以观察事件 F 和观察事件 E 的概率来计算事件 E 和 F 的概率，这两个事件都是观察事件。

P( E1 ⋂ E2 ⋂….. ⋂En)=P( E1) P(E2 | E1)…………P(En | E1…………En-1)

现在，假设我们有一个包含三个不相交事件 X、Y、Z 的样本空间 S。因此，

P(A)=P(A ⋂ X) +P(A ⋂ Y) +P(A ⋂ Z)

现在，根据乘法规则，总概率定律可以表示为

P(A)= P(A|X) P(X) +P(A|Y) P(Y) +P(A|Z) P(Z)

结论

了解条件概率对于掌握使用贝叶斯定理进行的复杂概率估计是必要的。如果您想深入了解条件概率和贝叶斯定理，我们建议您加入我们的IIT 机器学习高级证书课程。

upGrad 的 40,000+ 平台为顶级公司的点对点协作和 360° 工作协助提供了机会。通过实践项目、案例研究、现场讲座的严格培训，学生可以掌握复杂的概率概念，并利用它们部署机器学习模型。

引领人工智能驱动的技术革命。现在申请！

什么是联合概率？

它是衡量两个事件在同一时间点同时发生的概率。简单来说，联合概率就是事件 B 与事件 A 在同一时间点发生的可能性。

条件概率是否可交换？

它不是可交换的。

什么是条件概率？

条件概率使基于依赖于第一原理的条件证据更容易估计事件的概率。