Объяснение условной вероятности с помощью приложений из реальной жизни

Опубликовано: 2021-09-28

Оглавление

Что такое условная вероятность?

Условная вероятность в теории вероятностей определяется как мера вероятности наступления события при условии, что ранее произошло другое событие или исход. Он выражается как произведение вероятности ранее произошедшего события на вероятность условного события, произошедшего вслед за ним.

Итак, если у нас есть события A и B, где P(B)>0, мы вычисляем условную вероятность A, когда B уже произошло, P(A | B) как

Р(А | В)=Р(А∩В)Р(В)

  • | используется для обозначения «дано» в «случаях, когда происходит другое событие»
  • ∩ используется для обозначения пересечения

При вычислении условной вероятности предполагается, что мы знаем об исходе события B. Это особенно полезно, поскольку информация об исходе эксперимента часто неизвестна.

Давайте разберем это на примере:

  • У нас есть событие A, где мы предполагаем, что человек, подавший заявку в университет, будет принят. Вероятность их принятия составляет 70%.
  • У нас есть еще одно событие B, где есть 50% шанс, что принятые студенты получат общежитие.

Следовательно, мы вычисляем условную вероятность как,

Вероятность (прием студентов и размещение в общежитии) = P (прием общежития | прием студентов) × P (принятие студентов)

= (0,50) * (0,70) = 0,35

С условной вероятностью мы рассматриваем оба события А и Б, их взаимосвязь между собой, когда студент и принимается в университет, и получает общежитие.

Напротив, безусловная вероятность определяется как мера вероятности того, что событие произойдет независимо от того, предшествует ли ему другое событие или есть ли другие условия.

Реальные приложения условной вероятности

Условная вероятность находит широкое применение в различных областях, таких как страхование и исчисление. Это применимо и в политике. Предположим, ожидается переизбрание президента. Результаты будут зависеть от предпочтений тех, кто имеет право голоса, и вероятности исхода телевизионной рекламной кампании.

В другом примере предположим, что вероятность дождя в вашем районе составляет 40 %, как указано погодой. Однако этот результат во многом зависит от:

  • Формируются ли облака в вашем районе
  • Есть ли вероятность прихода холодного фронта в ваш район
  • Отталкивает ли облака другой фронт

Условная вероятность будет зависеть от каждого из вышеперечисленных событий.

Теорема Байеса

Представленная математиком Томасом Байесом теорема Байеса, или правило Байеса, или закон Байеса — это математическое уравнение, которое помогает рассчитать условную вероятность. Используя теорему Байеса, мы можем пересматривать (обновлять) существующие меры вероятности, когда появляются новые доказательства или дополнительная информация.

Теорема Байеса находит применение в финансах, где бухгалтеры используют ее для определения риска ссуды денег заемщику. В дополнение к этому, это также полезно в статистике и индуктивной логике.

Байесовская статистика основана на теореме Байеса, где можно предсказывать события на основе новых данных, что приводит к более динамичным и точным оценкам.

Присоединяйтесь к онлайн-курсу по машинному обучению в ведущих университетах мира — магистерским программам, программам последипломного образования для руководителей и программам повышения квалификации в области машинного обучения и искусственного интеллекта, чтобы ускорить свою карьеру.

Пример условной вероятности с Python

В этом примере мы будем использовать условную вероятность, чтобы определить вероятность того, что учащийся получит пятерку (80%+) по физике при условии, что он пропустит минимум 10 занятий.

Для начала проверьте набор данных, который вы загружаете с kaggle :

импортировать панд как pd

df = pd.read_csv('студент-потребление алкоголя/студент-мат.csv')

дф.голова(3)

Пройдитесь по количеству записей:

длина (df)

#=> 395

Мы будем учитывать только следующие столбцы: количество пропусков и итоговые оценки.

Теперь создайте новый логический столбецgrade_A, чтобы показать, составляет ли окончательная оценка учащегося 80 % или выше.

Умножить на 5:

df['grade_A'] = np.where(df['G3']*5 >= 80, 1, 0)

Создайте новый логический столбец high_absenses со значением 1, обозначающий учащихся, пропустивших минимум 10 занятий.

df['high_absenses'] = np.where(df['отсутствия'] >= 10, 1, 0)

Создайте еще один столбец, чтобы мы могли легко построить сводную таблицу:

дф['количество'] = 1

Удалите все остальные столбцы:

df = df[['grade_A','high_absenses','count']]

дф.голова()

Построение сводной таблицы:

pd.pivot_table(

дф,

значения = 'количество',

индекс = ['класс_A'],

столбцы = ['high_absenses'],

aggfunc=np.size,

fill_value=0

)

Теперь мы можем перейти к нашему расчету:

  • P(A) обозначает вероятность того, что учащийся получит оценку A (80% или выше).
  • P(B) — вероятность того, что учащийся пропустил минимум 10 занятий.
  • P(A|B) — это вероятность того, что учащийся набрал 80%+ оценок при условии, что он/она пропустил минимум 10 занятий.

Р(А) = (35 + 5) / (35 + 5 + 277 + 78) = 0,10126…

P(B) = (78 + 5) / (35 + 5 + 277 + 78) = 0,21012…

P(A ∩ B) = 5/(35 + 5 + 277 + 78) = 0,0126582…

P(A|B) = P(A ∩ B) / P(B) = 0,06

По нашим расчетам, вероятность того, что учащийся набрал оценку 80%+, при условии, что он/она пропустил минимум 10 занятий, составляет не менее 6%.

Условная вероятность независимых событий

У нас также есть события, скажем, A и B, где оба являются независимыми событиями, а это означает, что возникновение события A не связано с возникновением события B.

В таком случае условная вероятность P(B|A) по существу равна P(B).

П(В|А)= П(В)

Точно так же условная вероятность P (A | B) по существу равна P (A).

Р(А|В)= Р(А)

Условная вероятность взаимоисключающих событий

Согласно теории вероятностей, когда мы говорим о событиях, которые не могут произойти одновременно, мы говорим о взаимоисключающих. Проще говоря, если произошло событие А, событие Б не может произойти одновременно. Поэтому в таких случаях вероятность всегда равна нулю.

P(B|A)= 0 и P(A|B)= 0

Закон полной вероятности

Мы используем правило умножения для определения вероятности сложных случаев.

Согласно правилу умножения, мы вычисляем вероятность событий E и F, оба из которых являются событиями наблюдения, путем умножения вероятности события наблюдения F и события наблюдения E, учитывая, что событие F уже наблюдалось.

P( E1 ⋂ E2 ⋂….. ⋂En)=P( E1) P(E2 | E1)………P(En | E1…………En-1)

Теперь предположим, что у нас есть выборочное пространство S, содержащее три непересекающихся события X, Y, Z. Следовательно ,

Р (А) = Р (А ⋂ Х) + Р (А ⋂ Y) + Р (А ⋂ Z)

Теперь, согласно правилу умножения, закон полной вероятности можно выразить как

P(A)= P(A|X) P(X) +P(A|Y) P(Y) +P(A|Z) P(Z)

Заключение

Понимание условной вероятности необходимо для освоения сложных оценок вероятности, которые выполняются с использованием теоремы Байеса. Если вы хотите подробно изучить условную вероятность и теорему Байеса, мы рекомендуем присоединиться к нашей программе сертификации IIT-Advanced по машинному обучению .

Платформа upGrad, насчитывающая более 40 000 человек, предоставляет возможности для однорангового сотрудничества и всесторонней помощи в трудоустройстве в ведущих фирмах. Благодаря тщательному обучению с помощью практических проектов, тематических исследований и лекций в прямом эфире студенты могут освоить сложные концепции вероятности и использовать их для развертывания моделей машинного обучения.

Возглавьте технологическую революцию, основанную на искусственном интеллекте. Применить сейчас!

Что такое Совместная вероятность?

Это мера вероятности двух событий, происходящих одновременно в один и тот же момент времени. Проще говоря, совместная вероятность – это вероятность того, что событие В произойдет в тот же момент времени, что и событие А.

Является ли условная вероятность коммутативной или нет?

Это не коммутативно.

Зачем нужна условная вероятность?

Условная вероятность упрощает оценку вероятности события на основе условного свидетельства, которое зависит от первых принципов.