실생활 응용 프로그램으로 설명되는 조건부 확률

게시 됨: 2021-09-28

목차

조건부 확률이란 무엇입니까?

확률 이론에서 조건부 확률은 다른 사건이나 결과가 이전에 발생했다고 가정할 때 사건이 발생할 가능성의 척도로 정의됩니다. 이전에 발생한 이벤트의 확률과 연속적으로 발생한 조건부 이벤트의 확률을 곱한 값입니다.

따라서 P(B)>0인 사건 A와 B 가 있는 경우 B가 이미 발생했을 때 A의 조건부 확률을 계산합니다. P(A | B)는 다음과 같습니다.

P(A | B)=P(A∩B)P(B)

  • | "다른 사건이 발생하는 경우"에서 "주어진"을 나타내는 데 사용됩니다.
  • ∩는 교차점을 나타내는 데 사용됩니다.

조건부 확률을 계산할 때 이벤트 B의 결과를 알고 있다고 가정합니다. 이는 실험 결과에 대한 정보를 알 수 없는 경우가 많기 때문에 특히 유용합니다.

예를 들어 이것을 이해합시다.

  • 우리는 대학에 지원한 개인이 받아들여질 것이라고 가정하는 이벤트 A가 있습니다. 합격 확률은 70%입니다.
  • 합격한 학생들이 기숙사를 배정받을 확률이 50%인 또 다른 이벤트 B가 있습니다.

따라서 조건부 확률을 다음과 같이 계산합니다.

확률(합격 학생 및 기숙사 배정) = P(기숙사 배정 | 합격 학생) × P(합격 학생)

= (0.50)*(0.70) = 0.35

조건부 확률을 사용하여 이벤트 A와 B, 즉 학생이 대학에 입학하고 기숙사가 배정되는 서로의 관계를 살펴봅니다.

대조적으로, 무조건 확률은 다른 사건이 선행되거나 다른 조건이 주어지는지 여부에 관계없이 사건이 발생할 확률의 척도로 정의됩니다.

조건부 확률의 실제 적용

조건부 확률은 보험 및 미적분과 같은 다양한 분야에서 광범위하게 사용됩니다. 정치에도 적용된다. 대통령의 재선이 예상된다고 가정해 봅시다. 결과는 투표 자격이 있는 사람들의 선호도와 텔레비전 광고 캠페인 결과의 확률에 따라 달라집니다.

다른 예에서 날씨에 따라 지정된 지역에 비가 올 확률이 40%라고 가정해 보겠습니다. 그러나 이 결과는 다음에 크게 좌우됩니다.

  • 귀하의 지역에 구름이 형성되고 있는지 여부
  • 귀하의 지역에 한랭전선이 도착할 가능성이 있는지 여부
  • 구름이 또 다른 전선에 밀려 밀리고 있는지

조건부 확률은 위의 각 이벤트에 따라 다릅니다.

베이즈의 정리

수학자 Thomas Bayes가 소개한 Bayes의 정리 또는 Bayes의 규칙 또는 Bayes의 법칙은 조건부 확률을 계산하는 데 도움이 되는 수학 방정식입니다. Bayes의 정리를 사용하여 새로운 증거나 추가 정보가 나타날 때 기존 확률 측정값을 수정(업데이트)할 수 있습니다.

Bayes의 정리는 회계사가 차용자에게 돈을 빌려줄 위험을 결정하는 데 사용하는 금융에서 사용됩니다. 이 외에도 통계 및 귀납 논리에도 유용합니다.

베이지안 통계는 새로운 증거를 기반으로 이벤트를 예측할 수 있는 Bayes의 정리를 기반으로 하므로 보다 역동적이고 정확한 추정이 가능합니다.

세계 최고의 대학에서 온라인으로 머신 러닝 과정에 참여하십시오. 석사, 대학원 대학원 과정, ML 및 AI 고급 인증 프로그램을 통해 빠르게 경력을 쌓을 수 있습니다.

Python을 사용한 조건부 확률 예제

이 예에서는 조건부 확률을 사용하여 학생이 최소 10개의 수업을 건너뛴 경우 물리학에서 A 등급(80% 이상)을 받을 확률을 결정합니다.

먼저 kaggle 에서 다운로드한 데이터세트를 검사합니다 .

pandas를 pd로 가져오기

df = pd.read_csv('학생-알코올-소비/학생-매트.csv')

df.head(3)

레코드 수를 살펴보십시오.

렌(df)

#=> 395

결석 횟수 및 최종 성적 항목만 고려합니다.

이제 새 부울 열 grade_A를 만들어 학생의 최종 점수가 80% 이상인지 표시합니다.

5를 곱합니다.

df['등급_A'] = np.where(df['G3']*5 >= 80, 1, 0)

최소 10개 수업을 결석한 학생을 나타내는 값이 1인 새로운 부울 열 high_absenses를 만듭니다.

df['high_absenses'] = np.where(df['absences'] >= 10, 1, 0)

피벗 테이블을 쉽게 만들 수 있도록 다른 열을 만듭니다.

df['카운트'] = 1

다른 모든 열을 제거합니다.

df = df[['등급_A','높은_absenses','카운트']]

df.head()

피벗 테이블 만들기:

pd.pivot_table(

DF,

값 = '개수',

인덱스=['등급_A'],

열=['높은_absenses'],

aggfunc=np.size,

채우기 값=0

)

이제 계산을 진행할 수 있습니다.

  • P(A)는 학생이 A 등급(80% 이상)을 받을 확률을 나타냅니다.
  • P(B)는 학생이 최소 10개의 수업을 결석할 확률입니다.
  • P(A|B)는 학생이 최소 10개의 수업을 결석했을 때 80% 이상의 점수를 받았을 확률입니다.

P(A) = (35 + 5) / (35 + 5 + 277 + 78) = 0.10126…

P(B) = (78 + 5) / (35 + 5 + 277 + 78) = 0.21012…

P(A ∩ B) = 5 / (35 + 5 + 277 + 78) = 0.0126582…

P(A|B) = P(A ∩ B) / P(B) = 0.06

우리의 계산에 따르면 학생이 최소 10개의 수업을 결석한 경우 80% 이상의 점수를 받을 확률은 최소 6%입니다.

독립 사건의 조건부 확률

우리는 또한 사건 A와 B가 모두 독립적인 사건인 경우가 있는데, 이는 사건 A의 발생이 사건 B의 발생과 관련이 없음을 의미합니다.

이러한 경우 조건부 확률 P(B|A)는 기본적으로 P(B)입니다.

P(B|A)= P(B)

유사하게, 조건부 확률 P(A|B)는 본질적으로 P(A)입니다.

P(A|B)= P(A)

상호 배타적 사건의 조건부 확률

확률 이론에 따르면 동시에 발생할 수 없는 사건에 대해 이야기할 때 우리는 상호 배타적인 사건에 대해 이야기합니다. 간단히 말해서 사건 A가 발생했다면 사건 B는 동시에 일어날 수 없다. 따라서 이러한 경우 확률은 항상 0입니다.

P(B|A)= 0 및 P(A|B)= 0

총 확률의 법칙

복잡한 경우의 확률을 결정하기 위해 곱셈 규칙을 사용합니다.

곱셈 규칙에 따라 이벤트 F가 이미 관찰된 경우 관찰 이벤트 F와 관찰 이벤트 E의 확률을 곱하여 둘 다 이벤트를 관찰하는 이벤트 E 및 F의 확률을 계산합니다.

P( E1 ⋂ E2 ⋂… .. ⋂En)=P( E1) P(E2 | E1)…

이제 3개의 분리된 이벤트 X, Y, Z로 구성된 표본 공간 S가 있다고 가정합니다. 따라서 ,

P(A)=P(A ⋂ X) +P(A ⋂ Y) +P(A ⋂ Z)

이제 곱셈 규칙에 따라 총 확률의 법칙은 다음과 같이 표현될 수 있습니다.

P(A)= P(A|X) P(X) +P(A|Y) P(Y) +P(A| Z) P(Z)

결론

Bayes의 정리를 사용하여 수행되는 복잡한 확률 추정을 마스터하려면 조건부 확률을 이해해야 합니다. 조건부 확률과 베이즈 정리에 대해 자세히 알아보려면 기계 학습의 IIT-Advanced Certificate Program에 참여하는 것이 좋습니다 .

upGrad의 40,000개 이상의 플랫폼은 P2P 협업과 최고의 기업에서 360° 직업 지원을 위한 기회를 제공합니다. 실습 프로젝트, 사례 연구, 라이브 강의를 통한 엄격한 교육을 통해 학생들은 확률의 복잡한 개념을 마스터하고 이를 활용하여 기계 학습 모델을 배포할 수 있습니다.

AI가 주도하는 기술 혁명을 주도하십시오. 지금 신청하세요!

공동 확률이란 무엇입니까?

같은 시점에서 두 사건이 동시에 발생할 확률을 측정한 것입니다. 간단히 말해서, 결합 확률은 사건 A와 같은 시점에 사건 B가 발생할 가능성입니다.

조건부 확률은 가환성입니까?

가환성이 아닙니다.

조건부 확률이 필요한 이유는 무엇입니까?

조건부 확률을 사용하면 첫 번째 원칙에 의존하는 조건부 증거를 기반으로 사건의 확률을 더 쉽게 추정할 수 있습니다.