実際のアプリケーションで説明される条件付き確率

公開: 2021-09-28

目次

条件付き確率とは何ですか?

条件付き確率は、確率論では、別のイベントまたは結果が以前に発生したと仮定して、イベントが発生する可能性の尺度として定義されます。 これは、以前に発生したイベントの確率と、連続して発生した条件付きイベントの確率を掛け合わせたものとして表されます。

したがって、P(B)> 0であるイベントAおよびBがある場合、Bがすでに発生しているときのAの条件付き確率を計算します。P(A | B)は次のようになります。

P(A | B)= P(A∩B)P(B)

  • | 「別のイベントが発生した場合」に「与えられた」を表すために使用されます
  • ∩は交差点を示すために使用されます

条件付き確率を計算する際、イベントBの結果を認識していると想定されます。これは、実験の結果の情報が不明な場合が多いため、特に役立ちます。

例を使ってこれを理解しましょう:

  • 大学に出願した個人を受け入れることを想定したイベントAがあります。 それらが受け入れられる確率は70%です。
  • 別のイベントBがあり、受け入れられた学生に寮の住居が割り当てられる可能性が50%あります。

したがって、条件付き確率を次のように計算します。

確率(受け入れられた学生と割り当てられた寮)= P(割り当てられた寮|受け入れられた学生)×P(受け入れられた学生)

= (0.50)*(0.70)= 0.35

条件付き確率で、イベントAとBの両方、つまり、学生が大学に受け入れられ、寮の住居が割り当てられている場合の相互の関係を調べています。

対照的に、無条件確率は、イベントが別のイベントに先行するか、他の条件が与えられているかに関係なく、イベントが発生する確率の尺度として定義されます。

条件付き確率の実際のアプリケーション

条件付き確率は、保険や微積分などのさまざまな分野で広く使用されています。 政治にも当てはまります。 大統領の再選が予想されると仮定しましょう。 結果は、投票資格のある人の好みとテレビ広告キャンペーンの結果の確率に依存します。

別の例では、お住まいの地域の雨の確率が天気で指定されているように40%であると仮定します。 ただし、この結果は主に以下に依存します。

  • お住まいの地域に雲が形成されているかどうか
  • お住まいの地域に寒冷前線が到着する可能性があるかどうか
  • 雲が別の前線によって押しのけられているかどうか

条件付き確率は、上記の各イベントによって異なります。

ベイズの定理

数学者トーマスベイズによって導入されたベイズの定理またはベイズの定理またはベイズの法則は、条件付き確率の計算に役立つ数式です。 ベイズの定理を使用すると、新しい証拠や追加情報が明らかになったときに、既存の確率測度を修正(更新)できます。

ベイズの定理は、会計士が借り手にお金を貸すリスクを決定するためにそれを使用する金融での使用を見つけます。 これに加えて、統計や帰納論理にも役立ちます。

ベイズ統計はベイズの定理に基づいており、新しい証拠に基づいてイベントを予測できるため、より動的で正確な推定につながります。

世界のトップ大学(修士、エグゼクティブ大学院プログラム、ML&AIの高度な証明書プログラム)からオンラインで機械学習コースに参加して、キャリアを早急に進めましょう。

Pythonを使用した条件付き確率の例

この例では、条件付き確率を使用して、学生が最低10クラスをスキップする場合に、物理学でAグレード(80%以上)を取得する確率を決定します。

まず、 kaggleからダウンロードしたデータセットを調べます。

パンダをpdとしてインポートします

df = pd.read_csv('student-alcohol-consumption / student-mat.csv')

df.head(3)

レコードの数を確認します。

len(df)

#=> 395

次の列のみが考慮されます:欠席数と最終成績。

次に、新しいブール列grade_Aを作成して、生徒の最終スコアが80%以上かどうかを示します。

5を掛ける:

df ['grade_A'] = np.where(df ['G3'] * 5> = 80、1、0)

値1の新しいブール列high_absensesを作成して、最低10クラスを欠席した生徒を示します。

df ['high_absenses'] = np.where(df ['absences']> = 10、1、0)

ピボットテーブルを簡単に作成できるように、別の列を作成します。

df ['count'] = 1

他のすべての列を削除します。

df = df [['grade_A'、'high_absenses'、'count']]

df.head()

ピボットテーブルの作成:

pd.pivot_table(

df、

values ='カウント'、

index = ['grade_A']、

columns = ['high_absenses']、

aggfunc = np.size、

fill_value = 0

)。

これで、計算に進むことができます。

  • P(A)は、学生がAグレード(80%以上)を獲得する確率を示します。
  • P(B)は、生徒が最低10クラスを欠席した確率です。
  • P(A | B)は、学生が最低10のクラスを欠席した場合に、学生が80%以上の成績を獲得した確率です。

P(A)=(35 + 5)/(35 + 5 + 277 + 78)=0.10126…

P(B)=(78 + 5)/(35 + 5 + 277 + 78)=0.21012…

P(A∩B)= 5 /(35 + 5 + 277 + 78)=0.126582…

P(A | B)= P(A∩B)/ P(B)= 0.06

私たちの計算によると、学生が最低10のクラスを欠席した場合、学生が80%以上の成績を獲得する確率は少なくとも6%です。

独立したイベントの条件付き確率

また、AとBのように、両方が独立したイベントであるイベントもあります。これは、イベントAの発生がイベントBの発生とは関係がないことを意味します。

このような場合、条件付き確率P(B | A)は本質的にP(B)です。

P(B | A)= P(B)

同様に、条件付き確率P(A | B)は本質的にP(A)です。

P(A | B)= P(A)

相互に排他的なイベントの条件付き確率

確率論によれば、同時に発生する可能性のないイベントについて話すときは、相互に排他的なことについて話します。 簡単に言うと、イベントAが発生した場合、イベントBを同時に発生させることはできません。 したがって、そのような場合、確率は常にゼロです。

P(B | A)= 0およびP(A | B)= 0

全確率の法則

複雑なケースの確率を決定するために、確率の乗法を使用します。

乗算規則に従って、イベントFがすでに観測されている場合、観測イベントFと観測イベントEの確率を乗算することにより、両方とも観測イベントであるイベントEとFの確率を計算します。

P(E1⋂E2⋂…..⋂En)= P(E1)P(E2 | E1)………P(En | E1…………En-1)

ここで、3つのばらばらのイベントX、Y、Zを含むサンプル空間Sがあると仮定します。したがって、、

P(A)= P(A⋂X)+ P(A⋂Y)+ P(A⋂Z)

さて、確率の法則に従って、全確率の法則は次のように表すことができます。

P(A)= P(A | X)P(X)+ P(A | Y)P(Y)+ P(A | Z)P(Z)

結論

ベイズの定理を使用して実行される複雑な確率推定を習得するには、条件付き確率を理解する必要があります。 条件付き確率とベイズの定理について詳しく知りたい場合は、機械学習のIIT-AdvancedCertificateProgramに参加することをお勧めします

upGradの40,000以上のプラットフォームは、トップ企業でのピアツーピアコラボレーションと360°のジョブアシスタンスの機会を提供します。 実践的なプロジェクト、ケーススタディ、ライブレクチャーによる厳格なトレーニングにより、学生は確率の複雑な概念を習得し、それらを活用して機械学習モデルを展開できます。

AI主導の技術革命をリードします。 今すぐお申し込みください!

同時確率とは何ですか?

これは、2つのイベントが同じ時点で同時に発生する確率の尺度です。 簡単に言えば、同時確率は、イベントBがイベントAと同じ時点で発生する可能性です。

条件付き確率は可換かどうか?

可換ではありません。

条件付き確率の必要性は何ですか?

条件付き確率は、第一原理に依存する条件付き証拠に基づいてイベントの確率を推定することを容易にします。