ベイズ推定の初心者ガイド:完全ガイド
公開: 2021-11-26機械学習アプリケーションは、研究、ソーシャルメディア、広告などに広く適用できるようになりつつあります。ただし、アプリケーションは主に、大量のデータを含む予測を処理します。 統計は、不確かさの値の測定の定量化によく使用されます。 異なるイベントがある場合、3つのアプローチでイベントの確率を決定できます。
これらの3つの方法は次のとおりです。
- クラシック
- ベイジアン
- 頻度主義者
サイコロを振って「4」の顔が出るかどうかの確率を調べる例を考えてみましょう。 これは、確率を決定する3つのタイプの方法を理解するのに役立ちます。 確率推定の古典的な方法を検討するとします。 その場合、合計6つの結果があり、結果が発生する確率は同じであると考えられます。 このような仮定では、結果が4になる確率は1/6になります。 古典的な方法は、結果が同じように起こりそうな結果をもたらす場合、通常はうまく機能します。 しかし、結果がより主観的になると、この方法は使用できなくなります。
頻度主義的方法を考える場合、仮説的なイベントの無限のシーケンスが存在する必要があります。 次に、無限の仮説シーケンスで関連する周波数を検索する必要があります。 上記のサイコロの例を考えると、サイコロを無限に振った場合、結果、つまり1/6の場合、結果は4になります。 したがって、頻度主義的方法の定義によれば、6面サイコロで結果が4になる確率は1/6になります。
現在、ベイジアンアプローチに向かっており、いくつかの利点があります。 この方法の観点から、意思決定のプロセスに個人的な信念を組み込むことができます。 つまり、問題に関してわかっている情報などを考慮します。 このアプローチでは、個人ごとに異なる信念を持つことができるという事実も考慮されます。 たとえば、ある人が明日雨の確率が90%になると言った場合、他の人の場合、雨の確率は60%になる可能性があります。 したがって、ベイジアンアプローチの方法は主観的です。 ただし、結果は頻度主義的方法と比較してより直感的です。
目次
ベイズ推定
ベイズ推定は、主に統計的推論の問題に使用されます。 このような場合、推定する必要のある未知の量(データ)が常に存在します。 そして、データから希望量を推定します。 未知の量はθと呼ばれます。 θはランダムな量であるという仮定があり、θの値にはいくつかの初期推定値があります。 このタイプの配布は、事前配布と呼ばれます。 値の更新は通常、ベイズの定理によって行われます。 したがって、このアプローチはベイジアンアプローチと呼ばれます。
ベイズの定理
ベイズ推定の適用は、ベイズの定理の理解に依存します。
セットAとセットBなどの2つの結果セットがあると考えてください。これらのセットはイベントとも呼ばれます。 イベントAの確率をP(A)、イベントBの確率をP(B)としましょう。 これらは、個々のイベントの確率でした。 ただし、同時確率は、項P(A、B)を使用して定義できます。 条件付き確率は、次のように拡張できます。
P(A、B)= P(A | B)P(B)、
これは、Bが与えられている間、AとBの条件付き確率が2つのイベントの同時確率になることを意味します。
P(A、B)= P(B | A)P(A)
上記の両方の方程式で、方程式の左辺は同じであるため、方程式の右辺は等しくなければなりません。
P(A | B)P(B)= P(B | A)P(A)
P(A | B)= P(B | A)P(A)/ P(B)
この方程式はベイズの定理として知られています。
データサイエンスの分野では、ベイズの定理は次のように書くことができます。
P(仮説|データ)= P(データ|仮説)P(仮説)/ p(データ)
証拠である分母は、方程式の左側の事後分布が有効な確率密度であることを保証します。 これは、正規化定数とも呼ばれます。
ベイズの定理の方程式には3つの要素があります。
- 前
- 可能性
- 後部
事前配布
ベイズ推定法の重要な要素の1つは、事前分布です。 これにより、個人的な信念を意思決定のプロセスに組み込むことができます。 また、さまざまな個人に基づく判断を調査に組み込むことができます。 これは数式によって行われます。 θで表される未知のパラメータは、自分の信念を表現するために使用されます。 これらの信念を表現するために、事前分布である分布関数が使用されます。 したがって、実験を実行する前に、分布が選択されます。
ベイズ推定の初心者ガイド
1.前の選択
累積分布は通常、パラメーターθに対して定義されます。 事前確率の値がゼロであるイベントは、事後確率の値がゼロになります。 また、事前確率の値を持つイベントの場合、事後確率の値が1になります。 したがって、ベイジアンアプローチの優れたフレームワークでは、すでに発生したイベントに対するいくつかの点推定が定義されないか、その発生に関する情報がありません。 事前を選択するための特定の手法があります。 事前分布を選択するために広く使用されている手法の1つは、分布関数を使用することです。 すべての関数のファミリーが使用されます。 これらの機能は柔軟であり、個人の信念を表すことができるはずです。
2.可能性
推定される未知のパラメータとしてθを考えてみましょう。 ベイズ推定の例を考えると、コインの公平性はθで表すことができます。 コインは、その公平性を確認するために無限に裏返されています。 だから、弾くたびに、頭か尻尾のどちらかがあります。 イベントに割り当てられる値は0と1です。これはベルヌーイ試行とも呼ばれます。 すべての結果は独立していると見なされます。 これは、尤度の概念を定義する方程式で表すことができます。 尤度は、θの関数である密度関数です。 尤度を最大化するには、θの値が最大の尤度値になるはずです。 推定の方法は、最尤推定とも呼ばれます。
3.事後分布
ベイズの定理の結果は、事後分布として知られています。 これは、新しい情報を考慮した後に発生するイベントの更新された確率です。
4.ベイズ推定メカニズム
上で見たように、ベイズ推定法は確率の概念をある程度の信念として扱います。 これらの信念は、そのような証拠の下でイベントが発生する可能性があるという事実に関連しています。 したがって、パラメータシータ「θ」は確率変数と見なされます。
5.財務リスクにおけるベイズ推定の適用
ベイズ推定を適用できるアルゴリズムはたくさんあります。 アルゴリズムには、ニューラルネットワーク、ランダムフォレスト、回帰などがあります。この方法は、金融セクターでも人気があります。 複数の銀行のオペレーショナルリスクモデリングに使用できます。 業務の喪失を示す銀行のデータは、失われたいくつかのイベントを示しています。 これらの失われたイベントの頻度は低かったが、重大度は高かった。 したがって、そのような場合、ベイズ推定は非常に有用であることがわかります。 これは、この方法では、分析に多くのデータも必要としないためです。
オペレーショナルリスクのモデル化には、頻度主義的手法などの他の統計分析手法も以前に適用されていました。 しかし、不確定パラメータの推定には問題がありました。 したがって、ベイズ推定が最も効果的な方法であると考えられてきました。 これは、専門家の意見とデータを事後分布の導出に使用できるためです。 このタイプのタスクでは、銀行の内部損失のデータがいくつかの小さなフラグメントに分割され、専門家の判断によって各フラグメントの頻度が推定されます。 次に、これを確率の分布に適合させます。
世界のトップ大学(修士、エグゼクティブ大学院プログラム、ML&AIの高度な証明書プログラム)からオンラインで機械学習コースに参加して、キャリアを早急に進めましょう。
結論
統計と機械学習では、適用できる2つの主要なアプローチは、頻度主義的推定とベイズ推定の方法です。 この記事では、確率が主観的な信念として計算されるベイズ推定法について説明しました。 データとともに、確率を推定する際に人々の個人的な信念も組み込まれます。 これらは、モデルを多くの推定研究ではるかに広く受け入れられるようにします。 したがって、ベイズ推定の手法は、データの観察にあなたの信念を適用する方法または方法を指定します。 さらに、ノイズの多いデータが多い多くのタイプのアプリケーションでは、ベイズ推定手法を使用できます。 したがって、ベイズの定理にある力は、任意の性質の質問に答えるために使用できる量に計算できる量に関連付けることができます。