統計における検出力分析：それは何であり、どのように実行するのですか？

公開: 2021-01-08

仮説検定は、統計分析の重要な側面です。ただし、実行するテストを可能な限り正確にするために、事前定義する必要のあることがたくさんあります。ここで、パワーの概念が機能し、統計的検定のヒューリスティックを定義します。

このチュートリアルを終えると、次のことがわかります。

統計的検定のヒューリスティック
テストの力とは何ですか？
検出力分析の必要性は何ですか？
検出力分析の実行方法

統計的検定のヒューリスティック

テストを実行する前に事前設定する必要があるいくつかのヒューリスティックに対して正しい統計的テストを実行します。テストが開始されると変更できないため、適切なヒューリスティックを設定することが非常に重要です。これらのいくつかを見てみましょう。

1.有意水準と信頼区間

統計的検定を開始する前に、確率のしきい値を設定する必要があります。このしきい値または有意水準は、臨界値（アルファ）と呼ばれます。アルファ値を超える確率曲線の下の完全な領域は、クリティカル領域と呼ばれます。

アルファ値は、帰無仮説を棄却するのに十分な異常であると結論付ける前に、サンプルデータポイント（または実験ポイント）が帰無仮説（元の平均点）からどれだけ離れている必要があるかを示します。使用されるアルファの一般的な値は、0.05または95％の信頼区間です。

2.P値

得られたテスト結果が統計的に有意であるかどうかを評価するために、テスト前に設定した臨界値（アルファ）をテストのP値と比較します。 p値は、テストしている値と同じくらい極端な、またはさらに極端な値を取得する確率です。

3.タイプ1およびタイプ2のエラー

統計的検定は100％確実になることはありません。エラーや結果に惑わされる余地は常にあります。上で説明したように、アルファ値を0.05に設定すると、95％の信頼区間があります。したがって、得られた結果が不正確で誤解を招く可能性が5％あります。これらの誤った結果は、エラーと呼ばれるものです。エラーには、タイプ1とタイプ2の2種類があります。

0.05の有意水準値は、統計的検定が95％倍正しいことを意味します。これは、5％の確率で正しくないことも意味します。これは、帰無仮説が正しかったときにそれを棄却する場合です。これはタイプ1エラーの例です。また、alpha（ α ）はタイプ1エラーを犯す確率であるとも言えます。

また、帰無仮説が真であると結論付けたり、偽である場合にそれを受け入れたりする場合もあります。技術的には、帰無仮説を受け入れることはできません。私たちはそれを拒否することしかできません。これは、タイプ2エラーと呼ばれるものです。同様に、タイプ2のエラーが発生する確率は、Beta —βで与えられます。

読む：データアナリスト：習得するためのトップスキルとツール

統計的検定の力は何ですか？

テストの検出力は、帰無仮説が偽の場合に正しく棄却される確率です。つまり、電力はタイプ2のエラーが発生する確率に反比例します。したがって、Power=1- β。たとえば、検出力を80％に設定した場合、統計的検定の80％が正しく、偽の検定ではないことを意味します。したがって、電力値が高いほど、タイプ2エラーが発生する可能性は低くなります。

しかし、なぜ結果が偽物になるのでしょうか。これは、ここでランダムなサンプルを扱っているためです。また、取得されたサンプルが分布の平均から離れすぎているため、非現実的な結果が得られ、誤った決定を強いられる場合があります。検出力分析の全体的な目的は、これらの誤った決定を行わないようにすることです。

私たちはPハッキングですか？

COVID-19のワクチンを作った例を見てみましょう。このワクチンが重要な結果をもたらすと確信しています。私たちは、私たちの信念が統計的にも当てはまるかどうかを確認するために、統計的検定を実施します。したがって、アルファを0.05に設定し、100個のサンプルを使用してテストを実行します。

テスト後、P値は0.06になります。帰無仮説を安全に棄却できるように、アルファに非常に近いが、それ以上であることがわかります。サンプルを増やしてテストをやり直すとどうなるか見たくなります。

したがって、さらに50個のサンプルを追加すると、P値が0.045になることがわかります。ワクチンが統計的に有意であることを証明しただけですか？いいえ！最初の結果を得た後、サンプル数を増やしたので、Pハックしました。 P-Hackingとは何ですか？それを回避する方法については、こちらをご覧ください。

検出力分析とは何ですか？

上記の例で見たように、サンプルサイズが小さいことがわかり、後で増やしました。これは間違っているので、絶対に行わないでください。テスト自体を開始する前に、サンプルサイズの値を事前設定する必要があります。しかし、サンプルサイズのどの値が私たちに適していますか？

サンプルサイズを1として使用して複数のテストを実行する例を考えてみましょう。したがって、母集団からランダムに1つのデータポイントをサンプリングする場合、データを正しく表す平均の周りであるか、または大量である可能性があります。平均から遠く離れており、データを適切に表していない。

この問題は、これらの遠く離れたデータポイントを使用して統計的検定を実行するときに発生します。取得するP値は正しくありません。ここで、サンプルサイズとして2を使用して別の一連のテストを実行します。これで、一方の値がデータ平均から遠く離れている場合でも、分布の反対側にあるもう一方の値はそれらの平均を中央に引き寄せ、そのため、その遠く離れた値の影響を減らします。したがって、サンプルサイズが2の場合、正しいP値を使用すると結果がより正確になります。

検出力分析は、可能な限りテストを実行するために必要なサンプルサイズの適切な量を見つけるために使用される手法です。より多く必要な検出力が高いほど、必要となるサンプルサイズの量になります。したがって、サンプルサイズが大きいほど、より良い、より信頼できる結果が得られるので、サンプルサイズを大きくするだけではどうでしょうか。データの収集にはコストがかかり、必要なサンプルサイズの知識が不可欠であるため、これは正しくありません。

検出力分析を実行する方法は？

テストの検出力は、いくつかの要因によって異なります。検出力分析を実行するための最初のステップは、検出力値を設定することです。共通の累乗を0.8に設定したと考えてください。これは、帰無仮説を正しく棄却する可能性が少なくとも80％あることを意味します。 COVID-19ワクチンが一連の人々に及ぼす影響を検証する場合、ワクチン接種を受けた人々のデータポイントの分布がプラセボを与えられた人々のそれとは異なることを証明したいと思います。

1.オーバーラップ量

比較している2つの分布間のオーバーラップの量を考慮する必要があります。重複が多いほど、nullを安全に拒否することが難しくなるため、より多くのサンプルサイズが必要になります。ただし、オーバーラップが非常に少ない場合は、nullを非常に簡単に安全に拒否できます。そして、必要なサンプルサイズはかなり少なくなります。オーバーラップは、2つの分布の平均とそれらの標準偏差の間の距離に依存します。

2.効果量

効果量は、母集団の平均と標準偏差の差の効果を組み合わせる方法です。効果量（d）は、平均間の推定差をプールされた推定標準偏差で割ったものとして計算されます。プールされた推定標準偏差を計算する最も簡単な方法の1つは、標準偏差の2乗和を2で割った平方根です。

したがって、検出力の値、アルファ値、および効果量を取得したら、これらの値を統計検出力計算機に接続して、サンプルサイズの値を取得できます。このような統計的検出力計算機は、インターネットで簡単に入手できます。

世界のトップ大学からデータサイエンス認定を取得します。エグゼクティブPGプログラム、高度な証明書プログラム、または修士プログラムを学び、キャリアを早急に進めましょう。

行く前に

検出力、アルファ、および効果量を使用して検出力分析を実行することにより、サンプルサイズを計算しました。したがって、サンプルサイズの値が7の場合、帰無仮説を正しく棄却する確率が80％になるには、サンプルサイズが7である必要があることを意味します。適切な量のドメインの専門知識を持つことも、母集団の平均とその重複、および必要な電力を推定するために重要です。

データサイエンスについて知りたい場合は、IIIT-BとupGradのデータサイエンスのPGディプロマをチェックしてください。これは、働く専門家向けに作成され、10以上のケーススタディとプロジェクト、実践的なハンズオンワークショップ、業界の専門家とのメンターシップ、1- on-1業界のメンター、400時間以上の学習、トップ企業との仕事の支援。

検出力分析とは何ですか？

テストまたは検出力分析の検出力は、帰無仮説が偽である場合に正しく棄却する確率です。つまり、電力はタイプ2のエラーが発生する確率に反比例します。したがって、電力=1-β。たとえば、検出力を80％に設定した場合、統計的検定の80％が正しく、偽の検定ではないことを意味します。したがって、電力値が高いほど、タイプ2エラーが発生する可能性は低くなります。検出力分析は、さまざまなランダムサンプルを処理しているため、誤った決定を防ぐためのものであり、それらの平均が非現実的な平均を与え、誤った決定を行う可能性が高くなります。

検出力分析を実行する際に考慮される要素は何ですか？

検出力分析のテストに影響を与える特定の要因があります。最初のステップは、電力値を設定することです。帰無仮説を棄却する可能性が70％であることを意味する、0.7の累乗の値があるとします。以下は、検出力分析の影響要因です。オーバーラップの量は、比較されている2つの分布間のオーバーラップです。オーバーラップの量はヌルの計算の難しさに直接比例するため、オーバーラップはできるだけ小さくする必要があります。効果量は、母集団の平均と標準偏差の差をクラブ化する方法です。これは「d」で表され、平均間の推定差をプールされた推定標準偏差で割ったものとして計算されます。これで、検出力の値、アルファ値（オーバーラップの量）、および効果量が得られたので、検出力の分析を簡単に実行できます。

P-ハッキングとは何ですか？

P-ハッキングまたはデータドレッジングは、データ分析手法を悪用して、重要であるように見えるが重要ではないデータのパターンを見つける方法です。この方法は、重要なデータパターンを提供するという誤った約束を与えるため、調査に悪影響を及ぼし、その結果、誤検知の数が大幅に増加する可能性があります。 Pハッキングを完全に防ぐことはできませんが、確実にそれを減らし、トラップを回避するのに役立ついくつかの方法があります。