確率サンプリングとは何ですか? 定義、方法
公開: 2021-11-22調査には、市場調査、科学調査など、いくつかの種類があります。調査を行う場合、必要な重要なことの1つはデータです。 データは、あらゆる対象の機密情報の理解につながるため、有益であることが証明されています。 多くの場合、データはさまざまなソースやさまざまな人々から収集されます。 調査が人々のグループに焦点を合わせている場合、全員からデータを収集することは不可能な作業です。 このような場合、グループを代表して調査プロセスを支援するために、人々のサンプルが選択されます。
選択したサンプルは、結果から結論を効果的に引き出すために、グループを適切に表す必要があります。 したがって、調査研究では、サンプリング方法を選択する決定が非常に重要です。 大まかに言って、サンプリングには、確率サンプリングと非確率サンプリングの2つの方法があります。
確率サンプリング法はサンプルのランダム選択を含みますが、非確率サンプリング法の場合、非ランダム選択法がサンプリングに使用されます。
この記事では、確率サンプリングの方法に焦点を当てます。
サンプリング方法の概念を理解する前に、サンプルと母集団が何を意味するのかを理解するのが最善です。
- 母集団とは、研究者が特定の結論を導き出したい個人のグループ全体を指します。
- サンプルとは、母集団から収集された特定のグループの人々または個人を指し、データが収集されます。
- 年齢、地理的位置、収入など、人口を定義する際にさまざまな特性が考慮されます。
- 調査の調査に基づいて、ターゲット母集団を適切に定義する必要があります。
- 母集団のサイズが大きすぎると見なされると、母集団を表す適切なサンプルを作成することが困難になります。
- サンプリング方法で使用される用語
サンプリングフレームやサンプルサイズなど、いくつかの用語は主にサンプリング方法で使用されます。
- サンプリングサイズ:サンプリングサイズは、サンプルのサイズを指します。 これは、サンプル内で考慮される個人の数を意味します。 サンプルに人を含めるかどうかは、変動性や母集団のサイズなど、さまざまな要因によって異なります。 また、研究のデザインにも依存します。
- サンプリングフレーム:実際のサンプルを形成する個人のリストとして定義されます。
目次
確率サンプリング
母集団からサンプルを選択するサンプリング方法は、確率サンプリングと呼ばれます。 これは、サンプルがランダムにまたは偶然に選択されることを意味します。 このタイプのサンプリングのプロセスは、より時間とコストがかかります。
確率サンプリングでは、サンプルが偶然にランダムに選択されるため、すべての母集団のすべてのメンバーまたは個人がサンプルの一部になる確率があります。 つまり、すべてのメンバーがサンプルで選択される可能性があります。
ユーザーまたは研究者が、母集団全体の特性を表す個人のグループに対して調査を実行したいとします。 その場合、確率サンプリング法が最良の選択と考えられます。
確率サンプリング方法の種類
確率サンプリング法はさらに5種類のサンプリング法に分類されます。
1.単純ランダムサンプリング
サンプリング方法の最初のグループは、単純ランダムサンプリング方法です。 このサンプリング方法では、母集団内のメンバーが選択される可能性はすべて同じです。
サンプリングフレームは、実際の母集団全体である必要があります。
このサンプリング方法で使用できるツールは、乱数ジェネレーターまたは偶然に基づいて手法を検討するその他のツールです。
- 単純ランダムサンプリングの例
組織内の従業員のグループから100人の従業員のサンプルが選択されるとします。 その場合、1から100までの数字をランダムに従業員に配布することができます。 次に、乱数ジェネレーターを介して、配布された番号から100個の番号が選択されます。
2.系統抽出
サンプリング方法のプロセスは、単純ランダムサンプリングに似ています。 ただし、この方法は、前述の方法よりも簡単なプロセスと見なされます。 この方法では、母集団内のすべてのメンバーが数値エンティティでリストされます。 ただし、個人に割り当てられる番号はランダムに選択されるわけではありません。 代わりに、一定の間隔で番号が付けられます。
- 系統抽出の例
100人のグループから20人の個人が選ばれると仮定します。 このような場合、系統抽出を適用すると、番号が体系的に個人に割り当てられます。 個人を選択する際、最初に乱数が選択されます。 開始番号が決まったら、次の番号は8、18、28などの一定の間隔で続きます。同様に、20人を体系的に選択することができます。
系統抽出法を使用している間、個人のリストに隠れたパターンが存在してはならないことに注意する必要があります。
3.層化抽出
前述の方法とは異なり、この方法では、母集団は最初にサブ母集団に分割されます。 人口が分裂するにつれて、これらの小グループは何らかの形で重要になります。 層化抽出は、研究に関連するより具体的な結論を得るのに役立ちます。 これは、この方法により、サンプリング中に考慮されるサンプルですべてのサブグループが適切に表現されることが保証されるためです。
このプロセスは、母集団を明確なサブグループまたは階層に分割することから始まります。 これらのサブグループは、年齢、仕事、給与などの特性に基づいて形成できます。分割された後は、調査対象の母集団に基づいて、任意のサンプリング方法を適用して、各サブ母集団を表すサンプルを形成できます。
4.クラスターサンプリング
クラスターサンプリングの方法には、より大きな母集団からの部分母集団の形成が含まれます。 層化サンプリングとクラスターサンプリングの唯一の違いは、生成された各サブグループが互いに類似した特性を持つ必要があることです。 各サブグループには同様の特性が存在するため、サブグループから個人をサンプリングする代わりに、サブグループ全体をランダムに選択できます。 コストを削減するために、このタイプの方法は統計家が選択することができます。
クラスターサンプルは、母集団全体にサンプルを分散させるのではなく、サンプリングされたユニットの「ポケット」を形成します。 これにより、収集に関連する操作のコストが削減されます。 クラスターサンプリングを使用する必要がある別の理由があるかもしれません。 これは、他のサンプリング方法の場合、母集団のユニットリストが利用できない可能性があるためです。 一方、クラスターサンプリングの場合、クラスターリストは簡単に作成できるか、利用可能です。
ただし、クラスターサンプリングには、単純なランダムサンプリング方法よりも効率が低いため、欠点があります。 このため、調査は、大きなサイズの少数のクラスターを調査するのではなく、小さなサイズの多数のクラスターに対して実行する必要があります。 報告されているクラスターサンプリング法のもう1つの欠点は、サンプルの最終的なサイズを制御できないことです。
5.多段サンプリング
この方法は、クラスターサンプリング法とほぼ同じです。 ただし、違いは、クラスター全体ではなく、各クラスターからサンプルが選択されるサンプルの形成にあります。 このサンプリング方法には2つの段階があります。 最初の段階では、多数のクラスターが識別されてから選択されます。 メソッドの第2段階には、作成されたクラスターからのユニットの選択が含まれます。 これは、任意のタイプの確率サンプリング方法を使用して実行できます。 したがって、多段階スクリーニングプロセスでは、形成されるクラスターが主要なサンプリングユニット、つまりPSUになります。
対照的に、クラスター内に存在するユニットは、サンプリングの2次ユニットと呼ばれます。 このタイプのサンプリング方法では、より多くのサンプリング段階が存在する可能性があります。 このような場合、3次サンプリングユニットが選択され、最終サンプルが形成されるまでプロセスが続行されます。
確率サンプリングの利点
確率サンプリング方法は、さまざまな利点を提供するさまざまな手法で構成されています。 単一の方法には独自の利点があります。 利点のリストは以下に記載されています。
- クラスターサンプリング法は非常に使いやすく便利です。
- 単純ランダムサンプリングの方法は、母集団全体を表すことができるサンプルの作成につながります。
- 層化抽出法は、母集団全体を表す母集団の層の作成につながります。
- 系統抽出法で乱数を生成するためのツールを使用せずに、サンプルを簡単に作成できます。
結論
確率サンプリングは、母集団からサンプルを選択するのに役立つサンプリング方法の一種です。 確率サンプリングによってサンプルを選択する際の重要な目標の1つは、推定のサンプリングエラーを最小限に抑えることです。 また、調査にかかる時間とともに、調査のコストを削減する必要があることに注意する必要があります。 この記事では、確率サンプリングに含まれるさまざまな方法について説明しました。
人工知能と機械学習について詳しく知りたい場合は、IIIT-BとupGradのオンライン機械学習とAIプログラムをご覧ください。このプログラムは、働く専門家向けに設計されており、450時間以上の厳格なトレーニング、30以上のケーススタディと課題を提供しています。 IIIT-Bの卒業生のステータス、5つ以上の実践的な実践的なキャップストーンプロジェクト、トップ企業との仕事の支援。