什么是概率抽样? 定义、方法

已发表: 2021-11-22

研究可以有多种类型,例如市场研究、科学研究等。当进行研究时,需要的重要内容之一就是数据。 数据被证明是有益的,因为它可以导致对任何主题的机密信息的理解。 通常,数据是从不同的来源和不同的人收集的。 如果研究的重点是一群人,那么从每个人那里收集数据就不是一项可能的任务。 在这种情况下,会选择一个人样本来代表该群体并在研究过程中提供帮助。

所选样本应能很好地代表该群体,以确保有效地从结果中得出结论。 因此,选择抽样方法的决定在研究中是相当重要的。 从广义上讲,有两种抽样方式,一种是概率抽样,一种是非概率抽样。

概率抽样方法涉及样本的随机选择,而在非概率抽样方法的情况下,使用非随机选择方法进行抽样。

本文将重点介绍概率抽样的方法

在了解抽样方法的概念之前,最好先了解样本和总体的含义。

  • 人口是指研究人员想要得出某些结论的整个个体群体。
  • 样本是指从人群中收集的特定人群或个人,并收集数据。
  • 在定义人口时会考虑各种特征,例如年龄、地理位置、收入等。
  • 在研究的基础上,应明确目标人群。
  • 当人口规模被认为太大时,代表人口的良好样本变得难以形成。
  • 抽样方法中使用的术语

抽样方法中主要使用一些术语,例如抽样框架和样本量。

  • 抽样规模:抽样规模是指样本的大小。 这意味着在样本中考虑的个人数量。 在样本中包括人取决于各种因素,例如变异性和人口规模。 这也取决于研究的设计。
  • 抽样框:它被定义为将形成实际样本的个人列表。

目录

概率抽样

从总体中选择样本的抽样方法称为概率抽样。 这意味着样本是随机或偶然选择的。 这种类型的采样过程更耗时且成本更高。

在概率抽样中,由于样本是随机选择的,因此每个群体中的每个成员或个体都有成为样本一部分的概率。 这意味着每个成员都有机会在样本中被选中。

假设任何用户或研究人员想要对代表总体特征的一组个体进行研究。 在这种情况下,概率抽样方法被认为是最佳选择。

概率抽样方法的类型

概率抽样方法进一步分为五种不同类型的抽样方法。

1. 简单随机抽样

第一组抽样方法是简单随机抽样方法。 在这种抽样方法中,人口中的成员被选中的机会都是相同的。

抽样框架应该是整个实际人口。

您可以在此采样方法中使用的工具是随机数生成器或其他考虑基于机会的技术的工具。

  • 简单随机抽样示例

假设要从组织中的一组员工中选择一个包含 100 名员工的样本。 在这种情况下,从 1 到 100 的数字可以随机分配给员工。 然后,通过随机数生成器,从分布的数字中选出 100 个数字。

2. 系统抽样

抽样方法的过程类似于简单的随机抽样。 但是,这种方法被认为是比前面提到的方法更直接的过程。 在这种方法中,人口中的每个成员都用数字实体列出。 但是,分配给个人的数字不是随机选择的。 相反,它们会定期获得数字。

  • 系统抽样示例

假设要从 100 个人中选出 20 个人。 在这种情况下,当我们应用系统抽样时,这些数字会系统地分配给个人。 在选择个体时,在开始时会选择一个随机数。 一旦确定了起始号码,下一个号码就会以一定的间隔进行,例如8、18、28等。同样,可以系统地选出20个人。

在使用系统抽样技术时,应注意个人列表中不应存在任何隐藏模式。

3. 分层抽样

与前面讨论的方法不同,在这种方法中,首先将群体划分为亚群体。 随着人口的分化,这些小团体在某种程度上变得重要。 分层抽样有助于获得与研究相关的更具体的结论。 这是因为该方法可确保在抽样时在考虑的样本中适当地表示每个子组。

该过程从将人口划分为明确的子组或阶层开始。 这些子组可以根据年龄、工作、薪水等特征形成。一旦划分,根据所研究的人口,可以应用任何抽样方法来形成代表每个子人口的样本。

4. 整群抽样

整群抽样的方法包括从一个更大的种群中形成一个亚种群。 分层抽样和整群抽样之间的唯一区别是生成的每个子组应该具有彼此相似的特征。 由于每个子组中都存在相似的特征,您可以随机选择整个子组,而不是从子组中抽样个体。 为了降低成本,统计人员可以选择这种方法。

聚类样本为抽样单位形成“口袋”,而不是将样本分散到整个人口中。 这降低了收集中涉及的操作的成本。 应该使用整群抽样可能还有另一个原因。 这是因为,在其他抽样方法的情况下,总体的单位列表可能不可用。 另一方面,在集群抽样的情况下,集群列表可以很容易地创建或可用。

然而,整群抽样有一个缺点,因为它比简单的随机抽样方法效率低。 因此,调查应该针对大量较小规模的集群,而不是调查少数较大规模的集群。 已报道的整群抽样方法的另一个缺点是无法控制样本的最终大小。

5.多级抽样

该方法与整群抽样方法几乎相似。 然而,不同之处在于形成一个样本,其中一个样本是从每个集群而不是整个集群中选择的。 这种抽样方法有两个阶段。 在第一阶段,大量的簇被识别然后选择。 该方法的第二阶段包括从创建的集群中选择单元。 这可以通过使用任何类型的概率抽样方法来完成。 因此,在多阶段筛选过程中,所形成的簇是初级抽样单位,即初级抽样单位。

相反,集群中存在的单位被称为次要抽样单位。 在这种类型的采样方法中可以存在更多的采样阶段。 在这些情况下,将选择三次抽样单位,并继续该过程直到形成最终样本。

概率抽样的优点

概率抽样方法由提供不同好处的不同技术组成。 单一方法有其独特的优势。 优点列表已在下面提到

  • 整群抽样方法非常容易使用和方便。
  • 简单随机抽样的方法导致创建可以代表整个人口的样本。
  • 分层抽样方法导致创建代表整个人口的人口层。
  • 在系统抽样方法中,无需使用任何随机数生成工具即可轻松形成样本。

结论

概率抽样是一种有助于从总体中选择样本的抽样方法。 通过概率抽样选择样本的重要目标之一是尽量减少估计的抽样误差。 此外,应该注意的是,随着进行调查所花费的时间,调查的成本应该降低。 在本文中,我们讨论了概率抽样中包含的不同方法。

如果您有兴趣了解有关人工智能和机器学习的更多信息,请查看 IIIT-B 和upGrad 的在线机器学习和 AI 计划,该计划专为在职专业人士设计,提供 450 多个小时的严格培训、30 多个案例研究和作业, IIIT-B 校友身份、5 个以上实用的实践顶点项目和顶级公司的工作协助。

提升您在机器学习和人工智能方面的职业生涯

立即申请 IIITB 的 AI-ML 高管认证