什麼是概率抽樣? 定義、方法

已發表: 2021-11-22

研究可以有多種類型,例如市場研究、科學研究等。當進行研究時,需要的重要內容之一就是數據。 數據被證明是有益的,因為它可以導致對任何主題的機密信息的理解。 通常,數據是從不同的來源和不同的人收集的。 如果研究的重點是一群人,那麼從每個人那裡收集數據就不是一項可能的任務。 在這種情況下,會選擇一個人樣本來代表該群體並在研究過程中提供幫助。

所選樣本應能很好地代表該群體,以確保有效地從結果中得出結論。 因此,選擇抽樣方法的決定在研究中是相當重要的。 從廣義上講,有兩種抽樣方式,一種是概率抽樣,一種是非概率抽樣。

概率抽樣方法涉及樣本的隨機選擇,而在非概率抽樣方法的情況下,使用非隨機選擇方法進行抽樣。

本文將重點介紹概率抽樣的方法

在了解抽樣方法的概念之前,最好先了解樣本和總體的含義。

  • 人口是指研究人員想要得出某些結論的整個個體群體。
  • 樣本是指從人群中收集的特定人群或個人,並收集數據。
  • 在定義人口時會考慮各種特徵,例如年齡、地理位置、收入等。
  • 在研究的基礎上,應明確目標人群。
  • 當人口規模被認為太大時,代表人口的良好樣本變得難以形成。
  • 抽樣方法中使用的術語

抽樣方法中主要使用一些術語,例如抽樣框架和样本量。

  • 抽樣規模:抽樣規模是指樣本的大小。 這意味著在樣本中考慮的個人數量。 在樣本中包括人取決於各種因素,例如變異性和人口規模。 這也取決於研究的設計。
  • 抽樣框:它被定義為將形成實際樣本的個人列表。

目錄

概率抽樣

從總體中選擇樣本的抽樣方法稱為概率抽樣。 這意味著樣本是隨機或偶然選擇的。 這種類型的採樣過程更耗時且成本更高。

在概率抽樣中,由於樣本是隨機選擇的,因此每個群體中的每個成員或個體都有成為樣本一部分的概率。 這意味著每個成員都有機會在樣本中被選中。

假設任何用戶或研究人員想要對代表總體特徵的一組個體進行研究。 在這種情況下,概率抽樣方法被認為是最佳選擇。

概率抽樣方法的類型

概率抽樣方法進一步分為五種不同類型的抽樣方法。

1. 簡單隨機抽樣

第一組抽樣方法是簡單隨機抽樣方法。 在這種抽樣方法中,人口中的成員被選中的機會都是相同的。

抽樣框架應該是整個實際人口。

您可以在此採樣方法中使用的工具是隨機數生成器或其他考慮基於機會的技術的工具。

  • 簡單隨機抽樣示例

假設要從組織中的一組員工中選擇一個包含 100 名員工的樣本。 在這種情況下,從 1 到 100 的數字可以隨機分配給員工。 然後,通過隨機數生成器,從分佈的數字中選出 100 個數字。

2. 系統抽樣

抽樣方法的過程類似於簡單的隨機抽樣。 但是,這種方法被認為是比前面提到的方法更直接的過程。 在這種方法中,人口中的每個成員都用數字實體列出。 但是,分配給個人的數字不是隨機選擇的。 相反,它們會定期獲得數字。

  • 系統抽樣示例

假設要從 100 個人中選出 20 個人。 在這種情況下,當我們應用系統抽樣時,這些數字會系統地分配給個人。 在選擇個體時,在開始時會選擇一個隨機數。 一旦確定了起始號碼,下一個號碼就會以一定的間隔進行,例如8、18、28等。同樣,可以系統地選出20個人。

在使用系統抽樣技術時,應注意個人列表中不應存在任何隱藏模式。

3. 分層抽樣

與前面討論的方法不同,在這種方法中,首先將群體劃分為亞群體。 隨著人口的分化,這些小團體在某種程度上變得重要。 分層抽樣有助於獲得與研究相關的更具體的結論。 這是因為該方法可確保在抽樣時在考慮的樣本中適當地表示每個子組。

該過程從將人口劃分為明確的子組或階層開始。 這些亞組可以根據年齡、工作、薪水等特徵形成。一旦劃分,根據研究的人群,可以應用任何抽樣方法來形成代表每個亞群的樣本。

4. 整群抽樣

整群抽樣的方法包括從一個更大的種群中形成一個亞種群。 分層抽樣和整群抽樣之間的唯一區別是生成的每個子組應該具有彼此相似的特徵。 由於每個子組中都存在相似的特徵,您可以隨機選擇整個子組,而不是從子組中抽樣個體。 為了降低成本,統計人員可以選擇這種方法。

聚類樣本為抽樣單位形成“口袋”,而不是將樣本分散到整個人口中。 這降低了收集中涉及的操作的成本。 應該使用整群抽樣可能還有另一個原因。 這是因為,在其他抽樣方法的情況下,總體的單位列表可能不可用。 另一方面,在集群抽樣的情況下,集群列表可以很容易地創建或可用。

然而,整群抽樣有一個缺點,因為它比簡單的隨機抽樣方法效率低。 因此,調查應該針對大量較小規模的集群,而不是調查少數較大規模的集群。 已報導的整群抽樣方法的另一個缺點是無法控製樣本的最終大小。

5.多級採樣

該方法與整群抽樣方法幾乎相似。 然而,不同之處在於形成一個樣本,其中一個樣本是從每個集群而不是整個集群中選擇的。 這種抽樣方法有兩個階段。 在第一階段,大量的簇被識別然後選擇。 該方法的第二階段包括從創建的集群中選擇單元。 這可以通過使用任何類型的概率抽樣方法來完成。 因此,在多階段篩選過程中,所形成的簇是初級抽樣單位,即初級抽樣單位。

相反,集群中存在的單位被稱為次要抽樣單位。 在這種類型的採樣方法中可以存在更多的採樣階段。 在這些情況下,將選擇三次抽樣單位,並繼續該過程直到形成最終樣本。

概率抽樣的優點

概率抽樣方法由提供不同好處的不同技術組成。 單一方法有其獨特的優勢。 優點列表已在下面提到

  • 整群抽樣方法非常容易使用和方便。
  • 簡單隨機抽樣的方法導致創建可以代表整個人口的樣本。
  • 分層抽樣方法導致創建代表整個人口的人口層。
  • 在系統抽樣方法中,無需使用任何隨機數生成工具即可輕鬆形成樣本。

結論

概率抽樣是一種有助於從總體中選擇樣本的抽樣方法。 通過概率抽樣選擇樣本的重要目標之一是盡量減少估計的抽樣誤差。 此外,應該注意的是,隨著進行調查所花費的時間,調查的成本應該降低。 在本文中,我們討論了概率抽樣中包含的不同方法。

如果您有興趣了解有關人工智能和機器學習的更多信息,請查看 IIIT-B 和upGrad 的在線機器學習和 AI 計劃,該計劃專為在職專業人士設計,提供 450 多個小時的嚴格培訓、30 多個案例研究和作業, IIIT-B 校友身份、5 個以上實用的實踐頂點項目和頂級公司的工作協助。

提升您在機器學習和人工智能方面的職業生涯

立即申請 IIITB 的 AI-ML 高管認證