확률 샘플링이란 무엇입니까? 정의, 방법

게시 됨: 2021-11-22

연구는 시장 조사, 과학 조사 등 여러 유형이 있을 수 있습니다. 그리고 조사를 수행할 때 필요한 중요한 것 중 하나는 데이터입니다. 데이터는 모든 주제의 기밀 정보를 이해하는 데 도움이 되므로 유익한 것으로 판명되었습니다. 종종 데이터는 다른 출처와 다른 사람들로부터 수집됩니다. 연구가 한 그룹의 사람들에 초점을 맞춘다면 모든 사람으로부터 데이터를 수집하는 것은 가능한 작업이 아닙니다. 이러한 경우 그룹을 대표하고 연구 과정을 돕도록 사람들의 표본이 선택됩니다.

선택한 샘플은 결과에서 결론을 효과적으로 도출할 수 있도록 그룹을 잘 대표해야 합니다. 따라서 본 연구에서는 표본추출 방법을 선택하는 것이 매우 중요하다. 일반적으로 샘플링에는 확률 샘플링 과 비확률 샘플링의 두 가지 방법이 있습니다.

확률표집법은 표본을 무작위로 선택하는 방식인 반면, 비확률표본법의 경우 표본추출을 위해 비임의선택방식을 사용한다.

이 기사는 확률 샘플링 방법에 초점을 맞출 것입니다 .

표본 추출 방법의 개념을 이해하기 전에 표본과 모집단이 의미하는 바를 이해하는 것이 가장 좋습니다.

인구는 연구자가 특정 결론을 도출하고자 하는 개인의 전체 그룹을 나타냅니다.
표본은 모집단에서 수집된 특정 그룹의 사람 또는 개인을 말하며 데이터가 수집됩니다.
인구를 정의할 때 연령, 지리적 위치, 소득 등 다양한 특성을 고려합니다.
연구의 연구를 바탕으로 대상 인구를 잘 정의해야 합니다.
모집단을 대표하는 좋은 표본은 모집단 크기가 너무 큰 것으로 간주되면 형성하기 어려워집니다.
샘플링 방법에 사용되는 용어

샘플링 프레임 및 샘플 크기와 같은 몇 가지 용어는 샘플링 방법에 주로 사용됩니다.

샘플링 크기 : 샘플링 크기는 샘플의 크기를 나타냅니다. 이것은 표본 내에서 고려되는 개인의 수를 의미합니다. 표본에 사람을 포함시키는 것은 모집단의 변동성 및 크기와 같은 다양한 요인에 따라 다릅니다. 또한 연구 설계에 따라 다릅니다.
샘플링 프레임: 실제 샘플을 구성할 개인의 목록으로 정의됩니다.

확률 샘플링

모집단에서 표본을 추출하는 표본 추출 방법을 확률 표본 추출이라고 합니다. 이것은 표본이 무작위로 또는 우연히 선택됨을 의미합니다. 이러한 유형의 샘플링 프로세스는 시간이 많이 걸리고 비용이 많이 듭니다.

확률 표본 추출에서는 표본이 우연히 무작위로 선택되므로 모든 모집단의 모든 구성원이나 개인이 표본의 일부가 될 확률이 있습니다. 즉, 모든 구성원이 표본에서 선택될 기회가 있습니다.

사용자나 연구자가 전체 인구의 특성을 나타내는 개인 그룹에 대해 연구를 수행하기를 원한다고 가정합니다. 이 경우 확률 샘플링 방법이 최선의 선택으로 간주됩니다.

확률 샘플링 방법의 유형

확률 샘플링 방법은 다섯 가지 유형의 샘플링 방법으로 더 분류됩니다.

1. 단순 랜덤 샘플링

샘플링 방법의 첫 번째 그룹은 단순 무작위 샘플링 방법입니다. 이 샘플링 방법에서는 모집단 내의 구성원이 선택될 확률이 모두 동일합니다.

샘플링 프레임은 전체 실제 모집단이어야 합니다.

이 샘플링 방법에서 사용할 수 있는 도구는 난수 생성기 또는 우연에 기반한 기술을 고려하는 기타 도구입니다.

단순 무작위 샘플링의 예

100명의 직원 표본이 조직의 직원 그룹에서 선택된다고 가정합니다. 이 경우 1에서 100까지의 숫자를 직원에게 무작위로 배포할 수 있습니다. 그런 다음 난수 생성기를 통해 분산된 숫자 중에서 100개의 숫자를 선택합니다.

2. 체계적인 샘플링

샘플링 방법의 프로세스는 단순 무작위 샘플링과 유사합니다. 그러나 이 방법은 앞서 언급한 방법보다 더 간단한 과정으로 간주됩니다. 이 방법에서는 모집단 내의 모든 구성원이 숫자 엔터티와 함께 나열됩니다. 단, 개인에게 부여되는 번호는 임의로 선택되지 않습니다. 대신 일정한 간격으로 숫자가 제공됩니다.

체계적인 샘플링의 예

100명의 그룹에서 20명의 개인이 선택된다고 가정합니다. 이 경우 체계적 표본추출을 적용하면 개인에게 체계적으로 숫자가 할당됩니다. 개인을 선택하는 동안 처음에는 임의의 숫자가 선택됩니다. 시작 번호가 정해지면 8, 18, 28 등 일정한 간격으로 다음 번호가 진행됩니다. 마찬가지로 20명을 체계적으로 선발할 수 있습니다.

체계적인 샘플링 기법을 사용하는 동안 개인 목록에 존재하는 숨겨진 패턴이 없어야 한다는 점에 유의해야 합니다.

3. 계층화 샘플링

앞서 논의한 방법과 달리 이 방법에서는 모집단을 처음에 하위 모집단으로 나눕니다. 인구가 나누어짐에 따라 이러한 소그룹은 어떤 면에서 중요해집니다. 계층화된 샘플링은 연구와 관련된 보다 구체적인 결론을 얻는 데 도움이 됩니다. 이 방법은 샘플링하는 동안 모든 하위 그룹이 고려된 샘플에서 적절하게 표현되도록 하기 때문입니다.

이 과정은 인구를 명확한 하위 그룹 또는 계층으로 나누는 것으로 시작됩니다. 이러한 하위 그룹은 연령, 직업, 급여 등과 같은 특성을 기반으로 구성될 수 있습니다. 일단 분할되면 연구 대상 인구를 기반으로 임의의 샘플링 방법을 적용하여 각 하위 인구를 대표하는 표본을 형성할 수 있습니다.

4. 클러스터 샘플링

클러스터 샘플링 방법에는 더 큰 인구에서 하위 개체군을 형성하는 것이 포함됩니다. 계층화 샘플링과 클러스터 샘플링의 유일한 차이점은 생성된 각 하위 그룹이 서로 유사한 특성을 가져야 한다는 것입니다. 각 하위 그룹에는 유사한 특성이 있으므로 하위 그룹에서 개인을 샘플링하는 대신 전체 하위 그룹을 무작위로 선택할 수 있습니다. 비용 절감을 위해 이러한 유형의 방법을 통계학자가 선택할 수 있습니다.

클러스터 샘플은 전체 모집단에 샘플을 퍼뜨리지 않고 샘플링된 단위에 대한 "포켓"을 형성합니다. 이렇게 하면 컬렉션과 관련된 작업에 대한 비용이 절감됩니다. 클러스터 샘플링을 사용해야 하는 또 다른 이유가 있을 수 있습니다. 다른 샘플링 방법의 경우 모집단의 단위 목록을 사용할 수 없기 때문입니다. 반면에 클러스터 샘플링의 경우 클러스터 목록을 쉽게 만들 수 있거나 사용할 수 있습니다.

그러나 클러스터 샘플링은 단순 무작위 샘플링 방법보다 효율성이 떨어지는 단점이 있습니다. 이 때문에 대규모의 소수의 군집을 조사하기 보다는 소규모의 다수의 군집을 대상으로 조사를 실시해야 한다. 보고된 클러스터 샘플링 방법의 또 다른 단점은 샘플의 최종 크기에 대한 제어가 없다는 것입니다.

5. 다단계 샘플링

방법은 클러스터 샘플링 방법과 거의 유사합니다. 그러나 차이점은 전체 클러스터가 아닌 각 클러스터에서 샘플을 선택하여 샘플을 구성하는 데 있습니다. 이 샘플링 방법에는 두 단계가 있습니다. 첫 번째 단계에서는 많은 수의 클러스터를 식별한 후 선택합니다. 방법의 두 번째 단계에는 생성된 클러스터에서 단위 선택이 포함됩니다. 이는 모든 유형의 확률 샘플링 방법을 사용하여 수행할 수 있습니다. 따라서 다단계 선별 과정에서 형성된 클러스터는 기본 샘플링 단위, 즉 PSU입니다.

대조적으로, 클러스터 내에 존재하는 단위는 샘플링의 보조 단위라고 합니다. 이 유형의 샘플링 방법에는 더 많은 샘플링 단계가 있을 수 있습니다. 이러한 경우 3차 샘플링 단위가 선택되고 최종 샘플이 형성될 때까지 프로세스가 계속됩니다.

확률 샘플링의 장점

확률 샘플링 방법은 다양한 이점을 제공하는 다양한 기술로 구성됩니다. 단일 방법에는 고유한 장점이 있습니다. 장점 목록은 아래에 언급되어 있습니다 .

클러스터 샘플링 방법은 사용하기 쉽고 편리합니다.
단순 무작위 표본 추출 방법은 전체 모집단을 대표할 수 있는 표본 생성으로 이어집니다.
계층화된 샘플링 방법은 전체 모집단을 나타내는 모집단 레이어를 생성합니다.
체계적인 샘플링 방법에서 난수 생성을 위한 도구를 사용하지 않고 샘플을 쉽게 형성할 수 있습니다.

결론

확률 표본 추출은 모집단에서 표본을 선택하는 데 도움이 되는 표본 추출 방법의 한 유형입니다. 확률표본을 통한 표본 선정의 중요한 목표 중 하나는 추정치의 표본오차를 최소화하는 것이다. 또한 설문조사에 소요되는 시간과 함께 설문조사 비용을 줄여야 한다는 점에 유의해야 합니다. 이 기사에서는 확률 샘플링에 포함된 다양한 방법에 대해 논의했습니다.

인공 지능 및 기계 학습에 대해 자세히 알아보려면 작업 전문가를 위해 설계되었으며 450시간 이상의 엄격한 교육, 30개 이상의 사례 연구 및 과제를 제공하는 IIIT-B & upGrad의 온라인 기계 학습 및 AI 프로그램 을 확인하십시오. IIIT-B 동문 자격, 5개 이상의 실용적인 실습 캡스톤 프로젝트 및 최고의 기업과의 취업 지원.

기계 학습 및 인공 지능 분야에서 경력 향상

IIITB에서 AI-ML의 임원 인증을 지금 신청하십시오