통계의 전력 분석: 그것이 무엇이며 어떻게 수행합니까?

게시 됨: 2021-01-08

가설 테스트는 모든 통계 분석의 중요한 측면입니다. 그러나 우리가 수행하는 테스트가 최대한 정확할 수 있도록 미리 정의해야 할 사항이 많이 있습니다. 여기에서 권력의 개념이 작동하고 통계 테스트의 휴리스틱을 정의합니다.

이 튜토리얼이 끝나면 다음을 알게 될 것입니다.

통계적 테스트의 휴리스틱
테스트의 힘은 무엇입니까?
전력 분석이 필요한 이유는 무엇입니까?
전력 분석을 수행하는 방법

통계적 테스트의 휴리스틱

테스트를 수행하기 전에 미리 설정해야 하는 여러 경험적 방법에 대해 올바른 통계 테스트를 수행합니다. 테스트가 시작되면 변경할 수 없으므로 올바른 경험적 방법을 설정하는 것이 매우 중요합니다. 이 중 몇 가지를 살펴보겠습니다.

1. 유의수준 및 신뢰구간

통계 테스트를 시작하기 전에 확률 임계값을 설정해야 합니다. 이 임계값 또는 유의 수준을 임계값(알파)이라고 합니다. 알파 값을 넘어 확률 곡선 아래의 전체 영역을 임계 영역이라고 합니다.

알파 값은 귀무 가설을 기각하기에 충분히 비정상적이라는 결론을 내리기 전에 표본 데이터 점(또는 실험 점)이 귀무 가설(원래 평균 점)에서 얼마나 멀리 떨어져 있어야 하는지를 알려줍니다. 사용되는 알파의 일반적인 값은 0.05 또는 95% 신뢰 구간입니다.

2. P-값

우리가 얻은 테스트 결과가 통계적으로 유의한지 여부를 평가하기 위해 테스트 전에 설정한 Critical Value(알파)와 테스트의 P-Value를 비교합니다. p-값은 우리가 테스트하는 값만큼 극단적이거나 더 극단적인 값을 얻을 확률입니다.

3. 유형 1 및 유형 2 오류

통계 테스트는 100% 확신할 수 없습니다. 항상 오류의 여지가 있고 결과에 의해 오도될 수 있습니다. 위에서 논의한 바와 같이 알파 값을 0.05로 설정하면 95%의 신뢰 구간이 있습니다. 따라서 얻은 결과가 정확하지 않고 오도할 가능성이 5%입니다. 이러한 잘못된 결과를 오류라고 합니다. 오류에는 유형 1과 유형 2의 두 가지 유형이 있습니다.

0.05의 유의 수준 값은 통계 테스트가 95% 정확함을 의미합니다. 이것은 또한 그것이 틀릴 확률이 5%라는 것을 의미합니다! 귀무가설이 옳았을 때 이를 기각하는 경우입니다. 이것은 1종 오류의 예입니다. 그리고 우리는 또한 alpha( α )가 제1종 오류를 범할 확률이라고 말할 수 있습니다.

귀무가설이 참이라는 결론을 내리거나 거짓일 때 이를 수용하는 경우도 있습니다. 기술적으로 우리는 귀무가설을 받아들일 수 없습니다. 우리는 그것을 거부하지 않을 수 있습니다. 이것은 우리가 2종 오류라고 부르는 것입니다. 유사하게, 제2종 오류를 범할 확률은 Beta — β 로 지정됩니다 .

읽기: 데이터 분석가: 마스터해야 할 최고의 기술 및 도구

통계 테스트의 힘은 무엇입니까?

검정력은 귀무가설이 거짓일 때 이를 올바르게 기각할 확률입니다. 즉, 검정력은 제2종 오류를 범할 확률에 반비례합니다. 따라서 전력 = 1- β입니다. 예를 들어 검정력을 80%로 설정하면 통계 테스트의 80%가 정확하고 가짜 테스트가 아님을 의미합니다. 따라서 검정력 값이 높을수록 제2종 오류를 범할 확률이 낮아집니다.

그러나 결과가 가짜일 수 있는 이유는 무엇입니까? 이것은 여기서 무작위 샘플을 다루기 때문입니다. 그리고 때때로 취한 표본이 분포의 평균에서 너무 멀리 떨어져 있어 비현실적인 결과를 제공하여 잘못된 결정을 내리게 합니다. 전력 분석의 전체 목표는 이러한 잘못된 결정을 내리는 것을 방지하는 것입니다.

우리는 P-해킹입니까?

우리가 COVID-19에 대한 백신을 만들었고 백신이 상당한 결과를 가져올 것이라고 매우 확신하는 예를 들어 보겠습니다. 우리의 믿음이 통계적으로도 사실인지 확인하기 위해 통계 테스트를 진행합니다. 따라서 알파를 0.05로 설정하고 100개의 샘플을 사용하여 테스트를 수행합니다.

테스트 후 P 값은 0.06입니다. 우리는 그것이 우리의 알파에 매우 가깝지만 귀무 가설을 안전하게 기각할 수 있도록 그보다 작지 않다는 것을 알 수 있습니다. 샘플을 늘리고 테스트를 다시 실행하면 어떤 일이 발생하는지 보고 싶은 유혹에 빠집니다.

따라서 50개의 샘플을 더 추가하고 P-값이 이제 0.045로 나오는 것을 확인합니다. 우리 백신이 통계적으로 유의미하다는 것을 방금 증명했습니까? 아니요! 우리는 첫 번째 결과를 얻은 후 샘플 수를 늘리면서 P-hacking했습니다. P-Hacking이란 무엇이며 어떻게 피해야 하는지 에 대해 자세히 알아보세요 .

전력 분석이란 무엇입니까?

위의 예에서 보았듯이 표본 크기가 작다는 것을 발견하고 나중에 늘렸습니다. 이것은 잘못된 것이며 절대 해서는 안 됩니다. 샘플 크기 값은 테스트 자체를 시작하기 전에 미리 설정해야 합니다. 그러나 우리에게 적합한 표본 크기의 값은 무엇입니까?

샘플 크기를 1로 사용하여 여러 테스트를 수행하는 예를 생각해 보겠습니다. 따라서 모집단에서 무작위로 1개의 데이터 포인트를 샘플링할 때 데이터를 올바르게 나타내는 평균 주변에 있을 수도 있고 많을 수도 있습니다. 평균과 거리가 멀고 데이터를 잘 나타내지 않습니다.

이 문제는 멀리 떨어진 데이터 포인트를 사용하여 통계 테스트를 수행할 때 발생합니다. 우리가 얻을 P 값은 올바르지 않습니다. 이제 2를 표본 크기로 사용하는 또 다른 일련의 테스트를 수행합니다. 이제 한 값이 데이터 평균에서 멀리 떨어져 있더라도 분포의 다른 쪽에 있는 다른 값은 평균을 중앙으로 가져와서 멀리 떨어진 값의 영향을 줄입니다. 따라서 표본 크기가 2인 경우 올바른 P-값을 사용하면 결과가 더 사실이 됩니다.

검정력 분석은 가능한 한 테스트를 수행하는 데 필요한 올바른 양의 표본 크기를 찾는 데 사용되는 기술입니다. 검정력이 높을수록 더 많이 필요한 표본 크기가 됩니다. 따라서 샘플 크기가 클수록 더 좋고 신뢰할 수 있는 결과를 의미하기 때문에 단순히 큰 샘플 크기를 사용하면 안 된다고 생각할 수도 있습니다. 데이터를 수집하는 데 비용이 많이 들고 필요한 샘플 크기에 대한 지식이 필수적이기 때문에 이는 옳지 않습니다.

전력 분석을 수행하는 방법은 무엇입니까?

검정력은 몇 가지 요인에 따라 달라집니다. 검정력 분석을 수행하는 첫 번째 단계는 검정력 값을 설정하는 것입니다. 0.8의 공통 검정력을 설정했다고 가정합니다. 즉, 귀무 가설을 올바르게 기각할 확률이 80% 이상이어야 합니다. 일련의 사람들에 대한 COVID-19 백신의 효과를 검증하는 경우 백신을 접종한 사람들의 데이터 포인트 분포가 위약을 투여받은 사람들의 데이터 포인트 분포와 다르다는 것을 증명하고 싶습니다.

1. 중첩량

비교하고 있는 두 분포 사이의 중첩 정도를 고려해야 합니다. 중첩이 많을수록 null을 안전하게 거부하기가 더 어려워지므로 더 많은 샘플 크기가 필요합니다. 그러나 겹침이 매우 적으면 null을 아주 쉽게 안전하게 거부할 수 있습니다. 그리고 우리는 훨씬 적은 샘플 크기를 요구할 것입니다. 겹침은 두 분포의 평균과 해당 표준 편차 간의 거리에 따라 다릅니다.

2. 효과 크기

효과 크기는 모집단의 평균과 표준 편차 간의 차이 효과를 결합하는 방법입니다. 효과 크기(d)는 평균 간의 추정 차이를 합동 추정 표준 편차로 나눈 값으로 계산됩니다. 합동 추정 표준 편차를 계산하는 가장 간단한 방법 중 하나는 표준 편차의 제곱합을 2로 나눈 제곱근입니다.

따라서 검정력 값, 알파 값 및 효과 크기가 있으면 이 값을 통계 검정력 계산기에 연결하고 샘플 크기 값을 얻을 수 있습니다. 이러한 통계력 계산기는 인터넷에서 쉽게 구할 수 있습니다.

세계 최고의 대학에서 데이터 과학 인증 을 받으십시오 . 이그 제 큐 티브 PG 프로그램, 고급 인증 프로그램 또는 석사 프로그램을 통해 경력을 빠르게 추적하십시오.

가기 전에

검정력, 알파 및 효과 크기를 사용하여 검정력 분석을 수행하여 표본 크기를 계산했습니다. 따라서 표본 크기 값이 7인 경우 귀무 가설을 올바르게 기각할 확률이 80%이려면 표본 크기가 7이어야 합니다. 적절한 양의 도메인 전문 지식을 보유하는 것도 모집단 평균과 그 중복 및 필요한 전력을 추정하는 데 중요합니다.

데이터 과학에 대해 자세히 알아보려면 IIIT-B & upGrad의 데이터 과학 PG 디플로마를 확인하세요. 이 PG 디플로마는 실무 전문가를 위해 만들어졌으며 10개 이상의 사례 연구 및 프로젝트, 실용적인 실습 워크숍, 업계 전문가와의 멘토링, 1- 업계 멘토와 일대일, 400시간 이상의 학습 및 최고의 기업과의 취업 지원.

전력 분석이란 무엇입니까?

검정 또는 검정력 분석의 검정력은 귀무 가설이 거짓일 때 올바르게 기각할 확률입니다. 즉, 검정력은 제2종 오류를 범할 확률에 반비례합니다. 따라서 전력 = 1-β입니다. 예를 들어 검정력을 80%로 설정하면 통계 테스트의 80%가 정확하고 가짜가 아니라는 의미입니다. 따라서 검정력 값이 높을수록 제2종 오류를 범할 확률이 낮아집니다. 검정력 분석은 다양한 무작위 표본을 처리하기 때문에 잘못된 결정을 방지하는 것이므로 평균이 비현실적인 평균을 제공하고 잘못된 결정을 내릴 가능성이 높습니다.

전력 분석을 수행하는 동안 어떤 요소를 고려합니까?

검정력 분석에 영향을 미치는 특정 요인이 있습니다. 가장 첫 번째 단계는 전력 값을 설정하는 것입니다. 귀무 가설을 기각할 확률이 70%임을 의미하는 0.7의 거듭제곱 값이 있다고 가정합니다. 다음은 Power 분석의 영향 요인입니다. 겹침의 양은 비교 중인 두 분포 간의 겹침입니다. 겹침의 양은 널 계산의 어려움에 정비례하기 때문에 겹침은 가능한 한 작아야 합니다. 효과 크기는 모집단의 평균과 표준 편차 간의 차이를 클럽화하는 방법입니다. "d"로 표시되며 평균 간의 추정 차이를 합동 추정 표준 편차로 나눈 값으로 계산됩니다. 이제 power 값, alpha 값(겹침의 양) 및 효과 크기가 있으므로 쉽게 Power Analysis를 수행할 수 있습니다.

P-해킹이란?

P-Hacking 또는 데이터 준설은 데이터 분석 기술을 오용하여 데이터에서 중요해 보이지만 그렇지 않은 패턴을 찾는 방법입니다. 이 방법은 중요한 데이터 패턴을 제공하기 위해 잘못된 약속을 제공하므로 연구에 부정적인 영향을 미치며 결과적으로 잘못된 긍정의 수가 급격히 증가할 수 있습니다. P-hacking을 완전히 막을 수는 없지만 확실히 줄이고 함정을 피하는 데 도움이 되는 몇 가지 방법이 있습니다.