Analiza puterii în statistică: ce este și cum se efectuează?

Publicat: 2021-01-08

Testarea ipotezelor este un aspect crucial al oricărei analize statistice. Cu toate acestea, există o mulțime de lucruri care trebuie predefinite, astfel încât testul pe care îl facem să fie cât mai corect posibil. Aici intervine conceptul de putere și definește euristica unui Test statistic.

Până la sfârșitul acestui tutorial, veți ști:

Euristica testelor statistice
Care este puterea unui test?
Care este nevoie de analiza puterii?
Cum se efectuează analiza puterii

Cuprins

Euristica testelor statistice

Efectuarea de teste statistice corecte pe mai multe euristici care trebuie presetate înainte de efectuarea testului. Este foarte important să setați euristicile potrivite, deoarece acestea nu pot fi modificate odată ce testul este început. Să aruncăm o privire la câteva dintre acestea.

1. Nivelul de semnificație și intervalul de încredere

Înainte de a începe orice test statistic, trebuie stabilit un prag de probabilitate. Acest prag sau nivel de semnificație se numește Valoare Critică (alfa). Regiunea completă sub curba de probabilitate dincolo de valoarea alfa se numește Regiunea critică.

Valoarea alfa ne spune cât de departe trebuie să fie punctul de date eșantion (sau punctul experimental) de ipoteza nulă (punctul mediu original) înainte de a concluziona că este suficient de neobișnuit pentru a respinge ipoteza nulă. O valoare comună a alfa care este utilizată este intervalul de încredere de 0,05 sau 95%.

2. Valoarea P

Pentru a evalua dacă rezultatele testului pe care le-am obținut sunt semnificative statistic sau nu, comparăm valoarea critică (alfa) pe care am stabilit-o înainte de test cu valoarea P a testului. Valoarea p este probabilitatea de a obține valori la fel de extreme sau chiar mai extreme ca valoarea pentru care testăm.

3. Erori de tip 1 și tip 2

Testele statistice nu pot fi niciodată 100% sigure. Există întotdeauna loc de eroare și de a fi indus în eroare de rezultate. După cum sa discutat mai sus, dacă setăm o valoare alfa de 0,05, există un interval de încredere de 95%. Prin urmare, există o șansă de 5% ca rezultatul pe care îl obțineți să fie incorect și înșelător. Aceste rezultate incorecte sunt ceea ce numim erori. Există 2 tipuri de erori – Tip 1 și Tip 2.

Valoarea nivelului de semnificație de 0,05 înseamnă că testul dvs. statistic va fi de 95% ori corect. Ceea ce înseamnă, de asemenea, că există 5% șanse ca acesta să fie incorect! Acesta va fi cazul în care respingeți ipoteza nulă atunci când a fost corectă. Acesta este un exemplu de eroare de tip 1. Și mai putem spune că alfa( α ) este probabilitatea de a comite o eroare de tip 1.

Poate fi, de asemenea, un caz când trageți concluzia că ipoteza nulă este adevărată sau o acceptați când este falsă. Din punct de vedere tehnic, nu putem accepta niciodată ipoteza nulă. Nu putem decât să nu o respingem. Aceasta este ceea ce numim o eroare de tip 2. În mod similar, probabilitatea de a face o eroare de tip 2 este dată de Beta — β .

Citiți: Analiști de date: abilități și instrumente de top de stăpânit

Care este puterea unui test statistic?

Puterea unui test este probabilitatea de a respinge corect ipoteza nulă atunci când aceasta este falsă. Sau, cu alte cuvinte, puterea este invers proporțională cu probabilitatea de a face o eroare de tip 2. Prin urmare, Puterea = 1- β. De exemplu, dacă setăm puterea la 80%, atunci ne referim că 80% dintre testele noastre statistice sunt corecte și nu cele false. Prin urmare, cu cât valoarea puterii este mai mare, cu atât este mai mică probabilitatea de a comite o eroare de tip 2.

Dar de ce pot fi rezultatele false? Acest lucru se datorează faptului că aici avem de-a face cu mostre aleatorii. Și uneori, eșantionul care este prelevat este prea departe de media distribuției și, prin urmare, dă rezultate nerealiste, forțându-ne să luăm decizii incorecte. Scopul analizei puterii este de a ne împiedica să luăm aceste decizii incorecte.

Suntem P-Hacking?

Să luăm un exemplu în care am realizat un vaccin pentru COVID-19 și suntem foarte siguri că vaccinul va avea rezultate semnificative. Continuăm să efectuăm un test statistic pentru a vedea dacă credința noastră este adevărată și statistic. Deci setați alfa la 0,05 și efectuați un test folosind 100 de mostre.

După test, obținem o valoare P ca 0,06. Vedem că este atât de aproape de alfa noastră, dar nu mai puțin decât aceasta, astfel încât să putem respinge în siguranță ipoteza nulă. Devine tentant să vedem ce se întâmplă dacă creștem probele și refacem testul.

Așa că adăugăm încă 50 de mostre și vedem că valoarea P vine acum ca 0,045. Tocmai am dovedit că vaccinul nostru este semnificativ statistic? NU! Tocmai am spart P, deoarece am crescut numărul de mostre după ce am obținut primul rezultat. Aflați mai multe despre Ce este P-Hacking și Cum să îl evitați?

Ce este analiza puterii?

După cum am văzut în exemplul de mai sus, am constatat că dimensiunea eșantionului era mică și am mărit-o ulterior. Acest lucru este greșit și nu ar trebui făcut niciodată. Valoarea dimensiunii eșantionului ar trebui să fie presetată înainte de a începe testul în sine. Dar ce valoare a dimensiunii eșantionului este potrivită pentru noi?

Să luăm în considerare un exemplu în care efectuăm mai multe teste folosind dimensiunea eșantionului ca doar 1. Prin urmare, atunci când eșantionăm 1 punct de date aleatoriu din populație, acesta poate fi fie în jurul mediei care reprezintă corect datele noastre, fie poate fi, de asemenea, mult departe de medie și nu reprezintă bine datele.

Problema apare atunci când efectuăm teste statistice folosind aceste puncte de date îndepărtate. Valoarea P pe care o vom obține va fi incorectă. Acum efectuăm o altă serie de teste luând 2 ca dimensiune a eșantionului. Acum, chiar dacă o valoare este departe de media datelor, cealaltă valoare care se află de cealaltă parte a distribuției va trage media lor în centru, reducând astfel efectul acelei valori îndepărtate. Prin urmare, cu o dimensiune a eșantionului de 2, rezultatele noastre vor fi mai adevărate cu valorile P corecte.

Analiza puterii este tehnica folosită pentru a afla cantitatea potrivită de dimensiunea eșantionului care este necesară pentru a efectua teste cât mai bine posibil. Mai mare puterea de care avem nevoie mai mult este cantitatea de dimensiune a eșantionului care va fi necesară. Deci s-ar putea să vă gândiți că de ce să nu luați o dimensiune mare a eșantionului, deoarece o dimensiune mare a eșantionului înseamnă rezultate mai bune și mai de încredere. Acest lucru nu este corect, deoarece colectarea datelor este costisitoare și cunoașterea dimensiunii eșantionului necesară este esențială.

Cum se efectuează analiza puterii?

Puterea unui test depinde de anumiți factori. Primul pas pentru a efectua o analiză de putere este setarea unei valori de putere. Luați în considerare că setați o putere comună de 0,8, ceea ce înseamnă că doriți să aveți cel puțin 80% șanse de a respinge corect ipoteza nulă. Dacă validăm efectul vaccinului COVID-19 asupra unui set de oameni, dorim să demonstrăm că distribuția punctelor de date ale persoanelor vaccinate este diferită de cea a persoanelor cărora li sa administrat un placebo.

1. Cantitatea de suprapunere

Trebuie să luăm în considerare cantitatea de suprapunere dintre cele două distribuții pe care le comparăm. Cu cât se suprapune, cu atât ne va fi mai dificil să respingem în siguranță nulul și, prin urmare, vom avea nevoie de mai multă dimensiune a eșantionului. Cu toate acestea, dacă suprapunerea este foarte mică, atunci putem respinge destul de ușor în siguranță nulul. Și am avea nevoie de o dimensiune destul de mică a eșantionului. Suprapunerea depinde de distanța dintre mediile celor două distribuții și de abaterile standard ale acestora.

2. Dimensiunea efectului

Mărimea efectului este o modalitate de a combina efectele diferenței dintre medii și abaterile standard ale populațiilor. Mărimea efectului (d) este calculată ca Diferența estimată dintre medii împărțită la Abaterile standard estimate cumulate. Una dintre cele mai simple moduri de a calcula abaterile standard estimate cumulate este rădăcina pătrată a sumei pătrate a abaterilor standard împărțită la 2.

Deci, odată ce avem valoarea Putere, valoarea alfa și dimensiunea efectului, putem conecta aceste valori într-un Calculator de Putere Statistică și obținem valoarea mărimii eșantionului. Un astfel de Calculator de putere statistică este ușor disponibil pe internet.

Obțineți certificare în știința datelor de la cele mai bune universități din lume. Învață programe Executive PG, programe avansate de certificat sau programe de master pentru a-ți accelera cariera.

Inainte sa pleci

Am calculat dimensiunea eșantionului efectuând analiza puterii folosind puterea, alfa și dimensiunea efectului. Deci, dacă obținem o valoare a dimensiunii eșantionului de 7, va însemna că avem nevoie de o dimensiune a eșantionului de 7 pentru a avea șanse de 80% de a respinge corect ipoteza nulă. Deținerea cantității adecvate de expertiză în domeniu este, de asemenea, crucială pentru estimarea mijloacelor populației și a suprapunerilor acestora și a puterii necesare.

Dacă sunteți curios să aflați despre știința datelor, consultați Diploma PG în știința datelor de la IIIT-B și upGrad, care este creată pentru profesioniști care lucrează și oferă peste 10 studii de caz și proiecte, ateliere practice practice, mentorat cu experți din industrie, 1- on-1 cu mentori din industrie, peste 400 de ore de învățare și asistență profesională cu firme de top.

Ce este analiza puterii?

Puterea unui test sau analiză de putere este probabilitatea de a respinge corect Ipoteza Nulă atunci când aceasta este falsă. Sau, cu alte cuvinte, puterea este invers proporțională cu probabilitatea de a face o eroare de tip 2. Prin urmare, Puterea = 1-β. De exemplu, dacă setăm puterea la 80%, înseamnă că 80% dintre testele noastre statistice sunt corecte și nu false. Prin urmare, cu cât valoarea puterii este mai mare, cu atât este mai mică probabilitatea de a comite o eroare de tip 2. Analiza puterii se referă la prevenirea deciziilor greșite, deoarece manipulăm diverse eșantioane aleatorii și există șanse mari ca media lor să dea o medie nerealistă și să ne conducă să luăm decizii incorecte.

Ce factori sunt luați în considerare în timpul analizei noastre de putere?

Există anumiți factori care afectează testul pentru analiza puterii. Primul pas este să setați valoarea puterii. Să presupunem că avem o putere de 0,7 valoare, ceea ce implică că aveți șanse de 70% să respingeți ipoteza nulă. Mai jos sunt factorii care afectează analiza puterii. Cantitatea de suprapunere este suprapunerea dintre cele două distribuții care sunt comparate. Suprapunerea ar trebui să fie cât mai mică posibil, deoarece cantitatea de suprapunere este direct proporțională cu dificultatea de a calcula nul. Mărimea efectului este o metodă de a stabili diferența dintre media și abaterea standard a populațiilor. Se notează cu „d” și se calculează ca diferența estimată între medii împărțite la abaterile standard estimate cumulate. Deoarece acum avem valoarea puterii, valoarea alfa (cantitatea de suprapunere) și dimensiunea efectului, putem realiza cu ușurință analiza puterii.

Ce este P-Hacking?

P-Hacking sau dragarea datelor este o metodă de utilizare greșită a tehnicilor de analiză a datelor pentru a găsi modele în date care par semnificative, dar nu sunt. Această metodă afectează negativ studiul, deoarece oferă promisiuni false de a furniza modele de date semnificative care pot duce, la rândul lor, la o creștere drastică a numărului de fals pozitive. P-hacking-ul nu poate fi prevenit complet, dar există câteva metode care cu siguranță îl pot reduce și ajuta la evitarea capcanei.