İstatistikte Güç Analizi: Nedir ve Nasıl Yapılır?

Yayınlanan: 2021-01-08

Hipotez testi, herhangi bir İstatistiksel Analizin çok önemli bir yönüdür. Ancak, yaptığımız testin mümkün olduğunca doğru olabilmesi için önceden tanımlanması gereken çok şey var. Güç kavramının devreye girdiği ve İstatistiksel Testin buluşsal yöntemlerini tanımladığı yer burasıdır.

Bu eğitimin sonunda şunları bileceksiniz:

  • İstatistiksel Testlerin Buluşsal Yöntemleri
  • Bir testin gücü nedir?
  • Güç Analizine ne gerek var?
  • Güç Analizi nasıl yapılır

İçindekiler

İstatistiksel Testlerin Buluşsal Yöntemleri

Testi gerçekleştirmeden önce önceden ayarlanması gereken birkaç buluşsal yöntem üzerinde doğru İstatistiksel Testler yapmak. Test başlatıldıktan sonra değiştirilemeyecekleri için doğru buluşsal yöntemlerin ayarlanması son derece önemlidir. Bunlardan birkaçına bir göz atalım.

1. Önem Düzeyi ve Güven Aralığı

Herhangi bir istatistiksel teste başlamadan önce, bir olasılık eşiğinin ayarlanması gerekir. Bu eşik veya önem düzeyi, Kritik Değer (alfa) olarak adlandırılır. Alfa değerinin ötesinde, olasılık eğrisinin altındaki tam bölge, Kritik Bölge olarak adlandırılır.

Alfa değeri, sıfır hipotezini reddetmenin yeterince olağandışı olduğu sonucuna varmadan önce, örnek veri noktasının (veya deney noktasının) sıfır hipotezinden (orijinal ortalama nokta) ne kadar uzakta olması gerektiğini söyler. Kullanılan yaygın bir alfa değeri 0,05 veya %95 güven aralığıdır.

2. P-Değeri

Elde ettiğimiz test sonuçlarının istatistiksel olarak anlamlı olup olmadığını değerlendirmek için test öncesi belirlediğimiz Kritik Değeri (alfa) testin P-Değeri ile karşılaştırırız. p değeri, test ettiğimiz değer kadar uç veya hatta daha uç değerler alma olasılığıdır.

3. Tip 1 ve Tip 2 Hatalar

İstatistiksel Testler asla %100 kesin olamaz. Her zaman hataya ve sonuçlar tarafından yanıltılmaya yer vardır. Yukarıda tartışıldığı gibi, 0,05'lik bir alfa değeri belirlersek, %95'lik bir güven aralığı vardır. Bu nedenle vardığınız sonucun yanlış ve yanıltıcı olma olasılığı %5'tir. Bu hatalı sonuçlar bizim hata olarak adlandırdığımız sonuçlardır. 2 tür hata vardır – Tip 1 ve Tip 2.

0,05 anlamlılık düzeyi değeri, istatistiksel testinizin %95 kat doğru olacağı anlamına gelir. Bu da yanlış olma olasılığının %5 olduğu anlamına gelir! Bu, sıfır hipotezini doğruyken reddetmeniz durumu olacaktır. Bu, Tip 1 Hataya bir örnektir. Ayrıca alfa( α )'nin 1. Tip hata yapma olasılığı olduğunu da söyleyebiliriz .

Boş hipotezin doğru olduğu sonucuna vardığınızda veya yanlış olduğunda kabul ettiğinizde de olabilir. Teknik olarak, sıfır hipotezini asla kabul edemeyiz. Sadece reddetmekte başarısız olabiliriz. Buna Tip 2 Hata diyoruz. Benzer şekilde, 2. Tip hata yapma olasılığınız Beta — β ile verilir .

Okuyun: Veri Analistleri: Ustalaşmak İçin En İyi Beceriler ve Araçlar

İstatistiksel Testin Gücü Nedir?

Bir testin gücü, yanlış olduğunda Sıfır Hipotezini doğru olarak reddetme olasılığıdır. Veya başka bir deyişle, Güç, 2. tip hata yapma olasılığı ile ters orantılıdır. Bu nedenle, Güç = 1- β. Örneğin, gücü %80 olarak ayarlarsak, istatistiksel testlerimizin %80'inin sahte değil, doğru olduğunu kastediyoruz. Bu nedenle, güç değeri ne kadar yüksek olursa, 2. tip hata yapma olasılığı o kadar düşük olur.

Ama sonuçlar neden sahte olabilir? Çünkü burada rastgele örneklerle uğraşıyoruz. Ve bazen alınan örnek dağılımın ortalamasından çok uzaktır ve bu nedenle gerçekçi olmayan sonuçlar vererek bizi yanlış kararlar almaya zorlar. Güç Analizinin tüm amacı, bu yanlış kararları vermemizi engellemektir.

P-Hack mi yapıyoruz?

COVID-19 için bir aşı yaptığımız bir örneği ele alalım ve aşının önemli sonuçları olacağından çok eminiz. İnancımızın istatistiksel olarak da doğru olup olmadığını görmek için bir İstatistiksel test yapmaya devam ediyoruz. Bu yüzden alfayı 0,05 olarak ayarlayın ve 100 örnek kullanarak bir test yapın.

Testten sonra 0.06 olarak bir P değeri elde ederiz. Sıfır hipotezini güvenle reddedebilmemiz için alfamıza çok yakın olduğunu ancak ondan daha az olmadığını görüyoruz. Örnekleri artırıp testi yeniden yaparsak ne olacağını görmek cazip hale geliyor.

Böylece 50 örnek daha ekliyoruz ve P-Değerinin şimdi 0.045 olarak geldiğini görüyoruz. Az önce aşımızın istatistiksel olarak anlamlı olduğunu kanıtladık mı? HAYIR! İlk sonucu aldıktan sonra örnek sayısını artırdığımız için sadece P-hackledik. P-Hacking Nedir ve Nasıl Önlenir? hakkında daha fazla bilgi edinin .

Güç Analizi Nedir?

Yukarıdaki örnekte gördüğümüz gibi örneklem boyutunun küçük olduğunu gördük ve daha sonra büyüttük. Bu yanlıştır ve asla yapılmamalıdır. Numune boyutu değeri, teste başlamadan önce önceden ayarlanmalıdır. Ama bizim için hangi örneklem büyüklüğü değeri doğru?

Örneklem boyutunu sadece 1 olarak kullanarak birden fazla test yaptığımız bir örneği ele alalım. Bu nedenle, popülasyondan rastgele 1 veri noktasını örneklediğimizde, verilerimizi doğru temsil eden ortalama civarında olabilir veya çok fazla olabilir. ortalamadan uzaktır ve verileri iyi temsil etmez.

Sorun, bu uzak veri noktalarını kullanarak istatistiksel testler yaptığımızda ortaya çıkıyor. Alacağımız P değeri yanlış olacaktır. Şimdi numune boyutu olarak 2 alarak başka bir dizi test yapıyoruz. Şimdi, bir değer veri ortalamasından uzak olsa bile, dağılımın diğer tarafında bulunan diğer değer, bunların ortalamasını merkeze çekecek ve dolayısıyla o uzak değerin etkisini azaltacaktır. Bu nedenle, örneklem büyüklüğü 2 olduğunda, sonuçlarımız doğru P-Değerleri ile daha doğru olacaktır.

Güç Analizi, testleri mümkün olduğu kadar iyi yürütmek için gereken doğru miktarda numune boyutunu bulmak için kullanılan tekniktir. İhtiyacımız olan Güç ne kadar yüksek olursa, gerekli olacak numune boyutu miktarı da o kadar fazladır. Bu nedenle, büyük bir örneklem boyutu daha iyi ve daha güvenilir sonuçlar anlamına geldiği için neden sadece büyük bir örneklem boyutu almadığınızı düşünebilirsiniz. Bu doğru değildir, çünkü veri toplamak maliyetlidir ve gerekli örneklem büyüklüğü bilgisi esastır.

Güç Analizi nasıl yapılır?

Bir testin gücü bazı faktörlere bağlıdır. Bir güç analizi gerçekleştirmenin ilk adımı bir Güç Değeri belirlemektir. 0,8'lik bir ortak güç belirlediğinizi, yani sıfır hipotezini doğru bir şekilde reddetmek için en az %80 şansa sahip olmak istediğinizi düşünün. COVID-19 aşısının bir grup insan üzerindeki etkisini doğruluyorsak, aşılanmış kişilerin veri noktalarının dağılımının plasebo verilen insanlardan farklı olduğunu kanıtlamak istiyoruz.

1. Örtüşme miktarı

Karşılaştırdığımız iki dağılım arasındaki örtüşme miktarını dikkate almamız gerekiyor. Örtüşme ne kadar fazla olursa, boş değeri güvenli bir şekilde reddetmek bizim için o kadar zor olacak ve bu nedenle daha fazla örnek boyutuna ihtiyacımız olacak. Bununla birlikte, örtüşme çok daha az ise, o zaman boş değeri oldukça güvenli bir şekilde reddedebiliriz. Ve oldukça daha az numune boyutuna ihtiyaç duyacağız. Örtüşme, iki dağılımın ortalamaları ve bunların standart sapmaları arasındaki mesafeye bağlıdır.

2. Etki boyutu

Etki boyutu, popülasyonların ortalamaları ve standart sapmaları arasındaki farkın etkilerini birleştirmenin bir yoludur. Etki boyutu (d), Ortalamalar arasındaki tahmini farkın Havuzlanmış tahmini standart sapmalara bölünmesiyle hesaplanır. Havuzlanmış tahmini Standart Sapmaları hesaplamanın en basit yollarından biri, Standart sapmaların kare toplamının 2'ye bölünmesinin karekökü'dür.

Güç değeri, alfa değeri ve etki boyutu elde ettiğimizde, bu değerleri bir İstatistik Güç Hesaplayıcısına bağlayabilir ve örnek boyutu değerini alabiliriz. Böyle bir İstatistik Güç Hesaplayıcı internette kolayca bulunabilir.

Dünyanın en iyi Üniversitelerinden veri bilimi sertifikası alın . Kariyerinizi hızlandırmak için Yönetici PG Programları, İleri Düzey Sertifika Programları veya Yüksek Lisans Programları öğrenin.

Gitmeden önce

Örnek boyutunu Power, alpha ve efekt boyutunu kullanarak Güç Analizi yaparak hesapladık. Dolayısıyla, örneklem büyüklüğü değeri 7 ise, bu, Sıfır Hipotezini doğru bir şekilde reddetme şansımızın %80'i için 7'lik bir örneklem büyüklüğüne ihtiyacımız olduğu anlamına gelir. Doğru miktarda alan uzmanlığına sahip olmak, nüfus araçlarını ve bunların örtüşmelerini ve gereken gücü tahmin etmek için de çok önemlidir.

Veri bilimi hakkında bilgi edinmek istiyorsanız, çalışan profesyoneller için oluşturulan ve 10'dan fazla vaka çalışması ve proje, uygulamalı uygulamalı atölye çalışmaları, endüstri uzmanlarıyla mentorluk sunan IIIT-B & upGrad'ın Veri Biliminde PG Diplomasına göz atın, 1- endüstri danışmanlarıyla bire bir, en iyi firmalarla 400+ saat öğrenim ve iş yardımı.

Güç Analizi Nedir?

Bir testin veya Güç analizinin gücü, yanlış olduğunda Sıfır Hipotezini doğru olarak reddetme olasılığıdır. Veya başka bir deyişle, Güç, 2. tip hata yapma olasılığı ile ters orantılıdır. Bu nedenle, Güç = 1-β. Örneğin, gücü %80 olarak ayarlarsak, istatistiksel testlerimizin %80'inin doğru olduğunu ve sahte olmadığını kastederiz. Bu nedenle, güç değeri ne kadar yüksek olursa, 2. tip hata yapma olasılığı o kadar düşük olur. Güç Analizi, çeşitli rastgele örneklerle uğraştığımız için yanlış kararları önlemekle ilgilidir ve ortalamalarının gerçekçi olmayan bir ortalama verme ve bizi yanlış kararlar vermeye yönlendirme olasılığı yüksektir.

Güç Analizimizi taşırken hangi faktörler göz önünde bulundurulur?

Güç analizi için testi etkileyen belirli faktörler vardır. İlk adım, güç değerini ayarlamaktır. 0,7 değerinde bir gücümüz olduğunu varsayalım; bu, sıfır hipotezini reddetme şansınızın %70 olduğu anlamına gelir. Güç analizini etkileyen faktörler aşağıdadır. Örtüşme miktarı, karşılaştırılmakta olan iki dağılım arasındaki örtüşmedir. Örtüşme miktarı, boş hesaplamanın zorluğuyla doğru orantılı olduğundan, örtüşme mümkün olduğunca küçük olmalıdır. Etki büyüklüğü, popülasyonların ortalaması ve standart sapması arasındaki farkı kulüplemek için bir yöntemdir. "d" ile gösterilir ve ortalamalar arasındaki tahmini farkın Havuzlanmış tahmini standart sapmalara bölünmesiyle hesaplanır. Artık güç değeri, alfa değeri (örtüşme miktarı) ve efekt boyutu elimizde olduğundan, Güç Analizini kolayca gerçekleştirebiliriz.

P-Hackleme nedir?

P-Hacking veya Veri tarama, verilerde önemli görünen ancak önemli olmayan kalıpları bulmak için veri analizi tekniklerini kötüye kullanma yöntemidir. Bu yöntem, önemli veri kalıpları sağlamak için yanlış sözler verdiği için çalışmayı olumsuz etkiler ve bu da yanlış pozitiflerin sayısında ciddi bir artışa yol açabilir. P-hack tamamen engellenemez ancak kesinlikle azaltabilecek ve tuzaktan kaçınmaya yardımcı olabilecek bazı yöntemler vardır.