Ki Kare Testi: Giriş, Nasıl Hesaplanır, Ne Zaman Kullanılır

Yayınlanan: 2022-11-09

İstatistikte, ki-kare testi, normal olarak dağılmış bir değişkenler koleksiyonunun gözlemlerinden elde edilen verileri analiz etmek için kullanılır. Tipik olarak, bu, iki sayısal bilgi setinin karşılaştırılmasını içerir. Karl Pearson ilk olarak kategorik verileri analiz etmek ve dağıtmak için bu yöntemi önerdi ve buna Pearson'ın ki-kare testi adını verdi.

Pearson tarafından geliştirilen ki-kare testi, bir veya daha fazla ki-kare tablosu kategorisinde tahmin edilen ve gerçek frekanslar arasında anlamlı bir istatistiksel fark olup olmadığını değerlendirmek için bir olasılık tablosunda kullanılır.

İstatistiksel olarak, istatistikçiler bir modelin verilere ne kadar iyi uyduğunu belirlemek için ki-kare testini kullanır. Ki-kare istatistikleri, yeterli büyüklükte rastgele, birbirini dışlayan, ham, bağımsız değişken bir veri örneğine ihtiyaç duyar.

Dünyanın En İyi Üniversitelerinden Makine Öğrenimi Kursuna Kaydolun . Kariyerinizi hızlandırmak için Master, Executive PGP veya Gelişmiş Sertifika Programları kazanın.

İçindekiler

Ki-kare testi temel terminolojileri

Ki-kare testinin hesaplanması için standart formül, kare hatalarının veya yanlış pozitiflerin toplamının örnek varyansına bölünmesidir. Ki-kare testi kullanılırken uygulanan birkaç terim vardır. Bu terimler aşağıda tanımlanmıştır:

p değeri

p değeri, mevcut deneydekine eşit veya bundan daha büyük bir ki-kare elde etme olasılığıdır ve veriler hala hipotezi desteklemektedir. Bu olasılık yüzde olarak ifade edilir. Beklenen varyasyonların rastgele oluşumlardan başka bir şeyden kaynaklanmama olasılığını ifade eder.
p değeri 0,05'ten küçükse dikkate alınan hipotez kabul edilir. Değer 0,05'ten büyükse hipotez reddedilir.

Özgürlük derecesi

Bir tahmin problemi, bağımsız değişkenlerin sayısına eşit belirli bir serbestlik derecesine sahiptir. Bu değişkenlerin değerleri üzerinde kesin sınırlar olmamasına rağmen, veri setimizin tahmin edilen parametrelerle tutarlı olmasını istiyorsak, diğer değişkenlere sınırlar koyarlar.

"Serbestlik derecesi"nin bir tanımı, veri kümesindeki mantıksal olarak birbirinden bağımsız ve dolayısıyla değişikliğe tabi olan en fazla sayıda değerdir. Bir veri setindeki toplam gözlem sayısından bir tanesinin çıkarılması, serbestlik derecesini verir.

Serbestlik derecesi kavramının ele alındığı öne çıkan bir bağlam, ki-kare gibi istatistiksel hipotez testleri bağlamındadır.

Ki-kare istatistiğinin önemini ve sıfır hipotezinin sağlamlığını anlamak, büyük ölçüde serbestlik derecesinin doğru bir şekilde hesaplanmasına dayanır.

Varyans

Rastgele sayı örneğinin varyansı, ortalama etrafındaki dağılımının bir ölçüsüdür. Standart sapma değerinin karesi alınarak hesaplanır.

Ki-kare Testini Gerçekleştirecek Özellikler

Ki-kare testi aşağıdaki özelliklere sahiptir:

  • Ortalama dağılım, serbestlik derecesi sayısına eşittir.
  • Varyans, serbestlik derecesinin iki katına eşit olmalıdır.
  • Serbestlik derecesi büyüdükçe, ki-kare dağılım eğrisi normal dağılım eğrisine, yani bir çan eğrisine benzemeye başlar.

En İyi Makine Öğrenimi Kursları ve Çevrimiçi Yapay Zeka Kursları

LJMU'dan Makine Öğrenimi ve Yapay Zeka Bilim Ustası IIITB'den Makine Öğrenimi ve Yapay Zeka alanında Yönetici Yüksek Lisans Programı
IIITB'den Makine Öğrenimi ve NLP'de İleri Düzey Sertifika Programı IIITB'den Makine Öğrenimi ve Derin Öğrenmede Gelişmiş Sertifika Programı Maryland Üniversitesi'nden Veri Bilimi ve Makine Öğrenimi alanında Yönetici Yüksek Lisans Programı
Tüm kurslarımızı keşfetmek için aşağıdaki sayfamızı ziyaret edin.
Makine Öğrenimi Kursları

Ki-kare Testi nasıl yapılır?

Dağıtım için Ki-kare aşağıdaki formül kullanılarak hesaplanır:

2 = [(Gözlenen değer – Beklenen Değer ) 2 / Beklenen Değer]

Ki-kare istatistiğini hesaplamak için izlenecek adımlar

  1. Gözlenen ve beklenen değeri hesaplayın.
  2. Beklenen değerlerin her birini dağılım tablosundaki gözlenen değerden çıkarın.
  3. Adım 2'de elde ettiğiniz her gözlem için değeri kareleyin.
  4. Bu kare değerlerin her birini karşılık gelen beklenen değerlere bölün.
  5. Adım 4'te elde ettiğimiz tüm değerleri toplamak, ki-kare istatistiğini tanımlayan bir değer verir.
  6. Ki-kare testlerinin yukarıda belirtilen özellik memnuniyetini kontrol etmek için serbestlik derecesini hesaplayın.

Ki-Kare Testi Türleri

Formda olmanın güzelliği

Evrenin bir örneğinin bütünü ne kadar iyi temsil ettiğini görmek istiyorsanız, Ki-kare uyum iyiliği testini uygulayabilirsiniz. Örnek popülasyon ve öngörülen örnek popülasyon bu teknik kullanılarak karşılaştırılır.

Bağımsızlık Testi

Bu Ki-kare testi, iki kategorik değişken arasında bir korelasyon olup olmadığını belirlemek için bir popülasyonun bağımsızlığını test eder. Bağımsız test, gözlemlenen tek bir parametreyi teorik bir popülasyonla karşılaştırmadığından uyum iyiliği testinden farklıdır. Bunun yerine, bağımsızlık testi, bir örnek kümesindeki iki değeri birbiriyle karşılaştırır.

Homojenlik Testi

Bağımsızlık testinde olduğu gibi, homojenlik testi de aynı format ve prosedürü takip eder. İkisi arasındaki kritik ayrım, homojenlik testinin bir değişkenin birçok popülasyonda aynı dağılıma sahip olup olmadığını incelemesidir. Buna karşılık, bağımsızlık testi, benzer bir popülasyon içindeki iki kategorik değişken arasında bir bağlantının varlığını inceler.

Ki-kare testini ne zaman kullanmalısınız?

Ki-Kare Testi, gerçek değerlerin teorik olasılıklarla tutarlı olup olmadığını belirler. Ki-Kare, analiz edilen veriler rastgele bir örneklemden geldiğinde ve söz konusu değişken kategorik olduğunda kullanılacak en güvenilir testtir.

İsteğe Bağlı Makine Öğrenimi Becerileri

Yapay Zeka Kursları Tablo Kursları
NLP Kursları Derin Öğrenme Kursları

Ki-kare testi nerelerde kullanılır?

Bir pazarlama şirketi örneğini ele alalım.
Bir pazarlama şirketi, tüketici coğrafyası ile marka seçimleri arasındaki korelasyona bakıyor. Sonuç olarak, ki-kare önemli bir rol oynar ve istatistiğin değeri, şirketin gelirleri en üst düzeye çıkarmak için pazarlama yaklaşımını coğrafyalar arasında nasıl uyarlayabileceği konusunda bilgi verecektir.
Ki-kare testi, verileri analiz ederken, kategorik değişkenlerin tutarlılığını veya bağımsızlığını ve ayrıca incelenen uyum iyiliği modelini kontrol etmek için kullanışlıdır.

Benzer şekilde, ki-kare istatistiği tıp mesleğinde kullanım bulabilir. Ki-kare testi, bir kontrol grubuna kıyasla bir ilacın etkinliğini belirlemek için uygundur.

Popüler Makine Öğrenimi ve Yapay Zeka Blogları

IoT: Tarih, Bugün ve Gelecek Makine Öğrenimi Eğitimi: Makine Öğrenimi Öğrenin Algoritma nedir? Basit ve Kolay
Hindistan'da Robotik Mühendisi Maaşı : Tüm Roller Bir Makine Öğrenimi Mühendisinin Hayatından Bir Gün: Ne yapıyorlar? IoT (Nesnelerin İnterneti) Nedir?
Permütasyon ve Kombinasyon: Permütasyon ve Kombinasyon Arasındaki Fark Yapay Zeka ve Makine Öğreniminde En İyi 7 Trend R ile Makine Öğrenimi: Bilmeniz Gereken Her Şey

Çözüm

Bu makalede, Ki-kare istatistiklerini ve değerlerinin nasıl hesaplanacağını öğrendiniz. Ki-kare kategorik değişkenlerle çalıştığından, genellikle anket yanıt verilerini araştıran akademisyenler tarafından kullanılır. Bu çalışma biçimi, sosyoloji, psikoloji, ekonomi, siyaset bilimi ve pazarlama dahil olmak üzere birçok alanda yaygındır.

upGrad ile Makine Öğrenimi ve Yapay Zeka Alanında Yüksek Lisans Derecenizi Alın

Sonunda bir Bilim Ustası elde etmek mi istiyorsunuz? upGrad, size mümkün olan en küratörlü kursu sunmak için IIIT-B ve Liverpool John Moores Üniversitesi ile işbirliği yaptı. Makine Öğrenimi ve Yapay Zekada Bilim Ustası ile, Doğal Dil İşleme, Derin Öğrenme, Takviyeli Öğrenme vb. gibi ML ve AI alanında talep edilen her beceriyi öğreneceksiniz.

Uygunluk kriterleri:

  • Lisans Derecesini %50 ile Tamamlama
  • IIIT-B tarafından Makine Öğrenimi ve Yapay Zeka alanında Yönetici Yüksek Lisans Programının Tamamlanması
  • Minimum bir yıllık iş tecrübesi tercih sebebidir

Bu kursun size sundukları:

  • Öğrenmek için 750 saatten fazla kurs materyali
  • Çalışan profesyoneller için tasarlandı
  • 15'ten fazla ödev ve vaka çalışması
  • 6'sı capstone proje olmak üzere 12'den fazla proje
  • Canlı kodlama dersleri
  • Profil oluşturma atölyeleri
  • Kariyer Eğitim Kampı
  • Bire bir yüksek performanslı koçluk
  • Bire bir kariyer mentorluğu seansları
  • Ayrıcalıklı iş fırsatları
  • Kişiselleştirilmiş endüstri oturumları

Ki-kare testi ile p değeri nasıl ilişkilidir?

p-değeri, test istatistiği değerinin sağındaki ki-kare yoğunluk eğrisinin altındaki bölgedir. Ki-kare testi istatistiğinin sıfır hipotezini reddetmek için yeterince büyük olup olmadığı, ki-kare anlamlılık testindeki son adımdır. Bu amaçla p değeri kullanılır.

Ki-kare testini kullanmanın herhangi bir sınırlaması veya dezavantajı var mı?

İncelenen tüm bireyler benzersiz olmalıdır; yoksa sonuçlar anlamsız olurdu. Belirli bir yanıtlayıcı iki farklı grupta sınıflandırılabiliyorsa, ki-kare testi kullanılmamalıdır. Ki-karenin bir diğer kısıtlaması, yalnızca frekans verileri için kullanılabilmesidir. Ek olarak, tüm sınıflardaki tahmin edilen tüm kişilerin toplamı 5'ten büyük olmalıdır.

Ki-kare testinin güçlü yönleri nelerdir?

Birincil güçlü yönlerinden biri, ki-karenin hızlı ve kolay bir şekilde hesaplanabilmesidir. Nominal veriler de bu yöntem kullanılarak kullanılabilir. İstatistiksel anlamlılık için ikiden fazla kategorik değişken grubunu karşılaştırmak için de kullanılabilir.