Uji Chi Square: Pendahuluan, Cara Menghitung, Kapan Digunakan
Diterbitkan: 2022-11-09Dalam statistik, uji chi-kuadrat digunakan untuk menganalisis data dari pengamatan kumpulan variabel yang terdistribusi normal. Biasanya, ini melibatkan dua set informasi numerik yang kontras. Karl Pearson pertama kali mengusulkan metode ini untuk menganalisis dan mendistribusikan data kategoris, menamakannya uji chi-kuadrat Pearson.
Uji chi-kuadrat yang dikembangkan oleh Pearson digunakan dalam tabel kontingensi untuk mengevaluasi apakah ada perbedaan statistik yang signifikan antara frekuensi yang diprediksi dan frekuensi aktual dalam satu atau lebih kategori tabel chi-kuadrat.
Secara statistik, ahli statistik menggunakan uji chi-kuadrat untuk menentukan seberapa cocok suatu model dengan data. Statistik chi-kuadrat membutuhkan sampel data variabel acak, saling eksklusif, mentah, dan independen dengan ukuran yang memadai.
Mendaftar untuk Kursus Pembelajaran Mesin dari Universitas top dunia. Dapatkan Master, PGP Eksekutif, atau Program Sertifikat Tingkat Lanjut untuk mempercepat karier Anda.
Terminologi dasar uji chi-kuadrat
Rumus standar untuk menghitung uji chi-kuadrat adalah penjumlahan kesalahan kuadrat atau positif palsu dibagi dengan varians sampel. Ada beberapa istilah yang diterapkan saat menggunakan uji Chi-kuadrat. Istilah-istilah ini telah didefinisikan di bawah ini:
nilai-p
Nilai p adalah kemungkinan mencapai chi-kuadrat yang sama dengan atau lebih besar dari pada eksperimen ini, dan data tersebut masih mendukung hipotesis. Probabilitas ini dinyatakan sebagai persentase. Ini mengacu pada kemungkinan bahwa variasi yang diantisipasi disebabkan oleh tidak lebih dari kejadian acak.
Jika p-value kurang dari sama dengan 0,05, maka hipotesis yang dipertimbangkan diterima. Jika nilainya lebih dari 0,05, maka hipotesis ditolak.
Derajat Kebebasan
Masalah estimasi memiliki derajat kebebasan tertentu yang sama dengan jumlah variabel bebas. Meskipun tidak ada batasan tegas pada nilai-nilai variabel ini, mereka memberlakukan batasan pada variabel lain jika kita ingin kumpulan data kita konsisten dengan parameter yang diestimasi.
Satu definisi "derajat kebebasan" adalah jumlah nilai terbesar dalam kumpulan data yang secara logis independen satu sama lain dan karenanya dapat berubah. Pengurangan satu dari jumlah total pengamatan dalam kumpulan data menghasilkan derajat kebebasan.
Salah satu konteks yang menonjol di mana konsep derajat kebebasan dibahas adalah dalam konteks uji hipotesis statistik seperti chi-kuadrat.
Memahami pentingnya statistik chi-kuadrat dan kekokohan hipotesis nol sangat bergantung pada penghitungan derajat kebebasan secara akurat.
Perbedaan
Varians dari sampel bilangan acak adalah ukuran penyebarannya di sekitar meannya. Ini dihitung dengan mengkuadratkan nilai standar deviasi.
Properti untuk melakukan Uji Chi-kuadrat
Tes Chi-kuadrat memiliki sifat-sifat berikut:
- Distribusi rata-rata sama dengan jumlah derajat kebebasan.
- Varians harus sama dengan dua kali derajat kebebasan.
- Dengan bertambahnya derajat kebebasan, kurva distribusi chi-kuadrat mulai menyerupai kurva distribusi normal, yaitu kurva lonceng.
Kursus Pembelajaran Mesin Terbaik & Kursus AI Online
Master of Science dalam Pembelajaran Mesin & AI dari LJMU | Program Pascasarjana Eksekutif dalam Pembelajaran Mesin & AI dari IIITB | |
Program Sertifikat Tingkat Lanjut dalam Pembelajaran Mesin & NLP dari IIITB | Program Sertifikat Tingkat Lanjut dalam Pembelajaran Mesin & Pembelajaran Mendalam dari IIITB | Program Pascasarjana Eksekutif dalam Ilmu Data & Pembelajaran Mesin dari University of Maryland |
Untuk Jelajahi semua kursus kami, kunjungi halaman kami di bawah ini. | ||
Kursus Pembelajaran Mesin |
Bagaimana cara melakukan Uji Chi-kuadrat?
Chi-kuadrat untuk distribusi dihitung menggunakan rumus di bawah ini:
2 = [(Nilai yang diamati – Nilai yang Diharapkan ) 2 / Nilai yang Diharapkan]
Langkah-langkah yang harus diikuti untuk menghitung statistik Chi-kuadrat
- Hitung nilai yang diamati dan nilai yang diharapkan.
- Kurangi setiap nilai yang diharapkan dari nilai yang diamati dalam tabel distribusi.
- Kuadratkan nilai untuk setiap pengamatan yang Anda dapatkan di Langkah 2.
- Bagilah masing-masing nilai kuadrat ini dengan nilai ekspektasi yang sesuai.
- Menjumlahkan semua nilai yang kita peroleh pada Langkah 4 memberikan nilai yang mendefinisikan statistik chi-kuadrat.
- Hitung derajat kebebasan untuk memeriksa kepuasan properti uji chi-kuadrat yang disebutkan di atas.
Jenis Uji Chi-Kuadrat
Kebaikan
Jika Anda ingin melihat seberapa baik sampel populasi mewakili keseluruhan, Anda dapat menerapkan uji kecocokan Chi-kuadrat. Populasi sampel dan populasi sampel yang diproyeksikan dibandingkan dengan menggunakan teknik ini.
Ujian Kemerdekaan
Uji Chi-square ini untuk kemandirian satu populasi untuk mengetahui ada tidaknya korelasi antara dua variabel kategori. Uji independen berbeda dari uji kecocokan karena tidak membandingkan parameter tunggal yang diamati dengan populasi teoretis. Sebaliknya, tes independensi membandingkan dua nilai dalam kumpulan sampel satu sama lain.
Uji Homogenitas
Seperti halnya tes independensi, tes homogenitas mengikuti format dan prosedur yang sama. Perbedaan kritis antara keduanya adalah bahwa uji homogenitas menguji apakah suatu variabel memiliki distribusi yang sama di banyak populasi. Sebaliknya, uji independensi menguji adanya hubungan antara dua variabel kategori dalam populasi yang sama.
Kapan sebaiknya Anda menggunakan tes Chi-kuadrat?
Uji Chi-Square menentukan apakah nilai aktual konsisten dengan probabilitas teoretis. Chi-Square adalah tes yang paling dapat diandalkan untuk digunakan ketika data yang dianalisis berasal dari sampel acak dan variabel yang dipermasalahkan bersifat kategoris.
Keterampilan Pembelajaran Mesin yang Dibutuhkan
Kursus Kecerdasan Buatan | Kursus Tablo |
Kursus NLP | Kursus Pembelajaran Mendalam |
Di mana uji Chi-kuadrat digunakan?
Mari kita ambil contoh perusahaan pemasaran.
Sebuah perusahaan pemasaran sedang melihat korelasi antara geografi konsumen dan pilihan merek. Akibatnya, chi-kuadrat memainkan peran penting, dan nilai statistik akan menginformasikan bagaimana perusahaan dapat menyesuaikan pendekatan pemasarannya di seluruh geografi untuk memaksimalkan pendapatan.
Saat menganalisis data, uji Chi-kuadrat berguna untuk memeriksa konsistensi atau independensi variabel kategori, serta model kecocokan yang sedang dipertimbangkan.
Demikian pula, statistik chi-kuadrat dapat digunakan dalam profesi medis. Uji chi-kuadrat cocok untuk menentukan kemanjuran obat dibandingkan dengan kelompok kontrol.
Blog Pembelajaran Mesin dan Kecerdasan Buatan Populer
IoT: Sejarah, Sekarang & Masa Depan | Tutorial Pembelajaran Mesin: Belajar ML | Apa itu Algoritma? Sederhana & Mudah |
Gaji Insinyur Robotika di India : Semua Peran | Sehari dalam Kehidupan Seorang Insinyur Pembelajaran Mesin: Apa yang mereka lakukan? | Apa itu IoT (Internet of Things) |
Permutasi vs Kombinasi: Perbedaan antara Permutasi dan Kombinasi | 7 Tren Teratas dalam Kecerdasan Buatan & Pembelajaran Mesin | Pembelajaran Mesin dengan R: Semua yang Perlu Anda Ketahui |
Kesimpulan
Dalam artikel ini, Anda mempelajari tentang statistik Chi-kuadrat dan cara menghitung nilainya. Sejak Chi-square bekerja dengan variabel kategori, sering digunakan oleh akademisi menyelidiki data respon survei. Bentuk studi ini umum di banyak bidang, termasuk sosiologi, psikologi, ekonomi, ilmu politik, dan pemasaran.
Dapatkan Master of Science Anda dalam Pembelajaran Mesin & AI dengan upGrad
Apakah Anda akhirnya ingin mencapai gelar Master of Science? upGrad telah berkolaborasi dengan IIIT-B dan Liverpool John Moores University untuk memberikan Anda kursus yang paling dikurasi. Dengan Master of Science dalam Machine Learning & AI , Anda akan mempelajari setiap keterampilan yang dibutuhkan di bidang ML dan AI, seperti Natural Language Processing, Deep Learning, Reinforcement Learning, dll.
Kriteria kelayakan:
- Penyelesaian Sarjana dengan 50%
- Penyelesaian Program Pascasarjana Eksekutif dalam Pembelajaran Mesin & AI oleh IIIT-B
- Pengalaman kerja minimal satu tahun lebih diutamakan
Apa yang ditawarkan kursus ini kepada Anda:
- Lebih dari 750 jam materi kursus untuk dipelajari
- Dirancang untuk profesional yang bekerja
- Lebih dari 15 tugas dan studi kasus
- Lebih dari 12 proyek, 6 di antaranya adalah proyek batu penjuru
- Kelas pengkodean langsung
- Lokakarya pembuatan profil
- Bootcamp Karir
- Pelatihan kinerja tinggi satu lawan satu
- Sesi bimbingan karir satu-satu
- Kesempatan kerja eksklusif
- Sesi industri yang dipersonalisasi
Bagaimana nilai p terkait dengan uji Chi-kuadrat?
Nilai p adalah daerah di bawah kurva densitas chi-kuadrat yang berada di sebelah kanan nilai statistik uji. Apakah statistik uji chi-kuadrat cukup besar untuk menolak hipotesis nol atau tidak adalah langkah terakhir dalam uji signifikansi chi-kuadrat. Nilai p digunakan untuk tujuan ini.
Apakah ada keterbatasan atau kekurangan dalam menggunakan uji Chi-kuadrat?
Semua individu yang dipelajari harus unik; jika tidak, hasilnya tidak akan berarti. Tes chi-kuadrat tidak boleh digunakan jika responden tertentu dapat diklasifikasikan ke dalam dua kelompok yang berbeda. Namun batasan lain dari chi-kuadrat adalah bahwa ia hanya dapat digunakan untuk data frekuensi. Selain itu, jumlah semua orang yang diprediksi di semua kelas harus lebih besar dari 5.
Apa kekuatan dari uji Chi-kuadrat?
Salah satu kekuatan utamanya adalah bahwa chi-kuadrat dapat dihitung dengan cepat dan mudah. Data nominal juga dapat digunakan menggunakan metode ini. Ini juga dapat digunakan untuk membandingkan lebih dari dua kelompok variabel kategori untuk signifikansi statistik.