Distribusi Binomial di Python dengan Contoh Dunia Nyata [2022]

Diterbitkan: 2021-01-09

Nilai probabilitas dan statistik di bidang ilmu data sangat besar, dengan kecerdasan buatan dan pembelajaran mesin sangat bergantung padanya. Kami menggunakan model proses distribusi normal setiap kali kami melakukan pengujian A/B dan pemodelan investasi.

Namun, distribusi binomial dalam Python diterapkan dalam berbagai cara untuk melakukan beberapa proses. Namun, sebelum memulai dengan distribusi binomial di Python , Anda perlu mengetahui tentang distribusi binomial secara umum dan penggunaannya dalam kehidupan sehari-hari. Jika Anda seorang pemula dan tertarik untuk mempelajari lebih lanjut tentang ilmu data, lihat pelatihan ilmu data kami dari universitas terkemuka.

Daftar isi

Apa itu Distribusi Binomial ?

Pernahkah Anda melempar koin? Jika pernah, maka Anda harus tahu tentang probabilitas mendapatkan kepala atau ekor yang sama. Tapi, bagaimana dengan kemungkinan mendapatkan tujuh ekor dari total sepuluh lemparan koin? Di sinilah distribusi binomial dapat membantu dalam menghitung hasil setiap lemparan, dan dengan demikian mengetahui probabilitas mendapatkan tujuh ekor untuk sepuluh pelemparan koin.

Inti dari distribusi probabilitas berasal dari varians dari setiap peristiwa. Untuk setiap sepuluh lemparan koin yang ditetapkan, kemungkinan mendapatkan kepala dan ekor dapat berkisar antara satu hingga sepuluh kali, sama dan kemungkinan besar. Ketidakpastian dalam hasil (juga dikenal sebagai varians) membantu dalam menghasilkan distribusi hasil yang dihasilkan.

Dengan kata lain, distribusi binomial adalah proses di mana hanya ada dua kemungkinan hasil: benar atau salah. Oleh karena itu, ia memiliki probabilitas yang sama dari kedua hasil di semua peristiwa, karena tindakan yang sama dilakukan setiap kali. Hanya ada satu syarat… Langkah-langkahnya harus benar-benar tidak terpengaruh satu sama lain, dan hasilnya mungkin atau mungkin tidak sama.

Oleh karena itu, fungsi probabilitas dari distribusi binomial adalah:

f f( k k , n n, p p) = P r Pr( k k; n n, p p) = P r Pr ( X X= k k) =

Sumber

Di mana,

= n n! kk !( n n!- k k !)

Di sini, n = jumlah total percobaan

p = peluang sukses

k = jumlah target keberhasilan

Distribusi Binomial dengan Python

Untuk distribusi binomial melalui Python, Anda dapat menghasilkan variabel acak yang berbeda dari fungsi binom.rvs (), di mana 'n' didefinisikan sebagai frekuensi total percobaan, dan 'p' sama dengan probabilitas keberhasilan.

Anda juga dapat memindahkan distribusi menggunakan fungsi loc, dan ukurannya menentukan frekuensi tindakan yang diulang dalam rangkaian. Menambahkan random_state dapat membantu menjaga reproduktifitas.

Sumber

Contoh Dunia Nyata Distribusi Binomial dengan Python

Ada lebih banyak peristiwa (lebih besar dari lemparan koin) yang dapat diatasi dengan distribusi binomial dengan Python. Beberapa kasus penggunaan dapat membantu melacak dan meningkatkan ROI (laba atas investasi) untuk perusahaan besar dan kecil. Berikut caranya:

  • Pikirkan tentang pusat panggilan di mana setiap karyawan ditugaskan dengan rata-rata 50 panggilan setiap hari.
  • Probabilitas konversi atas setiap panggilan sama dengan 4%.
  • Pendapatan rata-rata yang dihasilkan perusahaan berdasarkan setiap konversi tersebut adalah sebesar USD 20.
  • Jika Anda menganalisis 100 karyawan seperti itu, yang dibayar USD 200 setiap hari, maka

n = 50

p = 4%

Kode dapat menghasilkan output sebagai berikut:

  • Tingkat konversi rata-rata untuk setiap karyawan = 2,13
  • Standar deviasi konversi untuk setiap personel call center = 1,48
  • Konversi kotor = 213
  • Pendapatan kotor yang dihasilkan = USD 21.300
  • Pengeluaran kotor = USD 20.000
  • Laba kotor = USD 1.300

Model distribusi binomial dan distribusi probabilitas lainnya hanya dapat memprediksi perkiraan yang mendekati dunia nyata dalam hal parameter tindakan, 'n' dan 'p'. Ini membantu kami untuk memahami dan mengidentifikasi area fokus kami dan meningkatkan peluang keseluruhan untuk kinerja dan efektivitas yang lebih baik.

Baca Juga: 13 Ide dan Topik Proyek Struktur Data Menarik Untuk Pemula

Apa selanjutnya?

Jika Anda penasaran untuk belajar tentang ilmu data, lihat Program PG Eksekutif IIIT-B & upGrad dalam Ilmu Data yang dibuat untuk para profesional yang bekerja dan menawarkan 10+ studi kasus & proyek, lokakarya praktis, bimbingan dengan pakar industri, 1 -on-1 dengan mentor industri, 400+ jam pembelajaran dan bantuan pekerjaan dengan perusahaan-perusahaan top.

Apa perbedaan antara distribusi probabilitas diskrit dan distribusi probabilitas kontinu?

Distribusi probabilitas diskrit atau distribusi hanya diskrit menghitung probabilitas variabel acak yang dapat diskrit. Misalnya, jika kita melempar koin dua kali, nilai kemungkinan variabel acak X yang menunjukkan jumlah kepala adalah {0, 1, 2} dan bukan nilai acak apa pun. Bernoulli, Binomial, Hypergeometric adalah beberapa contoh dari distribusi probabilitas diskrit. Di sisi lain, distribusi probabilitas kontinu memberikan probabilitas nilai acak yang dapat berupa bilangan acak apa pun. Misalnya, nilai variabel acak X yang menyatakan tinggi penduduk suatu kota dapat berupa bilangan apa saja seperti 161,2, 150,9, dll. Normal, T Siswa, Chi-kuadrat adalah beberapa contoh distribusi kontinu.

Apa pentingnya probabilitas dalam ilmu data?

Karena ilmu data adalah tentang mempelajari data, probabilitas memainkan peran kunci di sini. Alasan berikut menjelaskan bagaimana probabilitas merupakan bagian tak terpisahkan dari ilmu data: Ini membantu analis dan peneliti membuat prediksi dari kumpulan data. Hasil estimasi semacam ini merupakan dasar untuk analisis data lebih lanjut. Probabilitas juga digunakan saat mengembangkan algoritme yang digunakan dalam model pembelajaran mesin. Ini membantu dalam menganalisis kumpulan data yang digunakan untuk melatih model. Ini memungkinkan Anda untuk mengukur data dan memperoleh hasil seperti turunan, rata-rata, dan distribusi. Semua hasil yang dicapai dengan menggunakan probabilitas akhirnya merangkum data. Ringkasan ini juga membantu dalam mengidentifikasi outlier yang ada dalam kumpulan data.

Menjelaskan distribusi hipergeometrik. Dalam hal apa itu cenderung menjadi distribusi binomial?

keberhasilan atas jumlah percobaan tanpa penggantian apapun. Katakanlah kita memiliki tas yang penuh dengan bola merah dan hijau dan kita harus mencari peluang terambilnya bola hijau dalam 5 percobaan tetapi setiap kali kita mengambil bola, kita tidak mengembalikannya ke kantong. Ini adalah contoh tepat dari distribusi hipergeometrik.
Untuk N yang lebih besar, sangat sulit untuk menghitung distribusi hipergeometrik tetapi ketika N kecil, dalam hal ini cenderung ke distribusi binomial.