Gerçek Dünya Örnekleriyle Python'da Binom Dağılımı [222]

Yayınlanan: 2021-01-09

Veri bilimi alanında olasılık ve istatistiğin değeri, yapay zeka ve makine öğreniminin büyük ölçüde bunlara dayanmasıyla çok büyük olmuştur. A/B testi ve yatırım modellemesi yaptığımız her seferde normal dağılım süreç modellerini kullanıyoruz.

Bununla birlikte, Python'daki binom dağılımı, birkaç işlemi gerçekleştirmek için çeşitli şekillerde uygulanır. Ancak Python'da binom dağılımına başlamadan önce , genel olarak binom dağılımını ve günlük yaşamdaki kullanımını bilmeniz gerekir. Yeni başlayan biriyseniz ve veri bilimi hakkında daha fazla bilgi edinmek istiyorsanız, en iyi üniversitelerden veri bilimi eğitimimize göz atın.

İçindekiler

Binom Dağılımı nedir ?

Hiç yazı tura attın mı? Eğer varsa, tura veya tura gelme olasılığının eşit olduğunu bilmelisiniz. Ancak, toplam on yazı turasında yedi yazı gelme olasılığına ne dersiniz? Burası, binom dağılımının her atış sonucunun hesaplanmasına ve böylece bir madeni paranın on atışında yedi tura gelme olasılığının bulunmasına yardımcı olabileceği yerdir.

Olasılık dağılımının püf noktası, herhangi bir olayın varyansından gelir. Ayarlanan her on yazı tura için, tura ve tura gelme olasılığı, eşit ve olası olmak üzere, bir ila on kez arasında herhangi bir yerde olabilir. Sonuçtaki belirsizlik (varyans olarak da bilinir), üretilen sonuçların dağılımının oluşturulmasına yardımcı olur.

Başka bir deyişle, binom dağılımı , yalnızca iki olası sonucun olduğu bir süreçtir: doğru veya yanlış. Bu nedenle, her seferinde aynı eylemler gerçekleştirildiğinden, tüm olaylardaki sonuçların her ikisinin de eşit olasılığı vardır. Tek bir koşul var… Adımların birbirinden tamamen etkilenmemesi gerekiyor ve sonuçlar eşit derecede olası olabilir veya olmayabilir.

Bu nedenle, bir binom dağılımının olasılık fonksiyonu şudur:

f f( k k , n n, p p) = P r Pr( k k; n n, p p) = P r Pr ( X X= k k) =

Kaynak

Neresi,

= n n! k k !( n n!- k k!)

Burada, n = toplam deneme sayısı

p = başarı olasılığı

k = hedeflenen başarı sayısı

Python'da Binom Dağılımı

Python aracılığıyla binom dağılımı için, binom.rvs () işlevinden farklı rastgele değişken üretebilirsiniz; burada 'n' toplam deneme sıklığı olarak tanımlanır ve 'p' başarı olasılığına eşittir.

loc işlevini kullanarak da dağılımı taşıyabilirsiniz ve boyut, seride tekrarlanan bir eylemin sıklığını tanımlar. Bir random_state eklemek, tekrarlanabilirliğin korunmasına yardımcı olabilir.

Kaynak

Python'da Binom Dağılımının Gerçek Dünya Örnekleri

Python'da binom dağılımı ile ele alınabilecek daha birçok olay (yazı tura atışlarından daha büyük) vardır. Kullanım örneklerinden bazıları, büyük ve küçük şirketler için YG'yi (yatırım getirisi) izlemeye ve iyileştirmeye yardımcı olabilir. İşte nasıl:

  • Her çalışanın günde ortalama 50 çağrı aldığı bir çağrı merkezi düşünün.
  • Her aramada dönüşüm olasılığı %4'e eşittir.
  • Bu tür her bir dönüşüme dayalı olarak şirket için ortalama gelir üretimi 20 ABD dolarıdır.
  • Her gün 200 USD maaş alan 100 çalışanı analiz ederseniz,

sayı = 50

p = %4

Kod aşağıdaki gibi çıktı üretebilir:

  • Her çalışan için ortalama dönüşüm oranı = 2,13
  • Her çağrı merkezi personeli için dönüşümlerin standart sapması = 1,48
  • Brüt dönüşüm = 213
  • Brüt gelir üretimi = 21.300 USD
  • Brüt gider = 20.000 ABD doları
  • Brüt kar = 1.300 USD

Binom dağılım modelleri ve diğer olasılık dağılımları, yalnızca 'n' ve 'p' eylem parametreleri açısından gerçek dünyaya yakın olabilecek bir tahminde bulunabilir. Odak alanlarımızı anlamamıza ve belirlememize ve genel olarak daha iyi performans ve etkinlik şansını artırmamıza yardımcı olur.

Ayrıca Okuyun: Yeni Başlayanlar İçin 13 İlginç Veri Yapısı Projesi Fikirleri ve Konuları

Sıradaki ne?

Veri bilimi hakkında bilgi edinmek istiyorsanız, IIIT -B & upGrad'ın çalışan profesyoneller için oluşturulmuş ve 10'dan fazla vaka çalışması ve proje, uygulamalı uygulamalı atölye çalışmaları, endüstri uzmanlarıyla mentorluk, 1 Endüstri danışmanlarıyla bire bir, en iyi firmalarla 400+ saat öğrenim ve iş yardımı.

Kesikli olasılık dağılımı ile sürekli olasılık dağılımı arasındaki fark nedir?

Ayrık olasılık dağılımı veya basitçe ayrık dağılım, ayrık olabilen rastgele bir değişkenin olasılıklarını hesaplar. Örneğin, iki kez yazı tura atarsak, toplam tura sayısını gösteren rastgele bir X değişkeninin olası değerleri {0, 1, 2} olur ve herhangi bir rastgele değer olmaz. Bernoulli, Binomial, Hypergeometric, kesikli olasılık dağılımının bazı örnekleridir. Öte yandan, sürekli olasılık dağılımı, herhangi bir rastgele sayı olabilen rastgele bir değerin olasılıklarını sağlar. Örneğin, bir şehrin vatandaşlarının boyunu gösteren rastgele bir X değişkeninin değeri 161.2, 150.9 vb. gibi herhangi bir sayı olabilir. Normal, Student's T, Ki-kare sürekli dağılım örneklerinden bazılarıdır.

Veri biliminde olasılığın önemi nedir?

Veri bilimi tamamen verileri incelemekle ilgili olduğundan, burada olasılık önemli bir rol oynar. Aşağıdaki nedenler, olasılığın veri biliminin vazgeçilmez bir parçası olduğunu açıklar: Analistlerin ve araştırmacıların veri kümelerinden tahminler yapmasına yardımcı olur. Bu tür tahmini sonuçlar, verilerin daha fazla analizi için temel oluşturur. Makine öğrenmesi modellerinde kullanılan algoritmalar geliştirilirken de olasılıktan yararlanılır. Modelleri eğitmek için kullanılan veri setlerinin analizine yardımcı olur. Verileri nicelleştirmenize ve türevler, ortalama ve dağılım gibi sonuçlar elde etmenize olanak tanır. Olasılık kullanılarak elde edilen tüm sonuçlar sonunda verileri özetler. Bu özet aynı zamanda veri kümelerindeki mevcut aykırı değerlerin belirlenmesine de yardımcı olur.

Hipergeometrik dağılımı açıklar. Hangi durumda binom dağılımı olma eğilimindedir?

herhangi bir değiştirme olmaksızın deneme sayısı üzerinde başarılar. Diyelim ki kırmızı ve yeşil toplarla dolu bir çantamız var ve 5 denemede yeşil top alma olasılığını bulmamız gerekiyor ama her top aldığımızda tekrar torbaya geri vermiyoruz. Bu hipergeometrik dağılımın uygun bir örneğidir.
Daha büyük N için hipergeometrik dağılımı hesaplamak çok zordur, ancak N küçük olduğunda bu durumda binom dağılımına yönelir.