Negatif Binom Regresyona Başlarken: Adım Adım Kılavuz

Yayınlanan: 2022-04-17

Sayı değişkenlerinin modellemesini gerçekleştirmek için Negatif Binom Regresyon tekniği kullanılır. Yöntem, çoklu regresyon yöntemine neredeyse benzer. Ancak, Negatif Binom Regresyon durumunda, bağımlı değişkenin, yani Y'nin negatif binom dağılımını takip etmesi arasında bir fark vardır. Bu nedenle değişkenin değerleri 0, 1, 2 gibi negatif olmayan tam sayılar olabilir.

Yöntem ayrıca, ortalamanın varyansa eşit olduğu varsayımında bir gevşeme sağlayan Poisson regresyonunun bir uzantısıdır. “NB2” olarak tanımlanan geleneksel binom regresyon modellerinden biri, Poisson-gama'nın karışık dağılımına dayanmaktadır.

Poisson regresyon yöntemi, bir gama gürültüsü değişkeninin eklenmesiyle genelleştirilir. Bu değişken ortalama bir değerine ve ayrıca “v” olan bir ölçek parametresine sahiptir.

Negatif Binom Regresyonun birkaç örneği:

  • Okul yöneticileri, iki okuldan lise öğrencilerinin okula devam davranışlarını incelemek için bir araştırma yapmışlardır. Devam davranışını etkileyebilecek faktörler, küçüklerin okula gitmediği günleri içerebilir. Ayrıca, kayıtlı oldukları program.
  • Sağlıkla ilgili bir araştırmadan bir araştırmacı, son 12 ayda kaç yaşlı vatandaşın bir hastaneyi ziyaret ettiğini araştırdı. Çalışma, bireyin özelliklerine ve yaşlıların satın aldığı sağlık planlarına dayanıyordu.

İçindekiler

Negatif Binom Regresyon Örneği

Liseden yaklaşık 314 öğrenciden oluşan bir yoklama sayfası olduğunu varsayalım. Veriler iki şehir okulundan alınır ve nb_data.dta adlı bir dosyada saklanır. Bu örnekteki ilginç yanıt değişkeni, "daysab" olan eksik günlerdir. Her öğrencinin matematik puanını tanımlayan bir değişken, "matematik" mevcuttur. “Prog” olan başka bir değişken daha var. Bu değişken öğrencilerin kayıtlı olduğu programı gösterir.

Kaynak

Değişkenlerin her biri yaklaşık 314 gözleme sahiptir. Bu nedenle, değişkenler arasındaki dağılımlar da makuldür. Ayrıca sonuç değişkeni dikkate alındığında koşulsuz ortalama varyanstan daha düşüktür.

Şimdi, veri kümesinde ele alınan değişken açıklamasına odaklanın. Bir tablo, her program türünde bir öğrencinin okula devam etmediği ortalama günleri gösterir. Bu, değişken tipi programın öğrencinin okula devam etmediği günleri tahmin edebileceğini göstermektedir. Sonuç değişkenini tahmin etmek için de kullanabilirsiniz. Bunun nedeni, sonuç değişkeninin ortalama değerinin prog değişkenine göre değişmesidir. Ayrıca, varyansların değerleri, değişken prog'un her seviyesinde olduğundan daha yüksektir. Bu değerler varyanslar ve ortalamalar olarak adlandırılır. Mevcut farklılıklar, aşırı yayılımın var olduğunu ve bu nedenle negatif bir binom modelinin kullanılmasının uygun olacağını düşündürmektedir.

Kaynak

Bir araştırmacı, bu tür bir çalışma için çeşitli analiz yöntemlerini göz önünde bulundurabilir. Bu yöntemler aşağıda açıklanmıştır. Kullanıcının regresyon modelini analiz etmek için kullanabileceği birkaç analiz yöntemi şunlardır:

1. Negatif binom regresyon

Negatif Binom Regresyon yöntemi, aşırı dağılmış veriler olduğunda kullanılmalıdır. Bu, koşullu varyansın değerinin koşullu ortalamanın değerinden daha yüksek olduğu veya onu aştığı anlamına gelir. Yöntemin Poisson regresyon yönteminden genelleştirilmiş olduğu kabul edilir. Bunun nedeni, her iki yöntemin de aynı ortalama yapısına sahip olmasıdır. Ancak, aşırı dağılımı modellemek için kullanılan Negatif binom regresyonunda ek bir parametre vardır. Koşullu dağılım sonuç değişkeninden fazla dağıldığında güven aralıkları tutku regresyonundan daha dar kabul edilir.

2. Poisson regresyonu

Sayım verilerinin modellenmesinde Poisson regresyon yöntemi kullanılmıştır. Poisson regresyonundaki sayı değişkenlerini modellemek için birçok uzantı kullanılabilir.

3. OLS regresyonu

Sayım değişkenlerinin sonuçları bazen log-dönüştürülür ve daha sonra OLS regresyon yöntemiyle analiz edilir. Ancak, bazen OLS regresyon yöntemiyle ilgili sorunlar vardır. Bu sorunlar, sıfır değerinin günlüğü dikkate alınarak herhangi bir tanımsız değerin üretilmesinden kaynaklanan veri kaybı olabilir. Ayrıca, dağınık verilerin modellenmemesi nedeniyle de üretilebilir.

4. Sıfır şişirilmiş modeller

Bu tür modeller, modeldeki tüm fazla sıfırları hesaba katmaya çalışır.

Negatif Binom Regresyon Kullanarak Analiz

Negatif Binom Regresyon modelini tahmin etmek için “nbreg” komutu kullanılır. "Prog" değişkeninden önce bir "i" vardır. “i”nin varlığı, değişkenin tip faktör, yani kategorik değişken olduğunu gösterir. Bunlar modele gösterge değişkenleri olarak dahil edilmelidir.

  • Modelin çıktısı bir yineleme günlüğü ile başlar. Poisson modelinin uydurulmasıyla başlar, ardından boş bir model ve ardından negatif binom modeli gelir. Yöntem, maksimum olabilirlik tahminini kullanır ve son günlüğün değerinde bir değişiklik olana kadar yinelemeye devam eder. Modellerin karşılaştırılması için logun olasılığı kullanılır.
  • Bir sonraki bilgi başlık dosyasındadır.
  • Başlığın hemen altında Negatif Binom Regresyon katsayılarının bilgisi var. Katsayılar, p değerleri, z puanları gibi hatalarla birlikte her değişken için üretilir. Ayrıca tüm katsayılar için %95'lik bir güven aralığı vardır. “Matematik” değişkeninin katsayısı -0,006 olup istatistiksel olarak anlamlıdır. Sonuç, "matematik" değişkeninde bir birimde bir artış varsa, eksik gün sayısı için beklenen günlük sayısının 0,006 değerinde azaldığı anlamına gelir. Ayrıca, gösterge değişkeni olan 2. prog değeri, iki grup (grup 2 ve referans grubu) arasındaki log sayısında beklenen farktır.
  • Aktarılan log aşırı dağılımı için parametre tahmini yapılır ve daha sonra dönüştürülmemiş değerle görüntülenir. Poisson modelinde değer sıfırdır.
  • Katsayılar tablosunun altında oran testi olabilirlik bilgisi bulunmaktadır. Model, "marjlar" komutlarının kullanılmasıyla daha iyi anlaşılabilir.

Python'da Negatif Binom Regresyon Analizi Yapma Süreci

Regresyon işlemini gerçekleştirmek için gerekli paketlerin Python'dan alınması gerekmektedir. Bu paketler aşağıda listelenmiştir:

  • statsmodels.api'yi sm olarak içe aktar
  • matplotlib.pyplot'u plt olarak içe aktar
  • numpy'yi np olarak içe aktar
  • patsy ithalat dmatrislerinden
  • pandaları pd olarak içe aktar

Negatif Binom Regresyon için Hususlar

Negatif Binom Regresyon analizi yöntemi uygulanırken dikkat edilmesi gereken birkaç husus vardır. Bunlar şunları içerir:

  • Küçük örneklerin varlığı varsa, Negatif Binom Regresyon yöntemi önerilmez.
  • Bazen aşırı dağılmanın bir nedeni olabilecek fazla sıfırlar vardır. Bu sıfırlar, veri oluşturma işlemi nedeniyle oluşturulabilir. Böyle bir durum ortaya çıkarsa sıfır şişirilmiş model yönteminin kullanılması tavsiye edilir.
  • Veri oluşturma süreci herhangi bir sıfırı dikkate almıyorsa, bu gibi durumlarda sıfır kesilmiş model yönteminin kullanılması önerilir.
  • Sayım verileriyle ilişkili bir maruz kalma değişkeni vardır. Değişken, olayın meydana gelme olasılığının olduğu zamanları belirtir. Bu değişkenin Negatif Binom Regresyon modeline dahil edilmesi gereklidir. Bu, exp() seçeneği ile yapılır.
  • Negatif Binom Regresyon analizi modelinde sonuç değişkeni herhangi bir negatif değer olamaz. Ayrıca, maruziyet değişkeni 0 değerine sahip olamaz.
  • “glm” komutu, bir Negatif Binom Regresyon analizi yöntemini çalıştırmak için de kullanılabilir. Bu, günlüğün bağlantısı ve ayrıca binom ailesi aracılığıyla yapılabilir.
  • Artıkları elde etmek için “glm” komutu gereklidir. Bu, Negatif Binom Regresyon modelinde başka varsayımlar olup olmadığını kontrol etmek içindir.
  • Sözde R-karenin çeşitli ölçülerinin varlığı vardır. Ancak her ölçü, OLS regresyonunda R-kare tarafından sağlanan bilgilere benzer bilgiler sağlar.

Çözüm

Makale Negatif Binom Regresyon konusunu tartıştı . Çoklu regresyon yöntemine neredeyse benzer olduğunu ve Poisson dağılımının genelleştirilmiş bir şekli olduğunu gördük. Yöntemin birkaç uygulaması vardır. Teknik, python programlama dili aracılığıyla veya R'de de uygulanabilir.

Yaşlanma gibi çalışmalarda uygulanmasını gösteren birkaç vaka çalışması da mevcuttur. Ayrıca, sayım verilerinde kullanılabilecek klasik regresyon modelleri Poisson Regresyon, Negatif Binom Regresyon ve Geometrik Regresyon'dur. Bu yöntemler lineer modeller ailesine aitti ve R sistemi gibi hemen hemen tüm istatistiksel paketlere dahil edildi.

Makine öğreniminde mükemmel olmak ve veri alanını keşfetmek istiyorsanız, upGrad tarafından sunulan Makine Öğrenimi ve Yapay Zeka alanında Yönetici PG Programı kursuna göz atabilirsiniz. Yani, makine öğrenmesinde uzman olmayı hayal eden çalışan bir profesyonelseniz, gelin ve uzmanlar altında eğitim alma deneyimini kazanın. Daha fazla detay web sitemiz üzerinden elde edilebilir. Herhangi bir sorunuz için ekibimiz size hemen yardımcı olabilir.

Bu makaleyi paylaşmak istermisiniz?

Makine Öğrenimi ve Yapay Zeka Alanında Kariyerinizi Geliştirin

IIITB'den Ai-ml'de Yönetici Sertifikası için Şimdi Başvurun