Bayes Çıkarımına Yeni Başlayanlar Kılavuzu: Eksiksiz Kılavuz

Yayınlanan: 2021-11-26

Makine öğrenimi uygulamaları araştırma, sosyal medya, reklamcılık vb. alanlarda geniş uygulanabilirlikle artmaktadır. Bununla birlikte, uygulamalar çoğunlukla büyük miktarda veri içeren tahminlerle ilgilenmektedir. İstatistikler genellikle belirsizlik değerlerinin ölçümünün nicelleştirilmesi için kullanılır. Farklı olaylarımız varsa, olayın olasılığını üç yaklaşım belirleyebilir.
Bu üç yöntem şunlardır:

  • Klasik
  • Bayes
  • sık sık

"Dört"ün yüzünü gösterip göstermeme olasılığını bulmak için atılan bir zarın örneğini ele alalım. Olasılığı belirlemeye yönelik üç tür yöntemin anlaşılmasına yardımcı olacaktır. Klasik olasılık tahmini yöntemini düşündüğünüzü varsayalım. Bu durumda toplam altı sonuç olacağına ve herhangi bir sonucun gerçekleşme olasılığının aynı olacağına inanılacaktır. Böyle bir varsayımda, sonucun dört olma olasılığı 1/6 olacaktır. Klasik yöntem, sonuçlar eşit derecede olası sonuçlara sahip olduğunda genellikle iyi çalışır. Ancak sonuçlar daha öznel hale geldiğinde bu yöntem kullanılamaz.

Frequentist yöntemini ele alırsak, varsayımsal olan bir olayın sonsuz bir dizisi olması gerekir. Daha sonra sonsuz varsayımsal dizide ilgili frekansın aranmasını gerektirir. Yukarıdaki zar örneğini göz önünde bulundurarak, zarlar sonsuz sayıda atılırsa, sonuç yani 1/6, sonucu dört olarak alabiliriz. Bu nedenle, altı yüzlü zarda sonucun dört olma olasılığı, frekans yönteminin tanımına göre 1/6 olacaktır.

Şimdi Bayes yaklaşımına gelince, size bazı avantajlar sağlıyor. Bu yöntemin bakış açısına göre, karar verme sürecine kişisel bir inancı dahil edebilirsiniz. Bu, sorunla ilgili bilinen bilgiler gibi şeyleri dikkate alacağı anlamına gelir. Farklı bireylerin farklı inançlara sahip olabileceği de bu yaklaşımda dikkate alınmaktadır. Örneğin, birisi yarın yağmur yağma olasılığının %90 olacağını söylerse, bir başkası için yağmur yağma olasılığının %60 olabileceğini varsayalım. Bu nedenle, Bayes yaklaşımının yöntemi özneldir. Bununla birlikte, sonuçlar Frequentist yöntemine kıyasla daha sezgiseldir.

İçindekiler

Bayes Çıkarımı

Bayes Çıkarımı, çoğunlukla istatistiksel Çıkarım problemi için kullanılır. Bu durumlarda, tahmin edilmesi gereken her zaman bilinmeyen bir miktar (veri) vardır. Ardından, verilerden istenen miktar tahmin edilir. Bilinmeyen niceliğe θ denir. θ'nin rastgele bir nicelik olduğu varsayımı vardır ve θ değerleri için bazı başlangıç ​​tahminleri vardır. Bu dağıtım türü, ön dağıtım olarak adlandırılır. Değerin güncellenmesi genellikle Bayes kuralı ile yapılır. Bu nedenle, yaklaşım Bayes yaklaşımı olarak adlandırılır.

Bayes teoremi

Bayes Çıkarımının uygulanması Bayes Teoreminin anlaşılmasına bağlıdır.

A Kümesi ve B kümesi gibi iki sonuç kümesi olduğunu düşünün. Bu kümelere olay da denir. A olayının olasılığını P(A) ve B olayının olasılığını P(B) olarak gösterelim. Bunlar, olayların tek tek olasılıklarıydı. Ancak, ortak bir olasılık P(A, B) terimi ile tanımlanabilir. Koşullu olasılıklar şu şekilde genişletilebilir:

P(A,B) = P(A|B)P(B),

Bu, B verildiğinde, A ve B'nin koşullu olasılığının, iki olayın ortak olasılığı ile sonuçlandığı anlamına gelir.

P(A,B) = P(B|A)P(A)

Yukarıdaki denklemlerin her ikisinde de denklemlerin sol tarafı aynıdır, bu nedenle denklemlerin sağ tarafı eşit olmalıdır.

P(A|B)P(B) = P(B|A)P(A)

P(A|B) = P(B|A)P(A)/P(B)

Bu denklem Bayes teoremi olarak bilinir.

Veri bilimi alanında Bayes Teoremi şu şekilde yazılabilir:

P(hipotez|veri) = P(veri|hipotez) P(hipotez)/p(veri)

Kanıt olan payda, denklemin sol tarafındaki sonsal dağılımın geçerli olasılık yoğunluğu olmasını sağlar. Buna normalleştirme sabiti de denir.

Bayes teoreminin denkleminde üç bileşen vardır.

  • Önceki
  • Olasılık
  • arka

Önceki dağıtım

Bayesian Çıkarım yöntemindeki kilit faktörlerden biri Ön dağılımdır. Bu sayede, kişisel inançlarınızı karar verme sürecine dahil edebilirsiniz. Ayrıca, farklı bireylere dayalı yargıları da çalışmaya dahil edebilirsiniz. Bu matematiksel bir ifade ile yapılır. θ ile temsil edilen bilinmeyen bir parametre, birinin inancını ifade etmek için kullanılır. Bu inançları ifade etmek için, önceki dağılım olan bir dağıtım işlevi kullanılır. Bu nedenle, herhangi bir deneyi çalıştırmadan önce dağıtım seçilir.

Bayes Çıkarımına Yeni Başlayanlar Kılavuzu

1. Öncesini seçmek

Genellikle θ parametresi için kümülatif bir dağılım tanımlanır. Ön olasılık değeri sıfır olan bu olaylar, sıfır olarak son olasılık değerine sahip olacaktır. Ve önceki olasılık değerine sahip olan olaylar için, kişi bir olarak sonraki olasılık değerine sahip olacaktır. Bu nedenle, Bayes yaklaşımının iyi bir çerçevesi, halihazırda meydana gelen olaylara bazı nokta tahminleri tanımlamayacaktır veya meydana geldiğine dair hiçbir bilgi yoktur. Öncesini seçmek için belirli teknikler vardır. Öncesini seçmek için yaygın olarak kullanılan bir teknik, dağıtım fonksiyonlarının kullanılmasıdır. Tüm fonksiyonların ailesi kullanılır. Bu işlevler esnek olmalı ve bireylerin inançlarını temsil edebilecektir.

2. Olasılık

θ'yi tahmin edilecek bilinmeyen parametre olarak ele alalım. Bir madalyonun adaleti, Bayes Çıkarımı örneğini göz önünde bulundurarak θ ile ifade edilebilir . Madeni para, adaletini kontrol etmek için sonsuza kadar çevriliyor. Yani her dönüşte ya baş ya da kuyruk olacak. Olaylara atanan değerler 0 ve 1'dir. Buna Bernoulli denemeleri de denir. Tüm sonuçlar bağımsız olarak kabul edilir. Bu, olabilirlik kavramını tanımlayan bir denklem aracılığıyla ifade edilebilir. Olabilirlik, θ'nin bir fonksiyonu olan bir yoğunluk fonksiyonudur. Olabilirliği maksimize etmek için, θ değeri en büyük olabilirlik değeri ile sonuçlanmalıdır. Tahmin yöntemi, Maksimum olabilirlik tahmini olarak da bilinir.

3. Arka dağılım

Bayes teoreminin sonucu, sonsal dağılım olarak bilinir. Yeni bilgiler dikkate alındıktan sonra meydana gelen herhangi bir olayın güncellenmiş olasılığıdır.

4. Bayes Çıkarım mekanizması

Yukarıda gördüğümüz gibi, Bayesian Çıkarım yöntemi, olasılık kavramını bir dereceye kadar inanç olarak ele alır. Bu inançlar, olayın bu tür kanıtlar altında gerçekleşebileceği gerçeğiyle ilişkilidir. Bu nedenle, teta “θ” parametresi rastgele değişken olarak kabul edilir.

5. Finansal riskte Bayesian Çıkarım uygulaması

Bayes Çıkarımının uygulanabileceği birçok algoritma vardır. Algoritmalardan bazıları sinir ağları, rastgele orman, regresyon vb. Yöntemdir. Yöntem aynı zamanda finans sektöründe de popülerlik bulmuştur. Birkaç bankanın operasyonel risk modellemesi için kullanılabilir. Bankaların operasyon kaybını gösteren verileri, bazı olayların kaybedildiğini gösteriyor. Bu kayıp olaylar düşük bir sıklığa sahipti ancak yüksek bir ciddiyete sahipti. Bu nedenle, bu gibi durumlarda Bayes Çıkarımının oldukça yararlı olduğu kanıtlanmıştır. Bunun nedeni, bu yöntemde analiz için çok fazla veriye de gerek olmamasıdır.

Sık kullanılan yöntemler gibi diğer istatistiksel analiz yöntemleri de operasyonel riskleri modellemek için daha önce uygulanmıştı. Ancak belirsizlik parametresinin tahmininde bir sorun vardı. Bu nedenle Bayes çıkarımı en etkili yöntem olarak kabul edilmiştir. Bunun nedeni, uzman görüşlerinin ve verilerin sonsal dağılımlar elde etmek için kullanılabilmesidir. Bu tür bir görevde, bankaların dahili kayıp verileri birkaç küçük parçaya bölünür ve daha sonra her parçanın sıklığı uzman kararıyla tahmin edilir. Bu daha sonra olasılık dağılımlarına uyarlanır.

Kariyerinizi hızlandırmak için Makine Öğrenimi Kursuna , Makine Öğrenimi ve Yapay Zeka alanında Dünyanın en iyi Üniversiteleri - Yüksek Lisanslar, Yönetici Yüksek Lisans Programları ve İleri Düzey Sertifika Programından çevrimiçi katılın .

Çözüm

İstatistik ve makine öğreniminde uygulanabilecek iki ana yaklaşım Frequentist ve Bayesian Çıkarım yöntemleridir. Olasılıkların sübjektif inançlar olarak hesaplandığı yazıda Bayes Çıkarım yöntemini ele aldık. Olasılıklar tahmin edilirken verilerin yanı sıra kişilerin kişisel inançları da dahil edilir. Bunlar, modeli birçok tahmin çalışmasında çok daha yaygın olarak kabul edilmesini sağlar. Bu nedenle, Bayesian Çıkarım teknikleri, inançlarınızı verilerin gözlemlenmesine uygulama yöntemlerini veya yollarını belirtir. Ayrıca, çok gürültülü veri içeren birçok uygulama türünde Bayesian Çıkarım tekniği kullanılabilir. Bu nedenle, Bayes kuralında yatan güç, keyfi nitelikteki soruları cevaplamak için kullanılabilecek bir miktarla hesaplanabilen bir miktarla ilgili olabilir.

Makine Öğrenimi ve Yapay Zeka Alanında Kariyerinizi Geliştirin

Makine Öğrenimi ve Yapay Zeka'da EPGP için Şimdi Başvurun