Bayes Ağı Örneği [Grafik Gösterimli]

Yayınlanan: 2021-01-29

İçindekiler

Tanıtım

İstatistikte, olasılık modelleri değişkenler arasındaki ilişkiyi tanımlamak için kullanılır ve her bir değişkenin olasılıklarını hesaplamak için kullanılabilir. Birçok problemde çok sayıda değişken vardır. Bu gibi durumlarda, tam koşullu modeller, gerçek zamanlı olarak hesaplanması zor olabilecek olasılık fonksiyonlarının her bir durumunu kapsayacak çok büyük miktarda veri gerektirir. Naive Bayes gibi koşullu olasılık hesaplamalarını basitleştirmek için birkaç girişimde bulunulmuştur, ancak yine de, birkaç değişkeni büyük ölçüde azalttığı için verimli olduğu kanıtlanmamıştır.

Tek yol, rastgele değişkenler arasındaki koşullu bağımlılıkları ve diğer durumlarda koşullu bağımsızlığı koruyabilen bir model geliştirmektir. Bu bizi Bayes Ağları kavramına götürür. Bu Bayes Ağları, her etki alanı için olasılık modelini etkin bir şekilde görselleştirmemize ve kullanıcı dostu bir grafik biçiminde rastgele değişkenler arasındaki ilişkiyi incelememize yardımcı olur.

Dünyanın En İyi Üniversitelerinden ML Kursu öğrenin . Kariyerinizi hızlandırmak için Master, Executive PGP veya Advanced Certificate Programları kazanın.

Bayes Ağları nedir?

Tanım olarak, Bayes Ağları, olasılık hesaplamaları için Bayes çıkarımlarını kullanan bir Olasılıksal Grafik Model türüdür. Bir Yönlendirilmiş Döngüsel Grafik (DAG) ile bir dizi değişkeni ve koşullu olasılıklarını temsil eder. Öncelikle, meydana gelen bir olayı dikkate almak ve bilinen birkaç olası nedenden herhangi birinin katkıda bulunan faktör olma olasılığını tahmin etmek için uygundurlar.

Kaynak

Yukarıda bahsedildiği gibi, Bayesian Ağı tarafından belirtilen ilişkilerden yararlanarak, koşullu olasılıklarla Ortak Olasılık Dağılımı (JPF) elde edebiliriz. Grafikteki her düğüm rastgele bir değişkeni temsil eder ve yay (veya yönlendirilmiş ok) düğümler arasındaki ilişkiyi temsil eder. Doğada sürekli veya ayrık olabilirler.

Yukarıdaki diyagramda A, B, C ve D, grafiğin ağında verilen düğümlerle temsil edilen 4 rastgele değişkendir. B düğümünün A üst düğümü, C ise alt düğümüdür. Düğüm C, Düğüm A'dan bağımsızdır.

Bir Bayes Ağının uygulanmasına geçmeden önce, anlaşılması gereken birkaç olasılık temeli vardır.

Yerel Markov Özelliği

Bayes Ağları, Yerel Markov Özelliği olarak bilinen özelliği karşılar. Bir düğümün, ebeveynleri göz önüne alındığında, soyundan gelenlerden koşullu olarak bağımsız olduğunu belirtir. Yukarıdaki örnekte, P(D|A, B), P(D|A)'ya eşittir çünkü D, onun inişli olmayanı olan B'den bağımsızdır. Bu özellik, Ortak Dağılımı basitleştirmemize yardımcı olur. Yerel Markov Özelliği bizi Markov özelliklerini takip ettiği söylenen bir değişkenin etrafındaki rastgele bir alan olan bir Markov Rastgele Alanı kavramına götürür.

Şartlı olasılık

Matematikte, A olayının Koşullu Olasılığı, başka bir B olayının zaten meydana geldiği göz önüne alındığında, A olayının meydana gelme olasılığıdır. Basit bir ifadeyle, p(A | B), B olayının meydana geldiği göz önüne alındığında, A olayının meydana gelme olasılığıdır. Ancak A ve B arasında iki tür olay olasılığı vardır. Bunlar bağımlı olaylar veya bağımsız olaylar olabilir. Türlerine bağlı olarak, koşullu olasılığı hesaplamanın iki farklı yolu vardır.

  • A ve B'nin bağımlı olaylar olduğu göz önüne alındığında, koşullu olasılık P (A| B) = P (A ve B) / P (B) şeklinde hesaplanır.
  • A ve B bağımsız olaylarsa, koşullu olasılık ifadesi şu şekilde verilir: P(A| B) = P (A)

Ortak Olasılık Dağılımı

Bayes Ağları örneğine girmeden önce, Ortak Olasılık Dağılımı kavramını anlayalım. a1, a2 ve a3 değişkenlerini ele alalım. Tanım olarak, a1, a2 ve a3'ün tüm farklı olası kombinasyonlarının olasılıkları, Ortak Olasılık Dağılımı olarak adlandırılır.

P[a1,a2, a3,….., an], a1'den an'a kadar olan aşağıdaki değişkenlerin JPD'si ise, Ortak Olasılık Dağılımını aşağıdaki gibi çeşitli terimlerin bir kombinasyonu olarak hesaplamanın birkaç yolu vardır:

P[a1,a2, a3,….., an] = P[a1 | a2, a3,….., an] * P[a2, a3,….., an]

= P[a1 | a2, a3,….., an] * P[a2 | a3,….., an]….P[an-1|an] * P[an]

Yukarıdaki denklemi genelleştirerek, Ortak Olasılık Dağılımını şu şekilde yazabiliriz:

P(X i |X i-1 ,………, X n ) = P(X i |Ebeveynler(X ben ))

Bayes Ağları Örneği

Şimdi basit bir örnek yardımıyla Bayes Ağlarının mekanizmasını ve avantajlarını anlayalım. Bu örnekte, bir öğrencinin az önce verdiği bir sınav için notlarını ( m ) modelleme görevinin bize verildiğini düşünelim. Aşağıda verilen Bayes Ağ Grafiğinden, işaretlerin diğer iki değişkene bağlı olduğunu görüyoruz. Onlar,

  • Sınav Düzeyi ( e )– Bu ayrık değişken sınavın zorluğunu belirtir ve iki değere sahiptir (kolay için 0 ve zor için 1)
  • IQ Seviyesi ( i ) – Bu, öğrencinin Zeka Bölümü seviyesini temsil eder ve doğası gereği iki değere sahip ayrıktır (düşük için 0 ve yüksek için 1)

Ayrıca öğrencinin IQ seviyesi de bizi öğrencinin Yetenek Puanı ( s ) olan başka bir değişkene götürür. Şimdi, öğrencinin aldığı notlarla belirli bir üniversiteye kabul edilmesini sağlayabilir. Bir üniversiteye ( a ) kabul edilme olasılık dağılımı da aşağıda verilmiştir.

Yukarıdaki grafikte, verilen 5 değişkenin olasılık dağılım değerlerini temsil eden birkaç tablo görüyoruz. Bu tablolara Koşullu Olasılıklar Tablosu veya CPT denir. Aşağıda verilen CPT'nin birkaç özelliği vardır –

  • Belirli bir değişken için tüm olası durumlar ayrıntılı olduğundan (tüm olasılıkları temsil eden) her satırdaki CPT değerlerinin toplamı 1'e eşit olmalıdır.
  • Doğası gereği Boole olan bir değişkenin k Boole ebeveyni varsa, CPT'de 2K olasılık değerlerine sahiptir.

Sorunumuza geri dönersek, önce yukarıda verilen tabloda meydana gelen tüm olası olayları listeleyelim.

  1. Sınav Seviyesi (e)
  2. IQ Seviyesi (i)
  3. Yetenek Puanı (lar)
  4. İşaretler (m)
  5. Kabul (a)

Bu beş değişken, Koşullu Olasılık tablolarıyla birlikte Bayes Ağı formatında Yönlendirilmiş Döngüsel Grafik (DAG) biçiminde temsil edilir. Şimdi, formül tarafından verilen 5 değişkenin Ortak Olasılık Dağılımını hesaplamak için,

P[a, m, i, e, s]= P(a | m) . P(m | ben, e) . P(i) . P(e) . P(s | ben)

Yukarıdaki formülden,

  • P(a | m), öğrencinin sınavda aldığı puana göre kabul edilmesinin koşullu olasılığını ifade eder.
  • P(m | i, e) öğrencinin IQ seviyesi ve Sınav Seviyesinin zorluğuna göre alacağı notları temsil eder.
  • P(i) ve P(e), IQ Düzeyinin ve Sınav Düzeyinin olasılığını temsil eder.
  • P(s | i), öğrencinin IQ Düzeyine göre verilen Yetenek Puanının koşullu olasılığıdır.

Aşağıdaki olasılıklar hesaplanarak, tüm Bayes Ağının Ortak Olasılık Dağılımını bulabiliriz.

Ortak Olasılık Dağılımının Hesaplanması

Şimdi iki durum için JPD'yi hesaplayalım.

Durum 1: Sınav seviyesinin zor olmasına rağmen, IQ seviyesi düşük ve Yetenek Puanı düşük olan öğrencinin sınavı geçme ve üniversiteye güvenli bir şekilde girme olasılığını hesaplayın.

Yukarıdaki kelime problem ifadesinden Ortak Olasılık Dağılımı aşağıdaki gibi yazılabilir,

P[a=1, m=1, i=0, e=1, s=0]

Yukarıdaki Koşullu Olasılık tablolarından verilen koşullar için değerler formüle beslenir ve aşağıdaki gibi hesaplanır.

P[a=1, m=1, i=0, e=0, s=0] = P(a=1 | m=1) . P(m=1 | i=0, e=1) . P(i=0) . P(e=1) . P(s=0 | i=0)

= 0.1 * 0.1 * 0.8 * 0.3 * 0.75

= 0.0018

Durum 2: Bir başka durumda, öğrencinin Yüksek IQ düzeyine ve Yetenek Puanına sahip olma, sınavın kolay olmasına rağmen başarılı olamama ve üniversiteye kabulü garantilememe olasılığını hesaplayın.

JPD formülü şu şekilde verilir:

P[a=0, m=0, i=1, e=0, s=1]

Böylece,

P[a=0, m=0, i=1, e=0, s=1]= P(a=0 | m=0) . P(m=0 | i=1, e=0) . P(i=1) . P(e=0) . P(s=1 | i=1)

= 0,6 * 0,5 * 0,2 * 0,7 * 0,6

= 0.0252

Dolayısıyla, bu şekilde, meydana gelen çeşitli olası olayların olasılığını hesaplamak için Bayes Ağları ve Olasılık tablolarından yararlanabiliriz.

Ayrıca Okuyun: Makine Öğrenimi Proje Fikirleri ve Konuları

Çözüm

Spam Filtreleme, Semantik Arama, Bilgi Alma ve daha pek çok konuda Bayes Ağlarına yönelik sayısız uygulama vardır. Örneğin, belirli bir semptomla, hastalığa katkıda bulunan diğer birkaç faktörle birlikte bir hastalığın ortaya çıkma olasılığını tahmin edebiliriz. Bu nedenle, bu makalede Bayes Ağı kavramı, gerçek hayattan bir örnekle uygulanmasıyla birlikte tanıtılmaktadır.

Makine öğrenimi ve yapay zekada uzmanlaşmayı merak ediyorsanız, IIIT-B ve Liverpool John Moores Üniversitesi ile Makine Öğrenimi ve Yapay Zeka üzerine İleri Düzey Kurs ile kariyerinizi artırın.

Bayes ağları nasıl uygulanır?

Bayes ağı, düğümlerin her birinin rastgele değişkenleri temsil ettiği bir grafik modeldir. Her düğüm, diğer düğümlere yönlendirilmiş yaylarla bağlanır. Her yay, çocuklara verilen ebeveynlerin koşullu olasılık dağılımını temsil eder. Yönlendirilmiş kenarlar, bir ebeveynin çocukları üzerindeki etkisini temsil eder. Düğümler genellikle bazı gerçek dünya nesnelerini temsil eder ve yaylar, aralarındaki bazı fiziksel veya mantıksal ilişkileri temsil eder. Bayes ağları, otomatik konuşma tanıma, belge/görüntü sınıflandırma, tıbbi teşhis ve robotik gibi birçok uygulamada kullanılmaktadır.

Bayes ağı neden önemlidir?

Bildiğimiz gibi, Bayes ağı, makine öğrenimi ve istatistiğin önemli bir parçasıdır. Veri madenciliği ve bilimsel keşifte kullanılır. Bayes ağı, rastgele değişkenleri temsil eden düğümleri ve doğrudan etkiyi temsil eden yayları olan bir yönlendirilmiş asiklik grafiktir (DAG). Bayes ağı, Metin analizi, Dolandırıcılık tespiti, Kanser tespiti, Görüntü tanıma vb. gibi çeşitli uygulamalarda kullanılmaktadır. Bu yazıda Bayes ağlarında Akıl Yürütmeyi tartışacağız. Bayes Ağı, geçmişi analiz etmek, geleceği tahmin etmek ve kararların kalitesini iyileştirmek için önemli bir araçtır. Bayesian Network'ün kökeni istatistiklere dayanmaktadır, ancak şu anda Araştırma Bilimcileri, Yöneylem Araştırması Analistleri, Endüstri Mühendisleri, Pazarlama Uzmanları, İş Danışmanları ve hatta Yöneticiler dahil olmak üzere tüm profesyoneller tarafından kullanılmaktadır.

Seyrek Bayes Ağı nedir?

Seyrek Bayes Ağı (SBN), koşullu olasılık dağılımının seyrek bir grafik olduğu özel bir Bayes ağı türüdür. Değişken sayısı fazla ve/veya gözlem sayısı az olduğunda bir SBN kullanmak uygun olabilir. Genel olarak, Bayes Ağları, bir gözlemi veya olayı bir dizi faktöre koşullandırarak açıklamakla ilgilendiğinizde en kullanışlıdır.