貝葉斯網絡示例 [帶圖形表示]

已發表: 2021-01-29

目錄

介紹

在統計學中,概率模型用於定義變量之間的關係,並可用於計算每個變量的概率。 在許多問題中,存在大量變量。 在這種情況下,完全條件模型需要大量數據來涵蓋概率函數的每一種情況,這可能難以實時計算。 已經有幾次嘗試簡化條件概率計算,例如樸素貝葉斯,但仍然證明它不是有效的,因為它大大減少了幾個變量。

唯一的方法是開發一個模型,該模型可以保留隨機變量之間的條件依賴關係和其他情況下的條件獨立性。 這將我們引向貝葉斯網絡的概念。 這些貝葉斯網絡幫助我們有效地可視化每個域的概率模型,並以用戶友好的圖形的形式研究隨機變量之間的關係。

從世界頂級大學學習ML 課程獲得碩士、Executive PGP 或高級證書課程以加快您的職業生涯。

什麼是貝葉斯網絡?

根據定義,貝葉斯網絡是一種概率圖形模型,它使用貝葉斯推理進行概率計算。 它用有向無環圖 (DAG) 表示一組變量及其條件概率。 它們主要適用於考慮已發生的事件並預測幾種可能的已知原因中的任何一種是促成因素的可能性。

資源

如上所述,通過利用貝葉斯網絡指定的關係,我們可以獲得具有條件概率的聯合概率分佈(JPF)。 圖中的每個節點代表一個隨機變量,弧(或有向箭頭)代表節點之間的關係。 它們本質上可以是連續的或離散的。

在上圖中,A、B、C 和 D 是 4 個隨機變量,由圖中網絡中給定的節點表示。 對於節點 B,A 是它的父節點,C 是它的子節點。 節點 C 獨立於節點 A。

在我們開始實施貝葉斯網絡之前,必須了解一些概率基礎知識。

局部馬爾可夫性質

貝葉斯網絡滿足稱為局部馬爾可夫性質的性質。 它指出,給定其父節點,節點有條件地獨立於其非後代。 在上面的例子中,P(D|A, B) 等於 P(D|A),因為 D 獨立於它的非後裔 B。這個屬性有助於我們簡化聯合分佈。 局部馬爾可夫屬性將我們引向馬爾可夫隨機場的概念,它是圍繞一個變量的隨機場,據說它遵循馬爾可夫屬性。

條件概率

在數學中,事件 A 的條件概率是在另一個事件 B 已經發生的情況下,事件 A 發生的概率。 簡單來說,p(A | B) 是在給定事件 B 發生的情況下,事件 A 發生的概率。 但是,在 A 和 B 之間有兩種事件可能性。它們可能是依賴事件,也可能是獨立事件。 根據它們的類型,有兩種不同的方法來計算條件概率。

  • 給定 A 和 B 是相關事件,條件概率計算為 P (A| B) = P (A 和 B) / P (B)
  • 如果 A 和 B 是獨立事件,則條件概率的表達式為: P(A| B) = P (A)

聯合概率分佈

在我們進入貝葉斯網絡的例子之前,讓我們了解聯合概率分佈的概念。 考慮 3 個變量 a1、a2 和 a3。 根據定義,a1、a2 和 a3 的所有不同可能組合的概率稱為其聯合概率分佈。

如果 P[a1,a2,a3,…..,an] 是從 a1 到 an 的以下變量的 JPD,那麼有幾種方法可以計算聯合概率分佈作為各種項的組合,例如,

P[a1,a2, a3,….., an] = P[a1 | a2, a3,….., an] * P[a2, a3,….., an]

= P[a1 | a2, a3,….., 一個] * P[a2 | a3,….., an]….P[an-1|an] * P[an]

推廣上述方程,我們可以將聯合概率分佈寫為,

P(X i |X i-1 ,………, X n ) = P(X i |Parents(X i ))

貝葉斯網絡示例

現在讓我們藉助一個簡單的例子來了解貝葉斯網絡的機制及其優勢。 在這個例子中,讓我們假設我們的任務是為學生剛剛參加的考試的分數 ( m ) 建模。 從下面給定的貝葉斯網絡圖中,我們看到標記取決於其他兩個變量。 他們是,

  • 考試等級( e )——這個離散變量表示考試的難度,有兩個值(0 表示容易,1 表示困難)
  • 智商水平 ( i ) – 這代表學生的智商水平,並且在本質上也是離散的,具有兩個值(0 表示低,1 表示高)

此外,學生的智商水平也將我們引向另一個變量,即學生的 Aptitude Score ( s )。 現在,有了學生的分數,他就可以確保進入特定的大學。 下面還給出了被大學錄取 ( a ) 的概率分佈。

在上圖中,我們看到幾個表格表示給定 5 個變量的概率分佈值。 這些表稱為條件概率表或 CPT。 下面給出了 CPT 的一些屬性——

  • 每行中 CPT 值的總和必須等於 1,因為特定變量的所有可能情況都是詳盡無遺的(代表所有可能性)。
  • 如果一個本質上是布爾變量的變量有 k 個布爾值,那麼在 CPT 中它有 2K 個概率值。

回到我們的問題,讓我們首先列出上表中發生的所有可能事件。

  1. 考試等級 (e)
  2. 智商水平 (i)
  3. 能力傾向得分(s)
  4. 標記(米)
  5. 入場(一)

這五個變量以貝葉斯網絡格式的有向無環圖 (DAG) 的形式及其條件概率表表示。 現在,要計算 5 個變量的聯合概率分佈,公式由下式給出,

P[a, m, i, e, s]= P(a | m) 。 P(m | i, e) 。 (一)。 P(e) 。 P(s | i)

由上式可知,

  • P(a | m) 表示學生根據他在考試中獲得的分數獲得錄取的條件概率。
  • P(m | i, e) 表示根據學生的 IQ 水平和考試級別的難度,學生將獲得的分數。
  • P(i) 和 P(e) 代表 IQ Level 和 Exam Level 的概率。
  • P(s | i) 是給定學生 IQ 水平的學生能力傾向分數的條件概率。

通過計算以下概率,我們可以找到整個貝葉斯網絡的聯合概率分佈。

聯合概率分佈的計算

現在讓我們計算兩種情況的 JPD。

案例1:計算儘管考試難度很大,但智商水平低、能力傾向分數低的學生通過考試並獲得大學錄取的概率。

從上面的文字問題陳述中,聯合概率分佈可以寫成如下,

P[a=1, m=1, i=0, e=1, s=0]

從上面的條件概率表中,給定條件的值被輸入公式併計算如下。

P[a=1, m=1, i=0, e=0, s=0] = P(a=1 | m=1) 。 P(m=1 | i=0, e=1) 。 P(i=0) 。 P(e=1) 。 P(s=0 | i=0)

= 0.1 * 0.1 * 0.8 * 0.3 * 0.75

= 0.0018

案例 2:在另一種情況下,計算該學生具有高 IQ 水平和 Aptitude Score 的概率,考試很容易但未能通過並且不能確保被大學錄取。

JPD 的公式由下式給出

P[a=0, m=0, i=1, e=0, s=1]

因此,

P[a=0, m=0, i=1, e=0, s=1]= P(a=0 | m=0) 。 P(m=0 | i=1, e=0) 。 P(i=1) 。 P(e=0) 。 P(s=1 | i=1)

= 0.6 * 0.5 * 0.2 * 0.7 * 0.6

= 0.0252

因此,通過這種方式,我們可以利用貝葉斯網絡和概率表來計算各種可能發生的事件的概率。

另請閱讀:機器學習項目的想法和主題

結論

貝葉斯網絡在垃圾郵件過濾、語義搜索、信息檢索等方面有無數的應用。 例如,對於給定的症狀,我們可以預測疾病與其他幾個導致疾病的因素一起發生的概率。 因此,本文介紹了貝葉斯網絡的概念,並通過一個實際示例對其實現進行了介紹。

如果您想掌握機器學習和人工智能,請通過 IIIT-B 和利物浦約翰摩爾斯大學的機器學習和人工智能高級課程提升您的職業生涯。

貝葉斯網絡是如何實現的?

貝葉斯網絡是一個圖形模型,其中每個節點代表隨機變量。 每個節點通過有向弧連接到其他節點。 每個弧表示給定孩子的父母的條件概率分佈。 有向邊表示父母對其子女的影響。 節點通常代表一些現實世界的對象,弧線代表它們之間的一些物理或邏輯關係。 貝葉斯網絡用於許多應用,如自動語音識別、文檔/圖像分類、醫學診斷和機器人技術。

為什麼貝葉斯網絡很重要?

眾所周知,貝葉斯網絡是機器學習和統計的重要組成部分。 它用於數據挖掘和科學發現。 貝葉斯網絡是一個有向無環圖(DAG),節點代表隨機變量,弧代表直接影響。 貝葉斯網絡用於各種應用,如文本分析、欺詐檢測、癌症檢測、圖像識別等。在本文中,我們將討論貝葉斯網絡中的推理。 貝葉斯網絡是分析過去、預測未來和提高決策質量的重要工具。 貝葉斯網絡起源於統計學,但現在被所有專業人士使用,包括研究科學家、運籌學分析師、工業工程師、營銷專業人士、商業顧問甚至經理。

什麼是稀疏貝葉斯網絡?

稀疏貝葉斯網絡 (SBN) 是一種特殊的貝葉斯網絡,其中條件概率分佈是一個稀疏圖。 當變量的數量很大和/或觀察的數量很少時,使用 SBN 可能是合適的。 通常,當您有興趣通過基於多個因素來解釋觀察或事件時,貝葉斯網絡最有用。