مثال على شبكة بايز [مع تمثيل رسومي]

نشرت: 2021-01-29

جدول المحتويات

مقدمة

في الإحصاء ، تُستخدم النماذج الاحتمالية لتحديد العلاقة بين المتغيرات ويمكن استخدامها لحساب احتمالات كل متغير. في كثير من المشاكل ، هناك عدد كبير من المتغيرات. في مثل هذه الحالات ، تتطلب النماذج الشرطية بالكامل قدرًا هائلاً من البيانات لتغطية كل حالة من وظائف الاحتمال التي قد يكون من الصعب حسابها في الوقت الفعلي. كانت هناك عدة محاولات لتبسيط حسابات الاحتمال الشرطي مثل Naive Bayes ، لكن مع ذلك ، لم تثبت فعاليتها لأنها تقلل بشكل كبير من العديد من المتغيرات.

الطريقة الوحيدة هي تطوير نموذج يمكنه الحفاظ على التبعيات الشرطية بين المتغيرات العشوائية والاستقلال الشرطي في حالات أخرى. هذا يقودنا إلى مفهوم شبكات Bayesian. تساعدنا شبكات Bayesian هذه على تصور النموذج الاحتمالي بشكل فعال لكل مجال ودراسة العلاقة بين المتغيرات العشوائية في شكل رسم بياني سهل الاستخدام.

تعلم دورة ML من أفضل الجامعات في العالم. احصل على درجة الماجستير أو برنامج PGP التنفيذي أو برامج الشهادات المتقدمة لتسريع مسار حياتك المهنية.

ما هي شبكات بايزي؟

بحكم التعريف ، تعد شبكات بايز نوعًا من النماذج الرسومية الاحتمالية التي تستخدم الاستدلالات البايزية لحساب الاحتمالات. يمثل مجموعة من المتغيرات واحتمالاتها الشرطية برسم بياني دوري موجه (DAG). إنها مناسبة في المقام الأول للنظر في حدث وقع والتنبؤ باحتمالية أن يكون أيًا من الأسباب العديدة المحتملة المعروفة هو العامل المساهم.

مصدر

كما ذكرنا أعلاه ، من خلال الاستفادة من العلاقات المحددة بواسطة شبكة بايز ، يمكننا الحصول على التوزيع الاحتمالي المشترك (JPF) مع الاحتمالات الشرطية. تمثل كل عقدة في الرسم البياني متغيرًا عشوائيًا ويمثل القوس (أو السهم الموجه) العلاقة بين العقد. يمكن أن تكون إما متصلة أو منفصلة بطبيعتها.

في الرسم البياني أعلاه A و B و C و D عبارة عن 4 متغيرات عشوائية ممثلة بالعقد الواردة في شبكة الرسم البياني. بالنسبة للعقدة B ، فإن A هي العقدة الأصلية و C هي العقدة الفرعية الخاصة بها. العقدة C مستقلة عن العقدة A.

قبل أن ندخل في تنفيذ شبكة بايز ، هناك بعض الأساسيات الاحتمالية التي يجب فهمها.

ملكية ماركوف المحلية

تُلبي شبكات بايزي العقار المعروف باسم ملكية ماركوف المحلية. تنص على أن العقدة مستقلة بشكل مشروط عن غير المنحدرين منها ، بالنظر إلى والديها. في المثال أعلاه ، P (D | A ، B) تساوي P (D | A) لأن D مستقلة عن غير منحدرة ، B. هذه الخاصية تساعدنا في تبسيط التوزيع المشترك. تقودنا خاصية ماركوف المحلية إلى مفهوم حقل ماركوف العشوائي وهو حقل عشوائي حول متغير يقال إنه يتبع خصائص ماركوف.

احتمال مشروط

في الرياضيات ، فإن الاحتمال الشرطي للحدث A هو احتمال وقوع الحدث A بالنظر إلى وقوع حدث آخر B بالفعل. بعبارات بسيطة ، p (A | B) هو احتمال وقوع الحدث A ، بالنظر إلى هذا الحدث ، B يحدث. ومع ذلك ، هناك نوعان من احتمالات الأحداث بين A و B. قد تكون إما أحداثًا تابعة أو أحداثًا مستقلة. اعتمادًا على نوعها ، توجد طريقتان مختلفتان لحساب الاحتمال الشرطي.

نظرًا لأن A و B حدثان تابعان ، يتم حساب الاحتمال الشرطي على أنه P (A | B) = P (A and B) / P (B)
إذا كان A و B حدثين مستقلين ، فسيتم إعطاء تعبير الاحتمال الشرطي بواسطة P (A | B) = P (A)

التوزيع الاحتمالي المشترك

قبل أن ندخل في مثال شبكات Bayesian ، دعونا نفهم مفهوم التوزيع الاحتمالي المشترك. ضع في اعتبارك 3 متغيرات a1 و a2 و a3. بحكم التعريف ، فإن احتمالات جميع التوليفات الممكنة المختلفة من a1 و a2 و a3 تسمى التوزيع الاحتمالي المشترك.

إذا كانت P [a1، a2، a3،… ..، a] هي JPD للمتغيرات التالية من a1 إلى a ، فهناك عدة طرق لحساب التوزيع الاحتمالي المشترك كمجموعة من المصطلحات المختلفة مثل ،

P [a1، a2، a3،… ..، an] = P [a1 | a2، a3،… ..، an] * P [a2، a3،… ..، an]

= P [a1 | a2، a3،… ..، an] * P [a2 | a3،… ..، an]… .P [an-1 | an] * P [an]

بتعميم المعادلة أعلاه ، يمكننا كتابة التوزيع الاحتمالي المشترك ،

P (X i | X i-1 ، ………، X n ) = P (X i | الآباء (X i ))

مثال على شبكات بايزي

دعونا الآن نفهم آلية شبكات Bayesian ومزاياها بمساعدة مثال بسيط. في هذا المثال ، دعنا نتخيل أنه يتم تكليفنا بمهمة تصميم علامات الطالب ( م ) لامتحان قد قدمه للتو. من الرسم البياني لشبكة بايز أدناه ، نرى أن العلامات تعتمد على متغيرين آخرين. هم انهم،

مستوى الاختبار ( هـ ) - يشير هذا المتغير المنفصل إلى صعوبة الاختبار وله قيمتان (0 لسهولة و 1 للصعوبة)
مستوى الذكاء ( i ) - هذا يمثل مستوى حاصل الذكاء للطالب وهو أيضًا منفصل بطبيعته وله قيمتان (0 لمنخفض و 1 للارتفاع)

بالإضافة إلى ذلك ، يقودنا مستوى الذكاء لدى الطالب أيضًا إلى متغير آخر ، وهو درجة الكفاءة للطالب (الطلاب ) . الآن ، مع العلامات التي سجلها الطالب ، يمكنه تأمين القبول في جامعة معينة. يرد أدناه أيضًا توزيع احتمالية القبول ( أ ) في إحدى الجامعات.

في الرسم البياني أعلاه ، نرى عدة جداول تمثل قيم التوزيع الاحتمالي للمتغيرات الخمسة المحددة. تسمى هذه الجداول جدول الاحتمالات الشرطية أو CPT. هناك عدد قليل من خصائص CPT الواردة أدناه -

يجب أن يكون مجموع قيم CPT في كل صف مساويًا لـ 1 لأن جميع الحالات المحتملة لمتغير معين شاملة (تمثل جميع الاحتمالات).
إذا كان المتغير المنطقي بطبيعته يحتوي على أبوين منطقيتين k ، فإنه يحتوي في CPT على قيم احتمالية تبلغ 2K.

بالعودة إلى مشكلتنا ، دعنا أولاً ندرج جميع الأحداث المحتملة التي تحدث في الجدول الوارد أعلاه.

مستوى الامتحان (هـ)
مستوى الذكاء (1)
نقاط الكفاءة
علامات (م)
القبول (أ)

يتم تمثيل هذه المتغيرات الخمسة في شكل رسم بياني دوري موجه (DAG) بتنسيق شبكة بايزي مع جداول الاحتمالية الشرطية الخاصة بهم. الآن ، لحساب التوزيع الاحتمالي المشترك للمتغيرات الخمسة ، يتم إعطاء الصيغة بواسطة ،

الفوسفور [أ ، م ، أنا ، هـ ، ق] = ف (أ | م). ف (م | ط ، هـ). ص (ط). ف (هـ). ف (ق | ط)

من الصيغة أعلاه ،

تشير P (a | m) إلى الاحتمال الشرطي لحصول الطالب على القبول بناءً على العلامات التي سجلها في الاختبار.
تمثل P (m | i، e) العلامات التي سيحرزها الطالب في ضوء مستوى الذكاء وصعوبة مستوى الاختبار.
تمثل P (i) و P (e) احتمالية مستوى الذكاء ومستوى الاختبار.
P (s | i) هو الاحتمال الشرطي لدرجة كفاءة الطالب ، بالنظر إلى مستوى ذكائه.

مع حساب الاحتمالات التالية ، يمكننا إيجاد التوزيع الاحتمالي المشترك لشبكة بايزي بأكملها.

حساب التوزيع الاحتمالي المشترك

دعونا الآن نحسب JPD لحالتين.

الحالة 1: احسب احتمال أنه على الرغم من صعوبة مستوى الامتحان ، فإن الطالب الذي يتمتع بمستوى ذكاء منخفض ودرجة كفاءة منخفضة ، يمكنه اجتياز الاختبار وتأمين القبول في الجامعة.

من بيان مشكلة الكلمة أعلاه ، يمكن كتابة التوزيع الاحتمالي المشترك على النحو التالي ،

ف [أ = 1 ، م = 1 ، أنا = 0 ، ه = 1 ، ث = 0]

من جداول الاحتمال الشرطي أعلاه ، يتم تغذية القيم الخاصة بالشروط المحددة في الصيغة ويتم حسابها على النحو التالي.

الفوسفور [أ = 1 ، م = 1 ، أنا = 0 ، البريد = 0 ، ث = 0] = الفوسفور (أ = 1 | م = 1). الفوسفور (م = 1 | أنا = 0 ، ه = 1). ف (أنا = 0). ف (ه = 1). الفوسفور (ق = 0 | أنا = 0)

= 0.1 * 0.1 * 0.8 * 0.3 * 0.75

= 0.0018

الحالة 2: في حالة أخرى ، احسب احتمال حصول الطالب على مستوى ذكاء عالٍ ودرجة كفاءة ، حيث يكون الاختبار سهلاً ولكنه لا ينجح ولا يؤمن القبول في الجامعة.

يتم إعطاء صيغة JPD بواسطة

ف [أ = 0 ، م = 0 ، أنا = 1 ، ه = 0 ، ث = 1]

هكذا،

الفوسفور [أ = 0 ، م = 0 ، أنا = 1 ، البريد = 0 ، ث = 1] = الفوسفور (أ = 0 | م = 0). الفوسفور (م = 0 | أنا = 1 ، ه = 0). ف (أنا = 1). ف (ه = 0). الفوسفور (ق = 1 | أنا = 1)

= 0.6 * 0.5 * 0.2 * 0.7 * 0.6

= 0.0252

ومن ثم ، بهذه الطريقة ، يمكننا الاستفادة من شبكات Bayesian وجداول الاحتمالات لحساب احتمالية وقوع أحداث مختلفة محتملة.

اقرأ أيضًا: أفكار ومواضيع لمشروع التعلم الآلي

خاتمة

هناك عدد لا يحصى من التطبيقات لشبكات Bayesian في تصفية البريد العشوائي والبحث الدلالي واسترجاع المعلومات وغير ذلك الكثير. على سبيل المثال ، مع عرض معين يمكننا التنبؤ باحتمالية حدوث مرض مع العديد من العوامل الأخرى التي تساهم في المرض. وبالتالي ، تم تقديم مفهوم شبكة Bayesian في هذه المقالة جنبًا إلى جنب مع تنفيذها مع مثال من الحياة الواقعية.

إذا كنت مهتمًا بإتقان التعلم الآلي والذكاء الاصطناعي ، فقم بتعزيز حياتك المهنية من خلال دورة متقدمة في التعلم الآلي والذكاء الاصطناعي مع IIIT-B وجامعة Liverpool John Moores.

كيف يتم تنفيذ شبكات بايز؟

شبكة بايز هي نموذج رسومي حيث تمثل كل عقد متغيرات عشوائية. كل عقدة متصلة بالعقد الأخرى بواسطة أقواس موجهة. يمثل كل قوس توزيعًا احتماليًا مشروطًا للوالدين نظرًا للأطفال. تمثل الحواف الموجهة تأثير أحد الوالدين على أطفاله. تمثل العقد عادةً بعض كائنات العالم الحقيقي وتمثل الأقواس بعض العلاقات المادية أو المنطقية بينها. تُستخدم شبكات Bayesian في العديد من التطبيقات مثل التعرف التلقائي على الكلام وتصنيف المستندات / الصور والتشخيص الطبي والروبوتات.

لماذا تعتبر شبكة بايز مهمة؟

كما نعلم ، تعد شبكة Bayesian جزءًا مهمًا من التعلم الآلي والإحصاءات. يتم استخدامه في التنقيب عن البيانات والاكتشاف العلمي. شبكة Bayesian عبارة عن رسم بياني لا دوري موجه (DAG) مع عقد تمثل متغيرات عشوائية وأقواس تمثل تأثيرًا مباشرًا. تُستخدم شبكة Bayesian في العديد من التطبيقات مثل تحليل النص واكتشاف الاحتيال واكتشاف السرطان والتعرف على الصور وما إلى ذلك. في هذه المقالة ، سنناقش التفكير المنطقي في شبكات Bayesian. تعتبر شبكة بايز أداة مهمة لتحليل الماضي والتنبؤ بالمستقبل وتحسين جودة القرارات. تعود أصول شبكة Bayesian Network إلى الإحصاء ، ولكن يتم استخدامها الآن من قبل جميع المهنيين بما في ذلك علماء الأبحاث ومحللو أبحاث العمليات والمهندسون الصناعيون ومتخصصو التسويق ومستشاري الأعمال وحتى المديرين.

ما هي شبكة Sparse Bayesian Network؟

تعتبر شبكة Sparse Bayesian Network (SBN) نوعًا خاصًا من شبكات Bayesian حيث يكون التوزيع الاحتمالي الشرطي عبارة عن رسم بياني متفرق. قد يكون من المناسب استخدام SBN عندما يكون عدد المتغيرات كبيرًا و / أو عدد الملاحظات صغيرًا. بشكل عام ، تكون شبكات Bayesian مفيدة للغاية عندما تكون مهتمًا بشرح ملاحظة أو حدث من خلال تكييف عدد من العوامل.