دليل المبتدئين للاستدلال بايزي: دليل كامل
نشرت: 2021-11-26تتزايد تطبيقات التعلم الآلي مع إمكانية التطبيق على نطاق واسع في البحث ووسائل التواصل الاجتماعي والإعلان وما إلى ذلك. ومع ذلك ، تتعامل التطبيقات في الغالب مع التنبؤ الذي يتضمن قدرًا هائلاً من البيانات. غالبًا ما تستخدم الإحصائيات لتقدير قياس قيم عدم اليقين. إذا كانت لدينا أحداث مختلفة ، فيمكن أن تحدد ثلاث طرق احتمال وقوع الحدث.
هذه الطرق الثلاث هي:
- كلاسيكي
- بايزي
- كثرة
دعونا نفكر في مثال على رمي النرد لإيجاد احتمال ما إذا كان سيظهر وجه "أربعة". سيساعد في فهم الأنواع الثلاثة لطرق تحديد الاحتمال. لنفترض أنك نظرت في الطريقة الكلاسيكية لتقدير الاحتمالات. في هذه الحالة ، يُعتقد أنه سيكون هناك إجمالي ست نتائج ، وأن احتمال حدوث أي نتيجة سيكون هو نفسه. في مثل هذا الافتراض ، فإن احتمال أن تكون النتيجة أربعة سيكون 1/6. عادة ما تعمل الطريقة الكلاسيكية بشكل جيد عندما يكون للنتائج نفس النتائج المحتملة. ولكن عندما تصبح النتائج أكثر ذاتية ، لا يمكن استخدام هذه الطريقة.
إذا أخذنا في الاعتبار الطريقة المتكررة ، فمن الضروري أن يكون هناك تسلسل غير محدود لحدث افتراضي. ثم يتطلب البحث عن التردد ذي الصلة في التسلسل الافتراضي اللانهائي. بالنظر إلى مثال النرد أعلاه ، إذا تم دحرجة النرد لعدد لا نهائي من المرات ، فإن النتيجة ، أي 1/6 ، يمكننا الحصول على النتيجة كأربعة. لذلك ، فإن احتمال أن تكون النتيجة أربعة في الزهر ذي الجوانب الستة سيكون 1/6 وفقًا لتعريف طريقة التكرار.
الآن نحو نهج بايزي ، فإنه يوفر لك بعض المزايا. وفقًا لوجهة نظر هذه الطريقة ، يمكنك دمج اعتقاد شخصي في عملية اتخاذ القرار. هذا يعني أنه سينظر في أشياء مثل المعلومات المعروفة بخصوص المشكلة. يتم أيضًا مراعاة حقيقة أن الأفراد المختلفين يمكن أن يكون لديهم معتقدات مختلفة في هذا النهج. على سبيل المثال ، افترض أنه إذا ذكر أحدهم أن احتمال هطول المطر سيكون 90٪ غدًا ، فبالنسبة لشخص آخر ، قد يكون احتمال هطول المطر 60٪. لذلك ، فإن طريقة نهج بايز ذاتية. ومع ذلك ، فإن النتائج أكثر سهولة مقارنة بالطريقة المتكررة.
جدول المحتويات
الاستدلال بايزي
يستخدم الاستدلال البايزي في الغالب لمشكلة الاستدلال الإحصائي. في هذه الحالات ، هناك دائمًا كمية (بيانات) غير معروفة يجب تقديرها. وبعد ذلك ، من البيانات ، يتم تقدير المبلغ المطلوب. يشار إلى الكمية غير المعروفة باسم θ. هناك افتراض بأن θ كمية عشوائية ، وهناك بعض التخمينات الأولية لقيم θ. يشار إلى هذا النوع من التوزيع بالتوزيع المسبق. يتم تحديث القيمة عادةً من خلال قاعدة Bayes. لذلك ، يشار إلى النهج باسم نهج بايزي.
مبرهنة بايز
يعتمد تطبيق الاستدلال البايزي على فهم نظرية بايز.
ضع في اعتبارك أن هناك مجموعتين من النتائج ، مثل المجموعة أ والمجموعة ب. وتسمى هذه المجموعات أيضًا الأحداث. دعونا نشير إلى احتمال وقوع الحدث A كـ P (A) والحدث B كـ P (B). كانت هذه احتمالات الأحداث بشكل فردي. ومع ذلك ، يمكن تحديد احتمال مشترك من خلال المصطلح P (A ، B). يمكن توسيع الاحتمالات الشرطية على النحو التالي:
الفوسفور (أ ، ب) = ف (أ | ب) ف (ب) ،
هذا يعني أنه بينما يتم إعطاء B ، فإن الاحتمال الشرطي لـ A و B ينتج عنه الاحتمال المشترك للحدثين.
الفوسفور (أ ، ب) = الفوسفور (ب | أ) الفوسفور (أ)
في كلتا المعادلتين المذكورتين أعلاه ، يكون الجانب الأيسر من المعادلتين هو نفسه ، لذا يجب أن يكون الجانب الأيمن من المعادلتين متساويًا.
الفوسفور (أ | ب) الف (ب) = الفوسفور (ب | أ) الفوسفور (أ)
الفوسفور (أ | ب) = الفوسفور (ب | أ) الفوسفور (أ) / الف (ب)
تُعرف هذه المعادلة باسم نظرية بايز.
في مجال علم البيانات ، يمكن كتابة نظرية بايز بطريقة
P (فرضية | بيانات) = P (بيانات | فرضية) P (فرضية) / ع (بيانات)
يضمن المقام ، وهو الدليل ، أن التوزيع اللاحق على الجانب الأيسر من المعادلة هو كثافة الاحتمال الصالحة. يسمى هذا أيضًا ثابت التطبيع.
هناك ثلاثة مكونات في معادلة نظرية بايز.
- قبل
- احتمالية
- خلفي
التوزيع المسبق
يعد التوزيع المسبق أحد العوامل الرئيسية في طريقة الاستدلال البايزي. من خلال هذا ، يمكنك دمج المعتقدات الشخصية في عملية صنع القرار. أيضًا ، يمكنك دمج الأحكام المستندة إلى أفراد مختلفين في الدراسة. يتم ذلك من خلال تعبير رياضي. يتم استخدام معلمة غير معروفة ، ممثلة بـ ، للتعبير عن اعتقاد المرء. للتعبير عن هذه المعتقدات ، يتم استخدام دالة التوزيع ، وهي التوزيع السابق. لذلك ، قبل إجراء أي تجربة ، يتم اختيار التوزيع.
دليل المبتدئين للاستدلال بايزي
1. اختيار السابق
عادة ما يتم تحديد التوزيع التراكمي للمعامل θ. تلك الأحداث ذات قيمة الاحتمال السابق على أنها صفر سيكون لها قيمة الاحتمال اللاحق على أنها صفر. وبالنسبة للأحداث التي لها قيمة الاحتمال السابق ، سيكون للفرد قيمة الاحتمال اللاحق كاحتمال واحد. لذلك ، فإن الإطار الجيد لنهج بايز لن يحدد بعض التقديرات النقطية لتلك الأحداث التي حدثت بالفعل ، أو لا توجد معلومات عن حدوثها. هناك تقنيات معينة لاختيار المسبق. إحدى التقنيات المستخدمة على نطاق واسع لاختيار السابق هي من خلال استخدام وظائف التوزيع. يتم استخدام عائلة جميع الوظائف. يجب أن تكون هذه الوظائف مرنة وأن تكون قادرة على تمثيل معتقدات الأفراد.
2. احتمالية
دعونا نعتبر θ المعلمة غير المعروفة التي سيتم تقديرها. يمكن التعبير عن عدالة العملة من خلال θ ، مع الأخذ في الاعتبار مثال الاستدلال البايزي . يتم قلب العملة بلا حدود للتحقق من عدالتها. لذلك ، في كل مرة أثناء التقليب ، سيكون هناك رأس أو ذيل. القيم التي تم تخصيصها للأحداث هي 0 و 1. ويشار إلى هذا أيضًا باسم تجارب برنولي. تعتبر جميع النتائج مستقلة. يمكن التعبير عن هذا من خلال معادلة تحدد مفهوم الاحتمالية. الاحتمال هو دالة كثافة وهي دالة θ. لتعظيم الاحتمالية ، يجب أن تؤدي قيمة إلى أكبر قيمة احتمالية. تُعرف طريقة التقدير أيضًا باسم تقدير الاحتمالية القصوى.
3. التوزيع اللاحق
تُعرف نتيجة نظرية بايز بالتوزيع اللاحق. هو الاحتمال المحدث لأي حدث يقع بعد النظر في المعلومات الجديدة.
4. آلية الاستدلال بايزي
كما رأينا أعلاه ، تتعامل طريقة الاستدلال البايزي مع مفهوم الاحتمال على أنه درجة معينة من الاعتقاد. ترتبط هذه المعتقدات بحقيقة أن الحدث قد يقع في ظل مثل هذه الأدلة. لذلك ، تعتبر المعلمة ثيتا "θ" هي المتغير العشوائي.
5. تطبيق الاستدلال بايزي في المخاطر المالية
هناك الكثير من الخوارزميات حيث يمكن تطبيق الاستدلال البايزي. بعض الخوارزميات عبارة عن شبكات عصبية ، وغابة عشوائية ، وانحدار ، وما إلى ذلك ، وقد حظيت الطريقة أيضًا بشعبية في القطاع المالي. يمكن استخدامه لنمذجة المخاطر التشغيلية للعديد من البنوك. معطيات البنوك التي تظهر خسارة العمليات تظهر بعض الأحداث التي ضاعت. كان لهذه الأحداث المفقودة تواتر منخفض ولكنها كانت شديدة الخطورة. لذلك ، في مثل هذه الحالات ، يثبت الاستدلال البايزي أنه مفيد للغاية. هذا لأنه ، في هذه الطريقة ، لا يلزم أيضًا الكثير من البيانات للتحليل.
تم أيضًا تطبيق طرق التحليل الإحصائي الأخرى ، مثل الأساليب المتكررة ، في وقت سابق لنمذجة المخاطر التشغيلية. ولكن كانت هناك مشكلة في تقدير معامل عدم اليقين. لذلك ، يعتبر الاستدلال البايزي الطريقة الأكثر فعالية. وذلك لأنه يمكن استخدام آراء الخبراء والبيانات لاشتقاق التوزيعات اللاحقة. في هذا النوع من المهام ، يتم تقسيم بيانات الخسارة الداخلية للبنوك إلى عدة أجزاء أصغر ، ثم يتم تقدير تكرار كل جزء من خلال حكم الخبراء. ثم يتم تركيب هذا في توزيعات الاحتمال.
انضم إلى دورة التعلم الآلي عبر الإنترنت من أفضل الجامعات في العالم - الماجستير ، وبرامج الدراسات العليا التنفيذية ، وبرنامج الشهادات المتقدمة في ML & AI لتسريع حياتك المهنية.
خاتمة
في الإحصاء والتعلم الآلي ، النهجان الرئيسيان اللذان يمكن تطبيقهما هما طريقتا الاستدلال المتكرر والاستدلال البايزي. لقد ناقشنا طريقة الاستدلال البايزي في المقالة ، حيث يتم حساب الاحتمالات على أنها معتقدات ذاتية. إلى جانب البيانات ، يتم أيضًا دمج المعتقدات الشخصية للأشخاص أثناء تقدير الاحتمالات. هذه تجعل النموذج مقبولًا على نطاق واسع في الكثير من دراسات التقدير. لذلك ، تحدد تقنيات الاستدلال البايزي طرق أو طرق تطبيق معتقداتك على مراقبة البيانات. علاوة على ذلك ، في العديد من أنواع التطبيقات التي تحتوي على الكثير من البيانات الصاخبة ، يمكن استخدام تقنية Bayesian Inference. لذلك ، يمكن أن تتعلق القوة التي تكمن في قاعدة بايز بكمية يمكن حسابها بالكمية التي يمكن استخدامها للإجابة على الأسئلة ذات الطبيعة التعسفية.