Gaussian Naive Bayes: ما تحتاج إلى معرفته؟

نشرت: 2021-02-22

جدول المحتويات

بايز غاوسيان ساذج

Naive Bayes هي خوارزمية تعلم الآلة احتمالية تستخدم للعديد من وظائف التصنيف وتستند إلى نظرية بايز. Gaussian Naive Bayes هو امتداد لبايز الساذج. بينما يتم استخدام وظائف أخرى لتقدير توزيع البيانات ، فإن التوزيع الغاوسي أو العادي هو أبسط تطبيق حيث ستحتاج إلى حساب المتوسط ​​والانحراف المعياري لبيانات التدريب.

ما هي خوارزمية Naive Bayes؟

Naive Bayes هي خوارزمية تعلم آلي احتمالية يمكن استخدامها في العديد من مهام التصنيف. التطبيقات النموذجية لـ Naive Bayes هي تصنيف المستندات وتصفية البريد العشوائي والتنبؤ وما إلى ذلك. تعتمد هذه الخوارزمية على اكتشافات توماس بايز ومن هنا اسمها.

يتم استخدام الاسم "Naive" لأن الخوارزمية تتضمن ميزات في نموذجها مستقلة عن بعضها البعض. لا تؤثر أي تعديلات في قيمة ميزة واحدة بشكل مباشر على قيمة أي ميزة أخرى للخوارزمية. الميزة الرئيسية لخوارزمية Naive Bayes هي أنها خوارزمية بسيطة لكنها قوية.

يعتمد على النموذج الاحتمالي حيث يمكن ترميز الخوارزمية بسهولة ، والتنبؤات تتم بسرعة في الوقت الفعلي. ومن ثم فإن هذه الخوارزمية هي الخيار النموذجي لحل مشاكل العالم الحقيقي حيث يمكن ضبطها للاستجابة لطلبات المستخدم على الفور. ولكن قبل أن نغوص في أعماق Naive Bayes و Gaussian Naive Bayes ، يجب أن نعرف ما المقصود بالاحتمال الشرطي.

شرح الاحتمال الشرطي

يمكننا فهم الاحتمال الشرطي بشكل أفضل بمثال. عندما ترمي عملة معدنية ، فإن احتمال التقدم أو الذيل هو 50٪. وبالمثل ، فإن احتمال الحصول على 4 عند رمي النرد بالوجوه هو 1/6 أو 0.16.

إذا أخذنا حزمة من البطاقات ، فما هو احتمال الحصول على ملكة بشرط أن تكون الأشياء بأسمائها الحقيقية؟ نظرًا لأن الشرط مضبوط بالفعل على أنه يجب أن يكون مجرفة ، يصبح المقام أو مجموعة التحديد 13. هناك ملكة واحدة فقط في البستوني ، وبالتالي فإن احتمال اختيار ملكة الأشياء بأسمائها الحقيقية يصبح 1/13 = 0.07.

يعني الاحتمال الشرطي للحدث A حدث معين B احتمال وقوع الحدث A بالنظر إلى أن الحدث B قد حدث بالفعل. رياضياً ، يمكن الإشارة إلى الاحتمال الشرطي لـ A المعطى B كـ P [A | B] = P [A AND B] / P [B].

دعونا ننظر في مثال معقد قليلا. خذ مدرسة بها إجمالي 100 طالب. يمكن تقسيم هذا المجتمع إلى 4 فئات - الطلاب والمعلمين والذكور والإناث. ضع في اعتبارك الجدول الوارد أدناه:

أنثى ذكر المجموع
معلم 8 12 20
طالب علم 32 48 80
المجموع 40 50 100

هنا ، ما هو الاحتمال الشرطي أن يكون ساكنًا معينًا في المدرسة مدرسًا بشرط أنه رجل.

لحساب هذا ، سيتعين عليك تصفية المجموعة الفرعية المكونة من 60 رجلاً والانتقال إلى 12 معلمًا.

لذا ، فإن الاحتمال الشرطي المتوقع P [Teacher | ذكر] = 12/60 = 0.2

P (مدرس | ذكر) = P (مدرس ∩ ذكر) / P (ذكر) = 12/60 = 0.2

يمكن تمثيل هذا كمعلم (أ) وذكر (ب) مقسومًا على ذكر (ب). وبالمثل ، يمكن أيضًا حساب الاحتمال الشرطي لـ B معطى A. يمكن استنتاج القاعدة التي نستخدمها في Naive Bayes من الرموز التالية:

الفوسفور (أ | ب) = الفوسفور (أ ∩ ب) / ف (ب)

الفوسفور (ب | أ) = الفوسفور (أ ∩ ب) / ف (أ)

قاعدة بايز

في قاعدة Bayes ، ننتقل من P (X | Y) التي يمكن العثور عليها من مجموعة بيانات التدريب للعثور على P (Y | X). لتحقيق ذلك ، كل ما عليك فعله هو استبدال A و B بـ X و Y في الصيغ أعلاه. بالنسبة للملاحظات ، سيكون X هو المتغير المعروف وسيكون Y هو المتغير غير المعروف. لكل صف من مجموعة البيانات ، يجب عليك حساب احتمالية Y نظرًا لأن X قد حدث بالفعل.

ولكن ماذا يحدث عندما يكون هناك أكثر من فئتين في Y؟ يجب أن نحسب احتمال كل فئة Y لمعرفة الفائزة.

من خلال قاعدة بايز ، ننتقل من P (X | Y) لإيجاد P (Y | X)

معروف من بيانات التدريب: P (X | Y) = P (X ∩ Y) / P (Y)

ع (الدليل | النتيجة)

غير معروف - يمكن توقعه لبيانات الاختبار: P (Y | X) = P (X ∩ Y) / P (X)

P (النتيجة | الدليل)

قاعدة بايز = P (Y | X) = P (X | Y) * P (Y) / P (X)

بايز السذاجة

توفر قاعدة Bayes صيغة احتمالية Y بشرط X. ولكن في العالم الحقيقي ، قد يكون هناك متغيرات X متعددة. عندما يكون لديك ميزات مستقلة ، يمكن تمديد قاعدة Bayes إلى قاعدة Naive Bayes. إن Xs مستقلة عن بعضها البعض. صيغة Naive Bayes أقوى من صيغة Bayes

بايز غاوسيان ساذج

حتى الآن ، رأينا أن X في فئات ولكن كيف نحسب الاحتمالات عندما يكون X متغيرًا مستمرًا؟ إذا افترضنا أن X تتبع توزيعًا معينًا ، فيمكنك استخدام دالة كثافة الاحتمال لذلك التوزيع لحساب احتمال الاحتمالات.

إذا افترضنا أن X تتبع توزيعًا غاوسيًا أو عاديًا ، فيجب علينا استبدال الكثافة الاحتمالية للتوزيع الطبيعي وتسميتها Gaussian Naive Bayes. لحساب هذه الصيغة ، تحتاج إلى متوسط ​​وتباين X.

في الصيغ أعلاه ، sigma و mu هما التباين والمتوسط ​​للمتغير المستمر X المحسوب لفئة معينة c من Y.

تمثيل ل Gaussian Naive Bayes

تحسب الصيغة أعلاه احتمالات قيم الإدخال لكل فئة من خلال التردد. يمكننا حساب المتوسط ​​والانحراف المعياري لـ x لكل فئة للتوزيع بأكمله.

هذا يعني أنه إلى جانب الاحتمالات الخاصة بكل فئة ، يجب علينا أيضًا تخزين المتوسط ​​والانحراف المعياري لكل متغير إدخال للفئة.

يعني (x) = 1 / n * sum (x)

حيث يمثل n عدد الحالات و x هي قيمة متغير الإدخال في البيانات.

الانحراف المعياري (x) = sqrt (1 / n * sum (xi-mean (x) ^ 2))

هنا الجذر التربيعي لمتوسط ​​الفروق لكل x ومتوسط ​​x محسوب حيث n هو عدد الحالات ، و sum () هي دالة الجمع ، sqrt () هي دالة الجذر التربيعي ، و xi هي قيمة x محددة .

تنبؤات نموذج Gaussian Naive Bayes

يمكن استخدام دالة كثافة الاحتمال الغاوسي لعمل تنبؤات عن طريق استبدال المعلمات بقيمة الإدخال الجديدة للمتغير ونتيجة لذلك ، ستقدم الدالة Gaussian تقديرًا لاحتمال قيمة الإدخال الجديدة.

مصنف بايز ساذج

يفترض مصنف Naive Bayes أن قيمة ميزة واحدة مستقلة عن قيمة أي ميزة أخرى. تحتاج المصنفات Naive Bayes إلى بيانات تدريبية لتقدير المعلمات المطلوبة للتصنيف. نظرًا للتصميم والتطبيق البسيط ، يمكن أن تكون مصنفات Naive Bayes مناسبة في العديد من سيناريوهات الحياة الواقعية.

خاتمة

مصنف Gaussian Naive Bayes هو أسلوب تصنيف سريع وبسيط يعمل بشكل جيد للغاية دون بذل الكثير من الجهد ومستوى جيد من الدقة.

إذا كنت مهتمًا بمعرفة المزيد عن الذكاء الاصطناعي والتعلم الآلي ، فراجع IIIT-B & upGrad's دبلوم PG في التعلم الآلي والذكاء الاصطناعي المصمم للمهنيين العاملين ويقدم أكثر من 450 ساعة من التدريب الصارم ، وأكثر من 30 دراسة حالة ومهمة ، حالة خريجي IIIT-B ، أكثر من 5 مشاريع تكميلية عملية ومساعدة وظيفية مع أفضل الشركات.

تعلم دورة ML من أفضل الجامعات في العالم. احصل على درجة الماجستير أو برنامج PGP التنفيذي أو برامج الشهادات المتقدمة لتسريع مسار حياتك المهنية.

ما هي خوارزمية بايز ساذجة؟

Naive bayes هي خوارزمية تعلم الآلة الكلاسيكية. نظرًا لأن أصلها في الإحصاء ، فإن bayes الساذجة هي خوارزمية بسيطة وقوية. Naive bayes هي عائلة من المصنفات تعتمد على تطبيق تحليل الاحتمال الشرطي. في هذا التحليل ، يتم حساب الاحتمال الشرطي لحدث ما باستخدام احتمال كل حدث من الأحداث الفردية التي تشكل الحدث. غالبًا ما تكون المصنفات الساذجة bayes فعالة للغاية في الممارسة ، خاصةً عندما يكون عدد أبعاد مجموعة الميزات كبيرًا.

ما هي تطبيقات خوارزمية بايز الساذجة؟

يستخدم Naive Bayes في تصنيف النصوص وتصنيف المستندات وفهرسة المستندات. في الخانات الساذجة ، لا تحتوي كل ميزة ممكنة على أي وزن معين في مرحلة ما قبل المعالجة ويتم تعيين الأوزان لاحقًا أثناء التدريب بالإضافة إلى مرحلتي التعرف. الافتراض الأساسي لخوارزمية بايز الساذجة هو أن الميزات مستقلة.

ما هي خوارزمية Gaussian Naive Bayes؟

Gaussian Naive Bayes هي خوارزمية تصنيف احتمالية تعتمد على تطبيق نظرية بايز مع افتراضات استقلالية قوية. في سياق التصنيف ، يشير الاستقلال إلى فكرة أن وجود قيمة واحدة لميزة ما لا يؤثر على وجود قيمة أخرى (على عكس الاستقلال في نظرية الاحتمالات). يشير السذاجة إلى استخدام افتراض أن ميزات كائن ما مستقلة عن بعضها البعض. في سياق التعلم الآلي ، من المعروف أن المصنفات الساذجة Bayes معبرة للغاية وقابلة للتطوير ودقيقة إلى حد معقول ، لكن أداؤها يتدهور بسرعة مع نمو مجموعة التدريب. يساهم عدد من الميزات في نجاح مصنفات بايز الساذجة. والجدير بالذكر أنها لا تتطلب أي ضبط لمعلمات نموذج التصنيف ، فهي تتناسب بشكل جيد مع حجم مجموعة بيانات التدريب ، ويمكنها بسهولة التعامل مع الميزات المستمرة.