الفرق بين الغابة العشوائية وشجرة القرار

نشرت: 2022-09-30

الخوارزميات مطلوبة لتنفيذ برامج الكمبيوتر القوية. كلما زادت سرعة تنفيذ الخوارزمية ، زادت فعاليتها. يتم إنشاء الخوارزميات باستخدام مبادئ رياضية للعمل من خلال مشاكل الذكاء الاصطناعي والتعلم الآلي ؛ الغابة العشوائية وشجرة القرار هما من هذه الخوارزميات. تساعد هذه الخوارزميات في التعامل مع كميات هائلة من البيانات لإجراء تقييمات وأحكام أفضل.

جدول المحتويات

برامج الذكاء الاصطناعي والتعلم الآلي لدينا في الولايات المتحدة

ماجستير العلوم في التعلم الآلي والذكاء الاصطناعي من جامعة جون مورس بليفربول و IIITB برنامج PG التنفيذي في التعلم الآلي والذكاء الاصطناعي من IIITB
لاستكشاف جميع دوراتنا ، قم بزيارة صفحتنا أدناه.
دورات تعلم الآلة

لنبدأ بفهم معنى شجرة القرار والغابة العشوائية.

شجرة القرار

كما يوحي الاسم ، فإن هذا النهج يبني نموذجه في شكل شجرة ، مع استكمال عقد القرار وعقد الأوراق. يتم ترتيب عقد القرار بترتيب فرعين أو أكثر ، حيث تمثل العقدة الطرفية القرار. شجرة القرار عبارة عن مخطط انسيابي لصنع القرار بسيط وفعال يتم تنفيذه لإدارة البيانات المصنفة والمتسقة.

الأشجار هي طريقة بسيطة ومريحة لعرض نتائج الخوارزمية وتعلم كيفية اتخاذ القرارات. الميزة الرئيسية لشجرة القرار هي التعديل وفقًا للبيانات. يمكن استخدام مخطط الشجرة لرؤية نتائج العملية وتحليلها بطريقة منظمة. من ناحية أخرى ، من غير المحتمل بشكل كبير أن يتأثر نهج الغابة العشوائية بالانحرافات لأنه يولد عدة أشجار قرار منفصلة ويضع متوسط ​​هذه التوقعات.

احصل على شهادة التعلم الآلي من أفضل الجامعات في العالم. احصل على درجة الماجستير أو برنامج PGP التنفيذي أو برامج الشهادات المتقدمة لتسريع مسار حياتك المهنية.

مزايا شجرة القرار

  • تتطلب أشجار القرار وقتًا أقل للمعالجة المسبقة للبيانات مقارنة بالطرق الأخرى.
  • لا تتضمن شجرة القرار تسوية.
  • لا تتطلب شجرة القرار قابلية توسيع البيانات.
  • لا تؤثر الاختلافات في البيانات بشكل كبير على عملية تطوير شجرة القرار.
  • نموذج شجرة القرار أمر طبيعي جدًا وبسيط للتواصل مع الفرق الفنية وأصحاب المصلحة.

عيوب شجرة القرار

  • يمكن أن يؤدي تغيير طفيف في البيانات إلى تغيير هيكل بيانات شجرة القرار بشكل كبير ، مما يؤدي إلى زعزعة الاستقرار.
  • يمكن أن يكون حساب شجرة القرار أكثر تعقيدًا بشكل ملحوظ من الخوارزميات الأخرى في بعض الأحيان.
  • غالبًا ما تكون فترة التدريب لشجرة القرار أطول.
  • يعد تعليم شجرة القرار مكلفًا نظرًا لزيادة التعقيد والوقت المطلوب.
  • تقنية شجرة القرار غير كافية لإجراء الانحدار والتنبؤ بالمتغيرات المستمرة.

غابة عشوائية

تحتوي الغابة العشوائية على معلمات تشعبية متطابقة تقريبًا لشجرة القرار. يتم إنتاج نهج مجموعة شجرة القرار الخاص بها من البيانات المقسمة عشوائيًا. هذا المجتمع بأكمله عبارة عن غابة ، حيث تحتوي كل شجرة على عينة عشوائية فريدة من نوعها.

يمكن للعديد من الأشجار في تقنية الغابة العشوائية أن تجعلها بطيئة للغاية وغير فعالة للتنبؤ في الوقت الفعلي. في المقابل ، تولد طريقة الغابة العشوائية نتائج بناءً على ملاحظات وخصائص منتقاة عشوائيًا مبنية على أشجار قرارات متعددة.

نظرًا لأن الغابات العشوائية لا تستخدم سوى عدد قليل من المتغيرات لإنشاء كل شجرة قرار ، فإن أشجار القرار النهائية عادة ما تكون مرتبطة بالتزيين ، مما يعني أن نموذج منهجية الغابة العشوائية يصعب تجاوز قاعدة البيانات. كما ذكرنا سابقًا ، عادةً ما تكتب أشجار القرار فوق بيانات التدريب ، مما يعني أنه من المرجح أن تلائم فوضى مجموعة البيانات أكثر من النظام الأساسي الأصلي.

مزايا الغابة العشوائية

  • الغابة العشوائية قادرة على أداء مشاكل التصنيف والانحدار.
  • تولد الغابة العشوائية تنبؤات دقيقة وسهلة الفهم.
  • إنه قادر على التعامل بفعالية مع مجموعات البيانات الضخمة.
  • تتفوق طريقة الغابة العشوائية على خوارزمية شجرة القرار فيما يتعلق بدقة التنبؤ.

عيوب الغابة العشوائية

  • موارد حساب إضافية مطلوبة عند استخدام خوارزمية مجموعة عشوائية.
  • إنها تستغرق وقتًا أطول من شجرة القرار.

الفرق بين Random Forest وشجرة القرار

معالجة البيانات:

تستخدم أشجار القرار خوارزمية لاتخاذ قرار بشأن العقد والعقد الفرعية. يمكن تقسيم العقدة إلى عقدتين فرعيتين أو أكثر ، ويعطي إنشاء العقد الفرعية عقدة فرعية أخرى متماسكة ، لذلك يمكننا القول أن العقد قد تم تقسيمها.

من ناحية أخرى ، فإن الغابة العشوائية هي مزيج من أشجار القرار المختلفة ، وهي فئة مجموعة البيانات. قد تعطي بعض أشجار القرار مخرجات دقيقة بينما قد لا يعطي البعض الآخر ، لكن كل الأشجار تقوم بعمل تنبؤات معًا. يتم إجراء التقسيم مبدئيًا باستخدام أفضل البيانات ، وتتكرر العملية حتى تحصل جميع العقد الفرعية على بيانات موثوقة.

تعقيد:

شجرة القرار ، التي تُستخدم للتصنيف والانحدار ، هي سلسلة مباشرة من الخيارات المتخذة للحصول على النتائج المرجوة. تكمن فائدة شجرة القرار البسيطة في سهولة تفسير هذا النموذج ، وعند بناء أشجار القرار ، فإننا ندرك المتغير وقيمته المستخدمة لتقسيم البيانات. نتيجة لذلك ، يمكن توقع الإخراج بسرعة.

في المقابل ، فإن الغابة العشوائية أكثر تعقيدًا لأنها تجمع بين أشجار القرار ، وعند بناء غابة عشوائية ، علينا تحديد عدد الأشجار التي نريد صنعها وعدد المتغيرات التي نحتاجها.

دقة:

عند مقارنتها بأشجار القرار ، تتنبأ التوقعات العشوائية بالغابات بدقة أكبر. يمكننا أيضًا أن نفترض أن الغابات العشوائية تبني العديد من أشجار القرار التي يتم دمجها لإعطاء نتيجة دقيقة ومستقرة. عندما نستخدم خوارزمية لحل مشكلة الانحدار في غابة عشوائية ، فهناك طريقة للحصول على نتيجة دقيقة لكل عقدة. تُعرف الطريقة باسم خوارزمية التعلم الخاضع للإشراف في التعلم الآلي ، والتي تستخدم طريقة التعبئة.

التجهيز:

عند استخدام الخوارزميات ، هناك خطر حدوث فرط في التخصيص ، والذي يمكن اعتباره قيدًا عامًا في التعلم الآلي. يعد التجهيز الإضافي مشكلة مهمة في التعلم الآلي. عندما لا تتمكن نماذج التعلم الآلي من الأداء بشكل جيد على مجموعات البيانات غير المعروفة ، فإن ذلك يعد علامة على فرط التجهيز. هذا صحيح بشكل خاص إذا تم اكتشاف المشكلة في مجموعات بيانات الاختبار أو التحقق من الصحة وكانت أكبر بكثير من الخطأ في مجموعة بيانات التدريب. يحدث التجاوز عندما تتعلم النماذج بيانات التذبذب في بيانات التدريب ، مما يضر بأداء نموذج البيانات الجديد.

نظرًا لاستخدام العديد من أشجار القرار في الغابة العشوائية ، فإن خطر الإفراط في التجهيز أقل من خطر شجرة القرار. تزداد الدقة عندما نستخدم نموذج شجرة قرار في مجموعة بيانات معينة نظرًا لاحتوائها على المزيد من الانقسامات ، مما يجعل من السهل زيادة حجم البيانات والتحقق من صحتها.

مدونات التعلم الآلي والذكاء الاصطناعي الشعبية

إنترنت الأشياء: التاريخ والحاضر والمستقبل دروس تعلم الآلة: تعلم ML ما هي الخوارزمية؟ بسيط سهل
راتب مهندس الروبوتات في الهند: جميع الأدوار يوم في حياة مهندس التعلم الآلي: ماذا يفعلون؟ ما هو إنترنت الأشياء (إنترنت الأشياء)
التقليب مقابل الجمع: الفرق بين التقليب والجمع أهم 7 اتجاهات في الذكاء الاصطناعي وتعلم الآلة التعلم الآلي باستخدام R: كل ما تحتاج إلى معرفته

ملاحظة نهائية

شجرة القرار عبارة عن هيكل يستخدم نهج المتفرعة لإظهار كل نتيجة قرار يمكن تصوره. في المقابل ، الغابة العشوائية عبارة عن مجموعة من أشجار القرار التي تنتج النتيجة النهائية اعتمادًا على نتائج جميع أشجار القرار الخاصة بها.

تعرف على المزيد حول Random Forest و Decision Tree

كن خبيرًا في الخوارزميات المستخدمة في الذكاء الاصطناعي والتعلم الآلي من خلال تسجيل نفسك في ماجستير العلوم في التعلم الآلي والذكاء الاصطناعي في UpGrad بالتعاون مع جامعة ليفربول جون مورز.

يقوم برنامج الدراسات العليا بإعداد الأفراد لمجالات التكنولوجيا الحالية والمستقبلية من خلال دراسة الموضوعات المرتبطة بالصناعة. يركز البرنامج أيضًا على المشاريع الحقيقية ودراسات الحالة العديدة والأكاديميين العالميين التي يقدمها خبراء في الموضوع.

انضم إلى UpGrad اليوم للاستفادة من ميزاته الفريدة ، مثل مراقبة الشبكة وجلسات الدراسة ودعم التعلم بزاوية 360 درجة والمزيد!

هل شجرة القرار مفضلة على الغابة العشوائية؟

تشكل الأشجار المفردة المتعددة ، كل منها بناءً على عينة بيانات تدريب عشوائية ، غابات عشوائية. بالمقارنة مع أشجار القرار المنفردة ، فإنها غالبًا ما تكون أكثر دقة. تصبح حدود القرار أكثر دقة واستقرارًا مع إضافة المزيد من الأشجار.

هل يمكنك إنشاء غابة عشوائية بدون استخدام أشجار القرار؟

باستخدام ميزة عشوائية وتمهيد التشغيل ، يمكن أن تنتج الغابات العشوائية أشجار قرار غير مترابطة. عن طريق اختيار الميزات عشوائيًا لكل شجرة قرار في مجموعة غابة عشوائية ، يتم الحصول على ميزة عشوائية. تتيح لك معلمة max features تنظيم مقدار الميزات المستخدمة لكل شجرة في مجموعة تفرعات عشوائية.

ما هو حدود شجرة القرار؟

يعد عدم الاستقرار النسبي لأشجار القرار مقارنةً بأشجار القرار الأخرى أحد عيوبها. يمكن أن يؤثر تغيير طفيف في البيانات بشكل كبير على هيكل شجرة القرار ، مما يؤدي إلى إرسال نتيجة مختلفة عما قد يتلقاه المستخدمون عادةً.