كيف يتم إجراء تحليل الانحدار المتعدد؟

نشرت: 2021-11-23

في التحليل الإحصائي ، تُستخدم نماذج الانحدار في الغالب عند الضرورة لتطوير العلاقات بين المتغيرات التي تم النظر فيها. يتم إنشاء العلاقة من خلال ملاءمة خط بين جميع المتغيرات. لفهم سلوك المتغير التابع ، يتم استخدام نماذج الانحدار. إنها تتيح للمستخدم معرفة كيفية تغير المتغيرات التابعة مع تغيير المتغيرات المستقلة.

الانحدارات الخطية المتعددة هي إحدى هذه الأساليب التي تساعدنا على تقدير العلاقة بين تلك المتغيرات ، أي المتغيرات التابعة والمستقلة. ستركز هذه المقالة على تقنية الانحدار الخطي المتعدد وكيفية تنفيذه.

جدول المحتويات

الانحدارات الخطية المتعددة

الانحدارات الخطية المتعددة هي شكل من أشكال التقنية الإحصائية المستخدمة للتنبؤ بنتائج أي متغير استجابة. أحد أهداف التقنية هو إنشاء علاقة خطية بين المتغيرات المستقلة والتابعة. يعد تحليل الانحدار الخطي المتعدد أحد أشكال التحليل متعدد المتغيرات الذي يتضمن أكثر من شكل واحد من أشكال الملاحظة.

في الغالب يمكن تنفيذ التقنية إذا كنت تريد معرفة الأشياء التالية:

  • لفهم مدى قوة العلاقة بين المتغيرات. أيضًا ، إذا كنت تريد فهم العلاقة بين المتغير المستقل والمتغير التابع ، ففي هذه الحالات ، يمكننا استخدام تقنية الانحدار الخطي المتعدد.
  • يمكن استخدام هذه التقنية للتنبؤ بقيمة المتغيرات التابعة المقابلة للمتغيرات المستقلة.

الافتراضات التي تؤخذ في الاعتبار في الانحدارات الخطية المتعددة

يتم أخذ افتراضات معينة في الاعتبار في تقنيات الانحدار الخطي المتعدد. فيما يلي بعض الافتراضات المدرجة لـ MLR:

1. تجانس التباين

ومن المعروف أيضا باسم اللواط. هذا يعني أنه أثناء التنبؤ بنتيجة ، لا توجد تغييرات كبيرة في الخطأ المرتبط بالتنبؤ بالنتيجة من خلال قيم المتغيرات المستقلة. تفترض الطريقة أن مقدار الخطأ هو نفسه في جميع أنحاء نموذج MLR. يجب على المحلل رسم القيم المتبقية التي تم توحيدها مقابل القيم المتوقعة. يساعد هذا في تحديد ما إذا كان هناك توزيع عادل للنقاط عبر المتغيرات المستقلة. يمكن استخدام مخطط التشتت لتخطيط البيانات.

2. استقلالية الملاحظات

يتم جمع الملاحظات التي تم أخذها في الاعتبار في الانحدار الخطي المتعدد من خلال تقنيات إحصائية صحيحة. هذا يعني أنه لا توجد علاقات خفية أو حالية بين المتغيرات المجمعة. في بعض الأحيان ، في هذه التقنية ، هناك سيناريوهات ترتبط فيها بعض المتغيرات بمتغيرات أخرى. لذلك ، قبل تطوير نموذج الانحدار ، من المهم دائمًا التحقق من هذه المتغيرات المترابطة. دائمًا ما تكون إزالة أحد المتغيرات من تطوير النموذج أفضل للمتغيرات التي تظهر ارتباطًا عاليًا.

3. لا توجد علاقة ارتباط بين المتغيرات المستقلة

بطريقة أخرى ، يمكن الإشارة إلى أنه لا ينبغي أن يكون هناك أي علاقة خطية متعددة في البيانات. في حالة وجود أي علاقة خطية متعددة ، سيجد المحلل صعوبة في تحديد المتغير الذي يساهم في تباين المتغير التابع. لذلك ، فإن إحدى الطرق التي تعتبر الأفضل لاختبار الافتراض هي طريقة عامل التضخم المتغير.

4. الحالة الطبيعية:

هذا يعني أن مجموعة البيانات تتبع التوزيع الطبيعي.

5. الخطية

أثناء البحث عن العلاقة بين المتغيرات ، يتم محاولة تركيب خط مستقيم بين المتغيرات. من المفترض على نطاق واسع أن هناك علاقة خطية بين المتغيرات المستقلة والمتغيرات التابعة. تتمثل إحدى طرق التحقق من العلاقة الخطية في إنشاء مخططات مبعثرة ثم تصور مخططات التشتت. تمكن المستخدم من ملاحظة الخطية الموجودة في الملاحظات. في حالة عدم وجود علاقة خطية ، يجب على المحلل أن يكرر تحليله. يمكن استخدام البرامج الإحصائية مثل SPSS لأداء MLR.

التمثيل الرياضي للانحدار الخطي المتعدد

تظهر الصورة الرياضية لنموذج الانحدار الخطي المتعدد في المعادلة أدناه:

في المعادلة أعلاه ،

  • يمثل Y متغير الإخراج ،
  • يمثل X متغيرات الإدخال ،
  • Β يمثل المعامل المرتبط بكل مصطلح.
  • B0 هي قيمة تقاطع y مما يعني قيمة Y عندما تكون جميع المتنبئات الأخرى غائبة.

تتكون معادلة MLR في بعض الأحيان من مصطلح خطأ يتم تمثيله بالمصطلح "e" في نهاية المصطلحات في المعادلة.

أثناء العثور على أفضل ملاءمة للخط ، يتم استخدام معادلة MLR لحساب الأشياء التالية:

  • حساب معاملات الانحدار التي تؤدي إلى أدنى خطأ في معادلة MLR.
  • بالنسبة للنموذج الإجمالي ، تحسب المعادلة قيمة إحصاء t.
  • القيمة ف للنموذج.

المربعات الصغرى العادية

تُعرف طريقة الانحدار الخطي المتعدد أيضًا باسم المربعات الصغرى العادية (OLS). وذلك لأن طريقة MLR تحاول إيجاد أقل مجموع للمربعات. ومن ثم ، تُعرف أيضًا باسم طريقة OLS. يمكن استخدام لغة البرمجة python لتنفيذ هذه الطرق. الطريقتان اللتان يمكنهما تطبيق طريقة OLS في لغة البايثون هما:

1. SciKit Learn

هذه حزمة متوفرة بلغة برمجة بايثون. يجب استيراد وحدات الانحدار الخطي من حزمة Scikit Learn. ثم يتم تزويد النموذج بالبيانات. إنها طريقة مباشرة ويمكن استخدامها على نطاق واسع.

2. StatsModels

إحدى الطرق الأخرى المستخدمة في لغة برمجة Python هي حزمة Statsmodels. يمكن أن تساعد هذه الحزمة في تنفيذ تقنيات OLS.

أمثلة على الانحدار الخطي المتعدد

بعض الأمثلة على MLR مذكورة أدناه:

  • يمكن استخدام نموذج الانحدار الخطي المتعدد للتنبؤ بغلات المحاصيل. هذا لأنه ، في MLR ، يوجد ارتباط بين المتغير التابع والمتغير المستقل. في مثل هذه الأنواع من الدراسات ، يمكن النظر في عوامل إضافية مثل العوامل المناخية وهطول الأمطار ومستوى الأسمدة ودرجة الحرارة.
  • إذا كان لابد من إنشاء اتصال بين عدد ساعات الدراسة التي تم إجراؤها والفئة GPA ، فيمكن استخدام طريقة MLR. في مثل هذه الحالات ، سيكون المعدل التراكمي هو المتغير التابع بينما المتغير الآخر ، مثل ساعات الدراسة ، سيكون المتغير التوضيحي.
  • يمكن استخدام تقنية MLR لتحديد راتب المدير التنفيذي في الشركة بناءً على الخبرة وعمر المديرين التنفيذيين. في مثل هذه الحالات ، سيصبح الراتب متغيرًا تابعًا ، بينما سيكون العمر والخبرة متغيرًا مستقلًا.

سير عمل MLR

يجب تحضير البيانات وتحليلها قبل الخوض في نموذج الانحدار. يتم تحليل البيانات في الغالب بحثًا عن وجود أي أخطاء أو قيم متطرفة أو قيم مفقودة ، وما إلى ذلك. فيما يلي بعض الخطوات المدرجة لتوضيح كيفية تنفيذ أو تطبيق تقنيات الانحدار الخطي المتعددة.

1. اختيار المتغيرات

يتطلب MLR وجود مجموعة بيانات تحتوي على قيم التوقع التي لها أكبر علاقة بمتغير الاستجابة. هذا يعني أنه يجب استخراج الحد الأقصى من المعلومات من أقل عدد من المتغيرات. يمكن اختيار المتغيرات من العمليات التالية.

  • يمكن اختيار إجراء آلي للبحث عن المتغيرات. يمكن استخدام الأدوات مع حزم البرمجة R و Python لتحديد أفضل المتغيرات لدراسة MLR.
  • يمكن اختيار كل الانحدار الممكن للتحقق من وجود أي أجزاء فرعية من أي متغيرات مستقلة.
  • يمكن اعتبار قيمة R2 لتحليل أفضل المتغيرات. تعتبر هذه المتغيرات ذات القيمة الأكبر لـ R2 هي الأفضل ملاءمة في النموذج. يمكن أن تكون قيم R2 من الرقمين ، 0 و 1. تشير القيمة 0 إلى أنه لا يمكن لأي من المتغيرات المستقلة التنبؤ بنتيجة المتغيرات التابعة. تشير قيمة 1 إلى التنبؤ بواسطة المتغيرات المستقلة وبدون أخطاء.
  • هناك أيضًا مصطلح آخر وهو مجموع المربعات المتوقع (PRESSp). إذا كان نموذج MLR يحتوي على PRESSp أصغر ، فسيتم اعتبار أن النموذج يتمتع بقوة تنبؤية أفضل.

2. صقل النموذج

يمكن تحسين نموذج MLR من خلال فحص المعايير التالية:

  • قيمة اختبار F العالمي. يستخدم هذا لاختبار أهمية التنبؤ بنتيجة المتغير التابع بواسطة المتغير المستقل.
  • R2 المعدلة للتحقق من تباين العينة الكاملة بعد تعديل المعلمات وحجم العينة. تشير القيمة الأكبر للمصطلح إلى أن المتغيرات هي الأنسب للبيانات.
  • يستخدم الجذر التربيعي للانحراف التربيعي أو RMSE لتقدير الانحراف المعياري للأخطاء العشوائية.
  • يعتبر نموذج MLR يعطي تنبؤات دقيقة إذا كانت قيمة معامل التباين 10٪ أو أقل من ذلك.

3. اختبار افتراضات النموذج

يتم اختبار الافتراضات في نموذج الانحدار الخطي. يجب تلبية هذه الافتراضات.

4. معالجة المشاكل المصاحبة للنموذج

في الحالات التي يتم فيها انتهاك بعض الافتراضات التي تم النظر فيها في النموذج ، يجب عندئذٍ اتخاذ خطوات لتقليل مثل هذه المشكلات.

5. التحقق من صحة النموذج

هذه هي الخطوة الأخيرة في جيل نموذج MLR وتعتبر خطوة مهمة. بعد إنشاء النموذج ، يحتاج النموذج إلى التحقق من صحته. بمجرد التحقق من صحته ، يمكن استخدامه لأي تحليل انحدار خطي متعدد .

خاتمة

يعد الانحدار الخطي المتعدد أحد الأساليب الأكثر استخدامًا في أي دراسة بحثية لتحديد الارتباط بين المتغيرات. تعتبر أيضًا خوارزمية مهمة في عالم التعلم الآلي. ومع ذلك ، إذا كنت جديدًا في تحليل الانحدار ، فمن الأفضل دائمًا الحصول على فكرة عن نماذج الانحدار والانحدار الخطي البسيط.

احصل على دورات تعلم الآلة من أفضل الجامعات في العالم. اربح برامج PG التنفيذية أو برامج الشهادات المتقدمة أو برامج الماجستير لتتبع حياتك المهنية بشكل سريع.

عزز حياتك المهنية في التعلم الآلي والذكاء الاصطناعي

تقدم الآن للحصول على الشهادة التنفيذية في Ai-ml من IIITB