25 أسئلة وأجوبة مقابلة التعلم الآلي - الانحدار الخطي

نشرت: 2022-09-08

من الممارسات الشائعة اختبار الطامحين لعلوم البيانات على خوارزميات التعلم الآلي شائعة الاستخدام في المقابلات. هذه الخوارزميات التقليدية هي الانحدار الخطي ، والانحدار اللوجستي ، والتكتل ، وأشجار القرار وما إلى ذلك ، من المتوقع أن يمتلك علماء البيانات معرفة متعمقة بهذه الخوارزميات.

استشرنا مديري التوظيف وعلماء البيانات من مختلف المنظمات للتعرف على أسئلة ML النموذجية التي يطرحونها في مقابلة. بناءً على ملاحظاتهم المكثفة ، تم إعداد مجموعة من الأسئلة والأجوبة لمساعدة علماء البيانات الطموحين في محادثاتهم. أسئلة مقابلة الانحدار الخطي هي الأكثر شيوعًا في مقابلات التعلم الآلي. سيتم توفير أسئلة وأجوبة حول هذه الخوارزميات في سلسلة من أربع منشورات في المدونة.

جدول المحتويات

أفضل دورات التعلم الآلي ودورات الذكاء الاصطناعي عبر الإنترنت

ماجستير العلوم في التعلم الآلي والذكاء الاصطناعي من جامعة جون مورس بليفربول برنامج الدراسات العليا التنفيذية في التعلم الآلي والذكاء الاصطناعي من IIITB
برنامج شهادة متقدم في تعلم الآلة و البرمجة اللغوية العصبية من IIITB برنامج الشهادة المتقدم في التعلم الآلي والتعلم العميق من IIITB برنامج الدراسات العليا التنفيذية في علوم البيانات والتعلم الآلي من جامعة ماريلاند
لاستكشاف جميع دوراتنا ، قم بزيارة صفحتنا أدناه.
دورات تعلم الآلة

ستغطي كل مشاركة مدونة الموضوع التالي: -

  1. الانحدارالخطي
  2. الانحدار اللوجستي
  3. تجمع
  4. أشجار القرار والأسئلة التي تتعلق بجميع الخوارزميات

لنبدأ مع الانحدار الخطي!

1. ما هو الانحدار الخطي؟

بعبارات بسيطة ، يعد الانحدار الخطي طريقة لإيجاد أفضل خط مستقيم ملائم للبيانات المعطاة ، أي إيجاد أفضل علاقة خطية بين المتغيرات المستقلة والتابعة.
من الناحية الفنية ، الانحدار الخطي هو خوارزمية التعلم الآلي التي تجد أفضل علاقة ملائمة خطية على أي بيانات معينة ، بين المتغيرات المستقلة والتابعة. يتم إجراؤه في الغالب عن طريق مجموع طريقة التربيع المتبقية.

مهارات التعلم الآلي عند الطلب

دورات الذكاء الاصطناعي دورات تابلو
دورات البرمجة اللغوية العصبية دورات التعلم العميق

2. اذكر الافتراضات في نموذج الانحدار الخطي.

هناك ثلاثة افتراضات رئيسية في نموذج الانحدار الخطي:

  1. الافتراض حول شكل النموذج:
    من المفترض أن هناك علاقة خطية بين المتغيرات التابعة والمستقلة. يُعرف باسم "الافتراض الخطي".
  2. افتراضات حول المخلفات:
    1. افتراض الحالة الطبيعية: من المفترض أن شروط الخطأ ، (i) ، موزعة بشكل طبيعي.
    2. الافتراض المتوسط ​​الصفري: من المفترض أن القيم المتبقية لها متوسط ​​قيمة صفر.
    3. افتراض التباين الثابت: من المفترض أن المصطلحات المتبقية لها نفس التباين (ولكن غير معروف) ، σ 2 يُعرف هذا الافتراض أيضًا بافتراض التجانس أو التماثل.
    4. افتراض الخطأ المستقل: من المفترض أن تكون المصطلحات المتبقية مستقلة عن بعضها البعض ، أي أن التغاير بين الزوجين هو صفر.
  3. افتراضات حول المقدرين:
    1. يتم قياس المتغيرات المستقلة بدون أخطاء.
    2. المتغيرات المستقلة مستقلة خطيًا عن بعضها البعض ، أي لا توجد علاقة خطية متعددة في البيانات.

تفسير:

  1. هذا لا يحتاج إلى شرح.
  2. إذا لم يتم توزيع المخلفات بشكل طبيعي ، يتم فقد عشوائيتها ، مما يعني أن النموذج غير قادر على شرح العلاقة في البيانات.
    أيضًا ، يجب أن يكون متوسط ​​القيم المتبقية صفرًا.
    Y (i) i = β 0 + 1 x (i) + ε (i)
    هذا هو النموذج الخطي المفترض ، حيث هو المصطلح المتبقي.
    E (Y) = E ( β 0 + 1 x (i) + ε (i) )
    = E ( β 0 + 1 x (i) + (i) )
    إذا كان توقع (متوسط) المخلفات ، E (ε (i) ) ، هو صفر ، فإن توقعات المتغير المستهدف والنموذج تصبح هي نفسها ، وهو أحد أهداف النموذج.
    يجب أن تكون القيم المتبقية (المعروفة أيضًا باسم شروط الخطأ) مستقلة. هذا يعني أنه لا يوجد ارتباط بين القيم المتبقية والقيم المتوقعة ، أو بين القيم المتبقية نفسها. في حالة وجود بعض الارتباط ، فهذا يعني أن هناك علاقة ما لا يستطيع نموذج الانحدار تحديدها.
  3. إذا لم تكن المتغيرات المستقلة مستقلة خطيًا عن بعضها البعض ، فسيتم فقد تفرد حل المربعات الصغرى (أو حل المعادلة العادية).

انضم إلى دورة الذكاء الاصطناعي عبر الإنترنت من أفضل الجامعات في العالم - الماجستير ، وبرامج الدراسات العليا التنفيذية ، وبرنامج الشهادات المتقدمة في ML & AI لتسريع حياتك المهنية.

3. ما هي هندسة الميزات؟ كيف تقوم بتطبيقه في عملية النمذجة؟

هندسة الميزات هي عملية تحويل البيانات الأولية إلى ميزات تمثل بشكل أفضل المشكلة الأساسية للنماذج التنبؤية

، مما أدى إلى تحسين دقة النموذج على البيانات غير المرئية.
بعبارات عامة ، تعني هندسة الميزات تطوير ميزات جديدة قد تساعدك على فهم المشكلة وتصميمها بطريقة أفضل. تنقسم هندسة الميزات إلى نوعين - مدفوعة بالأعمال وقائمة على البيانات. تدور هندسة الميزات المدفوعة بالأعمال حول تضمين الميزات من وجهة نظر الأعمال. المهمة هنا هي تحويل متغيرات العمل إلى سمات المشكلة. في حالة هندسة الميزات المستندة إلى البيانات ، لا تحتوي الميزات التي تضيفها على أي تفسير مادي مهم ، ولكنها تساعد النموذج في التنبؤ بالمتغير المستهدف.

لمعلوماتك: دورة البرمجة اللغوية العصبية المجانية!
لتطبيق هندسة الميزات ، يجب أن يكون المرء على دراية كاملة بمجموعة البيانات. يتضمن هذا معرفة ماهية البيانات المقدمة ، وما تدل عليه ، وما هي الميزات الأولية ، وما إلى ذلك. يجب أن يكون لديك أيضًا فكرة واضحة تمامًا عن المشكلة ، مثل العوامل التي تؤثر على المتغير الهدف ، وما هو التفسير المادي للمتغير ، إلخ.

5 تطبيقات متطورة للتعلم الآلي

4. ما فائدة التسوية؟ اشرح تنظيمات L1 و L2.

التنظيم هو تقنية تُستخدم لمعالجة مشكلة فرط تجهيز النموذج. عندما يتم تنفيذ نموذج معقد للغاية على بيانات التدريب ، فإنه يتناسب تمامًا. في بعض الأحيان ، قد لا يكون النموذج البسيط قادرًا على تعميم البيانات والنموذج المعقد. لمعالجة هذه المشكلة ، يتم استخدام التنظيم.
التنظيم ليس سوى إضافة شروط المعامل (تجريبية) إلى دالة التكلفة بحيث تكون الشروط معاقبة وتكون صغيرة في الحجم. يساعد هذا بشكل أساسي في التقاط الاتجاهات في البيانات وفي نفس الوقت يمنع فرط التخصيص من خلال عدم ترك النموذج يصبح معقدًا للغاية.

  • تسوية L1 أو LASSO: هنا ، تتم إضافة القيم المطلقة للمعاملات إلى دالة التكلفة. يمكن ملاحظة ذلك في المعادلة التالية ؛ يتوافق الجزء المميز مع تسوية L1 أو LASSO. تعطي تقنية التنظيم هذه نتائج متفرقة ، مما يؤدي إلى اختيار الميزة أيضًا.

  • تسوية L2 أو Ridge: هنا ، تتم إضافة مربعات المعاملات إلى دالة التكلفة. يمكن ملاحظة ذلك في المعادلة التالية ، حيث يتوافق الجزء المميز مع تنظيم L2 أو Ridge.

5. كيف تختار قيمة معدل تعلم المعلمة (α)؟

يعد اختيار قيمة معدل التعلم عملاً صعبًا. إذا كانت القيمة صغيرة جدًا ، فإن خوارزمية النسب المتدرج تستغرق وقتًا لتتقارب مع الحل الأمثل. من ناحية أخرى ، إذا كانت قيمة معدل التعلم عالية ، فإن نزول التدرج اللوني سوف يتجاوز الحل الأمثل وعلى الأرجح لن يتقارب أبدًا مع الحل الأمثل.
للتغلب على هذه المشكلة ، يمكنك تجربة قيم مختلفة لـ alpha عبر نطاق من القيم ورسم التكلفة مقابل عدد التكرارات. بعد ذلك ، بناءً على الرسوم البيانية ، يمكن اختيار القيمة المقابلة للرسم البياني الذي يوضح الانخفاض السريع.

يمثل الرسم البياني المذكور أعلاه تكلفة مثالية مقابل منحنى عدد التكرارات. لاحظ أن التكلفة تتناقص في البداية مع زيادة عدد التكرارات ، ولكن بعد تكرارات معينة ، يتقارب نزول التدرج ولا تنخفض التكلفة بعد الآن.
إذا رأيت أن التكلفة تتزايد مع عدد التكرارات ، فإن معلمة معدل التعلم لديك مرتفعة ويجب تقليلها.

6. كيف يتم اختيار قيمة معامل التنظيم (λ)؟

يعد تحديد معامل التنظيم عملاً صعبًا. إذا كانت قيمة عالية جدًا ، فستؤدي إلى قيم صغيرة جدًا لمعامل الانحدار β ، مما سيؤدي إلى عدم ملاءمة النموذج (انحياز مرتفع - تباين منخفض). من ناحية أخرى ، إذا كانت قيمة هي 0 (صغيرة جدًا) ، فإن النموذج يميل إلى زيادة بيانات التدريب (التحيز المنخفض - التباين العالي).
لا توجد طريقة مناسبة لتحديد قيمة λ . ما يمكنك فعله هو الحصول على عينة فرعية من البيانات وتشغيل الخوارزمية عدة مرات على مجموعات مختلفة. هنا ، يجب على الشخص أن يقرر مقدار التباين الذي يمكن تحمله. بمجرد رضا المستخدم عن التباين ، يمكن اختيار قيمة λ لمجموعة البيانات الكاملة.
شيء واحد يجب ملاحظته هو أن قيمة λ المحددة هنا كانت مثالية لتلك المجموعة الفرعية ، وليس لبيانات التدريب بأكملها.

7. هل يمكننا استخدام الانحدار الخطي لتحليل السلاسل الزمنية؟

يمكن للمرء استخدام الانحدار الخطي لتحليل السلاسل الزمنية ، لكن النتائج ليست واعدة. لذلك ، من غير المستحسن بشكل عام القيام بذلك. الأسباب وراء ذلك -

  1. تُستخدم بيانات السلاسل الزمنية في الغالب للتنبؤ بالمستقبل ، لكن الانحدار الخطي نادرًا ما يعطي نتائج جيدة للتنبؤ في المستقبل لأنه لا يُقصد به الاستقراء.
  2. في الغالب ، تحتوي بيانات السلاسل الزمنية على نمط ، مثل خلال ساعات الذروة ، والمواسم الاحتفالية ، وما إلى ذلك ، والتي من المرجح أن يتم التعامل معها على أنها قيم متطرفة في تحليل الانحدار الخطي.

8. ما هي قيمة مجموع بقايا الانحدار الخطي القريب؟ يبرر.

الإجابة : مجموع القيم المتبقية من الانحدار الخطي هو 0. يعمل الانحدار الخطي على افتراض أن الأخطاء (القيم المتبقية) يتم توزيعها عادةً بمتوسط ​​0 ، أي

ص = β T X + ε

هنا ، Y هو الهدف أو المتغير التابع ،
β هو متجه معامل الانحدار ،
X هي مصفوفة السمات التي تحتوي على جميع الميزات مثل الأعمدة ،
ε هو المصطلح المتبقي مثل ε ~ N (0 ، σ 2 ).
لذا ، فإن مجموع كل القيم المتبقية هو القيمة المتوقعة للمخلفات مضروبًا في العدد الإجمالي لنقاط البيانات. نظرًا لأن توقع القيم المتبقية هو 0 ، فإن مجموع كل الشروط المتبقية هو صفر.
ملاحظة : N (μ، σ 2 ) هو التدوين القياسي للتوزيع العادي الذي له متوسط ​​μ وانحراف معياري σ 2 .

9. كيف تؤثر العلاقة الخطية المتعددة على الانحدار الخطي؟

تحدث الجواب الخطية المتعددة عندما تكون بعض المتغيرات المستقلة شديدة الترابط (إيجابًا أو سلبًا) مع بعضها البعض. تسبب هذه العلاقة الخطية المتعددة مشكلة لأنها تتعارض مع الافتراض الأساسي للانحدار الخطي. لا يؤثر وجود علاقة خطية متعددة على القدرة التنبؤية للنموذج. لذلك ، إذا كنت تريد تنبؤات فقط ، فلن يؤثر وجود الخط الخطي المتعدد على مخرجاتك. ومع ذلك ، إذا كنت ترغب في استخلاص بعض الأفكار من النموذج وتطبيقها ، دعنا نقول ، في بعض نماذج الأعمال ، فقد يتسبب ذلك في حدوث مشكلات.
واحدة من المشاكل الرئيسية التي تسببها العلاقة الخطية المتعددة هي أنها تؤدي إلى تفسيرات غير صحيحة وتوفر رؤى خاطئة. تشير معاملات الانحدار الخطي إلى متوسط ​​التغيير في القيمة المستهدفة إذا تم تغيير الميزة بوحدة واحدة. لذلك ، في حالة وجود علاقة خطية متعددة ، فإن هذا لا يكون صحيحًا لأن تغيير ميزة واحدة سيؤدي إلى تغييرات في المتغير المرتبط وما يترتب على ذلك من تغييرات في المتغير الهدف. هذا يؤدي إلى رؤى خاطئة ويمكن أن يؤدي إلى نتائج خطيرة للأعمال التجارية.
طريقة فعالة للغاية للتعامل مع العلاقات الخطية المتعددة هي استخدام VIF (عامل تضخم التباين). كلما زادت قيمة VIF للميزة ، كانت تلك الميزة أكثر ارتباطًا خطيًا. ما عليك سوى إزالة الميزة ذات قيمة VIF عالية جدًا وإعادة تدريب النموذج على مجموعة البيانات المتبقية.

10. ما هي الصيغة العادية (المعادلة) للانحدار الخطي؟ متى يجب تفضيلها على طريقة الانحدار؟

المعادلة العادية للانحدار الخطي هي -

β = (X T X) -1 . X T ص

هنا ، Y = β T X هو نموذج الانحدار الخطي ،
Y هو الهدف أو المتغير التابع ،
β هو متجه معامل الانحدار ، والذي تم التوصل إليه باستخدام المعادلة العادية ،
X هي مصفوفة المعالم التي تحتوي على جميع المعالم كأعمدة.
لاحظ هنا أن العمود الأول في المصفوفة X يتكون من جميع الآحاد. هذا لتضمين قيمة الإزاحة لخط الانحدار.
مقارنة بين النسب المتدرج والمعادلة العادية:

نزول متدرج معادلة عادية
يحتاج إلى ضبط المعلمة الفائقة لـ alpha (معلمة التعلم) لا حاجة لمثل هذه
إنها عملية تكرارية إنها عملية غير تكرارية
O (kn 2 ) التعقيد الزمني O (ن 3 ) تعقيد الوقت بسبب تقييم X T X
يُفضل عندما تكون n كبيرة للغاية يصبح بطيئًا جدًا لقيم n الكبيرة

هنا ، " k " هو الحد الأقصى لعدد التكرارات لنسب التدرج ، و " n " هو العدد الإجمالي لنقاط البيانات في مجموعة التدريب.
من الواضح ، إذا كانت لدينا بيانات تدريب كبيرة ، فلا يفضل استخدام المعادلة العادية. بالنسبة للقيم الصغيرة لـ ' n ' ، تكون المعادلة العادية أسرع من نزول التدرج اللوني.
ما هو التعلم الآلي ولماذا هو مهم

11. تقوم بتشغيل الانحدار الخاص بك على مجموعات فرعية مختلفة من البيانات الخاصة بك ، وفي كل مجموعة فرعية ، تختلف قيمة بيتا لمتغير معين بشكل كبير. ماذا يمكن أن يكون قضية هنا؟

تشير هذه الحالة إلى أن مجموعة البيانات غير متجانسة. لذلك ، للتغلب على هذه المشكلة ، يجب تجميع مجموعة البيانات في مجموعات فرعية مختلفة ، ثم بناء نماذج منفصلة لكل مجموعة. هناك طريقة أخرى للتعامل مع هذه المشكلة وهي استخدام نماذج غير بارامترية ، مثل أشجار القرار ، والتي يمكنها التعامل مع البيانات غير المتجانسة بكفاءة تامة.

12. لا يعمل الانحدار الخطي الخاص بك ويوضح أن هناك عددًا لا نهائيًا من أفضل التقديرات لمعاملات الانحدار. ماذا يمكن أن يكون الخطأ؟

ينشأ هذا الشرط عندما يكون هناك ارتباط كامل (إيجابي أو سلبي) بين بعض المتغيرات. في هذه الحالة ، لا توجد قيمة فريدة للمعاملات ، وبالتالي ، فإن الشرط المعطى ينشأ.

13. ماذا تقصد بتعديل R 2 ؟ كيف تختلف عن R 2 ؟

تعد R 2 المعدلة ، تمامًا مثل R 2 ، ممثلة لعدد النقاط الموجودة حول خط الانحدار. أي أنه يوضح مدى ملاءمة النموذج لبيانات التدريب. صيغة R 2 المعدلة هو -

هنا ، n هو عدد نقاط البيانات ، و k هو عدد المعالم.
عيب واحد من R 2 هو أنها ستزداد دائمًا مع إضافة ميزة جديدة ، سواء كانت الميزة الجديدة مفيدة أم لا. R 2 المعدلة يتغلب على هذا العيب. تزداد قيمة R 2 المعدلة فقط إذا لعبت الميزة المضافة حديثًا دورًا مهمًا في النموذج.

14. كيف تفسر منحنى القيمة المتبقية مقابل القيمة المناسبة؟

يتم استخدام مؤامرة القيمة المتبقية مقابل القيمة المجهزة لمعرفة ما إذا كانت القيم المتوقعة والمتبقيات لها ارتباط أم لا. إذا تم توزيع القيم المتبقية بشكل طبيعي ، بمتوسط ​​حول القيمة المناسبة والتباين المستمر ، فإن نموذجنا يعمل بشكل جيد ؛ خلاف ذلك ، هناك بعض المشاكل مع النموذج.
المشكلة الأكثر شيوعًا التي يمكن العثور عليها عند تدريب النموذج على نطاق كبير من مجموعة البيانات هي عدم التجانس (وهذا موضح في الإجابة أدناه). يمكن رؤية وجود تغاير المرونة بسهولة عن طريق رسم منحنى القيمة المتبقية مقابل منحنى القيمة المجهزة.

15. ما هي عدم التجانس؟ ما هي العواقب وكيف يمكنك التغلب عليها؟

يُقال إن المتغير العشوائي متغاير التماثل عندما يكون للمجموعات السكانية الفرعية المختلفة متغيرات مختلفة (الانحراف المعياري).
يؤدي وجود تغاير المرونة إلى ظهور مشاكل معينة في تحليل الانحدار حيث يقول الافتراض أن شروط الخطأ غير مرتبطة ، وبالتالي ، فإن التباين ثابت. غالبًا ما يمكن رؤية وجود تغاير المرونة في شكل مخطط مبعثر يشبه المخروط للقيم المتبقية مقابل القيم المجهزة.
أحد الافتراضات الأساسية للانحدار الخطي هو أن عدم تغاير المرونة غير موجود في البيانات. نظرًا لانتهاك الافتراضات ، فإن تقديرات المربعات الصغرى العادية (OLS) ليست أفضل التقديرات الخطية غير المنحازة (BLUE). ومن ثم ، فإنها لا تعطي أقل تباين من غيره من المقدر الخطي غير المتحيز (LUEs).
لا يوجد إجراء ثابت للتغلب على عدم التجانس. ومع ذلك ، هناك بعض الطرق التي قد تؤدي إلى الحد من عدم التجانس. هم انهم -

  1. لوغاريتميز البيانات: غالبًا ما تؤدي السلسلة التي تزداد أضعافًا مضاعفة إلى زيادة التباين. يمكن التغلب على هذا باستخدام تحويل السجل.
  2. باستخدام الانحدار الخطي الموزون: هنا ، يتم تطبيق طريقة OLS على القيم الموزونة لـ X و Y. وتتمثل إحدى الطرق في إرفاق أوزان مرتبطة مباشرة بحجم المتغير التابع.
كيف يعمل التعلم الآلي غير الخاضع للإشراف؟

16. ما هو VIF؟ كيف يمكنك حساب ذلك؟

يتم استخدام عامل تضخم التباين (VIF) للتحقق من وجود علاقة خطية متعددة في مجموعة البيانات. يتم حسابه على النحو التالي:
هنا ، VIF j هي قيمة VIF للمتغير j ،
R j 2 هي قيمة R 2 للنموذج عندما يتراجع هذا المتغير مقابل جميع المتغيرات المستقلة الأخرى.
إذا كانت قيمة VIF عالية بالنسبة لمتغير ، فهذا يعني أن R 2 قيمة النموذج المقابل عالية ، أي أن المتغيرات المستقلة الأخرى قادرة على تفسير هذا المتغير. بعبارات بسيطة ، يعتمد المتغير خطيًا على بعض المتغيرات الأخرى.

17. كيف تعرف أن الانحدار الخطي مناسب لأية بيانات معينة؟

لمعرفة ما إذا كان الانحدار الخطي مناسبًا لأي بيانات معينة ، يمكن استخدام مخطط التبعثر. إذا كانت العلاقة تبدو خطية ، فيمكننا البحث عن نموذج خطي. ولكن إذا لم يكن الأمر كذلك ، فعلينا تطبيق بعض التحولات لجعل العلاقة خطية. من السهل رسم مخططات التبعثر في حالة الانحدار الخطي البسيط أو أحادي المتغير. ولكن في حالة الانحدار الخطي متعدد المتغيرات ، يمكن رسم مخططات مبعثرة ثنائية الأبعاد ثنائية الأبعاد ، ومؤامرات دوارة ، ورسوم بيانية ديناميكية.

18. كيف يتم استخدام اختبار الفرضيات في الانحدار الخطي؟

يمكن إجراء اختبار الفرضيات في الانحدار الخطي للأغراض التالية:

  1. للتحقق مما إذا كان المتنبئ مهمًا للتنبؤ بالمتغير المستهدف. طريقتان شائعتان لهذا هما -
    1. عن طريق استخدام القيم p:
      إذا كانت قيمة p للمتغير أكبر من حد معين (عادةً 0.05) ، يكون المتغير غير مهم في التنبؤ بالمتغير المستهدف.
    2. بالتحقق من قيم معامل الانحدار:
      إذا كانت قيمة معامل الانحدار المقابل للمتنبئ هي صفر ، فإن هذا المتغير يكون غير مهم في التنبؤ بالمتغير المستهدف وليس له علاقة خطية معه.
  2. للتحقق مما إذا كانت معاملات الانحدار المحسوبة هي تقديرات جيدة للمعاملات الفعلية.

19. اشرح النسب المتدرج فيما يتعلق بالانحدار الخطي.

نزول التدرج هو خوارزمية التحسين. في الانحدار الخطي ، يتم استخدامه لتحسين دالة التكلفة والعثور على قيم βs (المقدرات) المقابلة للقيمة المثلى لدالة التكلفة.
يعمل الانحدار المتدرج مثل كرة تتدحرج على الرسم البياني (متجاهلة القصور الذاتي). تتحرك الكرة على طول اتجاه التدرج الأكبر وتستقر عند السطح المستوي (الحد الأدنى).

رياضيا ، الهدف من الانحدار المتدرج للانحدار الخطي هو إيجاد حل
ArgMin J (Θ 0 ، Θ 1 ) ، حيث J ( 0 ، Θ 1 ) هي دالة التكلفة للانحدار الخطي. تعطى من قبل -

هنا ، h هو نموذج الفرضية الخطية ، h = Θ 0 + Θ 1 x ، y هو الناتج الحقيقي ، و m هو عدد نقاط البيانات في مجموعة التدريب.
يبدأ التدرج اللوني بحل عشوائي ، ثم بناءً على اتجاه التدرج اللوني ، يتم تحديث الحل إلى القيمة الجديدة حيث يكون لدالة التكلفة قيمة أقل.
التحديث هو:
كرر حتى التقارب

20. كيف تفسر نموذج الانحدار الخطي؟

من السهل جدًا تفسير نموذج الانحدار الخطي. النموذج من الشكل التالي:

تكمن أهمية هذا النموذج في حقيقة أنه يمكن للمرء بسهولة تفسير وفهم التغييرات الهامشية وعواقبها. على سبيل المثال ، إذا زادت قيمة x 0 بمقدار وحدة واحدة ، مع الحفاظ على المتغيرات الأخرى ثابتة ، فإن الزيادة الإجمالية في قيمة y ستكون β i . رياضيا ، مصطلح التقاطع ( β 0 ) هو الاستجابة عندما يتم تعيين جميع شروط التوقع إلى الصفر أو لا يتم النظر فيها.
تعمل تقنيات التعلم الآلي الستة هذه على تحسين الرعاية الصحية

21. ما هو الانحدار القوي؟

يجب أن يكون نموذج الانحدار قويًا بطبيعته. هذا يعني أنه مع التغييرات في بعض الملاحظات ، يجب ألا يتغير النموذج بشكل جذري. أيضًا ، لا ينبغي أن يتأثر كثيرًا بالقيم المتطرفة.
نموذج الانحدار مع OLS (المربعات الصغرى العادية) حساس تمامًا للقيم المتطرفة. للتغلب على هذه المشكلة ، يمكننا استخدام طريقة WLS (المربعات الصغرى الموزونة) لتحديد مقدرات معاملات الانحدار. هنا ، يتم إعطاء أوزان أقل للقيم المتطرفة أو نقاط التأثير العالي في التركيب ، مما يجعل هذه النقاط أقل تأثيرًا.

22. ما هي الرسوم البيانية المقترح ملاحظتها قبل تركيب النموذج؟

قبل تركيب النموذج ، يجب أن يكون المرء مدركًا جيدًا للبيانات ، مثل الاتجاهات والتوزيع والانحراف وما إلى ذلك في المتغيرات. يمكن استخدام الرسوم البيانية مثل الرسوم البيانية ومخططات الصندوق والمخططات النقطية لمراقبة توزيع المتغيرات. بصرف النظر عن هذا ، يجب على المرء أيضًا تحليل العلاقة بين المتغيرات التابعة والمستقلة. يمكن القيام بذلك عن طريق مخططات مبعثرة (في حالة وجود مشاكل أحادية المتغير) ، أو قطع أرض دوارة ، أو مخططات ديناميكية ، إلخ.

23. ما هو النموذج الخطي المعمم؟

النموذج الخطي المعمم هو مشتق من نموذج الانحدار الخطي العادي. يعتبر GLM أكثر مرونة من حيث المخلفات ويمكن استخدامه حيث لا يبدو الانحدار الخطي مناسبًا. يسمح GLM بتوزيع المخلفات لتكون بخلاف التوزيع الطبيعي. يعمم الانحدار الخطي بالسماح للنموذج الخطي بالارتباط بالمتغير المستهدف باستخدام وظيفة الربط. يتم تقدير النموذج باستخدام طريقة تقدير الاحتمالية القصوى.

24. اشرح مقايضة التحيز والتباين.

يشير التحيز إلى الاختلاف بين القيم التي تنبأ بها النموذج والقيم الحقيقية. إنه خطأ. أحد أهداف خوارزمية ML هو التحيز المنخفض.
يشير التباين إلى حساسية النموذج للتقلبات الصغيرة في مجموعة بيانات التدريب. الهدف الآخر لخوارزمية ML هو الحصول على تباين منخفض.
بالنسبة لمجموعة البيانات غير الخطية تمامًا ، لا يمكن أن يكون كل من التحيز والتباين منخفضين في نفس الوقت. نموذج الخط المستقيم سيكون له تباين منخفض ولكن انحياز كبير ، في حين أن متعدد الحدود عالي الدرجة سيكون له تحيز منخفض ولكن تباين كبير.
لا مفر من العلاقة بين التحيز والتباين في التعلم الآلي.

  1. يؤدي تقليل التحيز إلى زيادة التباين.
  2. يؤدي تقليل التباين إلى زيادة التحيز.

لذلك ، هناك مفاضلة بين الاثنين ؛ يجب على اختصاصي تعلم الآلة أن يقرر ، بناءً على المشكلة المحددة ، مقدار التحيز والتباين الذي يمكن تحمله. بناءً على ذلك ، تم بناء النموذج النهائي.

25. كيف يمكن لمنحنيات التعلم أن تساعد في إنشاء نموذج أفضل؟

تعطي منحنيات التعلم دلالة على وجود فرط أو نقص في التجهيز.
في منحنى التعلم ، يتم رسم خطأ التدريب وخطأ التحقق المتبادل مقابل عدد نقاط بيانات التدريب. يبدو منحنى التعلم النموذجي كما يلي:

إذا تقارب خطأ التدريب والخطأ الحقيقي (خطأ التحقق المتبادل) مع نفس القيمة وكانت القيمة المقابلة للخطأ عالية ، فهذا يشير إلى أن النموذج غير ملائم ويعاني من انحياز كبير.

مقابلات تعلم الآلة وكيفية تفوقها

يمكن أن تختلف مقابلات التعلم الآلي وفقًا للأنواع أو الفئات ، على سبيل المثال ، يطرح عدد قليل من المجندين العديد من أسئلة مقابلة الانحدار الخطي . عند الذهاب إلى مقابلة مهندس التعلم الآلي ، يمكنهم التخصص في فئات مثل الترميز ، والبحث ، ودراسة الحالة ، وإدارة المشاريع ، والعرض التقديمي ، وتصميم النظام ، والإحصاء. سنركز على الأنواع الأكثر شيوعًا من الفئات وكيفية الاستعداد لها.

  1. الترميز

يعد التشفير والبرمجة مكونين مهمين لمقابلة التعلم الآلي وغالبًا ما يستخدمان لفحص المتقدمين. لتحقيق أداء جيد في هذه المقابلات ، يجب أن تتمتع بقدرات برمجة قوية. عادةً ما تستغرق المقابلات الترميزية من 45 إلى 60 دقيقة وتتكون من سؤالين فقط. يطرح القائم بإجراء المقابلة الموضوع ويتوقع أن يتعامل معه مقدم الطلب في أقل وقت ممكن.

كيف تستعد - يمكنك التحضير لهذه المقابلات من خلال فهم جيد لهياكل البيانات ، وتعقيدات الزمان والمكان ، ومهارات الإدارة ، والقدرة على فهم المشكلة وحلها. لدى upGrad دورة رائعة في هندسة البرمجيات يمكن أن تساعدك على تحسين مهاراتك في الترميز وتفوق تلك المقابلة.

2. تعلم الآلة

سيتم تقييم فهمك للتعلم الآلي من خلال المقابلات. يمكن تغطية الطبقات التلافيفية ، والشبكات العصبية المتكررة ، وشبكات الخصوم التوليدية ، والتعرف على الكلام ، وغيرها من الموضوعات اعتمادًا على احتياجات التوظيف.

كيف تستعد - لتتمكن من إجراء هذه المقابلة ، يجب عليك التأكد من أن لديك فهمًا شاملاً لأدوار ومسؤوليات الوظيفة. سيساعدك هذا على تحديد مواصفات ML التي يجب عليك دراستها. ومع ذلك ، إذا لم تصادف أي مواصفات ، فيجب أن تفهم الأساسيات بعمق. يمكن أن تساعدك الدورة التدريبية المتعمقة في ML التي توفرها upGrad في ذلك. يمكنك أيضًا دراسة أحدث المقالات حول ML و AI لفهم أحدث اتجاهاتهم ويمكنك دمجها بشكل منتظم.

3. الفرز

هذه المقابلة غير رسمية إلى حد ما وعادة ما تكون واحدة من النقاط الأولية للمقابلة. غالبًا ما يتعامل معها صاحب العمل المحتمل. الهدف الرئيسي لهذه المقابلة هو تزويد مقدم الطلب بشعور بالعمل والدور والواجبات. في جو غير رسمي أكثر ، يُسأل المرشح أيضًا عن ماضيه لتحديد ما إذا كان مجال اهتمامه يتطابق مع الموقف.

كيف تستعد - هذا جزء غير تقني للغاية من المقابلة. كل هذا مطلوب هو أمانتك وأساسيات تخصصك في التعلم الآلي.

4. تصميم النظام

تختبر مثل هذه المقابلات قدرة الشخص على إنشاء حل قابل للتطوير بالكامل من البداية إلى النهاية. ينشغل غالبية المهندسين بقضية ما لدرجة أنهم غالبًا ما يتجاهلون الصورة الأوسع. تتطلب مقابلة تصميم النظام فهم العديد من العناصر التي تتحد لإنتاج حل. تتضمن هذه العناصر تخطيط الواجهة الأمامية وموازن التحميل وذاكرة التخزين المؤقت والمزيد. يكون تطوير نظام شامل فعال وقابل للتطوير أسهل عندما يتم فهم هذه المشكلات جيدًا.

كيف تستعد - فهم مفاهيم ومكونات مشروع تصميم النظام. استخدم أمثلة من الحياة الواقعية لشرح الهيكل لمحاورك لفهم المشروع بشكل أفضل.

مدونات التعلم الآلي والذكاء الاصطناعي الشعبية

إنترنت الأشياء: التاريخ والحاضر والمستقبل دروس تعلم الآلة: تعلم ML ما هي الخوارزمية؟ بسيط سهل
راتب مهندس الروبوتات في الهند: جميع الأدوار يوم في حياة مهندس التعلم الآلي: ماذا يفعلون؟ ما هو إنترنت الأشياء (إنترنت الأشياء)
التقليب مقابل الجمع: الفرق بين التقليب والجمع أهم 7 اتجاهات في الذكاء الاصطناعي وتعلم الآلة التعلم الآلي باستخدام R: كل ما تحتاج إلى معرفته

إذا كانت هناك فجوة كبيرة بين القيم المتقاربة للتدريب وأخطاء التحقق المتقاطع ، أي أن خطأ التحقق المتبادل أعلى بكثير من خطأ التدريب ، فهذا يشير إلى أن النموذج يملأ بيانات التدريب ويعاني من تباين كبير .
مهندسو التعلم الآلي: الخرافات مقابل الحقائق

هذه نهاية القسم الأول من هذه السلسلة. التزم بالجزء التالي من السلسلة الذي يتكون من أسئلة تستند إلى الانحدار اللوجستي . لا تتردد في إضافة التعليقات الخاصة بك.
كاتب مُشارك: - Ojas Agarwal

يمكنك التحقق من برنامج PG التنفيذي الخاص بنا في التعلم الآلي والذكاء الاصطناعي ، والذي يوفر ورش عمل عملية ، ومرشد صناعي فردي ، و 12 دراسة حالة ومهمة ، وحالة خريجي IIIT-B ، والمزيد.

ماذا تفهم بالتسوية؟

التنظيم هو استراتيجية للتعامل مع مشكلة فرط النموذج. يحدث التجاوز عند تطبيق نموذج معقد على بيانات التدريب. قد لا يكون النموذج الأساسي قادرًا على تعميم البيانات في بعض الأحيان ، وقد يتجاوز النموذج المعقد البيانات. التنظيم يستخدم للتخفيف من هذه المشكلة. التنظيم هو عملية إضافة شروط معامل (تجريبية) إلى مشكلة التصغير بطريقة يتم فيها معاقبة المصطلحات ويكون حجمها متواضعًا. يساعد هذا بشكل أساسي في تحديد أنماط البيانات مع منع فرط التخصيص عن طريق منع النموذج من أن يصبح معقدًا للغاية.

ماذا تفهم عن هندسة الميزات؟

تُعرف عملية تغيير البيانات الأصلية إلى ميزات تصف بشكل أفضل المشكلة الأساسية للنماذج التنبؤية ، مما يؤدي إلى تحسين دقة النموذج على البيانات غير المرئية ، باسم هندسة الميزات. من منظور الشخص العادي ، تشير هندسة الميزات إلى إنشاء ميزات إضافية قد تساعد في فهم المشكلة بشكل أفضل ونمذجةها. هناك نوعان من هندسة الميزات: تعتمد على الأعمال وتستند إلى البيانات. يعد دمج الميزات من وجهة نظر تجارية هو محور هندسة الميزات المدفوعة بالأعمال.

ما هي مقايضة التباين التحيز؟

يشار إلى الفجوة بين النموذج - القيم المتوقعة والقيم الفعلية على أنها تحيز. انها غلطة. يعد التحيز المنخفض أحد أهداف خوارزمية ML. يشار إلى قابلية تعرض النموذج للتغييرات الصغيرة في مجموعة بيانات التدريب باسم التباين. التباين المنخفض هو هدف آخر لخوارزمية ML. من المستحيل أن يكون لديك انحياز منخفض وتباين منخفض في مجموعة بيانات ليست خطية تمامًا. التباين في نموذج الخط المستقيم منخفض ، لكن التحيز كبير ، في حين أن التباين في كثير الحدود عالي الدرجة منخفض ، لكن التحيز مرتفع. في التعلم الآلي ، لا مفر من الارتباط بين التحيز والاختلاف.