مقدمة في التعلم شبه الخاضع للإشراف [أهم التطبيقات في عالم اليوم]

نشرت: 2021-01-29

كان التعلم الآلي هو الكلمة الطنانة في العقد الماضي. هناك عدد قليل جدًا من المجالات الآن لا يتضح فيها سحر التعلم الآلي. لا سيما في مجال الإعلانات المربحة للغاية ، يستخدم التعلم الآلي الآن على نطاق واسع أكثر من أي وقت مضى.

في كل مرة تقوم فيها بزيارة موقع ويب ، في كل مرة تبحث فيها عن مصطلح معين على الإنترنت ، يتم "تعلم" البيانات التي تقوم بإنشائها. تُستخدم هذه البيانات بعد ذلك لتزويدك بإعلانات مستهدفة ، مما يضمن تلقي كل مستخدم إعلانات مختلفة ، بغض النظر عن صفحة الويب التي يزورها المستخدم.

جدول المحتويات

كيف يعمل التعلم الآلي

إذن كيف يعمل التعلم الآلي؟ يشبه التعلم الآلي في عمله الدماغ البشري. يتم تحديث بياناتها باستمرار ، وتتعلم دائمًا من المعلومات الجديدة التي تتلقاها. يتضمن التعلم الآلي نوعين من المجموعات - مجموعة اختبار ومجموعة تدريب. مجموعة التدريب هي في الأساس مجموعة من البيانات التي تمثل جميع البيانات التي سيقوم نموذج التعلم الآلي بعمل تنبؤات لها.

الأهم من ذلك ، لدينا المعلومات الخاصة بمجموعات التدريب والاختبار للتنبؤ بالبيانات الكاملة. بمجرد أن يتعرف نموذج التعلم الآلي الذي قمت بإنشائه على نمط ما في مجموعة التدريب ، يتم اختباره من حيث الفعالية في مجموعة الاختبار. يستمر هذا ذهابًا وإيابًا حتى يصل النموذج إلى مستوى معين من الفعالية.

أنواع التعلم الآلي

التعلم الآلي له أنواعه الخاصة. النوعان الرئيسيان للتعلم الآلي هما كما يلي.

  1. التعلم الخاضع للإشراف
  2. تعليم غير مشرف عليه

في شكله المبكر وبالشكل الذي تم شرحه به في القسم السابق ، كان التعلم الآلي عمومًا مرادفًا للتعلم الخاضع للإشراف حتى وقت ليس ببعيد في التعلم الخاضع للإشراف. سيكون لكل من مجموعة التدريب ومجموعة الاختبار بيانات مصنفة.

البيانات المصنفة هي نوع البيانات التي يتم فيها تصنيف جميع حقول البيانات المهمة ، بما في ذلك الحقل الذي سيتم توقعه بواسطة النموذج ، على النحو الواجب حتى يتعلم النموذج بشكل فعال. التعلم الخاضع للإشراف هو تعلم قائم على الخبرة بالكامل وهو أمر رائع إذا كنت ترغب في تحسين أداء نموذجك.

التعلم غير الخاضع للإشراف هو نوع التعلم الآلي الذي لا يتم فيه تمييز جميع البيانات. بدلاً من ذلك ، يُمنح نموذج التعلم الآلي حرية التمييز بين الأنماط من بين البيانات المقدمة إليه. غالبًا ما يؤدي التعلم غير الخاضع للإشراف إلى نتائج غير متوقعة وحتى المساعدة في اكتشاف أنماط جديدة في مجموعات كبيرة من البيانات. نادرًا ما يتم تصنيف البيانات التي ستتلقاها بشكل عام ، ونماذج التعلم غير الخاضعة للإشراف مخصصة للبيانات غير المسماة.

التعلم شبه الخاضع للإشراف

هناك العديد من العيوب لكل من التعلم تحت الإشراف والتعلم غير الخاضع للإشراف. العيب الأكبر والأكثر وضوحًا للتعلم تحت الإشراف هو حقيقة أن معظم البيانات غير موسومة. لجعل التعلم الخاضع للإشراف يعمل على مجموعة من البيانات ، يجب غالبًا استخراج جميع البيانات وتصنيفها يدويًا ، وهي عملية صارمة وقد تلغي جميع مزايا استخدام التعلم الآلي على بياناتك.

لا يتطلب التعلم غير الخاضع للإشراف بيانات مصنفة ، ولكن قاعدة التطبيقات المحتملة للتعلم غير الخاضع للإشراف البحت ، للأسف ، محدودة نوعًا ما.

التعلم شبه الخاضع للإشراف هو نوع من التعلم الآلي يوفر مسارًا وسطيًا رائعًا بين التعلم الخاضع للإشراف والتعلم غير الخاضع للإشراف. من المسلم به أن التعلم شبه الخاضع للإشراف يتجه قليلاً نحو النهاية الخاضعة للإشراف من طيف التعلم الآلي. الشرط الأساسي لأي نموذج تعليمي شبه خاضع للإشراف هو مجموعة من البيانات غير الموسومة ، والتي تم استخراج قدر ضئيل من البيانات منها وتصنيفها يدويًا.

هذه فائدة كبيرة على النموذج الخاضع للإشراف البحت ، حيث يجب تسمية جميع البيانات. ومن ثم ، يرتبط التعلم شبه الخاضع للإشراف بتوفير التكلفة والوقت. بالمقارنة مع نموذج غير خاضع للإشراف ، يمكن للنموذج الخاضع للإشراف ، إذا تم استخدامه مع كمية صغيرة من البيانات المصنفة ، أن يقلل الموارد الحسابية والتحسينات في دقة النموذج.

افتراضات التعلم غير الخاضع للرقابة

عندما يتعلق الأمر بأي استخدام للبيانات غير المسماة ، يجب أن يكون مرتبطًا بطريقة ما بالبيانات الأساسية. عند استخدام نموذج التعلم الآلي شبه الخاضع للإشراف ، يتم عمل افتراضات معينة حول البيانات. هذه الافتراضات هي التالية.

افتراض الاستمرارية: هذا افتراض مفاده أن النقاط الموجودة على مخطط مبعثر تمثل جميع البيانات الأقرب لبعضها من المرجح أن يكون لها نفس التسمية. هذا أيضًا افتراض رئيسي يستخدم بشكل عام لنماذج التعلم تحت الإشراف. هذا الافتراض يجعل من السهل على النموذج شبه الخاضع للإشراف تشكيل حدود قرار واضحة.

افتراض الكتلة: يفترض هذا أن البيانات لديها ميل طبيعي لتكوين مجموعات وأن نقاط البيانات التي هي جزء من نفس المجموعة لها نفس التسمية. ومع ذلك ، فإن التحذير لهذا الافتراض هو أن مجموعتين أو أكثر قد تحتوي أيضًا على بيانات تنتمي إلى نفس التصنيف. هذا الافتراض ذو فائدة كبيرة في خوارزميات التجميع. هذا مشابه جدًا للافتراض السابق ويمكن التعامل معه كحالة خاصة لافتراض الاستمرارية. يعتبر افتراض المجموعة ذا فائدة كبيرة عندما يكون تحديد حدود القرار مطلوبًا ، على غرار افتراض الاستمرارية.

الافتراض المتنوع: هذا يفترض أن أبعاد مشعب مساحة الإدخال أعلى بكثير من تلك التي تقع عليها البيانات. بمجرد إجراء هذا الافتراض ، قام بتسمية البيانات غير الموسومة ويمكن تعلمها وفقًا للمشعب المشترك. بمجرد إنشاء المشعب ، يمكن قياس الكثافة والمسافة بين نقاط البيانات. يعد هذا افتراضًا مفيدًا عندما يكون عدد الأبعاد في البيانات مرتفعًا جدًا ويكرر أن عدد الأبعاد التي تحكم تصنيف البيانات في تسميات مختلفة سيكون أقل نسبيًا.

اقرأ أيضًا: نماذج التعلم الآلي

تطبيقات التعلم شبه الخاضع للإشراف

الشكوى الرئيسية من التعلم غير الخاضع للإشراف هي أن عدد التطبيقات المحتملة منخفض نوعًا ما. غالبًا ما تكون النتائج التي يتم الحصول عليها من خلال نموذج غير خاضع للإشراف زائدة عن الحاجة أو غير قابلة للاستخدام. وبالمقارنة ، فإن التعلم شبه الخاضع للإشراف يحتوي على مجموعة قوية من التطبيقات حيث يمكن الاستفادة منها.

تصنيف المحتوى على الإنترنت: الإنترنت عبارة عن مجموعة كبيرة من صفحات الويب ، ولا يمكن توقع أن يتم تصنيف كل صفحة وتحتوي على جميع البيانات الخاصة بالمجال الذي تريده. ومع ذلك ، في الوقت نفسه ، من الصحيح أنه على مر السنين ، سيتم تصنيف بعض أقلية صفحات الويب لأحد الأبعاد أو الأبعاد الأخرى.

يمكن استخدام هذا لتصنيف صفحات الويب. يمكن استخدام مجموعة من صفحات الويب المصنفة للتنبؤ بتسمية جميع صفحات الويب الأخرى التي تحتاجها. تستخدم العديد من محركات البحث نموذجًا تعليميًا شبه خاضع للإشراف لتصنيف وترتيب صفحات الويب في نتائج البحث ، بما في ذلك Google.

تحليل الصور والصوت: يعد تحليل الصور والصوت من أكثر الاستخدامات شيوعًا لنماذج التعلم شبه الخاضعة للإشراف. عادة ما يكون هذا النوع من البيانات غير موسوم. يمكن للخبرة البشرية تسمية نسبة صغيرة من البيانات بدلاً من تصنيف كل صورة أو جزء صوتي لحقل معين على مدار أيام وشهور. بمجرد تصنيف هذه النسبة الصغيرة من البيانات ، يمكنك ببساطة استخدام الخوارزمية المدربة لتصنيف جميع البيانات الأخرى التي لديك.

تصنيف تسلسل البروتين: هذا تطبيق جديد نسبيًا للتعلم شبه الخاضع للإشراف. تحتوي تسلسلات البروتين على العديد من الأحماض الأمينية ، ومن غير العملي تحليل كل تسلسل بروتين وتصنيفه كنوع أو آخر. يمكن إكمال هذه المهمة بسهولة باستخدام التعلم شبه الخاضع للإشراف. كل ما تحتاجه هو قاعدة بيانات للبروتينات المتسلسلة بالفعل ، ويمكن للنموذج نفسه تسلسل الباقي.

خاتمة

يوفر التعلم شبه الخاضع للإشراف اعتدالًا كبيرًا بين مزايا وعيوب التعلم الخاضع للإشراف وغير الخاضع للإشراف. كما أنه يضمن إمكانية استخدام قدر كبير من البيانات المُنشأة أو المتاحة في نموذج واحد أو آخر للحصول على رؤى ذات مغزى. من المرجح أن يزداد استخدام هذا النوع من النماذج في السنوات القادمة.

يعد التعلم الآلي من أكثر التقنيات تأثيرًا في العالم. هذا سبب كبير لشعبية كبيرة في الوقت الحاضر.

تستخدم العديد من الصناعات التعلم الآلي لأغراض مختلفة ، وبالتالي يزداد الطلب يومًا بعد يوم. إذا كنت ترغب في معرفة المزيد عن الوظائف في التعلم الآلي والذكاء الاصطناعي ، تحقق من IIIT-B و upGrad's دبلوم PG في برنامج التعلم الآلي والذكاء الاصطناعي.

تعلم دورة ML من أفضل الجامعات في العالم. احصل على درجة الماجستير أو برنامج PGP التنفيذي أو برامج الشهادات المتقدمة لتسريع مسار حياتك المهنية.

قيادة الثورة التكنولوجية التي يقودها الذكاء الاصطناعي

تعلم برنامج الشهادة المتقدم في التعلم الآلي والتعلم العميق