الانحدار اللوجستي للتعلم الآلي: دليل كامل
نشرت: 2021-10-04تتطلب نماذج التعلم الآلي الخوارزميات للعمل. اعتمادًا على مجموعة الشروط ، يمكن لنموذج ML معين أداء أفضل باستخدام خوارزمية واحدة أو أخرى. نتيجة لذلك ، يجب أن يكون مهندسو التعلم الآلي والمتحمسون على دراية بالأنواع المختلفة من الخوارزميات التي يمكن استخدامها في سياقات مختلفة - لمعرفة أي منها يستخدم عندما يحين الوقت. لا يوجد حل واحد يناسب الجميع في "التعلم الآلي" ، ويمكن أن يؤدي التغيير والتبديل باستخدام خوارزميات مختلفة إلى تحقيق النتائج المرجوة.
على سبيل المثال ، يجب أن تعرف بالفعل عن الانحدار الخطي. ومع ذلك ، لا يمكن تطبيق هذه الخوارزمية فقط على المتغيرات التابعة بشكل قاطع. هذا هو المكان الذي يكون فيه الانحدار اللوجستي مفيدًا.
في التعلم الآلي ، يعد الانحدار اللوجستي طريقة تعلم خاضعة للإشراف تستخدم للتنبؤ باحتمالية وجود متغير تابع أو متغير مستهدف. باستخدام الانحدار اللوجستي ، يمكنك التنبؤ وإقامة علاقات بين متغير تابع ومتغير واحد أو أكثر من المتغيرات المستقلة.
تُستخدم معادلات ونماذج الانحدار اللوجستي عمومًا للتحليلات التنبؤية للتصنيف الثنائي. يمكنك أيضًا استخدامها لتصنيف متعدد الفئات.
إليك كيف تبدو معادلة الانحدار اللوجستي للتعلم الآلي:
logit (p) = ln (p / (1-p)) = h0 + h1X1 + h2X2 + h3X3…. + hkXk
أين؛
ع = احتمال حدوث الميزة
x1، x2، .. xk = مجموعة ميزات الإدخال
h1، h2،… .hk = القيم البارامترية التي سيتم تقديرها في معادلة الانحدار اللوجستي.
جدول المحتويات
أنواع نماذج الانحدار اللوجستي في التعلم الآلي
بناءً على طريقة استخدام الانحدار اللوجستي ، يمكن تصنيف نوع نماذج الانحدار اللوجستي على النحو التالي:
1. نموذج الانحدار اللوجستي الثنائي
هذا هو أحد نماذج الانحدار الأكثر استخدامًا للانحدار اللوجستي. يساعد في تصنيف البيانات إلى فئتين والتنبؤ بقيمة المدخلات الجديدة على أنها تنتمي إلى أي من الفئتين. على سبيل المثال ، يمكن أن يكون ورم المريض حميدًا أو خبيثًا ولكن لا يمكن أن يكون كلاهما.
2. نموذج الانحدار اللوجستي متعدد الحدود
يساعد هذا النموذج في تصنيف المتغيرات المستهدفة إلى أكثر من فئتين - بغض النظر عن أي أهمية كمية. مثال على ذلك يمكن أن يكون التنبؤ بنوع الطعام الذي من المرجح أن يطلبه الفرد بناءً على تفضيلاته الغذائية والتجارب السابقة.
انضم إلى دورة التعلم الآلي عبر الإنترنت من أفضل الجامعات في العالم - الماجستير ، وبرامج الدراسات العليا التنفيذية ، وبرنامج الشهادات المتقدمة في ML & AI لتسريع حياتك المهنية.
3. نموذج الانحدار اللوجيستي الترتيبي
يستخدم هذا النموذج لتصنيف المتغير المستهدف. على سبيل المثال ، يمكن تصنيف أداء الطالب في الاختبار على أنه ضعيف وجيد وممتاز في ترتيب هرمي. بهذه الطريقة ، يتم تصنيف البيانات إلى ثلاث فئات متميزة ، مع كل فئة بمستوى معين من الأهمية.
يمكن استخدام معادلة الانحدار اللوجستي في العديد من الحالات ، مثل اكتشاف البريد العشوائي وتصنيف الورم وتصنيف الجنس وغير ذلك الكثير. دعنا نلقي نظرة على حالتين من أكثر الأمثلة شيوعًا لاستخدام معادلة الانحدار اللوجستي في التعلم الآلي لمساعدتك على الفهم بشكل أفضل.
مثال على استخدام حالات معادلة الانحدار اللوجستي
مثال 1: تحديد البريد الإلكتروني العشوائي
ضع في اعتبارك الفئة 1 إذا كان البريد الإلكتروني بريدًا عشوائيًا و 0 إذا لم يكن البريد الإلكتروني غير مرغوب فيه. لاكتشاف ذلك ، يتم تحليل سمات متعددة من نص البريد. وتشمل هذه:
- المرسل
- اخطاء املائية
- كلمات رئيسية في البريد الإلكتروني مثل "تفاصيل البنك" ، "محظوظ" ، "الفائز" ، "مبروك".
- تفاصيل الاتصال أو URL في البريد الإلكتروني
يمكن بعد ذلك إدخال هذه البيانات المستخرجة في معادلة الانحدار اللوجستي للتعلم الآلي والتي ستحلل جميع المدخلات وتقدم درجة بين 0 و 1. إذا كانت النتيجة أكبر من 0 ولكن أقل من 0.5 ، فسيتم تصنيف البريد الإلكتروني على أنه بريد عشوائي ، و إذا كانت النتيجة بين 0.5 إلى 1 ، يتم وضع علامة على البريد على أنه ليس بريدًا عشوائيًا.
مثال 2: تحديد الاحتيال على بطاقة الائتمان
باستخدام معادلات الانحدار اللوجستي أو نماذج التعلم الآلي القائمة على الانحدار اللوجستي ، يمكن للبنوك تحديد معاملات بطاقات الائتمان الاحتيالية على الفور. لهذا الغرض ، يتم إدخال تفاصيل مثل نقاط البيع ، ورقم البطاقة ، وقيمة المعاملة ، وبيانات المعاملة ، وما شابه ذلك في نموذج الانحدار اللوجستي ، الذي يقرر ما إذا كانت معاملة معينة أصلية (0) أو احتيالية (1). على سبيل المثال ، إذا كانت قيمة الشراء مرتفعة للغاية وتنحرف عن القيم النموذجية ، فإن نموذج الانحدار يخصص قيمة (بين 0.5 و 1) تصنف المعاملة على أنها احتيال.
عمل الانحدار اللوجستي في التعلم الآلي
يعمل الانحدار اللوجستي باستخدام الدالة Sigmoid لتعيين التنبؤات إلى احتمالات الإخراج. هذه الوظيفة عبارة عن منحنى على شكل حرف S يرسم القيم المتوقعة بين 0 و 1. ثم يتم رسم القيم باتجاه الهوامش في أعلى وأسفل المحور Y ، باستخدام 0 و 1 كعناوين. بعد ذلك ، بناءً على هذه القيم ، يمكن تصنيف المتغيرات المستقلة.
إليك كيف تبدو وظيفة السيني:
تعتمد الدالة السينية على المعادلة التالية:
ص = 1 / (1 + ه ^ س)
حيث e ^ x = الثابت الأسي بقيمة 2.718.
توفر معادلة الدالة السينية أعلاه القيمة المتوقعة (y) على أنها صفر إذا كانت x تعتبر سالبة. إذا كانت x عددًا موجبًا كبيرًا ، فإن القيمة المتوقعة تكون قريبة من واحد.
بناء نموذج الانحدار اللوجستي في بايثون
دعنا نتعرف على عملية بناء نموذج الانحدار اللوجستي في بايثون. لذلك ، دعنا نستخدم مجموعة بيانات الشبكة الاجتماعية لإجراء تحليل الانحدار ، ودعنا نحاول التنبؤ بما إذا كان الفرد سيشتري سيارة معينة أم لا. إليك كيف تبدو الخطوات.
الخطوة 1: استيراد المكتبات ومجموعة البيانات
يبدأ باستيراد المكتبات اللازمة لبناء النموذج. وهذا يشمل Pandas و Numpy و Matplotlib. نحتاج أيضًا إلى استيراد مجموعة البيانات التي سنعمل معها. هذا ما يبدو عليه الرمز:
استيراد numpy كـ np
استيراد matplotlib.pyplot كـ pt
استيراد الباندا كما pd
مجموعة البيانات = pd.read_csv ('Social_Network.csv')
الخطوة الثانية: التقسيم إلى متغيرات مستقلة ومستقلة
حان الوقت الآن لتقسيم البيانات التي تم إدخالها إلى متغيرات تابعة ومستقلة. في هذا المثال ، سننظر في قيمة الشراء على أنها المتغير التابع خلال الراتب التقديري وعمر الأفراد كمتغيرات مستقلة.
x = dataset.iloc [:، [2،3]]. قيم
y = dataset.iloc [:، 4] .values
الخطوة 3: تقسيم مجموعة البيانات إلى مجموعة تدريب ومجموعة اختبار
من الضروري تقسيم مجموعة البيانات إلى مجموعات تدريب واختبار محددة. ستقوم مجموعة التدريب بتدريب معادلة الانحدار اللوجستي ، بينما سيتم استخدام بيانات الاختبار للتحقق من تدريب النموذج واختباره. يستخدم Sklearn لتقسيم مجموعة البيانات المحددة إلى مجموعتين. نستخدم train_split_function من خلال تحديد كمية البيانات التي نرغب في وضعها جانبًا للتدريب والاختبار.
من sklearn.model_selection استيراد train_test_split
x_train ، x_test ، y_train ، y_test = train_test_split (x ، y ، test_size = 0.33 ، random_state = 0)
كما ترى ، حددنا حجم الاختبار على أنه 33٪ من مجموعة البيانات الكاملة. لذلك ، سيتم استخدام الـ 66٪ المتبقية كبيانات تدريبية.
الخطوة 4: التحجيم
لتحسين دقة نموذج الانحدار اللوجستي الخاص بك ، ستحتاج إلى إعادة قياس البيانات وإحضار القيم التي قد تكون شديدة التباين في طبيعتها.
من sklearn.preprocessing استيراد StandardScaler
sc_X = StandardScaler ()
X_train = sc_X.fit_transform (X_train)
X_test = sc_X.transform (X_test)
الخطوة الخامسة: بناء نموذج الانحدار اللوجستي
بمجرد القيام بذلك ، تحتاج إلى بناء نموذج الانحدار اللوجستي وتناسبه مع مجموعة التدريب. ابدأ باستيراد خوارزمية الانحدار اللوجستي من Sklearn.
من sklearn.linear_model استيراد LogisticRegression
بعد ذلك ، قم بإنشاء مصنف مثيل لملاءمة بيانات التدريب.
المصنف = LogisticRegression (random_state = 0)
classifier.fit (x_train، y_train)
بعد ذلك ، أنشئ تنبؤات على مجموعة بيانات الاختبار.
y_pred = classifier.predict (x_test)
أخيرًا ، تحقق من أداء نموذج الانحدار اللوجستي الخاص بك باستخدام مصفوفة الارتباك.
من sklearn.metrics استيراد confusion_matrix
سم = confusion_matrix (y_test ، y_pred)
acc = resolution_score (y_test، y_pred)
طباعة (acc)
طباعة (سم)
الآن ، يمكنك استخدام Matplotlib لتصور مجموعة البيانات بأكملها ، بما في ذلك مجموعات التدريب والاختبار!
ختاما
يعد الانحدار اللوجستي أحد الأدوات التي تساعد في تطوير نماذج التعلم الآلي والخوارزميات. وبالمثل ، هناك العديد من الخوارزميات الأخرى أيضًا ، والتي يتم استخدامها اعتمادًا على حالة الاستخدام في متناول اليد. ومع ذلك ، لمعرفة الخوارزمية التي يجب استخدامها ، يجب أن تكون على دراية بجميع الخيارات الممكنة. عندها فقط ستكون في وضع يسمح لك بتحديد الخوارزمية الأكثر ملاءمة لمجموعة البيانات الخاصة بك.
تحقق من برنامج PG التنفيذي الخاص بنا في التعلم الآلي المصمم بطريقة تأخذك من نقطة الصفر وتساعدك على بناء مهاراتك إلى القمة - بحيث تكون في وضع يسمح لك بحل أي مشكلة في التعلم الآلي في العالم الحقيقي. تحقق من الدورات التدريبية المختلفة والتسجيل في الدورة التي تشعر أنها مناسبة لك. انضم إلى upGrad واختبر بيئة تعليمية شاملة ودعم التوظيف!
يتكون الانحدار اللوجستي بشكل عام من ثلاثة أنواع: الانحدار اللوجستي هو أحد أساليب التعلم الخاضعة للإشراف المستخدمة لإيجاد وبناء أفضل علاقة ملائمة بين المتغيرات التابعة والمستقلة لعمل تنبؤات مستقبلية مناسبة. يستخدم الانحدار اللوجستي للتعلم الآلي الوظيفة السينية للعثور على أفضل منحنى ملائم.كم عدد أنواع الانحدار اللوجستي الممكنة للتعلم الآلي؟
1. ثنائي
2. متعدد الحدود
3. ترتيبي. ما هو الانحدار اللوجستي المستخدم في التعلم الآلي؟
ما هي الوظيفة التي يستخدمها الانحدار اللوجستي للتعلم الآلي؟