15 فكرة مثيرة للاهتمام لمشروع تعلم الآلة للمبتدئين [2022]

نشرت: 2021-01-10

جدول المحتويات

أفكار مشروع التعلم الآلي

مع استمرار تقدم الذكاء الاصطناعي (AI) بسرعة في عام 2022 ، أصبح تحقيق التمكن من التعلم الآلي (ML) مهمًا بشكل متزايد لجميع اللاعبين في هذا المجال. هذا لأن كل من الذكاء الاصطناعي والتعلم الآلي يكملان بعضهما البعض. لذلك ، إذا كنت مبتدئًا ، فإن أفضل ما يمكنك فعله هو العمل في بعض مشاريع التعلم الآلي.

نحن ، هنا في upGrad ، نؤمن بالمنهج العملي لأن المعرفة النظرية وحدها لن تساعد في بيئة العمل في الوقت الفعلي. في هذه المقالة ، سنستكشف بعض مشاريع التعلم الآلي المثيرة للاهتمام والتي يمكن للمبتدئين العمل عليها لوضع معارفهم في التعلم الآلي قيد الاختبار. في هذه المقالة ، ستجد 15 فكرة من أفضل مشاريع التعلم الآلي للمبتدئين للحصول على خبرة عملية.

لكن أولاً ، دعنا نتناول السؤال الأكثر صلة بالموضوع الذي يجب أن يكمن في ذهنك: لماذا نبني مشاريع التعلم الآلي؟

عندما يتعلق الأمر بالمهن في مجال تطوير البرمجيات ، فمن الضروري للمطورين الطموحين العمل في مشاريعهم الخاصة. يعد تطوير مشاريع العالم الحقيقي هو أفضل طريقة لصقل مهاراتك وتجسيد معرفتك النظرية في تجربة عملية. كلما جربت مشاريع مختلفة للتعلم الآلي ، زادت المعرفة التي تكتسبها.

بينما ستمنحك الكتب المدرسية والمواد الدراسية كل المعرفة التي تحتاج لمعرفتها حول التعلم الآلي ، لا يمكنك أبدًا إتقان تعلم الآلة ما لم تستثمر وقتك في التجارب العملية الواقعية - مشروعات حول التعلم الآلي. عندما تبدأ في العمل على أفكار مشاريع التعلم الآلي ، لن تكون قادرًا على اختبار نقاط قوتك وضعفك فحسب ، بل ستكتسب أيضًا اكتشافًا يمكن أن يكون مفيدًا للغاية في تعزيز حياتك المهنية. في هذا البرنامج التعليمي ، ستجد 15 فكرة مثيرة للاهتمام لمشروع التعلم الآلي للمبتدئين للحصول على خبرة عملية في التعلم الآلي.

تعلم دورات التعلم الآلي عبر الإنترنت من أفضل الجامعات في العالم. احصل على درجة الماجستير أو برنامج PGP التنفيذي أو برامج الشهادات المتقدمة لتسريع مسار حياتك المهنية.

إذن ، إليك بعض مشاريع التعلم الآلي التي يمكن للمبتدئين العمل عليها:

فيما يلي بعض الأفكار الرائعة لمشروع التعلم الآلي للمبتدئين

شاهد الفيديو الخاص بنا حول أفكار ومواضيع مشروعات التعلم الآلي ...

قائمة أفكار مشاريع التعلم الآلي للطلاب مناسبة للمبتدئين ، وأولئك الذين بدأوا للتو في التعلم الآلي أو علوم البيانات بشكل عام. ستساعدك أفكار مشروع التعلم الآلي هذه على المضي قدمًا في جميع الجوانب العملية التي تحتاجها للنجاح في حياتك المهنية كمحترف في التعلم الآلي.

علاوة على ذلك ، إذا كنت تبحث عن أفكار مشروع التعلم الآلي للعام الأخير ، فيجب أن تساعدك هذه القائمة على المضي قدمًا. لذلك ، دون مزيد من اللغط ، دعنا ننتقل مباشرة إلى بعض أفكار مشاريع التعلم الآلي التي ستقوي قاعدتك وتسمح لك بتسلق السلم.

1. توقع أسعار الأسهم

من أفضل الأفكار لبدء تجربة مشاريع التعلم الآلي العملية للطلاب هي العمل على توقع أسعار الأسهم. تبحث منظمات الأعمال والشركات اليوم عن برامج يمكنها مراقبة وتحليل أداء الشركة والتنبؤ بالأسعار المستقبلية للأسهم المختلفة. ومع وجود الكثير من البيانات المتاحة في سوق الأوراق المالية ، فهي تمثل مرتعًا للفرص لعلماء البيانات الذين لديهم ميل للتمويل.

مخزون أفكار مشروع التعلم الآلي

ومع ذلك ، قبل أن تبدأ ، يجب أن يكون لديك حصة عادلة من المعرفة في المجالات التالية:

  • التحليل التنبئي: الاستفادة من تقنيات الذكاء الاصطناعي المختلفة لعمليات البيانات المختلفة مثل التنقيب عن البيانات واستكشاف البيانات وما إلى ذلك من أجل "التنبؤ" بسلوك النتائج المحتملة.
  • تحليل الانحدار: التحليل الانحداري هو نوع من الأساليب التنبؤية التي تعتمد على التفاعل بين متغير / متغيرات مستقلة (هدف) ومستقل (متنبئ).
  • تحليل الإجراء: في هذه الطريقة ، يتم تحليل جميع الإجراءات التي نفذتها الطريقتان المذكورتان أعلاه ، وبعد ذلك يتم إدخال النتيجة في ذاكرة التعلم الآلي.
  • النمذجة الإحصائية: تتضمن بناء وصف رياضي لعملية في العالم الحقيقي وتوضيح أوجه عدم اليقين ، إن وجدت ، ضمن هذه العملية.
ما هو التعلم الآلي ولماذا هو مهم

2. المتنبئ الرياضي

في لعبة Moneyball الخاصة بـ Michael Lewis ، قام فريق أوكلاند لألعاب القوى بتحويل وجه لعبة البيسبول من خلال دمج تقنية استكشاف اللاعبين التحليلية في خطة لعبهم. ومثلهم تمامًا ، يمكنك أيضًا إحداث ثورة في الرياضة في العالم الحقيقي! هذا مشروع تعلم آلي ممتاز للمبتدئين.

نظرًا لعدم وجود ندرة في البيانات في عالم الرياضة ، يمكنك الاستفادة من هذه البيانات لبناء مشاريع ممتعة وإبداعية للتعلم الآلي مثل استخدام الإحصائيات الرياضية الجامعية للتنبؤ باللاعب الذي سيحظى بأفضل مهنة في أي رياضة معينة (استكشاف المواهب). يمكنك أيضًا اختيار تحسين إدارة الفريق من خلال تحليل نقاط القوة والضعف لدى اللاعبين في الفريق وتصنيفهم وفقًا لذلك.

مع مقدار الإحصائيات والبيانات الرياضية المتاحة ، يعد هذا ميدانًا ممتازًا لصقل مهارات استكشاف البيانات والتصور لديك. بالنسبة لأي شخص لديه موهبة في لغة Python ، سيكون Scikit-Learn هو الخيار المثالي لأنه يتضمن مجموعة من الأدوات المفيدة لتحليل الانحدار والتصنيفات واستيعاب البيانات وما إلى ذلك. يمكن أن يساعد ذكر مشاريع التعلم الآلي للعام الأخير في أن تبدو سيرتك الذاتية أكثر إثارة من غيرها.

6 مرات أذهل الذكاء الاصطناعي العالم

3. تطوير محلل المشاعر

هذه واحدة من أفكار مشاريع التعلم الآلي المثيرة للاهتمام. على الرغم من أن معظمنا يستخدم منصات التواصل الاجتماعي للتعبير عن مشاعرنا الشخصية وآرائنا ليراها العالم ، يكمن أحد أكبر التحديات في فهم "المشاعر" الكامنة وراء منشورات وسائل التواصل الاجتماعي.

أفكار مشروع التعلم الآلي - تحليل المشاعر

وهذه هي الفكرة المثالية لمشروعك التالي للتعلم الآلي!

تزدهر وسائل التواصل الاجتماعي بأطنان من المحتوى الذي ينشئه المستخدمون. من خلال إنشاء نظام ML يمكنه تحليل المشاعر الكامنة وراء النصوص أو المنشور ، سيصبح من السهل جدًا على المؤسسات فهم سلوك المستهلك. وهذا بدوره سيسمح لهم بتحسين خدمة العملاء ، وبالتالي توفير مجال لرضا المستهلك على النحو الأمثل.

يمكنك محاولة استخراج البيانات من Twitter أو Reddit لتبدأ بمشروع تحليل مشاعرك للتعلم الآلي. قد تكون هذه واحدة من تلك الحالات النادرة لمشاريع التعلم العميق التي يمكن أن تساعدك في جوانب أخرى أيضًا.

4. تعزيز الرعاية الصحية

بدأت تطبيقات الذكاء الاصطناعي والتعلم الآلي بالفعل في اختراق صناعة الرعاية الصحية وتعمل أيضًا على إحداث تحول سريع في وجه الرعاية الصحية العالمية. أجهزة الرعاية الصحية القابلة للارتداء ، والمراقبة عن بعد ، والتطبيب عن بعد ، والجراحة الروبوتية ، وما إلى ذلك ، كلها ممكنة بسبب خوارزميات التعلم الآلي المدعومة بالذكاء الاصطناعي. إنهم لا يساعدون فقط مقدمي الرعاية الصحية (مقدمي الرعاية الصحية) على تقديم خدمات رعاية صحية سريعة وأفضل ، ولكنهم أيضًا يقللون من التبعية وعبء العمل على الأطباء إلى حد كبير.

أفكار مشروع التعلم الآلي للرعاية الصحية

فلماذا لا تستخدم مهاراتك لتطوير مشروع تعلم آلي مثير للإعجاب يعتمد على الرعاية الصحية؟ للتعامل مع مشروع مع خوارزميات التعلم الآلي للمبتدئين يمكن أن يكون مفيدًا لبناء حياتك المهنية ببداية جيدة.

تمتلك صناعة الرعاية الصحية كميات هائلة من البيانات تحت تصرفها. بتسخير هذه البيانات ، يمكنك إنشاء:

  • أنظمة الرعاية التشخيصية التي يمكنها مسح الصور والأشعة السينية وما إلى ذلك تلقائيًا ، وتقديم تشخيص دقيق للأمراض المحتملة.
  • تطبيقات الرعاية الوقائية التي يمكن أن تتنبأ بإمكانيات الأوبئة مثل الأنفلونزا والملاريا وما إلى ذلك ، على المستويين الوطني والمجتمعي.
تعمل تقنيات التعلم الآلي الست هذه على تحسين الرعاية الصحية

5. إعداد خوارزميات ML - من الصفر!

هذه واحدة من أفكار مشاريع التعلم الآلي الممتازة للمبتدئين. تقدم كتابة خوارزميات تعلم الآلة من الصفر مزايا ذات شقين:

  • أولًا ، كتابة خوارزميات تعلم الآلة هي أفضل طريقة لفهم التفاصيل الدقيقة لميكانيكاها.
  • ثانيًا ، سوف تتعلم كيفية تحويل التعليمات الرياضية إلى كود وظيفي. ستكون هذه المهارة مفيدة في حياتك المهنية المستقبلية في التعلم الآلي.

يمكنك البدء باختيار خوارزمية مباشرة وليست معقدة للغاية. وراء صنع كل خوارزمية - حتى أبسطها - هناك العديد من القرارات المحسوبة بعناية. بمجرد تحقيق مستوى معين من الإتقان في بناء خوارزميات تعلم بسيطة ، حاول تعديل وظائفها وتوسيعها. على سبيل المثال ، يمكنك أن تأخذ خوارزمية الانحدار اللوجستي الفانيليا وتضيف معلمات تنظيم إليها لتحويلها إلى خوارزمية انحدار لاسو / ريدج. يمكن أن يساعد ذكر مشاريع التعلم الآلي في أن تبدو سيرتك الذاتية أكثر إثارة من غيرها.

6. تطوير شبكة عصبية يمكنها قراءة خط اليد

أفكار مشروع التعلم الآلي الشبكة العصبية

واحدة من أفضل الأفكار لبدء تجربة مشاريع Java العملية للطلاب هي العمل على الشبكة العصبية. التعلم العميق والشبكات العصبية هما كلمتان طنانة تحدثان في الذكاء الاصطناعي. لقد أعطانا هذا أعاجيب تكنولوجية مثل السيارات ذاتية القيادة والتعرف على الصور وما إلى ذلك.
لذا ، حان الوقت الآن لاستكشاف ساحة الشبكات العصبية. ابدأ مشروع التعلم الآلي للشبكة العصبية مع تحدي تصنيف الأرقام المكتوبة بخط اليد MNIST. يحتوي على واجهة سهلة الاستخدام للغاية ومثالية للمبتدئين.

مهندسو التعلم الآلي: الخرافات مقابل الحقائق

7. نظام تسعير تذاكر الأفلام

مع التوسع في منصات OTT مثل Netflix و Amazon Prime ، يفضل الناس مشاهدة المحتوى حسب ما يناسبهم. أثرت عوامل مثل التسعير وجودة المحتوى والتسويق على نجاح هذه المنصات.

ارتفعت تكلفة صناعة فيلم كامل الطول بشكل كبير في الماضي القريب. 10٪ فقط من الأفلام تحقق أرباحًا. جعلت المنافسة الشديدة من منصات التليفزيون و OTT بالإضافة إلى ارتفاع تكلفة التذاكر من الصعب على الأفلام جني الأموال بشكل أكبر. ارتفاع تكلفة تذكرة المسرح (إلى جانب تكلفة الفشار) يترك قاعة السينما فارغة.

يمكن لنظام تسعير التذاكر المتقدم أن يساعد بالتأكيد صانعي الأفلام والمشاهدين. يمكن أن يكون سعر التذكرة أعلى مع ارتفاع الطلب على التذكرة والعكس صحيح. كلما قام المشاهد بحجز التذكرة في وقت مبكر ، قلت التكلفة لفيلم يرتفع الطلب عليه. يجب أن يحسب النظام السعر بذكاء اعتمادًا على مصلحة المشاهدين والإشارات الاجتماعية وعوامل العرض والطلب.

8. مشروع ML لتصنيف زهور السوسن

واحدة من أفضل الأفكار لبدء تجربة مشاريع التعلم الآلي العملية للطلاب هي العمل على مشروع ML لتصنيف Iris Flowers. تعد مجموعة بيانات زهور Iris واحدة من أفضل مجموعات البيانات لمهام التصنيف. نظرًا لأن أزهار السوسن من أنواع متنوعة ، فيمكن تمييزها بناءً على طول الكأس والبتلات. يهدف مشروع ML هذا إلى تصنيف الأزهار إلى بين الأنواع الثلاثة - Virginica أو Setosa أو Versicolor.

يشار إلى مشروع ML هذا عادةً باسم "Hello World" لتعلم الآلة. تحتوي مجموعة بيانات زهور القزحية على سمات رقمية ، وهي مثالية للمبتدئين للتعرف على خوارزميات ML الخاضعة للإشراف ، وبشكل أساسي كيفية تحميل البيانات ومعالجتها. أيضًا ، نظرًا لأن هذه مجموعة بيانات صغيرة ، يمكن وضعها بسهولة في الذاكرة دون الحاجة إلى تحويلات خاصة أو إمكانيات قياس. وهذه هي الفكرة المثالية لمشروعك التالي للتعلم الآلي!

يمكنك تنزيل مجموعة بيانات القزحية هنا .

9. BigMart Sales Prediction ML Project

هذه فكرة مشروع ML ممتازة للمبتدئين. يعتبر مشروع ML هذا هو الأفضل لتعلم كيفية عمل خوارزميات ML غير الخاضعة للإشراف. تتكون مجموعة بيانات مبيعات BigMart من بيانات مبيعات 2013 بدقة لـ 1559 منتجًا عبر عشرة منافذ بيع في مدن مختلفة.

الهدف هنا هو استخدام مجموعة بيانات مبيعات BigMart لتطوير نموذج انحدار يمكنه التنبؤ ببيع كل من 1559 منتجًا في العام المقبل في منافذ BigMart العشرة المختلفة. تحتوي مجموعة بيانات مبيعات BigMart على سمات محددة لكل منتج ومنفذ ، مما يساعدك على فهم خصائص المنتجات والمتاجر المختلفة التي تؤثر على المبيعات الإجمالية لـ BigMart كعلامة تجارية.

10. محركات التوصية مع مجموعة بيانات MovieLens

أصبحت محركات التوصية ذات شعبية كبيرة في التسوق عبر الإنترنت ومواقع البث المباشر. على سبيل المثال ، منصات دفق المحتوى عبر الإنترنت مثل Netflix و Hulu لديها محركات توصية لتخصيص محتواها وفقًا لتفضيلات العملاء الفردية وسجل التصفح. من خلال تخصيص المحتوى لتلبية احتياجات المشاهدة وتفضيلات العملاء المختلفين ، تمكنت هذه المواقع من زيادة الطلب على خدمات البث الخاصة بهم.

كمبتدئ ، يمكنك أن تجرب يدك في بناء نظام توصية باستخدام واحدة من مجموعات البيانات الأكثر شيوعًا المتوفرة على الويب - مجموعة بيانات MovieLens. تتضمن مجموعة البيانات هذه أكثر من "25 مليون تقييم ومليون تطبيق علامات مطبقة على 62000 فيلم بواسطة 162000 مستخدم." يمكنك بدء هذا المشروع من خلال إنشاء تصور سحابة عالمية لعناوين الأفلام لإنشاء محرك توصية أفلام لـ MovieLens.

يمكنك التحقق من مجموعة بيانات MovieLens هنا .

11. توقع جودة النبيذ باستخدام مجموعة بيانات جودة النبيذ

من الحقائق الراسخة أن العمر يجعل النبيذ أفضل - فكلما تقدم النبيذ ، كان مذاقه أفضل. ومع ذلك ، فإن العمر ليس الشيء الوحيد الذي يحدد طعم النبيذ. تحدد العديد من العوامل شهادة جودة النبيذ ، بما في ذلك الاختبارات الفيزيوكيميائية مثل كمية الكحول والحموضة الثابتة والحموضة المتطايرة والكثافة ومستوى الأس الهيدروجيني ، على سبيل المثال لا الحصر.

في مشروع ML هذا ، تحتاج إلى تطوير نموذج ML يمكنه استكشاف الخصائص الكيميائية للنبيذ للتنبؤ بجودته. تتكون مجموعة بيانات جودة النبيذ التي ستستخدمها لهذا المشروع من حوالي 4898 ملاحظة ، بما في ذلك 11 متغيرًا مستقلاً ومتغيرًا تابعًا واحدًا. يمكن أن يساعد ذكر مشاريع التعلم الآلي للعام الأخير في أن تبدو سيرتك الذاتية أكثر إثارة من غيرها.

12. تصنيف الأرقام المكتوبة بخط اليد MNIST

هذا هو أحد مشاريع التعلم الآلي المثيرة للاهتمام. لقد وجد التعلم العميق والشبكات العصبية حالات استخدام في العديد من تطبيقات العالم الحقيقي مثل التعرف على الصور وإنشاء النص التلقائي والسيارات بدون سائق وغير ذلك الكثير. ومع ذلك ، قبل الخوض في هذه المجالات المعقدة من التعلم العميق ، يجب أن تبدأ بمجموعة بيانات بسيطة مثل مجموعة بيانات MNIST. فلماذا لا تستخدم مهاراتك لتطوير مشروع تعلم آلي مثير للإعجاب يعتمد على MNIST؟

تم تصميم مشروع تصنيف الأرقام MNIST لتدريب الآلات على التعرف على الأرقام المكتوبة بخط اليد. نظرًا لأن المبتدئين عادةً ما يجدون صعوبة في العمل مع بيانات الصورة عبر البيانات العلائقية المسطحة ، فإن مجموعة بيانات MNIST هي الأفضل للمبتدئين. في هذا المشروع ، ستستخدم مجموعات بيانات MNIST لتدريب نموذج ML الخاص بك باستخدام الشبكات العصبية التلافيفية (CNNs). على الرغم من أن مجموعة بيانات MNIST يمكن أن تتلاءم بسلاسة مع ذاكرة الكمبيوتر (صغيرة جدًا) ، إلا أن مهمة التعرف على الأرقام المكتوبة بخط اليد تمثل تحديًا كبيرًا.

يمكنك الوصول إلى مجموعة بيانات MNIST هنا .

13. التعرف على النشاط البشري باستخدام مجموعة بيانات الهاتف الذكي

هذه إحدى أفكار مشاريع التعلم الآلي الشائعة. تتضمن مجموعة بيانات الهاتف الذكي سجل نشاط اللياقة ومعلومات عن 30 شخصًا. تم التقاط هذه البيانات من خلال هاتف ذكي مزود بأجهزة استشعار تعمل بالقصور الذاتي.

يهدف مشروع ML هذا إلى بناء نموذج تصنيف يمكنه تحديد أنشطة اللياقة البدنية البشرية بدرجة عالية من الدقة. من خلال العمل في مشروع ML هذا ، ستتعلم أساسيات التصنيف وأيضًا كيفية حل مشاكل التصنيف المتعدد.

14. كشف الكائن مع التعلم العميق

هذا أحد مشاريع التعلم الآلي المثيرة للاهتمام التي يجب إنشاؤها. عندما يتعلق الأمر بتصنيف الصور ، يجب أن تكون الشبكات العصبية العميقة (DNN) هي خيارك المفضل. بينما يتم استخدام DNNs بالفعل في العديد من تطبيقات تصنيف الصور في العالم الحقيقي ، يهدف مشروع ML هذا إلى رفعه إلى مستوى أعلى.

في مشروع ML هذا ، ستحل مشكلة اكتشاف الكائنات عن طريق الاستفادة من DNNs. سيتعين عليك تطوير نموذج يمكنه تصنيف الكائنات وأيضًا تحديد موقع الكائنات من الفئات المختلفة بدقة. هنا ، ستتعامل مع مهمة اكتشاف الكائن كمشكلة انحدار لأقنعة الصندوق المحيط بالكائن. أيضًا ، ستحدد إجراء استدلال متعدد المقاييس يمكنه إنشاء اكتشافات عالية الدقة للكائنات بأقل تكلفة.

15. كشف الأخبار الكاذبة

هذه واحدة من أفكار مشاريع التعلم الآلي الممتازة للمبتدئين ، خاصةً كيف تنتشر الأخبار المزيفة كالنار في الهشيم الآن. الأخبار الكاذبة لها موهبة في الانتشار كالنار في الهشيم. ومع سيطرة وسائل التواصل الاجتماعي على حياتنا في الوقت الحالي ، أصبح التمييز بين الأخبار المزيفة وأحداث الأخبار الحقيقية أكثر أهمية من أي وقت مضى. هذا هو المكان الذي يمكن أن يساعد فيه التعلم الآلي. يستخدم Facebook بالفعل الذكاء الاصطناعي لتصفية القصص المزيفة وغير المرغوب فيها من خلاصات المستخدمين.

يهدف مشروع ML هذا إلى الاستفادة من تقنيات NLP (معالجة اللغة الطبيعية) للكشف عن الأخبار المزيفة والقصص المضللة التي تظهر من مصادر غير حسنة السمعة. يمكنك أيضًا استخدام نهج تصنيف النص الكلاسيكي لتصميم نموذج يمكنه التفريق بين الأخبار الحقيقية والمزيفة. في الطريقة الأخيرة ، يمكنك جمع مجموعات البيانات لكل من الأخبار الحقيقية والمزيفة وإنشاء نموذج ML باستخدام مصنف Naive Bayes لتصنيف الخبر على أنه احتيالي أو حقيقي استنادًا إلى الكلمات والعبارات المستخدمة فيه.

16. تسجيل مشروع البريد الإلكتروني

تحتوي مجموعة بيانات البريد الإلكتروني لشركة Enron على ما يقرب من 500 ألف رسالة بريد إلكتروني لأكثر من 150 مستخدمًا. إنها مجموعة بيانات قيّمة للغاية لمعالجة اللغة الطبيعية. يتضمن هذا المشروع بناء نموذج ML يستخدم خوارزمية تجميع الوسائل k للكشف عن الإجراءات الاحتيالية. سيفصل النموذج الملاحظات إلى عدد "k" من المجموعات وفقًا لأنماط مماثلة في مجموعة البيانات.

17. مشروع باركنسون

تشتمل مجموعة بيانات باركنسون على 195 سجلًا طبيًا حيويًا لأشخاص لديهم 23 خاصية متنوعة. الفكرة من وراء هذا المشروع هي تصميم نموذج ML يمكنه التفريق بين الأشخاص الأصحاء وأولئك الذين يعانون من مرض باركنسون. يستخدم النموذج خوارزمية XGboost (تعزيز التدرج الشديد) بناءً على أشجار القرار لعمل الفصل.

18. مشروع Flickr 30K

تتكون مجموعة بيانات Flickr 30K من أكثر من 30000 صورة ، ولكل منها شرح فريد. ستستخدم مجموعة البيانات هذه لإنشاء منشئ تسمية توضيحية للصور. تكمن الفكرة في بناء نموذج CNN يمكنه تحليل الميزات واستخراجها بشكل فعال من الصورة وإنشاء تعليق مناسب يصف الصورة باللغة الإنجليزية.

19. مشروع مول العملاء

كما يوحي الاسم ، تتضمن مجموعة بيانات عملاء المركز التجاري سجلات الأشخاص الذين زاروا المركز التجاري ، مثل الجنس والعمر ورقم تعريف العميل والدخل السنوي ودرجة الإنفاق وما إلى ذلك. ستنشئ نموذجًا يستخدم هذه البيانات لتقسيم العملاء. في مجموعات مختلفة بناءً على أنماط سلوكهم. يعد تقسيم العملاء هذا أسلوبًا تسويقيًا مفيدًا للغاية تستخدمه العلامات التجارية والمسوقون لزيادة المبيعات والإيرادات مع زيادة رضا العملاء أيضًا.

20. مشروع الخواص الحركية

بالنسبة لهذا المشروع ، ستستخدم مجموعة بيانات شاملة تتضمن ثلاث مجموعات بيانات منفصلة - Kinetics 400 و Kinetics 600 و Kinetics 700 - تحتوي على روابط URL لأكثر من 6.5 مليون مقطع فيديو عالي الجودة. هدفك هو إنشاء نموذج يمكنه اكتشاف وتحديد تصرفات الإنسان من خلال دراسة سلسلة من الملاحظات المختلفة.

21- مشروع نظام التوصيات

هذه مجموعة بيانات غنية تحتوي على مجموعة متنوعة من مجموعات البيانات التي تم جمعها من مواقع الويب الشهيرة مثل مراجعات كتب Goodreads ومراجعات منتجات Amazon والوسائط الاجتماعية وما إلى ذلك. هدفك هو إنشاء محرك توصية (مثل تلك المستخدمة من قبل Amazon و Netflix) التي يمكنها إنشاء توصيات مخصصة للمنتجات والأفلام والموسيقى وما إلى ذلك ، بناءً على تفضيلات العملاء واحتياجاتهم وسلوكهم عبر الإنترنت.

22. مشروع بوسطن السكني

تتكون مجموعة بيانات الإسكان في بوسطن من تفاصيل المنازل المختلفة في بوسطن بناءً على عوامل مثل معدل الضريبة ومعدل الجريمة وعدد الغرف في المنزل وما إلى ذلك. إنها مجموعة بيانات ممتازة للتنبؤ بأسعار المنازل المختلفة في بوسطن. في هذا المشروع ، ستقوم ببناء نموذج يمكنه التنبؤ بسعر منزل جديد باستخدام الانحدار الخطي. الانحدار الخطي هو الأنسب لهذا المشروع لأنه يتم استخدامه عندما يكون للبيانات علاقة خطية بين قيم الإدخال والإخراج وعندما يكون الإدخال غير معروف.

23- مشروع مناظر المدينة

تتضمن مجموعة البيانات مفتوحة المصدر هذه تعليقات توضيحية عالية الجودة على مستوى البكسل لتسلسلات الفيديو التي تم جمعها من الشوارع عبر 50 مدينة مختلفة. إنه مفيد للغاية للتحليل الدلالي. يمكنك استخدام مجموعة البيانات هذه لتدريب الشبكات العصبية العميقة على تحليل وفهم مشهد المدينة الحضري. يتضمن المشروع تصميم نموذج يمكنه إجراء تجزئة للصور وتحديد كائنات مختلفة (سيارات ، حافلات ، شاحنات ، أشجار ، طرق ، أشخاص ، إلخ) من تسلسل فيديو في الشارع.

24. يوتيوب 8M المشروع

Youtube 8M عبارة عن مجموعة بيانات ضخمة تحتوي على 6.1 مليون معرف فيديو على YouTube ، و 350.000 ساعة من الفيديو ، و 2.6 مليار ميزة صوتية / مرئية ، و 3862 فئة ، ومتوسط ​​3 تسميات لكل مقطع فيديو. يستخدم على نطاق واسع لمشاريع تصنيف الفيديو. في هذا المشروع ، ستنشئ نظام تصنيف للفيديو يمكنه وصف مقطع فيديو بدقة. سينظر في سلسلة من المدخلات المختلفة ويصنف مقاطع الفيديو إلى فئات منفصلة.

25. Urban sound 8K

تُستخدم مجموعة بيانات الصوت الحضري 8K لتصنيف الصوت. يتضمن مجموعة متنوعة من 8732 صوتًا حضريًا تنتمي إلى فئات مختلفة مثل صفارات الإنذار ، وموسيقى الشوارع ، ونباح الكلاب ، ونقيق الطيور ، والناس يتحدثون ، وما إلى ذلك. ستصمم نموذجًا لتصنيف الصوت يمكنه تلقائيًا اكتشاف الصوت الحضري الذي يتم تشغيله في

26. مشروع IMDB-Wiki

من المحتمل أن تكون مجموعة البيانات المصنفة هذه واحدة من أكثر مجموعات صور الوجه شمولاً التي تم جمعها من جميع أنحاء IMDB و Wikipedia. يحتوي على أكثر من 5 ملايين صورة وجه مصنفة حسب العمر والجنس. مع تصنيف الجنس والعمر. ستنشئ نموذجًا يمكنه اكتشاف الوجوه والتنبؤ بعمرها وجنسها بدقة. يمكنك إنشاء شرائح / نطاقات عمرية مختلفة مثل 0-10 ، و10-20 ، و30-40 ، وما إلى ذلك.

27. مشروع Librispeech

مجموعة بيانات librispeech عبارة عن مجموعة ضخمة من الخطب الإنجليزية المستمدة من مشروع LibriVox. يحتوي على خطب تقرأ باللغة الإنجليزية بلهجات مختلفة تمتد لأكثر من 1000 ساعة وهي أداة مثالية للتعرف على الكلام. ينصب تركيز هذا المشروع على إنشاء نموذج يمكنه تلقائيًا ترجمة الصوت إلى نص. ستنشئ نظامًا للتعرف على الكلام يمكنه اكتشاف الكلام باللغة الإنجليزية وترجمته إلى تنسيق نصي.

28. مشروع المعيار الألماني للتعرف على إشارات المرور (GTSRB)

تحتوي مجموعة البيانات هذه على أكثر من 50000 صورة لإشارات المرور مقسمة إلى 43 فئة وتحتوي على معلومات حول المربع المحيط لكل علامة مرور. إنه مثالي لتصنيف متعدد الطبقات وهو بالضبط ما ستركز عليه هنا. ستقوم ببناء نموذج باستخدام إطار عمل تعليمي عميق يمكنه التعرف على المربع المحيط للإشارات وتصنيف إشارات المرور. يمكن أن يكون المشروع مفيدًا للغاية للمركبات ذاتية القيادة لأنه يكتشف العلامات ويساعد السائقين في اتخاذ الإجراءات اللازمة.

29. الرياضة مباراة تلخيص نص الفيديو

هذا المشروع هو بالضبط كما يبدو - الحصول على ملخص دقيق وموجز لفيديو رياضي. إنها أداة مفيدة للمواقع الرياضية التي تُطلع القراء على أهم المباريات. نظرًا لأن الشبكات العصبية هي الأفضل لتلخيص النص ، فسوف تقوم ببناء هذا النموذج باستخدام شبكات التعلم العميق مثل 3D-CNNs و RNNs و LSTM s. ستقوم أولاً بتجزئة مقطع فيديو رياضي إلى أقسام متعددة باستخدام خوارزميات ML المناسبة ثم استخدام مجموعة من SVM (آلات ناقلات الدعم) والشبكات العصبية وخوارزمية k-mean.

30. مولد ملخص اجتماعات العمل

يتضمن التلخيص استخراج أكثر أجزاء المعلومات أهمية وقيمة من المحادثات وملفات الصوت / الفيديو وما إلى ذلك ، بإيجاز ودقة. يتم ذلك عمومًا من خلال ميزة التقاط السمات الإحصائية واللغوية والعاطفية مع بنية الحوار للمحادثة المعنية. في هذا المشروع ، ستستخدم تقنيات التعلم العميق ومعالجة اللغة الطبيعية لإنشاء ملخصات دقيقة لاجتماعات العمل مع الحفاظ على سياق المحادثة بأكملها.

31. تحليل المشاعر للاكتئاب

الاكتئاب هو مصدر قلق صحي كبير على مستوى العالم. في كل عام ، ينتحر ملايين الأشخاص بسبب الاكتئاب وضعف الصحة العقلية. عادةً ما تكون وصمة العار المرتبطة بمشاكل الصحة العقلية وتأخر العلاج هما السببان الرئيسيان وراء ذلك. في هذا المشروع ، ستستفيد من البيانات التي تم جمعها من منصات وسائط اجتماعية مختلفة وتحلل العلامات اللغوية في منشورات وسائل التواصل الاجتماعي لفهم الصحة العقلية للأفراد. تكمن الفكرة في إنشاء نموذج تعليمي عميق يمكنه تقديم رؤى قيمة ودقيقة للصحة العقلية للفرد في وقت أبكر بكثير من الطرق التقليدية.

32. حل المعادلات المكتوبة بخط اليد

يعد التعرف على التعبيرات الرياضية المكتوبة بخط اليد مجالًا حاسمًا للدراسة في أبحاث رؤية الكمبيوتر. ستقوم ببناء نموذج وتدريبه على حل المعادلات الرياضية المكتوبة بخط اليد باستخدام الشبكات العصبية التلافيفية. سيستفيد النموذج أيضًا من تقنيات معالجة الصور. يتضمن هذا المشروع تدريب النموذج بالبيانات الصحيحة لجعله بارعًا في قراءة الأرقام المكتوبة بخط اليد ، والرموز ، وما إلى ذلك ، لتقديم نتائج صحيحة للمعادلات الرياضية ذات مستويات التعقيد المختلفة.

33. التعرف على الوجه لاكتشاف الحالة المزاجية والتوصية بالأغاني

من المعروف أن الناس يستمعون إلى الموسيقى بناءً على مزاجهم الحالي ومشاعرهم. فلماذا لا تنشئ تطبيقًا يمكنه اكتشاف الحالة المزاجية لأي شخص من خلال تعابير وجهه والتوصية بالأغاني وفقًا لذلك؟ لهذا ، ستستخدم عناصر وتقنيات رؤية الكمبيوتر. الهدف هو إنشاء نموذج يمكنه الاستفادة بشكل فعال من رؤية الكمبيوتر لمساعدة أجهزة الكمبيوتر على اكتساب فهم عالي المستوى للصور ومقاطع الفيديو.

34. مولد الموسيقى

إن التركيب الموسيقي ليس سوى مزيج رخيم من مستويات تردد مختلفة. في هذا المشروع ، ستقوم بتصميم مولد موسيقى آلي يمكنه تأليف مقطوعات موسيقية قصيرة بأقل تدخل بشري. ستستخدم خوارزميات التعلم العميق وشبكات LTSM لبناء مولد الموسيقى هذا.

35- نظام التنبؤ بالأمراض

تم تصميم مشروع ML هذا للتنبؤ بالأمراض. ستقوم بإنشاء هذا النموذج باستخدام R and R Studio ومجموعة بيانات Breast Cancer Wisconsin (التشخيصية) . تتضمن مجموعة البيانات هذه فئتين للتنبؤ - كتلة الثدي الحميدة والخبيثة. من الضروري أن يكون لديك معرفة أساسية بالغابات العشوائية و XGBoost للعمل في هذا المشروع.

36. إيجاد كوكب خارجي صالح للسكنى

في العقد الماضي ، نجحنا في تحديد العديد من الكواكب العابرة والخارجية. نظرًا لأن التفسير اليدوي للكواكب الخارجية المحتملة يمثل تحديًا كبيرًا ويستغرق وقتًا طويلاً (لا ننسى أنه عرضة أيضًا للخطأ البشري) ، فمن الأفضل استخدام التعلم العميق لتحديد الكواكب الخارجية. يهدف هذا المشروع إلى معرفة ما إذا كان هناك أي كواكب خارجية صالحة للسكن من حولنا باستخدام شبكات CNN وبيانات السلاسل الزمنية الصاخبة. يمكن لهذه الطريقة تحديد الكواكب الخارجية الصالحة للحياة بدقة أكبر من طريقة المربعات الصغرى.

37. تجديد الصور للبكرات القديمة والتالفة

تعد استعادة بكرات الصور القديمة أو التالفة مهمة صعبة. يكاد يكون من المستحيل دائمًا استعادة الصور القديمة إلى حالتها الأصلية. ومع ذلك ، يمكن للتعلم العميق حل هذه المشكلة. ستنشئ نموذجًا تعليميًا عميقًا يمكنه تحديد العيوب في الصورة (التجويفات ، والثقوب ، والطيات ، وإزالة اللون ، وما إلى ذلك) واستخدام خوارزميات Inpainting لاستعادتها. يمكنك حتى تلوين صور B&W القديمة.

مشاريع الصناعة في العالم الحقيقي

أرجواني

يركز مشروع البحث هذا على استكشاف تطبيقات التعلم الآلي في عملية إنشاء الفن والموسيقى. ستقوم بتطوير التعلم المعزز الفريد وخوارزميات التعلم العميق التي يمكنها إنشاء الصور والأغاني والموسيقى وغير ذلك الكثير. إنه المشروع المثالي للعقول المبدعة المتحمسة للفن والموسيقى.

BluEx

تعد BluEx من بين الشركات اللوجستية الرائدة في الهند التي طورت قاعدة جماهيرية كبيرة ، وذلك بفضل عمليات التسليم الفعالة في الوقت المناسب. ومع ذلك ، كما هو الحال مع جميع مزودي الخدمات اللوجستية ، تواجه BluEx تحديًا خاصًا واحدًا يكلف الوقت والمال - لا يتردد سائقوها في مسارات التسليم المثلى مما يتسبب في حدوث تأخيرات ويؤدي إلى ارتفاع تكاليف الوقود. ستقوم بإنشاء نموذج ML باستخدام التعلم المعزز الذي يمكنه العثور على المسار الأكثر كفاءة لموقع تسليم معين. يمكن أن يوفر هذا ما يصل إلى 15٪ من تكلفة الوقود لـ BluEx.

استوديوهات موشن

تفتخر Motion Studios بأنها أكبر شركة إنتاج إذاعية في أوروبا بإيرادات تتجاوز مليار دولار. منذ أن أطلقت الشركة الإعلامية برنامجها الواقعي RJ Star ، تلقوا استجابة هائلة وغمرتهم المقاطع الصوتية. كونه برنامجًا واقعيًا ، هناك نافذة زمنية محدودة لاختيار المرشحين. ستنشئ نموذجًا يمكنه التفريق بين أصوات الذكور والإناث وتصنيف المقاطع الصوتية لتسهيل عملية التصفية بشكل أسرع. سيساعد هذا في تحديد أسرع ، وتسهيل مهمة المديرين التنفيذيين للعرض.

ليثيوم

تصنع ليثيون باور بطاريات للسيارات الكهربائية. عادة ، يقوم السائقون باستئجار بطاريات الشركة لمدة يوم واستبدالها ببطارية مشحونة. يعتمد عمر البطارية على عوامل مثل المسافة المقطوعة / اليوم ، السرعة الزائدة ، إلخ. تستخدم LithionPower نموذج تسعير متغير بناءً على سجل قيادة السائق. الهدف من هذا المشروع هو بناء نموذج مجمع يقوم بتجميع السائقين وفقًا لتاريخ قيادتهم وتحفيز السائقين بناءً على تلك المجموعات. في حين أن هذا سيزيد من الأرباح بنسبة 15-20٪ ، إلا أنه سيكلف أيضًا المزيد من السائقين الذين لديهم تاريخ قيادة سيئ.

خاتمة

فيما يلي قائمة شاملة بأفكار مشاريع التعلم الآلي . لا يزال التعلم الآلي في مراحله المبكرة في جميع أنحاء العالم. هناك الكثير من المشاريع التي يتعين القيام بها ، والكثير من المطلوب تحسينه. مع العقول الذكية والأفكار الحادة ، تصبح الأنظمة التي تدعم الأعمال التجارية أفضل وأسرع ومربحة. إذا كنت ترغب في التفوق في التعلم الآلي ، فيجب أن تجمع الخبرة العملية في مشاريع التعلم الآلي هذه.

يمكنك أيضًا التحقق من برنامج PG التنفيذي في التعلم الآلي والذكاء الاصطناعي من IIT Delhi . IIT دلهي هي واحدة من أكثر المؤسسات المرموقة في الهند. مع أكثر من 500 عضو من أعضاء هيئة التدريس الداخليين وهم الأفضل في الموضوعات.

فقط من خلال العمل مع أدوات ML وخوارزميات ML يمكنك فهم كيفية عمل البنى التحتية ML في الواقع. انطلق الآن واختبر كل المعارف التي جمعتها من خلال دليل أفكار مشروع التعلم الآلي لبناء مشاريع التعلم الآلي الخاصة بك!

ما مدى سهولة تنفيذ هذه المشاريع؟

هذه المشاريع أساسية للغاية ، يمكن لأي شخص لديه معرفة جيدة بالتعلم الآلي أن يدير بسهولة اختيار وإنهاء أي من هذه المشاريع.

هل يمكنني القيام بهذه المشاريع في ML Internship؟

نعم ، كما ذكرنا سابقًا ، أفكار المشروع هذه مخصصة للطلاب أو المبتدئين بشكل أساسي. هناك احتمال كبير أن تعمل على أي من أفكار المشاريع هذه أثناء فترة التدريب.

لماذا نحتاج إلى بناء مشاريع التعلم الآلي؟

عندما يتعلق الأمر بالمهن في مجال تطوير البرمجيات ، فمن الضروري للمطورين الطموحين العمل في مشاريعهم الخاصة. يعد تطوير مشاريع العالم الحقيقي هو أفضل طريقة لصقل مهاراتك وتجسيد معرفتك النظرية في تجربة عملية.