โครงการ ML แบบเรียลไทม์ 10 อันดับแรกสำหรับนักเรียนและผู้เชี่ยวชาญ

เผยแพร่แล้ว: 2021-12-12

ในประเด็นที่เกี่ยวกับเทคโนโลยี การมีความรู้เชิงทฤษฎีจากหนังสือเรียนเท่านั้นจะทำให้คุณไปได้ไกล เฉพาะเมื่อคุณใช้แนวทางปฏิบัติเท่านั้นที่คุณจะสามารถเชี่ยวชาญด้านเทคโนโลยีหรือทักษะที่เกี่ยวข้องได้ และอะไรจะดีไปกว่าการทำโปรเจ็กต์แบบเรียลไทม์

เช่นเดียวกับสาขาการเรียนรู้ของเครื่อง (ML) และปัญญาประดิษฐ์ (AI) โปรเจ็กต์แมชชีนเลิร์นนิงช่วยให้คุณเรียนรู้การปฏิบัติจริงทั้งหมดที่คุณต้องการเพื่อรับประสบการณ์สภาพแวดล้อมการทำงานแบบเรียลไทม์และทำให้คุณมีงานทำในอุตสาหกรรม ยิ่งไปกว่านั้น ขนาดตลาดปัญญาประดิษฐ์ทั่วโลกในปัจจุบันและที่คาดการณ์ไว้ ทำให้ผู้เล่นในสาขานี้มีเหตุผลเท่านั้นที่จะบรรลุความเชี่ยวชาญด้านการเรียนรู้ด้วยเครื่อง ดังนั้น โดยไม่ต้องกังวลใจอีกต่อไป เราขอนำเสนอโครงการการเรียนรู้เชิงลึก 10 อันดับแรกและแนวคิดโครงการการเรียนรู้ของเครื่องสำหรับผู้เริ่มต้นและมืออาชีพที่ต้องการทำให้ประวัติย่อของพวกเขาโดดเด่น

สารบัญ

แนวคิดโครงงานแมชชีนเลิร์นนิงสำหรับนักเรียนและผู้เชี่ยวชาญ

ด้านล่างนี้คือรายการแนวคิดของโครงงานแมชชีนเลิร์นนิงที่น่าสนใจสำหรับนักเรียนและมืออาชีพในการสัมผัสการเรียนรู้ของเครื่องโดยตรง

1. การจำแนกตัวเลข MNIST

การจำแนกตัวเลข MNIST เป็นหนึ่งในโครงการการเรียนรู้เชิงลึกที่น่าสนใจที่สุดสำหรับผู้เริ่มต้น การเรียนรู้เชิงลึกและโครงข่ายประสาทเทียมมีแอปพลิเคชันขั้นสูงในโลกแห่งความเป็นจริง เช่น การสร้างข้อความอัตโนมัติ การจดจำรูปภาพ รถยนต์ที่ขับด้วยตนเอง เป็นต้น แต่ก่อนที่คุณจะจัดการกับแอปพลิเคชันที่ซับซ้อนเหล่านั้น การทำงานกับชุดข้อมูล MNIST ถือเป็นการหยุดที่ดี โปรเจ็กต์นี้มีจุดมุ่งหมายเพื่อฝึกโมเดลการเรียนรู้ของเครื่องให้จดจำตัวเลขที่เขียนด้วยลายมือโดยใช้ชุดข้อมูล MNIST และโครงข่ายประสาทเทียม (CNN) โดยรวมแล้ว เป็นโครงการที่สมบูรณ์แบบสำหรับผู้ที่พบว่าการทำงานกับข้อมูลเชิงสัมพันธ์ผ่านข้อมูลภาพมีความท้าทายน้อยกว่า

2. การจำแนกดอกไอริส

โปรเจ็กต์การจำแนกดอกไอริสมักถูกมองว่าเป็น "สวัสดีโลก" ของโปรเจ็กต์แมชชีนเลิร์นนิง เป็นที่ที่ดีที่สุดสำหรับผู้เริ่มต้นในการเริ่มต้นเส้นทางการเรียนรู้ด้วยเครื่อง โปรเจ็กต์นี้ใช้ชุดข้อมูลดอกไอริส และมีเป้าหมายเพื่อจำแนกดอกไม้สีม่วงสวยออกเป็นสามสายพันธุ์ ได้แก่ versicolor, virginica และ setosa เราสามารถแยกความแตกต่างของสายพันธุ์ตามกลีบและกลีบเลี้ยงของพวกมัน ชุดข้อมูลมีแอตทริบิวต์ที่เป็นตัวเลขและต้องการให้ผู้เริ่มต้นเรียนรู้เกี่ยวกับอัลกอริธึมการเรียนรู้ของเครื่องภายใต้การดูแลและวิธีโหลดและจัดการข้อมูล ยิ่งไปกว่านั้น ชุดข้อมูลมีขนาดเล็กและพอดีกับหน่วยความจำได้อย่างง่ายดายโดยไม่ต้องมีการแปลงหรือปรับขนาดเพิ่มเติม

3. ระบบแนะนำเพลง

ในเว็บไซต์ช็อปปิ้งออนไลน์อย่าง Amazon ระบบจะแนะนำผลิตภัณฑ์ระหว่างการชำระเงิน ซึ่งลูกค้ามักจะซื้อจากการซื้อครั้งก่อนๆ ในทำนองเดียวกัน เว็บไซต์สตรีมภาพยนตร์/เพลง เช่น Netflix และ Spotify นั้นค่อนข้างดีในการแนะนำภาพยนตร์และเพลงที่ผู้ใช้บางรายอาจชอบ เมื่อใช้ชุดข้อมูลบริการสตรีมเพลง คุณสามารถสร้างระบบแนะนำส่วนบุคคลที่คล้ายกันในโปรเจ็กต์แมชชีนเลิร์นนิงของคุณ เป้าหมายคือเพื่อกำหนดว่าเพลงหรือศิลปินใหม่ใดที่ผู้ใช้อาจชอบโดยอิงจากตัวเลือกก่อนหน้านี้ และคาดการณ์โอกาสที่ผู้ใช้จะปรับเพลงซ้ำๆ ในช่วงเวลาที่กำหนด

4. ตัวทำนายราคาหุ้น

หากคุณสนใจด้านการเงิน ตัวทำนายราคาหุ้นเป็นหนึ่งในโครงการการเรียนรู้ของเครื่องที่ดีที่สุดที่คุณสามารถสำรวจได้ องค์กรธุรกิจและบริษัทที่ขับเคลื่อนด้วยข้อมูลส่วนใหญ่ในปัจจุบันมีความต้องการซอฟต์แวร์อย่างต่อเนื่อง ซึ่งสามารถตรวจสอบและวิเคราะห์ประสิทธิภาพของบริษัทและคาดการณ์ราคาหุ้นในอนาคตได้อย่างแม่นยำ ด้วยข้อมูลตลาดหุ้นจำนวนมหาศาลที่มีอยู่ การทำงานกับเครื่องมือทำนายราคาหุ้นจึงเป็นโอกาสที่น่าตื่นเต้นสำหรับนักวิทยาศาสตร์ด้านข้อมูลและผู้ที่ชื่นชอบการเรียนรู้ของเครื่อง อย่างไรก็ตาม การทำงานในโครงการนี้จะต้องใช้ความรู้ที่ถูกต้องเกี่ยวกับการวิเคราะห์เชิงคาดการณ์ การวิเคราะห์การดำเนินการ การวิเคราะห์การถดถอย และการสร้างแบบจำลองทางสถิติ

5. แก้สมการที่เขียนด้วยลายมือ

การทำให้โมเดลแมชชีนเลิร์นนิงของคุณจดจำตัวเลขที่เขียนด้วยลายมือเป็นเพียงจุดเริ่มต้นเท่านั้น ผู้ที่เอาชนะโครงการการจำแนกตัวเลข MNIST ระดับเริ่มต้นสามารถก้าวไปข้างหน้าและสร้างโครงการที่สามารถแก้สมการที่เขียนด้วยลายมือโดยใช้ CNN การจดจำสมการทางคณิตศาสตร์ที่เขียนด้วยลายมือเป็นหนึ่งในปัญหาที่ทำให้งงงวยที่สุดในด้านการวิจัยการมองเห็นด้วยคอมพิวเตอร์ อย่างไรก็ตาม ด้วยการผสมผสานระหว่าง CNN และเทคนิคการประมวลผลภาพบางอย่าง เป็นไปได้ที่จะฝึกนักแก้ปัญหาที่เท่ากันที่เขียนด้วยลายมือผ่านตัวเลขทางคณิตศาสตร์และสัญลักษณ์ที่เขียนด้วยลายมือ โปรเจ็กต์นี้เป็นขั้นตอนสู่การแปลงดิจิทัลขั้นตอนการแก้สมการทางคณิตศาสตร์ที่เขียนโดยใช้ปากกาและกระดาษ

6. การวิเคราะห์ความเชื่อมั่นตามโพสต์โซเชียลมีเดีย

แพลตฟอร์มโซเชียลมีเดียเช่น Facebook หรือ Instagram อาจเป็นเพียงสถานที่สำหรับแสดงความรู้สึกและความคิดเห็นส่วนตัวต่อผู้ใช้ทั่วไป อย่างไรก็ตาม สำหรับธุรกิจ ยังเป็นช่องทางในการศึกษาพฤติกรรมผู้บริโภค โซเชียลมีเดียเต็มไปด้วยเนื้อหาที่ผู้ใช้สร้างขึ้น การทำความเข้าใจความรู้สึกเบื้องหลังทุกข้อความหรือรูปภาพเป็นสิ่งสำคัญสำหรับองค์กรธุรกิจในการปรับปรุงการบริการลูกค้าโดยอิงจากการศึกษาพฤติกรรมผู้บริโภคแบบเรียลไทม์ นอกจากนี้ การวิเคราะห์เครื่องหมายทางภาษาในโพสต์บนโซเชียลมีเดียสามารถช่วยสร้างแบบจำลองการเรียนรู้เชิงลึกที่สามารถให้ข้อมูลเชิงลึกส่วนบุคคลเกี่ยวกับสุขภาพจิตของผู้ใช้ได้เร็วกว่าวิธีการทั่วไป คุณสามารถขุดข้อมูลจาก Reddit หรือ Twitter เพื่อเริ่มต้นโครงการนี้

7. การทำนายคุณสมบัติสินเชื่อ

ธนาคารมักจะปฏิบัติตามขั้นตอนที่เข้มงวดมากก่อนที่จะอนุมัติเงินกู้ แต่ต้องขอบคุณความก้าวหน้าในการเรียนรู้ของเครื่อง ทำให้สามารถคาดการณ์สิทธิ์ในการขอสินเชื่อได้เร็วและแม่นยำยิ่งขึ้น โมเดลแมชชีนเลิร์นนิงสำหรับการคาดการณ์สิทธิ์ในการขอสินเชื่อจะได้รับการฝึกอบรมโดยใช้ชุดข้อมูลที่ประกอบด้วยข้อมูลที่เกี่ยวข้องกับผู้สมัคร เช่น จำนวนเงินกู้ เพศ รายได้ สถานภาพการสมรส จำนวนผู้ติดตาม คุณสมบัติ ประวัติบัตรเครดิต และอื่นๆ ในทำนองเดียวกัน โปรเจ็กต์จะเกี่ยวข้องกับการฝึกอบรมและทดสอบโมเดลโดยใช้การตรวจสอบข้าม และคุณจะได้เรียนรู้วิธีสร้างแบบจำลองทางสถิติ เช่น XGBoost, Gradient Boosting และเมตริก เช่น MCC Scorer, ROC Curve เป็นต้น

8. การทำนายคุณภาพไวน์

ชุดข้อมูลการทำนายคุณภาพไวน์ค่อนข้างเป็นที่นิยมในหมู่นักเรียนที่เริ่มต้นในสาขาวิทยาศาสตร์ข้อมูล มันเกี่ยวข้องกับการใช้ความเป็นกรดระเหย ความเป็นกรดคงที่ ความหนาแน่น และแอลกอฮอล์เพื่อทำนายคุณภาพของไวน์แดง คุณสามารถใช้วิธีการจัดประเภทหรือการถดถอยสำหรับโครงการนี้ ตัวแปรคุณภาพไวน์ที่คุณต้องคาดการณ์ในช่วงชุดข้อมูลระหว่าง 0-10 และคุณสามารถทำได้โดยการสร้างแบบจำลองการถดถอย อีกวิธีหนึ่งคือการสร้างสามหมวดหมู่ (ต่ำ กลาง และสูง) แบ่ง 0-10 ออกเป็นช่วงๆ แยกกัน และแปลงเป็นค่าหมวดหมู่ ดังนั้น คุณสามารถสร้างแบบจำลองการจัดหมวดหมู่ใดๆ สำหรับการทำนายได้

9. การทำนายราคาบ้าน

หากคุณเป็นมือใหม่สำหรับแมชชีนเลิร์นนิง คุณสามารถใช้ชุดข้อมูลราคาบ้านของ Kaggle เพื่อสร้างโครงการคาดการณ์ราคาบ้าน ราคาของบ้านหลังหนึ่งเป็นตัวแปรเป้าหมายในชุดข้อมูลนี้ โมเดล ML ของคุณจะต้องคาดการณ์ราคาโดยใช้ข้อมูล เช่น ท้องที่ จำนวนห้อง และระบบสาธารณูปโภค เนื่องจากเป็นปัญหาการถดถอย ผู้เริ่มต้นจึงสามารถใช้แนวทางการถดถอยเชิงเส้นเพื่อสร้างแบบจำลองได้ ผู้ที่ต้องการใช้แนวทางขั้นสูงกว่านี้สามารถใช้การไล่ระดับความชันหรือตัวถดถอยของป่าแบบสุ่มเพื่อคาดการณ์ราคาบ้าน ชุดข้อมูลยังมีตัวแปรตามหมวดหมู่จำนวนมาก ซึ่งต้องใช้เทคนิคต่างๆ เช่น การเข้ารหัสฉลากและการเข้ารหัสแบบร้อนครั้งเดียว

10. การแบ่งส่วนลูกค้าใน Python

สำหรับผู้ที่ต้องการเริ่มต้นใช้งานแมชชีนเลิร์นนิงแบบไม่มีผู้ดูแล ชุดข้อมูลการแบ่งกลุ่มลูกค้าบน Kaggle คือคำตอบที่ดีที่สุดของคุณ ชุดข้อมูลประกอบด้วยรายละเอียดของลูกค้า เช่น เพศ อายุ รายได้ต่อปี และคะแนนการใช้จ่าย คุณต้องใช้ตัวแปรเหล่านี้เพื่อจัดกลุ่มลูกค้าที่เหมือนกันเป็นกลุ่มที่คล้ายคลึงกัน เป้าหมายหลักของโครงการคือการบรรลุการแบ่งส่วนลูกค้า ระบุลูกค้าเป้าหมายสำหรับกลยุทธ์ทางการตลาดต่างๆ และทำความเข้าใจกลไกในโลกแห่งความเป็นจริงของกลยุทธ์ทางการตลาด คุณสามารถใช้การจัดกลุ่มแบบลำดับชั้นหรือการจัดกลุ่ม k-mean เพื่อให้งานเหล่านี้สำเร็จ

ทางข้างหน้า

upGrad เสนอโปรแกรม Executive PG แบบออนไลน์ในการเรียนรู้ของเครื่องและปัญญาประดิษฐ์ โดยมีเป้าหมายเพื่อมอบทักษะตามความต้องการ เช่น NLP, การเรียนรู้เชิงลึก, MLOps และการสร้างกลยุทธ์ AI

ไฮไลท์ของโปรแกรม:

  • การยอมรับอันทรงเกียรติจาก IIIT Bangalore
  • การเรียนรู้มากกว่า 450 ชั่วโมงกับโครงการอุตสาหกรรม
  • ชั้นเรียนเขียนโค้ดแบบสดและเวิร์กช็อปการสร้างโปรไฟล์
  • เครือข่ายอุตสาหกรรมและเพียร์พร้อมการสนับสนุนการเรียนรู้แบบ 360 องศา

ชื่อเสียงของ upGrad ในการเป็นหนึ่งในแพลตฟอร์ม EdTech ระดับสูงที่ดีที่สุดนั้นไม่มีใครเทียบได้ โปรแกรมระดับโลกที่เกี่ยวข้องกับอุตสาหกรรมได้ส่งผลกระทบต่อคนทำงานกว่า 500,000 คนทั่วโลก และยังคงตอบสนองความต้องการด้านการเรียนรู้ของฐานผู้เรียนมากกว่า 40,000 รายใน 85 ประเทศ ลงทะเบียนกับ upGrad เพื่อทราบข้อมูลเพิ่มเติมเกี่ยวกับหลักสูตรและใบรับรองที่เป็นที่ต้องการมากที่สุด

การเรียนรู้ของเครื่องจำเป็นต้องมีการเข้ารหัสหรือไม่

ใช่ การเขียนโค้ดเป็นสิ่งจำเป็นหากคุณต้องการประกอบอาชีพด้านการเรียนรู้ของเครื่อง Java, C++ และ Python เป็นพื้นฐานภาษาการเขียนโปรแกรมสำหรับการเรียนรู้ของเครื่อง แต่สามารถเจาะจงมากขึ้นได้ ยิ่งทักษะการเขียนโค้ดของคุณดีขึ้น คุณก็จะเข้าใจวิธีการทำงานของอัลกอริธึมได้ดีขึ้น และในทางกลับกัน คุณก็จะติดตามและเพิ่มประสิทธิภาพของอัลกอริธึม

การเรียนรู้ของเครื่องซับซ้อนหรือไม่?

เครื่องมือแมชชีนเลิร์นนิงจำนวนมากค่อนข้างท้าทายในการใช้งานและต้องการความรู้ด้านสถิติ คณิตศาสตร์ขั้นสูง และวิศวกรรมซอฟต์แวร์ อย่างไรก็ตาม มีแนวคิดระดับเริ่มต้นมากมายสำหรับผู้เริ่มต้น ตัวอย่างเช่น โมเดลการเรียนรู้แบบ unsupervised และ supervised จำนวนมากที่ใช้ใน Python และ R มีให้ใช้อย่างอิสระและตั้งค่าได้ง่ายในคอมพิวเตอร์ส่วนบุคคล การถดถอยเชิงเส้นหรือโลจิสติกอย่างง่ายยังมีประโยชน์สำหรับงานการเรียนรู้ของเครื่องต่างๆ

คณิตศาสตร์ประเภทใดที่จำเป็นสำหรับการเรียนรู้ของเครื่อง

คุณจำเป็นต้องมีความเชี่ยวชาญด้านคณิตศาสตร์เพื่อทำงานและโครงการต่างๆ ของแมชชีนเลิร์นนิง แนวคิดทางคณิตศาสตร์บางอย่างที่จำเป็นสำหรับการเรียนรู้ของเครื่องและอัลกอริธึม AI ได้แก่ พีชคณิตเชิงเส้น แคลคูลัส คณิตศาสตร์แบบไม่ต่อเนื่อง ทฤษฎีความน่าจะเป็น และสถิติ