หลักสูตรการเรียนรู้ของเครื่อง: หลักสูตร ML & AI ที่ดีที่สุดสำหรับการเพิ่มทักษะ
เผยแพร่แล้ว: 2021-01-21หลักสูตร PG Diploma โดย upGrad เป็นหนึ่งในหลักสูตรที่ครอบคลุมมากที่สุด ครอบคลุมความรู้ทั้งหมดของทักษะ แนวคิด และเครื่องมือที่จำเป็นในอุตสาหกรรมในปัจจุบัน
หลักสูตรนี้ได้รับการออกแบบมาเพื่อให้คุณอุตสาหกรรมพร้อมและสามารถสัมภาษณ์ได้อย่างง่ายดาย
มาดูหลักสูตรฉบับสมบูรณ์กันเพื่อดูรายละเอียดเชิงลึกเกี่ยวกับ "โปรแกรม PG สำหรับผู้บริหารในการเรียนรู้ของเครื่องและ AI" กัน
หลักสูตรแบ่งออกเป็น 8 ส่วนหลัก:
- ชุดเครื่องมือวิทยาศาสตร์ข้อมูล
- สถิติและการสำรวจข้อมูล Analytics
- การเรียนรู้ของเครื่อง-1
- การเรียนรู้ของเครื่อง-2
- การประมวลผลภาษาธรรมชาติ
- การเรียนรู้อย่างลึกซึ้ง
- การเรียนรู้การเสริมแรง
- โครงการปรับใช้และ Capstone
สารบัญ
ชุดเครื่องมือวิทยาศาสตร์ข้อมูล
ส่วนนี้เป็นหลักสูตรเตรียมความพร้อมซึ่งจำเป็นสำหรับการเริ่มต้นการเดินทางของ Data Science และ Machine Learning ข้อกำหนดที่สำคัญคือ Python, SQL และ Excel ในระดับหนึ่ง
ส่วนนี้แบ่งออกเป็น 6 โมดูลด้านล่าง:

บทนำสู่ Python: โมดูลนี้ครอบคลุมหัวข้อหลักของ Python โดยไม่ต้องมีความรู้มาก่อน การทำความเข้าใจโครงสร้างของ Python โครงสร้างข้อมูลเช่นรายการ ทูเพิล พจนานุกรม ฯลฯ ครอบคลุมอยู่
Python สำหรับ Data Science: 2 ไลบรารีที่สำคัญที่สุดของ Python – NumPy และ Pandas มีเนื้อหาครอบคลุมในเชิงลึก NumPy และ Pandas จำเป็นสำหรับการวิเคราะห์ข้อมูล การทำความสะอาด และงานหลักของ Data Science ส่วนใหญ่
คณิตศาสตร์สำหรับการเรียนรู้ของเครื่อง: พีชคณิตเชิงเส้น เมทริกซ์ แคลคูลัสหลายตัวแปร และเวกเตอร์ครอบคลุมอยู่ในโมดูลนี้ หัวข้อเหล่านี้เป็นข้อกำหนดเบื้องต้นสำหรับการทำความเข้าใจว่าอัลกอริธึม ML ทำงานอย่างไร
การแสดงข้อมูลใน Python: โมดูลนี้ครอบคลุมไดนามิกของการพล็อตกราฟและแนวโน้มโดยใช้ Python
- การวิเคราะห์ข้อมูลโดยใช้ SQL: SQL เป็นแกนหลักของการวิเคราะห์ข้อมูลและวิศวกรรม โมดูลนี้ครอบคลุมพื้นฐานของ SQL เช่น ฟังก์ชัน อนุประโยค เคียวรี และการรวม
- SQL ขั้นสูง: โมดูลนี้ครอบคลุมหัวข้อขั้นสูง เช่น การออกแบบฐานข้อมูล ฟังก์ชันหน้าต่าง การเพิ่มประสิทธิภาพการค้นหา ฯลฯ
สถิติและการสำรวจข้อมูล Analytics
สถิติและข้อมูลเป็นของคู่กัน การวิเคราะห์ข้อมูลส่วนใหญ่ดำเนินการวิเคราะห์ทางสถิติภายใต้ประทุนซึ่งสามารถสำรวจเพิ่มเติมเพื่อให้ได้ผลลัพธ์ที่มีนัยสำคัญ
ส่วนนี้ครอบคลุมด้านล่าง 6 โมดูล:
- การแก้ปัญหาการวิเคราะห์: โมดูลนี้ครอบคลุมเฟรมเวิร์ก CRISP-DM สำหรับภาพรวมของโปรเจ็กต์ Machine Learning ซึ่งครอบคลุมตั้งแต่ความเข้าใจทางธุรกิจไปจนถึงการปรับใช้งาน
- การกำหนดการลงทุน: การกำหนด Data Analytics ในฐานะพนักงานบริษัทวาณิชธนกิจ
- สถิติอนุมาน: โมดูลนี้ครอบคลุมแนวคิดทางสถิติที่สำคัญที่สุด เช่น ความน่าจะเป็น การแจกแจงความน่าจะเป็น และทฤษฎีบทขีดจำกัดกลาง
- การทดสอบสมมติฐาน: การ ทดสอบสมมติฐานครอบคลุมถึงอะไร ทำไม และอย่างไรในโมดูลนี้ P-Value การทดสอบและการใช้งานประเภทต่างๆ ใน Python
- การวิเคราะห์ข้อมูลเชิงสำรวจ: EDA ดึงข้อมูลจากข้อมูล โมดูลนี้ครอบคลุม Data Cleaning, การวิเคราะห์ Univariate/Bivariate และตัวชี้วัดที่ได้รับสำหรับ ML
- โครงการกลุ่ม: กรณีศึกษาชมรมให้ยืมเพื่อค้นหาว่าลูกค้ารายใดมีความเสี่ยงที่จะผิดนัดเงินกู้
เรียน รู้ใบรับรองการเรียนรู้ของเครื่อง จากมหาวิทยาลัยชั้นนำของโลก รับ Masters, Executive PGP หรือ Advanced Certificate Programs เพื่อติดตามอาชีพของคุณอย่างรวดเร็ว
การเรียนรู้ของเครื่อง-1
ส่วนนี้ครอบคลุมพื้นฐานของการเรียนรู้ของเครื่องและอัลกอริธึมบางอย่าง จำเป็นอย่างยิ่งที่จะต้องมีความรู้ที่ครอบคลุมเกี่ยวกับสิ่งเหล่านี้ก่อนที่จะดำดิ่งสู่หัวข้อขั้นสูง
ประกอบด้วย 5 โมดูล:
- การถดถอยเชิงเส้น: โมดูลนี้ครอบคลุมพื้นฐานของการถดถอยเชิงเส้น สมมติฐาน ข้อจำกัด และการประยุกต์ใช้ในอุตสาหกรรม
- การประเมินการถดถอยเชิงเส้น: การกำหนดการ คาดการณ์ราคารถยนต์
- Logistic Regression: การถดถอย โลจิสติกแบบตัวแปรเดียวและหลายตัวแปรสำหรับการจำแนกประเภท ML การใช้งานใน Python การวัดผลและการใช้งานในอุตสาหกรรมจะครอบคลุม
- Naive Bayes: หนึ่งในอัลกอริธึมการจำแนกประเภทที่ง่ายและมีประสิทธิภาพมากที่สุด โมดูลนี้ครอบคลุมพื้นฐานของทฤษฎีบท Bayes ตัวแยกประเภท Naive Bayes และการใช้งานในตัวแยกประเภทสแปม-แฮม
- การเลือกแบบจำลอง: โมดูลนี้ครอบคลุมการเลือกรุ่น การแลกเปลี่ยนความแปรปรวนแบบไบแอส การปรับค่าพารามิเตอร์ไฮเปอร์ และการตรวจสอบความถูกต้องข้าม ซึ่งจำเป็นต่อการสรุปโมเดล ML ที่ดีที่สุด
การเรียนรู้ของเครื่อง-2
ส่วนนี้ครอบคลุมหัวข้อขั้นสูงของแมชชีนเลิร์นนิง ประกอบด้วยอัลกอริธึมภายใต้การดูแลและไม่ได้รับการดูแลประเภทต่างๆ
8 โมดูลที่ครอบคลุมคือ:
- การถดถอยขั้นสูง: โมดูลนี้แนะนำเทคนิคการถดถอยเชิงเส้นทั่วไปและเทคนิคการถดถอยแบบปกติเช่น Ridge และ Lasso
- รองรับ Vector Machine (ตัวเลือก): โมดูลนี้ครอบคลุมอัลกอริทึม SVM การทำงาน เมล็ดพืช และการใช้งาน
- แบบจำลองต้นไม้: พื้นฐานของแบบจำลองต้นไม้ โครงสร้าง เทคนิคการแยก การตัดแต่งกิ่งและตระการตาเพื่อสร้างป่าสุ่มมีอยู่ที่นี่
- การเลือกแบบจำลอง-ข้อควรพิจารณาในทางปฏิบัติ: โมดูลนี้ให้การปฏิบัติจริงสำหรับการใช้เทคนิคการเลือกแบบจำลองเพื่อเลือกแบบจำลองที่ดีที่สุด
- การ ส่งเสริม: อะไรคือผู้เรียนที่อ่อนแอและผู้เรียนแบบสตริง และพวกเขาจะร่วมกันสร้างแบบจำลองที่ยอดเยี่ยมได้อย่างไร เทคนิคต่างๆ ของ Boosting ครอบคลุมอยู่ที่นี่
- Unsupervised Learning-Clustering: โมดูลนี้แนะนำ Clustering ประเภทและการใช้งานตั้งแต่เริ่มต้น
- Unsupervised Learning-Principal Component Analysis: ครอบคลุมถึงพื้นฐานของ PCA การทำงานและการนำไปใช้ใน Python
- กรณีศึกษา Telecom Churn: กรณีศึกษาเพื่อคาดการณ์ Customer Churn สำหรับผู้ให้บริการโทรคมนาคม
การประมวลผลภาษาธรรมชาติ
การประมวลผลภาษาธรรมชาติ (NLP) เป็นสาขาขนาดใหญ่ ในส่วน NLP นี้ การสร้างบล็อคทั้งหมดของการจัดการข้อมูลข้อความจะครอบคลุมพร้อมกับแชทบอท

5 โมดูลที่รวมเป็น:
- การประมวลผลคำศัพท์: โมดูลนี้ครอบคลุมพื้นฐานของ NLP เช่น การเข้ารหัสข้อความ นิพจน์ทั่วไป เทคนิคการประมวลผลข้อความ และเทคนิคคำศัพท์ขั้นสูง เช่น Phonetic Hashing
- การประมวลผลวากยสัมพันธ์: โมดูลนี้ครอบคลุมพื้นฐานของการประมวลผลวากยสัมพันธ์ การแยกวิเคราะห์ข้อความประเภทต่างๆ การดึงข้อมูล และฟิลด์สุ่มตามเงื่อนไข
- การประมวลผลวากยสัมพันธ์ - การกำหนด: การใช้การประมวลผลวากยสัมพันธ์เพื่อทำความเข้าใจโครงสร้างไวยากรณ์ของข้อความ
- การประมวลผลเชิงความหมาย: โมดูลนี้แนะนำการประมวลผลเชิงความหมาย เวกเตอร์ Word และการฝัง เทคนิคการสร้างแบบจำลองหัวข้อตามด้วยกรณีศึกษา
- การสร้าง Chatbots ด้วย Rasa: โมดูลนี้ครอบคลุมเครื่องมือที่ร้อนแรงที่สุดสำหรับการพัฒนา Chatbot พร้อมกับการใช้งาน
การเรียนรู้อย่างลึกซึ้ง
Deep Learning ใช้กันอย่างแพร่หลายในอุตสาหกรรมในแอปพลิเคชันล้ำสมัยมากมายสำหรับข้อมูลประเภทต่างๆ ในส่วนนี้ Neural Networks ทุกประเภทจะครอบคลุมพร้อมกับการใช้งาน
5 โมดูลที่ครอบคลุมคือ:
- บทนำสู่โครงข่ายประสาทเทียม: โมดูลนี้ครอบคลุมพื้นฐานของโครงข่ายประสาทเทียม ฟังก์ชันการเปิดใช้งาน และเครือข่ายฟีดฟอร์เวิร์ด
- Convolutional Neural Network-Industry Applications: โมดูลนี้ครอบคลุมรายละเอียดเกี่ยวกับ CNN โครงสร้าง เลเยอร์ และการทำงาน นอกจากนี้ยังครอบคลุมถึงโมเดล Transfer Learning ที่หลากหลาย การถ่ายโอนสไตล์ และการประมวลผลข้อมูลล่วงหน้าของข้อมูลรูปภาพ ตามด้วยกรณีศึกษา
- Neural Networks-Assignment: กรณีศึกษาของ CNN
- Recurrent Neural Networks: โมดูลนี้ครอบคลุมเครือข่ายประสาทประเภทอื่นที่ใช้เป็นพิเศษสำหรับข้อมูลตามลำดับ - RNN และ LSTM พร้อมกับการใช้งาน
- โครงการ Neural Networks: ในโมดูลนี้ คุณจะทำโปรเจ็กต์การรู้จำท่าทางโดยใช้สแต็กเครือข่าย CNN และ RNN
การเรียนรู้การเสริมแรง
ในส่วนนี้ เราจะแนะนำให้คุณรู้จักกับ Machine Learning อีกประเภทหนึ่ง – Reinforcement Learning คุณจะได้เรียนรู้พื้นฐานต่างๆ รวมถึงการเรียนรู้การเสริมแรงแบบคลาสสิกและการเรียนรู้การเสริมแรงแบบลึก

ส่วนนี้ครอบคลุมด้านล่าง 4 โมดูล:
- การเรียนรู้การเสริมแรงแบบคลาสสิก: โมดูลนี้ครอบคลุมพื้นฐานของ RL เช่น กระบวนการตัดสินใจของมาร์คอฟ สมการ RL รวมถึงวิธีมอนติคาร์โล
- Assignment-Classical Reinforcement Learning: การมอบหมายงานแบบโอเอกซ์โดยใช้ RL
- Deep Reinforcement Learning: ในโมดูลนี้ เราจะเจาะลึกลงไปใน Deep Q Networks สถาปัตยกรรมและการใช้งาน นอกจากนี้ยังครอบคลุมหัวข้อขั้นสูง เช่น วิธีการไล่ระดับนโยบายและวิธีนักวิจารณ์
- โครงการเรียนรู้การเสริมกำลัง: การมอบหมายให้ทำโดยใช้สถาปัตยกรรม RL
โครงการ Capstone
ในส่วนนี้ คุณจะสร้างโปรเจ็กต์หลักขั้นสุดท้ายโดยใช้ความรู้ทั้งหมดที่ได้รับจนถึงตอนนี้
ส่วนนี้แบ่งออกเป็น 2 โมดูล:
- การ ปรับใช้: โมดูลนี้ครอบคลุมระยะหลังของโปรเจ็กต์ Machine Learning ซึ่งคุณจะได้เรียนรู้พื้นฐานการปรับใช้บนคลาวด์และ PaaS รวมถึงไปป์ไลน์ CI/CD และพื้นฐานของ Docker
- Capstone: โครงการสุดท้ายที่จะทำให้ประวัติย่อและผลงานของคุณพุ่งสูงขึ้น
ก่อนที่คุณจะไป
โปรแกรมนี้ครอบคลุมพื้นฐานที่จำเป็นทั้งหมด รวมถึงเครื่องมือและทักษะขั้นสูงเพื่อเข้าสู่อุตสาหกรรม Data Science และ Machine Learning คุณจะต้องผ่านการฝึกปฏิบัติและโครงงานต่างๆ ที่เพียงพอเพื่อให้แน่ใจว่าคุณได้เรียนรู้เป็นอย่างดี
ด้วยทักษะที่เรียนรู้ทั้งหมด คุณสามารถใช้งานบนแพลตฟอร์มการแข่งขันอื่นๆ รวมทั้งทดสอบทักษะของคุณและลงมือปฏิบัติจริงได้มากขึ้น
การเรียนรู้ของเครื่องคืออะไร?
การเรียนรู้ของเครื่องเป็นสาขาวิชาวิทยาการคอมพิวเตอร์ที่ช่วยให้คอมพิวเตอร์สามารถเรียนรู้ได้โดยไม่ต้องตั้งโปรแกรมไว้อย่างชัดเจน ทำให้คอมพิวเตอร์สามารถเรียนรู้ได้โดยไม่ต้องตั้งโปรแกรมไว้อย่างชัดเจน การเรียนรู้ด้วยเครื่องเป็นวินัยทางวิทยาศาสตร์ที่ศึกษาการสร้างและศึกษาอัลกอริทึมที่สามารถเรียนรู้และคาดการณ์ข้อมูลได้ จากคำชี้แจงปัญหา แมชชีนเลิร์นนิงมุ่งเน้นไปที่การสร้างแบบจำลองการคาดการณ์จากข้อมูล/คุณลักษณะที่กำหนด และสร้างสมมติฐานเกี่ยวกับความน่าจะเป็นของผลลัพธ์ตามคุณลักษณะที่มีอยู่ในข้อมูล
แอพพลิเคชั่นของการเรียนรู้ของเครื่องคืออะไร?
โดยทั่วไป แมชชีนเลิร์นนิงเป็นปัญญาประดิษฐ์ชนิดหนึ่งที่เกี่ยวข้องกับคอมพิวเตอร์หรือโปรแกรมเพื่อเรียนรู้และคาดการณ์ตามข้อมูล แมชชีนเลิร์นนิงใช้กันอย่างแพร่หลายในการจดจำภาพ การประมวลผลภาษาธรรมชาติ และด้านอื่นๆ ในขณะที่ความก้าวหน้าครั้งใหม่ในการเรียนรู้เชิงลึกและข้อมูลขนาดใหญ่ทำให้ AI เข้าใกล้ความเป็นจริงมากขึ้น ปัจจุบัน แมชชีนเลิร์นนิงกำลังถูกใช้ในเกือบทุกภาคส่วนที่สำคัญ รวมถึงการดูแลสุขภาพ การขนส่งและโลจิสติกส์ เกษตรกรรม อีคอมเมิร์ซ ฯลฯ
จะสร้างโมเดลแมชชีนเลิร์นนิงได้อย่างไร?
โมเดลแมชชีนเลิร์นนิงจะเรียนรู้จากข้อมูลการฝึกที่มีป้ายกำกับ และทำการคาดการณ์หรือจัดประเภทกับข้อมูลใหม่ที่ไม่เคยปรากฏมาก่อน มันขึ้นอยู่กับทฤษฎีการเรียนรู้ทางสถิติ แต่มีการเพิ่มประสิทธิภาพ การสร้างแบบจำลอง และการเข้ารหัสจำนวนมาก โมเดลแมชชีนเลิร์นนิงจึงมี 2 ส่วนคือ โมเดลและอัลกอริธึมการเรียนรู้ ส่วนของแบบจำลองจะแสดงเป็นแบบจำลองทางคณิตศาสตร์ เช่น ต้นไม้หรือแผนผังการตัดสินใจ และอัลกอริธึมการเรียนรู้จะแสดงด้วยชุดข้อมูลในอดีต อัลกอริธึมการเรียนรู้จะเรียนรู้จากชุดข้อมูลและปรับโมเดลให้เหมาะสมเพื่อสร้างสมดุลระหว่างข้อผิดพลาดและความซับซ้อนของโมเดล ยิ่งโมเดลของคุณมีความแม่นยำมากขึ้นและโมเดลยิ่งเรียบง่ายมากเท่าไหร่ก็ยิ่งดีเท่านั้น