หลักสูตรการเรียนรู้ของเครื่อง: หลักสูตร ML & AI ที่ดีที่สุดสำหรับการเพิ่มทักษะ

เผยแพร่แล้ว: 2021-01-21

หลักสูตร PG Diploma โดย upGrad เป็นหนึ่งในหลักสูตรที่ครอบคลุมมากที่สุด ครอบคลุมความรู้ทั้งหมดของทักษะ แนวคิด และเครื่องมือที่จำเป็นในอุตสาหกรรมในปัจจุบัน

หลักสูตรนี้ได้รับการออกแบบมาเพื่อให้คุณอุตสาหกรรมพร้อมและสามารถสัมภาษณ์ได้อย่างง่ายดาย

มาดูหลักสูตรฉบับสมบูรณ์กันเพื่อดูรายละเอียดเชิงลึกเกี่ยวกับ "โปรแกรม PG สำหรับผู้บริหารในการเรียนรู้ของเครื่องและ AI" กัน

หลักสูตรแบ่งออกเป็น 8 ส่วนหลัก:

  1. ชุดเครื่องมือวิทยาศาสตร์ข้อมูล
  2. สถิติและการสำรวจข้อมูล Analytics
  3. การเรียนรู้ของเครื่อง-1
  4. การเรียนรู้ของเครื่อง-2
  5. การประมวลผลภาษาธรรมชาติ
  6. การเรียนรู้อย่างลึกซึ้ง
  7. การเรียนรู้การเสริมแรง
  8. โครงการปรับใช้และ Capstone

สารบัญ

ชุดเครื่องมือวิทยาศาสตร์ข้อมูล

ส่วนนี้เป็นหลักสูตรเตรียมความพร้อมซึ่งจำเป็นสำหรับการเริ่มต้นการเดินทางของ Data Science และ Machine Learning ข้อกำหนดที่สำคัญคือ Python, SQL และ Excel ในระดับหนึ่ง

ส่วนนี้แบ่งออกเป็น 6 โมดูลด้านล่าง:

บทนำสู่ Python: โมดูลนี้ครอบคลุมหัวข้อหลักของ Python โดยไม่ต้องมีความรู้มาก่อน การทำความเข้าใจโครงสร้างของ Python โครงสร้างข้อมูลเช่นรายการ ทูเพิล พจนานุกรม ฯลฯ ครอบคลุมอยู่

Python สำหรับ Data Science: 2 ไลบรารีที่สำคัญที่สุดของ Python – NumPy และ Pandas มีเนื้อหาครอบคลุมในเชิงลึก NumPy และ Pandas จำเป็นสำหรับการวิเคราะห์ข้อมูล การทำความสะอาด และงานหลักของ Data Science ส่วนใหญ่

คณิตศาสตร์สำหรับการเรียนรู้ของเครื่อง: พีชคณิตเชิงเส้น เมทริกซ์ แคลคูลัสหลายตัวแปร และเวกเตอร์ครอบคลุมอยู่ในโมดูลนี้ หัวข้อเหล่านี้เป็นข้อกำหนดเบื้องต้นสำหรับการทำความเข้าใจว่าอัลกอริธึม ML ทำงานอย่างไร

การแสดงข้อมูลใน Python: โมดูลนี้ครอบคลุมไดนามิกของการพล็อตกราฟและแนวโน้มโดยใช้ Python

  • การวิเคราะห์ข้อมูลโดยใช้ SQL: SQL เป็นแกนหลักของการวิเคราะห์ข้อมูลและวิศวกรรม โมดูลนี้ครอบคลุมพื้นฐานของ SQL เช่น ฟังก์ชัน อนุประโยค เคียวรี และการรวม
  1. SQL ขั้นสูง: โมดูลนี้ครอบคลุมหัวข้อขั้นสูง เช่น การออกแบบฐานข้อมูล ฟังก์ชันหน้าต่าง การเพิ่มประสิทธิภาพการค้นหา ฯลฯ

สถิติและการสำรวจข้อมูล Analytics

สถิติและข้อมูลเป็นของคู่กัน การวิเคราะห์ข้อมูลส่วนใหญ่ดำเนินการวิเคราะห์ทางสถิติภายใต้ประทุนซึ่งสามารถสำรวจเพิ่มเติมเพื่อให้ได้ผลลัพธ์ที่มีนัยสำคัญ

ส่วนนี้ครอบคลุมด้านล่าง 6 โมดูล:

  1. การแก้ปัญหาการวิเคราะห์: โมดูลนี้ครอบคลุมเฟรมเวิร์ก CRISP-DM สำหรับภาพรวมของโปรเจ็กต์ Machine Learning ซึ่งครอบคลุมตั้งแต่ความเข้าใจทางธุรกิจไปจนถึงการปรับใช้งาน
  2. การกำหนดการลงทุน: การกำหนด Data Analytics ในฐานะพนักงานบริษัทวาณิชธนกิจ
  3. สถิติอนุมาน: โมดูลนี้ครอบคลุมแนวคิดทางสถิติที่สำคัญที่สุด เช่น ความน่าจะเป็น การแจกแจงความน่าจะเป็น และทฤษฎีบทขีดจำกัดกลาง
  4. การทดสอบสมมติฐาน: การ ทดสอบสมมติฐานครอบคลุมถึงอะไร ทำไม และอย่างไรในโมดูลนี้ P-Value การทดสอบและการใช้งานประเภทต่างๆ ใน ​​Python
  5. การวิเคราะห์ข้อมูลเชิงสำรวจ: EDA ดึงข้อมูลจากข้อมูล โมดูลนี้ครอบคลุม Data Cleaning, การวิเคราะห์ Univariate/Bivariate และตัวชี้วัดที่ได้รับสำหรับ ML
  6. โครงการกลุ่ม: กรณีศึกษาชมรมให้ยืมเพื่อค้นหาว่าลูกค้ารายใดมีความเสี่ยงที่จะผิดนัดเงินกู้

เรียน รู้ใบรับรองการเรียนรู้ของเครื่อง จากมหาวิทยาลัยชั้นนำของโลก รับ Masters, Executive PGP หรือ Advanced Certificate Programs เพื่อติดตามอาชีพของคุณอย่างรวดเร็ว

การเรียนรู้ของเครื่อง-1

ส่วนนี้ครอบคลุมพื้นฐานของการเรียนรู้ของเครื่องและอัลกอริธึมบางอย่าง จำเป็นอย่างยิ่งที่จะต้องมีความรู้ที่ครอบคลุมเกี่ยวกับสิ่งเหล่านี้ก่อนที่จะดำดิ่งสู่หัวข้อขั้นสูง

ประกอบด้วย 5 โมดูล:

  1. การถดถอยเชิงเส้น: โมดูลนี้ครอบคลุมพื้นฐานของการถดถอยเชิงเส้น สมมติฐาน ข้อจำกัด และการประยุกต์ใช้ในอุตสาหกรรม
  2. การประเมินการถดถอยเชิงเส้น: การกำหนดการ คาดการณ์ราคารถยนต์
  3. Logistic Regression: การถดถอย โลจิสติกแบบตัวแปรเดียวและหลายตัวแปรสำหรับการจำแนกประเภท ML การใช้งานใน Python การวัดผลและการใช้งานในอุตสาหกรรมจะครอบคลุม
  4. Naive Bayes: หนึ่งในอัลกอริธึมการจำแนกประเภทที่ง่ายและมีประสิทธิภาพมากที่สุด โมดูลนี้ครอบคลุมพื้นฐานของทฤษฎีบท Bayes ตัวแยกประเภท Naive Bayes และการใช้งานในตัวแยกประเภทสแปม-แฮม
  5. การเลือกแบบจำลอง: โมดูลนี้ครอบคลุมการเลือกรุ่น การแลกเปลี่ยนความแปรปรวนแบบไบแอส การปรับค่าพารามิเตอร์ไฮเปอร์ และการตรวจสอบความถูกต้องข้าม ซึ่งจำเป็นต่อการสรุปโมเดล ML ที่ดีที่สุด

การเรียนรู้ของเครื่อง-2

ส่วนนี้ครอบคลุมหัวข้อขั้นสูงของแมชชีนเลิร์นนิง ประกอบด้วยอัลกอริธึมภายใต้การดูแลและไม่ได้รับการดูแลประเภทต่างๆ

8 โมดูลที่ครอบคลุมคือ:

  1. การถดถอยขั้นสูง: โมดูลนี้แนะนำเทคนิคการถดถอยเชิงเส้นทั่วไปและเทคนิคการถดถอยแบบปกติเช่น Ridge และ Lasso
  2. รองรับ Vector Machine (ตัวเลือก): โมดูลนี้ครอบคลุมอัลกอริทึม SVM การทำงาน เมล็ดพืช และการใช้งาน
  3. แบบจำลองต้นไม้: พื้นฐานของแบบจำลองต้นไม้ โครงสร้าง เทคนิคการแยก การตัดแต่งกิ่งและตระการตาเพื่อสร้างป่าสุ่มมีอยู่ที่นี่
  4. การเลือกแบบจำลอง-ข้อควรพิจารณาในทางปฏิบัติ: โมดูลนี้ให้การปฏิบัติจริงสำหรับการใช้เทคนิคการเลือกแบบจำลองเพื่อเลือกแบบจำลองที่ดีที่สุด
  5. การ ส่งเสริม: อะไรคือผู้เรียนที่อ่อนแอและผู้เรียนแบบสตริง และพวกเขาจะร่วมกันสร้างแบบจำลองที่ยอดเยี่ยมได้อย่างไร เทคนิคต่างๆ ของ Boosting ครอบคลุมอยู่ที่นี่
  6. Unsupervised Learning-Clustering: โมดูลนี้แนะนำ Clustering ประเภทและการใช้งานตั้งแต่เริ่มต้น
  7. Unsupervised Learning-Principal Component Analysis: ครอบคลุมถึงพื้นฐานของ PCA การทำงานและการนำไปใช้ใน Python
  8. กรณีศึกษา Telecom Churn: กรณีศึกษาเพื่อคาดการณ์ Customer Churn สำหรับผู้ให้บริการโทรคมนาคม

การประมวลผลภาษาธรรมชาติ

การประมวลผลภาษาธรรมชาติ (NLP) เป็นสาขาขนาดใหญ่ ในส่วน NLP นี้ การสร้างบล็อคทั้งหมดของการจัดการข้อมูลข้อความจะครอบคลุมพร้อมกับแชทบอท

5 โมดูลที่รวมเป็น:

  1. การประมวลผลคำศัพท์: โมดูลนี้ครอบคลุมพื้นฐานของ NLP เช่น การเข้ารหัสข้อความ นิพจน์ทั่วไป เทคนิคการประมวลผลข้อความ และเทคนิคคำศัพท์ขั้นสูง เช่น Phonetic Hashing
  2. การประมวลผลวากยสัมพันธ์: โมดูลนี้ครอบคลุมพื้นฐานของการประมวลผลวากยสัมพันธ์ การแยกวิเคราะห์ข้อความประเภทต่างๆ การดึงข้อมูล และฟิลด์สุ่มตามเงื่อนไข
  3. การประมวลผลวากยสัมพันธ์ - การกำหนด: การใช้การประมวลผลวากยสัมพันธ์เพื่อทำความเข้าใจโครงสร้างไวยากรณ์ของข้อความ
  4. การประมวลผลเชิงความหมาย: โมดูลนี้แนะนำการประมวลผลเชิงความหมาย เวกเตอร์ Word และการฝัง เทคนิคการสร้างแบบจำลองหัวข้อตามด้วยกรณีศึกษา
  5. การสร้าง Chatbots ด้วย Rasa: โมดูลนี้ครอบคลุมเครื่องมือที่ร้อนแรงที่สุดสำหรับการพัฒนา Chatbot พร้อมกับการใช้งาน

การเรียนรู้อย่างลึกซึ้ง

Deep Learning ใช้กันอย่างแพร่หลายในอุตสาหกรรมในแอปพลิเคชันล้ำสมัยมากมายสำหรับข้อมูลประเภทต่างๆ ในส่วนนี้ Neural Networks ทุกประเภทจะครอบคลุมพร้อมกับการใช้งาน

5 โมดูลที่ครอบคลุมคือ:

  1. บทนำสู่โครงข่ายประสาทเทียม: โมดูลนี้ครอบคลุมพื้นฐานของโครงข่ายประสาทเทียม ฟังก์ชันการเปิดใช้งาน และเครือข่ายฟีดฟอร์เวิร์ด
  2. Convolutional Neural Network-Industry Applications: โมดูลนี้ครอบคลุมรายละเอียดเกี่ยวกับ CNN โครงสร้าง เลเยอร์ และการทำงาน นอกจากนี้ยังครอบคลุมถึงโมเดล Transfer Learning ที่หลากหลาย การถ่ายโอนสไตล์ และการประมวลผลข้อมูลล่วงหน้าของข้อมูลรูปภาพ ตามด้วยกรณีศึกษา
  3. Neural Networks-Assignment: กรณีศึกษาของ CNN
  4. Recurrent Neural Networks: โมดูลนี้ครอบคลุมเครือข่ายประสาทประเภทอื่นที่ใช้เป็นพิเศษสำหรับข้อมูลตามลำดับ - RNN และ LSTM พร้อมกับการใช้งาน
  5. โครงการ Neural Networks: ในโมดูลนี้ คุณจะทำโปรเจ็กต์การรู้จำท่าทางโดยใช้สแต็กเครือข่าย CNN และ RNN

การเรียนรู้การเสริมแรง

ในส่วนนี้ เราจะแนะนำให้คุณรู้จักกับ Machine Learning อีกประเภทหนึ่ง – Reinforcement Learning คุณจะได้เรียนรู้พื้นฐานต่างๆ รวมถึงการเรียนรู้การเสริมแรงแบบคลาสสิกและการเรียนรู้การเสริมแรงแบบลึก

ส่วนนี้ครอบคลุมด้านล่าง 4 โมดูล:

  1. การเรียนรู้การเสริมแรงแบบคลาสสิก: โมดูลนี้ครอบคลุมพื้นฐานของ RL เช่น กระบวนการตัดสินใจของมาร์คอฟ สมการ RL รวมถึงวิธีมอนติคาร์โล
  2. Assignment-Classical Reinforcement Learning: การมอบหมายงานแบบโอเอกซ์โดยใช้ RL
  3. Deep Reinforcement Learning: ในโมดูลนี้ เราจะเจาะลึกลงไปใน Deep Q Networks สถาปัตยกรรมและการใช้งาน นอกจากนี้ยังครอบคลุมหัวข้อขั้นสูง เช่น วิธีการไล่ระดับนโยบายและวิธีนักวิจารณ์
  4. โครงการเรียนรู้การเสริมกำลัง: การมอบหมายให้ทำโดยใช้สถาปัตยกรรม RL

โครงการ Capstone

ในส่วนนี้ คุณจะสร้างโปรเจ็กต์หลักขั้นสุดท้ายโดยใช้ความรู้ทั้งหมดที่ได้รับจนถึงตอนนี้

ส่วนนี้แบ่งออกเป็น 2 โมดูล:

  1. การ ปรับใช้: โมดูลนี้ครอบคลุมระยะหลังของโปรเจ็กต์ Machine Learning ซึ่งคุณจะได้เรียนรู้พื้นฐานการปรับใช้บนคลาวด์และ PaaS รวมถึงไปป์ไลน์ CI/CD และพื้นฐานของ Docker
  2. Capstone: โครงการสุดท้ายที่จะทำให้ประวัติย่อและผลงานของคุณพุ่งสูงขึ้น

ก่อนที่คุณจะไป

โปรแกรมนี้ครอบคลุมพื้นฐานที่จำเป็นทั้งหมด รวมถึงเครื่องมือและทักษะขั้นสูงเพื่อเข้าสู่อุตสาหกรรม Data Science และ Machine Learning คุณจะต้องผ่านการฝึกปฏิบัติและโครงงานต่างๆ ที่เพียงพอเพื่อให้แน่ใจว่าคุณได้เรียนรู้เป็นอย่างดี

ด้วยทักษะที่เรียนรู้ทั้งหมด คุณสามารถใช้งานบนแพลตฟอร์มการแข่งขันอื่นๆ รวมทั้งทดสอบทักษะของคุณและลงมือปฏิบัติจริงได้มากขึ้น

การเรียนรู้ของเครื่องคืออะไร?

การเรียนรู้ของเครื่องเป็นสาขาวิชาวิทยาการคอมพิวเตอร์ที่ช่วยให้คอมพิวเตอร์สามารถเรียนรู้ได้โดยไม่ต้องตั้งโปรแกรมไว้อย่างชัดเจน ทำให้คอมพิวเตอร์สามารถเรียนรู้ได้โดยไม่ต้องตั้งโปรแกรมไว้อย่างชัดเจน การเรียนรู้ด้วยเครื่องเป็นวินัยทางวิทยาศาสตร์ที่ศึกษาการสร้างและศึกษาอัลกอริทึมที่สามารถเรียนรู้และคาดการณ์ข้อมูลได้ จากคำชี้แจงปัญหา แมชชีนเลิร์นนิงมุ่งเน้นไปที่การสร้างแบบจำลองการคาดการณ์จากข้อมูล/คุณลักษณะที่กำหนด และสร้างสมมติฐานเกี่ยวกับความน่าจะเป็นของผลลัพธ์ตามคุณลักษณะที่มีอยู่ในข้อมูล

แอพพลิเคชั่นของการเรียนรู้ของเครื่องคืออะไร?

โดยทั่วไป แมชชีนเลิร์นนิงเป็นปัญญาประดิษฐ์ชนิดหนึ่งที่เกี่ยวข้องกับคอมพิวเตอร์หรือโปรแกรมเพื่อเรียนรู้และคาดการณ์ตามข้อมูล แมชชีนเลิร์นนิงใช้กันอย่างแพร่หลายในการจดจำภาพ การประมวลผลภาษาธรรมชาติ และด้านอื่นๆ ในขณะที่ความก้าวหน้าครั้งใหม่ในการเรียนรู้เชิงลึกและข้อมูลขนาดใหญ่ทำให้ AI เข้าใกล้ความเป็นจริงมากขึ้น ปัจจุบัน แมชชีนเลิร์นนิงกำลังถูกใช้ในเกือบทุกภาคส่วนที่สำคัญ รวมถึงการดูแลสุขภาพ การขนส่งและโลจิสติกส์ เกษตรกรรม อีคอมเมิร์ซ ฯลฯ

จะสร้างโมเดลแมชชีนเลิร์นนิงได้อย่างไร?

โมเดลแมชชีนเลิร์นนิงจะเรียนรู้จากข้อมูลการฝึกที่มีป้ายกำกับ และทำการคาดการณ์หรือจัดประเภทกับข้อมูลใหม่ที่ไม่เคยปรากฏมาก่อน มันขึ้นอยู่กับทฤษฎีการเรียนรู้ทางสถิติ แต่มีการเพิ่มประสิทธิภาพ การสร้างแบบจำลอง และการเข้ารหัสจำนวนมาก โมเดลแมชชีนเลิร์นนิงจึงมี 2 ส่วนคือ โมเดลและอัลกอริธึมการเรียนรู้ ส่วนของแบบจำลองจะแสดงเป็นแบบจำลองทางคณิตศาสตร์ เช่น ต้นไม้หรือแผนผังการตัดสินใจ และอัลกอริธึมการเรียนรู้จะแสดงด้วยชุดข้อมูลในอดีต อัลกอริธึมการเรียนรู้จะเรียนรู้จากชุดข้อมูลและปรับโมเดลให้เหมาะสมเพื่อสร้างสมดุลระหว่างข้อผิดพลาดและความซับซ้อนของโมเดล ยิ่งโมเดลของคุณมีความแม่นยำมากขึ้นและโมเดลยิ่งเรียบง่ายมากเท่าไหร่ก็ยิ่งดีเท่านั้น