แมชชีนเลิร์นนิงภายใต้การดูแลคืออะไร อัลกอริทึม ตัวอย่าง

เผยแพร่แล้ว: 2021-06-22

แมชชีนเลิร์นนิงมีอยู่ทุกที่ ตั้งแต่หน่วยงานภาครัฐ บริการค้าปลีก และสถาบันการเงิน ไปจนถึงภาคการดูแลสุขภาพ ความบันเทิง และการขนส่ง มันมีความเกี่ยวข้องอย่างซับซ้อนกับชีวิตประจำวันของเรา ไม่ว่าจะเป็น Netflix หรือ Amazon ที่ให้คำแนะนำออนไลน์หรือการปลดล็อกสมาร์ทโฟนของคุณด้วยเทคโนโลยีการตรวจจับใบหน้า การเรียนรู้ของเครื่อง และปัญญาประดิษฐ์ได้รับแรงผลักดันอย่างที่ไม่เคยมีมาก่อน

เนื่องจากแมชชีนเลิร์นนิงเป็นหนึ่งในเทรนด์เทคโนโลยีที่ได้รับความนิยมมากที่สุดในขณะนี้ จึงจำเป็นต้องรู้เกี่ยวกับวิธีการหลักวิธีหนึ่งในการสร้างปัญญาประดิษฐ์ – แมชชีนเลิร์นนิงภายใต้การดูแล

สารบัญ

แมชชีนเลิร์นนิงภายใต้การดูแลคืออะไร

แมชชีนเลิร์นนิงภายใต้การดูแลเป็นแมชชีนเลิร์นนิงประเภทหนึ่งที่อัลกอริทึมของคอมพิวเตอร์ได้รับการฝึกอบรมโดยใช้ข้อมูลอินพุตที่มีป้ายกำกับ และคอมพิวเตอร์จะคาดการณ์ผลลัพธ์สำหรับข้อมูลที่ไม่คาดคิด ในที่นี้ "ติดป้ายกำกับ" หมายความว่าข้อมูลบางส่วนจะถูกแท็กด้วยคำตอบที่ถูกต้องแล้วเพื่อช่วยให้เครื่องเรียนรู้ ในการเรียนรู้ภายใต้การดูแล ข้อมูลที่ป้อนเข้าที่ป้อนให้กับคอมพิวเตอร์ทำงานเหมือนหัวหน้างานหรือครูในการฝึกอบรมเครื่องเพื่อให้ได้ผลลัพธ์ที่แม่นยำโดยการตรวจจับรูปแบบและความสัมพันธ์ที่แฝงอยู่ระหว่างข้อมูลอินพุตและป้ายกำกับเอาต์พุต

ประเภทของอัลกอริทึมการเรียนรู้ภายใต้การดูแล

มีอัลกอริธึมการเรียนรู้ภายใต้การดูแลหลายประเภทเพื่อให้ได้ผลลัพธ์ที่เฉพาะเจาะจง ให้เราดูที่บางประเภทที่พบบ่อยที่สุด

1. การจำแนกประเภท

อัลกอริธึมการจำแนกประเภทใช้ข้อมูลการฝึกที่มีป้ายกำกับเพื่อจัดเรียงอินพุตตามจำนวนคลาสหรือหมวดหมู่ที่กำหนด ในที่นี้ ตัวแปรเอาต์พุตคือหมวดหมู่ เช่น 'ใช่' หรือ 'ไม่ใช่' และ 'จริง' หรือ 'เท็จ' การจัดหมวดหมู่รายงานทางการแพทย์เป็นเชิงบวก (โรค) หรือเชิงลบ (ไม่มีโรค) หรือการแบ่งประเภทภาพยนตร์ออกเป็นประเภทต่าง ๆ เป็นบางตัวอย่างที่ใช้อัลกอริธึมการจำแนกประเภท

2. การถดถอย

ตัวแบบการถดถอยจะใช้เมื่อมีความสัมพันธ์เชิงตัวเลขระหว่างตัวแปรอินพุตและเอาต์พุต อัลกอริธึมการถดถอยที่อยู่ภายในขอบเขตของการเรียนรู้ภายใต้การดูแล ได้แก่ การถดถอยเชิงเส้น การถดถอยแบบไม่เชิงเส้น ต้นไม้การถดถอย การถดถอยพหุนาม และการถดถอยเชิงเส้นแบบเบย์ โมเดลดังกล่าวใช้เป็นหลักในการคาดการณ์ตัวแปรต่อเนื่อง เช่น การคาดเดาแนวโน้มของตลาด การพยากรณ์อากาศ หรือการกำหนดอัตราการคลิกผ่านในโฆษณาออนไลน์ในช่วงเวลาที่กำหนดตลอดทั้งวัน

เข้าร่วม หลักสูตร Machine Learning Online จากมหาวิทยาลัยชั้นนำของโลก – ปริญญาโท, Executive Post Graduate Programme และ Advanced Certificate Program ใน ML & AI เพื่อติดตามอาชีพของคุณอย่างรวดเร็ว

3. โครงข่ายประสาทเทียม

อัลกอริธึมโครงข่ายประสาทเทียมใช้สำหรับตีความข้อมูลทางประสาทสัมผัส การจดจำรูปแบบ หรือการจัดกลุ่มอินพุตดิบ แม้ว่าอัลกอริธึมนี้มีข้อดีหลายประการ แต่ก็ค่อนข้างท้าทายที่จะใช้โครงข่ายประสาทเทียมเมื่อมีการสังเกตมากเกินไป แอปพลิเคชั่นยอดนิยมในชีวิตจริงของโครงข่ายประสาทเทียม ได้แก่ การดึงข้อมูล การจำแนกข้อความ การรู้จำคำพูดและอักขระ การสรุปเอกสารหลายชุด การสร้างภาษา และอื่นๆ

4. โมเดลเบเซียนไร้เดียงสา

Naive Bayes Classifiers ไม่ใช่อัลกอริธึมเดียว แต่เป็นชุดของอัลกอริธึมตามทฤษฎีบทของเบย์ส์ หลักการมาตรฐานที่เป็นรากฐานของอัลกอริธึมเหล่านี้คือคุณลักษณะที่จัดประเภททุกคู่เป็นอิสระจากกัน ป้ายชื่อคลาสถูกกำหนดโดยใช้กราฟ acyclic โดยตรงที่ประกอบด้วยโหนดย่อยหลายโหนดและโหนดหลักหนึ่งโหนด โหนดย่อยแต่ละโหนดจะถือว่าแยกจากกันและเป็นอิสระจากพาเรนต์ แอปพลิเคชั่นยอดนิยมในชีวิตจริงของอัลกอริธึม Naive Bayesian รวมถึงการกรองสแปมและการวิเคราะห์ความคิดเห็น

5. ต้นไม้แห่งการตัดสินใจ

แผนผังการตัดสินใจเป็นแบบจำลองที่คล้ายกับแผนผังลำดับงานซึ่งมีคำสั่งควบคุมแบบมีเงื่อนไขเพื่อเปรียบเทียบการตัดสินใจและผลที่ตามมา โครงสร้างการตัดสินใจสร้างกราฟแบบต้นไม้โดยที่โหนดภายในแสดงถึงจุดที่เราเลือกแอตทริบิวต์และถามคำถาม โหนดปลายสุดแสดงถึงป้ายกำกับระดับหรือผลลัพธ์จริง และขอบแทนคำตอบของคำถาม

6. รองรับ Vector Machine

Support Vector Machine (SVM) อิงตามทฤษฎีการเรียนรู้ทางสถิติของ Vap Nick และได้รับการพัฒนาในปี 1990 ในแง่ที่ง่ายที่สุด เครื่องเวกเตอร์สนับสนุนคือชุดของวิธีการเรียนรู้ภายใต้การดูแลที่ใช้สำหรับการถดถอย การจำแนกประเภท และการตรวจจับค่าผิดปกติ มีความเกี่ยวข้องอย่างใกล้ชิดกับเครือข่ายเคอร์เนลและค้นหาแอปพลิเคชันในด้านต่างๆ เช่น การจดจำรูปแบบ ชีวสารสนเทศ และการดึงข้อมูลมัลติมีเดีย

7. โมเดลป่าสุ่ม

แบบจำลองสุ่มป่าประกอบด้วยชุดของต้นไม้ตัดสินใจแต่ละต้น โดยที่ต้นไม้แต่ละต้นให้การทำนายชั้นเรียน และชั้นเรียนที่มีคะแนนโหวตสูงสุดเป็นการทำนายของแบบจำลอง แนวคิดเบื้องหลังแนวคิดของแบบจำลองป่าสุ่มคือต้นไม้หรือแบบจำลองที่ไม่สัมพันธ์กันจำนวนมากที่ทำงานในกลุ่มจะทำให้เกิดการทำนายที่แม่นยำมากกว่าการทำนายแต่ละรายการ นี่เป็นเพราะต้นไม้ปกป้องซึ่งกันและกันจากข้อผิดพลาดที่เป็นอิสระ

มันทำงานอย่างไร?

การเรียนรู้ภายใต้การดูแลเกี่ยวข้องกับโมเดลการฝึกอบรมโดยใช้ชุดข้อมูลที่มีป้ายกำกับ เพื่อให้พวกเขาสามารถเรียนรู้เกี่ยวกับข้อมูลแต่ละประเภทได้ หลังจากการฝึกอบรมเสร็จสิ้น แบบจำลองจะได้รับข้อมูลการทดสอบเพื่อระบุและคาดการณ์ผลลัพธ์

มาดูตัวอย่างง่ายๆ เพื่ออธิบายแนวคิดเพิ่มเติม

สมมติว่าคุณได้รับลังที่ประกอบด้วยผักหลายชนิด ในแนวทางการเรียนรู้ด้วยเครื่องภายใต้การดูแล ขั้นตอนแรกของคุณคือการทำความคุ้นเคยกับผักต่างๆ ทีละน้อยด้วยวิธีนี้:

  • หากวัตถุมีลักษณะเป็นหลอดไฟและสีม่วงอมชมพู วัตถุนั้นจะถูกระบุว่าเป็น – หัวหอม
  • หากวัตถุมีใบและมีสีเขียว วัตถุนั้นจะถูกระบุว่าเป็น – ผักโขม

เมื่อคุณฝึกเครื่องจักรแล้ว คุณต้องให้ผักแยกจากลัง (เช่น หัวหอม) และขอให้ระบุ เนื่องจากเครื่องได้เรียนรู้เกี่ยวกับผักจากข้อมูลก่อนหน้านี้แล้ว จึงจะจัดประเภทวัตถุใหม่ตามรูปร่างและสี และยืนยันผลที่ได้เป็นหัวหอม ด้วยวิธีนี้ เครื่องจะเรียนรู้หรือฝึกจากข้อมูลการฝึก (ลังที่มีผัก) และนำความรู้ไปใช้กับข้อมูลใหม่ที่ไม่คาดคิด (ผักใหม่)

เช่นเดียวกับตัวอย่างผักที่เราใช้ข้างต้น ให้เราดู ตัวอย่างการเรียนรู้ภายใต้การดูแลอื่นเพื่อทำความเข้าใจวิธีการทำงาน

สมมติว่าเรามีชุดข้อมูลที่ประกอบด้วยรูปทรงต่างๆ เช่น สามเหลี่ยม สี่เหลี่ยม และห้าเหลี่ยม ขั้นตอนแรกคือการฝึกโมเดลสำหรับแต่ละร่างด้วยวิธีต่อไปนี้:

  • หากรูปร่างมีสามด้าน จะเขียนว่า – Triangle
  • หากรูปร่างมีสี่ด้านเท่ากัน จะเรียกว่า – Square
  • หากรูปร่างมีห้าด้านแล้วจะมีป้ายกำกับว่า – Pentagon

เมื่อการฝึกอบรมเสร็จสิ้น เราจะทดสอบแบบจำลองโดยใช้ข้อมูลการทดสอบ และงานของแบบจำลองคือการระบุรูปร่างตามความรู้ในการฝึกอบรม ดังนั้นเมื่อแบบจำลองพบรูปร่างใหม่ มันจะจัดประเภทตามจำนวนด้านและให้ผลลัพธ์

ข้อดีและความท้าทาย

จำเป็นต้องพูด การเรียนรู้ภายใต้การดูแลมีข้อดีหลายประการในการใช้โมเดลการเรียนรู้ของเครื่อง ประโยชน์บางประการมีดังต่อไปนี้:

  • โมเดลการเรียนรู้ภายใต้การดูแลสามารถทำนายผลลัพธ์ได้อย่างแม่นยำตามประสบการณ์ก่อนหน้า
  • การเรียนรู้ภายใต้การดูแลช่วยเพิ่มประสิทธิภาพการทำงานโดยใช้ประสบการณ์
  • การเรียนรู้ภายใต้การดูแลทำให้เรามีความคิดที่ชัดเจนและแม่นยำเกี่ยวกับคลาสของวัตถุ
  • สุดท้ายแต่ไม่ท้ายสุด อัลกอริธึมการเรียนรู้ภายใต้การดูแลมีความสำคัญอย่างยิ่งต่อการแก้ปัญหาต่างๆ ในโลกแห่งความเป็นจริงและค้นหาแอปพลิเคชันในภาคส่วนต่างๆ

ไม่ต้องสงสัยเลยว่าอัลกอริธึมการเรียนรู้ภายใต้การดูแลนั้นมีประโยชน์อย่างมาก โดยเฉพาะอย่างยิ่งในแง่ของศักยภาพในการจัดการกับความท้าทายแบบเรียลไทม์ อย่างไรก็ตาม การสร้างรูปแบบการเรียนรู้ภายใต้การดูแลที่ยั่งยืนและมีประสิทธิภาพนั้นมาพร้อมกับความท้าทายในตัวของมันเอง ลองมาดู:

  • กระบวนการทั้งหมดของรูปแบบการเรียนรู้ภายใต้การดูแลของการฝึกอบรมนั้นเป็นกระบวนการที่ต้องใช้เวลามาก
  • การควบคุมดูแลโมเดลการเรียนรู้มักต้องการความเชี่ยวชาญและทรัพยากรในระดับหนึ่งเพื่อจัดโครงสร้างและทำงานได้อย่างถูกต้อง
  • ตรงกันข้ามกับโมเดลการเรียนรู้แบบไม่มีผู้ดูแล โมเดลการเรียนรู้ภายใต้การดูแลไม่สามารถจัดประเภทหรือจัดกลุ่มข้อมูลด้วยตนเอง
  • โอกาสที่ความผิดพลาดของมนุษย์จะคืบคลานเข้าไปในชุดข้อมูลค่อนข้างสูง ซึ่งอาจนำไปสู่การฝึกอัลกอริทึมอย่างไม่ถูกต้อง

แนวทางปฏิบัติที่ดีที่สุดพร้อมตัวอย่าง

แนวทางปฏิบัติที่ดีที่สุดใดบ้างที่คุณควรจำไว้ก่อนที่จะเริ่มโครงการโดยใช้การเรียนรู้ของเครื่องภายใต้การดูแล ลองดูด้านล่าง

  • ตรวจสอบให้แน่ใจว่าคุณมีความชัดเจนเกี่ยวกับประเภทของข้อมูลที่คุณจะใช้เป็นชุดข้อมูลการฝึกอบรม
  • รวบรวมผลลัพธ์ที่เกี่ยวข้องจากการวัดมาตรฐานหรือผู้เชี่ยวชาญที่เป็นมนุษย์
  • ตัดสินใจโครงสร้างของอัลกอริทึมการเรียนรู้

ในที่สุดก็คุ้มค่าที่จะพูดถึงตัวอย่างในชีวิตจริงที่ดีที่สุดและเป็นที่นิยมมากที่สุดของการเรียนรู้ด้วยเครื่องภายใต้การดูแล

  • การวิเคราะห์เชิงทำนาย : กรณีการใช้งานอย่างแพร่หลายของการใช้แบบจำลองการเรียนรู้ภายใต้การดูแลสำหรับการวิเคราะห์เชิงคาดการณ์คือการให้ข้อมูลเชิงลึกที่มีความหมายและนำไปดำเนินการได้จริงในจุดข้อมูลทางธุรกิจต่างๆ ผลลัพธ์ที่ได้คือ องค์กรธุรกิจสามารถคาดการณ์ผลลัพธ์บางอย่างโดยอิงจากตัวแปรผลลัพธ์ที่กำหนด เพื่อพิสูจน์เหตุผลและสำรองการตัดสินใจ
  • การรู้จำวัตถุและภาพ : อัลกอริธึมการเรียนรู้ภายใต้การดูแลจะนำไปใช้ในการค้นหาและจำแนกวัตถุในภาพและวิดีโอ ซึ่งเป็นข้อกำหนดที่พบบ่อยในการวิเคราะห์ภาพและเทคนิคการมองเห็นด้วยคอมพิวเตอร์แบบต่างๆ
  • การตรวจหา สแปม : เทคนิคการตรวจหาและกรองสแปมใช้อัลกอริธึมการจำแนกประเภทภายใต้การดูแลเพื่อฝึกฐานข้อมูลเพื่อให้สามารถรับรู้รูปแบบในข้อมูลใหม่เพื่อการแยกสแปมและอีเมลที่ไม่ใช่สแปมอย่างมีประสิทธิภาพ
  • การวิเคราะห์ความรู้สึก : วิธีที่ยอดเยี่ยมในการส่งเสริมความผูกพันกับแบรนด์คือการทำความเข้าใจปฏิสัมพันธ์กับลูกค้า แมชชีนเลิร์นนิงภายใต้การดูแลสามารถช่วยในเรื่องนี้ได้โดยการแยกและจำแนกข้อมูลที่สำคัญจากชุดข้อมูลขนาดใหญ่ เช่น อารมณ์ ความตั้งใจ ความชอบของลูกค้า เป็นต้น

เรียนรู้แมชชีนเลิร์นนิงด้วย upGrad

ต้องการทำให้มันใหญ่ในด้านการเรียนรู้ของเครื่องและ AI หรือไม่? เริ่มต้นการเดินทางของคุณด้วยโปรแกรม Executive PG ของ upGrad ในการเรียนรู้ ของ เครื่องและ AI เป็นหลักสูตรการรับรองออนไลน์ที่ครอบคลุมซึ่งออกแบบมาสำหรับมืออาชีพที่ต้องการเรียนรู้ทักษะตามความต้องการ เช่น Deep Learning, Reinforcement Learning, NLP และโมเดลกราฟิก

นี่คือไฮไลท์บางส่วนของหลักสูตรที่คุณไม่ควรพลาด:

  • ใบรับรองการสำเร็จหลักสูตรจาก IIIT บังกาลอร์
  • การเรียนรู้มากกว่า 450 ชั่วโมงอัดแน่นไปด้วยเซสชันสด งานเขียนโค้ด กรณีศึกษา และโครงการต่างๆ
  • ครอบคลุมเครื่องมือ 20 ภาษา โปรแกรมภาษา และไลบรารี่อย่างครอบคลุม
  • ชั้นเรียนการเขียนโค้ดแบบสดและเวิร์กช็อปการสร้างโปรไฟล์

บทสรุป

รายงานการวิจัยตลาดล่าสุดโดย Technavio ในหัวข้อ Machine Learning Market โดยผู้ใช้ปลายทางและภูมิศาสตร์ – การคาดการณ์และการวิเคราะห์ปี 2020-2024 คาดการณ์ว่าขนาดตลาดแมชชีนเลิร์นนิงทั่วโลกจะมีการเติบโต 11.16 พันล้านดอลลาร์สหรัฐในช่วงระยะเวลาคาดการณ์ 2020-2024 ยิ่งไปกว่านั้น การเติบโตที่เพิ่มขึ้นทุกปีอย่างมั่นคงจะเป็นตัวขับเคลื่อนแรงผลักดันการเติบโตของตลาด

ทั้งแนวโน้มในปัจจุบันและการคาดการณ์ในอนาคตบ่งชี้ว่าการเรียนรู้ของเครื่องจะยังคงอยู่ อัลกอริธึมการเรียนรู้ภายใต้การดูแลเป็นพื้นฐานของโปรเจ็กต์แมชชีนเลิร์นนิงที่เกี่ยวข้องกับปัญหาการจำแนกประเภทและการถดถอยเป็นหลัก แม้จะมีความท้าทาย แต่อัลกอริธึมการเรียนรู้ภายใต้การดูแลก็มีประโยชน์มากที่สุดสำหรับการทำนายผลลัพธ์ตามประสบการณ์

เป็นผู้นำการปฏิวัติเทคโนโลยีที่ขับเคลื่อนด้วย AI

สมัครวิทยาศาสตรมหาบัณฑิตสาขาการเรียนรู้ของเครื่อง & AI