ความแตกต่างระหว่างการเรียนรู้ภายใต้การดูแลและการเรียนรู้ที่ไม่ได้อยู่ภายใต้การดูแล

เผยแพร่แล้ว: 2022-09-26

สารบัญ

บทนำ

เทคโนโลยีต่างๆ เช่น แมชชีนเลิร์นนิง ปัญญาประดิษฐ์ และการวิเคราะห์ข้อมูลเติบโตบนข้อมูลเพื่อทำให้งานที่ซับซ้อนเป็นไปโดยอัตโนมัติ การใช้ข้อมูลไม่ได้จำกัดอยู่เพียงการประมวลผลและการตีความเพื่อให้นำหน้าคู่แข่ง ให้บริการลูกค้าที่ดีขึ้น และสร้างกลยุทธ์ทางธุรกิจที่มีประสิทธิภาพ แต่ยังรวมถึงการฝึกอบรม ทดสอบ และประเมินรูปแบบอีกด้วย ในการเรียนรู้ของเครื่อง ข้อมูลแบ่งออกเป็นสามประเภท ข้อมูลการฝึกอบรม ข้อมูลการตรวจสอบความถูกต้อง และข้อมูลการทดสอบ ตามชื่อที่แนะนำ ข้อมูลการฝึกอบรมจะฝึกโมเดลหรืออัลกอริทึมในการเรียนรู้ของเครื่อง โมเดลจะเรียนรู้จากชุดข้อมูลการฝึกอบรมอินพุตและเอาต์พุต และคาดการณ์การจัดประเภทหรือทำงานเฉพาะ เราใช้ข้อมูลการฝึกอบรมสำหรับการเรียนรู้อัลกอริทึมทั้งแบบมีผู้ดูแลและแบบไม่มีผู้ดูแล

โปรแกรม AI & ML ของเราในสหรัฐอเมริกา

วิทยาศาสตรมหาบัณฑิตสาขาวิชา Machine Learning & AI จาก LJMU และ IIITB Executive PG Program in Machine Learning & Artificial Intelligence จาก IIITB
หากต้องการสำรวจหลักสูตรทั้งหมดของเรา โปรดไปที่หน้าด้านล่าง
หลักสูตรการเรียนรู้ของเครื่อง

บล็อกนี้กล่าวถึงแมชชีนเลิร์นนิงสองหมวดหมู่กว้างๆ – การเรียนรู้ภายใต้การดูแลและไม่ได้รับการดูแล และความแตกต่างในรายละเอียด

รับใบรับรองการเรียนรู้ของเครื่องจากมหาวิทยาลัยชั้นนำของโลก รับ Masters, Executive PGP หรือ Advanced Certificate Programs เพื่อติดตามอาชีพของคุณอย่างรวดเร็ว

การเรียนรู้ภายใต้การดูแลคืออะไร?

การเรียนรู้ภายใต้การดูแล ซึ่งเป็นชุดย่อยของแมชชีนเลิร์นนิงและปัญญาประดิษฐ์ เป็นเทคนิคการสอนอัลกอริทึมที่ใช้ข้อมูลที่ติดป้ายกำกับเพื่อฝึกอัลกอริทึม มันสอนอัลกอริทึมวิธีการทำงาน เช่น การจัดประเภทและการถดถอยในชุดข้อมูล ในการเรียนรู้ภายใต้การดูแล อัลกอริธึมรับตัวอย่างการฝึกอบรมอินพุต-เอาต์พุต และใช้ตัวอย่างเหล่านี้เพื่อสร้างความสัมพันธ์ระหว่างชุดข้อมูล เนื่องจากเราจัดเตรียมข้อมูลการฝึกอบรมที่มีป้ายกำกับให้กับอัลกอริทึมเพื่อทำงานภายใต้การดูแล เราจึงเรียกข้อมูลนั้นว่าการเรียนรู้ภายใต้การดูแล วัตถุประสงค์หลักของการเรียนรู้ภายใต้การดูแลคือการป้อนข้อมูลไปยังอัลกอริธึมเพื่อให้เข้าใจถึงความสัมพันธ์ระหว่างอินพุตและเอาต์พุต เมื่ออัลกอริธึมสร้างการเชื่อมต่อระหว่างอินพุตและเอาต์พุต ก็สามารถส่งมอบผลลัพธ์ที่สดใหม่จากอินพุตที่ใหม่กว่าได้อย่างแม่นยำ

ให้เราเข้าใจว่าการเรียนรู้ภายใต้การดูแลทำงานอย่างไร สมมติว่าในอัลกอริธึมการเรียนรู้ของเครื่อง เรามีอินพุต X และเอาต์พุต Y เราป้อนหรือจัดเตรียมอินพุต X ให้กับระบบการเรียนรู้ในแบบจำลอง ระบบการเรียนรู้นี้จะส่งผล Y' อนุญาโตตุลาการในระบบตรวจสอบความแตกต่างระหว่าง Y และ Y' และสร้างสัญญาณผิดพลาด สัญญาณนี้ส่งต่อไปยังระบบการเรียนรู้ที่เข้าใจความแตกต่างระหว่าง Y และ Y' และปรับพารามิเตอร์เพื่อลดความแตกต่างระหว่าง Y และ Y' โดยที่ Y คือข้อมูลที่มีป้ายกำกับ

กระบวนการเรียนรู้ภายใต้การดูแลประกอบด้วยหลายขั้นตอน

  • เริ่มแรก เราต้องกำหนดประเภทชุดข้อมูลการฝึกอบรม จากนั้นจึงรวบรวมข้อมูลการฝึกที่มีป้ายกำกับ เรายังจำเป็นต้องจัดเรียงข้อมูลที่แตกต่างกันสำหรับการจำแนกประเภทหรือการถดถอย
  • ขั้นตอนต่อไปคือการใช้อัลกอริธึมสำหรับการเรียนรู้ภายใต้การดูแล เช่น เครื่องเวกเตอร์สนับสนุนหรือแผนผังการตัดสินใจ จากนั้นกำหนดคุณสมบัติอินพุตสำหรับโมเดลการเรียนรู้
  • ตอนนี้ ดำเนินการตามกระบวนการเรียนรู้และปรับหรือควบคุมพารามิเตอร์
  • ขั้นตอนสุดท้ายเกี่ยวข้องกับการทดสอบความถูกต้องของแบบจำลอง

กระบวนการเรียนรู้ภายใต้การดูแลทั้งหมดจะฝึกระบบการเรียนรู้เพื่อปรับพารามิเตอร์ ดังนั้นอัลกอริทึมจึงให้ผลลัพธ์ที่ต่างกันน้อยที่สุด การเรียนรู้ภายใต้การดูแลช่วยอำนวยความสะดวกสองกระบวนการที่ซับซ้อนในการทำเหมืองข้อมูล – การจำแนกประเภทและการถดถอย ในการจัดหมวดหมู่ ข้อมูลจะถูกจัดหมวดหมู่หรือติดป้ายกำกับในคลาสต่างๆ ตามแอตทริบิวต์ที่คล้ายคลึงกัน เช่น ตัวกรองสแปม เราใช้การถดถอยเพื่อทำนายการสังเกตอย่างต่อเนื่อง เช่น ตลาดหุ้นหรืออัตราการเต้นของหัวใจ การถดถอยให้ค่าจำนวนจริง

ต่อไปนี้เป็นอัลกอริธึมการเรียนรู้ภายใต้การดูแลประเภทต่างๆ ดังต่อไปนี้:

  • Naive Bayes:- The Naive Bayes Classifier ขึ้นอยู่กับทฤษฎีบท Bayes อัลกอริธึมนี้อนุมานว่าคุณลักษณะทั้งหมดของคลาสนั้นเป็นอิสระจากกัน ตัวแยกประเภท Naive Bayes ใช้วิธีความน่าจะเป็นแบบมีเงื่อนไขเพื่อทำนายการจำแนกประเภท
  • รองรับ Vector Machine: - เป็นอัลกอริธึมการเรียนรู้ของเครื่องยอดนิยมสำหรับงานจำแนกประเภทและการถดถอย
  • การถดถอยเชิงเส้น:- อัลกอริทึมการถดถอยเชิงเส้นใช้การเรียนรู้ภายใต้การดูแลเพื่อทำนายผลลัพธ์ในอนาคต มันสร้างความสัมพันธ์ระหว่างตัวแปรตามหนึ่งตัวแปรและตัวแปรอิสระสองตัวหรือมากกว่า
  • Logistic Regression:- เราใช้อัลกอริทึมการถดถอยโลจิสติกเมื่อเรามีตัวแปรในหมวดหมู่ต่างๆ เช่น ใช่หรือไม่ใช่ และจริงหรือเท็จ เราใช้อัลกอริธึมการถดถอยโลจิสติกเป็นหลักในการแก้ปัญหาการจำแนกประเภทไบนารี

โดยสรุปแล้ว การเรียนรู้ภายใต้การดูแลจะใช้ในการฝึกโมเดลโดยใช้ข้อมูลอินพุตและเอาต์พุตที่รู้จักเพื่อสร้างการคาดคะเนสำหรับอินพุตชุดใหม่

Unsupervised Learning คืออะไร?

ต่างจากการเรียนรู้ภายใต้การดูแล เราไม่มีป้ายกำกับข้อมูลในการเรียนรู้แบบไม่มีผู้ดูแล ไม่มีความสัมพันธ์ที่กำหนดไว้ล่วงหน้าระหว่างชุดข้อมูลหรือผลลัพธ์ที่คาดการณ์ไว้ ตรงกันข้ามกับการเรียนรู้ภายใต้การดูแล การเรียนรู้โดยไม่ได้รับการดูแลจำเป็นต้องมีการแทรกแซงของมนุษย์ขั้นต่ำ ดังนั้นเราจึงเรียกว่าการเรียนรู้แบบไม่มีผู้ดูแล โมเดลใช้ชุดการสังเกตชุดข้อมูลและอธิบายคุณสมบัติของข้อมูลที่กำหนด การเรียนรู้แบบ Unsupervised อิงตามกรอบงานคลัสเตอร์เนื่องจากระบุกลุ่มต่างๆ ในชุดข้อมูล

ให้เราเข้าใจว่าการเรียนรู้แบบไม่มีผู้ดูแลทำงานอย่างไร สมมติว่าเรามีชุดอินพุตชื่อ X1, X2, X3…….Xt แต่ไม่มีเอาต์พุตเป้าหมาย ในกรณีนี้ เครื่องจะไม่ได้รับการตอบรับใดๆ จากสภาพแวดล้อม อย่างไรก็ตาม มันพัฒนากรอบการทำงานที่เป็นทางการและคาดการณ์ผลลัพธ์ในอนาคต ในการเรียนรู้แบบไม่มีผู้ดูแล ตัวแบบจะใช้อินพุตสำหรับการตัดสินใจและการสร้างตัวแทน เราไม่สามารถใช้การเรียนรู้แบบไม่มีผู้ดูแลสำหรับกระบวนการจำแนกประเภทและการถดถอยเนื่องจากไม่มีข้อมูลเอาต์พุต การใช้งานหลักของการเรียนรู้แบบ unsupervised คือการหาโครงสร้างพื้นฐานของชุดข้อมูลอินพุต เครื่องจัดเรียงข้อมูลในกลุ่มต่างๆ ตามการตีความหลังจากพบโครงสร้าง ขั้นตอนสุดท้ายคือการแสดงชุดข้อมูลในรูปแบบที่บีบอัด

วิศวกรส่วนใหญ่ใช้การเรียนรู้แบบไม่มีผู้ดูแลเพื่อวัตถุประสงค์สองประการ – การวิเคราะห์เชิงสำรวจและการลดขนาด การวิเคราะห์เชิงสำรวจดำเนินการตรวจสอบข้อมูลเบื้องต้นเพื่อจัดเรียงข้อมูลในกลุ่มต่างๆ สร้างสมมติฐาน และค้นพบรูปแบบ กระบวนการลดขนาดมิติจะลดจำนวนอินพุตในชุดข้อมูลที่กำหนด ข้อได้เปรียบที่สำคัญที่สุดของการเรียนรู้แบบไม่มีผู้ดูแล ได้แก่ การค้นหาข้อมูลเชิงลึกที่เกี่ยวข้อง การเรียนรู้โดยไม่ได้รับการดูแลส่วนใหญ่จะใช้ในการสร้างแอปพลิเคชัน AI เนื่องจากต้องมีการแทรกแซงของมนุษย์ขั้นต่ำ

การเรียนรู้ภายใต้การดูแลกับการเรียนรู้ที่ไม่ได้อยู่ภายใต้การดูแล

เมื่อคุณทราบแล้วว่าการเรียนรู้ภายใต้การดูแลและไม่ได้รับการดูแลคืออะไร ให้เราพิจารณาความแตกต่างที่สำคัญที่สุดของพวกเขา

  • ข้อมูล – การเรียนรู้ภายใต้การดูแลจะใช้ข้อมูลที่ติดป้ายกำกับ ในขณะที่การเรียนรู้ที่ไม่ได้รับการดูแลจะไม่ใช้ข้อมูลที่ติดป้ายกำกับ นอกจากนี้เรายังให้ข้อมูลผลลัพธ์แก่โมเดลในการเรียนรู้ภายใต้การดูแล อย่างไรก็ตาม ในการเรียนรู้แบบ unsupervised จะไม่มีข้อมูลที่ป้อนเข้ามา
  • คำติชม - โมเดลใช้คำติชมและปรับพารามิเตอร์ในการเรียนรู้ภายใต้การดูแล มันไม่ได้เกิดขึ้นในการเรียนรู้แบบไม่มีผู้ดูแล
  • เป้าหมาย – วัตถุประสงค์หลักของการเรียนรู้ภายใต้การดูแลคือการฝึกโมเดลโดยใช้ข้อมูลการฝึกอบรม ดังนั้น เมื่อมีอินพุตใหม่ เครื่องสามารถคาดการณ์เอาต์พุตได้อย่างแม่นยำ อย่างไรก็ตาม เนื่องจากไม่มีผลลัพธ์ในการเรียนรู้แบบไม่มีผู้ดูแล จึงใช้เพื่อรวบรวมข้อมูลเชิงลึกที่เกี่ยวข้องหรือรูปแบบที่ซ่อนอยู่ในข้อมูลที่กำหนด
  • การจำแนกประเภทและการถดถอย – เราสามารถจัดหมวดหมู่การเรียนรู้ภายใต้การดูแลเป็นการจำแนกและการถดถอย ซึ่งจะไม่เกิดขึ้นในการเรียนรู้แบบไม่มีผู้ดูแล
  • ปัญญาประดิษฐ์ – การเรียนรู้ภายใต้การดูแลไม่เกี่ยวข้องกับปัญญาประดิษฐ์ เนื่องจากเราต้องป้อนข้อมูลการฝึกอบรมลงในแบบจำลอง อย่างไรก็ตาม การเรียนรู้โดยไม่ได้รับการดูแลจะเป็นประโยชน์มากกว่าสำหรับปัญญาประดิษฐ์ เนื่องจากต้องมีการแทรกแซงของมนุษย์น้อยที่สุด
  • อัลกอริธึม – อัลกอริธึมการเรียนรู้ภายใต้การดูแล ได้แก่ Support Vector Machine, Naive Bayes, การถดถอยเชิงเส้น และการถดถอยโลจิสติก อัลกอริธึมการเรียนรู้แบบไม่มีผู้ดูแลประกอบด้วยการจัดกลุ่มและเพื่อนบ้านที่ใกล้ที่สุด K (KNN)
  • ความแม่นยำของผลลัพธ์ – เมื่อโมเดลได้รับผลลัพธ์ที่กำหนดไว้ล่วงหน้าในการเรียนรู้ภายใต้การดูแล ก็จะให้ผลลัพธ์ที่แม่นยำยิ่งขึ้น อย่างไรก็ตาม ผลลัพธ์ของการเรียนรู้แบบ unsupervised นั้นเป็นแบบอัตนัยและให้ผลลัพธ์ที่แม่นยำน้อยกว่า

บล็อกการเรียนรู้ของเครื่องยอดนิยมและปัญญาประดิษฐ์

IoT: ประวัติศาสตร์ ปัจจุบัน และอนาคต บทช่วยสอนการเรียนรู้ของเครื่อง: เรียนรู้ ML อัลกอริทึมคืออะไร? ง่ายและสะดวก
เงินเดือนวิศวกรหุ่นยนต์ในอินเดีย: บทบาททั้งหมด วันหนึ่งในชีวิตของวิศวกรแมชชีนเลิร์นนิง: พวกเขาทำอะไร? IoT คืออะไร (Internet of Things)
การเปลี่ยนแปลงและการรวมกัน: ความแตกต่างระหว่างการเปลี่ยนแปลงและการรวมกัน แนวโน้ม 7 อันดับแรกในปัญญาประดิษฐ์และการเรียนรู้ของเครื่อง แมชชีนเลิร์นนิงกับ R: ทุกสิ่งที่คุณต้องรู้

บทสรุป

การเรียนรู้แบบมีผู้ดูแลและการเรียนรู้แบบไม่มีผู้ดูแลเป็นแนวคิดพื้นฐานของการเรียนรู้ด้วยเครื่อง ซึ่งเป็นการวางรากฐานสำหรับการเรียนรู้แนวคิดที่ซับซ้อน หากคุณมีความสนใจในแมชชีนเลิร์นนิงและต้องการสร้างอาชีพในลักษณะเดียวกัน คุณสามารถเรียนหลักสูตรวิทยาศาสตรมหาบัณฑิตสาขาแมชชีนเลิร์นนิงและ AI จาก upGrad

ผู้นำในอุตสาหกรรมสอนหลักสูตรนี้เพื่อช่วยให้คุณได้รับความรู้เชิงทฤษฎีเชิงลึกเกี่ยวกับแมชชีนเลิร์นนิงและข้อมูลเชิงลึกเชิงปฏิบัติเกี่ยวกับเทคโนโลยีแมชชีนเลิร์นนิง นอกจากนี้ คุณยังได้รับโอกาสในการทำงานในกรณีศึกษาและโครงการต่างๆ เกี่ยวกับแมชชีนเลิร์นนิงเพื่อช่วยให้คุณได้รับทักษะที่เกี่ยวข้อง

คุณสามารถใช้การเรียนรู้แบบไม่มีผู้ดูแลได้เมื่อใด

การรวบรวมชุดข้อมูลการฝึกอบรมด้วยอินพุตและเอาต์พุตที่กำหนดไว้เป็นสิ่งที่ท้าทาย ในกรณีเช่นนี้ ควรใช้การเรียนรู้แบบไม่มีผู้ดูแลจะดีกว่า ในการเรียนรู้แบบ unsupervised โมเดลจะดึงการอนุมานจากข้อมูลอินพุตหากไม่มีข้อมูลเอาต์พุตหรือหากไม่มีการระบุป้ายกำกับ ดังนั้น คุณสามารถใช้การเรียนรู้แบบไม่มีผู้ดูแลได้ในกรณีที่คุณมีอินพุตแต่ไม่มีเอาต์พุตที่กำหนดไว้ การใช้การเรียนรู้แบบ unsupervised ที่ดีที่สุดอย่างหนึ่งคือการพัฒนาแอปพลิเคชันปัญญาประดิษฐ์

คุณควรใช้การเรียนรู้ภายใต้การดูแลเมื่อใด

อัลกอริทึมการเรียนรู้ภายใต้การดูแลจะใช้เมื่อคุณมีชุดข้อมูลอินพุตและเอาต์พุตที่แน่นอน คุณสามารถปรับเกณฑ์ประสิทธิภาพของโมเดลแมชชีนเลิร์นนิงให้เหมาะสมได้โดยการปรับพารามิเตอร์ การเรียนรู้ภายใต้การดูแลจะช่วยแก้ปัญหาการคำนวณในชีวิตจริง และสร้างแอปพลิเคชันสำหรับการรู้จำเสียงพูดและข้อความ การวิเคราะห์เชิงคาดการณ์ และการตรวจจับสแปม

ข้อมูลที่มีป้ายกำกับในการเรียนรู้ภายใต้การดูแลคืออะไร

ข้อมูลที่มีป้ายกำกับ หมายถึงชุดข้อมูลที่ทำเครื่องหมายหรือจัดหมวดหมู่ตามคุณสมบัติหรือลักษณะเฉพาะ ในการเรียนรู้ภายใต้การดูแล ข้อมูลการฝึกอบรมที่เราใช้เป็นเกณฑ์มาตรฐานสำหรับการฝึกอบรมรูปแบบการเรียนรู้จะเรียกว่าข้อมูลที่มีป้ายกำกับ