6 ประเภทของการเรียนรู้ภายใต้การดูแลที่คุณต้องรู้ในปี 2022

เผยแพร่แล้ว: 2021-01-10

แมชชีนเลิร์นนิงเป็นหนึ่งในแอปพลิเคชันทั่วไปของปัญญาประดิษฐ์ เครื่องเรียนรู้ที่จะดำเนินงานจากข้อมูลที่ป้อนเข้าไป และด้วยประสบการณ์ ทำให้ประสิทธิภาพในการทำงานดีขึ้น แมชชีนเลิร์นนิงรวมถึงเทคนิคการเรียนรู้ภายใต้การดูแล ไม่ได้รับการดูแล และเสริมกำลัง อ่านเพิ่มเติมเกี่ยวกับประเภทของการเรียนรู้ของเครื่อง

ในบทความนี้ เราจะ พิจารณา การเรียนรู้ภายใต้การดูแลประเภทต่างๆ

สารบัญ

การเรียนรู้ภายใต้การดูแลคืออะไร?

ใน Supervised Learning เครื่องจะได้รับการฝึกอบรมโดยใช้ข้อมูลที่ 'ติดป้ายกำกับ' กล่าวกันว่าชุดข้อมูลจะติดป้ายกำกับเมื่อมีพารามิเตอร์อินพุตและเอาต์พุต กล่าวอีกนัยหนึ่ง ข้อมูลได้ถูกแท็กด้วยคำตอบที่ถูกต้องแล้ว

ดังนั้น เทคนิคนี้จึงเลียนแบบสภาพแวดล้อมในห้องเรียนที่นักเรียนเรียนรู้ต่อหน้าหัวหน้างานหรือครู ในทางกลับกัน อัลกอริธึมการเรียนรู้แบบไม่มีผู้ดูแลช่วยให้โมเดลค้นพบข้อมูลและเรียนรู้ด้วยตนเอง

แมชชีนเลิร์นนิงภายใต้การดูแลมีประโยชน์อย่างมากในการแก้ปัญหาการคำนวณในโลกแห่งความเป็นจริง อัลกอริธึมทำนายผลลัพธ์สำหรับข้อมูลที่ไม่คาดฝันโดยการเรียนรู้จากข้อมูลการฝึกที่มีป้ายกำกับ ดังนั้นจึงต้องใช้นักวิทยาศาสตร์ข้อมูลที่มีทักษะสูงในการสร้างและปรับใช้โมเดลดังกล่าว เมื่อเวลาผ่านไป นักวิทยาศาสตร์ด้านข้อมูลยังใช้ความเชี่ยวชาญด้านเทคนิคเพื่อสร้างแบบจำลองขึ้นใหม่เพื่อรักษาความสมบูรณ์ของข้อมูลเชิงลึกที่ให้ไว้

มันทำงานอย่างไร?

ตัวอย่างเช่น คุณต้องการฝึกเครื่องจักรในการคาดคะเนเวลาเดินทางระหว่างสำนักงานและบ้านของคุณ ขั้นแรก คุณจะต้องสร้างชุดข้อมูลที่มีป้ายกำกับ เช่น สภาพอากาศ ช่วงเวลาของวัน เส้นทางที่เลือก ฯลฯ ซึ่งจะประกอบด้วยข้อมูลที่คุณป้อน และผลลัพธ์จะเป็นระยะเวลาโดยประมาณของการเดินทางกลับบ้านในวันที่กำหนด

เมื่อคุณสร้างชุดการฝึกอบรมตามปัจจัยที่เกี่ยวข้องแล้ว เครื่องจะมองเห็นความสัมพันธ์ระหว่างจุดข้อมูลและใช้เพื่อระบุระยะเวลาที่คุณจะขับรถกลับบ้าน ตัวอย่างเช่น แอปพลิเคชันมือถือสามารถบอกคุณได้ว่าเวลาเดินทางของคุณจะนานขึ้นเมื่อมีฝนตกหนัก

เครื่องอาจเห็นการเชื่อมต่ออื่นๆ ในข้อมูลที่ติดป้ายกำกับ เช่น เวลาที่คุณออกจากที่ทำงาน คุณสามารถกลับบ้านได้เร็วกว่านี้หากคุณเริ่มก่อนการจราจรติดขัดในชั่วโมงเร่งด่วน อ่านเพิ่มเติมหากคุณอยากรู้ว่าแมชชีนเลิร์นนิงทำงานอย่างไร

ตอนนี้ ให้เราพยายามทำความเข้าใจการเรียนรู้ภายใต้การดูแลโดยใช้ตัวอย่างในชีวิตจริงอีกตัวอย่างหนึ่ง สมมติว่าคุณมีตะกร้าผลไม้ และคุณฝึกเครื่องจักรด้วยผลไม้ประเภทต่างๆ ข้อมูลการฝึกอบรมอาจรวมถึงสถานการณ์เหล่านี้:

  • หากวัตถุมีสีแดง มีรูปร่างกลม และมีรอยกดทับด้านบน ให้ระบุว่าเป็น "แอปเปิ้ล"
  • หากสินค้ามีสีเขียวแกมเหลืองและมีรูปร่างเป็นทรงกระบอกโค้ง ให้ทำเครื่องหมายเป็น 'กล้วย'

ถัดไป คุณให้วัตถุใหม่ (ข้อมูลทดสอบ) และขอให้เครื่องระบุว่าเป็นกล้วยหรือแอปเปิ้ล โดยจะเรียนรู้จากข้อมูลการฝึกและนำความรู้ไปจำแนกผลไม้ตามสีและรูปทรงที่ป้อน

T ประเภทต่างๆของการเรียนรู้ภายใต้การดูแล

1. การถดถอย

ในการถดถอย ค่าเอาต์พุตเดียวถูกสร้างขึ้นโดยใช้ข้อมูลการฝึกอบรม ค่านี้เป็นการตีความความน่าจะเป็น ซึ่งตรวจสอบได้หลังจากพิจารณาความแรงของสหสัมพันธ์ระหว่างตัวแปรอินพุต ตัวอย่างเช่น การถดถอยสามารถช่วยทำนายราคาบ้านตามท้องที่ ขนาด ฯลฯ

ในการถดถอยโลจิสติก เอาต์พุตมีค่าที่ไม่ต่อเนื่องตามชุดของตัวแปรอิสระ วิธีนี้สามารถดิ้นรนเมื่อต้องรับมือกับขอบเขตการตัดสินใจที่ไม่เป็นเชิงเส้นและหลายขอบเขต นอกจากนี้ยังไม่ยืดหยุ่นพอที่จะบันทึกความสัมพันธ์ที่ซับซ้อนในชุดข้อมูล

2. การจำแนกประเภท

มันเกี่ยวข้องกับการจัดกลุ่มข้อมูลเป็นคลาส หากคุณกำลังคิดที่จะให้เครดิตแก่บุคคลใดบุคคลหนึ่ง คุณสามารถใช้การจัดประเภทเพื่อกำหนดว่าบุคคลนั้นจะเป็นผู้ผิดนัดเงินกู้หรือไม่ เมื่ออัลกอริธึมการเรียนรู้ภายใต้การดูแลระบุข้อมูลอินพุตออกเป็นสองคลาสที่แตกต่างกัน จะเรียกว่าการจำแนกแบบไบนารี การจำแนกหลายประเภทหมายถึงการจัดหมวดหมู่ข้อมูลเป็นมากกว่าสองคลาส

3. Naive Bayesian Model

แบบจำลองการจัดประเภทแบบเบย์ใช้สำหรับชุดข้อมูลจำกัดขนาดใหญ่ เป็นวิธีการกำหนดป้ายกำกับคลาสโดยใช้กราฟ acyclic โดยตรง กราฟประกอบด้วยโหนดหลักหนึ่งโหนดและโหนดย่อยหลายโหนด และโหนดย่อยแต่ละโหนดจะถือว่าเป็นอิสระและแยกจากพาเรนต์

ต้นไม้ตัดสินใจ

โครงสร้างการตัดสินใจเป็นแบบจำลองที่คล้ายกับผังงานซึ่งมีคำสั่งควบคุมแบบมีเงื่อนไข ซึ่งประกอบด้วยการตัดสินใจและผลที่ตามมา ผลลัพธ์เกี่ยวข้องกับการติดฉลากข้อมูลที่ไม่คาดฝัน

ในการแทนแบบต้นไม้ โหนดปลายสุดจะสอดคล้องกับป้ายชื่อคลาส และโหนดภายในแสดงถึงแอตทริบิวต์ ต้นไม้การตัดสินใจสามารถใช้ในการแก้ปัญหาด้วยคุณลักษณะที่ไม่ต่อเนื่องและฟังก์ชันบูลีน อัลกอริธึมแผนผังการตัดสินใจที่โดดเด่นบางส่วน ได้แก่ ID3 และ CART

4. แบบจำลองป่าสุ่ม

แบบจำลองป่าสุ่มเป็นวิธีการทั้งมวล มันทำงานโดยการสร้างต้นไม้ตัดสินใจจำนวนมากและแสดงผลการจำแนกประเภทของต้นไม้แต่ละต้น สมมติว่าคุณต้องการคาดเดาว่านักศึกษาระดับปริญญาตรีคนใดจะมีผลการเรียน GMAT ได้ดี ซึ่งเป็นการทดสอบเพื่อเข้าศึกษาในหลักสูตรการจัดการระดับบัณฑิตศึกษา แบบจำลองป่าสุ่มจะทำงานให้สำเร็จ โดยพิจารณาจากปัจจัยด้านประชากรศาสตร์และการศึกษาของนักเรียนกลุ่มหนึ่งที่เคยทำแบบทดสอบมาก่อน

5. โครงข่ายประสาทเทียม

อัลกอริทึมนี้ออกแบบมาเพื่อจัดกลุ่มอินพุตดิบ จดจำรูปแบบ หรือตีความข้อมูลทางประสาทสัมผัส แม้จะมีข้อดีหลายประการ แต่โครงข่ายประสาทเทียมก็ต้องการทรัพยากรในการคำนวณที่สำคัญ การติดตั้งโครงข่ายประสาทเทียมอาจซับซ้อนขึ้นเมื่อมีการสังเกตหลายพันครั้ง อัลกอริทึมนี้เรียกอีกอย่างว่า "กล่องดำ" เนื่องจากการตีความตรรกะที่อยู่เบื้องหลังการคาดการณ์อาจเป็นเรื่องที่ท้าทาย

อ่าน : 10 อันดับสถาปัตยกรรมโครงข่ายประสาทเทียมในปี 2020

6. รองรับ Vector Machines

Support Vector Machine (SVM) เป็นอัลกอริธึมการเรียนรู้ภายใต้การดูแลที่พัฒนาขึ้นในปี 1990 โดยดึงมาจากทฤษฎีการเรียนรู้ทางสถิติที่พัฒนาโดย Vap Nick

SVM แยกไฮเปอร์เพลนออก ซึ่งทำให้เป็นตัวแยกประเภท เอาต์พุตถูกผลิตขึ้นในรูปแบบของไฮเปอร์เพลนที่เหมาะสมที่สุดซึ่งจัดหมวดหมู่ตัวอย่างใหม่ SVM มีการเชื่อมต่ออย่างใกล้ชิดกับเคอร์เนลเฟรมเวิร์กและใช้ในฟิลด์ที่หลากหลาย ตัวอย่างบางส่วน ได้แก่ ชีวสารสนเทศ การจดจำรูปแบบ และการดึงข้อมูลมัลติมีเดีย

ข้อดีและข้อเสียของการเรียนรู้ภายใต้การดูแล

การเรียนรู้ภายใต้การดูแล หลาย ประเภท ช่วยให้คุณสามารถรวบรวมและสร้างข้อมูลจากประสบการณ์ก่อนหน้านี้ได้ ตั้งแต่การปรับเกณฑ์ประสิทธิภาพให้เหมาะสมจนถึงการจัดการกับปัญหาในโลกแห่งความเป็นจริง การเรียนรู้ภายใต้การดูแลได้กลายเป็นเครื่องมือที่ทรงพลังในด้าน AI นอกจากนี้ยังเป็นวิธีที่น่าเชื่อถือมากกว่าเมื่อเปรียบเทียบกับการเรียนรู้แบบไม่มีผู้ดูแล ซึ่งอาจมีความซับซ้อนทางคอมพิวเตอร์และแม่นยำน้อยกว่าในบางกรณี

อย่างไรก็ตาม การเรียนรู้ภายใต้การดูแลไม่ได้ไร้ข้อจำกัด ตัวอย่างที่เป็นรูปธรรมจำเป็นสำหรับตัวแยกประเภทการฝึกอบรม และขอบเขตการตัดสินใจสามารถ overtrained ได้หากไม่มีตัวอย่างที่เหมาะสม เราอาจประสบปัญหาในการจำแนกข้อมูลขนาดใหญ่

สรุป

การเรียนรู้ภายใต้การดูแลที่ยาวนานและสั้นคือใช้ข้อมูลที่ติดป้ายกำกับเพื่อฝึกเครื่องจักร เทคนิคการถดถอยและอัลกอริธึมการจำแนกประเภทช่วยพัฒนาแบบจำลองการคาดการณ์ที่มีความน่าเชื่อถือสูงและมีหลายแอพพลิเคชั่น

การเรียนรู้ภายใต้การดูแลต้องการผู้เชี่ยวชาญในการสร้าง ปรับขนาด และอัปเดตโมเดล ในกรณีที่ไม่มีความชำนาญทางเทคนิค อาจใช้กำลังดุร้ายเพื่อกำหนดตัวแปรอินพุต และสิ่งนี้อาจทำให้ได้ผลลัพธ์ที่ไม่ถูกต้อง ดังนั้น การเลือกคุณสมบัติข้อมูลที่เกี่ยวข้องจึงเป็นสิ่งจำเป็นสำหรับการเรียนรู้ภายใต้การดูแลเพื่อให้ทำงานอย่างมีประสิทธิภาพ

ก่อนอื่นควรตัดสินใจว่าข้อมูลใดที่จำเป็นสำหรับชุดการฝึกอบรม จัดโครงสร้างฟังก์ชันและอัลกอริทึมที่เรียนรู้ต่อไป และรวบรวมผลลัพธ์จากผู้เชี่ยวชาญและการวัด แนวทางปฏิบัติที่ดีที่สุดดังกล่าวสามารถช่วยสนับสนุนความถูกต้องของแบบจำลองได้เป็นอย่างดี

ในขณะที่ปัญญาประดิษฐ์และแมชชีนเลิร์นนิงเพิ่มขึ้นอย่างรวดเร็วในโลกที่เน้นเทคโนโลยีในปัจจุบัน การรู้เกี่ยวกับ ประเภทของการเรียนรู้ภายใต้การดูแล สามารถสร้างความแตกต่างอย่างมีนัยสำคัญในทุกสาขา คำอธิบายข้างต้นจะช่วยให้คุณทำขั้นตอนแรกได้!

หากคุณสนใจที่จะเรียนรู้เพิ่มเติมเกี่ยวกับแมชชีนเลิร์นนิง โปรดดูที่ IIIT-B & upGrad's PG Diploma in Machine Learning & AI ซึ่งออกแบบมาสำหรับมืออาชีพที่ทำงานและมีการฝึกอบรมที่เข้มงวดมากกว่า 450 ชั่วโมง กรณีศึกษาและการมอบหมายมากกว่า 30 รายการ IIIT- สถานะศิษย์เก่า B, 5+ โครงการหลักที่ใช้งานได้จริง & ความช่วยเหลือด้านงานกับบริษัทชั้นนำ

เรียนรู้ หลักสูตร ML จากมหาวิทยาลัยชั้นนำของโลก รับ Masters, Executive PGP หรือ Advanced Certificate Programs เพื่อติดตามอาชีพของคุณอย่างรวดเร็ว

ความหมายของการเรียนรู้ภายใต้การดูแลคืออะไร?

เครื่องเรียนรู้โดยใช้ข้อมูลที่ 'ติดป้ายกำกับ' ในการเรียนรู้ภายใต้การดูแล เมื่อชุดข้อมูลมีทั้งพารามิเตอร์อินพุตและเอาต์พุต จะถือว่ามีป้ายกำกับ กล่าวอีกนัยหนึ่งคือ ข้อมูลมีป้ายกำกับว่าตอบถูกต้องแล้ว ในความท้าทายด้านการคำนวณในโลกแห่งความเป็นจริง แมชชีนเลิร์นนิงภายใต้การดูแลนั้นมีประโยชน์มาก ระบบเรียนรู้จากข้อมูลการฝึกที่มีป้ายกำกับเพื่อคาดการณ์ผลลัพธ์สำหรับข้อมูลที่ไม่คาดคิด ด้วยเหตุนี้ การสร้างและปรับใช้แบบจำลองดังกล่าวจึงจำเป็นต้องอาศัยความเชี่ยวชาญของนักวิทยาศาสตร์ข้อมูลที่มีทักษะสูง นักวิทยาศาสตร์ข้อมูลใช้ความรู้ด้านเทคนิคของตนเพื่อสร้างแบบจำลองในช่วงเวลาหนึ่ง เพื่อรักษาความถูกต้องของข้อมูลเชิงลึกที่ให้ไว้

ความแตกต่างระหว่างการจำแนกและการถดถอยคืออะไร?

การใช้ข้อมูลการฝึก การถดถอยจะสร้างค่าเอาต์พุตเดียว นี่คือการตีความความน่าจะเป็นที่กำหนดโดยคำนึงถึงความแข็งแกร่งของความสัมพันธ์ระหว่างตัวแปรอินพุต ตัวอย่างเช่น การถดถอยสามารถช่วยคาดการณ์ราคาบ้านตามที่ตั้ง ขนาด และปัจจัยอื่นๆ การจัดประเภทข้อมูลนำมาซึ่งการแบ่งออกเป็นหมวดหมู่ คุณสามารถใช้การจัดหมวดหมู่เพื่อประเมินว่าบุคคลนั้นจะผิดนัดเงินกู้หรือไม่หากคุณกำลังพิจารณาให้เครดิตแก่พวกเขา การจำแนกประเภทไบนารีเกิดขึ้นเมื่ออัลกอริธึมการเรียนรู้ภายใต้การดูแลจัดประเภทข้อมูลอินพุตออกเป็นสองคลาสแยกกัน การจำแนกหลายประเภทหมายถึงการแบ่งข้อมูลออกเป็นมากกว่าสองกลุ่ม

ป่าสุ่มคืออะไร?

วิธีการทั้งมวลคือแบบจำลองป่าสุ่ม มันทำงานโดยการสร้างแผนผังการตัดสินใจจำนวนมากแล้วจำแนกต้นไม้แต่ละต้น สมมติว่าคุณต้องการทราบว่านักศึกษามหาวิทยาลัยคนใดสามารถสอบ GMAT ได้ดี ซึ่งเป็นข้อสอบที่จำเป็นสำหรับการเข้าศึกษาในหลักสูตรการจัดการระดับบัณฑิตศึกษา จากลักษณะทางประชากรและการศึกษาของกลุ่มนักเรียนที่เคยทำการทดสอบก่อนหน้านี้ แบบจำลองป่าสุ่มสามารถทำงานให้เสร็จสิ้นได้