บทช่วยสอนการเรียนรู้ของเครื่อง: เรียนรู้ ML ตั้งแต่เริ่มต้น

เผยแพร่แล้ว: 2022-02-17

การปรับใช้โซลูชันปัญญาประดิษฐ์ (AI) และการเรียนรู้ของเครื่อง (ML) ยังคงพัฒนา กระบวนการ ทาง ธุรกิจ ที่หลากหลาย การปรับปรุง ประสบการณ์ของลูกค้า เป็นกรณีการใช้งานอันดับต้นๆ

ทุกวันนี้ แมชชีนเลิร์นนิงมีแอปพลิเคชันมากมาย และส่วนใหญ่เป็นเทคโนโลยีที่เราพบในแต่ละวัน ตัวอย่างเช่น Netflix หรือแพลตฟอร์ม OTT ที่คล้ายกันใช้แมชชีนเลิร์นนิงเพื่อปรับแต่งคำแนะนำสำหรับผู้ใช้แต่ละราย ดังนั้น หากผู้ใช้ดูอาชญากรรมระทึกขวัญหรือค้นหาสิ่งเดียวกันบ่อยครั้ง ระบบแนะนำที่ขับเคลื่อนด้วย ML ของแพลตฟอร์มจะเริ่มแนะนำภาพยนตร์ประเภทเดียวกันเพิ่มเติม ในทำนองเดียวกัน Facebook และ Instagram จะปรับแต่งฟีดของผู้ใช้ตามโพสต์ที่พวกเขาโต้ตอบด้วยบ่อยๆ

ในบทช่วยสอนการเรียนรู้เครื่อง Python นี้ l เราจะเจาะลึกถึงพื้นฐานของการเรียนรู้ของเครื่อง เราได้รวมบทช่วยสอนการเรียนรู้เชิงลึกสั้นๆ เพื่อแนะนำแนวคิดสำหรับผู้เริ่มต้น

สารบัญ

แมชชีนเลิร์นนิงคืออะไร?

คำว่า 'แมชชีนเลิร์นนิง' ตั้งขึ้นในปี 2502 โดยอาร์เธอร์ ซามูเอล ผู้บุกเบิกการเล่นเกมคอมพิวเตอร์และปัญญาประดิษฐ์

การเรียนรู้ของเครื่องเป็นส่วนย่อยของปัญญาประดิษฐ์ โดยอิงตามแนวคิดที่ว่าซอฟต์แวร์ (โปรแกรม) สามารถเรียนรู้จากข้อมูล ถอดรหัสรูปแบบ และตัดสินใจโดยมีการรบกวนจากมนุษย์น้อยที่สุด กล่าวอีกนัยหนึ่ง ML เป็นสาขาของวิทยาการคอมพิวเตอร์ที่ช่วยให้ผู้ใช้สามารถป้อนข้อมูลจำนวนมหาศาลไปยังอัลกอริธึม และให้ระบบวิเคราะห์และตัดสินใจโดยใช้ข้อมูลตามข้อมูลที่ป้อนเข้า ดังนั้น อัลกอริธึม ML จึงไม่อาศัยโมเดลที่กำหนดไว้ล่วงหน้า แต่จะ "เรียนรู้" ข้อมูลจากข้อมูลที่ป้อนโดยตรงแทน

อัลกอริธึม ML

แหล่งที่มา

นี่คือตัวอย่างง่ายๆ –

เราจะเขียนโปรแกรมระบุดอกไม้ตามสี รูปร่างกลีบดอก หรือคุณสมบัติอื่นๆ ได้อย่างไร แม้ว่าวิธีที่ชัดเจนที่สุดคือการสร้างกฎการระบุตัวแบบไม่ยอมใครง่ายๆ แต่วิธีการดังกล่าวจะไม่ทำให้กฎในอุดมคติมีผลบังคับใช้ในทุกกรณี อย่างไรก็ตาม แมชชีนเลิร์นนิงใช้กลยุทธ์ที่ใช้งานได้จริงและมีประสิทธิภาพมากกว่า และแทนที่จะสร้างกฎที่กำหนดไว้ล่วงหน้า ให้ฝึกระบบโดยป้อนข้อมูล (ภาพ) ของดอกไม้ต่างๆ ดังนั้น ในครั้งต่อไปที่ระบบแสดงดอกกุหลาบและดอกทานตะวัน ระบบสามารถจำแนกทั้งสองตามประสบการณ์ก่อนหน้านี้

อ่าน วิธีการเรียนรู้การเรียนรู้ของเครื่อง – ทีละขั้นตอน

ประเภทของการเรียนรู้ของเครื่อง

การจัดหมวดหมู่แมชชีนเลิร์นนิงขึ้นอยู่กับวิธีที่อัลกอริทึมเรียนรู้เพื่อให้แม่นยำยิ่งขึ้นในการทำนายผลลัพธ์ ดังนั้น การเรียนรู้ของเครื่องจึงมีพื้นฐานอยู่ 3 วิธี ได้แก่ การเรียนรู้แบบมีผู้ดูแล การเรียนรู้แบบไม่มีผู้ดูแล และการเรียนรู้แบบเสริมกำลัง

การเรียนรู้ภายใต้การดูแล

ในแมชชีนเลิร์นนิงภายใต้การดูแล อัลกอริธึมจะมาพร้อมกับข้อมูลการฝึกที่มีป้ายกำกับ นอกจากนี้ ผู้ใช้ยังกำหนดตัวแปรที่ต้องการให้อัลกอริทึมประเมิน ตัวแปรเป้าหมายคือตัวแปรที่เราต้องการทำนาย และคุณสมบัติคือตัวแปรที่ช่วยเราคาดการณ์เป้าหมาย ดังนั้น มันเหมือนกับว่าเราแสดงอัลกอรึทึมภาพของปลาและพูดว่า "มันคือปลา" จากนั้นเราแสดงกบและชี้ให้เห็นว่าเป็นกบ จากนั้น เมื่ออัลกอริธึมได้รับการฝึกอบรมเกี่ยวกับข้อมูลปลาและกบเพียงพอแล้ว ก็จะเรียนรู้ที่จะแยกแยะระหว่างข้อมูลเหล่านั้น

การเรียนรู้แบบไม่มีผู้ดูแล

แมชชีนเลิร์นนิงที่ไม่มีผู้ดูแลเกี่ยวข้องกับอัลกอริธึมที่เรียนรู้จากข้อมูลการฝึกที่ไม่มีป้ายกำกับ ดังนั้นจึงมีเพียงคุณสมบัติ (ตัวแปรอินพุต) และไม่มีตัวแปรเป้าหมาย ปัญหาการเรียนรู้ที่ไม่ได้รับการดูแล ได้แก่ การจัดกลุ่ม โดยที่ตัวแปรอินพุตที่มีลักษณะเหมือนกันจะถูกจัดกลุ่มและเชื่อมโยงกับการถอดรหัสความสัมพันธ์ที่มีความหมายภายในชุดข้อมูล ตัวอย่างของการจัดกลุ่มคือการจัดกลุ่มคนเป็นผู้สูบบุหรี่และไม่สูบบุหรี่ ในทางตรงกันข้าม การค้นพบว่าลูกค้าที่ใช้สมาร์ทโฟนจะซื้อปกโทรศัพท์ก็เป็นเรื่องที่เกี่ยวข้องกัน

การเรียนรู้การเสริมแรง

การเรียนรู้การเสริมแรงเป็นเทคนิคที่ใช้ฟีดเป็นหลัก ซึ่งโมเดลแมชชีนเลิร์นนิงเรียนรู้ที่จะตัดสินใจเป็นชุดตามผลตอบรับที่ได้รับจากการกระทำ สำหรับการกระทำที่ดีแต่ละครั้ง เครื่องจะได้รับผลตอบรับเชิงบวก และสำหรับการกระทำที่ไม่ดีแต่ละรายการจะได้รับบทลงโทษหรือคำติชมเชิงลบ ดังนั้น ไม่เหมือนแมชชีนเลิร์นนิงภายใต้การดูแล โมเดลเสริมจะเรียนรู้โดยอัตโนมัติโดยใช้คำติชมแทนข้อมูลใดๆ ที่ติดป้ายกำกับ

อ่านด้วย แมชชีนเลิร์นนิงคืออะไรและเหตุใดจึงสำคัญ

เหตุใดจึงต้องใช้ Python สำหรับการเรียนรู้ของเครื่อง

โปรเจ็กต์แมชชีนเลิร์นนิงแตกต่างจากโปรเจ็กต์ซอฟต์แวร์แบบดั้งเดิม โดยที่โปรเจ็กต์แรกเกี่ยวข้องกับชุดทักษะ กองเทคโนโลยี และการวิจัยเชิงลึก ดังนั้น การนำโปรเจ็กต์แมชชีนเลิร์นนิงไปใช้งานที่ประสบความสำเร็จจึงต้องการภาษาการเขียนโปรแกรมที่เสถียร ยืดหยุ่น และนำเสนอเครื่องมือที่มีประสิทธิภาพ Python นำเสนอทุกอย่าง ดังนั้นเราจึงเห็นโปรเจ็กต์การเรียนรู้ของเครื่องที่ใช้ Python เป็นหลัก

ความเป็นอิสระของแพลตฟอร์ม

ความนิยมของ Python ส่วนใหญ่มาจากข้อเท็จจริงที่ว่ามันเป็นภาษาที่ไม่ขึ้นกับแพลตฟอร์ม และได้รับการสนับสนุนจากแพลตฟอร์มส่วนใหญ่ รวมทั้ง Windows, macOS และ Linux ดังนั้น นักพัฒนาสามารถสร้างโปรแกรมปฏิบัติการแบบสแตนด์อโลนบนแพลตฟอร์มเดียว และแจกจ่ายไปยังระบบปฏิบัติการอื่นโดยไม่ต้องใช้ล่าม Python ดังนั้น โมเดลการเรียนรู้ของเครื่องฝึกอบรมจึงสามารถจัดการได้ง่ายขึ้นและราคาถูกลง

ความเรียบง่ายและความยืดหยุ่น

เบื้องหลังโมเดลแมชชีนเลิร์นนิงทุกรูปแบบคืออัลกอริธึมและเวิร์กโฟลว์ที่ซับซ้อนซึ่งอาจทำให้ผู้ใช้หวาดกลัวและล้นหลาม แต่โค้ดที่กระชับและอ่านได้ของ Python ช่วยให้นักพัฒนาสามารถมุ่งเน้นไปที่โมเดลการเรียนรู้ของเครื่อง แทนที่จะต้องกังวลเกี่ยวกับเทคนิคของภาษา นอกจากนี้ Python ยังเรียนรู้ได้ง่าย และสามารถจัดการกับงานแมชชีนเลิร์นนิงที่ซับซ้อน ส่งผลให้สร้างและทดสอบต้นแบบได้อย่างรวดเร็ว

กรอบและไลบรารีที่มีให้เลือกมากมาย

Python นำเสนอเฟรมเวิร์กและไลบรารีที่หลากหลายซึ่งช่วยลดเวลาในการพัฒนาได้อย่างมาก ไลบรารีดังกล่าวมีโค้ดที่เขียนไว้ล่วงหน้าซึ่งนักพัฒนาใช้เพื่อทำงานเขียนโปรแกรมทั่วไปให้สำเร็จ เครื่องมือซอฟต์แวร์ของ Python ประกอบด้วย Scikit-learn, TensorFlow และ Keras สำหรับการเรียนรู้ของเครื่อง, Pandas สำหรับการวิเคราะห์ข้อมูลทั่วไป, NumPy และ SciPy สำหรับการวิเคราะห์ข้อมูล และการคำนวณทางวิทยาศาสตร์ Seaborn สำหรับการแสดงข้อมูล และอื่นๆ

เรียนรู้การประมวลผลข้อมูลล่วงหน้าในการเรียนรู้ของเครื่อง: 7 ขั้นตอนง่ายๆ ในการปฏิบัติตาม

ขั้นตอนในการดำเนินโครงการ Python Machine Learning

หากคุณเพิ่งเริ่มใช้แมชชีนเลิร์นนิง วิธีที่ดีที่สุดในการทำโปรเจ็กต์คือการลงรายการขั้นตอนสำคัญที่คุณต้องพูดถึง เมื่อคุณมีขั้นตอนแล้ว คุณสามารถใช้เป็นเทมเพลตสำหรับชุดข้อมูลต่อมา เติมช่องว่างและปรับเปลี่ยนเวิร์กโฟลว์ของคุณเมื่อคุณเข้าสู่ขั้นตอนขั้นสูง

นี่คือภาพรวมของวิธีการใช้โปรเจ็กต์แมชชีนเลิร์นนิงด้วย Python:

  1. กำหนดปัญหา
  2. ติดตั้ง Python และ SciPy
  3. โหลดชุดข้อมูล
  4. สรุปชุดข้อมูล
  5. เห็นภาพชุดข้อมูล
  6. ประเมินอัลกอริทึม
  7. ทำนาย.
  8. นำเสนอผลงาน.

เครือข่ายการเรียนรู้เชิงลึกคืออะไร?

เครือข่ายการเรียนรู้เชิงลึกหรือเครือข่ายประสาทส่วนลึก (DNN) เป็นสาขาหนึ่งของการเรียนรู้ด้วยเครื่องโดยอาศัยการเลียนแบบสมองของมนุษย์ DNN ประกอบด้วยหน่วยที่รวมหลายอินพุตเพื่อสร้างเอาต์พุตเดียว พวกมันคล้ายคลึงกับเซลล์ประสาททางชีววิทยาที่รับสัญญาณหลายตัวผ่าน synapses และส่งกระแสการกระทำเดียวที่มีศักยภาพลงไปที่เซลล์ประสาทของมัน

โครงข่ายประสาทลึก

แหล่งที่มา

ในโครงข่ายประสาทเทียม การทำงานที่เหมือนสมองทำได้ผ่านชั้นโหนดที่ประกอบด้วยชั้นอินพุต เลเยอร์ที่ซ่อนอยู่หนึ่งหรือหลายชั้น และเลเยอร์เอาต์พุต แต่ละเซลล์ประสาทหรือโหนดเทียมมีเกณฑ์และน้ำหนักที่เกี่ยวข้องและเชื่อมต่อกับเซลล์อื่น เมื่อเอาต์พุตของโหนดหนึ่งสูงกว่าค่าเกณฑ์ที่กำหนดไว้ โหนดจะเปิดใช้งานและส่งข้อมูลไปยังเลเยอร์ถัดไปในเครือข่าย

DNN อาศัยข้อมูลการฝึกอบรมเพื่อเรียนรู้และปรับแต่งความแม่นยำเมื่อเวลาผ่านไป สิ่งเหล่านี้เป็นเครื่องมือปัญญาประดิษฐ์ที่แข็งแกร่ง ทำให้สามารถจำแนกข้อมูลและจัดกลุ่มข้อมูลได้ในความเร็วสูง โดเมนแอปพลิเคชันทั่วไปสองแห่งของเครือข่ายนิวรัลลึกคือการรู้จำภาพและการรู้จำคำพูด

ทางข้างหน้า

ไม่ว่าจะเป็นการปลดล็อกสมาร์ทโฟนด้วยรหัสใบหน้า เรียกดูภาพยนตร์ หรือค้นหาหัวข้อแบบสุ่มบน Google ผู้บริโภคยุคใหม่ที่ขับเคลื่อนด้วยดิจิทัลต้องการคำแนะนำที่เฉียบคมและการปรับเปลี่ยนในแบบของคุณที่ดีขึ้น ไม่ว่าจะเป็นอุตสาหกรรมหรือโดเมนใดก็ตาม AI ยังคงมีบทบาทสำคัญในการยกระดับประสบการณ์ผู้ใช้ ยิ่งไปกว่านั้น ความเรียบง่ายและความเก่งกาจของ Python ทำให้การพัฒนา การปรับใช้ และการบำรุงรักษาโครงการ AI สะดวกและมีประสิทธิภาพในทุกแพลตฟอร์ม

เรียนรู้หลักสูตร ML จากมหาวิทยาลัยชั้นนำของโลก รับ Masters, Executive PGP หรือ Advanced Certificate Programs เพื่อติดตามอาชีพของคุณอย่างรวดเร็ว

หากคุณพบว่าบทช่วยสอนการเรียนรู้ของเครื่อง Python สำหรับผู้เริ่มต้นน่าสนใจ ให้ดำดิ่งลงไปในหัวข้อนี้ด้วย วิทยาศาสตรมหาบัณฑิตสาขาการเรียนรู้ของเครื่องและ AI ของ upGrad โปรแกรมออนไลน์นี้ออกแบบมาสำหรับคนทำงานที่ต้องการเรียนรู้ทักษะ AI ขั้นสูง เช่น NLP, การเรียนรู้เชิงลึก, การเรียนรู้แบบเสริมกำลัง และอื่นๆ

ไฮไลท์ของหลักสูตร:

  • ปริญญาโทจาก LJMU
  • Executive PGP จาก IIIT Bangalore
  • 750+ ชั่วโมงของเนื้อหา
  • 40+ เซสชันสด
  • 12+ กรณีศึกษาและโครงการ
  • 11 การเข้ารหัสที่ได้รับมอบหมาย
  • ครอบคลุม 20 เครื่องมือ ภาษา และห้องสมุด
  • ความช่วยเหลือด้านอาชีพ 360 องศา

1. Python ดีสำหรับการเรียนรู้ของเครื่องหรือไม่?

Python เป็นหนึ่งในภาษาโปรแกรมที่ดีที่สุดสำหรับการนำโมเดลการเรียนรู้ของเครื่องไปใช้ Python ดึงดูดนักพัฒนาและผู้เริ่มต้นเนื่องจากความเรียบง่าย ความยืดหยุ่น และเส้นโค้งการเรียนรู้ที่อ่อนโยน ยิ่งไปกว่านั้น Python นั้นไม่ขึ้นกับแพลตฟอร์มและสามารถเข้าถึงไลบรารีและเฟรมเวิร์กที่ทำให้การสร้างและทดสอบโมเดลการเรียนรู้ของเครื่องได้เร็วและง่ายขึ้น

2. แมชชีนเลิร์นนิงกับ Python ยากไหม

เนื่องจากความนิยมอย่างแพร่หลายของ Python เป็นภาษาโปรแกรมทั่วไปและการนำไปใช้ในการเรียนรู้ของเครื่องและการคำนวณทางวิทยาศาสตร์ การค้นหาบทแนะนำการเรียนรู้ของเครื่อง Python นั้นค่อนข้างง่าย นอกจากนี้ เส้นโค้งการเรียนรู้ที่นุ่มนวลของ Python โค้ดที่อ่านได้และแม่นยำทำให้เป็นภาษาการเขียนโปรแกรมที่เป็นมิตรกับผู้เริ่มต้น

3. AI และแมชชีนเลิร์นนิงเหมือนกันไหม

แม้ว่าคำว่า AI และการเรียนรู้ของเครื่องมักจะใช้สลับกันได้ แต่ก็ไม่เหมือนกัน ปัญญาประดิษฐ์ (AI) เป็นคำศัพท์ทั่วไปสำหรับสาขาวิทยาการคอมพิวเตอร์ที่เกี่ยวข้องกับเครื่องจักรที่สามารถทำงานได้ตามปกติโดยมนุษย์ แต่แมชชีนเลิร์นนิงเป็นส่วนย่อยของ AI ที่เครื่องจักรจะได้รับข้อมูลและฝึกฝนให้ตัดสินใจโดยอิงจากข้อมูลที่ป้อนเข้า