บทนำสู่โครงข่ายประสาทเทียมและการเรียนรู้เชิงลึก: โครงสร้าง ประเภท และข้อจำกัด

เผยแพร่แล้ว: 2022-06-25

เนื่องจากคุณกำลังอ่านบทความนี้ เป็นไปได้ว่าคุณมีความเข้าใจเกี่ยวกับการเรียนรู้ของเครื่องขั้นพื้นฐานแล้ว หากไม่ใช่ด้านเทคนิค อย่างน้อยก็ในด้านทฤษฎีของการเรียนรู้ของเครื่อง

Deep Learning เป็นขั้นตอนต่อไปหลังจากการเรียนรู้ของเครื่อง ในแมชชีนเลิร์นนิงแบบดั้งเดิมนั้น แมชชีนถูกสร้างขึ้นมาเพื่อเรียนรู้โดยอาศัยการควบคุมดูแลหรือการเสริมแรง อย่างไรก็ตาม Deep Learning มีเป้าหมายเพื่อจำลองกระบวนการเรียนรู้ของมนุษย์ และทำให้ระบบสามารถเรียนรู้ได้ด้วยตนเอง

สิ่งนี้เกิดขึ้นได้โดยใช้ Neural Networks ลองนึกถึงเซลล์ประสาทในสมองของคุณและวิธีการทำงาน ตอนนี้ลองนึกภาพว่าพวกเขาถูกแปลงเป็นเครือข่ายเทียมหรือไม่ - นั่นคือสิ่งที่โครงข่ายประสาทเทียมเป็น

การเรียนรู้เชิงลึกและโครงข่ายประสาทเทียมกำลังจะปฏิวัติโลกที่เรารู้จัก และยังมีอีกหลายสิ่งที่ต้องแกะออกเมื่อพูดถึงเทคโนโลยีนี้

ในบทความเบื้องต้นนี้ เราจะให้ความเข้าใจสั้น ๆ เกี่ยวกับการเรียนรู้เชิงลึกควบคู่ไปกับการทำงานของโครงข่ายประสาทเทียม ประเภทต่าง ๆ ของโครงข่ายประสาทเทียม และข้อ จำกัด บางประการของโครงข่ายประสาทเทียมมีอะไรบ้าง

สารบัญ

การเรียนรู้อย่างลึกซึ้ง – ภาพรวมโดยย่อ
โครงข่ายประสาทเทียม
สำรวจหลักสูตรของเราเกี่ยวกับการเรียนรู้ของเครื่องและปัญญาประดิษฐ์
เพอร์เซ็ปตรอน
โครงสร้างของโครงข่ายประสาทเทียม
อ่านบทความยอดนิยมของเราเกี่ยวกับการเรียนรู้ของเครื่องและปัญญาประดิษฐ์
โครงข่ายประสาทประเภทต่างๆ
- CNNs – Convolutional Neural Networks
- RNNs – โครงข่ายประสาทกำเริบ
ข้อจำกัดในการทำงานกับโครงข่ายประสาทเทียม
- ต้องการข้อมูลจำนวนมาก
- ส่วนใหญ่ทำงานเป็นกล่องดำ
- การพัฒนามักใช้เวลานาน
สรุปแล้ว
1. การเรียนรู้เชิงลึกเป็นไปได้โดยไม่มีโครงข่ายประสาทเทียมหรือไม่?
2. ANN ประเภทใดบ้าง
3. หน่วยพื้นฐานที่สุดของโครงข่ายประสาทเทียมคืออะไร?

การเรียนรู้อย่างลึกซึ้ง – ภาพรวมโดยย่อ

การเรียนรู้เชิงลึกถือเป็นสาขาย่อยของการเรียนรู้ของเครื่อง อย่างไรก็ตาม ไม่เหมือนกับอัลกอริธึมหรือระบบแมชชีนเลิร์นนิงแบบดั้งเดิม ระบบการเรียนรู้เชิงลึกใช้หลายเลเยอร์เพื่อแยกคุณลักษณะที่มีลำดับสูงออกจากอินพุตดิบที่ป้อนด้วย ยิ่งจำนวนเลเยอร์มากเท่าไร เครือข่ายก็จะยิ่ง "ลึกขึ้น" และการแยกคุณลักษณะและการเรียนรู้โดยรวมก็จะยิ่งดีขึ้น

คำว่าการเรียนรู้อย่างลึกซึ้งมีมาตั้งแต่ปี 1950 แต่วิธีการในสมัยนั้นค่อนข้างไม่เป็นที่นิยม เมื่อมีการวิจัยมากขึ้นในพื้นที่นี้ การเรียนรู้เชิงลึกยังคงก้าวหน้า และวันนี้เรามีวิธีการเรียนรู้เชิงลึกที่ซับซ้อนซึ่งขับเคลื่อนโดยโครงข่ายประสาทเทียม

แอปพลิเคชั่นยอดนิยมบางตัวของโครงข่ายประสาทเทียมในการเรียนรู้เชิงลึกนั้นเกี่ยวข้องกับการตรวจจับใบหน้า การตรวจจับวัตถุ การจดจำภาพ การตรวจจับข้อความเป็นคำพูดและการถอดความ และอื่นๆ แต่เราแค่ขีดข่วนพื้นผิว – ยังมีอีกมากให้ค้นพบ!

ดังนั้น ก่อนที่คุณจะดำดิ่งสู่การเรียนรู้อย่างลึกซึ้ง เราต้องเริ่มต้นด้วยการทำความเข้าใจว่า Artificial Neural Network ใน AI คืออะไร

เข้าร่วม หลักสูตรปัญญาประดิษฐ์ ออนไลน์จากมหาวิทยาลัยชั้นนำของโลก – ปริญญาโท หลักสูตร Executive Post Graduate และหลักสูตรประกาศนียบัตรขั้นสูงใน ML & AI เพื่อติดตามอาชีพของคุณอย่างรวดเร็ว

โครงข่ายประสาทเทียม

ANN ได้รับแรงบันดาลใจจากการทำงานของสมองจริงของมนุษย์และเป็นรากฐานของการเรียนรู้เชิงลึก ระบบเหล่านี้รับข้อมูล ฝึกฝนตนเองเพื่อค้นหารูปแบบในข้อมูล และค้นหาผลลัพธ์สำหรับชุดข้อมูลชุดใหม่ที่คล้ายกัน

นั่นคือสิ่งที่ให้พลังแก่การเรียนรู้อย่างลึกซึ้ง – โครงข่ายประสาทเรียนรู้ด้วยตนเองและแข็งแกร่งขึ้นในการค้นหารูปแบบโดยอัตโนมัติ โดยไม่ต้องมีการแทรกแซงของมนุษย์ ด้วยเหตุนี้ โครงข่ายประสาทเทียมจึงสามารถทำหน้าที่เป็นระบบจัดเรียงและติดฉลากข้อมูลได้

มาทำความเข้าใจ ANN ในเชิงลึกด้วยการทำความเข้าใจ Perceptrons ก่อน

สำรวจหลักสูตรของเราเกี่ยวกับการเรียนรู้ของเครื่องและปัญญาประดิษฐ์

การรับรองขั้นสูงในการเรียนรู้ของเครื่องและคลาวด์จาก IITM	วิทยาศาสตรมหาบัณฑิตสาขาวิชา Machine Learning & AI จาก LJMU	Executive Post Graduate Program in Machine Learning & AI จาก IITB
โปรแกรมประกาศนียบัตรขั้นสูงในการเรียนรู้ของเครื่อง & NLP จาก IIITB	โปรแกรมประกาศนียบัตรขั้นสูงในการเรียนรู้ของเครื่องและการเรียนรู้เชิงลึกจาก IIITB	โปรแกรมใบรับรองขั้นสูงใน AI สำหรับผู้จัดการจาก IITR

เพอร์เซ็ปตรอน

ANN ประกอบด้วยหน่วยที่เล็กกว่า เช่น โครงข่ายประสาทในสมองของเราประกอบด้วยหน่วยที่เล็กกว่าที่เรียกว่าเซลล์ประสาท หน่วยที่เล็กกว่าของ ANNs เรียกว่า perceptrons โดยพื้นฐานแล้ว Perceptron มีเลเยอร์อินพุตอย่างน้อยหนึ่งชั้น ความลำเอียง ฟังก์ชันการเปิดใช้งาน และเอาต์พุตสุดท้าย

Perceptron ทำงานโดยรับอินพุต คูณด้วยน้ำหนัก และส่งผ่านผ่านฟังก์ชันการเปิดใช้งานเพื่อสร้างเอาต์พุต การเพิ่มอคติเป็นสิ่งสำคัญเพื่อไม่ให้เกิดปัญหาแม้ว่าอินพุตทั้งหมดจะเป็นศูนย์ก็ตาม ทำงานบนสูตรต่อไปนี้:

Y = ∑ (น้ำหนัก * อินพุต) + อคติ

ดังนั้น สิ่งแรกที่เกิดขึ้นคือการคำนวณภายใน perceptron เดียว ที่นี่ผลรวมถ่วงน้ำหนักจะถูกคำนวณและส่งต่อไปยังฟังก์ชันการเปิดใช้งาน อีกครั้ง ฟังก์ชันการเปิดใช้งานสามารถมีได้หลายประเภท เช่น ฟังก์ชันตรีโกณมิติ ฟังก์ชันขั้นตอน ฟังก์ชันการเปิดใช้งาน ฯลฯ

โครงสร้างของโครงข่ายประสาทเทียม

ในการพัฒนาโครงข่ายประสาทเทียม ขั้นตอนแรกคือการจัดกลุ่มของเพอร์เซปตรอนหลายชั้นเข้าด้วยกัน ด้วยวิธีนี้ เราจะได้โมเดล perceptron แบบหลายชั้น

จากหลายเลเยอร์เหล่านี้ เลเยอร์แรกคือเลเยอร์อินพุต เลเยอร์นี้รับอินพุตโดยตรง ในขณะที่ชั้นสุดท้ายเรียกว่าชั้นผลลัพธ์และมีหน้าที่ในการสร้างผลลัพธ์ที่ต้องการ

เลเยอร์ทั้งหมดระหว่างเลเยอร์อินพุตและเอาต์พุตเรียกว่าเลเยอร์ที่ซ่อนอยู่ เลเยอร์เหล่านี้ไม่ได้สื่อสารโดยตรงกับอินพุตคุณลักษณะหรือเอาต์พุตขั้นสุดท้าย แต่เซลล์ประสาทของเลเยอร์ที่ซ่อนอยู่จากชั้นหนึ่งจะเชื่อมต่อกับอีกชั้นหนึ่งโดยใช้ช่องทางที่แตกต่างกัน

ผลลัพธ์ที่ได้มาจากฟังก์ชันการกระตุ้นคือสิ่งที่กำหนดว่าเซลล์ประสาทจะเปิดใช้งานหรือไม่ เมื่อเซลล์ประสาทถูกเปิดใช้งาน เซลล์สามารถส่งข้อมูลไปยังชั้นถัดไปโดยใช้ช่องทางการสื่อสาร ดังนั้นจุดข้อมูลทั้งหมดจึงถูกกระจายไปทั่วเครือข่าย

ในที่สุด ในชั้นผลลัพธ์ เซลล์ประสาทที่มีค่าสูงสุดจะกำหนดผลลัพธ์สุดท้ายโดยการยิง ค่าที่เซลล์ประสาทได้รับหลังจากการแพร่พันธุ์ทั้งหมดคือความน่าจะเป็น หมายความว่าเครือข่ายประเมินผลลัพธ์ผ่านค่าความน่าจะเป็นสูงสุดตามอินพุตที่ได้รับ

เมื่อได้ผลลัพธ์สุดท้ายแล้ว เราสามารถเปรียบเทียบกับฉลากที่รู้จักและทำการปรับน้ำหนักตามนั้น กระบวนการนี้จะทำซ้ำจนกว่าเราจะทำซ้ำได้สูงสุดที่อนุญาตหรืออัตราข้อผิดพลาดที่ยอมรับได้

ตอนนี้ มาพูดถึงประเภทของ Neural Networks ประเภทต่างๆ กัน

อ่านบทความยอดนิยมของเราเกี่ยวกับการเรียนรู้ของเครื่องและปัญญาประดิษฐ์

IoT: ประวัติศาสตร์ ปัจจุบัน และอนาคต	บทช่วยสอนการเรียนรู้ของเครื่อง: เรียนรู้ ML	อัลกอริทึมคืออะไร? ง่ายและสะดวก
เงินเดือนวิศวกรหุ่นยนต์ในอินเดีย: บทบาททั้งหมด	วันหนึ่งในชีวิตของวิศวกรแมชชีนเลิร์นนิง: พวกเขาทำอะไร?	IoT คืออะไร (Internet of Things)
การเปลี่ยนแปลงและการรวมกัน: ความแตกต่างระหว่างการเปลี่ยนแปลงและการรวมกัน	แนวโน้ม 7 อันดับแรกในปัญญาประดิษฐ์และการเรียนรู้ของเครื่อง	แมชชีนเลิร์นนิงกับ R: ทุกสิ่งที่คุณต้องรู้

โครงข่ายประสาทประเภทต่างๆ

วันนี้ เราจะมาดู Neural Networks ยอดนิยมสองประเภทที่ใช้สำหรับการเรียนรู้เชิงลึก เช่น CNN และ RNN

CNNs – Convolutional Neural Networks

แทนที่จะทำงานกับอาร์เรย์ 2 มิติอย่างง่าย ซีเอ็นเอ็นทำงานกับการจัดเรียงเซลล์ประสาท 3 มิติ ชั้นแรกเรียกว่าชั้น convolutional เซลล์ประสาทแต่ละเซลล์ในชั้นที่เกิดการบิดงอนี้มีหน้าที่ในการประมวลผลข้อมูลอินพุตเพียงส่วนเล็ก ๆ เท่านั้น ด้วยเหตุนี้ เครือข่ายจึงเข้าใจภาพรวมทั้งหมดในส่วนเล็กๆ และคำนวณหลายครั้งเพื่อให้ทั้งภาพสมบูรณ์

ดังนั้น CNN จึงมีค่าอย่างยิ่งต่อการจดจำภาพ การตรวจจับวัตถุ และงานอื่นๆ ที่คล้ายคลึงกัน แอปพลิเคชันอื่นๆ ที่ CNN ประสบความสำเร็จ ได้แก่ การรู้จำเสียง งานคอมพิวเตอร์วิทัศน์ และการแปลด้วยคอมพิวเตอร์

RNNs – โครงข่ายประสาทกำเริบ

RNN ได้รับความสนใจในช่วงทศวรรษ 1980 และพวกเขาใช้ข้อมูลอนุกรมเวลาหรือข้อมูลตามลำดับในการทำนาย ดังนั้น จึงมีประโยชน์สำหรับการแก้ปัญหาชั่วคราวหรือลำดับ เช่น การรู้จำคำพูด การประมวลผลภาษาธรรมชาติ การแปล และอื่นๆ

เช่นเดียวกับซีเอ็นเอ็น RNN ยังต้องการข้อมูลการฝึกอบรมเพื่อเรียนรู้และคาดการณ์ อย่างไรก็ตาม สิ่งที่ทำให้ RNN แตกต่างจาก CNN คือ RNN สามารถจดจำเอาต์พุตของเลเยอร์หนึ่งและป้อนกลับไปยังเซลล์ประสาทของเลเยอร์อื่นๆ ด้วยเหตุนี้ จึงถือได้ว่าเป็นเครือข่ายข้อเสนอแนะที่คอยประมวลผลข้อมูลใหม่ แทนที่จะเพียงแค่ป้อนข้อมูลไปข้างหน้า เช่น ANN

ข้อจำกัดในการทำงานกับโครงข่ายประสาทเทียม

Neural Network เป็นพื้นที่ของการวิจัยและการปรับเปลี่ยนอย่างต่อเนื่อง ดังนั้น จึงมักมีข้อบกพร่องบางอย่างที่กำลังได้รับการแก้ไขและแก้ไขเพื่อนำมาซึ่งการปรับเปลี่ยนที่ซับซ้อนในเทคโนโลยี มาดูข้อจำกัดบางประการของ Neural Networks:

ต้องการข้อมูลจำนวนมาก

Neural Networks ทำงานกับข้อมูลการฝึกอบรมจำนวนมากเพื่อให้ทำงานได้อย่างถูกต้อง หากคุณมีข้อมูลไม่มาก เครือข่ายจะฝึกฝนตัวเองได้ยาก นอกจากนี้ โครงข่ายประสาทเทียมยังมีพารามิเตอร์หลายอย่าง เช่น อัตราการเรียนรู้ จำนวนเซลล์ประสาทต่อเลเยอร์ จำนวนเลเยอร์ที่ซ่อนอยู่ เป็นต้น ซึ่งจำเป็นต้องปรับอย่างเหมาะสมเพื่อลดข้อผิดพลาดในการทำนาย ขณะที่เพิ่มประสิทธิภาพและความเร็วในการทำนายให้สูงสุด เป้าหมายคือเพื่อให้โครงข่ายประสาทจำลองการทำงานของสมองมนุษย์ ซึ่งต้องการข้อมูลจำนวนมาก

ส่วนใหญ่ทำงานเป็นกล่องดำ

เนื่องจากมักจะเป็นเรื่องยากที่จะค้นหาว่าเลเยอร์ที่ซ่อนอยู่ทำงานอย่างไรและมีการจัดระเบียบอย่างไร โครงข่ายประสาทเทียมจึงมักถูกมองว่าเป็นสภาพแวดล้อมแบบกล่องดำ ดังนั้น หากเกิดข้อผิดพลาดขึ้น การค้นหาสาเหตุของข้อผิดพลาดจึงเป็นเรื่องยากและใช้เวลานานในการแก้ไข อย่าลืมว่ามันค่อนข้างแพงด้วย นี่เป็นหนึ่งในสาเหตุหลักที่ธนาคารและสถาบันการเงินยังไม่ได้ใช้ Neural Networks ในการคาดการณ์

การพัฒนามักใช้เวลานาน

เนื่องจาก Neural Networks เรียนรู้ด้วยตัวเอง กระบวนการทั้งหมดจึงมักใช้เวลานาน นอกจากจะมีค่าใช้จ่ายสูงแล้ว เมื่อเปรียบเทียบกับวิธีการเรียนรู้ของเครื่องแบบเดิม โครงข่ายประสาทเทียมนั้นมีค่าใช้จ่ายด้านการคำนวณและการเงินเพิ่มเติม เนื่องจากพวกเขาต้องการข้อมูลการฝึกอบรมและพลังในการคำนวณจำนวนมากเพื่อให้การเรียนรู้เกิดขึ้น

สรุปแล้ว

ยิ่งไปกว่านั้น โลกนี้กำลังพัฒนาอย่างรวดเร็ว โดยแต่ละสัปดาห์จะผ่านไป หากคุณหลงใหลในการค้นหาข้อมูลเพิ่มเติมเกี่ยวกับการเรียนรู้เชิงลึกและวิธีการสร้างเครือข่ายประสาทให้ทำงาน เราขอแนะนำให้คุณตรวจสอบ โปรแกรมใบรับรองขั้นสูงของเราในการเรียนรู้ของเครื่องและการเรียนรู้เชิงลึก ที่เสนอร่วมกับ IIIT-B หลักสูตรระยะยาว 8 เดือนนี้มอบทุกสิ่งที่คุณต้องการเพื่อเริ่มต้นอาชีพของคุณ ตั้งแต่การให้คำปรึกษาแบบตัวต่อตัว การสนับสนุนในอุตสาหกรรม ไปจนถึงการแนะแนวตำแหน่ง สมัครเองได้แล้ววันนี้!

1. การเรียนรู้เชิงลึกเป็นไปได้โดยไม่มีโครงข่ายประสาทเทียมหรือไม่?

ไม่ โครงข่ายประสาทเทียมมีความสำคัญต่อการเรียนรู้อย่างลึกซึ้ง

2. ANN ประเภทใดบ้าง

โครงข่ายประสาทเทียมมีหลายประเภท แต่ 2 เครือข่ายที่ใช้กันมากที่สุดคือ Recurrent Neural Networks และ Convolutional Neural Networks

3. หน่วยพื้นฐานที่สุดของโครงข่ายประสาทเทียมคืออะไร?

Perceptron เป็นหน่วยพื้นฐานที่สุดของ ANN