Naive Bayes ลักษณนามอธิบาย

เผยแพร่แล้ว: 2022-09-28

สารบัญ

บทนำ

หากคุณสนใจในการเรียนรู้ของเครื่อง ปัญญาประดิษฐ์ หรือวิทยาศาสตร์ข้อมูล คุณต้องทราบถึงความสำคัญของสมมติฐาน แมชชีนเลิร์นนิงหรือโมเดลตามความเสี่ยงอื่นๆ ได้รับการพัฒนาตามสมมติฐานบางประการและข้อตกลงที่กำหนดไว้ล่วงหน้า ซึ่งช่วยให้นักพัฒนาได้ผลลัพธ์ที่ต้องการ หากนักพัฒนาไม่พิจารณาสมมติฐานในขณะสร้างแบบจำลอง อาจรบกวนข้อมูลและนำไปสู่ผลลัพธ์ที่ไม่ถูกต้อง Naive Bayes Classifier เป็นหนึ่งในตัวอย่างคลาสสิกของสมมติฐานทางคณิตศาสตร์ในแบบจำลองทางสถิติ

โปรแกรม AI & ML ของเราในสหรัฐอเมริกา

วิทยาศาสตรมหาบัณฑิตสาขาวิชา Machine Learning & AI จาก LJMU และ IIITB Executive PG Program in Machine Learning & Artificial Intelligence จาก IIITB
หากต้องการสำรวจหลักสูตรทั้งหมดของเรา โปรดไปที่หน้าด้านล่าง
หลักสูตรการเรียนรู้ของเครื่อง

บล็อกนี้อธิบายทฤษฎีบท Bayes, Naive Bayes Classifier และแบบจำลองต่างๆ

ลักษณนาม Naive Bayes คืออะไร?

Naive Bayes Classifier มีพื้นฐานมาจากทฤษฎีบท Bayes ที่เสนอโดย Thomas Bayes นักคณิตศาสตร์ชาวอังกฤษ ดังนั้น ก่อนที่คุณจะเข้าใจ Naive Bayes Classifier คุณจำเป็นต้องรู้ทฤษฎีบท Bayes เสียก่อน ทฤษฎีบท Bayes หรือที่เรียกว่า Bayes' Law หรือ Bayes' Rule เป็นตัวกำหนดโอกาสในการเกิดขึ้นหรือไม่เกิดขึ้นของเหตุการณ์ใดๆ พูดง่ายๆ คือ บอกความน่าจะเป็นของเหตุการณ์ที่เกิดขึ้น

ทฤษฎีบทเบย์นิยมใช้ในการเรียนรู้ของเครื่องเพื่อทำนายชั้นเรียนอย่างแม่นยำ จะคำนวณความน่าจะเป็นแบบมีเงื่อนไขของงานการจำแนกประเภทในการเรียนรู้ของเครื่อง งานการจำแนกหมายถึงกิจกรรมที่ดำเนินการโดยอัลกอริทึมการเรียนรู้ของเครื่องเพื่อแก้ปัญหา คุณสามารถเข้าใจสิ่งนี้ได้ดีขึ้นด้วยตัวอย่างอีเมลขยะ อัลกอริทึมการเรียนรู้ของเครื่องเรียนรู้ที่จะจัดประเภทอีเมลเป็นสแปมหรือไม่เป็นสแปม ดังนั้น ในรูปแบบการเรียนรู้ของเครื่อง ทฤษฎีบทเบย์จึงใช้เพื่อทำนายกิจกรรมการจำแนกประเภทหรือการแบ่งแยก

ทฤษฎีบท Naive Bayes เป็นส่วนย่อยของทฤษฎีบท Bayes เนื่องจากหน้าที่หลักของมันคือการจำแนกประเภทของงาน เราจึงเรียกมันว่าตัวแยกประเภท Naive Bayes ทฤษฎีบทยังทำให้สมมติฐานไร้เดียงสาว่าคุณลักษณะของคลาสทั้งหมดไม่ได้ขึ้นอยู่กับแต่ละอื่น ๆ ดังนั้นคำว่าทฤษฎีบท Naive Bayes ถ้าเราพูดถึงแมชชีนเลิร์นนิ่ง Naive Bayes Classifier เป็นอัลกอริธึมที่ใช้ทฤษฎีบท Bayes เพื่อทำนายเหตุการณ์ในขณะที่สมมติว่าแอตทริบิวต์ของคลาสใดคลาสหนึ่งเป็นอิสระจากกัน คุณลักษณะเหล่านี้ถือว่าเท่ากันและสามารถมีอยู่ได้โดยไม่ต้องขึ้นอยู่กับคุณลักษณะอื่น

เราสามารถใช้ Naive Bayes Classifier ได้กับการทำงานหลายอย่าง เช่น การวินิจฉัยโรคเฉพาะถ้ามีอาการต่างๆ การพยากรณ์อากาศ ความชื้น อุณหภูมิ และปัจจัยอื่นๆ พูดง่ายๆ ก็คือ คุณสามารถใช้อัลกอริธึม Bayes ที่ไร้เดียงสาสำหรับกระบวนการข้อมูลใดๆ ที่ต้องใช้การจำแนกประเภทหลายคลาสแบบไบนารีหรือหลายแบบ Naive Bayes Classifier ทำงานบนแนวคิดของความน่าจะเป็นแบบมีเงื่อนไข หมายความว่าความน่าจะเป็นของเหตุการณ์หนึ่งที่เกิดขึ้นนั้นขึ้นอยู่กับการเกิดขึ้นของเหตุการณ์อื่น ตัวอย่างเช่น ความน่าจะเป็นแบบมีเงื่อนไขของเหตุการณ์ A ที่เกิดขึ้นนั้นขึ้นอยู่กับการเกิดขึ้นของเหตุการณ์ B

รับใบรับรองการเรียนรู้ของเครื่องจากมหาวิทยาลัยชั้นนำของโลก รับ Masters, Executive PGP หรือ Advanced Certificate Programs เพื่อติดตามอาชีพของคุณอย่างรวดเร็ว

การทำงานของลักษณนาม Naive Bayes

Naive Bayes Classifier ใช้เพื่อค้นหาความน่าจะเป็นของเอาต์พุตหากมีอินพุต Naive Bayes Classifier แก้ปัญหาการสร้างแบบจำลองการคาดการณ์โดยจัดหมวดหมู่คลาสโดยใช้ป้ายกำกับต่างๆ อัลกอริธึมแมชชีนเลิร์นนิงตามแบบจำลองความน่าจะเป็นสามารถแก้ปัญหาที่ซับซ้อนดังกล่าวได้

ตัวอย่างเช่น มี y1, y2, y3…….yn class label และ x1, x2, x3……xk ตัวแปรอินพุตในปัญหาการจัดหมวดหมู่ อันดับแรก เราต้องคำนวณความน่าจะเป็นแบบมีเงื่อนไขของเลเบลคลาส y อื่นในกรณีของอินพุต x จากนั้นเราจะพิจารณาคุณลักษณะที่มีความน่าจะเป็นแบบมีเงื่อนไขสูงสุดเป็นการจัดประเภทที่เหมาะสมที่สุด

โมเดลต่างๆ ของ Naive Bayes Classifier

นี่คือตัวแยกประเภท Naive Bayes สามประเภท

  • Gaussian Naive Bayes – Gaussian Naive Bayes ใช้การแจกแจงแบบปกติหรือแบบเกาส์เซียนเพื่อรองรับข้อมูลอย่างต่อเนื่อง ทฤษฎีบทการแจกแจงแบบปกติจะวิเคราะห์ข้อมูลหากมีความเป็นไปได้ที่ข้อมูลต่อเนื่องจะถูกกระจายอย่างเท่าเทียมกันเหนือหรือต่ำกว่าค่าเฉลี่ย
  • Multinomial Naive Bayes – เราใช้ multinomial Naive Bayes classifier เมื่อต้องมีการจัดหมวดหมู่ของคุณสมบัติที่ไม่ต่อเนื่อง เช่น การนับจำนวนคำสำหรับการจัดประเภทข้อความ มันวิเคราะห์เนื้อหาของเอกสารทางสถิติและกำหนดให้กับชั้นเรียน
  • Bernoulli Naive Bayes – The Bernoulli Naive Bayes นั้นคล้ายกับ Multinomial Naive Bayes นอกจากนี้ยังใช้สำหรับข้อมูลที่ไม่ต่อเนื่อง อย่างไรก็ตาม จะรับเฉพาะคุณสมบัติไบนารี – 0 และ 1 ดังนั้น ในกรณีของคุณสมบัติไบนารีในชุดข้อมูล เราต้องใช้ Bernoulli Naive Bayes

ข้อดีและข้อเสียของตัวจำแนก Naive Bayes

คุณลักษณะที่สำคัญที่สุดของ Naive Bayes Classifier คือสามารถจัดการข้อมูลทั้งแบบต่อเนื่องและแบบไม่ต่อเนื่องได้ ความแม่นยำของ Naive Bayes Classifier จะเพิ่มขึ้นตามปริมาณข้อมูล เนื่องจากจะให้ผลลัพธ์ที่แม่นยำยิ่งขึ้นหากใช้ชุดข้อมูลขนาดใหญ่ นี่คือข้อดีและข้อเสียบางประการของ Naive Bayes Classifier

ข้อดีของ Naive Bayes Classifier

  • ปรับขนาดได้สูง – ข้อดีที่สำคัญที่สุดประการหนึ่งของ Naive Bayes Classifier คือสามารถปรับขนาดได้สูงเนื่องจากสมมติฐานที่ไร้เดียงสา
  • ระยะเวลาการฝึกอบรมที่น้อยลง – เราต้องการข้อมูลการฝึกอบรมจำนวนเล็กน้อยเพื่อฝึกอบรม Naive Bayes Classifier ดังนั้น ระยะเวลาการฝึกอบรมจึงค่อนข้างสั้นเมื่อเทียบกับอัลกอริธึมอื่นๆ
  • เรียบง่าย – ข้อได้เปรียบที่สำคัญอีกประการหนึ่งของ Naive Bayes Classifier คือการสร้างง่าย นอกจากนี้ยังสามารถใช้ในการจำแนกชุดข้อมูลขนาดใหญ่ได้อย่างง่ายดาย

ข้อเสียของ Naive Bayes Classifier

  • ข้อจำกัดในการใช้งานจริง – Naive Bayes Classifier ตั้งสมมติฐานไร้เดียงสาว่าคุณลักษณะต่างๆ ของคลาสนั้นไม่ขึ้นอยู่กับกันและกัน เนื่องจากปรากฏการณ์นี้ไม่ค่อยเกิดขึ้นในโลกแห่งความเป็นจริง อัลกอริทึมจึงสามารถใช้เพื่อวัตถุประสงค์ที่จำกัด
  • ปัญหาความถี่เป็นศูนย์ – หากชุดข้อมูลการฝึกมีค่าเพิ่มที่ขาดหายไปในภายหลัง ตัวแยกประเภท Naive Bayes จะทำเครื่องหมายค่านั้นเป็นศูนย์เนื่องจากไม่มีความถี่ ดังนั้น เมื่อคูณความน่าจะเป็นของค่าต่างๆ กัน ความน่าจะเป็นตามความถี่จะกลายเป็นศูนย์ เนื่องจากอัลกอริธึมได้กำหนดค่าศูนย์ให้กับข้อมูลที่ขาดหายไป ซึ่งอาจนำไปสู่ผลลัพธ์ที่ไม่ถูกต้อง

การใช้ตัวแยกประเภท Naive Bayes ในการเรียนรู้ของเครื่องและปัญญาประดิษฐ์

อัลกอริธึม Naive Bayes มีประโยชน์ในการเรียนรู้ด้วยเครื่องและปัญญาประดิษฐ์ เนื่องจากมีการสันนิษฐานว่าคุณลักษณะทั้งหมดของคลาสไม่ได้ขึ้นอยู่กับกันและกัน ต่อไปนี้คือการใช้งานเชิงปฏิบัติของ Naive Bayes Classifier ในการเรียนรู้ของเครื่องและปัญญาประดิษฐ์:

  • การ ทำนายมะเร็งลำไส้ใหญ่ – นักวิจัยแนะนำให้ใช้แบบจำลอง Naive Bayes Classifier เพื่อทำนายมะเร็งลำไส้ใหญ่ อาจเป็นหนึ่งในการใช้งานที่โดดเด่นที่สุดของ Naive Bayes Classifier สามารถทำได้ด้วยข้อมูลมะเร็งลำไส้ใหญ่ เช่น ช่วงของฮีโมโกลบิน และจำนวนเซลล์เม็ดเลือดแดงและเม็ดเลือดขาวในร่างกายของผู้ป่วยลำไส้ใหญ่เป็นข้อมูลการฝึกสำหรับแบบจำลอง อัลกอริธึมสามารถทำนายมะเร็งลำไส้ใหญ่ได้หากฮีโมโกลบินและเซลล์เม็ดเลือดของผู้ป่วยอยู่ในช่วงเดียวกัน
  • การจัดการความเสี่ยงด้านการจราจร – สามารถใช้ Naive Bayes Classifier สำหรับการจัดการความเสี่ยงด้านการจราจรได้ Naive Bayes Classifier สามารถคาดการณ์ความเสี่ยงในการขับขี่ของผู้ขับขี่และการจราจรบนท้องถนนโดยอิงจากข้อมูลการฝึก

บล็อกการเรียนรู้ของเครื่องยอดนิยมและปัญญาประดิษฐ์

IoT: ประวัติศาสตร์ ปัจจุบัน และอนาคต บทช่วยสอนการเรียนรู้ของเครื่อง: เรียนรู้ ML อัลกอริทึมคืออะไร? ง่ายและสะดวก
เงินเดือนวิศวกรหุ่นยนต์ในอินเดีย: บทบาททั้งหมด วันหนึ่งในชีวิตของวิศวกรแมชชีนเลิร์นนิง: พวกเขาทำอะไร? IoT คืออะไร (Internet of Things)
การเปลี่ยนแปลงและการรวมกัน: ความแตกต่างระหว่างการเปลี่ยนแปลงและการรวมกัน แนวโน้ม 7 อันดับแรกในปัญญาประดิษฐ์และการเรียนรู้ของเครื่อง แมชชีนเลิร์นนิงกับ R: ทุกสิ่งที่คุณต้องรู้

บทสรุป

Naive Bayes Classifier เป็นอัลกอริธึมที่เป็นมิตรกับผู้เริ่มต้นซึ่งช่วยลดความยุ่งยากในการจำแนกประเภทในการเรียนรู้ของเครื่องและปัญญาประดิษฐ์ อัลกอริธึม Naive Bayes ใช้สำหรับการใช้งานจริงต่างๆ เช่น การป้องกันสแปม การพยากรณ์อากาศ และการวินิจฉัยทางการแพทย์โดยใช้ ML และ Ai ดังนั้น หากคุณมีความสนใจในการเรียนรู้ของเครื่องและต้องการที่จะประกอบอาชีพในสาขานี้ คุณต้องรู้เกี่ยวกับ Naive Bayes Classifier และอัลกอริธึมพื้นฐานอื่นๆ คุณสามารถเรียน วิทยาศาสตรมหาบัณฑิตสาขาการเรียนรู้ของเครื่องและปัญญาประดิษฐ์ จาก upGrad เพื่อเรียนรู้อัลกอริทึมและทักษะ ML และ AI อื่นๆ ในเชิงลึก หลักสูตรนี้ยังให้โอกาสในการทำงานในโครงการแมชชีนเลิร์นนิงในชีวิตจริง ช่วยให้คุณได้รับทักษะ ปรับปรุงประวัติย่อของคุณ และคว้าโอกาสในการทำงานหลายอย่างใน AI และ ML

เราสามารถใช้ทฤษฎีบท Naive Bayes เพื่อการถดถอยได้หรือไม่?

ได้ สามารถใช้ Naive Bayes Classifier สำหรับการถดถอยได้ ก่อนหน้านี้ แอปพลิเคชันจำกัดเฉพาะงานการจำแนกประเภท อย่างไรก็ตาม ด้วยการปรับเปลี่ยนทีละน้อย ตอนนี้เราสามารถใช้มันเพื่อการถดถอย ซึ่งหมายความว่า Naive Bayes Classifier สามารถนำไปใช้กับการจำแนกทั้งแบบกำเนิดและแบบจำแนกได้

Naive Bayes Classifier ดีกว่าการถดถอยโลจิสติกหรือไม่?

ทั้งการถดถอยโลจิสติกและ Naive Bayes Classifier เป็นอัลกอริธึมการจำแนกเชิงเส้นที่ใช้ข้อมูลอย่างต่อเนื่อง อย่างไรก็ตาม หากมีอคติหรือลักษณะเฉพาะที่แตกต่างกันในคลาส ตัวแยกประเภทแบบไร้เดียงสาจะให้ความแม่นยำที่ดีกว่าการถดถอยโลจิสติกเนื่องจากสมมติฐานที่ไร้เดียงสา

Naive Bayes Classifier ทำงานเกี่ยวกับแมชชีนเลิร์นนิงอะไรได้บ้าง

Naive Bayes Classifier อำนวยความสะดวกให้กับงานการเรียนรู้ภายใต้การดูแลในการเรียนรู้ของเครื่อง อัลกอริทึมจะจำแนกข้อมูลตามข้อมูลการฝึกอบรมที่ให้ไว้ก่อนหน้านี้ อัลกอริธึม Naive Bayes คาดการณ์การจัดประเภทที่เกิดขึ้นจากอินพุต-เอาต์พุตหรือประสบการณ์ก่อนหน้า