คู่มือเริ่มต้นสำหรับการอนุมานแบบเบย์: คู่มือฉบับสมบูรณ์

เผยแพร่แล้ว: 2021-11-26

แอปพลิเคชันการเรียนรู้ของเครื่องเพิ่มขึ้นด้วยการนำไปใช้อย่างกว้างขวางในการวิจัย โซเชียลมีเดีย การโฆษณา ฯลฯ อย่างไรก็ตาม แอปพลิเคชันส่วนใหญ่จัดการกับการคาดการณ์ที่เกี่ยวข้องกับข้อมูลจำนวนมหาศาล สถิติมักใช้สำหรับการหาปริมาณของการวัดค่าความไม่แน่นอน หากเรามีเหตุการณ์ต่างกัน สามวิธีสามารถกำหนดความน่าจะเป็นของเหตุการณ์ได้
สามวิธีนี้คือ:

  • คลาสสิก
  • เบย์เซียน
  • frequentist

ให้เราพิจารณาตัวอย่างของการทอยลูกเต๋าเพื่อหาความน่าจะเป็นที่จะแสดงหน้าของ “สี่” หรือไม่ จะช่วยในการทำความเข้าใจวิธีการกำหนดความน่าจะเป็นทั้งสามประเภท สมมติว่าคุณพิจารณาวิธีการประมาณความน่าจะเป็นแบบคลาสสิก ในกรณีนั้น เชื่อกันว่าจะมีทั้งหมด 6 ผลลัพธ์ และความน่าจะเป็นของผลลัพธ์ใด ๆ ที่เกิดขึ้นจะเหมือนกัน ในสมมติฐานดังกล่าว ความน่าจะเป็นที่ผลลัพธ์จะเป็นสี่จะเป็น 1/6 วิธีการแบบคลาสสิกมักจะใช้ได้ผลดีเมื่อผลลัพธ์มีแนวโน้มเท่ากัน แต่เมื่อผลลัพธ์กลายเป็นอัตนัยมากขึ้น วิธีนี้ใช้ไม่ได้

หากเราพิจารณาวิธี Frequentist จำเป็นต้องมีลำดับอนันต์ของเหตุการณ์ที่เป็นการสมมติขึ้น จากนั้นจึงต้องการการค้นหาความถี่ที่เกี่ยวข้องในลำดับสมมุติฐานอนันต์ เมื่อพิจารณาจากตัวอย่างข้างต้นของลูกเต๋า หากทอยลูกเต๋าเป็นจำนวนนับไม่ถ้วน ผลลัพธ์ เช่น 1/6 เราจะได้ผลลัพธ์เป็นสี่ ดังนั้นความน่าจะเป็นที่ผลลัพธ์จะเป็นสี่ในลูกเต๋าหกด้านจะเป็น 1/6 ตามคำจำกัดความของวิธีความถี่

มาถึงแนวทางแบบเบย์เซียนแล้ว คุณจะมีข้อดีบางประการ ตามมุมมองของวิธีการนี้ คุณสามารถรวมความเชื่อส่วนบุคคลเข้ากับกระบวนการตัดสินใจได้ นั่นหมายความว่าจะพิจารณาสิ่งต่าง ๆ เช่นข้อมูลที่ทราบเกี่ยวกับปัญหา ความจริงที่ว่าบุคคลต่าง ๆ สามารถมีความเชื่อต่างกันได้ก็ถูกพิจารณาในแนวทางนี้เช่นกัน ตัวอย่างเช่น สมมติว่าถ้ามีคนกล่าวว่าความน่าจะเป็นที่ฝนจะตกคือ 90% ในวันพรุ่งนี้ สำหรับบางคน ความน่าจะเป็นที่ฝนจะตกอาจเป็น 60% ดังนั้นวิธีการของแนวทางแบบเบย์จึงเป็นแบบอัตนัย อย่างไรก็ตาม ผลลัพธ์นั้นเข้าใจง่ายกว่าเมื่อเปรียบเทียบกับวิธี Frequentist

สารบัญ

การอนุมานแบบเบย์

การอนุมานแบบเบย์ส่วนใหญ่จะใช้สำหรับปัญหาของการอนุมานทางสถิติ ในกรณีเหล่านี้ มีปริมาณ (ข้อมูล) ที่ไม่รู้จักอยู่เสมอซึ่งจำเป็นต้องประเมิน จากนั้นจากข้อมูลจะประมาณปริมาณที่ต้องการ ปริมาณที่ไม่รู้จักเรียกว่า θ มีการสันนิษฐานว่า θ เป็นปริมาณแบบสุ่ม และมีการเดาเบื้องต้นสำหรับค่าของ θ การกระจายประเภทนี้เรียกว่าการแจกแจงก่อนหน้า การอัปเดตค่ามักจะทำผ่านกฎของเบย์ ดังนั้นแนวทางนี้จึงเรียกว่าแนวทางแบบเบย์เซียน

ทฤษฎีบทเบย์

การประยุกต์ใช้การอนุมานแบบเบย์ขึ้นอยู่กับความเข้าใจของทฤษฎีบทเบย์

พิจารณาว่ามีผลลัพธ์สองชุด เช่น ชุด A และชุด B ชุดเหล่านี้เรียกอีกอย่างว่าเหตุการณ์ ให้เราแสดงความน่าจะเป็นของเหตุการณ์ A เป็น P(A) และเหตุการณ์ B เป็น P(B) นี่คือความน่าจะเป็นของเหตุการณ์แต่ละอย่าง อย่างไรก็ตาม ความน่าจะเป็นร่วมกันสามารถกำหนดได้โดยใช้คำว่า P(A, B) ความน่าจะเป็นแบบมีเงื่อนไขสามารถขยายได้ดังนี้:

P(A,B) = P(A|B)P(B),

ซึ่งหมายความว่าในขณะที่ให้ B ความน่าจะเป็นแบบมีเงื่อนไขของ A และ B ส่งผลให้เกิดความน่าจะเป็นร่วมกันของทั้งสองเหตุการณ์

P(A,B) = P(B|A)P(A)

ในสมการทั้งสองข้างบนนี้ ทางซ้ายของสมการจะเท่ากัน ดังนั้นทางขวามือของสมการจึงควรเท่ากัน

P(A|B)P(B) = P(B|A)P(A)

P(A|B) = P(B|A)P(A)/P(B)

สมการนี้เรียกว่าทฤษฎีบทของเบย์

ในสาขาวิทยาศาสตร์ข้อมูล ทฤษฎีบทของเบย์สามารถเขียนในลักษณะเป็น

P(สมมติฐาน|ข้อมูล) = P(ข้อมูล|สมมติฐาน) P(สมมติฐาน)/p(ข้อมูล)

ตัวส่วนซึ่งเป็นหลักฐานช่วยให้แน่ใจว่าการแจกแจงภายหลังทางด้านซ้ายของสมการคือความหนาแน่นของความน่าจะเป็นที่ถูกต้อง นี่เรียกอีกอย่างว่าค่าคงที่การทำให้เป็นมาตรฐาน

มีสามองค์ประกอบในสมการของทฤษฎีบทเบย์

  • ก่อน
  • ความน่าจะเป็น
  • หลัง

แจกก่อน

ปัจจัยสำคัญประการหนึ่งในวิธีการอนุมานแบบเบย์คือการแจกแจงล่วงหน้า ด้วยวิธีนี้ คุณสามารถรวมความเชื่อส่วนบุคคลเข้ากับกระบวนการตัดสินใจได้ นอกจากนี้ คุณยังสามารถรวมการตัดสินโดยพิจารณาจากบุคคลต่างๆ ในการศึกษาได้ สิ่งนี้ทำผ่านนิพจน์ทางคณิตศาสตร์ พารามิเตอร์ที่ไม่รู้จักซึ่งแสดงโดย θ ใช้เพื่อแสดงความเชื่อของตน สำหรับการแสดงความเชื่อเหล่านี้ จะใช้ฟังก์ชันการแจกแจง ซึ่งเป็นการแจกแจงก่อนหน้า ดังนั้น ก่อนทำการทดสอบใดๆ การกระจายจะถูกเลือก

คู่มือเริ่มต้นสำหรับการอนุมานแบบเบย์

1. การเลือกก่อน

โดยปกติการแจกแจงสะสมถูกกำหนดไว้สำหรับพารามิเตอร์ θ เหตุการณ์เหล่านั้นที่มีค่าของความน่าจะเป็นก่อนหน้าเป็นศูนย์จะมีค่าของความน่าจะเป็นหลังเป็นศูนย์ และสำหรับเหตุการณ์เหล่านั้นที่มีค่าของความน่าจะเป็นก่อนหน้า เหตุการณ์หนึ่งจะมีค่าของความน่าจะเป็นหลังเป็นหนึ่ง ดังนั้น กรอบความคิดที่ดีของแนวทางแบบเบย์จะไม่กำหนดประมาณการบางจุดของเหตุการณ์ที่เกิดขึ้นแล้ว หรือไม่มีข้อมูลการเกิดขึ้น มีเทคนิคบางอย่างในการเลือกก่อน เทคนิคหนึ่งที่ใช้กันอย่างแพร่หลายในการเลือกก่อนหน้าคือการใช้ฟังก์ชันการกระจาย ใช้ตระกูลของฟังก์ชันทั้งหมด หน้าที่เหล่านี้ควรมีความยืดหยุ่นและจะสามารถแสดงถึงความเชื่อของแต่ละบุคคลได้

2. ความน่าจะเป็น

ให้เราพิจารณา θ เป็นพารามิเตอร์ที่ไม่รู้จักที่จะประมาณ ความเป็นธรรมของเหรียญสามารถแสดงออกผ่าน θ โดยพิจารณาจาก ตัวอย่างการอนุมานแบบเบ ย์ มีการพลิกเหรียญอย่างไม่สิ้นสุดเพื่อตรวจสอบความเป็นธรรม ดังนั้นทุกครั้งที่พลิกจะมีหัวหรือหาง ค่าที่กำหนดให้กับเหตุการณ์คือ 0 และ 1 ซึ่งเรียกอีกอย่างว่าการทดลองของ Bernoulli ผลลัพธ์ทั้งหมดถือว่าเป็นอิสระ สิ่งนี้สามารถแสดงออกผ่านสมการที่กำหนดแนวคิดของความน่าจะเป็น ความน่าจะเป็นคือฟังก์ชันความหนาแน่นซึ่งเป็นฟังก์ชันของ θ เพื่อเพิ่มความเป็นไปได้สูงสุด ค่าของ θ ควรส่งผลให้ค่าความน่าจะเป็นมากที่สุด วิธีการประมาณค่าเรียกอีกอย่างว่าการประมาณความน่าจะเป็นสูงสุด

3. การกระจายหลัง

ผลลัพธ์ของทฤษฎีบทเบย์เรียกว่าการแจกแจงภายหลัง เป็นความน่าจะเป็นที่อัปเดตของเหตุการณ์ใด ๆ ที่เกิดขึ้นหลังจากพิจารณาข้อมูลใหม่แล้ว

4. กลไกการอนุมานแบบเบย์

ดังที่เราได้เห็นข้างต้น วิธีการอนุมานแบบเบย์ถือว่าแนวคิดเรื่องความน่าจะเป็นเป็นความเชื่อในระดับหนึ่ง ความเชื่อเหล่านี้สัมพันธ์กับข้อเท็จจริงที่ว่าเหตุการณ์อาจเกิดขึ้นภายใต้หลักฐานดังกล่าว ดังนั้น พารามิเตอร์ theta “θ” จึงถือเป็นตัวแปรสุ่ม

5. การอนุมานแบบเบย์ในความเสี่ยงทางการเงิน

มีอัลกอริธึมมากมายที่สามารถใช้การอนุมานแบบเบย์ได้ อัลกอริทึมบางส่วน ได้แก่ โครงข่ายประสาทเทียม ฟอเรสต์สุ่ม การถดถอย ฯลฯ วิธีการนี้ยังพบความนิยมในภาคการเงินอีกด้วย สามารถใช้สำหรับแบบจำลองความเสี่ยงด้านปฏิบัติการของธนาคารหลายแห่ง ข้อมูลของธนาคารที่แสดงการขาดทุนของการดำเนินงานแสดงเหตุการณ์บางอย่างที่หายไป เหตุการณ์ที่สูญหายเหล่านี้มีความถี่ต่ำ แต่มีความรุนแรงสูง ดังนั้น ในกรณีเช่นนี้ การอนุมานแบบเบย์จึงพิสูจน์ได้ว่ามีประโยชน์มาก เนื่องจากในวิธีนี้ การวิเคราะห์ไม่จำเป็นต้องใช้ข้อมูลจำนวนมาก

วิธีการวิเคราะห์ทางสถิติอื่นๆ เช่น วิธีที่ใช้บ่อย ก็ถูกนำมาใช้ก่อนหน้านี้สำหรับการจำลองความเสี่ยงในการปฏิบัติงาน แต่มีปัญหาในการประมาณค่าพารามิเตอร์ความไม่แน่นอน ดังนั้น การอนุมานแบบเบย์จึงถือเป็นวิธีที่มีประสิทธิภาพสูงสุด เนื่องจากความคิดเห็นของผู้เชี่ยวชาญและข้อมูลสามารถใช้สำหรับการแจกแจงภายหลังได้ ในงานประเภทนี้ ข้อมูลการสูญเสียภายในของธนาคารจะแบ่งออกเป็นส่วนย่อยๆ หลายส่วน จากนั้นความถี่ของชิ้นส่วนแต่ละส่วนจะถูกประเมินผ่านการตัดสินของผู้เชี่ยวชาญ จากนั้นจึงนำไปใส่ในการแจกแจงความน่าจะเป็น

เข้าร่วม หลักสูตรแมชชีนเลิ ร์นนิง ออนไลน์จากมหาวิทยาลัยชั้นนำของโลก – ปริญญาโท หลักสูตร Executive Post Graduate และหลักสูตรประกาศนียบัตรขั้นสูงใน ML & AI เพื่อติดตามอาชีพของคุณอย่างรวดเร็ว

บทสรุป

ในสถิติและแมชชีนเลิร์นนิง วิธีการหลักสองวิธีที่สามารถนำไปใช้ได้คือวิธีการของ Frequentist และ Bayesian Inference เราได้กล่าวถึงวิธีการอนุมานแบบเบย์ในบทความแล้ว โดยจะคำนวณความน่าจะเป็นตามความเชื่อส่วนตัว นอกจากข้อมูลแล้ว ความเชื่อส่วนบุคคลของประชาชนยังถูกรวมเข้าไว้ด้วยในขณะประเมินความน่าจะเป็น สิ่งเหล่านี้ทำให้แบบจำลองเป็นที่ยอมรับอย่างกว้างขวางมากขึ้นในการศึกษาการประมาณค่าจำนวนมาก ดังนั้นเทคนิคของการอนุมานแบบเบย์จึงระบุวิธีการหรือวิธีการใช้ความเชื่อของคุณกับการสังเกตข้อมูล นอกจากนี้ ในแอปพลิเคชันหลายประเภทที่มีข้อมูลที่มีสัญญาณรบกวนจำนวนมาก สามารถใช้เทคนิคการอนุมานแบบเบย์ได้ ดังนั้น พลังที่อยู่ในกฎของเบย์สามารถสัมพันธ์กับปริมาณที่สามารถคำนวณได้กับปริมาณที่สามารถใช้เพื่อตอบคำถามที่มีลักษณะตามอำเภอใจ

ยกระดับอาชีพของคุณในการเรียนรู้ของเครื่องและปัญญาประดิษฐ์

สมัครตอนนี้สำหรับ EPGP ในแมชชีนเลิร์นนิงและ AI