การถดถอยเชิงเส้นแบบเบย์: ฟังก์ชันและการใช้งานในชีวิตจริงคืออะไรในปี 2022

เผยแพร่แล้ว: 2021-01-08

สารบัญ

การถดถอยเชิงเส้นคืออะไร?

การถดถอยเชิงเส้นพยายามแสดงความเชื่อมโยงระหว่างสองปัจจัยโดยการปรับเงื่อนไขโดยตรงกับข้อมูลที่สังเกตได้ ตัวแปรหนึ่งถูกมองว่าเป็นตัวแปรตัวอย่าง และอีกตัวแปรหนึ่งถูกมองว่าเป็นตัวแปรขัดสน ตัวอย่างเช่น นักสร้างแบบจำลองควรเชื่อมโยงผู้คนจำนวนมากกับรูปปั้นของพวกเขาโดยใช้แบบจำลองการกำเริบโดยตรง

ขั้นตอนต่อไปคือการรู้ว่าสมการเชิงเส้นแบบเบย์คืออะไรและสามารถคำนวณได้อย่างไรเพื่อให้ได้ผลลัพธ์ที่ต้องการ

ทีนี้ สมการเชิงเส้นแบบเบย์คืออะไร?

เมื่อเราพูดถึงวิธีการถดถอยแบบเบย์ เรารู้ว่ามันเป็นวิธีที่ทรงพลังมาก เพราะมันให้การแจกแจงทั้งหมดเหนือพารามิเตอร์การถดถอย ในการคำนวณข้อมูลที่ไม่เพียงพอหรือข้อมูลที่กระจายไม่เท่ากัน Bayesian Linear Regression ได้จัดให้มีกลไกทางธรรมชาติ

คุณสามารถใส่ค่าก่อนบนสัมประสิทธิ์เพื่อที่ว่าหากไม่มีข้อมูล ค่าก่อนหน้าสามารถแทนที่ข้อมูลได้ การวิเคราะห์ทางสถิติดำเนินการภายใต้เงื่อนไขของอินเทอร์เฟซแบบเบย์ในการถดถอยเชิงเส้นแบบเบย์ในสถิติ

เราใช้การแจกแจงความน่าจะเป็นแทนการประมาณการจุดเพื่อสร้างการถดถอยเชิงเส้น

ผลลัพธ์ที่ได้มาจากการแจกแจงความน่าจะเป็น มากกว่าเทคนิคการถดถอยปกติ เป้าหมายของการถดถอยเชิงเส้นแบบเบย์คือการหา Posterior แทนพารามิเตอร์ของแบบจำลอง

พารามิเตอร์แบบจำลองควรจะเกิดขึ้นจากการแจกแจง

นิพจน์หลังคือ

หลัง= (โอกาส*ก่อนหน้า)/การทำให้เป็นมาตรฐาน

สมการข้างต้นคล้ายกับทฤษฎีบทของเบย์ ซึ่งก็คือ

แหล่งที่มา

การประยุกต์ใช้การถดถอยเชิงเส้นแบบเบย์ในชีวิตจริง

จากกราฟต่อไปนี้ การถดถอยเชิงเส้นและการถดถอยแบบเบย์สามารถสร้างการคาดคะเนแบบเดียวกันได้

แหล่งที่มา

แหล่งที่มา

ในกราฟที่แล้ว เราสามารถสรุปได้ว่าหากการกระจายเชิงพยากรณ์อยู่ภายในสีที่มีความหนา ความหนาแน่นของข้อมูลจะสูงและหากอยู่ในพื้นที่ที่หายาก ความหนาแน่นจะถือว่าต่ำ

มาพูดถึงข้อดีของการถดถอยแบบเบย์กัน:

  • ด้วยความช่วยเหลือของการประมวลผลแบบเบย์ เราสามารถเรียกโซลูชันอนุมานที่หลากหลายทั้งหมดแทนการประมาณแบบจุด
  • มันทำงานอย่างมีประสิทธิภาพด้วยขนาดที่เล็กของชุดข้อมูล
  • มันเหมาะมากสำหรับรูปแบบการเรียนรู้ออนไลน์ ในขณะที่ในรูปแบบของการเรียนรู้แบบกลุ่ม เรามีชุดข้อมูลทั้งหมด
  • เป็นวิธีที่มีประสิทธิภาพและผ่านการทดสอบแล้ว

ทีนี้ มาพูดถึงข้อเสียของการถดถอยเชิงเส้นแบบเบย์กัน

  • จะไม่ทำงานอย่างมีประสิทธิภาพหากชุดข้อมูลมีข้อมูลจำนวนมาก
  • การคาดเดาของแบบจำลองอาจใช้เวลานาน

อ่าน: แนวคิดและหัวข้อโครงการเชิงเส้น

บทสรุป

ดังนั้นเราจึงสามารถเห็นได้ว่าวิธีที่มีประสิทธิภาพของการถดถอยเชิงเส้นแบบเบย์คืออะไร ข้อดีหลายประการสามารถนำมาใช้กับการถดถอยเชิงเส้นแบบเบย์ได้ และเป็นหนึ่งในกลไกทางธรรมชาติในการคำนวณข้อมูลที่กระจายไม่เพียงพอหรือไม่เพียงพอ

มุมมองแบบเบย์เป็นรูปแบบสัญชาตญาณของการมองโลก การอนุมานแบบเบย์สามารถปรุงแต่งสิ่งทดแทนที่สะดวกมากสำหรับคู่กันที่ใช้บ่อย ใช้ในด้านต่างๆ เช่น วิทยาศาสตร์ข้อมูล การเรียนรู้ของเครื่อง และอื่นๆ อีกมากมาย ช่วยในการสร้างแบบจำลองต่างๆ ด้วยความช่วยเหลือที่เราสามารถแก้ปัญหาได้มากมาย

หากคุณต้องการทราบข้อมูลเพิ่มเติมเกี่ยวกับอาชีพในแมชชีนเลิร์นนิงและปัญญาประดิษฐ์ โปรดดูที่ IIT Madras และการรับรองขั้นสูงของ upGrad ในการเรียนรู้ของเครื่องและคลาวด์

การอนุมานแบบเบย์คืออะไร?

การอนุมานแบบเบย์เป็นกลุ่มของการดำเนินการทางคณิตศาสตร์ตามทฤษฎีบทเบย์ เป็นวิธีการทางคณิตศาสตร์สำหรับกำหนดความน่าจะเป็นแบบมีเงื่อนไข ความเป็นไปได้ของผลลัพธ์ที่เกิดขึ้นขึ้นอยู่กับความน่าจะเป็นของผลลัพธ์หลักที่เกิดขึ้นนั้นเรียกว่าความน่าจะเป็นแบบมีเงื่อนไข ผู้เชี่ยวชาญสามารถใช้ทฤษฎีบทเบย์เพื่อแก้ไขการคาดการณ์หรือสมมติฐานก่อนหน้าได้ ใช้ในด้านการเงินเพื่อประเมินความเสี่ยงในการให้เงินแก่ผู้กู้ที่มีศักยภาพ เมื่อพิจารณาถึงความเป็นไปได้ที่แต่ละบุคคลจะมีอาการป่วยและความแม่นยำทั่วไปของการทดสอบ อาจใช้ทฤษฎีบทของ Bayes เพื่อประเมินความถูกต้องของผลการทดสอบทางการแพทย์

การถดถอยเชิงเส้นแบบเบย์แตกต่างจากการถดถอยเชิงเส้นธรรมดาอย่างไร

การถดถอยเชิงเส้นธรรมดาเป็นวิธีที่ใช้บ่อย ซึ่งหมายความว่ามีการวัดที่เพียงพอเพื่อสร้างข้อความที่ถูกต้อง ข้อมูลถูกเสริมด้วยข้อมูลเพิ่มเติมในรูปแบบของการแจกแจงความน่าจะเป็นก่อนหน้าในวิธีเบย์เซียน ความเชื่อภายหลังเกี่ยวกับพารามิเตอร์ได้มาจากการรวมความรู้ก่อนหน้าเกี่ยวกับพารามิเตอร์เข้ากับฟังก์ชันความน่าจะเป็นของข้อมูลโดยใช้ทฤษฎีบทเบย์ การตีความแบบเบย์ของการถดถอยเชิงเส้นและการถดถอยแบบลอจิสติกใช้การวิเคราะห์ทางสถิติภายในบริบทของสมมติฐานแบบเบย์

การถดถอยเชิงเส้นแบบเบย์ทำงานอย่างไร

เรานิยามการถดถอยเชิงเส้นโดยใช้การแจกแจงความน่าจะเป็นมากกว่าการประมาณแบบจุดจากเปอร์สเปคทีฟแบบเบย์ คำตอบคือ y ควรเลือกจากการแจกแจงความน่าจะเป็นมากกว่าที่จะประเมินเป็นตัวเลขเดียว ผลลัพธ์ y เกิดจากการแจกแจงแบบปกติ (เกาส์เซียน) โดยมีค่าเฉลี่ยและความแปรปรวน ในการถดถอยเชิงเส้น ค่าเฉลี่ยคำนวณโดยการคูณเมทริกซ์น้ำหนักด้วยเมทริกซ์ตัวทำนาย เนื่องจากนี่เป็นแบบจำลองหลายมิติ ความแปรปรวนจึงเป็นกำลังสองของส่วนเบี่ยงเบนมาตรฐานคูณด้วยเมทริกซ์เอกลักษณ์ เป้าหมายของการถดถอยเชิงเส้นแบบเบย์คือการระบุการแจกแจงภายหลังสำหรับพารามิเตอร์แบบจำลอง ไม่ใช่เพื่อค้นหาผลลัพธ์ที่สมบูรณ์แบบโดยเฉพาะสำหรับพารามิเตอร์ของแบบจำลอง