การถดถอยเชิงเส้นแบบเบย์: ฟังก์ชันและการใช้งานในชีวิตจริงคืออะไรในปี 2022
เผยแพร่แล้ว: 2021-01-08สารบัญ
การถดถอยเชิงเส้นคืออะไร?
การถดถอยเชิงเส้นพยายามแสดงความเชื่อมโยงระหว่างสองปัจจัยโดยการปรับเงื่อนไขโดยตรงกับข้อมูลที่สังเกตได้ ตัวแปรหนึ่งถูกมองว่าเป็นตัวแปรตัวอย่าง และอีกตัวแปรหนึ่งถูกมองว่าเป็นตัวแปรขัดสน ตัวอย่างเช่น นักสร้างแบบจำลองควรเชื่อมโยงผู้คนจำนวนมากกับรูปปั้นของพวกเขาโดยใช้แบบจำลองการกำเริบโดยตรง
ขั้นตอนต่อไปคือการรู้ว่าสมการเชิงเส้นแบบเบย์คืออะไรและสามารถคำนวณได้อย่างไรเพื่อให้ได้ผลลัพธ์ที่ต้องการ
ทีนี้ สมการเชิงเส้นแบบเบย์คืออะไร?
เมื่อเราพูดถึงวิธีการถดถอยแบบเบย์ เรารู้ว่ามันเป็นวิธีที่ทรงพลังมาก เพราะมันให้การแจกแจงทั้งหมดเหนือพารามิเตอร์การถดถอย ในการคำนวณข้อมูลที่ไม่เพียงพอหรือข้อมูลที่กระจายไม่เท่ากัน Bayesian Linear Regression ได้จัดให้มีกลไกทางธรรมชาติ
คุณสามารถใส่ค่าก่อนบนสัมประสิทธิ์เพื่อที่ว่าหากไม่มีข้อมูล ค่าก่อนหน้าสามารถแทนที่ข้อมูลได้ การวิเคราะห์ทางสถิติดำเนินการภายใต้เงื่อนไขของอินเทอร์เฟซแบบเบย์ในการถดถอยเชิงเส้นแบบเบย์ในสถิติ
เราใช้การแจกแจงความน่าจะเป็นแทนการประมาณการจุดเพื่อสร้างการถดถอยเชิงเส้น
ผลลัพธ์ที่ได้มาจากการแจกแจงความน่าจะเป็น มากกว่าเทคนิคการถดถอยปกติ เป้าหมายของการถดถอยเชิงเส้นแบบเบย์คือการหา Posterior แทนพารามิเตอร์ของแบบจำลอง

พารามิเตอร์แบบจำลองควรจะเกิดขึ้นจากการแจกแจง
นิพจน์หลังคือ
หลัง= (โอกาส*ก่อนหน้า)/การทำให้เป็นมาตรฐาน
สมการข้างต้นคล้ายกับทฤษฎีบทของเบย์ ซึ่งก็คือ
แหล่งที่มา
การประยุกต์ใช้การถดถอยเชิงเส้นแบบเบย์ในชีวิตจริง
จากกราฟต่อไปนี้ การถดถอยเชิงเส้นและการถดถอยแบบเบย์สามารถสร้างการคาดคะเนแบบเดียวกันได้
แหล่งที่มา
แหล่งที่มา
ในกราฟที่แล้ว เราสามารถสรุปได้ว่าหากการกระจายเชิงพยากรณ์อยู่ภายในสีที่มีความหนา ความหนาแน่นของข้อมูลจะสูงและหากอยู่ในพื้นที่ที่หายาก ความหนาแน่นจะถือว่าต่ำ
มาพูดถึงข้อดีของการถดถอยแบบเบย์กัน:

- ด้วยความช่วยเหลือของการประมวลผลแบบเบย์ เราสามารถเรียกโซลูชันอนุมานที่หลากหลายทั้งหมดแทนการประมาณแบบจุด
- มันทำงานอย่างมีประสิทธิภาพด้วยขนาดที่เล็กของชุดข้อมูล
- มันเหมาะมากสำหรับรูปแบบการเรียนรู้ออนไลน์ ในขณะที่ในรูปแบบของการเรียนรู้แบบกลุ่ม เรามีชุดข้อมูลทั้งหมด
- เป็นวิธีที่มีประสิทธิภาพและผ่านการทดสอบแล้ว
ทีนี้ มาพูดถึงข้อเสียของการถดถอยเชิงเส้นแบบเบย์กัน

- จะไม่ทำงานอย่างมีประสิทธิภาพหากชุดข้อมูลมีข้อมูลจำนวนมาก
- การคาดเดาของแบบจำลองอาจใช้เวลานาน
อ่าน: แนวคิดและหัวข้อโครงการเชิงเส้น
บทสรุป
ดังนั้นเราจึงสามารถเห็นได้ว่าวิธีที่มีประสิทธิภาพของการถดถอยเชิงเส้นแบบเบย์คืออะไร ข้อดีหลายประการสามารถนำมาใช้กับการถดถอยเชิงเส้นแบบเบย์ได้ และเป็นหนึ่งในกลไกทางธรรมชาติในการคำนวณข้อมูลที่กระจายไม่เพียงพอหรือไม่เพียงพอ
มุมมองแบบเบย์เป็นรูปแบบสัญชาตญาณของการมองโลก การอนุมานแบบเบย์สามารถปรุงแต่งสิ่งทดแทนที่สะดวกมากสำหรับคู่กันที่ใช้บ่อย ใช้ในด้านต่างๆ เช่น วิทยาศาสตร์ข้อมูล การเรียนรู้ของเครื่อง และอื่นๆ อีกมากมาย ช่วยในการสร้างแบบจำลองต่างๆ ด้วยความช่วยเหลือที่เราสามารถแก้ปัญหาได้มากมาย
หากคุณต้องการทราบข้อมูลเพิ่มเติมเกี่ยวกับอาชีพในแมชชีนเลิร์นนิงและปัญญาประดิษฐ์ โปรดดูที่ IIT Madras และการรับรองขั้นสูงของ upGrad ในการเรียนรู้ของเครื่องและคลาวด์
การอนุมานแบบเบย์คืออะไร?
การอนุมานแบบเบย์เป็นกลุ่มของการดำเนินการทางคณิตศาสตร์ตามทฤษฎีบทเบย์ เป็นวิธีการทางคณิตศาสตร์สำหรับกำหนดความน่าจะเป็นแบบมีเงื่อนไข ความเป็นไปได้ของผลลัพธ์ที่เกิดขึ้นขึ้นอยู่กับความน่าจะเป็นของผลลัพธ์หลักที่เกิดขึ้นนั้นเรียกว่าความน่าจะเป็นแบบมีเงื่อนไข ผู้เชี่ยวชาญสามารถใช้ทฤษฎีบทเบย์เพื่อแก้ไขการคาดการณ์หรือสมมติฐานก่อนหน้าได้ ใช้ในด้านการเงินเพื่อประเมินความเสี่ยงในการให้เงินแก่ผู้กู้ที่มีศักยภาพ เมื่อพิจารณาถึงความเป็นไปได้ที่แต่ละบุคคลจะมีอาการป่วยและความแม่นยำทั่วไปของการทดสอบ อาจใช้ทฤษฎีบทของ Bayes เพื่อประเมินความถูกต้องของผลการทดสอบทางการแพทย์
การถดถอยเชิงเส้นแบบเบย์แตกต่างจากการถดถอยเชิงเส้นธรรมดาอย่างไร
การถดถอยเชิงเส้นธรรมดาเป็นวิธีที่ใช้บ่อย ซึ่งหมายความว่ามีการวัดที่เพียงพอเพื่อสร้างข้อความที่ถูกต้อง ข้อมูลถูกเสริมด้วยข้อมูลเพิ่มเติมในรูปแบบของการแจกแจงความน่าจะเป็นก่อนหน้าในวิธีเบย์เซียน ความเชื่อภายหลังเกี่ยวกับพารามิเตอร์ได้มาจากการรวมความรู้ก่อนหน้าเกี่ยวกับพารามิเตอร์เข้ากับฟังก์ชันความน่าจะเป็นของข้อมูลโดยใช้ทฤษฎีบทเบย์ การตีความแบบเบย์ของการถดถอยเชิงเส้นและการถดถอยแบบลอจิสติกใช้การวิเคราะห์ทางสถิติภายในบริบทของสมมติฐานแบบเบย์
การถดถอยเชิงเส้นแบบเบย์ทำงานอย่างไร
เรานิยามการถดถอยเชิงเส้นโดยใช้การแจกแจงความน่าจะเป็นมากกว่าการประมาณแบบจุดจากเปอร์สเปคทีฟแบบเบย์ คำตอบคือ y ควรเลือกจากการแจกแจงความน่าจะเป็นมากกว่าที่จะประเมินเป็นตัวเลขเดียว ผลลัพธ์ y เกิดจากการแจกแจงแบบปกติ (เกาส์เซียน) โดยมีค่าเฉลี่ยและความแปรปรวน ในการถดถอยเชิงเส้น ค่าเฉลี่ยคำนวณโดยการคูณเมทริกซ์น้ำหนักด้วยเมทริกซ์ตัวทำนาย เนื่องจากนี่เป็นแบบจำลองหลายมิติ ความแปรปรวนจึงเป็นกำลังสองของส่วนเบี่ยงเบนมาตรฐานคูณด้วยเมทริกซ์เอกลักษณ์ เป้าหมายของการถดถอยเชิงเส้นแบบเบย์คือการระบุการแจกแจงภายหลังสำหรับพารามิเตอร์แบบจำลอง ไม่ใช่เพื่อค้นหาผลลัพธ์ที่สมบูรณ์แบบโดยเฉพาะสำหรับพารามิเตอร์ของแบบจำลอง