25 คำถามและคำตอบสำหรับการสัมภาษณ์การเรียนรู้ของเครื่อง – การถดถอยเชิงเส้น

เผยแพร่แล้ว: 2022-09-08

เป็นแนวทางปฏิบัติทั่วไปในการทดสอบผู้สนใจวิทยาศาสตร์ข้อมูลเกี่ยวกับอัลกอริธึมการเรียนรู้ของเครื่องที่ใช้กันทั่วไปในการสัมภาษณ์ อัลกอริธึมทั่วไปเหล่านี้ ได้แก่ การถดถอยเชิงเส้น การถดถอยโลจิสติก การจัดกลุ่ม ต้นไม้การตัดสินใจ ฯลฯ นักวิทยาศาสตร์ด้านข้อมูลคาดว่าจะมีความรู้เชิงลึกเกี่ยวกับอัลกอริธึมเหล่านี้

เราได้ปรึกษากับผู้จัดการการจ้างงานและนักวิทยาศาสตร์ข้อมูลจากองค์กรต่างๆ เพื่อทราบเกี่ยวกับคำถาม ML ทั่วไปที่พวกเขาถามในการสัมภาษณ์ จากผลตอบรับที่กว้างขวางของพวกเขา ชุดของคำถามและคำตอบถูกเตรียมไว้เพื่อช่วยนักวิทยาศาสตร์ข้อมูลที่ต้องการในการสนทนาของพวกเขา คำถามสัมภาษณ์ เชิงเส้นถดถอย เป็นคำถาม ที่พบบ่อยที่สุดในการสัมภาษณ์แมชชีนเลิร์นนิง ถาม&ตอบเกี่ยวกับอัลกอริธึมเหล่านี้จะมีอยู่ในบล็อกโพสต์สี่ชุด

สารบัญ

สุดยอดหลักสูตรการเรียนรู้ของเครื่องและหลักสูตร AI ออนไลน์

วิทยาศาสตรมหาบัณฑิตสาขาวิชา Machine Learning & AI จาก LJMU Executive Post Graduate Program in Machine Learning & AI จาก IIITB
โปรแกรมประกาศนียบัตรขั้นสูงในการเรียนรู้ของเครื่อง & NLP จาก IIITB โปรแกรมประกาศนียบัตรขั้นสูงในการเรียนรู้ของเครื่องและการเรียนรู้เชิงลึกจาก IIITB Executive Post Graduate Program in Data Science & Machine Learning จาก University of Maryland
หากต้องการสำรวจหลักสูตรทั้งหมดของเรา โปรดไปที่หน้าด้านล่าง
หลักสูตรการเรียนรู้ของเครื่อง

โพสต์บล็อกแต่ละรายการจะครอบคลุมหัวข้อต่อไปนี้:-

  1. การถดถอยเชิงเส้น
  2. การถดถอยโลจิสติก
  3. การจัดกลุ่ม
  4. ต้นไม้การตัดสินใจและคำถามที่เกี่ยวข้องกับอัลกอริธึมทั้งหมด

มาเริ่มด้วยการถดถอยเชิงเส้นกัน!

1. การถดถอยเชิงเส้นคืออะไร?

กล่าวอย่างง่าย ๆ การถดถอยเชิงเส้นเป็นวิธีการหาความพอดีของเส้นตรงที่ดีที่สุดกับข้อมูลที่กำหนด กล่าวคือ การหาความสัมพันธ์เชิงเส้นตรงที่ดีที่สุดระหว่างตัวแปรอิสระและตัวแปรตาม
ในแง่เทคนิค การถดถอยเชิงเส้นคืออัลกอริธึมการเรียนรู้ของเครื่องที่ค้นหาความสัมพันธ์แบบเส้นตรงที่ดีที่สุดบนข้อมูลใดๆ ที่กำหนด ระหว่างตัวแปรอิสระและตัวแปรตาม ส่วนใหญ่จะทำโดยวิธีผลรวมของเศษที่เหลือ

ทักษะการเรียนรู้ของเครื่องตามความต้องการ

หลักสูตรปัญญาประดิษฐ์ หลักสูตร Tableau
หลักสูตร NLP หลักสูตรการเรียนรู้เชิงลึก

2. ระบุสมมติฐานในรูปแบบการถดถอยเชิงเส้น

มีสมมติฐานหลักสามข้อในแบบจำลองการถดถอยเชิงเส้น:

  1. สมมติฐานเกี่ยวกับรูปแบบของแบบจำลอง:
    สันนิษฐานว่ามีความสัมพันธ์เชิงเส้นตรงระหว่างตัวแปรตามและตัวแปรอิสระ เรียกว่า 'สมมติฐานเชิงเส้น'
  2. สมมติฐานเกี่ยวกับส่วนที่เหลือ:
    1. สมมติฐานปกติ: สันนิษฐานว่าเงื่อนไขข้อผิดพลาด ε (i) มีการแจกจ่ายตามปกติ
    2. สมมติฐานค่าเฉลี่ยเป็นศูนย์: สันนิษฐานว่าส่วนที่เหลือมีค่าเฉลี่ยเป็นศูนย์
    3. สมมติฐานความแปรปรวนคงที่: สันนิษฐานว่าเงื่อนไขที่เหลือมีความแปรปรวนเหมือนกัน (แต่ไม่ทราบ) σ 2 สมมติฐานนี้เรียกอีกอย่างว่าสมมติฐานของความเป็นเนื้อเดียวกันหรือความคล้ายคลึงกัน
    4. สมมติฐานข้อผิดพลาดอิสระ: สันนิษฐานว่าเงื่อนไขที่เหลือเป็นอิสระจากกัน กล่าวคือ ความแปรปรวนร่วมแบบคู่ของพวกมันเป็นศูนย์
  3. สมมติฐานเกี่ยวกับตัวประมาณ:
    1. ตัวแปรอิสระจะถูกวัดโดยไม่มีข้อผิดพลาด
    2. ตัวแปรอิสระมีความเป็นอิสระเชิงเส้นต่อกัน กล่าวคือ ไม่มีข้อมูลหลายเส้นตรงในข้อมูล

คำอธิบาย:

  1. นี่เป็นคำอธิบายในตัวเอง
  2. หากเศษที่เหลือไม่ได้รับการกระจายตามปกติ การสุ่มของพวกมันจะหายไป ซึ่งหมายความว่าแบบจำลองไม่สามารถอธิบายความสัมพันธ์ในข้อมูลได้
    นอกจากนี้ ค่าเฉลี่ยของค่าคงเหลือควรเป็นศูนย์
    Y (i)i = β 0 + β 1 x (i) + ε (i)
    นี่คือแบบจำลองเชิงเส้นสมมติ โดยที่ ε คือเทอมที่เหลือ
    E(Y) = E( β 0 + β 1 x (i) + ε (i) )
    = E( β 0 + β 1 x (i) + ε (i) )
    หากค่าความคาดหมาย (ค่าเฉลี่ย) ของค่าคงเหลือ E(ε (i) ) เป็นศูนย์ ค่าความคาดหมายของตัวแปรเป้าหมายและแบบจำลองจะเหมือนกัน ซึ่งเป็นหนึ่งในเป้าหมายของแบบจำลอง
    ส่วนที่เหลือ (หรือที่เรียกว่าเงื่อนไขข้อผิดพลาด) ควรเป็นอิสระ ซึ่งหมายความว่าไม่มีความสัมพันธ์กันระหว่างค่าคงเหลือกับค่าที่คาดการณ์ไว้ หรือระหว่างค่าคงเหลือเอง หากมีความสัมพันธ์บางอย่าง แสดงว่ามีความสัมพันธ์บางอย่างที่แบบจำลองการถดถอยไม่สามารถระบุได้
  3. ถ้าตัวแปรอิสระไม่เป็นอิสระเชิงเส้นต่อกัน ความเป็นเอกลักษณ์ของคำตอบกำลังสองน้อยที่สุด (หรือคำตอบของสมการปกติ) จะหายไป

เข้าร่วมหลักสูตรปัญญาประดิษฐ์ออนไลน์จากมหาวิทยาลัยชั้นนำของโลก – ปริญญาโท โปรแกรม Executive Post Graduate และหลักสูตรประกาศนียบัตรขั้นสูงใน ML & AI เพื่อติดตามอาชีพของคุณอย่างรวดเร็ว

3. วิศวกรรมคุณลักษณะคืออะไร? คุณนำไปใช้ในกระบวนการสร้างแบบจำลองได้อย่างไร?

วิศวกรรมคุณลักษณะเป็นกระบวนการในการแปลงข้อมูลดิบเป็นคุณลักษณะที่แสดงถึงปัญหาพื้นฐานของแบบจำลองการคาดการณ์ได้ดีขึ้น

ส่งผลให้ความแม่นยำของแบบจำลองดีขึ้นในข้อมูลที่มองไม่เห็น
ในแง่คนธรรมดา วิศวกรรมคุณลักษณะหมายถึงการพัฒนาคุณลักษณะใหม่ที่อาจช่วยให้คุณเข้าใจและจำลองปัญหาในทางที่ดีขึ้น วิศวกรรมคุณลักษณะมีสองประเภท — ขับเคลื่อนธุรกิจและขับเคลื่อนด้วยข้อมูล วิศวกรรมคุณลักษณะที่ขับเคลื่อนด้วยธุรกิจเกี่ยวข้องกับการรวมคุณลักษณะจากมุมมองทางธุรกิจ งานที่นี่คือการแปลงตัวแปรทางธุรกิจเป็นคุณสมบัติของปัญหา ในกรณีของวิศวกรรมคุณลักษณะที่ขับเคลื่อนด้วยข้อมูล คุณลักษณะที่คุณเพิ่มไม่มีการตีความทางกายภาพที่สำคัญ แต่ช่วยแบบจำลองในการทำนายตัวแปรเป้าหมาย

FYI: หลักสูตร nlp ฟรี!
หากต้องการใช้วิศวกรรมคุณลักษณะ คุณต้องทำความคุ้นเคยกับชุดข้อมูลอย่างเต็มที่ สิ่งนี้เกี่ยวข้องกับการรู้ว่าข้อมูลที่ระบุคืออะไร หมายความว่าอย่างไร คุณสมบัติดิบคืออะไร ฯลฯ คุณต้องมีแนวคิดที่ชัดเจนเกี่ยวกับปัญหาด้วย เช่น ปัจจัยใดที่ส่งผลต่อตัวแปรเป้าหมาย การตีความทางกายภาพของตัวแปรคืออะไร ฯลฯ

5 แอปพลิเคชั่นสุดล้ำของการเรียนรู้ของเครื่อง

4. การทำให้เป็นมาตรฐานคืออะไร? อธิบายการทำให้เป็นมาตรฐานของ L1 และ L2

การทำให้เป็นมาตรฐานเป็นเทคนิคที่ใช้ในการจัดการกับปัญหาการปรับโมเดลมากเกินไป เมื่อมีการใช้แบบจำลองที่ซับซ้อนมากกับข้อมูลการฝึกอบรม ในบางครั้ง โมเดลธรรมดาอาจไม่สามารถสรุปข้อมูลได้ และโมเดลที่ซับซ้อนเกินพอดี เพื่อแก้ไขปัญหานี้ จะใช้การทำให้เป็นมาตรฐาน
การทำให้เป็นมาตรฐานไม่มีอะไรเลยนอกจากการเพิ่มเงื่อนไขสัมประสิทธิ์ (เบต้า) ให้กับฟังก์ชันต้นทุนเพื่อให้เงื่อนไขนั้นถูกลงโทษและมีขนาดเล็ก โดยพื้นฐานแล้วจะช่วยในการจับแนวโน้มในข้อมูล และในขณะเดียวกันก็ป้องกันการ overfitting โดยไม่ปล่อยให้แบบจำลองซับซ้อนเกินไป

  • การทำให้เป็นมาตรฐาน L1 หรือ LASSO: ที่นี่ ค่าสัมบูรณ์ของสัมประสิทธิ์จะถูกเพิ่มลงในฟังก์ชันต้นทุน ดังจะเห็นได้จากสมการต่อไปนี้ ส่วนที่ไฮไลต์สอดคล้องกับการปรับมาตรฐาน L1 หรือ LASSO เทคนิคการทำให้เป็นมาตรฐานนี้ให้ผลลัพธ์ที่เบาบาง ซึ่งนำไปสู่การเลือกคุณลักษณะเช่นกัน

  • การทำให้เป็นมาตรฐาน L2 หรือ Ridge: ในที่นี้ กำลังสองของสัมประสิทธิ์จะถูกเพิ่มลงในฟังก์ชันต้นทุน ซึ่งสามารถเห็นได้ในสมการต่อไปนี้ โดยส่วนที่ไฮไลต์สอดคล้องกับ L2 หรือการปรับแนวสันเขา

5. วิธีการเลือกค่าของอัตราการเรียนรู้พารามิเตอร์ (α)?

การเลือกมูลค่าของอัตราการเรียนรู้เป็นธุรกิจที่ยุ่งยาก หากค่าน้อยเกินไป อัลกอริธึมการไล่ระดับสีแบบเกรเดียนท์จะใช้เวลานานในการมาบรรจบกันเป็นโซลูชันที่เหมาะสมที่สุด ในทางกลับกัน หากค่าของอัตราการเรียนรู้สูง การไล่ระดับการไล่ระดับจะเกินวิธีแก้ปัญหาที่เหมาะสมที่สุด และไม่น่าจะมาบรรจบกันกับโซลูชันที่เหมาะสมที่สุด
เพื่อแก้ปัญหานี้ คุณสามารถลองใช้ค่าอัลฟ่าที่แตกต่างกันในช่วงของค่าต่างๆ และพล็อตต้นทุนเทียบกับจำนวนการวนซ้ำ จากนั้น สามารถเลือกค่าที่สอดคล้องกับกราฟที่แสดงการลดลงอย่างรวดเร็วตามกราฟได้

กราฟดังกล่าวเป็นต้นทุนในอุดมคติเทียบกับจำนวนเส้นโค้งการวนซ้ำ โปรดทราบว่าต้นทุนในขั้นต้นจะลดลงเมื่อจำนวนการวนซ้ำเพิ่มขึ้น แต่หลังจากการทำซ้ำบางอย่าง การไล่ระดับการไล่ระดับจะบรรจบกันและต้นทุนจะไม่ลดลงอีกต่อไป
หากคุณเห็นว่าค่าใช้จ่ายเพิ่มขึ้นตามจำนวนการทำซ้ำ แสดงว่าพารามิเตอร์อัตราการเรียนรู้ของคุณสูงและจำเป็นต้องลดลง

6. จะเลือกค่าของพารามิเตอร์การทำให้เป็นมาตรฐาน (λ) ได้อย่างไร?

การเลือกพารามิเตอร์การทำให้เป็นมาตรฐานเป็นเรื่องยุ่งยาก หากค่าของ λ สูงเกินไป จะนำไปสู่ค่าสัมประสิทธิ์การถดถอยที่น้อยมาก β ซึ่ง จะนำไปสู่แบบจำลองที่ไม่เหมาะสม (ความเอนเอียงสูง - ความแปรปรวนต่ำ) ในทางกลับกัน หากค่าของ λ เป็น 0 (น้อยมาก) ตัวแบบจะมีแนวโน้มมากเกินไปกับข้อมูลการฝึก (ความเอนเอียงต่ำ – ความแปรปรวนสูง)
ไม่มีวิธีที่เหมาะสมในการเลือกค่าของ λ สิ่งที่คุณสามารถทำได้คือมีตัวอย่างข้อมูลย่อยและเรียกใช้อัลกอริทึมหลายครั้งในชุดต่างๆ ที่นี่บุคคลต้องตัดสินใจว่าจะทนต่อความแปรปรวนได้มากน้อยเพียงใด เมื่อผู้ใช้พอใจกับความแปรปรวนแล้ว ค่าของ λ นั้นสามารถเลือกเป็นชุดข้อมูลทั้งหมดได้
สิ่งหนึ่งที่ควรสังเกตคือค่าของ λ ที่เลือกที่นี่เหมาะสมที่สุดสำหรับเซตย่อยนั้น ไม่ใช่สำหรับข้อมูลการฝึกทั้งหมด

7. เราสามารถใช้การถดถอยเชิงเส้นสำหรับการวิเคราะห์อนุกรมเวลาได้หรือไม่?

สามารถใช้การถดถอยเชิงเส้นสำหรับการวิเคราะห์อนุกรมเวลาได้ แต่ผลลัพธ์ไม่น่าเป็นไปได้ ดังนั้นจึงไม่แนะนำให้ทำเช่นนั้นโดยทั่วไป เหตุผลเบื้องหลังนี้คือ—

  1. ข้อมูลอนุกรมเวลาส่วนใหญ่ใช้สำหรับการทำนายอนาคต แต่การถดถอยเชิงเส้นไม่ค่อยให้ผลลัพธ์ที่ดีสำหรับการคาดการณ์ในอนาคต เนื่องจากไม่ได้มีไว้สำหรับการอนุมาน
  2. โดยส่วนใหญ่ ข้อมูลอนุกรมเวลามีรูปแบบ เช่น ในช่วงเวลาที่มีผู้ใช้บริการสูงสุด ช่วงเทศกาล ฯลฯ ซึ่งมักจะถือว่าเป็นค่าผิดปกติในการวิเคราะห์การถดถอยเชิงเส้น

8. ผลรวมของเศษเหลือของการถดถอยเชิงเส้นมีค่าเท่ากับเท่าใด ให้เหตุผล

Ans ผลรวมของเศษเหลือของการถดถอยเชิงเส้นคือ 0 การถดถอยเชิงเส้นทำงานบนสมมติฐานที่ว่าข้อผิดพลาด (ส่วนที่เหลือ) ปกติจะกระจายด้วยค่าเฉลี่ย 0 คือ

Y = β T X + ε

โดยที่ Y คือเป้าหมายหรือตัวแปรตาม
β คือเวกเตอร์ของสัมประสิทธิ์การถดถอย
X คือเมทริกซ์คุณลักษณะที่มีคุณลักษณะทั้งหมดเป็นคอลัมน์
ε เป็นเทอมที่เหลือซึ่ง ε ~ N(0,σ 2 )
ดังนั้น ผลรวมของเศษที่เหลือทั้งหมดจึงเป็นมูลค่าที่คาดไว้ของเศษเหลือคูณจำนวนจุดข้อมูลทั้งหมด เนื่องจากความคาดหวังของส่วนที่เหลือเป็น 0 ผลรวมของเทอมที่เหลือทั้งหมดจึงเป็นศูนย์
หมายเหตุ : N(μ,σ 2 ) เป็นสัญกรณ์มาตรฐานสำหรับการแจกแจงแบบปกติที่มีค่าเฉลี่ย μ และค่าเบี่ยงเบนมาตรฐาน σ 2

9. multicollinearity ส่งผลต่อการถดถอยเชิงเส้นอย่างไร

Ans Multicollinearity เกิดขึ้นเมื่อตัวแปรอิสระบางตัวมีความสัมพันธ์สูง (บวกหรือลบ) ซึ่งกันและกัน พหุเส้นตรงนี้ทำให้เกิดปัญหาเนื่องจากขัดกับสมมติฐานพื้นฐานของการถดถอยเชิงเส้น การปรากฏตัวของ multicollinearity ไม่ส่งผลต่อความสามารถในการคาดการณ์ของแบบจำลอง ดังนั้น หากคุณต้องการแค่การคาดคะเน การมีอยู่ของหลายคอลลิเนียร์ก็ไม่ส่งผลต่อผลลัพธ์ของคุณ อย่างไรก็ตาม หากคุณต้องการดึงข้อมูลเชิงลึกจากแบบจำลองและนำไปใช้ สมมติว่ารูปแบบธุรกิจบางอย่างอาจทำให้เกิดปัญหาได้
ปัญหาสำคัญประการหนึ่งที่เกิดจากความหลากหลายร่วมคือมันนำไปสู่การตีความที่ไม่ถูกต้องและให้ข้อมูลเชิงลึกที่ไม่ถูกต้อง ค่าสัมประสิทธิ์ของการถดถอยเชิงเส้นแนะนำการเปลี่ยนแปลงเฉลี่ยในค่าเป้าหมายหากจุดสนใจถูกเปลี่ยนโดยหนึ่งหน่วย ดังนั้น หาก multicollinearity มีอยู่ สิ่งนี้ไม่ถือเป็นจริงเนื่องจากการเปลี่ยนแปลงคุณลักษณะหนึ่งจะนำไปสู่การเปลี่ยนแปลงในตัวแปรที่สัมพันธ์กันและการเปลี่ยนแปลงที่ตามมาในตัวแปรเป้าหมาย สิ่งนี้นำไปสู่ข้อมูลเชิงลึกที่ผิดพลาดและสามารถสร้างผลลัพธ์ที่เป็นอันตรายสำหรับธุรกิจได้
วิธีที่มีประสิทธิภาพสูงในการจัดการกับความหลากหลายทางชีวภาพคือการใช้ VIF (Variance Inflation Factor) ค่าของ VIF สำหรับจุดสนใจสูงขึ้น ความสัมพันธ์เชิงเส้นตรงมากขึ้นคือจุดสนใจนั้น เพียงลบคุณสมบัติที่มีค่า VIF สูงมาก และฝึกโมเดลอีกครั้งบนชุดข้อมูลที่เหลือ

10. รูปแบบปกติ (สมการ) ของการถดถอยเชิงเส้นคืออะไร? เมื่อใดจึงควรใช้วิธีการไล่ระดับสีแบบไล่ระดับ?

สมการปกติสำหรับการถดถอยเชิงเส้นคือ —

β=(X T X) -1 . X T Y

โดยที่ Y = β TX เป็นแบบจำลองสำหรับการถดถอยเชิงเส้น
Y คือเป้าหมายหรือตัวแปรตาม
β เป็นเวกเตอร์ของสัมประสิทธิ์การถดถอย ซึ่งได้มาโดยใช้สมการปกติ
X คือเมทริกซ์คุณลักษณะที่มีคุณลักษณะทั้งหมดเป็นคอลัมน์
โปรดทราบว่าคอลัมน์แรกในเมทริกซ์ X ประกอบด้วย 1 ทั้งหมด นี่คือการรวมค่าออฟเซ็ตสำหรับเส้นการถดถอย
การเปรียบเทียบระหว่างเกรเดียนท์โคตรและสมการปกติ:

โคตรไล่ระดับ สมการปกติ
ต้องการการปรับแต่งไฮเปอร์พารามิเตอร์สำหรับอัลฟ่า (พารามิเตอร์การเรียนรู้) ไม่จำเป็น
มันเป็นกระบวนการวนซ้ำ เป็นกระบวนการที่ไม่ทำซ้ำ
O(kn 2 ) ความซับซ้อนของเวลา O(n 3 ) ความซับซ้อนของเวลาเนื่องจากการประเมิน X T X
ต้องการเมื่อ n มีขนาดใหญ่มาก ค่อนข้างช้าสำหรับค่า n . จำนวนมาก

ในที่นี้ ' k ' คือจำนวนสูงสุดของการวนซ้ำสำหรับการลงระดับแบบเกรเดียนท์ และ ' n ' คือจำนวนจุดข้อมูลทั้งหมดในชุดการฝึก
เห็นได้ชัดว่าถ้าเรามีข้อมูลการฝึกจำนวนมาก สมการปกติก็ไม่นิยมใช้ สำหรับค่าน้อยของ ' n ' สมการปกติจะเร็วกว่าการไล่ระดับสีแบบเกรเดียนต์
แมชชีนเลิร์นนิงคืออะไรและเหตุใดจึงสำคัญ

11. คุณเรียกใช้การถดถอยของคุณกับชุดย่อยต่างๆ ของข้อมูล และในแต่ละชุดย่อย ค่าเบต้าสำหรับตัวแปรบางตัวจะแตกต่างกันอย่างมาก มีปัญหาอะไรที่นี่

กรณีนี้แสดงว่าชุดข้อมูลต่างกัน ดังนั้น เพื่อแก้ปัญหานี้ ชุดข้อมูลควรจัดกลุ่มเป็นชุดย่อยที่แตกต่างกัน จากนั้นจึงควรสร้างแบบจำลองแยกกันสำหรับแต่ละคลัสเตอร์ อีกวิธีหนึ่งในการจัดการกับปัญหานี้คือการใช้โมเดลที่ไม่ใช่พารามิเตอร์ เช่น โครงสร้างการตัดสินใจ ซึ่งสามารถจัดการกับข้อมูลที่ต่างกันได้อย่างมีประสิทธิภาพ

12. การถดถอยเชิงเส้นของคุณไม่ทำงานและแสดงว่ามีค่าประมาณที่ดีที่สุดสำหรับค่าสัมประสิทธิ์การถดถอยจำนวนอนันต์ มีอะไรผิดปกติ?

เงื่อนไขนี้เกิดขึ้นเมื่อมีความสัมพันธ์ที่สมบูรณ์แบบ (บวกหรือลบ) ระหว่างตัวแปรบางตัว ในกรณีนี้ ไม่มีค่าเฉพาะสำหรับสัมประสิทธิ์ ดังนั้นเงื่อนไขที่กำหนดจึงเกิดขึ้น

13. คุณหมายถึงอะไรโดยการปรับ R 2 ? ต่างจาก R2 อย่างไร ?

ปรับ R 2 เช่นเดียวกับ R 2 เป็นตัวแทนของจำนวนจุดที่อยู่รอบเส้นการถดถอย นั่นคือมันแสดงให้เห็นว่าโมเดลนั้นเหมาะสมกับข้อมูลการฝึกแค่ไหน สูตรปรับ R 2 เป็น -

โดยที่ n คือจำนวนจุดข้อมูล และ k คือจำนวนคุณลักษณะ
ข้อเสียเปรียบประการหนึ่งของ R 2 คือมันจะเพิ่มขึ้นด้วยการเพิ่มฟีเจอร์ใหม่อยู่เสมอ ไม่ว่าฟีเจอร์ใหม่จะมีประโยชน์หรือไม่ก็ตาม R 2 . ที่ปรับแล้ว เอาชนะข้อเสียนี้ ค่าของ R 2 ที่ปรับปรุงแล้ว จะเพิ่มขึ้นก็ต่อเมื่อคุณสมบัติที่เพิ่มเข้ามาใหม่มีบทบาทสำคัญในโมเดลเท่านั้น

14. คุณตีความเส้นโค้งมูลค่าคงเหลือเทียบกับค่าพอดีอย่างไร?

แผนภาพมูลค่าคงเหลือเทียบกับค่าพอดีจะใช้เพื่อดูว่าค่าที่คาดการณ์ไว้และค่าคงเหลือมีความสัมพันธ์กันหรือไม่ ถ้าเศษที่เหลือกระจายตามปกติ ด้วยค่าเฉลี่ยรอบค่าที่ติดตั้งและความแปรปรวนคงที่ แบบจำลองของเราทำงานได้ดี มิฉะนั้นจะมีปัญหากับรุ่น
ปัญหาที่พบบ่อยที่สุดที่สามารถพบได้เมื่อฝึกโมเดลในชุดข้อมูลที่หลากหลายคือ heteroscedasticity (อธิบายไว้ในคำตอบด้านล่าง) การมีอยู่ของ heteroscedasticity นั้นสามารถเห็นได้ง่ายโดยการวางแผนกราฟค่าคงเหลือเทียบกับกราฟที่พอดี

15. heteroscedasticity คืออะไร? ผลที่ตามมาคืออะไรและคุณจะเอาชนะมันได้อย่างไร?

ตัวแปรสุ่มเรียกว่า heteroscedastic เมื่อประชากรย่อยต่างกันมีความแปรปรวนต่างกัน (ส่วนเบี่ยงเบนมาตรฐาน)
การมีอยู่ของ heteroscedasticity ทำให้เกิดปัญหาบางอย่างในการวิเคราะห์การถดถอย เนื่องจากข้อสมมติระบุว่าเงื่อนไขข้อผิดพลาดไม่มีความสัมพันธ์กัน ดังนั้น ความแปรปรวนจึงคงที่ การมีอยู่ของ heteroscedasticity มักจะเห็นได้ในรูปแบบของแผนภาพการกระจายแบบรูปกรวยสำหรับค่าที่เหลือและค่าที่พอดี
สมมติฐานพื้นฐานประการหนึ่งของการถดถอยเชิงเส้นคือไม่มีข้อมูล heteroscedasticity เนื่องจากการละเมิดสมมติฐาน ตัวประมาณค่า Ordinary Least Squares (OLS) จึงไม่ใช่ตัวประมาณค่าเชิงเส้นที่ไม่เอนเอียงที่ดีที่สุด (BLUE) ดังนั้นจึงไม่ได้ให้ค่าความแปรปรวนน้อยที่สุดเมื่อเทียบกับตัวประมาณค่าเชิงเส้นที่ไม่เอนเอียง (LUE) อื่นๆ
ไม่มีขั้นตอนตายตัวที่จะเอาชนะความแตกต่างได้ อย่างไรก็ตาม มีบางวิธีที่อาจนำไปสู่การลดความต่างศักย์ลงได้ พวกเขาคือ -

  1. ลอการิทึมของข้อมูล: อนุกรมที่เพิ่มขึ้นแบบทวีคูณมักส่งผลให้เกิดความแปรปรวนเพิ่มขึ้น สิ่งนี้สามารถเอาชนะได้โดยใช้การแปลงบันทึก
  2. การใช้การถดถอยเชิงเส้นแบบถ่วงน้ำหนัก: ในที่นี้ วิธี OLS ใช้กับค่าถ่วงน้ำหนักของ X และ Y วิธีหนึ่งคือการแนบน้ำหนักที่เกี่ยวข้องโดยตรงกับขนาดของตัวแปรตาม
การเรียนรู้ของเครื่อง Unsupervised ทำงานอย่างไร

16. วีไอเอฟคืออะไร? คุณคำนวณมันได้อย่างไร?

Variance Inflation Factor (VIF) ใช้เพื่อตรวจสอบการมีอยู่ของหลายคอลลิเนียร์ในชุดข้อมูล มันถูกคำนวณเป็น-
ที่นี่ VIF j คือค่าของ VIF สำหรับ ตัวแปร j
Rj2 _ คือค่า R 2 ของโมเดลเมื่อตัวแปรนั้นถดถอยกับตัวแปรอิสระอื่นๆ ทั้งหมด
หากค่าของ VIF สูงสำหรับตัวแปร แสดงว่า R 2 ค่าของแบบจำลองที่สอดคล้องกันสูง กล่าวคือ ตัวแปรอิสระอื่น ๆ สามารถอธิบายตัวแปรนั้นได้ พูดง่ายๆ ก็คือ ตัวแปรนั้นขึ้นอยู่กับตัวแปรอื่นเป็นเส้นตรง

17. คุณรู้ได้อย่างไรว่าการถดถอยเชิงเส้นเหมาะสมกับข้อมูลใด ๆ

หากต้องการดูว่าการถดถอยเชิงเส้นเหมาะสมกับข้อมูลใดๆ หรือไม่ สามารถใช้พล็อตกระจาย ถ้าความสัมพันธ์มีลักษณะเชิงเส้น เราก็สามารถเลือกตัวแบบเชิงเส้นได้ แต่ถ้าไม่ใช่กรณีนี้ เราต้องใช้การแปลงเพื่อสร้างความสัมพันธ์เชิงเส้น การพล็อตพล็อตกระจายนั้นง่ายในกรณีที่มีการถดถอยเชิงเส้นอย่างง่ายหรือไม่มีตัวแปร แต่ในกรณีของการถดถอยเชิงเส้นพหุตัวแปร สามารถพล็อตกราฟแบบกระจายคู่แบบสองมิติ กราฟแบบหมุน และกราฟไดนามิกได้

18. การทดสอบสมมติฐานใช้ในการถดถอยเชิงเส้นอย่างไร

การทดสอบสมมติฐานสามารถทำได้ในการถดถอยเชิงเส้นเพื่อวัตถุประสงค์ดังต่อไปนี้:

  1. เพื่อตรวจสอบว่าตัวทำนายมีความสำคัญต่อการทำนายของตัวแปรเป้าหมายหรือไม่ สองวิธีทั่วไปสำหรับสิ่งนี้คือ -
    1. โดยการใช้ค่า p:
      หากค่า p ของตัวแปรมากกว่าค่าจำกัดที่กำหนด (โดยปกติคือ 0.05) ตัวแปรนั้นไม่มีนัยสำคัญในการทำนายของตัวแปรเป้าหมาย
    2. โดยการตรวจสอบค่าสัมประสิทธิ์การถดถอย:
      หากค่าสัมประสิทธิ์การถดถอยที่สอดคล้องกับตัวทำนายเป็นศูนย์ แสดงว่าตัวแปรนั้นไม่มีนัยสำคัญในการทำนายของตัวแปรเป้าหมายและไม่มีความสัมพันธ์เชิงเส้นกับตัวแปรนั้น
  2. เพื่อตรวจสอบว่าสัมประสิทธิ์การถดถอยที่คำนวณได้เป็นตัวประมาณที่ดีของสัมประสิทธิ์จริงหรือไม่

19. อธิบายการถดถอยเชิงเกรเดียนต์เกี่ยวกับการถดถอยเชิงเส้น

Gradient Descent เป็นอัลกอริธึมการปรับให้เหมาะสม ในการถดถอยเชิงเส้น ใช้เพื่อเพิ่มประสิทธิภาพฟังก์ชันต้นทุนและค้นหาค่าของ βs (ตัวประมาณ) ที่สอดคล้องกับค่าที่เหมาะสมที่สุดของฟังก์ชันต้นทุน
การไล่ระดับสีทำงานเหมือนลูกบอลกลิ้งไปตามกราฟ (ไม่สนใจความเฉื่อย) ลูกบอลเคลื่อนที่ไปตามทิศทางของการไล่ระดับสูงสุดและหยุดนิ่งที่พื้นผิวเรียบ (minima)

ในทางคณิตศาสตร์ จุดมุ่งหมายของการไล่ระดับการถดถอยเชิงเส้นคือการหาคำตอบของ
ArgMin J(Θ 0 1 ) โดยที่ J(Θ 0 1 ) เป็นฟังก์ชันต้นทุนของการถดถอยเชิงเส้น มอบให้โดย—

ที่นี่ h คือแบบจำลองสมมติฐานเชิงเส้น h=Θ 0 + Θ 1 x, y คือผลลัพธ์ที่แท้จริง และ m คือจำนวนจุดข้อมูลในชุดการฝึก
Gradient Descent เริ่มต้นด้วยโซลูชันแบบสุ่ม จากนั้นตามทิศทางของการไล่ระดับสี โซลูชันจะได้รับการอัปเดตเป็นค่าใหม่ที่ฟังก์ชันต้นทุนมีค่าต่ำกว่า
การอัปเดตคือ:
ทำซ้ำจนกระทั่งบรรจบกัน

20. คุณตีความแบบจำลองการถดถอยเชิงเส้นอย่างไร?

ตัวแบบการถดถอยเชิงเส้นค่อนข้างง่ายต่อการตีความ โมเดลมีรูปแบบดังต่อไปนี้:

ความสำคัญของแบบจำลองนี้อยู่ในความจริงที่ว่าเราสามารถตีความและเข้าใจการเปลี่ยนแปลงเล็กน้อยและผลที่ตามมาได้อย่างง่ายดาย ตัวอย่างเช่น หากค่าของ x 0 เพิ่มขึ้น 1 หน่วย ทำให้ตัวแปรอื่นๆ คงที่ ค่า y ที่เพิ่มขึ้นทั้งหมด จะเป็น β i ในทางคณิตศาสตร์ ระยะการสกัดกั้น ( β 0 ) คือการตอบสนองเมื่อเงื่อนไขตัวทำนายทั้งหมดถูกตั้งค่าเป็นศูนย์หรือไม่ถูกพิจารณา
เทคนิคการเรียนรู้ด้วยเครื่อง 6 อย่างนี้กำลังปรับปรุงการดูแลสุขภาพ

21. การถดถอยที่แข็งแกร่งคืออะไร?

ตัวแบบการถดถอยควรมีลักษณะที่แข็งแกร่ง ซึ่งหมายความว่าด้วยการเปลี่ยนแปลงในการสังเกตสองสามอย่าง โมเดลไม่ควรเปลี่ยนแปลงอย่างมาก นอกจากนี้ ค่าผิดปกติไม่ควรได้รับผลกระทบมากนัก
แบบจำลองการถดถอยด้วย OLS (Ordinary Least Squares) ค่อนข้างไวต่อค่าผิดปกติ เพื่อแก้ปัญหานี้ เราสามารถใช้วิธี WLS (Weighted Least Squares) เพื่อกำหนดตัวประมาณค่าสัมประสิทธิ์การถดถอย ในที่นี้ ค่าน้ำหนักที่น้อยกว่าจะถูกมอบให้กับค่าผิดปกติหรือจุดเลเวอเรจที่สูงในข้อต่อ ทำให้จุดเหล่านี้ส่งผลกระทบน้อยลง

22. กราฟใดแนะนำให้สังเกตก่อนการปรับโมเดล

ก่อนปรับโมเดลให้เหมาะสม เราต้องทราบข้อมูลเป็นอย่างดี เช่น แนวโน้ม การกระจาย ความเบ้ ฯลฯ ในตัวแปรคืออะไร สามารถใช้กราฟต่างๆ เช่น ฮิสโตแกรม แผนภาพกล่อง และแผนภาพจุดเพื่อสังเกตการกระจายของตัวแปรได้ นอกจากนี้ ยังต้องวิเคราะห์ว่าความสัมพันธ์ระหว่างตัวแปรตามและตัวแปรอิสระคืออะไร สามารถทำได้โดย แปลงแบบกระจาย (ในกรณีที่มีปัญหาแบบไม่มีตัวแปร) แปลงแบบหมุน แปลงแบบไดนามิก ฯลฯ

23. ตัวแบบเชิงเส้นทั่วไปคืออะไร?

ตัว แบบเชิงเส้นทั่วไปเป็นอนุพันธ์ของตัวแบบการถดถอยเชิงเส้นธรรมดา GLM มีความยืดหยุ่นมากกว่าในแง่ของปริมาณสารตกค้าง และสามารถใช้ได้ในกรณีที่การถดถอยเชิงเส้นไม่เหมาะสม GLM ยอมให้การกระจายของที่เหลือเป็นอย่างอื่นนอกเหนือจากการแจกแจงแบบปกติ มันสรุปการถดถอยเชิงเส้นโดยให้ตัวแบบเชิงเส้นเชื่อมโยงไปยังตัวแปรเป้าหมายโดยใช้ฟังก์ชันการเชื่อมโยง การประมาณค่าแบบจำลองทำได้โดยใช้วิธีการประมาณความน่าจะเป็นสูงสุด

24. อธิบายการแลกเปลี่ยนความแปรปรวนอคติ

อคติหมายถึงความแตกต่างระหว่างค่าที่ทำนายโดยแบบจำลองและค่าจริง มันเป็นข้อผิดพลาด เป้าหมายหนึ่งของอัลกอริทึม ML คือการมีอคติต่ำ
ความแปรปรวนหมายถึงความไวของแบบจำลองต่อความผันผวนเล็กน้อยในชุดข้อมูลการฝึก เป้าหมายอีกประการของอัลกอริทึม ML คือการมีความแปรปรวนต่ำ
สำหรับชุดข้อมูลที่ไม่ใช่เชิงเส้นตรงทั้งหมด เป็นไปไม่ได้ที่จะมีอคติและความแปรปรวนต่ำในเวลาเดียวกัน แบบจำลองเส้นตรงจะมีความแปรปรวนต่ำแต่มีความเอนเอียงสูง ในขณะที่พหุนามระดับสูงจะมีอคติต่ำแต่มีความแปรปรวนสูง
ไม่มีการหลีกเลี่ยงความสัมพันธ์ระหว่างอคติและความแปรปรวนในการเรียนรู้ของเครื่อง

  1. การลดความลำเอียงจะเพิ่มความแปรปรวน
  2. การลดความแปรปรวนจะเพิ่มอคติ

ดังนั้นจึงมีข้อแลกเปลี่ยนระหว่างคนทั้งสอง ผู้เชี่ยวชาญ ML ต้องตัดสินใจโดยพิจารณาจากปัญหาที่กำหนดว่าจะทนต่ออคติและความแปรปรวนได้มากน้อยเพียงใด ด้วยเหตุนี้ โมเดลสุดท้ายจึงถูกสร้างขึ้น

25. เส้นโค้งการเรียนรู้จะช่วยสร้างแบบจำลองที่ดีขึ้นได้อย่างไร?

เส้นโค้งการเรียนรู้บ่งบอกถึงการสวมใส่มากเกินไปหรือน้อยเกินไป
ในกราฟการเรียนรู้ ข้อผิดพลาดการฝึกอบรมและข้อผิดพลาดในการตรวจสอบข้ามจะถูกพล็อตกับจำนวนจุดข้อมูลการฝึกอบรม เส้นโค้งการเรียนรู้ทั่วไปมีลักษณะดังนี้:

หากข้อผิดพลาดการฝึกอบรมและข้อผิดพลาดที่แท้จริง (ข้อผิดพลาดในการตรวจสอบความถูกต้อง) มาบรรจบกันเป็นค่าเดียวกันและค่าที่สอดคล้องกันของข้อผิดพลาดนั้นสูง แสดงว่าแบบจำลองนั้นไม่เหมาะสมและมีอคติสูง

บทสัมภาษณ์แมชชีนเลิร์นนิงและวิธีเอาชนะพวกเขา

บทสัมภาษณ์ของแมชชีนเลิร์นนิงอาจแตกต่างกันไปตามประเภทหรือหมวดหมู่ เช่น นายหน้าบางคนถาม คำถามสัมภาษณ์ การถดถอยเชิงเส้น หลาย คำถาม เมื่อไปรับบทบาทการสัมภาษณ์วิศวกรแมชชีนเลิร์นนิง พวกเขาสามารถเชี่ยวชาญในหมวดหมู่ต่างๆ เช่น การเข้ารหัส การวิจัย กรณีศึกษา การจัดการโครงการ การนำเสนอ การออกแบบระบบ และสถิติ เราจะเน้นไปที่ประเภทที่พบบ่อยที่สุดและวิธีเตรียมตัวสำหรับหมวดหมู่เหล่านั้น

  1. การเข้ารหัส

การเข้ารหัสและการเขียนโปรแกรมเป็นองค์ประกอบสำคัญของการสัมภาษณ์แมชชีนเลิร์นนิงและมักใช้เพื่อคัดกรองผู้สมัคร ในการที่จะทำได้ดีในการสัมภาษณ์เหล่านี้ คุณต้องมีความสามารถในการเขียนโปรแกรมที่แข็งแกร่ง การสัมภาษณ์การเข้ารหัสมักใช้เวลาประมาณ 45 ถึง 60 นาทีและประกอบด้วยคำถามเพียงสองข้อเท่านั้น ผู้สัมภาษณ์วางหัวข้อและคาดหวังว่าผู้สมัครจะจัดการเรื่องนี้ให้เร็วที่สุดเท่าที่จะเป็นไปได้

วิธีเตรียมตัว – คุณสามารถเตรียมตัวสำหรับการสัมภาษณ์เหล่านี้ได้โดยต้องมีความเข้าใจที่ดีเกี่ยวกับโครงสร้างข้อมูล ความซับซ้อนของเวลาและพื้นที่ ทักษะการจัดการ และความสามารถในการทำความเข้าใจและแก้ไขปัญหา upGrad มีหลักสูตรวิศวกรรมซอฟต์แวร์ที่ยอดเยี่ยมที่จะช่วยให้คุณพัฒนาทักษะการเขียนโค้ดและฝึกฝนในการสัมภาษณ์ได้

2. การเรียนรู้ของเครื่อง

ความเข้าใจของคุณเกี่ยวกับแมชชีนเลิร์นนิงจะได้รับการประเมินผ่านการสัมภาษณ์ เลเยอร์ Convolutional, โครงข่ายประสาทที่เกิดซ้ำ, เครือข่ายปฏิปักษ์กำเนิด, การรู้จำคำพูด และหัวข้ออื่นๆ อาจครอบคลุมได้ขึ้นอยู่กับความต้องการในการจ้างงาน

วิธีเตรียมตัว – เพื่อให้สามารถเอาชนะการสัมภาษณ์นี้ได้ คุณต้องแน่ใจว่าคุณมีความเข้าใจอย่างถ่องแท้เกี่ยวกับบทบาทและความรับผิดชอบของงาน ซึ่งจะช่วยให้คุณระบุข้อกำหนดของ ML ที่คุณต้องศึกษา อย่างไรก็ตาม หากคุณไม่พบข้อกำหนดใด ๆ คุณต้องเข้าใจพื้นฐานอย่างลึกซึ้ง หลักสูตรเชิงลึกใน ML ที่ upGrad มีให้สามารถช่วยคุณได้ คุณยังสามารถศึกษา บทความ ล่าสุดเกี่ยว กับ ML และ AI เพื่อทำความเข้าใจแนวโน้มล่าสุด และรวมไว้เป็นประจำ

3. คัดกรอง

การสัมภาษณ์นี้ค่อนข้างไม่เป็นทางการและมักเป็นจุดเริ่มต้นหนึ่งของการสัมภาษณ์ นายจ้างที่คาดหวังมักจะจัดการกับมัน เป้าหมายหลักของการสัมภาษณ์ครั้งนี้คือการทำให้ผู้สมัครเข้าใจถึงธุรกิจ บทบาทและหน้าที่ ในบรรยากาศที่เป็นกันเอง ผู้สมัครจะถูกตั้งคำถามเกี่ยวกับอดีตของตนด้วยเพื่อพิจารณาว่าประเด็นที่พวกเขาสนใจตรงกับตำแหน่งหรือไม่

วิธีเตรียมตัว – นี่เป็นส่วนที่ไม่ใช่ด้านเทคนิคของการสัมภาษณ์ ทั้งหมดนี้คือความจริงใจของคุณและพื้นฐานของความเชี่ยวชาญพิเศษของคุณในการเรียนรู้ของเครื่อง

4. การออกแบบระบบ

การสัมภาษณ์ดังกล่าวจะทดสอบความสามารถของบุคคลในการสร้างโซลูชันที่ปรับขนาดได้อย่างเต็มที่ตั้งแต่ต้นจนจบ วิศวกรส่วนใหญ่มักหมกมุ่นอยู่กับปัญหาที่พวกเขามักจะมองข้ามภาพรวม การสัมภาษณ์ออกแบบระบบจำเป็นต้องมีความเข้าใจในองค์ประกอบต่างๆ มากมายที่รวมกันเพื่อสร้างโซลูชัน องค์ประกอบเหล่านี้รวมถึงเลย์เอาต์ส่วนหน้า ตัวโหลดบาลานซ์ แคช และอื่นๆ ระบบ end-to-end ที่มีประสิทธิภาพและปรับขนาดได้จะพัฒนาได้ง่ายขึ้นเมื่อเข้าใจปัญหาเหล่านี้เป็นอย่างดี

วิธีเตรียมตัว – ทำความเข้าใจแนวคิดและส่วนประกอบของโครงการออกแบบระบบ ใช้ตัวอย่างในชีวิตจริงเพื่ออธิบายโครงสร้างให้ผู้สัมภาษณ์เข้าใจโครงการมากขึ้น

บล็อกการเรียนรู้ของเครื่องยอดนิยมและปัญญาประดิษฐ์

IoT: ประวัติศาสตร์ ปัจจุบัน และอนาคต บทช่วยสอนการเรียนรู้ของเครื่อง: เรียนรู้ ML อัลกอริทึมคืออะไร? ง่ายและสะดวก
เงินเดือนวิศวกรหุ่นยนต์ในอินเดีย: บทบาททั้งหมด วันหนึ่งในชีวิตของวิศวกรแมชชีนเลิร์นนิง: พวกเขาทำอะไร? IoT คืออะไร (Internet of Things)
การเปลี่ยนแปลงและการรวมกัน: ความแตกต่างระหว่างการเปลี่ยนแปลงและการรวมกัน แนวโน้ม 7 อันดับแรกในปัญญาประดิษฐ์และการเรียนรู้ของเครื่อง แมชชีนเลิร์นนิงกับ R: ทุกสิ่งที่คุณต้องรู้

หากมีช่องว่างที่มีนัยสำคัญระหว่างค่าการบรรจบกันของการฝึกอบรมและข้อผิดพลาดการตรวจสอบข้าม กล่าวคือ ข้อผิดพลาดในการตรวจสอบข้ามสูงกว่าข้อผิดพลาดในการฝึกอย่างมีนัยสำคัญ แสดงว่าแบบจำลองมีข้อมูลการฝึกมากเกินไปและมีความแปรปรวนสูง .
วิศวกรการเรียนรู้ของเครื่อง: ตำนานกับความเป็นจริง

นั่นคือจุดสิ้นสุดของส่วนแรกของซีรีส์นี้ ติดตามต่อในตอนต่อไปของซีรี ส์ ซึ่งประกอบด้วยคำถามตาม Logistic Regression รู้สึกอิสระที่จะโพสต์ความคิดเห็นของคุณ
ร่วมเขียนโดย – Ojas Agarwal

คุณสามารถตรวจสอบ Executive PG Program ของเราใน Machine Learning & AI ซึ่ง มีการฝึกอบรมเชิงปฏิบัติ ที่ปรึกษาในอุตสาหกรรมแบบตัวต่อตัว กรณีศึกษาและการมอบหมาย 12 กรณี สถานะศิษย์เก่า IIIT-B และอื่นๆ

คุณเข้าใจอะไรจากการทำให้เป็นมาตรฐาน?

การทำให้เป็นมาตรฐานเป็นกลยุทธ์ในการจัดการกับปัญหาของโมเดลที่มากเกินไป Overfitting เกิดขึ้นเมื่อมีการใช้แบบจำลองที่ซับซ้อนกับข้อมูลการฝึก โมเดลพื้นฐานอาจไม่สามารถสรุปข้อมูลได้ในบางครั้ง และโมเดลที่ซับซ้อนอาจทำให้ข้อมูลมากเกินไป การทำให้เป็นมาตรฐานใช้เพื่อบรรเทาปัญหานี้ การทำให้เป็นมาตรฐานคือกระบวนการของการเพิ่มเงื่อนไขสัมประสิทธิ์ (เบต้า) ให้กับปัญหาการย่อให้เล็กสุดในลักษณะที่เงื่อนไขนั้นถูกลงโทษและมีขนาดพอประมาณ ซึ่งจะช่วยระบุรูปแบบข้อมูลโดยพื้นฐานแล้วในขณะเดียวกันก็ป้องกันการใส่มากเกินไปโดยป้องกันไม่ให้แบบจำลองซับซ้อนเกินไป

คุณเข้าใจอะไรเกี่ยวกับวิศวกรรมคุณลักษณะ

กระบวนการเปลี่ยนข้อมูลดั้งเดิมเป็นคุณลักษณะที่อธิบายปัญหาพื้นฐานของแบบจำลองการคาดการณ์ได้ดีกว่า ส่งผลให้ความถูกต้องของแบบจำลองดีขึ้นในข้อมูลที่มองไม่เห็น เรียกว่าวิศวกรรมคุณลักษณะ ในแง่ของคนธรรมดา วิศวกรรมคุณลักษณะหมายถึงการสร้างคุณลักษณะเพิ่มเติมที่อาจช่วยในการทำความเข้าใจและการสร้างแบบจำลองของปัญหาได้ดีขึ้น วิศวกรรมคุณลักษณะมีสองประเภท: ที่ขับเคลื่อนด้วยธุรกิจและที่ขับเคลื่อนด้วยข้อมูล การรวมคุณสมบัติจากมุมมองทางการค้าเป็นจุดสนใจของวิศวกรรมคุณลักษณะที่ขับเคลื่อนด้วยธุรกิจ

อะไรคือการแลกเปลี่ยนความแปรปรวนอคติ?

ช่องว่างระหว่างแบบจำลอง - ค่าที่คาดการณ์ไว้และค่าจริงเรียกว่าอคติ มันเป็นความผิดพลาด ความเอนเอียงต่ำเป็นหนึ่งในวัตถุประสงค์ของอัลกอริทึม ML ช่องโหว่ของแบบจำลองต่อการเปลี่ยนแปลงเล็กน้อยในชุดข้อมูลการฝึกอบรมเรียกว่าความแปรปรวน ความแปรปรวนต่ำเป็นอีกเป้าหมายหนึ่งของอัลกอริทึม ML เป็นไปไม่ได้ที่จะมีทั้งอคติต่ำและความแปรปรวนต่ำในชุดข้อมูลที่ไม่เป็นเส้นตรงอย่างสมบูรณ์ ความแปรปรวนของแบบจำลองเส้นตรงนั้นต่ำ แต่ความเอนเอียงนั้นใหญ่ ในขณะที่ความแปรปรวนของพหุนามดีกรีสูงนั้นต่ำ แต่ความเอนเอียงนั้นสูง ในแมชชีนเลิร์นนิง จะหลีกเลี่ยงความเชื่อมโยงระหว่างอคติกับความแปรปรวนไม่ได้