15 คำถามและคำตอบสำหรับการสัมภาษณ์แมชชีนเลิร์นนิงสำหรับปี 2022
เผยแพร่แล้ว: 2021-01-08คุณเป็นคนที่ปรารถนาที่จะประสบความสำเร็จในอาชีพการเรียนรู้ของเครื่องหรือไม่? ถ้าใช่ก็ดีสำหรับคุณ!
แต่ก่อนอื่น คุณต้องเตรียมตัวสำหรับ ice-breaker – การสัมภาษณ์ ML
เนื่องจากขั้นตอนการเตรียมตัวสำหรับการสัมภาษณ์อาจยากเกินไป เราจึงตัดสินใจเข้าร่วม – นี่คือรายการคำถามที่พบบ่อย 15 ข้อที่รวบรวมไว้ซึ่งได้รับการคัดสรรมาอย่างดีในการสัมภาษณ์แมชชีนเลิร์นนิง!
- อะไรคือความแตกต่างระหว่างการเรียนรู้เชิงลึกและการเรียนรู้ของเครื่อง?
ในขณะที่แมชชีนเลิร์นนิงเกี่ยวข้องกับแอปพลิเคชันและการใช้อัลกอริธึมขั้นสูงเพื่อแยกวิเคราะห์ข้อมูล เปิดเผยรูปแบบที่ซ่อนอยู่ภายในข้อมูลและเรียนรู้จากข้อมูลนั้น และสุดท้ายนำข้อมูลเชิงลึกที่เรียนรู้มาใช้เพื่อประกอบการตัดสินใจทางธุรกิจอย่างมีข้อมูล สำหรับ Deep Learning เป็นชุดย่อยของ Machine Learning ที่เกี่ยวข้องกับการใช้ Artificial Neural Nets ซึ่งดึงแรงบันดาลใจจากโครงสร้าง Neural Net ของสมองมนุษย์ Deep Learning ใช้กันอย่างแพร่หลายในการตรวจจับคุณสมบัติ
- กำหนด – ความแม่นยำและการเรียกคืน
การวัดค่าที่แม่นยำหรือค่าการทำนายผลบวกหรือคาดการณ์จำนวนผลบวกที่แท้จริงในการอ้างสิทธิ์โดยแบบจำลองได้อย่างแม่นยำมากขึ้นเมื่อเทียบกับจำนวนผลบวกที่อ้างสิทธิ์จริง
Recall หรือ True Positive Rate หมายถึงจำนวนผลบวกที่โมเดลอ้างสิทธิ์ เทียบกับจำนวนผลบวกที่เกิดขึ้นจริงในข้อมูล

เข้าร่วม หลักสูตรแมชชีนเลิ ร์นนิง ออนไลน์จากมหาวิทยาลัยชั้นนำของโลก – ปริญญาโท หลักสูตร Executive Post Graduate และหลักสูตรประกาศนียบัตรขั้นสูงใน ML & AI เพื่อติดตามอาชีพของคุณอย่างรวดเร็ว
- อธิบายคำว่า 'อคติ' และ 'ความแปรปรวน' '
ในระหว่างกระบวนการฝึกอบรม ข้อผิดพลาดที่คาดหวังของอัลกอริธึมการเรียนรู้โดยทั่วไปจะถูกจำแนกหรือแบ่งออกเป็นสองส่วน - ความลำเอียงและความแปรปรวน แม้ว่า 'อคติ' เป็นสถานการณ์ข้อผิดพลาดที่เกิดจากการใช้สมมติฐานง่ายๆ ในอัลกอริทึมการเรียนรู้ แต่ 'ความแปรปรวน' หมายถึงข้อผิดพลาดที่เกิดจากความซับซ้อนของอัลกอริทึมการเรียนรู้นั้นในการวิเคราะห์ข้อมูล อคติวัดความใกล้เคียงของตัวแยกประเภทเฉลี่ยที่สร้างโดยอัลกอริธึมการเรียนรู้กับฟังก์ชันเป้าหมาย และความแปรปรวนจะวัดโดยการคาดการณ์ของอัลกอริทึมการเรียนรู้จะแตกต่างกันมากน้อยเพียงใดสำหรับชุดข้อมูลการฝึกที่แตกต่างกัน
- ROC Curve ทำงานอย่างไร?
ROC หรือกราฟลักษณะการทำงานของผู้รับคือการแสดงกราฟิกของการเปลี่ยนแปลงระหว่างอัตราผลบวกที่แท้จริงและอัตราผลบวกเท็จที่เกณฑ์ที่แตกต่างกัน เป็นเครื่องมือพื้นฐานสำหรับการประเมินการทดสอบวินิจฉัย และมักใช้แทนการแลกเปลี่ยนระหว่างความไวของแบบจำลอง (ผลบวกที่แท้จริง) กับความน่าจะเป็นที่จะกระตุ้นสัญญาณเตือนที่ผิดพลาด (ผลบวกที่ผิดพลาด)
แหล่งที่มา
- เส้นโค้งแสดงให้เห็นการประนีประนอมระหว่างความไวและความจำเพาะ – หากความไวเพิ่มขึ้น ความจำเพาะจะลดลง
- หากเส้นโค้งล้อมรอบไปทางแกนซ้ายมือและด้านบนของสเปซ ROC มากกว่า การทดสอบมักจะแม่นยำกว่า อย่างไรก็ตาม หากเส้นโค้งเข้าใกล้เส้นทแยงมุม 45 องศาของพื้นที่ ROC มากขึ้น การทดสอบจะแม่นยำหรือเชื่อถือได้น้อยกว่า
- ความชันของเส้นสัมผัสที่จุดตัดแสดงถึงอัตราส่วนความน่าจะเป็น (LR) สำหรับค่าเฉพาะของการทดสอบ
- พื้นที่ใต้เส้นโค้งวัดความแม่นยำในการทดสอบ
- อธิบายความแตกต่างระหว่างข้อผิดพลาดประเภท 1 และประเภท 2
ข้อผิดพลาดประเภทที่ 1 เป็นข้อผิดพลาดเชิงบวกเท็จที่ 'อ้างว่า' เหตุการณ์เกิดขึ้นเมื่อที่จริงแล้วไม่มีอะไรเกิดขึ้น ตัวอย่างที่ดีที่สุดของข้อผิดพลาดเชิงบวกที่ผิดพลาดคือสัญญาณเตือนไฟไหม้ที่ผิดพลาด – สัญญาณเตือนจะเริ่มดังขึ้นเมื่อไม่มีไฟไหม้ ตรงกันข้าม ข้อผิดพลาดประเภทที่ 2 เป็นข้อผิดพลาดเชิงลบที่เป็นเท็จซึ่ง 'อ้างว่า' ไม่มีอะไรเกิดขึ้นเมื่อมีบางอย่างเกิดขึ้นอย่างแน่นอน มันจะเป็นข้อผิดพลาดประเภท 2 ที่จะบอกหญิงตั้งครรภ์ว่าเธอไม่ได้อุ้มเด็ก
- เหตุใด Bayes จึงเรียกว่า "Naive Bayes"
Naive Bayes ถูกเรียกว่า "ไร้เดียงสา" เพราะถึงแม้จะมีการใช้งานจริงมากมาย แต่ก็ขึ้นอยู่กับสมมติฐานที่หาไม่ได้ในข้อมูลในชีวิตจริง คุณลักษณะทั้งหมดในชุดข้อมูลมีความสำคัญ เป็นอิสระ และเท่าเทียมกัน ในแนวทาง Naive Bayes ความน่าจะเป็นแบบมีเงื่อนไขจะคำนวณเป็นผลคูณของความน่าจะเป็นของส่วนประกอบแต่ละส่วน ดังนั้นจึงแสดงถึงความเป็นอิสระอย่างสมบูรณ์ของคุณลักษณะ น่าเสียดายที่สมมติฐานนี้ไม่สามารถบรรลุได้ในสถานการณ์จริง
- คำว่า 'โอเวอร์ฟิตติ้ง' หมายถึงอะไร? คุณสามารถหลีกเลี่ยงได้หรือไม่ ถ้าเป็นเช่นนั้นอย่างไร?
โดยปกติ ในระหว่างกระบวนการฝึกอบรม แบบจำลองจะได้รับข้อมูลจำนวนมาก ในระหว่างกระบวนการ ข้อมูลจะเริ่มเรียนรู้แม้จากข้อมูลที่ไม่ถูกต้องและสัญญาณรบกวนที่มีอยู่ในชุดข้อมูลตัวอย่าง สิ่งนี้สร้างอิทธิพลเชิงลบต่อประสิทธิภาพของแบบจำลองบนข้อมูลใหม่ กล่าวคือ โมเดลไม่สามารถจำแนกอินสแตนซ์/ข้อมูลใหม่ได้อย่างถูกต้องแม่นยำ นอกเหนือจากของชุดการฝึก สิ่งนี้เรียกว่า Overfitting
ใช่ เป็นไปได้ที่จะหลีกเลี่ยงการสวมใส่มากเกินไป โดยใช้วิธีดังนี้:
- รวบรวมข้อมูลมากขึ้น (จากแหล่งที่มาที่แตกต่างกัน) เพื่อฝึกโมเดลด้วยตัวอย่างต่างๆ
- ใช้วิธีการรวมกลุ่ม (เช่น Random Forest) ที่ใช้วิธีการบรรจุถุงเพื่อลดความผันแปรในการทำนายโดยการวางผลลัพธ์ของแผนผังการตัดสินใจหลายชุดในหน่วยต่างๆ ของชุดข้อมูล
- ตรวจสอบให้แน่ใจว่าใช้เทคนิคการตรวจสอบข้าม
- ตั้งชื่อสองวิธีที่ใช้สำหรับการสอบเทียบในการเรียนรู้ภายใต้การดูแล
วิธีการสอบเทียบสองวิธีในการเรียนรู้ภายใต้การดูแลคือ – Platt Calibration และ Isotonic Regression ทั้งสองวิธีนี้ได้รับการออกแบบมาโดยเฉพาะสำหรับการจำแนกประเภทไบนารี

- ทำไมคุณถึงตัดแต่งต้นไม้การตัดสินใจ?
ต้องตัดแต่งต้นไม้เพื่อการตัดสินใจเพื่อกำจัดกิ่งที่มีความสามารถในการคาดการณ์ที่อ่อนแอ ซึ่งช่วยลดผลหารความซับซ้อนของแบบจำลอง Decision Tree และปรับความแม่นยำในการทำนายให้เหมาะสม การตัดแต่งกิ่งสามารถทำได้ทั้งจากบนลงล่างหรือล่างขึ้นบน การตัดแต่งกิ่งที่ผิดพลาดที่ลดลง การตัดแต่งกิ่งที่มีต้นทุนซับซ้อน การตัดแต่งกิ่งที่มีความซับซ้อนของข้อผิดพลาด และการตัดแต่งกิ่งที่ผิดพลาดน้อยที่สุดคือวิธีการตัดแต่งกิ่งต้นไม้การตัดสินใจที่ใช้กันมากที่สุด
- คะแนน F1 หมายถึงอะไร
กล่าวอย่างง่าย ๆ คะแนน F1 เป็นตัววัดประสิทธิภาพของแบบจำลอง – ค่าเฉลี่ยของความแม่นยำและการเรียกคืนของแบบจำลอง โดยผลลัพธ์ที่ใกล้เคียงกับ 1 นั้นดีที่สุด และคะแนนที่ใกล้ถึง 0 นั้นแย่ที่สุด คะแนน F1 สามารถใช้ในการทดสอบการจำแนกประเภทที่ไม่ให้ความสำคัญกับผลเชิงลบที่แท้จริง
- แยกความแตกต่างระหว่างอัลกอริธึม Generative และ Discriminative
แม้ว่าอัลกอริธึมทั่วไปจะเรียนรู้เกี่ยวกับหมวดหมู่ของข้อมูล ส่วนอัลกอริธึม Discriminative จะเรียนรู้ความแตกต่างระหว่างหมวดหมู่ของข้อมูลต่างๆ เมื่อพูดถึงงานการจัดประเภท แบบจำลองการเลือกปฏิบัติมักจะแซงหน้าแบบจำลองกำเนิด
- Ensemble Learning คืออะไร?
Ensemble Learning ใช้อัลกอริธึมการเรียนรู้ร่วมกันเพื่อเพิ่มประสิทธิภาพการทำนายของแบบจำลอง ในวิธีนี้ โมเดลต่างๆ เช่น ตัวแยกประเภทหรือผู้เชี่ยวชาญ ถูกสร้างและรวมเข้าด้วยกันอย่างมีกลยุทธ์ เพื่อป้องกัน Overfitting ในแบบจำลอง ส่วนใหญ่จะใช้เพื่อปรับปรุงการทำนาย การจัดประเภท การประมาณฟังก์ชัน ประสิทธิภาพ ฯลฯ ของแบบจำลอง
- กำหนด 'เคล็ดลับเคอร์เนล'
วิธี Kernel Trick เกี่ยวข้องกับการใช้ฟังก์ชันเคอร์เนลที่สามารถทำงานได้ในพื้นที่คุณลักษณะที่มีมิติสูงและโดยนัย โดยไม่ต้องคำนวณพิกัดของจุดภายในมิตินั้นอย่างชัดเจน ฟังก์ชันเคอร์เนลคำนวณผลิตภัณฑ์ภายในระหว่างรูปภาพของข้อมูลทุกคู่ที่อยู่ในพื้นที่คุณลักษณะ ขั้นตอนนี้มีราคาถูกกว่าการคำนวณเมื่อเทียบกับการคำนวณพิกัดอย่างชัดเจนและเรียกว่า Kernel Trick

- คุณควรจัดการกับข้อมูลที่สูญหายหรือเสียหายในชุดข้อมูลอย่างไร
ในการค้นหาข้อมูลที่ขาดหายไป/เสียหายในชุดข้อมูล คุณต้องวางแถวและคอลัมน์หรือแทนที่ด้วยค่าอื่น ห้องสมุด Pandas มีวิธีที่ยอดเยี่ยมสองวิธีในการค้นหาข้อมูลที่ขาดหายไป/เสียหาย – isnull() และ dropna() ฟังก์ชันทั้งสองนี้ได้รับการออกแบบมาโดยเฉพาะเพื่อช่วยให้คุณค้นหาแถว/คอลัมน์ของข้อมูลที่มีข้อมูลที่ขาดหายไป/เสียหายและปล่อยค่าเหล่านั้น
- ตารางแฮชคืออะไร?
ตารางแฮชเป็นโครงสร้างข้อมูลที่สร้างอาร์เรย์ที่เชื่อมโยง โดยที่คีย์จะถูกจับคู่กับค่าเฉพาะโดยใช้ฟังก์ชันแฮช ตารางแฮชส่วนใหญ่จะใช้ในการสร้างดัชนีฐานข้อมูล
แหล่งที่มา
รายการคำถามนี้มีขึ้นเพื่อแนะนำคุณเกี่ยวกับพื้นฐานของการเรียนรู้ด้วยเครื่อง และตามจริงแล้ว คำถามทั้ง 20 ข้อนี้เป็นเพียงหยดเล็กๆ ในทะเล การเรียนรู้ด้วยเครื่องกำลังก้าวหน้าในขณะที่เราพูด ดังนั้นเมื่อเวลาผ่านไป แนวคิดใหม่ก็จะปรากฏขึ้น กุญแจสำคัญในการสัมภาษณ์ ML ของคุณนั้นอยู่ที่การกระตุ้นให้เรียนรู้และเพิ่มทักษะอย่างต่อเนื่อง ดังนั้น เริ่มต้นและเผยแพร่อินเทอร์เน็ต อ่านวารสาร เข้าร่วมชุมชนออนไลน์ เข้าร่วมการประชุมและสัมมนาของ ML - มีหลายวิธีในการเรียนรู้
ในการเข้าสู่องค์กรขนาดใหญ่ จำเป็นต้องมีใบรับรองจากสถาบันที่มีชื่อเสียง ตรวจสอบ โปรแกรม Executive PG ของ IIIT-B ในการเรียนรู้ของเครื่องและ AI และรับความช่วยเหลือด้านงานจากบริษัท ML & AI ชั้นนำ
Ensemble Learning มีข้อจำกัดอะไรบ้าง?
แนวทางทั้งมวลสามารถช่วยในการลดความแปรปรวนและการพัฒนาแบบจำลองที่แข็งแกร่งยิ่งขึ้น อย่างไรก็ตาม มีข้อเสียบางประการในการใช้เทคนิคของวงดนตรี เช่น ขาดความสามารถในการอธิบายและประสิทธิภาพ นอกจากนี้ พึงระลึกไว้เสมอว่าประสิทธิภาพของตระการตามาจากความสามารถในการรวมแบบจำลองหลายๆ แบบที่เน้นด้านต่างๆ ของปัญหา อย่างไรก็ตาม มีระยะเวลาการคาดการณ์ที่ยาวนานกว่า เนื่องจากคุณอาจต้องการการคาดการณ์จากแบบจำลองหลายร้อยแบบ แม้ว่าจะมีการคาดการณ์ที่ดีขึ้น แต่ความแม่นยำที่เพิ่มขึ้นอาจไม่คุ้มค่า
ต้องใช้เวลาเท่าใดในการเรียนรู้แมชชีนเลิร์นนิง
เมื่อพูดถึงแมชชีนเลิร์นนิง เทคโนโลยีที่ซับซ้อนที่ใช้สำหรับสิ่งเดียวกันอาจทำให้ผู้คนหวาดกลัวได้ง่าย อย่างไรก็ตาม การทำความเข้าใจทีละน้อยไม่ใช่เรื่องยาก ประสบการณ์ก่อนหน้าในด้านสถิติ คณิตศาสตร์ขั้นสูง และอื่นๆ จะช่วยให้คุณเข้าใจแนวคิดทั้งหมดได้อย่างรวดเร็ว อย่างไรก็ตาม เนื่องจากภูมิหลังทางการศึกษาและทักษะแตกต่างกันไปในแต่ละบุคคล บุคคลหนึ่งอาจเรียนรู้ ML ได้ภายในสามสัปดาห์ในขณะที่อีกคนหนึ่งอาจต้องใช้เวลาหนึ่งปี
Machine Learning ถูกนำมาใช้ในชีวิตประจำวันอย่างไร?
Gmail จัดหมวดหมู่อีเมลตามความจำเป็นโดยจัดเรียงเป็นอีเมลหลัก โปรโมชัน โซเชียล และอัปเดตโดยใช้แมชชีนเลิร์นนิง บริษัทต่างๆ กำลังใช้โครงข่ายประสาทเทียมในการตรวจจับธุรกรรมที่เป็นการฉ้อโกงโดยอิงจากข้อมูล เช่น ความถี่ล่าสุดของการทำธุรกรรม จำนวนธุรกรรม และประเภทผู้ค้า เครื่องตรวจจับการลอกเลียนแบบยังใช้ประโยชน์จากการเรียนรู้ของเครื่องอีกด้วย เมื่อพูดถึงวิศวกรรม ML จะใช้เวลาประมาณหกเดือนจึงจะเสร็จ