9 แนวคิดและหัวข้อโครงการการถดถอยเชิงเส้นที่น่าสนใจสำหรับผู้เริ่มต้น [2022]
เผยแพร่แล้ว: 2021-01-09การถดถอยเชิงเส้นเป็นหัวข้อยอดนิยมในการเรียนรู้ของเครื่อง เป็นอัลกอริธึมการเรียนรู้ภายใต้การดูแลและค้นหาแอปพลิเคชันในหลายภาคส่วน หากคุณกำลังเรียนรู้เกี่ยวกับหัวข้อนี้และต้องการทดสอบทักษะของคุณ คุณควรลองใช้โครงงานการถดถอยเชิงเส้นสองสามโครงการ ในบทความนี้เรากำลังพูดถึงเรื่องเดียวกัน
เรามีแนวคิดโครงการถดถอยเชิงเส้นสำหรับระดับทักษะและขอบเขตที่แตกต่างกัน เพื่อให้คุณสามารถเลือกได้ตามความเชี่ยวชาญและความสนใจของคุณ นอกจากนี้ คุณสามารถปรับเปลี่ยนระดับความท้าทายของโครงการใดๆ ที่เราได้กล่าวถึงที่นี่โดยการเพิ่ม (หรือลด) ค่าข้อมูลที่คุณเพิ่มในชุดข้อมูลของคุณ
เข้าร่วม หลักสูตร Deep Learning ออนไลน์จากมหาวิทยาลัยชั้นนำของโลก – ปริญญาโท โปรแกรม Executive Post Graduate และหลักสูตรประกาศนียบัตรขั้นสูงใน ML & AI เพื่อติดตามอาชีพของคุณอย่างรวดเร็ว
สารบัญ
การถดถอยเชิงเส้นคืออะไร?
การถดถอยเชิงเส้นเป็นอัลกอริธึมการเรียนรู้ภายใต้การดูแลในการเรียนรู้ของเครื่อง มันจำลองค่าการทำนายตามตัวแปรอิสระและช่วยในการค้นหาความสัมพันธ์ระหว่างตัวแปรเหล่านั้นกับการพยากรณ์ ตัวแบบการถดถอยขึ้นอยู่กับความสัมพันธ์ระหว่างตัวแปรอิสระและตัวแปรตามตลอดจนจำนวนตัวแปรที่ใช้
การถดถอยเชิงเส้นทำนายค่าที่ขึ้นต่อกัน (y) ตามตัวแปรอิสระ (x) ผลลัพธ์ที่นี่เป็นค่าที่ขึ้นต่อกัน และอินพุตเป็นค่าอิสระ ฟังก์ชันสมมติฐานสำหรับการถดถอยเชิงเส้นมีดังต่อไปนี้:
Y = 1 + 2 x

ตัวแบบการถดถอยเชิงเส้นหาเส้นที่ดีที่สุด ซึ่งทำนายค่าของ y ตามค่าของ x ที่ให้มา เพื่อให้ได้เส้นที่ดีที่สุด จะพบค่าที่เหมาะสมที่สุด สำหรับ 1 และ 2 1 คือค่าตัดขวาง และ 2 คือสัมประสิทธิ์ของ x เมื่อเราพบค่าที่ดีที่สุดสำหรับ 1 และ 2 เราจะพบเส้นที่ดีที่สุดสำหรับการถดถอยเชิงเส้นของคุณเช่นกัน
ตอนนี้เราได้พูดถึงแนวคิดพื้นฐานของการถดถอยเชิงเส้นแล้ว เราสามารถย้ายไปยังแนวคิดโครงการการถดถอยเชิงเส้นได้
แนวคิดโครงการการถดถอยเชิงเส้นยอดนิยมของเรา
แนวคิด #1: งบประมาณสำหรับการขับรถระยะไกล
สมมติว่าคุณต้องการเดินทางไกล (จากเดลีไปโลนาวาลา) ก่อนเดินทางไกล ควรเตรียมงบประมาณและหาจำนวนเงินที่ต้องจ่ายในส่วนใดส่วนหนึ่ง คุณสามารถใช้ตัวแบบการถดถอยเชิงเส้นที่นี่เพื่อกำหนดต้นทุนของก๊าซที่คุณจะต้องได้รับ
ในการถดถอยเชิงเส้นนี้ จำนวนเงินทั้งหมดที่คุณต้องจ่ายจะเป็นตัวแปรตาม ซึ่งหมายความว่ามันจะเป็นผลลัพธ์ของแบบจำลองของเรา ระยะห่างระหว่างจุดหมายปลายทางจะเป็นตัวแปรอิสระ เพื่อให้โมเดลเรียบง่าย เราสามารถสมมติได้ว่าราคาน้ำมันจะคงที่ตลอดการเดินทาง
คุณสามารถเลือกปลายทางใดก็ได้สองแห่งสำหรับโครงการนี้ เป็นแนวคิดโครงการที่ยอดเยี่ยมสำหรับผู้เริ่มต้นเพราะช่วยให้คุณสามารถทดลองและทำความเข้าใจแนวคิดได้อย่างชัดเจน นอกจากนี้ คุณยังสามารถใช้โมเดลนี้ได้ทุกเมื่อที่คุณวางแผนจะขับรถระยะไกลอีกด้วย!
แนวคิด #2: เปรียบเทียบอัตราการว่างงานกับกำไรในตลาดหุ้น
หากคุณเป็นคนที่กระตือรือร้นด้านเศรษฐศาสตร์ หรือหากคุณต้องการใช้ความรู้เกี่ยวกับแมชชีนเลิร์นนิงในสาขานี้ นี่เป็นหนึ่งในแนวคิดโครงการการถดถอยเชิงเส้นที่ดีที่สุดสำหรับคุณ เราทุกคนทราบดีว่าการว่างงานเป็นปัญหาสำคัญสำหรับประเทศของเราอย่างไร ในโครงการนี้ เราจะพบความสัมพันธ์ระหว่างอัตราการว่างงานและผลกำไรที่เกิดขึ้นในตลาดหุ้น
คุณสามารถใช้ข้อมูลอย่างเป็นทางการจากรัฐบาลเพื่อดูอัตราการว่างงาน และใช้เพื่อดูว่ามีความสัมพันธ์ระหว่างอัตราการว่างงานกับผลกำไรในตลาดหุ้นหรือไม่
อ่าน: การดำเนินการถดถอยเชิงเส้นใน Python
แนวคิด #3: เปรียบเทียบเงินเดือนของ Batsmen กับค่าเฉลี่ยที่พวกเขาทำคะแนนต่อเกม
คริกเก็ตเป็นเกมที่ได้รับความนิยมมากที่สุดในอินเดีย คุณสามารถใช้ความรู้เกี่ยวกับแมชชีนเลิร์นนิงในโปรเจ็กต์ที่เรียบง่ายแต่น่าตื่นเต้นนี้ ซึ่งคุณจะได้วางแผนความสัมพันธ์ระหว่างเงินเดือนของนักตีบอลและการวิ่งเฉลี่ยที่พวกเขาทำคะแนนในทุกเกม นักคริกเก็ตของเราเป็นหนึ่งในนักกีฬาที่มีรายได้สูงที่สุดในโลก การทำงานในโครงการนี้จะช่วยให้คุณทราบว่าค่าเฉลี่ยการตีบอลของพวกเขามีความรับผิดชอบต่อรายได้ของพวกเขามากน้อยเพียงใด
หากคุณเป็นมือใหม่ คุณสามารถเริ่มต้นด้วยทีมใดทีมหนึ่งและตรวจสอบเงินเดือนของนักตีปิงปอง ในทางกลับกัน หากคุณต้องการก้าวไปอีกขั้น คุณสามารถพิจารณาหลายทีม (ออสเตรเลีย อังกฤษ แอฟริกาใต้ ฯลฯ) และตรวจสอบเงินเดือนของนักตีบอลด้วย
แนวคิด #4: เปรียบเทียบวันที่ในหนึ่งเดือนกับเงินเดือนรายเดือน
โครงงานนี้สำรวจการประยุกต์ใช้แมชชีนเลิร์นนิงในทรัพยากรบุคคลและการจัดการ มันเป็นหนึ่งในโครงการการถดถอยเชิงเส้นระดับเริ่มต้น ดังนั้น หากคุณไม่เคยทำโปรเจ็กต์ดังกล่าวมาก่อน คุณสามารถเริ่มด้วยโปรเจ็กต์นี้ได้ ที่นี่ คุณจะใช้วันที่ปัจจุบันในเดือนหนึ่งและเปรียบเทียบกับเงินเดือนรายเดือน
หลังจากที่คุณได้สร้างความสัมพันธ์ระหว่างตัวแปรทั้งสองแล้ว คุณสามารถสำรวจได้ว่าค่าจ้างปัจจุบันเหมาะสมหรือไม่ คุณสามารถเลือกอาชีพใดก็ได้และค้นหาเงินเดือนเฉลี่ยเพื่อเลือกเป็นตัวแปรอิสระ คุณสามารถทำให้โปรเจ็กต์นี้มีความท้าทายมากขึ้นโดยพูดคุยเกี่ยวกับงานอื่นๆ มากมาย นอกเหนือจากงานเดิม
แนวคิด #5: เปรียบเทียบอุณหภูมิโลกโดยเฉลี่ยและระดับมลพิษ
มลพิษและผลกระทบต่อสิ่งแวดล้อมเป็นหัวข้อสนทนาที่โดดเด่น การระบาดใหญ่ครั้งล่าสุดยังแสดงให้เราเห็นว่าเรายังคงสามารถรักษาสิ่งแวดล้อมของเราได้อย่างไร คุณสามารถใช้ทักษะการเรียนรู้ของเครื่องในสาขานี้ได้เช่นกัน โครงการนี้จะช่วยคุณในการทำความเข้าใจว่าแมชชีนเลิร์นนิงสามารถแก้ปัญหาต่างๆ ที่มีอยู่ในโดเมนนี้ได้อย่างไร

ในที่นี้ คุณจะต้องนำอุณหภูมิโลกโดยเฉลี่ยในช่วงหลายปีที่ผ่านมามาเปรียบเทียบกับระดับมลพิษที่เกิดขึ้นในช่วงเวลานั้น การสร้างแบบจำลองการถดถอยเชิงเส้นในหัวข้อนี้เป็นเรื่องง่ายและไม่ต้องใช้ความพยายามมากนัก อย่างไรก็ตาม มันจะช่วยคุณในการทดลองใช้ทักษะการเรียนรู้ของเครื่อง
แนวคิด #6: เปรียบเทียบอุณหภูมิท้องถิ่นกับปริมาณน้ำฝน
นี่เป็นอีกหนึ่งแนวคิดโครงการที่น่าตื่นเต้นสำหรับผู้ชื่นชอบธรรมชาติและสิ่งแวดล้อม ในโครงการนี้ คุณต้องค้นหาความสัมพันธ์ระหว่างอุณหภูมิท้องถิ่นกับปริมาณฝนที่เกิดขึ้นที่นั่น หลังจากทำโครงงานนี้เสร็จแล้ว คุณจะเห็นว่าคุณสามารถใช้การถดถอยเชิงเส้นและเทคนิคการเรียนรู้ของเครื่องอื่นๆ ในภูมิศาสตร์และวิชาที่เกี่ยวข้องได้อย่างไร
คุณควรเก็บอุณหภูมิเป็นเซลเซียสและปริมาณน้ำฝนเป็นมิลลิเมตร (มิลลิเมตร) สำหรับผู้เริ่มต้น คุณสามารถพิจารณาเมืองสำคัญๆ ของประเทศ (เช่น นิวเดลี มุมไบ ปูเน่ ชัยปุระ) และเพิ่มอีกเมื่อคุณทำโครงการเสร็จสิ้น
แนวคิด #7: เปรียบเทียบอายุเฉลี่ยของมนุษย์กับจำนวนการนอนหลับของพวกเขา
การนอนหลับทำให้นักวิทยาศาสตร์ของเราหลงใหลอยู่เสมอ และหากคุณรู้สึกทึ่งกับหัวข้อนี้เช่นกัน คุณควรทำงานในหัวข้อนี้ ในโครงการนี้ คุณต้องเปรียบเทียบอายุขัยเฉลี่ยของผู้คนกับปริมาณการนอนหลับที่พวกเขาได้รับ
หากคุณต้องการเข้าสู่สาขาเทคโนโลยีชีวภาพหรือประสาทวิทยาศาสตร์ที่มีความเชี่ยวชาญด้านการเรียนรู้ด้วยเครื่อง นี่คือตัวเลือกที่ยอดเยี่ยมสำหรับคุณ จะช่วยคุณสำรวจการประยุกต์ใช้การถดถอยเชิงเส้นในภาคส่วนเหล่านี้ มีรายงานการวิจัยมากมายในหัวข้อนี้ ดังนั้นคุณจะไม่มีปัญหาในการค้นหาแหล่งข้อมูลที่เกี่ยวข้อง
แนวคิด #8: เปรียบเทียบเปอร์เซ็นต์ของตะกอนในแม่น้ำกับการปลดปล่อย
นี่เป็นอีกหนึ่งแนวคิดโครงการที่น่าตื่นเต้นสำหรับผู้ที่ชื่นชอบสิ่งแวดล้อมและภูมิศาสตร์ ที่นี่คุณต้องเปรียบเทียบเปอร์เซ็นต์ของตะกอนที่มีอยู่ในน้ำกับระดับการปลดปล่อย คุณสามารถเริ่มต้นด้วยแม่น้ำสายเดียวและทำให้ท้าทายมากขึ้นโดยเพิ่มลำธารให้มากขึ้น ในทำนองเดียวกัน คุณสามารถเริ่มต้นด้วยกระแสน้ำเล็กๆ (หรือส่วนหนึ่งของแม่น้ำยักษ์) หากคุณไม่เคยทำโครงการการถดถอยเชิงเส้นมาก่อน
การระบายของแม่น้ำคือปริมาตรที่ไหลผ่านช่องทางของมัน คือปริมาตรรวมของน้ำที่ไหลผ่านจุดหนึ่ง และหน่วยวัดปริมาณน้ำที่ไหลออกในแม่น้ำเป็นลูกบาศก์เมตรต่อวินาที ตะกอน เป็นวัสดุที่เป็นของแข็งในลำธารที่เคลื่อนตัวและตกตะกอนไปยังตำแหน่งใหม่ผ่านแม่น้ำ

แนวคิด #9: เปรียบเทียบงบประมาณของภาพยนตร์ที่ได้รับการเสนอชื่อเข้าชิงรางวัลภาพยนตร์แห่งชาติกับจำนวนภาพยนตร์ที่ชนะรางวัลเหล่านี้
คุณใช้การถดถอยเชิงเส้นในภาคบันเทิงด้วย ในโครงการนี้ คุณต้องเปรียบเทียบงบประมาณของภาพยนตร์ที่ได้รับการเสนอชื่อเข้าชิงรางวัลภาพยนตร์แห่งชาติกับจำนวนภาพยนตร์ที่ได้รับรางวัลเหล่านี้ คุณจะพบว่างบประมาณของภาพยนตร์ส่งผลต่อความน่าจะเป็นที่จะได้รับรางวัลหรือไม่ คุณสามารถเริ่มต้นด้วยข้อมูลในช่วงห้าปีที่ผ่านมา (2014-19) และถ้าคุณต้องการก้าวไปอีกระดับ คุณสามารถเพิ่มข้อมูลจากปีอื่นๆ และทำให้โครงการมีความท้าทายมากขึ้น
อ่านเพิ่มเติม: 15 แนวคิดโครงการการเรียนรู้ของเครื่องที่น่าสนใจสำหรับผู้เริ่มต้น
ความคิดสุดท้าย
เรามาถึงจุดสิ้นสุดของรายการโครงการแล้ว เราหวังว่าคุณจะพบว่าแนวคิดโครงการการถดถอยเชิงเส้นมีประโยชน์ หากคุณมีคำถามใดๆ เกี่ยวกับการถดถอยเชิงเส้นหรือแนวคิดโครงการเหล่านี้ อย่าลังเลที่จะถามเรา
ในทางกลับกัน หากคุณต้องการเรียนรู้เพิ่มเติมเกี่ยวกับการถดถอยเชิงเส้น เราแนะนำให้ไปที่บล็อกของเรา ซึ่งคุณจะพบแหล่งข้อมูล คู่มือ และบทความที่มีคุณค่ามากมายในหัวข้อนี้ สำหรับผู้เริ่มต้น นี่คือ คำแนะนำเกี่ยวกับการถดถอยเชิงเส้นในการเรียนรู้ ของ เครื่อง
คุณสามารถตรวจสอบ Executive PG Program ของ IIT Delhi ใน Machine Learning ร่วมกับ upGrad IIT Delhi เป็นหนึ่งในสถาบันที่มีชื่อเสียงที่สุดในอินเดีย ด้วยคณาจารย์ภายในมากกว่า 500 คนซึ่งดีที่สุดในสาขาวิชา
ขั้นตอนสำคัญที่ต้องปฏิบัติตามในการถดถอยเชิงเส้นคืออะไร?
บางสิ่งที่มากกว่าการปรับเส้นตรงให้พอดีผ่านกลุ่มจุดข้อมูลนั้นเกี่ยวข้องกับการวิเคราะห์การถดถอยเชิงเส้น มีสามขั้นตอน: (1) การตรวจสอบข้อมูลสำหรับความสัมพันธ์และทิศทาง (2) การทำนายแบบจำลอง กล่าวคือ การปรับเส้นให้พอดี และ (3) การประเมินความถูกต้องและประโยชน์ของแบบจำลอง ในการเริ่มต้น ใช้แผนภาพกระจายเพื่อประเมินข้อมูลและตรวจสอบทิศทางและความสัมพันธ์ การติดตั้งเส้นถดถอยเป็นขั้นตอนที่สองในการวิเคราะห์การถดถอย เศษที่เหลือที่ไม่ได้อธิบายจะถูกย่อให้เล็กสุดโดยใช้การประมาณค่ากำลังสองน้อยที่สุดทางคณิตศาสตร์ การทดสอบนัยสำคัญเป็นขั้นตอนสุดท้ายในการวิเคราะห์การถดถอยเชิงเส้น
เหตุใดการถดถอยเชิงเส้นจึงต้องมีการแจกแจงแบบปกติ
ผู้ใช้บางคนเข้าใจผิดว่าสมมติฐานการแจกแจงแบบปกติของการถดถอยเชิงเส้นใช้กับข้อมูลของพวกเขา พวกเขาสามารถสร้างฮิสโทแกรมของตัวแปรการตอบสนองเพื่อดูว่ามันแยกออกจากการแจกแจงแบบปกติหรือไม่ คนอื่นเชื่อว่าตัวแปรอธิบายต้องมีการแจกแจงแบบสม่ำเสมอ ไม่จำเป็น สมมติฐานภาวะปกติใช้กับการกระจายส่วนที่เหลือ ข้อมูลมีการกระจายตามปกติ เช่นเดียวกับเส้นการถดถอยจะจับคู่กับข้อมูลเพื่อให้ค่าเฉลี่ยคงเหลือเป็นศูนย์
ข้อดีและข้อเสียของการถดถอยเชิงเส้นคืออะไร?
ประโยชน์ที่สำคัญที่สุดของการวิเคราะห์การถดถอยเชิงเส้นคือความเป็นเส้นตรง: ทำให้กระบวนการประมาณง่ายขึ้น และที่สำคัญกว่านั้น สมการเชิงเส้นเหล่านี้มีการตีความแบบแยกส่วนที่เข้าใจง่าย (เช่น ตุ้มน้ำหนัก) การถดถอยเชิงเส้นใช้ค่าเฉลี่ยของตัวแปรตาม ศึกษาความเชื่อมโยงระหว่างค่าเฉลี่ยของตัวแปรตามกับตัวแปรอิสระโดยใช้การถดถอยเชิงเส้น ค่าผิดปกติอาจส่งผลต่อการถดถอยเชิงเส้น