9 Ide & Topik Proyek Regresi Linier Menarik Untuk Pemula [2022]

Diterbitkan: 2021-01-09

Regresi linier adalah topik populer dalam pembelajaran mesin. Ini adalah algoritma pembelajaran yang diawasi dan menemukan aplikasi di banyak sektor. Jika Anda mempelajari topik ini dan ingin menguji keterampilan Anda, maka Anda harus mencoba beberapa proyek regresi linier. Pada artikel ini, kita membahas hal yang sama.

Kami memiliki ide proyek regresi linier untuk berbagai tingkat keterampilan dan domain sehingga Anda dapat memilih satu sesuai dengan keahlian dan minat Anda. Selain itu, Anda dapat mengubah tingkat tantangan proyek apa pun yang telah kami sebutkan di sini dengan menambah (atau mengurangi) nilai data yang Anda tambahkan di kumpulan data Anda.

Bergabunglah dengan Deep Learning Course online dari Universitas top dunia – Magister, Program Pascasarjana Eksekutif, dan Program Sertifikat Tingkat Lanjut di ML & AI untuk mempercepat karir Anda.

Daftar isi

Apa itu Regresi Linier?

Regresi Linier adalah algoritma pembelajaran terawasi dalam pembelajaran mesin. Ini memodelkan nilai prediksi menurut variabel independen dan membantu dalam menemukan hubungan antara variabel tersebut dan perkiraan. Model regresi bergantung pada hubungan antara variabel bebas dan variabel terikat serta jumlah variabel yang digunakan.

Regresi linier memprediksi nilai dependen (y) sesuai dengan variabel independen (x). Output di sini adalah nilai dependen, dan input adalah nilai independen. Fungsi hipotesis untuk regresi linier adalah sebagai berikut:

Y = 1 + 2 x

Model regresi linier menemukan garis terbaik, yang memprediksi nilai y sesuai dengan nilai x yang diberikan. Untuk mendapatkan garis terbaik, ia menemukan nilai yang paling cocok untuk 1 dan 2 . 1 adalah intersep, dan 2 adalah koefisien x. Ketika kami menemukan nilai terbaik untuk 1 dan 2 , kami juga menemukan garis terbaik untuk regresi linier Anda.

Sekarang setelah kita membahas konsep dasar regresi linier, kita dapat beralih ke ide proyek regresi linier.

Ide Proyek Regresi Linier Teratas Kami

Ide #1: Anggaran Perjalanan Jauh

Misalkan Anda ingin melakukan perjalanan jauh (dari Delhi ke Lonawala). Sebelum melakukan perjalanan selama ini, sebaiknya siapkan anggaran dan cari tahu berapa banyak yang harus Anda keluarkan untuk bagian tertentu. Anda dapat menggunakan model regresi linier di sini untuk menentukan biaya bahan bakar yang harus Anda dapatkan.

Dalam regresi linier ini, jumlah total uang yang harus Anda bayarkan akan menjadi variabel dependen, yang berarti itu akan menjadi output dari model kami. Jarak antara tujuan akan menjadi variabel independen. Untuk menjaga model tetap sederhana, kita dapat mengasumsikan bahwa harga bahan bakar akan tetap konstan selama perjalanan.

Anda dapat memilih dua tujuan untuk proyek ini. Ini adalah ide proyek yang bagus untuk pemula karena memungkinkan Anda untuk bereksperimen dan memahami konsep dengan jelas. Plus, Anda juga dapat menggunakan model ini kapan pun Anda merencanakan perjalanan jauh!

Ide #2: Bandingkan Tingkat Pengangguran dengan Keuntungan di Pasar Saham

Jika Anda seorang penggemar ekonomi, atau jika Anda ingin menggunakan pengetahuan Anda tentang Pembelajaran Mesin di bidang ini, maka ini adalah salah satu ide proyek regresi linier terbaik untuk Anda. Kita semua tahu bagaimana pengangguran merupakan masalah yang signifikan bagi negara kita. Dalam proyek ini, kita akan menemukan hubungan antara tingkat pengangguran dan keuntungan yang terjadi di pasar saham.

Anda dapat menggunakan data resmi dari pemerintah untuk mendapatkan tingkat pengangguran dan menggunakannya untuk mengetahui apakah ada hubungan antara itu dan keuntungan di pasar saham.

Baca: Implementasi Regresi Linier dengan Python

Ide #3: Bandingkan Gaji Batsmen dengan Lari Rata-Rata yang Mereka Skor per Game

Kriket dengan mudah adalah permainan paling populer di India. Anda dapat menggunakan pengetahuan Anda tentang pembelajaran mesin dalam proyek sederhana namun menarik ini di mana Anda akan merencanakan hubungan antara gaji batsmen dan rata-rata lari yang mereka cetak di setiap pertandingan. Pemain kriket kami termasuk di antara beberapa atlet berpenghasilan tertinggi di dunia. Bekerja pada proyek ini akan membantu Anda mengetahui berapa banyak rata-rata pukulan mereka bertanggung jawab atas penghasilan mereka.

Jika Anda seorang pemula, Anda dapat memulai dengan satu tim dan memeriksa gaji para pemukulnya. Di sisi lain, jika Anda ingin melangkah lebih jauh, Anda dapat mempertimbangkan beberapa tim (Australia, Inggris, Afrika Selatan, dll.) dan juga memeriksa gaji batsmen mereka.

Ide #4: Bandingkan Tanggal dalam Sebulan dengan Gaji Bulanan

Proyek ini mengeksplorasi penerapan pembelajaran mesin dalam sumber daya manusia dan manajemen. Ini adalah salah satu proyek regresi linier tingkat pemula, jadi jika Anda belum pernah mengerjakan proyek seperti itu sebelumnya, Anda bisa mulai dengan yang ini. Di sini, Anda akan mengambil tanggal yang ada dalam sebulan dan membandingkannya dengan gaji bulanan.

Setelah Anda menetapkan hubungan antara dua variabel, Anda dapat mengeksplorasi apakah upah saat ini optimal atau tidak. Anda dapat memilih karir apapun dan mencari gaji rata-rata untuk dipilih sebagai variabel independen. Anda dapat membuat proyek ini lebih menantang dengan mendiskusikan banyak pekerjaan lain selain yang asli.

Ide #5: Bandingkan Suhu Global Rata-Rata dan Tingkat Polusi

Polusi dan dampaknya terhadap lingkungan adalah topik diskusi yang menonjol. Pandemi baru-baru ini juga menunjukkan kepada kita bagaimana kita masih bisa menyelamatkan lingkungan kita. Anda dapat menggunakan keterampilan pembelajaran mesin Anda di bidang ini juga. Proyek ini akan membantu Anda dalam memahami bagaimana pembelajaran mesin dapat memecahkan berbagai masalah yang ada di domain ini juga.

Di sini, Anda akan mengambil suhu global rata-rata dalam beberapa tahun dan membandingkannya dengan tingkat polusi yang terjadi dalam durasi tersebut. Membuat model regresi linier pada topik ini mudah dan tidak membutuhkan banyak usaha. Namun, itu pasti akan membantu Anda dalam mencoba keterampilan pembelajaran mesin Anda.

Ide #6: Bandingkan Suhu Lokal dengan Jumlah Hujan

Ini adalah ide proyek menarik lainnya untuk pecinta alam dan lingkungan. Dalam proyek ini, Anda harus menemukan hubungan antara suhu lokal dan jumlah hujan yang terjadi di sana. Setelah menyelesaikan proyek ini, Anda akan melihat bagaimana Anda dapat menggunakan regresi linier dan teknik pembelajaran mesin lainnya dalam Geografi dan mata pelajaran terkait.

Anda harus menjaga suhu dalam Celcius dan jumlah hujan dalam mm (milimeter). Sebagai permulaan, Anda dapat mempertimbangkan beberapa kota terkemuka di negara ini (seperti New Delhi, Mumbai, Pune, Jaipur) dan menambahkan lebih banyak lagi saat Anda menyelesaikan proyek.

Ide #7: Bandingkan Usia Rata-Rata Manusia dengan Jumlah Tidurnya

Tidur selalu mempesona para ilmuwan kita. Dan jika Anda juga tertarik dengan topik ini, maka Anda harus mengerjakan yang satu ini. Dalam proyek ini, Anda harus membandingkan umur rata-rata orang dengan jumlah tidur yang mereka dapatkan.

Jika Anda ingin memasuki bidang bioteknologi atau ilmu saraf dengan keahlian dalam pembelajaran mesin, maka ini adalah pilihan yang sangat baik untuk Anda. Ini akan membantu Anda menjelajahi aplikasi regresi linier di sektor-sektor ini. Ada banyak makalah penelitian tentang topik ini, sehingga Anda tidak akan kesulitan menemukan sumber data yang relevan.

Ide #8: Bandingkan Persentase Sedimen di Sungai dengan Debitnya

Ini adalah ide proyek menarik lainnya untuk penggemar lingkungan dan geografi. Di sini, Anda harus membandingkan persentase sedimen yang ada di air dengan tingkat debitnya. Anda dapat memulai dengan satu sungai dan membuatnya lebih menantang dengan menambahkan lebih banyak aliran. Demikian pula, Anda dapat memulai dengan aliran kecil (atau bagian dari sungai raksasa), jika Anda belum pernah mengerjakan proyek regresi linier sebelumnya.

Debit sungai adalah volume yang mengikuti salurannya. Ini adalah total volume air yang mengalir melalui titik tertentu, dan unit untuk mengukur debit sungai dalam meter kubik per detik. Sedimen adalah bahan padat yang ada di sungai yang bergerak dan diendapkan ke lokasi baru melalui sungai.

Ide #9: Bandingkan Anggaran Film yang Dinominasikan Penghargaan Film Nasional dengan jumlah Film yang Memenangkan Penghargaan Ini

Anda juga menerapkan regresi linier di sektor hiburan. Dalam proyek ini, Anda harus membandingkan anggaran film yang dinominasikan untuk Penghargaan Film Nasional dengan jumlah film yang memenangkan penghargaan ini. Anda akan mengetahui apakah anggaran sebuah film mempengaruhi kemungkinan memenangkan penghargaan atau tidak. Anda bisa mulai dengan data selama lima tahun terakhir (2014-19). Dan jika Anda ingin melangkah lebih jauh, Anda dapat menambahkan data dari tahun ke tahun dan membuat proyek lebih menantang.

Baca Juga: 15 Ide Proyek Pembelajaran Mesin yang Menarik Untuk Pemula

Pikiran Akhir

Kami telah mencapai akhir daftar proyek kami. Kami harap ide proyek regresi linier ini bermanfaat bagi Anda. Jika Anda memiliki pertanyaan tentang regresi linier atau ide proyek ini, jangan ragu untuk bertanya kepada kami.

Di sisi lain, jika Anda ingin mempelajari lebih lanjut tentang regresi linier, maka kami sarankan untuk mengunjungi blog kami, di mana Anda akan menemukan banyak sumber daya, panduan, dan artikel berharga tentang topik ini. Sebagai permulaan, inilah panduan kami tentang regresi linier dalam pembelajaran mesin .

Anda dapat memeriksa Program PG Eksekutif IIT Delhi dalam Pembelajaran Mesin yang terkait dengan upGrad . IIT Delhi adalah salah satu institusi paling bergengsi di India. Dengan lebih dari 500+ anggota fakultas In-house yang terbaik dalam mata pelajaran.

Apa langkah-langkah penting yang harus diikuti dalam regresi linier?

Sesuatu yang lebih dari sekadar memasang garis linier melalui sekelompok titik data terlibat dalam analisis regresi linier. Ini memiliki tiga tahap: (1) memeriksa data untuk korelasi dan arah, (2) memprediksi model, yaitu menyesuaikan garis, dan (3) menilai validitas dan utilitas model. Untuk memulai, gunakan plot sebar untuk menilai data dan memverifikasi arah dan korelasi. Menyesuaikan garis regresi adalah tahap kedua dalam analisis regresi. Residu yang tidak dapat dijelaskan diminimalkan menggunakan estimasi kuadrat terkecil matematis. Uji signifikansi merupakan tahap akhir dalam analisis regresi linier.

Mengapa regresi linier membutuhkan distribusi normal?

Beberapa pengguna secara keliru percaya bahwa asumsi distribusi normal regresi linier berlaku untuk data mereka. Mereka bisa membuat histogram dari variabel respon mereka untuk melihat apakah itu menyimpang dari distribusi normal. Yang lain percaya bahwa variabel penjelas harus memiliki distribusi yang terdistribusi secara teratur. Tidak perlu. Asumsi normalitas berlaku untuk distribusi residual. Data berdistribusi normal, serta garis regresi dicocokkan dengan data sehingga rata-rata residualnya adalah nol.

Apa kelebihan dan kekurangan regresi linier?

Manfaat paling signifikan dari analisis regresi linier adalah linieritasnya: Ini menyederhanakan proses estimasi dan, yang lebih penting, persamaan linier ini memiliki interpretasi modular yang mudah dipahami (yaitu bobot). Regresi linier hanya mempertimbangkan mean Variabel Dependen. Hubungan antara rata-rata variabel dependen dan variabel independen dipelajari dengan menggunakan regresi linier. Pencilan dapat mempengaruhi Regresi Linier.