15 Ide Proyek Pembelajaran Mesin yang Menarik Untuk Pemula [2022]

Diterbitkan: 2021-01-10

Daftar isi

Ide Proyek Pembelajaran Mesin

Karena Artificial Intelligence (AI) terus berkembang pesat pada tahun 2022, pencapaian penguasaan atas Machine Learning (ML) menjadi semakin penting bagi semua pemain di bidang ini. Ini karena AI dan ML saling melengkapi. Jadi, jika Anda seorang pemula, hal terbaik yang dapat Anda lakukan adalah mengerjakan beberapa proyek Machine Learning.

Kami, di upGrad, percaya pada pendekatan praktis karena pengetahuan teoretis saja tidak akan membantu dalam lingkungan kerja waktu nyata. Dalam artikel ini, kita akan menjelajahi beberapa proyek Machine Learning yang menarik yang dapat dikerjakan oleh pemula untuk menguji pengetahuan Machine Learning mereka. Dalam artikel ini, Anda akan menemukan 15 ide proyek pembelajaran mesin teratas bagi pemula untuk mendapatkan pengalaman langsung.

Tapi pertama-tama, mari kita bahas pertanyaan yang lebih relevan yang pasti ada di benak Anda: mengapa membangun proyek Machine Learning?

Ketika berbicara tentang karir dalam pengembangan perangkat lunak, adalah suatu keharusan bagi calon pengembang untuk mengerjakan proyek mereka sendiri. Mengembangkan proyek dunia nyata adalah cara terbaik untuk mengasah keterampilan Anda dan mewujudkan pengetahuan teoretis Anda menjadi pengalaman praktis. Semakin banyak Anda bereksperimen dengan berbagai proyek Machine Learning , semakin banyak pengetahuan yang Anda peroleh.

Meskipun buku teks dan materi pelajaran akan memberi Anda semua pengetahuan yang perlu Anda ketahui tentang Machine Learning, Anda tidak akan pernah bisa benar-benar menguasai ML kecuali Anda menginvestasikan waktu Anda dalam eksperimen praktis kehidupan nyata – proyek di Machine Learning. Saat Anda mulai mengerjakan ide proyek pembelajaran mesin, Anda tidak hanya akan dapat menguji kekuatan dan kelemahan Anda, tetapi Anda juga akan mendapatkan paparan yang dapat sangat membantu untuk meningkatkan karier Anda. Dalam tutorial ini, Anda akan menemukan 15 ide proyek pembelajaran mesin yang menarik bagi pemula untuk mendapatkan pengalaman langsung dalam pembelajaran mesin.

Pelajari Kursus Online Machine Learning dari Universitas top dunia. Dapatkan Master, PGP Eksekutif, atau Program Sertifikat Tingkat Lanjut untuk mempercepat karier Anda.

Jadi, berikut adalah beberapa Proyek Pembelajaran Mesin yang dapat dikerjakan oleh pemula:

Berikut adalah beberapa ide proyek Machine Learning yang keren untuk pemula

Tonton video kami tentang ide dan topik proyek pembelajaran mesin…

Daftar ide proyek pembelajaran mesin untuk siswa ini cocok untuk pemula, dan mereka yang baru memulai dengan Pembelajaran Mesin atau Ilmu Data secara umum. Ide proyek pembelajaran mesin ini akan membuat Anda maju dengan semua kepraktisan yang Anda butuhkan untuk berhasil dalam karir Anda sebagai profesional Pembelajaran Mesin.

Selanjutnya, jika Anda mencari ide proyek Machine Learning untuk tahun terakhir , daftar ini akan membantu Anda. Jadi, tanpa basa-basi lagi, mari langsung masuk ke beberapa ide proyek Machine Learning yang akan memperkuat basis Anda dan memungkinkan Anda untuk menaiki tangga.

1. Prediktor Harga Saham

Salah satu ide terbaik untuk mulai bereksperimen dengan proyek Pembelajaran Mesin langsung untuk siswa adalah mengerjakan Prediktor Harga Saham. Organisasi bisnis dan perusahaan saat ini sedang mencari perangkat lunak yang dapat memantau dan menganalisis kinerja perusahaan dan memprediksi harga berbagai saham di masa depan. Dan dengan begitu banyak data yang tersedia di pasar saham, ini adalah sarang peluang bagi para ilmuwan data dengan kecenderungan untuk keuangan.

stok ide proyek pembelajaran mesin

Namun, sebelum Anda memulai, Anda harus memiliki cukup banyak pengetahuan di bidang-bidang berikut:

  • Analisis Prediktif: Memanfaatkan berbagai teknik AI untuk berbagai proses data seperti penambangan data, eksplorasi data, dll. untuk 'memprediksi' perilaku hasil yang mungkin.
  • Analisis Regresi: Analisis regresif adalah sejenis teknik prediksi yang didasarkan pada interaksi antara variabel dependen (target) dan variabel independen (prediktor).
  • Analisis Tindakan: Dalam metode ini, semua tindakan yang dilakukan oleh dua teknik yang disebutkan di atas dianalisis setelah hasilnya dimasukkan ke dalam memori pembelajaran mesin.
  • Pemodelan Statistik: Ini melibatkan membangun deskripsi matematis dari proses dunia nyata dan mengelaborasi ketidakpastian, jika ada, dalam proses itu.
Apa itu Pembelajaran Mesin dan Mengapa itu penting

2. Prediktor Olahraga

Dalam Moneyball Michael Lewis , tim Atletik Oakland mengubah wajah bisbol dengan memasukkan teknik analisis pemain kepramukaan dalam rencana permainan mereka. Dan seperti mereka, Anda juga dapat merevolusi olahraga di dunia nyata! Ini adalah proyek pembelajaran mesin yang sangat baik untuk pemula.

Karena tidak ada kelangkaan data di dunia olahraga, Anda dapat memanfaatkan data ini untuk membangun proyek pembelajaran mesin yang menyenangkan dan kreatif seperti menggunakan statistik olahraga perguruan tinggi untuk memprediksi pemain mana yang akan memiliki karir terbaik di olahraga tertentu (pencarian bakat). Anda juga dapat memilih untuk meningkatkan manajemen tim dengan menganalisis kekuatan dan kelemahan para pemain dalam sebuah tim dan mengklasifikasikannya sesuai dengan itu.

Dengan jumlah statistik olahraga dan data yang tersedia, ini adalah arena yang sangat baik untuk mengasah keterampilan eksplorasi dan visualisasi data Anda. Bagi siapa pun yang memiliki bakat dalam Python, Scikit-Learn akan menjadi pilihan ideal karena mencakup serangkaian alat yang berguna untuk analisis regresi, klasifikasi, penyerapan data, dan sebagainya. Menyebutkan proyek Pembelajaran Mesin untuk tahun terakhir dapat membantu resume Anda terlihat jauh lebih menarik daripada yang lain.

6 Kali Kecerdasan Buatan Mengejutkan Dunia

3. Kembangkan Penganalisis Sentimen

Ini adalah salah satu ide proyek pembelajaran mesin yang menarik. Meskipun sebagian besar dari kita menggunakan platform media sosial untuk menyampaikan perasaan dan pendapat pribadi kita kepada dunia untuk dilihat, salah satu tantangan terbesar terletak pada pemahaman 'sentimen' di balik posting media sosial.

ide proyek pembelajaran mesin - analisis sentimen

Dan ini adalah ide yang sempurna untuk proyek pembelajaran mesin Anda berikutnya!

Media sosial berkembang pesat dengan banyak konten buatan pengguna. Dengan membuat sistem ML yang dapat menganalisis sentimen di balik teks, atau postingan, akan jauh lebih mudah bagi organisasi untuk memahami perilaku konsumen. Hal ini, pada gilirannya, akan memungkinkan mereka untuk meningkatkan layanan pelanggan mereka, sehingga memberikan ruang lingkup untuk kepuasan konsumen yang optimal.

Anda dapat mencoba menambang data dari Twitter atau Reddit untuk memulai proyek pembelajaran mesin analisis sentimen Anda. Ini mungkin salah satu kasus langka dari proyek pembelajaran mendalam yang dapat membantu Anda dalam aspek lain juga.

4. Tingkatkan Perawatan Kesehatan

Aplikasi AI dan ML telah mulai merambah industri perawatan kesehatan dan juga dengan cepat mengubah wajah perawatan kesehatan global. Produk perawatan kesehatan, pemantauan jarak jauh, telemedicine, operasi robotik, dll., semuanya dimungkinkan karena algoritme pembelajaran mesin yang didukung oleh AI. Mereka tidak hanya membantu HCP (Penyedia Perawatan Kesehatan) untuk memberikan layanan kesehatan yang cepat dan lebih baik, tetapi juga mengurangi ketergantungan dan beban kerja dokter secara signifikan.

ide proyek pembelajaran mesin kesehatan

Jadi, mengapa tidak menggunakan keahlian Anda untuk mengembangkan proyek pembelajaran mesin yang mengesankan berdasarkan perawatan kesehatan? Menangani proyek dengan algoritme Pembelajaran Mesin untuk pemula dapat membantu membangun karier Anda dengan awal yang baik.

Industri kesehatan memiliki sejumlah besar data yang mereka miliki. Dengan memanfaatkan data ini, Anda dapat membuat:

  • Sistem perawatan diagnostik yang dapat secara otomatis memindai gambar, sinar-X, dll., dan memberikan diagnosis yang akurat tentang kemungkinan penyakit.
  • Aplikasi perawatan preventif yang dapat memprediksi kemungkinan epidemi seperti flu, malaria, dll, baik di tingkat nasional maupun komunitas.
6 Teknik Pembelajaran Mesin Ini Meningkatkan Layanan Kesehatan

5. Siapkan Algoritma ML – Dari Awal!

Ini adalah salah satu ide proyek pembelajaran mesin yang sangat baik untuk pemula. Menulis algoritme ML dari awal akan menawarkan manfaat dua kali lipat:

  • Satu, menulis algoritme ML adalah cara terbaik untuk memahami seluk beluk mekanismenya.
  • Dua, Anda akan belajar bagaimana mengubah instruksi matematika menjadi kode fungsional. Keterampilan ini akan berguna dalam karir masa depan Anda di Machine Learning.

Anda bisa memulainya dengan memilih algoritma yang lugas dan tidak terlalu rumit. Di balik pembuatan setiap algoritma – bahkan yang paling sederhana sekalipun – ada beberapa keputusan yang diperhitungkan dengan cermat. Setelah Anda mencapai tingkat penguasaan tertentu dalam membangun algoritme ML sederhana, cobalah untuk mengubah dan memperluas fungsinya. Misalnya, Anda dapat mengambil algoritme regresi logistik vanilla dan menambahkan parameter regularisasi ke dalamnya untuk mengubahnya menjadi algoritme regresi laso/ridge. Menyebutkan proyek pembelajaran mesin dapat membantu resume Anda terlihat jauh lebih menarik daripada yang lain.

6. Kembangkan Neural Network yang Dapat Membaca Tulisan Tangan

ide proyek pembelajaran mesin jaringan saraf

Salah satu ide terbaik untuk mulai bereksperimen dengan proyek Java untuk siswa adalah mengerjakan jaringan saraf. Pembelajaran mendalam dan jaringan saraf adalah dua kata kunci yang terjadi di AI. Ini telah memberi kita keajaiban teknologi seperti mobil tanpa pengemudi, pengenalan gambar, dan sebagainya.
Jadi, sekaranglah waktunya untuk menjelajahi arena jaringan saraf. Mulailah proyek pembelajaran mesin jaringan saraf Anda dengan Tantangan Klasifikasi Digit Tulisan Tangan MNIST. Ini memiliki antarmuka yang sangat ramah pengguna yang ideal untuk pemula.

Insinyur Pembelajaran Mesin: Mitos vs. Realitas

7. Sistem Harga Tiket Film

Dengan perluasan platform OTT seperti Netflix, Amazon Prime, orang lebih suka menonton konten sesuai kenyamanan mereka. Faktor-faktor seperti Harga, Kualitas Konten & Pemasaran telah memengaruhi keberhasilan platform ini.

Biaya pembuatan film full-length telah melonjak secara eksponensial di masa lalu. Hanya 10% dari film yang dibuat menghasilkan keuntungan. Persaingan ketat dari platform Televisi & OTT bersama dengan biaya tiket yang tinggi membuat film semakin sulit menghasilkan uang. Meningkatnya biaya tiket teater (bersama dengan biaya popcorn) membuat ruang bioskop kosong.

Sistem penetapan harga tiket yang canggih pasti dapat membantu pembuat film dan pemirsa. Harga tiket bisa lebih tinggi dengan meningkatnya permintaan tiket dan sebaliknya. Semakin awal penonton memesan tiket, semakin rendah biayanya, untuk film dengan permintaan tinggi. Sistem harus menghitung harga dengan cerdas tergantung pada minat pemirsa, sinyal sosial, dan faktor permintaan-penawaran.

8. Proyek ML Klasifikasi Bunga Iris

Salah satu ide terbaik untuk mulai bereksperimen dengan proyek Pembelajaran Mesin langsung untuk siswa adalah mengerjakan proyek ML klasifikasi Bunga Iris. Dataset bunga iris adalah salah satu dataset terbaik untuk tugas klasifikasi. Karena bunga iris memiliki spesies yang bervariasi, mereka dapat dibedakan berdasarkan panjang sepal dan kelopak. Proyek ML ini bertujuan untuk mengklasifikasikan bunga ke dalam tiga spesies – Virginica, Setosa, atau Versicolor.

Proyek ML khusus ini biasanya disebut sebagai “Hello World” dari Machine Learning. Dataset bunga iris berisi atribut numerik, dan sangat cocok bagi pemula untuk mempelajari tentang algoritme ML yang diawasi, terutama cara memuat dan menangani data. Juga, karena ini adalah kumpulan data kecil, ia dapat dengan mudah masuk ke dalam memori tanpa memerlukan transformasi khusus atau kemampuan penskalaan. Dan ini adalah ide yang sempurna untuk proyek pembelajaran mesin Anda berikutnya!

Anda dapat mengunduh kumpulan data iris di sini .

9. Proyek ML Prediksi Penjualan BigMart

Ini adalah ide proyek ML yang bagus untuk pemula. Proyek ML ini adalah yang terbaik untuk mempelajari cara kerja algoritme ML tanpa pengawasan. Dataset penjualan BigMart terdiri dari data penjualan 2013 tepatnya untuk 1559 produk di sepuluh outlet di berbagai kota.

Tujuannya di sini adalah untuk menggunakan dataset penjualan BigMart untuk mengembangkan model regresi yang dapat memprediksi penjualan masing-masing dari 1559 produk di tahun mendatang di sepuluh gerai BigMart yang berbeda. Kumpulan data penjualan BigMart berisi atribut khusus untuk setiap produk dan outlet, sehingga membantu Anda memahami properti dari berbagai produk dan toko yang memengaruhi keseluruhan penjualan BigMart sebagai sebuah merek.

10. Mesin Rekomendasi dengan Dataset MovieLens

Mesin rekomendasi telah menjadi sangat populer di situs belanja dan streaming online. Misalnya, platform streaming konten online seperti Netflix dan Hulu memiliki mesin rekomendasi untuk menyesuaikan konten mereka sesuai dengan preferensi pelanggan individu dan riwayat penelusuran. Dengan menyesuaikan konten untuk memenuhi kebutuhan menonton dan preferensi pelanggan yang berbeda, situs-situs ini telah mampu meningkatkan permintaan akan layanan streaming mereka.

Sebagai pemula, Anda dapat mencoba membangun sistem rekomendasi menggunakan salah satu kumpulan data paling populer yang tersedia di web – kumpulan data MovieLens. Kumpulan data ini mencakup lebih dari "25 juta peringkat dan satu juta aplikasi tag yang diterapkan ke 62.000 film oleh 162.000 pengguna." Anda dapat memulai proyek ini dengan membangun visualisasi cloud dunia dari judul film untuk membuat mesin rekomendasi film untuk MovieLens.

Anda dapat melihat kumpulan data MovieLens di sini .

11. Memprediksi Kualitas Anggur menggunakan Dataset Kualitas Anggur

Ini adalah fakta yang mapan bahwa usia membuat anggur lebih baik - semakin tua anggur, semakin baik rasanya. Namun, usia bukanlah satu-satunya hal yang menentukan rasa anggur. Banyak faktor yang menentukan sertifikasi kualitas anggur, termasuk tes fisiokimia seperti kuantitas alkohol, keasaman tetap, keasaman yang mudah menguap, kepadatan, dan tingkat pH, untuk beberapa nama.

Dalam proyek ML ini, Anda perlu mengembangkan model ML yang dapat mengeksplorasi sifat kimia anggur untuk memprediksi kualitasnya. Kumpulan data kualitas anggur yang akan Anda gunakan untuk proyek ini terdiri dari sekitar 4898 pengamatan, termasuk 11 variabel bebas dan satu variabel terikat. Menyebutkan proyek Pembelajaran Mesin untuk tahun terakhir dapat membantu resume Anda terlihat jauh lebih menarik daripada yang lain.

12. Klasifikasi Digit Tulisan Tangan MNIST

Ini adalah salah satu proyek pembelajaran mesin yang menarik. Deep Learning dan jaringan saraf telah menemukan kasus penggunaan di banyak aplikasi dunia nyata seperti pengenalan gambar, pembuatan teks otomatis, mobil tanpa pengemudi, dan banyak lagi. Namun, sebelum Anda mempelajari area Deep Learning yang kompleks ini, Anda harus mulai dengan kumpulan data sederhana seperti kumpulan data MNIST. Jadi, mengapa tidak menggunakan keahlian Anda untuk mengembangkan proyek pembelajaran mesin yang mengesankan berdasarkan MNIST?

Proyek klasifikasi digit MNIST dirancang untuk melatih mesin mengenali digit tulisan tangan. Karena pemula biasanya merasa kesulitan untuk bekerja dengan data gambar di atas data relasional datar, dataset MNIST adalah yang terbaik untuk pemula. Dalam proyek ini, Anda akan menggunakan set data MNIST untuk melatih model ML Anda menggunakan Convolutional Neural Networks (CNNs). Meskipun dataset MNIST dapat dengan mulus masuk ke memori PC Anda (sangat kecil), tugas pengenalan digit tulisan tangan cukup menantang.

Anda dapat mengakses kumpulan data MNIST di sini .

13. Pengenalan Aktivitas Manusia menggunakan Dataset Smartphone

Ini adalah salah satu ide proyek pembelajaran mesin yang sedang tren. Dataset ponsel cerdas mencakup catatan aktivitas kebugaran dan informasi 30 orang. Data ini ditangkap melalui smartphone yang dilengkapi dengan sensor inersia.

Proyek ML ini bertujuan untuk membangun model klasifikasi yang dapat mengidentifikasi aktivitas kebugaran manusia dengan tingkat akurasi yang tinggi. Dengan mengerjakan proyek ML ini, Anda akan mempelajari dasar-dasar klasifikasi dan juga cara menyelesaikan masalah multiklasifikasi.

14. Deteksi Objek dengan Deep Learning

Ini adalah salah satu proyek pembelajaran mesin yang menarik untuk dibuat. Dalam hal klasifikasi gambar, Deep Neural Networks (DNN) harus menjadi pilihan utama Anda. Meskipun DNN sudah digunakan di banyak aplikasi klasifikasi gambar dunia nyata, proyek ML ini bertujuan untuk meningkatkannya.

Dalam proyek ML ini, Anda akan memecahkan masalah deteksi objek dengan memanfaatkan DNN. Anda harus mengembangkan model yang dapat mengklasifikasikan objek dan juga secara akurat melokalisasi objek dari kelas yang berbeda. Di sini, Anda akan memperlakukan tugas pendeteksian objek sebagai masalah regresi untuk topeng kotak pembatas objek. Juga, Anda akan menentukan prosedur inferensi multi-skala yang dapat menghasilkan deteksi objek resolusi tinggi dengan biaya minimal.

15. Deteksi Berita Palsu

Ini adalah salah satu ide proyek pembelajaran mesin yang sangat baik untuk pemula, terutama bagaimana berita palsu menyebar seperti api sekarang. Berita palsu memiliki kemampuan untuk menyebar seperti api. Dan dengan media sosial yang mendominasi kehidupan kita saat ini, semakin penting untuk membedakan berita palsu dari peristiwa berita nyata. Di sinilah Pembelajaran Mesin dapat membantu. Facebook sudah menggunakan AI untuk memfilter cerita palsu dan berisi spam dari umpan pengguna.

Proyek ML ini bertujuan untuk memanfaatkan teknik NLP (Natural Language Processing) untuk mendeteksi berita palsu dan cerita menyesatkan yang muncul dari sumber yang tidak memiliki reputasi baik. Anda juga dapat menggunakan pendekatan klasifikasi teks klasik untuk merancang model yang dapat membedakan antara berita asli dan palsu. Dalam metode terakhir, Anda dapat mengumpulkan kumpulan data untuk berita asli dan palsu dan membuat model ML menggunakan pengklasifikasi Naive Bayes untuk mengklasifikasikan sebuah berita sebagai berita palsu atau nyata berdasarkan kata dan frasa yang digunakan di dalamnya.

16. Daftar Proyek Email

Dataset email Enron berisi hampir 500 ribu email dari lebih dari 150 pengguna. Ini adalah kumpulan data yang sangat berharga untuk pemrosesan bahasa alami. Proyek ini melibatkan pembuatan model ML yang menggunakan algoritme pengelompokan k-means untuk mendeteksi tindakan penipuan. Model akan memisahkan pengamatan menjadi 'k' jumlah cluster sesuai dengan pola yang sama dalam dataset.

17. Proyek Parkinson

Dataset Parkinson mencakup 195 catatan biomedis orang dengan 23 karakteristik yang bervariasi. Ide di balik proyek ini adalah merancang model ML yang dapat membedakan antara orang sehat dan mereka yang menderita penyakit Parkinson. Model menggunakan algoritma XGboost (extreme gradient boosting) berdasarkan pohon keputusan untuk membuat pemisahan.

18. Proyek Flickr 30K

Dataset Flickr 30K terdiri dari lebih dari 30.000 gambar, masing-masing memiliki keterangan yang unik. Anda akan menggunakan kumpulan data ini untuk membuat generator teks gambar. Idenya adalah untuk membangun model CNN yang dapat secara efektif menganalisis dan mengekstrak fitur dari sebuah gambar dan membuat keterangan yang sesuai untuk menggambarkan gambar dalam bahasa Inggris.

19. Proyek pelanggan mal

Seperti namanya, dataset pelanggan mal mencakup catatan orang yang mengunjungi mal, seperti jenis kelamin, usia, ID pelanggan, pendapatan tahunan, skor pengeluaran, dll. Anda akan membuat model yang akan menggunakan data ini untuk mengelompokkan pelanggan ke dalam kelompok yang berbeda berdasarkan pola perilaku mereka. Segmentasi pelanggan seperti itu adalah taktik pemasaran yang sangat berguna yang digunakan oleh merek dan pemasar untuk meningkatkan penjualan dan pendapatan sekaligus meningkatkan kepuasan pelanggan.

20. Proyek kinetika

Untuk proyek ini, Anda akan menggunakan kumpulan data ekstensif yang mencakup tiga kumpulan data terpisah – Kinetics 400, Kinetics 600, dan Kinetics 700 – yang berisi tautan URL lebih dari 6,5 juta video berkualitas tinggi. Tujuan Anda adalah membuat model yang dapat mendeteksi dan mengidentifikasi tindakan manusia dengan mempelajari serangkaian pengamatan yang berbeda.

21. Proyek sistem rekomendasi

Ini kumpulan dataset kaya yang berisi beragam kumpulan data yang dikumpulkan dari situs web populer seperti ulasan buku Goodreads, ulasan produk Amazon, media sosial, dll. Tujuan Anda adalah membangun mesin rekomendasi (seperti yang digunakan oleh Amazon dan Netflix) yang dapat menghasilkan rekomendasi yang dipersonalisasi untuk produk, film, musik, dll., berdasarkan preferensi, kebutuhan, dan perilaku online pelanggan.

22. Proyek perumahan Boston

Kumpulan data perumahan Boston terdiri dari rincian berbagai rumah di Boston berdasarkan faktor-faktor seperti tarif pajak, tingkat kejahatan, jumlah kamar di sebuah rumah, dll. Ini adalah kumpulan data yang sangat baik untuk memprediksi harga berbagai rumah di Boston. Dalam proyek ini, Anda akan membangun model yang dapat memprediksi harga rumah baru menggunakan regresi linier. Regresi linier paling cocok untuk proyek ini karena digunakan di mana data memiliki hubungan linier antara nilai input dan output dan ketika input tidak diketahui.

23. Proyek Cityscapes

Kumpulan data sumber terbuka ini mencakup anotasi tingkat piksel berkualitas tinggi dari urutan video yang dikumpulkan dari jalan-jalan di 50 kota berbeda. Ini sangat berguna untuk analisis semantik. Anda dapat menggunakan kumpulan data ini untuk melatih jaring saraf dalam untuk menganalisis dan memahami lanskap kota perkotaan. Proyek ini melibatkan perancangan model yang dapat melakukan segmentasi gambar dan mengidentifikasi berbagai objek (mobil, bus, truk, pohon, jalan, orang, dll.) dari urutan video jalanan.

24. Proyek YouTube 8M

Youtube 8M adalah kumpulan data besar yang memiliki 6,1 juta ID video YouTube, 350.000 jam video, 2,6 miliar fitur audio/visual, 3862 kelas, dan rata-rata 3 label untuk setiap video. Ini banyak digunakan untuk proyek klasifikasi video. Dalam proyek ini, Anda akan membangun sistem klasifikasi video yang dapat mendeskripsikan video secara akurat. Ini akan mempertimbangkan serangkaian masukan yang berbeda dan mengklasifikasikan video ke dalam kategori terpisah.

25. Suara perkotaan 8K

Dataset 8K suara perkotaan digunakan untuk klasifikasi suara. Ini mencakup koleksi beragam 8732 suara perkotaan milik kelas yang berbeda seperti sirene, musik jalanan, gonggongan anjing, kicau burung, orang berbicara, dll. Anda akan merancang model klasifikasi suara yang dapat secara otomatis mendeteksi suara perkotaan mana yang diputar di

26. Proyek Wiki-IMDB

Kumpulan data berlabel ini mungkin adalah salah satu koleksi gambar wajah paling luas yang dikumpulkan dari seluruh IMDB dan Wikipedia. Ini memiliki lebih dari 5 juta gambar wajah berlabel usia dan jenis kelamin. dengan label jenis kelamin dan usia. Anda akan membuat model yang dapat mendeteksi wajah dan memprediksi usia dan jenis kelamin mereka dengan akurat. Anda dapat membuat segmen/rentang usia yang berbeda seperti 0-10, 10-20, 30-40, dan seterusnya.

27. Proyek Librispeech

Kumpulan data librispeech adalah kumpulan besar pidato bahasa Inggris yang berasal dari proyek LibriVox. Ini berisi pidato yang dibaca dalam bahasa Inggris dalam berbagai aksen yang berlangsung lebih dari 1000 jam dan merupakan alat yang sempurna untuk pengenalan suara. Fokus dari proyek ini adalah membuat model yang dapat menerjemahkan audio menjadi teks secara otomatis. Anda akan membangun sistem pengenalan suara yang dapat mendeteksi ucapan bahasa Inggris dan menerjemahkannya ke dalam format teks.

28. Proyek benchmark pengenalan rambu lalu lintas Jerman (GTSRB)

Dataset ini berisi lebih dari 50.000 gambar rambu lalu lintas yang tersegmentasi ke dalam 43 kelas dan berisi informasi tentang kotak pembatas setiap rambu lalu lintas. Ini sangat ideal untuk klasifikasi multikelas yang akan Anda fokuskan di sini. Anda akan membangun model menggunakan kerangka pembelajaran mendalam yang dapat mengenali kotak pembatas rambu dan mengklasifikasikan rambu lalu lintas. Proyek ini bisa sangat berguna untuk kendaraan otonom karena mendeteksi tanda dan membantu pengemudi mengambil tindakan yang diperlukan.

29. Peringkasan teks video pertandingan olahraga

Proyek ini persis seperti yang terdengar – memperoleh ringkasan yang akurat dan ringkas dari video olahraga. Ini adalah alat yang berguna untuk situs web olahraga yang memberi tahu pembaca tentang sorotan pertandingan. Karena jaringan saraf adalah yang terbaik untuk peringkasan teks, Anda akan membangun model ini menggunakan jaringan pembelajaran mendalam seperti 3D-CNN, RNN, dan LSTM . Pertama-tama Anda akan memecah video olahraga menjadi beberapa bagian dengan menggunakan algoritme ML yang sesuai, lalu menggunakan kombinasi SVM (Support vector machine), jaringan saraf, dan algoritme k-means.

30. Pembuat ringkasan pertemuan bisnis

Peringkasan melibatkan penggalian informasi yang paling bermakna dan berharga dari percakapan, file audio/video, dll., secara singkat dan padat. Biasanya dilakukan dengan feature yang menangkap ciri-ciri statistik, linguistik, dan sentimental dengan struktur dialog percakapan yang bersangkutan. Dalam proyek ini, Anda akan menggunakan pembelajaran mendalam dan teknik pemrosesan bahasa alami untuk membuat ringkasan rapat bisnis yang tepat sambil mempertahankan konteks seluruh percakapan.

31. Analisis sentimen untuk depresi

Depresi adalah masalah kesehatan utama secara global. Setiap tahun, jutaan orang melakukan bunuh diri karena depresi dan kesehatan mental yang buruk. Biasanya, stigma yang melekat pada masalah kesehatan mental dan pengobatan yang tertunda adalah dua penyebab utama di balik ini. Dalam proyek ini, Anda akan memanfaatkan data yang dikumpulkan dari berbagai platform media sosial dan menganalisis penanda linguistik di postingan media sosial untuk memahami kesehatan mental individu. Idenya adalah untuk menciptakan model pembelajaran mendalam yang dapat menawarkan wawasan berharga dan akurat tentang kesehatan mental seseorang jauh lebih awal daripada metode konvensional.

32. Pemecah persamaan tulisan tangan

Pengenalan ekspresi matematika tulisan tangan adalah bidang studi penting dalam penelitian visi komputer. Anda akan membangun model dan melatihnya untuk menyelesaikan persamaan matematika tulisan tangan menggunakan Jaringan Saraf Konvolusi. Model juga akan menggunakan teknik pemrosesan gambar. Proyek ini melibatkan pelatihan model dengan data yang tepat untuk membuatnya mahir membaca angka tulisan tangan, simbol, dll., untuk memberikan hasil yang benar untuk persamaan matematika dari tingkat kompleksitas yang berbeda.

33. Pengenalan wajah untuk mendeteksi suasana hati dan merekomendasikan lagu

Ini adalah fakta yang diketahui bahwa orang mendengarkan musik berdasarkan suasana hati dan perasaan mereka saat ini. Jadi, mengapa tidak membuat aplikasi yang dapat mendeteksi suasana hati seseorang melalui ekspresi wajah mereka dan merekomendasikan lagu yang sesuai? Untuk ini, Anda akan menggunakan elemen dan teknik visi komputer. Tujuannya adalah untuk membuat model yang dapat secara efektif memanfaatkan visi komputer untuk membantu komputer mendapatkan pemahaman tingkat tinggi tentang gambar dan video.

34. Generator musik

Sebuah komposisi musik tidak lain adalah kombinasi merdu dari tingkat frekuensi yang berbeda. Dalam proyek ini, Anda akan merancang generator musik otomatis yang dapat membuat musik pendek dengan sedikit campur tangan manusia. Anda akan menggunakan algoritme pembelajaran mendalam dan jaringan LTSM untuk membangun generator musik ini.

35. Sistem prediksi penyakit

Proyek ML ini dirancang untuk memprediksi penyakit. Anda akan membuat model ini menggunakan R dan R Studio dan Dataset Kanker Payudara Wisconsin (Diagnostik) . Dataset ini mencakup dua kelas prediktor – massa payudara jinak dan ganas. Sangat penting untuk memiliki pengetahuan dasar tentang hutan acak dan XGBoost untuk mengerjakan proyek ini.

36. Menemukan exo-planet yang layak huni

Dalam dekade terakhir, kami telah berhasil mengidentifikasi banyak transit dan planet ekstrasurya. Karena interpretasi manual dari exoplanet potensial cukup menantang dan memakan waktu (jangan lupa, itu juga tunduk pada kesalahan manusia), yang terbaik adalah menggunakan pembelajaran mendalam untuk mengidentifikasi exoplanet. Proyek ini bertujuan untuk mengetahui apakah ada planet ekstrasurya yang dapat dihuni di sekitar kita menggunakan CNN dan data deret waktu yang bising. Metode ini dapat mengidentifikasi exoplanet yang layak huni dengan lebih presisi daripada metode kuadrat terkecil.

37. Regenerasi gambar untuk gulungan lama & rusak

Memulihkan gulungan gambar lama atau rusak adalah tugas yang menantang. Hampir selalu tidak mungkin untuk mengembalikan foto lama ke keadaan semula. Namun, pembelajaran yang mendalam dapat memecahkan masalah ini. Anda akan membangun model pembelajaran mendalam yang dapat mengidentifikasi cacat pada gambar (goresan, lubang, lipatan, penghilangan warna, dll.) dan menggunakan algoritme Inpainting untuk memulihkannya. Anda bahkan dapat mewarnai gambar B&W lama.

Proyek industri dunia nyata

Magenta

Proyek penelitian ini berfokus pada eksplorasi aplikasi pembelajaran mesin dalam proses penciptaan seni dan musik. Anda akan mengembangkan pembelajaran penguatan unik dan algoritme pembelajaran mendalam yang dapat menghasilkan gambar, lagu, musik, dan banyak lagi. Ini adalah proyek yang sempurna untuk pikiran kreatif yang bergairah tentang seni dan musik.

BlueEx

BlueEx adalah salah satu perusahaan logistik terkemuka di India yang telah mengembangkan cukup banyak penggemar, berkat pengirimannya yang tepat waktu dan efisien. Namun, seperti halnya semua penyedia logistik, BluEx menghadapi satu tantangan khusus yang menghabiskan waktu dan uang – pengemudinya tidak sering melewati jalur pengiriman yang optimal yang menyebabkan penundaan dan menyebabkan biaya bahan bakar yang lebih tinggi. Anda akan membuat model ML menggunakan pembelajaran penguatan yang dapat menemukan jalur paling efisien untuk lokasi pengiriman tertentu. Ini dapat menghemat hingga 15% dari biaya bahan bakar untuk BlueEx.

Studio Gerak

Motion Studios membanggakan diri sebagai rumah produksi Radio terbesar di Eropa dengan pendapatan melebihi satu miliar dolar. Sejak perusahaan media meluncurkan reality show mereka, RJ Star, mereka telah menerima respons yang fenomenal dan dibanjiri dengan klip suara. Menjadi reality show, ada jendela waktu yang terbatas untuk memilih kandidat. Anda akan membuat model yang dapat membedakan antara suara pria dan wanita dan mengklasifikasikan klip suara untuk memfasilitasi penyaringan yang lebih cepat. Ini akan membantu seleksi lebih cepat, meringankan tugas eksekutif pertunjukan.

LithionPower

Lithionpower membuat baterai untuk kendaraan listrik. Biasanya, pengemudi menyewa baterai perusahaan selama sehari dan menggantinya dengan baterai yang terisi. Masa pakai baterai tergantung pada faktor-faktor seperti jarak tempuh/hari, kecepatan berlebih, dll. LithionPower menggunakan model penetapan harga variabel berdasarkan riwayat mengemudi pengemudi. Tujuan dari proyek ini adalah untuk membangun model cluster yang akan mengelompokkan pengemudi berdasarkan riwayat mengemudi mereka dan memberi insentif kepada pengemudi berdasarkan cluster tersebut. Meskipun ini akan meningkatkan keuntungan sebesar 15-20%, itu juga akan mengenakan biaya lebih banyak dari pengemudi yang memiliki riwayat mengemudi yang buruk.

Kesimpulan

Berikut adalah daftar lengkap ide proyek pembelajaran mesin . Pembelajaran mesin masih dalam tahap awal di seluruh dunia. Ada banyak proyek yang harus diselesaikan, dan banyak yang harus diperbaiki. Dengan pikiran yang cerdas dan ide yang tajam, sistem dengan dukungan bisnis menjadi lebih baik, lebih cepat dan menguntungkan. Jika Anda ingin unggul dalam Pembelajaran Mesin, Anda harus mengumpulkan pengalaman langsung dengan proyek pembelajaran mesin tersebut.

Anda juga dapat memeriksa Program PG Eksekutif kami di Pembelajaran Mesin & AI dari IIT Delhi . IIT Delhi adalah salah satu institusi paling bergengsi di India. Dengan lebih dari 500+ anggota fakultas In-house yang terbaik dalam mata pelajaran.

Hanya dengan bekerja dengan alat ML dan algoritme ML, Anda dapat memahami cara kerja infrastruktur ML di dunia nyata. Sekarang lanjutkan dan uji semua pengetahuan yang telah Anda kumpulkan melalui panduan ide proyek pembelajaran mesin kami untuk membangun proyek pembelajaran mesin Anda sendiri!

Seberapa mudah untuk mengimplementasikan proyek-proyek ini?

Proyek-proyek ini sangat mendasar, seseorang dengan pengetahuan yang baik tentang Pembelajaran Mesin dapat dengan mudah mengatur untuk memilih dan menyelesaikan salah satu proyek ini.

Bisakah saya melakukan proyek ini di ML Internship?

Ya, seperti yang disebutkan, ide proyek ini pada dasarnya untuk Siswa atau Pemula. Ada kemungkinan besar Anda dapat mengerjakan salah satu dari ide proyek ini selama magang.

Mengapa kita perlu membangun proyek pembelajaran mesin?

Ketika berbicara tentang karir dalam pengembangan perangkat lunak, adalah suatu keharusan bagi calon pengembang untuk mengerjakan proyek mereka sendiri. Mengembangkan proyek dunia nyata adalah cara terbaik untuk mengasah keterampilan Anda dan mewujudkan pengetahuan teoretis Anda menjadi pengalaman praktis.