Apa itu Pembelajaran Mesin yang Diawasi? Algoritma, Contoh
Diterbitkan: 2021-06-22Pembelajaran mesin ada di mana-mana – mulai dari lembaga pemerintah, layanan ritel, dan lembaga keuangan hingga sektor kesehatan, hiburan, dan transportasi. Ini terkait erat dengan kehidupan kita sehari-hari, baik itu Netflix atau Amazon yang memberikan rekomendasi online atau pembukaan kunci ponsel cerdas Anda dengan teknologi deteksi wajah, pembelajaran mesin, dan kecerdasan buatan telah mendapatkan momentum yang belum pernah ada sebelumnya.
Dengan pembelajaran mesin menjadi salah satu tren teknologi paling populer sekarang, menjadi penting untuk mengetahui tentang salah satu pendekatan utama untuk menciptakan kecerdasan buatan – pembelajaran mesin yang diawasi.
Daftar isi
Apa itu Pembelajaran Mesin yang Diawasi?
Pembelajaran mesin yang diawasi adalah jenis pembelajaran mesin di mana algoritma komputer dilatih menggunakan data input berlabel dan komputer, pada gilirannya, memprediksi output untuk data yang tidak terduga. Di sini, "diberi label" berarti bahwa beberapa data sudah akan ditandai dengan jawaban yang benar untuk membantu mesin belajar. Dalam pembelajaran terawasi, data masukan yang diumpankan ke komputer bekerja seperti supervisor atau guru untuk melatih mesin agar menghasilkan hasil yang akurat dengan mendeteksi pola dan korelasi yang mendasari antara data masukan dan label keluaran.
Jenis-Jenis Algoritma Pembelajaran Terawasi
Ada berbagai jenis algoritma pembelajaran yang diawasi untuk mencapai hasil tertentu. Mari kita lihat beberapa jenis yang paling umum.
1. Klasifikasi
Algoritma klasifikasi menggunakan data pelatihan berlabel untuk mengurutkan input ke dalam sejumlah kelas atau kategori tertentu. Di sini, variabel keluaran adalah kategori seperti 'Ya' atau 'Tidak' dan 'Benar' atau 'Salah.' Mengkategorikan laporan medis ke dalam positif (penyakit) atau negatif (tidak ada penyakit), atau mengklasifikasikan film ke dalam genre yang berbeda adalah beberapa contoh di mana algoritma klasifikasi dapat diterapkan.
2. Regresi
Model regresi digunakan ketika ada hubungan numerik antara variabel input dan output. Algoritma regresi yang termasuk dalam lingkup pembelajaran terawasi meliputi regresi linier, regresi non-linier, pohon regresi, regresi polinomial, dan regresi linier Bayesian. Model semacam itu terutama digunakan untuk memprediksi variabel berkelanjutan seperti spekulasi tren pasar, prakiraan cuaca, atau penentuan sebelumnya rasio klik-tayang dalam iklan online pada waktu tertentu sepanjang hari.
Bergabunglah dengan Kursus Online Pembelajaran Mesin dari Universitas top dunia – Magister, Program Pascasarjana Eksekutif, dan Program Sertifikat Tingkat Lanjut di ML & AI untuk mempercepat karier Anda.
3. Jaringan Saraf
Algoritme jaringan saraf digunakan untuk menafsirkan data sensorik, mengenali pola, atau mengelompokkan input mentah. Meskipun algoritme ini memiliki beberapa keunggulan, penggunaan jaringan saraf dapat menjadi sangat menantang jika terlalu banyak pengamatan. Aplikasi kehidupan nyata yang populer dari jaringan saraf termasuk ekstraksi informasi, klasifikasi teks, pengenalan ucapan dan karakter, peringkasan multi-dokumen, pembuatan bahasa, dan banyak lagi.
4. Model Bayesian Naif
Naive Bayes Classifiers bukanlah algoritma tunggal tetapi kumpulan algoritma berdasarkan Teorema Bayes. Prinsip standar yang mendasari algoritma ini adalah bahwa setiap pasangan fitur yang diklasifikasikan adalah independen satu sama lain. Label kelas ditetapkan menggunakan grafik asiklik langsung yang terdiri dari beberapa simpul anak dan satu simpul induk. Setiap simpul anak dianggap terpisah dan independen dari induknya. Aplikasi kehidupan nyata yang populer dari algoritma Naive Bayesian termasuk pemfilteran spam dan analisis sentimen.
5. Pohon Keputusan
Pohon keputusan adalah model seperti diagram alur yang berisi pernyataan kontrol bersyarat untuk membandingkan keputusan dan kemungkinan konsekuensinya. Pohon keputusan memerlukan grafik seperti pohon di mana simpul internal mewakili titik di mana kita memilih atribut dan mengajukan pertanyaan, simpul daun mewakili label kelas atau keluaran aktual, dan ujungnya mewakili jawaban atas pertanyaan.
6. Mendukung Mesin Vektor
Support Vector Machine (SVM) didasarkan pada teori pembelajaran statistik yang diberikan oleh Vap Nick dan dikembangkan kembali pada tahun 1990. Dalam istilah yang paling sederhana, mesin vektor dukungan adalah seperangkat metode pembelajaran terawasi yang digunakan untuk regresi, klasifikasi, dan deteksi outlier. Mereka terkait erat dengan jaringan kernel dan menemukan aplikasi di berbagai bidang seperti pengenalan pola, bioinformatika, dan pengambilan informasi multimedia.
7. Model Hutan Acak
Model hutan acak terdiri dari ansambel pohon keputusan individu di mana setiap pohon individu memberikan prediksi kelas, dan kelas dengan suara maksimum adalah prediksi model. Gagasan di balik konsep model hutan acak adalah bahwa sejumlah besar pohon atau model yang relatif tidak berkorelasi yang beroperasi dalam ansambel akan menghasilkan prediksi yang lebih akurat daripada prediksi individu mana pun. Ini karena pohon melindungi satu sama lain dari kesalahan independen.
Bagaimana cara kerjanya?
Pembelajaran terawasi melibatkan model pelatihan menggunakan kumpulan data berlabel sehingga mereka dapat mempelajari setiap jenis data. Setelah pelatihan selesai, model diberikan data uji untuk mengidentifikasi dan memprediksi output.
Mari kita lihat contoh sederhana untuk memperjelas konsep lebih lanjut.
Katakanlah Anda diberi peti yang terdiri dari berbagai jenis sayuran. Dalam pendekatan pembelajaran mesin yang diawasi, langkah pertama Anda adalah memperkenalkan mesin dengan semua sayuran yang berbeda satu per satu dengan cara ini:
- Jika benda tersebut seperti bohlam dan berwarna merah muda keunguan, maka akan diberi label sebagai – Bawang.
- Jika objek berdaun dan berwarna hijau, maka akan diberi label sebagai – Bayam.
Setelah Anda melatih mesin, Anda memberikannya sayuran terpisah dari peti (misalnya, bawang) dan meminta untuk mengidentifikasinya. Sekarang, karena mesin telah mempelajari sayuran dari data sebelumnya, mesin akan mengklasifikasikan objek baru berdasarkan bentuk dan warnanya dan mengkonfirmasi hasilnya sebagai bawang. Dengan cara ini, mesin mempelajari atau melatih dari data pelatihan (peti berisi sayuran) dan menerapkan pengetahuan tersebut ke data baru yang tidak terduga (sayuran baru).
Seperti contoh sayuran yang kami gunakan di atas, mari kita lihat contoh pembelajaran terawasi lainnya untuk memahami cara kerjanya.
Misalkan kita memiliki dataset yang terdiri dari berbagai bentuk seperti segitiga, kotak, dan segi lima. Langkah pertama adalah melatih model untuk setiap gambar dengan cara berikut:
- Jika bentuknya memiliki tiga sisi, maka akan diberi label sebagai – Segitiga
- Jika bentuk tersebut memiliki empat sisi yang sama, maka akan diberi label sebagai – Persegi
- Jika bentuknya memiliki lima sisi, maka akan diberi label sebagai – Pentagon
Setelah pelatihan selesai, kami menguji model dengan menggunakan data uji, dan tugas model adalah mengidentifikasi bentuk berdasarkan pengetahuan pelatihan. Oleh karena itu, ketika model menemukan bentuk baru, ia mengklasifikasikannya berdasarkan jumlah sisi dan memberikan output.
Keuntungan dan Tantangan
Tak perlu dikatakan, pembelajaran terawasi memiliki beberapa keunggulan dalam menerapkan model pembelajaran mesin. Beberapa manfaatnya tercantum di bawah ini:
- Model pembelajaran yang diawasi dapat secara akurat memprediksi keluaran berdasarkan pengalaman sebelumnya.
- Pembelajaran yang diawasi membantu mengoptimalkan kinerja menggunakan pengalaman.
- Pembelajaran yang diawasi memberi kita ide yang jelas dan tepat tentang kelas objek.
- Last but not least, algoritma pembelajaran yang diawasi sangat penting untuk memecahkan berbagai masalah dunia nyata dan menemukan aplikasi di berbagai sektor.
Tidak diragukan lagi, algoritma pembelajaran yang diawasi sangat bermanfaat, terutama yang berkaitan dengan potensinya dalam mengatasi tantangan secara real-time. Namun, membangun model pembelajaran terawasi yang berkelanjutan dan efisien memiliki tantangan tersendiri. Jadi mari kita lihat:
- Seluruh proses pelatihan model pembelajaran yang diawasi adalah proses yang memakan waktu.
- Model pembelajaran supervisi seringkali membutuhkan tingkat keahlian dan sumber daya tertentu untuk menyusun dan berfungsi secara akurat.
- Berbeda dengan model pembelajaran tanpa pengawasan, model pembelajaran terawasi tidak dapat mengklasifikasikan atau mengelompokkan data sendiri.
- Kemungkinan kesalahan manusia merayap ke dalam kumpulan data cukup tinggi, yang dapat menyebabkan pelatihan algoritme salah.
Praktik Terbaik Dengan Contoh
Apa saja praktik terbaik yang harus Anda ingat sebelum memulai proyek menggunakan pembelajaran mesin yang diawasi? Lihatlah di bawah ini.
- Pastikan Anda mengetahui dengan jelas jenis data yang akan Anda gunakan sebagai set data pelatihan.
- Kumpulkan output yang sesuai baik dari pengukuran standar atau ahli manusia.
- Tentukan struktur algoritma pembelajaran.
Penting untuk akhirnya berbicara tentang beberapa contoh kehidupan nyata terbaik dan paling populer dari pembelajaran mesin yang diawasi.
- Analisis prediktif : Kasus penggunaan yang meluas dari penggunaan model pembelajaran terawasi untuk analisis prediktif memberikan wawasan yang bermakna dan dapat ditindaklanjuti ke berbagai titik data bisnis. Akibatnya, perusahaan bisnis dapat meramalkan hasil tertentu berdasarkan variabel output yang diberikan untuk membenarkan dan mendukung keputusan.
- Pengenalan objek dan gambar : Algoritme pembelajaran yang diawasi digunakan dalam menemukan dan mengklasifikasikan objek dalam gambar dan video – persyaratan yang sering digunakan dalam analisis gambar dan berbagai teknik penglihatan komputer.
- Deteksi spam : Teknik pendeteksian dan pemfilteran spam menggunakan algoritme klasifikasi yang diawasi untuk melatih basis data sehingga mereka dapat mengenali pola dalam data baru untuk pemisahan email spam dan non-spam yang efektif.
- Analisis sentimen : Cara yang bagus untuk meningkatkan upaya keterlibatan merek adalah dengan memahami interaksi pelanggan. Pembelajaran mesin yang diawasi dapat membantu dalam hal ini dengan mengekstraksi dan mengklasifikasikan informasi penting dari kumpulan data besar seperti emosi, niat, preferensi pelanggan, dll.
Pelajari Pembelajaran Mesin Dengan upGrad
Ingin menjadi besar di bidang Pembelajaran Mesin dan AI? Mulailah perjalanan Anda dengan Program PG Eksekutif upGrad dalam Pembelajaran Mesin & AI . Ini adalah kursus sertifikasi online komprehensif yang dirancang untuk para profesional yang ingin mempelajari keterampilan yang dibutuhkan seperti Pembelajaran Mendalam, Pembelajaran Penguatan, NLP, dan model grafis.
Berikut adalah beberapa sorotan kursus yang tidak boleh Anda lewatkan:
- Sertifikat penyelesaian kursus dari IIIT Bangalore.
- Lebih dari 450 jam pembelajaran dikemas dengan sesi langsung, tugas pengkodean, studi kasus, dan proyek.
- Cakupan yang komprehensif dari 20 alat, bahasa pemrograman, dan perpustakaan.
- Kelas Live Coding & Workshop Pembuatan Profil.
Kesimpulan
Laporan riset pasar terbaru oleh Technavio berjudul Machine Learning Market by End-user and Geography – Forecast and Analysis 2020-2024 memperkirakan bahwa ukuran pasar pembelajaran mesin global akan menyaksikan pertumbuhan sebesar US$ 11,16 miliar selama periode perkiraan 2020-2024. Terlebih lagi, peningkatan pertumbuhan yang stabil dari tahun ke tahun akan mendorong dorongan pertumbuhan pasar.
Baik tren saat ini maupun prediksi masa depan menunjukkan bahwa pembelajaran mesin akan tetap ada. Algoritme pembelajaran yang diawasi adalah dasar untuk setiap proyek pembelajaran mesin yang terutama melibatkan masalah klasifikasi dan regresi. Terlepas dari tantangannya, algoritma pembelajaran yang diawasi adalah yang paling berguna untuk memprediksi hasil berdasarkan pengalaman.