6 Jenis Pembelajaran Terbimbing yang Harus Anda Ketahui di 2022

Diterbitkan: 2021-01-10

Pembelajaran mesin adalah salah satu aplikasi Kecerdasan Buatan yang paling umum. Sebuah mesin belajar untuk menjalankan tugas dari data yang dimasukkan di dalamnya. Dan dengan pengalaman, kinerjanya dalam tugas tertentu meningkat. Pembelajaran mesin mencakup teknik pembelajaran yang diawasi, tidak diawasi, dan diperkuat. Baca lebih lanjut tentang jenis pembelajaran mesin.

Pada artikel ini, kita akan melihat berbagai jenis pembelajaran yang diawasi.

Daftar isi

Apa itu Pembelajaran Terawasi?

Dalam Supervised Learning, sebuah mesin dilatih menggunakan data 'berlabel'. Kumpulan data dikatakan diberi label ketika mereka berisi parameter input dan output. Dengan kata lain, data telah ditandai dengan jawaban yang benar.

Jadi, teknik meniru lingkungan kelas di mana seorang siswa belajar di hadapan seorang supervisor atau guru. Di sisi lain, algoritma pembelajaran tanpa pengawasan membiarkan model menemukan informasi dan belajar sendiri.

Pembelajaran mesin yang diawasi sangat membantu dalam memecahkan masalah komputasi dunia nyata. Algoritme memprediksi hasil untuk data tak terduga dengan belajar dari data pelatihan berlabel. Oleh karena itu, dibutuhkan ilmuwan data yang sangat terampil untuk membangun dan menerapkan model semacam itu. Seiring waktu, ilmuwan data juga menggunakan keahlian teknis mereka untuk membangun kembali model guna menjaga integritas wawasan yang diberikan.

Bagaimana cara kerjanya?

Misalnya, Anda ingin melatih mesin dalam memprediksi waktu perjalanan Anda antara kantor dan rumah. Pertama, Anda akan membuat kumpulan data berlabel seperti cuaca, waktu, rute yang dipilih, dll. yang akan terdiri dari data input Anda. Dan hasilnya adalah perkiraan durasi perjalanan Anda kembali ke rumah pada hari tertentu.

Setelah Anda membuat set pelatihan berdasarkan faktor terkait, mesin akan melihat hubungan antara titik data dan menggunakannya untuk memastikan jumlah waktu yang Anda perlukan untuk berkendara kembali ke rumah. Misalnya, aplikasi seluler dapat memberi tahu Anda bahwa waktu perjalanan Anda akan lebih lama saat hujan deras.

Mesin juga dapat melihat koneksi lain di data berlabel Anda, seperti waktu Anda berangkat kerja. Anda dapat mencapai rumah lebih awal jika Anda mulai sebelum jam sibuk lalu lintas menghantam jalan. Baca lebih lanjut jika Anda ingin tahu tentang cara kerja pembelajaran mesin tanpa pengawasan.

Sekarang, mari kita coba memahami pembelajaran yang diawasi dengan bantuan contoh kehidupan nyata lainnya. Misalkan Anda memiliki keranjang buah, dan Anda melatih mesin dengan semua jenis buah yang berbeda. Data pelatihan dapat mencakup skenario berikut:

  • Jika benda tersebut berwarna merah, berbentuk bulat, dan memiliki cekungan di bagian atasnya, beri label 'Apel'
  • Jika item tersebut berwarna kuning kehijauan dan berbentuk seperti silinder melengkung, tandai sebagai 'Banana'

Selanjutnya, Anda memberikan objek baru (data uji) dan meminta mesin untuk mengidentifikasi apakah itu pisang atau apel. Ini akan belajar dari data pelatihan dan menerapkan pengetahuan untuk mengklasifikasikan buah sesuai dengan warna dan bentuk yang diinput.

Berbagai Jenis Pembelajaran Terawasi

1. Regresi

Dalam regresi, nilai output tunggal dihasilkan menggunakan data pelatihan. Nilai ini merupakan interpretasi probabilistik, yang dipastikan setelah mempertimbangkan kekuatan korelasi antar variabel input. Misalnya, regresi dapat membantu memprediksi harga rumah berdasarkan lokasi, ukuran, dll.

Dalam regresi logistik, output memiliki nilai diskrit berdasarkan sekumpulan variabel independen. Metode ini dapat gagal ketika berhadapan dengan batas-batas keputusan non-linier dan ganda. Selain itu, tidak cukup fleksibel untuk menangkap hubungan kompleks dalam kumpulan data.

2. Klasifikasi

Ini melibatkan pengelompokan data ke dalam kelas. Jika Anda berpikir untuk memberikan kredit kepada seseorang, Anda dapat menggunakan klasifikasi untuk menentukan apakah seseorang akan menjadi pelanggar pinjaman atau tidak. Ketika algoritma pembelajaran yang diawasi memberi label input data ke dalam dua kelas yang berbeda, itu disebut klasifikasi biner. Beberapa klasifikasi berarti mengkategorikan data menjadi lebih dari dua kelas.

3. Model Bayesian Naif

Model klasifikasi Bayesian digunakan untuk kumpulan data berhingga yang besar. Ini adalah metode pemberian label kelas menggunakan grafik asiklik langsung. Grafik terdiri dari satu simpul induk dan beberapa simpul anak. Dan setiap simpul anak diasumsikan independen dan terpisah dari induknya.

Pohon Keputusan

Pohon keputusan adalah model seperti diagram alur yang berisi pernyataan kontrol bersyarat, yang terdiri dari keputusan dan kemungkinan konsekuensinya. Outputnya berkaitan dengan pelabelan data yang tidak terduga.

Dalam representasi pohon, simpul daun sesuai dengan label kelas, dan simpul internal mewakili atribut. Sebuah pohon keputusan dapat digunakan untuk memecahkan masalah dengan atribut diskrit serta fungsi boolean. Beberapa algoritma pohon keputusan yang terkenal adalah ID3 dan CART.

4. Model Hutan Acak

Model hutan acak adalah metode ensemble. Ini beroperasi dengan membangun banyak pohon keputusan dan menghasilkan klasifikasi pohon individu. Misalkan Anda ingin memprediksi mahasiswa sarjana mana yang akan berprestasi baik di GMAT – tes yang diambil untuk masuk ke program manajemen pascasarjana. Model hutan acak akan menyelesaikan tugas, mengingat faktor demografi dan pendidikan dari sekumpulan siswa yang sebelumnya telah mengikuti tes.

5. Jaringan Syaraf

Algoritma ini dirancang untuk mengelompokkan input mentah, mengenali pola, atau menafsirkan data sensorik. Terlepas dari berbagai keunggulannya, jaringan saraf membutuhkan sumber daya komputasi yang signifikan. Ini bisa menjadi rumit untuk menyesuaikan jaringan saraf ketika ada ribuan pengamatan. Ini juga disebut algoritma 'kotak hitam' karena menafsirkan logika di balik prediksi mereka bisa jadi menantang.

Baca : 10 Arsitektur Neural Network Terbaik Tahun 2020

6. Mendukung Mesin Vektor

Support Vector Machine (SVM) adalah algoritma pembelajaran terawasi yang dikembangkan pada tahun 1990. Ini diambil dari teori pembelajaran statistik yang dikembangkan oleh Vap Nick.

SVM memisahkan hyperplanes, yang membuatnya menjadi pengklasifikasi diskriminatif. Output yang dihasilkan berupa hyperplane optimal yang mengkategorikan contoh-contoh baru. SVM terkait erat dengan kerangka kerja kernel dan digunakan di berbagai bidang. Beberapa contoh termasuk bioinformatika, pengenalan pola, dan pencarian informasi multimedia.

Pro & Kontra Pembelajaran Terawasi

Beberapa jenis pembelajaran yang diawasi memungkinkan Anda mengumpulkan dan menghasilkan data dari pengalaman sebelumnya. Dari mengoptimalkan kriteria kinerja hingga menangani masalah dunia nyata, pembelajaran yang diawasi telah muncul sebagai alat yang ampuh di bidang AI. Ini juga merupakan metode yang lebih dapat dipercaya dibandingkan dengan pembelajaran tanpa pengawasan, yang dapat menjadi rumit secara komputasi dan kurang akurat dalam beberapa kasus.

Namun, pembelajaran terawasi bukan tanpa keterbatasan. Contoh konkret diperlukan untuk pengklasifikasi pelatihan, dan batasan keputusan dapat dilatih secara berlebihan tanpa adanya contoh yang tepat. Seseorang juga mungkin mengalami kesulitan dalam mengklasifikasikan data besar.

Menyimpulkan

Panjang dan pendek dari pembelajaran yang diawasi adalah bahwa ia menggunakan data berlabel untuk melatih mesin. Teknik regresi dan algoritme klasifikasi membantu mengembangkan model prediksi yang sangat andal dan memiliki banyak aplikasi.

Pembelajaran yang diawasi membutuhkan para ahli untuk membangun, menskalakan, dan memperbarui model. Dengan tidak adanya kemampuan teknis, brute force dapat diterapkan untuk menentukan variabel input. Dan ini bisa membuat hasil yang tidak akurat. Jadi, pemilihan fitur data yang relevan sangat penting agar pembelajaran yang diawasi dapat bekerja secara efektif.

Seseorang harus terlebih dahulu memutuskan data mana yang diperlukan untuk set pelatihan, melanjutkan struktur fungsi dan algoritma yang dipelajari, dan juga mengumpulkan hasil dari para ahli dan pengukuran. Praktik terbaik semacam itu bisa sangat membantu dalam mendukung keakuratan model.

Ketika kecerdasan buatan dan pembelajaran mesin meningkat pesat di dunia yang berorientasi pada teknologi saat ini, mengetahui tentang jenis pembelajaran yang diawasi dapat menjadi pembeda yang signifikan dalam bidang apa pun. Penjelasan di atas akan membantu Anda mengambil langkah pertama itu!

Jika Anda tertarik untuk mempelajari lebih lanjut tentang pembelajaran mesin, lihat PG Diploma IIIT-B & upGrad dalam Pembelajaran Mesin & AI yang dirancang untuk para profesional yang bekerja dan menawarkan 450+ jam pelatihan ketat, 30+ studi kasus & tugas, IIIT- B Status alumni, 5+ proyek batu penjuru praktis & bantuan pekerjaan dengan perusahaan-perusahaan top.

Pelajari Kursus ML dari Universitas top Dunia. Dapatkan Master, PGP Eksekutif, atau Program Sertifikat Tingkat Lanjut untuk mempercepat karier Anda.

Apa yang dimaksud dengan pembelajaran terawasi?

Sebuah mesin belajar menggunakan data 'berlabel' dalam Pembelajaran Terawasi. Ketika kumpulan data memiliki parameter input dan output, itu dianggap diberi label. Dengan kata lain, informasi tersebut telah diberi label dengan respons yang benar. Dalam tantangan komputasi dunia nyata, pembelajaran mesin yang diawasi cukup berguna. Sistem belajar dari data pelatihan berlabel untuk memprediksi hasil untuk data yang tidak terduga. Akibatnya, membangun dan menerapkan model semacam itu memerlukan keahlian ilmuwan data yang sangat terampil. Ilmuwan data memanfaatkan pengetahuan teknis mereka untuk membangun model dari waktu ke waktu untuk menjaga validitas wawasan yang diberikan.

Apa perbedaan antara klasifikasi dan regresi?

Menggunakan data pelatihan, regresi menghasilkan nilai output tunggal. Ini adalah interpretasi probabilistik yang ditentukan dengan mempertimbangkan kekuatan korelasi antara variabel input. Regresi, misalnya, dapat membantu memperkirakan harga rumah berdasarkan lokasi, ukuran, dan faktor lainnya. Tindakan mengklasifikasikan data memerlukan membaginya ke dalam kategori. Anda dapat menggunakan kategorisasi untuk mengevaluasi apakah seseorang akan gagal membayar pinjaman jika Anda mempertimbangkan untuk menawarkan kredit kepada mereka. Klasifikasi biner terjadi ketika algoritma pembelajaran yang diawasi mengklasifikasikan data input menjadi dua kelas yang terpisah. Klasifikasi ganda mengacu pada pembagian informasi menjadi lebih dari dua kelompok.

Apa itu hutan acak?

Metode ensemble adalah model hutan acak. Ia bekerja dengan membuat sejumlah besar pohon keputusan dan kemudian mengklasifikasikan pohon individu. Katakanlah Anda ingin tahu mahasiswa universitas mana yang akan berhasil di GMAT, ujian yang diperlukan untuk masuk ke program manajemen pascasarjana. Mengingat karakteristik demografis dan pendidikan sekelompok siswa yang sebelumnya telah mengikuti tes, model hutan acak dapat menyelesaikan tugas tersebut.