Pembelajaran Sekali Pakai dengan Jaringan Siam [Untuk Pengenalan Wajah]

Diterbitkan: 2021-02-08

Artikel berikut berbicara tentang perlunya menggunakan pembelajaran One-shot beserta variasi dan kekurangannya.

Untuk memulainya, untuk melatih model pembelajaran mendalam apa pun, kami memerlukan sejumlah besar data sehingga model kami melakukan tugas prediksi atau klasifikasi yang diinginkan secara efisien. Misalnya, mendeteksi anjing dari gambar akan mengharuskan Anda melatih model jaringan saraf pada ratusan dan ribuan gambar anjing dan non-anjing agar dapat membedakan satu sama lain secara akurat. Namun, model jaringan saraf ini akan gagal bekerja jika dilatih pada satu atau sangat sedikit data pelatihan.

Dengan kurangnya data, mengekstraksi fitur yang relevan pada lapisan yang berbeda menjadi sulit. Model tidak akan dapat menggeneralisasi dengan baik antara kelas yang berbeda sehingga mempengaruhi kinerjanya secara keseluruhan.

Sebagai ilustrasi, perhatikan contoh pengenalan wajah di bandara. Dalam hal ini, kami tidak memiliki kebebasan untuk melatih model kami dari ratusan dan ribuan gambar setiap orang yang mengandung ekspresi berbeda, pencahayaan latar, dll. Dengan lebih dari ribuan penumpang yang tiba setiap hari, ini adalah tugas yang mustahil! Selain itu, menyimpan sejumlah besar data menambah biaya.

Untuk mengatasi masalah di atas, kami menggunakan teknik di mana tugas klasifikasi atau kategorisasi dapat dicapai dengan satu atau beberapa contoh untuk mengklasifikasikan banyak contoh baru. Teknik ini disebut One-shot learning.

Dalam beberapa tahun terakhir, teknologi one-shot learning sedang digunakan secara luas dalam pengenalan wajah dan pemeriksaan paspor. Konsep yang digunakan adalah- Model mengambil input 2 gambar; satu adalah gambar dari paspor dan yang lainnya adalah gambar orang yang melihat ke kamera. Model kemudian mengeluarkan nilai yang merupakan kesamaan antara 2 gambar. Jika nilai outputnya rendah maka kedua gambar tersebut serupa jika tidak mereka berbeda.

Daftar isi

Jaringan Siam

Arsitektur yang digunakan untuk pembelajaran One-shot disebut Siamese Network. Arsitektur ini terdiri dari dua jaringan saraf paralel dengan masing-masing mengambil input yang berbeda. Keluaran model berupa nilai atau indeks kesamaan yang menunjukkan apakah kedua citra masukan sama atau tidak. Nilai di bawah ambang batas yang telah ditentukan sesuai dengan kesamaan yang tinggi antara dua gambar dan sebaliknya.

Ketika gambar melewati serangkaian lapisan Convolutional, lapisan max-pooling, dan lapisan yang terhubung sepenuhnya, apa yang kami capai adalah vektor yang mengkodekan fitur gambar. Di sini karena kami memasukkan dua gambar, dua vektor yang mencakup fitur dari gambar input akan dihasilkan. Nilai yang kita bicarakan adalah jarak antara dua vektor fitur yang dapat dihitung dengan menemukan norma perbedaan antara dua vektor.

Fungsi kehilangan rangkap tiga

Seperti namanya, untuk melatih model kita membutuhkan tiga citra- satu citra jangkar (A), satu citra positif (P), dan satu citra negatif (N). Karena dua input dapat diberikan ke model, gambar jangkar dengan gambar positif atau negatif diberikan. Model mempelajari parameter sedemikian rupa sehingga jarak antara gambar jangkar dan gambar positif rendah sedangkan jarak antara gambar jangkar dan gambar negatif tinggi.

Fungsi kerugian konstruktif menghukum model jika jarak antara A dan N rendah atau A dan P tinggi, sementara itu mendorong model atau mempelajari fitur ketika jarak antara A dan N tinggi dan A dan P rendah.

Untuk lebih memahami tentang jangkar, citra positif dan negatif, mari kita perhatikan contoh sebelumnya di bandara. Dalam kasus seperti itu, gambar jangkar akan menjadi gambar Anda ketika Anda melihat ke kamera, gambar positif akan menjadi gambar di foto paspor Anda dan gambar negatif akan menjadi gambar acak dari penumpang yang hadir di bandara.

Setiap kali kami melatih jaringan Siaseme, kami menyediakannya dengan gambar trio APN (Anchor, positif dan negatif). Membuat kumpulan data ini jauh lebih mudah dan membutuhkan lebih sedikit gambar untuk dilatih.

Keterbatasan Pembelajaran Sekali Pakai

Pembelajaran sekali pakai masih merupakan algoritma pembelajaran mesin yang matang dan memiliki beberapa keterbatasan. Misalnya, model tidak akan berfungsi dengan baik jika gambar input memiliki beberapa modifikasi- seseorang yang memakai topi, kacamata hitam, dan lain-lain. Selanjutnya, model yang dilatih untuk satu aplikasi tidak dapat digeneralisasi untuk aplikasi lain.

Selanjutnya mari kita lihat beberapa variasi pembelajaran One-shot yang memerlukan pembelajaran Zero-shot dan pembelajaran Sedikit-shot.

Pembelajaran tanpa tembakan

Pembelajaran zero-shot adalah kemampuan model untuk mengidentifikasi data berlabel baru atau tidak terlihat saat dilatih pada data yang terlihat dan mengetahui fitur semantik dari data baru atau tidak terlihat. Misalnya, seorang anak yang telah melihat kucing dapat mengidentifikasinya dengan ciri-cirinya yang berbeda. Apalagi jika anak mengetahui bahwa anjing menggonggong dan memiliki sifat yang lebih padat dari kucing, maka anak tidak akan kesulitan mengenali anjing tersebut.

Untuk menyimpulkan, kita dapat mengatakan bahwa fungsi pengenalan ZSL dengan cara yang memperhitungkan set pelatihan berlabel dari kelas yang terlihat ditambah dengan pengetahuan tentang bagaimana setiap kelas yang tidak terlihat secara semantik terkait dengan kelas yang terlihat.

pembelajaran N-shot

Seperti namanya, dalam N shot learning kita akan memiliki n data berlabel dari setiap kelas yang tersedia untuk pelatihan. Model dilatih pada kelas K yang masing-masing berisi n data berlabel. Setelah mengekstrak fitur dan pola yang relevan, model harus mengkategorikan gambar baru yang tidak berlabel ke dalam salah satu kelas K. Mereka menggunakan jaringan Pencocokan yang bekerja pada pendekatan berbasis tetangga terdekat yang dilatih sepenuhnya dari ujung ke ujung.

Kesimpulan

Kesimpulannya, bidang pembelajaran One-shot dan rekan-rekannya memiliki potensi besar untuk memecahkan beberapa masalah yang menantang. Meskipun, sebagai bidang penelitian yang relatif baru, ini membuat kemajuan pesat, dan para peneliti berupaya menjembatani kesenjangan antara mesin dan manusia.

Dengan ini, kami telah mengakhiri posting ini, saya harap Anda menikmati membacanya.

Jika Anda tertarik untuk mempelajari lebih lanjut tentang pembelajaran mesin, lihat PG Diploma IIIT-B & upGrad dalam Pembelajaran Mesin & AI yang dirancang untuk para profesional yang bekerja dan menawarkan 450+ jam pelatihan ketat, 30+ studi kasus & tugas, IIIT- B Status alumni, 5+ proyek batu penjuru praktis & bantuan pekerjaan dengan perusahaan-perusahaan top.

Pelajari Kursus ML dari Universitas top Dunia. Dapatkan Master, PGP Eksekutif, atau Program Sertifikat Tingkat Lanjut untuk mempercepat karier Anda.

Pimpin Revolusi Teknologi Berbasis AI

Terapkan untuk Program Sertifikat Tingkat Lanjut dalam Pembelajaran Mesin & NLP