Pengenalan Tulisan Tangan dengan Pembelajaran Mesin
Diterbitkan: 2022-06-01Pengenalan tulisan tangan hanyalah kemampuan mesin atau komputer untuk mengambil tulisan tangan – dari berbagai sumber fisik dan digital – dan menafsirkannya sebagai teks di layar. Inputnya juga bisa berupa gambar dengan teks tulisan tangan. Dalam hal ini, pertama-tama harus melewati pengenalan pola atau perangkat lunak pengenalan waktu nyata untuk pemindaian optik.
Pengenalan tulisan tangan memberi mesin kemampuan untuk membaca tulisan tangan sebagai teks aktual dan mengubahnya menjadi bentuk digital. Pengenalan tulisan tangan tersebar luas, dari kasus konsumen seperti membaca teks dari penulisan stylus atau aplikasi kamera hingga penelitian akademis tentang cara kerja pengenalan tulisan tangan pada manusia.
Sebelum pengenalan tulisan tangan, ada pengenalan teks. Optical Character Recognition (OCR) adalah teknik pengenalan teks yang paling umum dan terkenal. OCR adalah bentuk pengenalan gambar yang mengenali karakter tulisan tangan, bukan bentuk, wajah, atau tengara. Itu membuatnya berbeda dari pengenalan tulisan tangan dari pembelajaran mesin atau pembelajaran mendalam.
Pengenalan Tulisan Tangan – Apa bedanya dengan OCR?
OCR berfungsi untuk memindai dokumen dan mengenali font, sedangkan pengenalan tulisan tangan adalah metode yang lebih cerdas dan efisien dengan berbagai kasus penggunaan dan teknik lainnya. Kelemahan utama OCR adalah jumlah font yang terbatas, tetapi setiap individu memiliki gaya penulisan yang berbeda. Jadi, alih-alih dilatih pada tingkat karakter untuk mengenali font untuk membuat teks komputer, algoritme pengenalan tulisan tangan menggunakan pendekatan yang lebih otomatis menggunakan pembelajaran mesin.
Sementara pada intinya, pengenalan tulisan tangan juga menganalisis kata, karakter, dan huruf, tetapi melakukannya dengan cara yang lebih algoritmik dengan melakukan "pencocokan terbaik" dari kumpulan huruf. Akibatnya, teknik pengenalan tulisan tangan harus bekerja dengan berbagai kata dan huruf yang dapat dengan mudah dihindari oleh OCR.
Untuk menyelesaikan tugas yang sulit ini, teknik pengenalan tulisan tangan menggunakan teknik pembelajaran mesin seperti visi komputer dan pembelajaran mendalam untuk membuat model abstrak kata dan huruf. Ini mengikuti prosedur tulisan tangan kita manusia, di mana kita dapat mengidentifikasi abjad dan kata-kata bahkan jika ditulis dengan cara yang menyimpang atau tidak terbaca. Dengan begitu, algoritme ini dapat mengenali tulisan tangan dengan lebih mulus dan tanpa banyak batasan.
Dengan pembelajaran yang mendalam, kinerja pengenalan tulisan tangan telah berkembang pesat dalam waktu singkat. Sementara bentuk pengenalan tulisan tangan yang lebih lama membutuhkan banyak bantuan dalam bentuk kamus dan konteks lainnya, pengenalan berbasis pembelajaran mendalam dapat menyalin satu halaman penuh informasi tanpa bantuan apa pun dan melakukannya dengan cukup andal.
Namun, karena variasi yang luas dalam jenis dan gaya tulisan tangan, kinerja pengenalan tulisan tangan umumnya lebih rendah, dan terus meningkat dibandingkan dengan teknik OCR yang bekerja terutama pada pengenalan font.
Jelajahi kursus kami tentang Pembelajaran Mesin & Kecerdasan Buatan
Sertifikasi Lanjutan dalam Pembelajaran Mesin dan Cloud dari IITM | Master of Science dalam Pembelajaran Mesin & AI dari LJMU | Program Pascasarjana Eksekutif dalam Pembelajaran Mesin & AI dari IITB |
Program Sertifikat Tingkat Lanjut dalam Pembelajaran Mesin & NLP dari IIITB | Program Sertifikat Tingkat Lanjut dalam Pembelajaran Mesin & Pembelajaran Mendalam dari IIITB | Program Sertifikat Tingkat Lanjut dalam AI untuk Manajer dari IITR |
Mari kita bicara tentang hubungan antara pengenalan tulisan tangan dan pembelajaran mesin.
Pentingnya Pengenalan Tulisan Tangan dengan Pembelajaran Mesin
Menyalin secara manual jumlah data tulisan tangan yang terus meningkat adalah tugas yang menakutkan dan hampir mustahil. Plus, dengan begitu banyak alat digital yang kita miliki, semakin penting untuk memberi orang kemampuan untuk menulis di layar mereka seolah-olah itu kertas, dan komputer bisa membaca dan menafsirkan dan menyimpannya sendiri. Ini hanyalah salah satu kasus penggunaan pengenalan tulisan tangan dengan pembelajaran mesin, dan daftarnya semakin panjang dan kaya. Alat dan sistem pengenalan tulisan tangan otomatis dapat menghilangkan banyak waktu yang terbuang sia-sia dalam menyalin volume teks. Ini juga dapat membuka jalan bagi penelitian lanjutan dalam pengenalan tulisan tangan dengan pembelajaran mesin.
Pengenalan tulisan tangan menggunakan pembelajaran mesin dalam arti luas. Pengenalan tulisan tangan dibangun di atas kecerdasan buatan, visi komputer, pengenalan karakter, dan pengenalan pola dalam konteks yang lebih spesifik. Algoritme atau sistem apa pun yang dipelajari untuk mengenali tulisan tangan dapat mendeteksi dan memahami pola dari gambar, perangkat, dll., dan mengubahnya menjadi format yang dapat dibaca mesin tanpa kehilangan informasi apa pun.
Meskipun ada berbagai algoritma pembelajaran mesin, model, teknik, dan strategi pengenalan tulisan tangan, dalam konteks yang luas, setiap algoritma pengenalan tulisan tangan akan berisi elemen-elemen berikut:
Algoritma pengenalan karakter:
Algoritma ini akan diperlukan untuk pra-pemrosesan gambar, mengekstraksi fitur dari teks/gambar/dokumen, dan mengklasifikasikannya ke dalam kategori yang benar. Algoritma ini umumnya digunakan dalam urutan yang disebutkan. Misalnya, pra-pemrosesan citra sebelum ekstraksi fitur membuat proses lebih lancar, sedangkan ekstraksi fitur mendukung klasifikasi yang lebih baik dan akurat.
Pra-pemrosesan gambar:
Pra-pemrosesan gambar adalah salah satu tugas penting di seluruh saluran pengenalan tulisan tangan untuk memprediksi karakter secara akurat. Pra-pemrosesan umumnya membantu menghilangkan noise, mengelompokkan gambar, melakukan operasi pembersihan, penskalaan, pemotongan, pengubahan ukuran, dan semacamnya. Karena penangkapan digital dan konversi untuk menyimpan gambar menyebabkan banyak noise pada gambar, pra-pemrosesan adalah langkah yang diperlukan untuk mengidentifikasi objek penting di seluruh gambar dan noise yang dapat dihindari dan dihilangkan. Idenya adalah untuk menghilangkan noise sebanyak mungkin untuk mempermudah proses selanjutnya.
Segmentasi:
Pada fase segmentasi, algoritma menyegmentasikan karakter dalam sub-gambar dari karakter individu yang berbeda. Kami tidak akan menyelam lebih dalam ke teknis ini karena berada di luar cakupan diskusi ini!
Ekstraksi fitur:
Dengan fitur, yang kami maksud di sini adalah semua properti terukur dari data input yang digunakan untuk mengklasifikasikan dan menganalisis data. Ekstraksi fitur sangat penting untuk mengidentifikasi fitur yang relevan dan membedakan instance yang independen satu sama lain.
Klasifikasi dan pengakuan:
Pada tahap ini, algoritma membuat keputusan akhir dari input tulisan tangan yang diberikan. Ini dilakukan dengan menggunakan jaringan saraf atau pengklasifikasi lainnya.
Baca Artikel populer kami terkait Pembelajaran Mesin dan Kecerdasan Buatan
IoT: Sejarah, Sekarang & Masa Depan | Tutorial Pembelajaran Mesin: Belajar ML | Apa itu Algoritma? Sederhana & Mudah |
Gaji Insinyur Robotika di India : Semua Peran | Sehari dalam Kehidupan Seorang Insinyur Pembelajaran Mesin: Apa yang mereka lakukan? | Apa itu IoT (Internet of Things) |
Permutasi vs Kombinasi: Perbedaan antara Permutasi dan Kombinasi | 7 Tren Teratas dalam Kecerdasan Buatan & Pembelajaran Mesin | Pembelajaran Mesin dengan R: Semua yang Perlu Anda Ketahui |
Kesimpulannya
Pembelajaran mesin adalah bidang menarik yang menawarkan banyak peluang untuk penelitian dan inovasi. Meskipun mungkin tampak sulit jika Anda benar-benar pemula, itu menjadi lebih mudah setelah Anda mengambil langkah pertama.
Jika Anda tertarik dengan komputer, matematika, mesin, atau bahkan psikologi, atau hanya ingin memahami cara kerja pembelajaran mesin – lihat Master of Science kami dalam Pembelajaran Mesin dan AI – yang ditawarkan bekerja sama dengan IIIT Bangalore. Dengan 15+ studi kasus, tiga pilihan untuk dipilih, dan bimbingan karir satu lawan satu, program kami dirancang untuk membantu semua orang – mulai dari yang baru lulus hingga profesional yang berpengalaman – mencapai skala tinggi dalam perjalanan Pembelajaran Mesin mereka.
Bergabunglah dengan Kursus Pembelajaran Mesin dari Universitas top dunia. Dapatkan Master, PGP Eksekutif, atau Program Sertifikat Tingkat Lanjut untuk mempercepat karier Anda.
Algoritma Machine Learning mana yang terbaik untuk tugas pengenalan tulisan tangan?
Pengklasifikasi SVM adalah yang paling akurat dalam hal akurasi sehingga dapat menjadi algoritma terbaik untuk tugas pengenalan tulisan tangan.
Bagaimana cara kerja perangkat lunak pengenalan tulisan tangan?
Perangkat lunak pengenalan tulisan tangan menggunakan pencocokan pola, yang mengubah tulisan tangan menjadi teks komputer secara real-time.
Mengapa pengenalan tulisan tangan diperlukan dengan pembelajaran mesin?
Sebelum pembelajaran mesin, OCR adalah teknik masuk untuk pengenalan karakter. Ini bekerja dengan baik untuk karakter yang diketik untuk mencocokkan font dan membacanya. Namun, gagal dalam mengenali tulisan tangan manusia karena variabilitas dan ambiguitas yang tinggi dari orang ke orang. Di situlah pembelajaran mesin memberikan solusi dan membuka jalan untuk pengenalan tulisan tangan. Karena ini adalah bidang yang terus berkembang, alat yang kita miliki saat ini untuk pengenalan tulisan tangan akan semakin canggih, menghasilkan strategi yang lebih berkembang.