การรู้จำลายมือด้วยการเรียนรู้ของเครื่อง
เผยแพร่แล้ว: 2022-06-01การรู้จำลายมือเป็นเพียงความสามารถของเครื่องหรือคอมพิวเตอร์ในการเขียนด้วยลายมือ จากแหล่งข้อมูลทางกายภาพและดิจิทัลต่างๆ และตีความว่าเป็นข้อความบนหน้าจอ อินพุตอาจอยู่ในรูปของรูปภาพที่มีข้อความที่เขียนด้วยลายมือ ในกรณีนั้น ก่อนอื่นต้องส่งผ่านซอฟต์แวร์การจดจำรูปแบบหรือซอฟต์แวร์การรู้จำแบบเรียลไทม์สำหรับการสแกนด้วยแสง
การรู้จำลายมือทำให้เครื่องสามารถอ่านลายมือเป็นข้อความจริงและแปลงเป็นรูปแบบดิจิทัลได้ การรู้จำลายมือเป็นที่แพร่หลาย ตั้งแต่กรณีของผู้บริโภค เช่น การอ่านข้อความจากการเขียนด้วยสไตลัสหรือแอปพลิเคชันกล้อง ไปจนถึงการวิจัยทางวิชาการเกี่ยวกับวิธีการทำงานของการรู้จำลายมือในมนุษย์
ก่อนการจดจำลายมือ มีการจดจำข้อความ Optical Character Recognition (OCR) เป็นเทคนิคการจดจำข้อความที่เป็นกระแสหลักและเป็นที่รู้จักกันดี OCR เป็นรูปแบบหนึ่งของการจดจำภาพที่จดจำตัวอักษรของลายมือแทนรูปร่าง ใบหน้า หรือจุดสังเกต ซึ่งทำให้แตกต่างจากการรู้จำลายมือจากการเรียนรู้ของเครื่องหรือการเรียนรู้เชิงลึก
การรู้จำลายมือ – ต่างจาก OCR อย่างไร?
OCR ทำงานในการสแกนเอกสารและจดจำแบบอักษร ในขณะที่การรู้จำลายมือเป็นวิธีที่ชาญฉลาดกว่าและมีประสิทธิภาพมากกว่าด้วยกรณีการใช้งานและเทคนิคอื่นๆ ที่แตกต่างกัน ข้อเสียเปรียบหลักของ OCR คือฟอนต์จำนวนจำกัด แต่แต่ละคนมีสไตล์การเขียนที่แตกต่างกัน ดังนั้น แทนที่จะได้รับการฝึกอบรมในระดับอักขระให้รู้จักแบบอักษรเพื่อสร้างข้อความในคอมพิวเตอร์ อัลกอริธึมการรู้จำลายมือจึงใช้วิธีอัตโนมัติมากขึ้นโดยใช้การเรียนรู้ของเครื่อง
ในขณะที่แกนหลัก การรู้จำลายมือยังวิเคราะห์คำ อักขระ และตัวอักษรด้วย แต่ทำในลักษณะอัลกอริธึมมากขึ้นด้วยการแสดง "การจับคู่ที่ดีที่สุด" จากชุดตัวอักษร ด้วยเหตุนี้ เทคนิคการรู้จำลายมือจึงต้องทำงานกับคำและตัวอักษรต่างๆ ที่ OCR สามารถหลีกเลี่ยงได้ง่าย
ในการบรรลุงานที่ยากนี้ เทคนิคการรู้จำลายมือจะใช้เทคนิคการเรียนรู้ของเครื่อง เช่น คอมพิวเตอร์วิทัศน์และการเรียนรู้เชิงลึกเพื่อสร้างแบบจำลองนามธรรมของคำและตัวอักษร สิ่งนี้เป็นไปตามขั้นตอนการเขียนด้วยลายมือของมนุษย์เรา ซึ่งเราสามารถระบุตัวอักษรและคำได้ แม้ว่าจะเขียนในลักษณะที่บิดเบี้ยวหรืออ่านไม่ออกก็ตาม อัลกอริทึมเหล่านี้สามารถจดจำลายมือได้แนบเนียนยิ่งขึ้นโดยไร้ข้อจำกัดมากมาย
ด้วยการเรียนรู้เชิงลึก ประสิทธิภาพการรู้จำลายมือจึงมาไกลในระยะเวลาอันสั้น ในขณะที่รูปแบบการรู้จำลายมือแบบเก่าต้องการความช่วยเหลืออย่างมากในรูปแบบของพจนานุกรมและบริบทอื่นๆ การรู้จำแบบอาศัยการเรียนรู้เชิงลึกสามารถถอดความข้อมูลเต็มหน้าโดยไม่ต้องมีความช่วยเหลือใด ๆ และทำได้อย่างน่าเชื่อถือ
อย่างไรก็ตาม เนื่องจากประเภทและรูปแบบของการเขียนด้วยลายมือมีความแตกต่างกันอย่างมาก ประสิทธิภาพของการรู้จำลายมือโดยทั่วไปจึงลดลง และเพิ่มขึ้นเรื่อยๆ เมื่อเทียบกับเทคนิค OCR ที่ใช้กับการจดจำแบบอักษรเป็นหลัก
สำรวจหลักสูตรของเราเกี่ยวกับการเรียนรู้ของเครื่องและปัญญาประดิษฐ์
การรับรองขั้นสูงในการเรียนรู้ของเครื่องและคลาวด์จาก IITM | วิทยาศาสตรมหาบัณฑิตสาขาวิชา Machine Learning & AI จาก LJMU | Executive Post Graduate Program in Machine Learning & AI จาก IITB |
โปรแกรมประกาศนียบัตรขั้นสูงในการเรียนรู้ของเครื่อง & NLP จาก IIITB | โปรแกรมประกาศนียบัตรขั้นสูงในการเรียนรู้ของเครื่องและการเรียนรู้เชิงลึกจาก IIITB | โปรแกรมใบรับรองขั้นสูงใน AI สำหรับผู้จัดการจาก IITR |
มาพูดถึงความสัมพันธ์ระหว่างการรู้จำลายมือกับการเรียนรู้ของเครื่องกัน
ความสำคัญของการรู้จำลายมือด้วยการเรียนรู้ของเครื่อง
การคัดลอกข้อมูลที่เขียนด้วยลายมือจำนวนมากขึ้นเรื่อยๆ ด้วยตนเองนั้นเป็นงานที่น่ากลัวและแทบจะเป็นไปไม่ได้เลย นอกจากนี้ ด้วยเครื่องมือดิจิทัลมากมายที่เรามีอยู่ การจัดเตรียมผู้คนให้สามารถเขียนบนหน้าจอราวกับว่ามันเป็นกระดาษ และคอมพิวเตอร์สามารถอ่าน ตีความ และจัดเก็บด้วยตนเองได้ นี่เป็นเพียงหนึ่งในกรณีการใช้งานของการรู้จำลายมือด้วยการเรียนรู้ของเครื่อง และรายการจะยาวขึ้นและสมบูรณ์ยิ่งขึ้นเท่านั้น เครื่องมือและระบบการรู้จำลายมือแบบอัตโนมัติสามารถขจัดเวลาจำนวนมากที่เสียไปในการถอดความข้อความจำนวนมาก นอกจากนี้ยังสามารถปูทางสำหรับการวิจัยขั้นสูงในการรู้จำลายมือด้วยการเรียนรู้ของเครื่อง
การรู้จำลายมือใช้การเรียนรู้ของเครื่องในความหมายกว้าง การรู้จำลายมือสร้างขึ้นจากปัญญาประดิษฐ์ การมองเห็นด้วยคอมพิวเตอร์ การรู้จำอักขระ และการรู้จำรูปแบบในบริบทที่เฉพาะเจาะจงมากขึ้น อัลกอริธึมหรือระบบใดๆ ที่เรียนรู้ที่จะจดจำลายมือเขียนสามารถตรวจจับและเข้าใจรูปแบบจากรูปภาพ อุปกรณ์ ฯลฯ และแปลงเป็นรูปแบบที่เครื่องอ่านได้โดยไม่สูญเสียข้อมูลใดๆ
แม้ว่าจะมีอัลกอริธึม แบบจำลอง เทคนิค และกลยุทธ์การเรียนรู้ด้วยลายมือที่แตกต่างกันออกไป ในบริบทกว้างๆ อัลกอริธึมการรู้จำลายมือจะมีองค์ประกอบต่อไปนี้:
อัลกอริทึมการรู้จำอักขระ:
อัลกอริทึมเหล่านี้จำเป็นสำหรับการประมวลผลภาพล่วงหน้า การแยกคุณลักษณะจากข้อความ/รูปภาพ/เอกสาร และจัดประเภทให้เป็นหมวดหมู่ที่ถูกต้อง อัลกอริทึมเหล่านี้มักใช้ในลำดับที่กล่าวถึง ตัวอย่างเช่น การประมวลผลภาพล่วงหน้าก่อนการแยกคุณลักษณะทำให้กระบวนการราบรื่นขึ้น ในขณะที่การแยกคุณลักษณะสนับสนุนการจัดประเภทที่ดีและแม่นยำยิ่งขึ้น
การประมวลผลภาพล่วงหน้า:
การประมวลผลภาพล่วงหน้าเป็นหนึ่งในงานที่สำคัญในไปป์ไลน์การรู้จำลายมือทั้งหมด เพื่อการทำนายตัวอักษรอย่างแม่นยำ การประมวลผลล่วงหน้าโดยทั่วไปจะช่วยขจัดสัญญาณรบกวน แบ่งภาพ ดำเนินการทำความสะอาด ปรับขนาด ครอบตัด การปรับขนาด และอื่นๆ เนื่องจากการจับภาพดิจิทัลและการแปลงเพื่อจัดเก็บภาพทำให้เกิดสัญญาณรบกวนจำนวนมากในภาพ การประมวลผลล่วงหน้าจึงเป็นขั้นตอนที่จำเป็นในการระบุวัตถุที่สำคัญในภาพทั้งหมดและสัญญาณรบกวนที่สามารถหลีกเลี่ยงและกำจัดได้ แนวคิดคือการกำจัดสัญญาณรบกวนให้มากที่สุดเพื่อให้กระบวนการต่อไปง่ายขึ้น
การแบ่งส่วน:
ในขั้นตอนการแบ่งส่วน อัลกอริธึมจะแบ่งอักขระในภาพย่อยของอักขระแต่ละตัวที่แตกต่างกัน เราจะไม่ลงลึกในด้านเทคนิคของเรื่องนี้ เพราะมันอยู่นอกเหนือขอบเขตของการสนทนานี้!
การแยกคุณสมบัติ:
ตามคุณสมบัติ เราหมายถึงคุณสมบัติที่วัดได้ทั้งหมดจากข้อมูลอินพุตที่ใช้ในการจัดประเภทและวิเคราะห์ข้อมูล การแยกคุณลักษณะเป็นสิ่งจำเป็นสำหรับการระบุคุณลักษณะที่เกี่ยวข้องและการเลือกปฏิบัติอินสแตนซ์ที่เป็นอิสระจากกัน
การจำแนกประเภทและการรับรู้:
ในขั้นตอนนี้ อัลกอริธึมจะทำการตัดสินใจขั้นสุดท้ายของการป้อนข้อมูลด้วยลายมือที่ได้รับ ทำได้โดยใช้โครงข่ายประสาทเทียมหรือตัวแยกประเภทอื่นๆ
อ่านบทความยอดนิยมของเราเกี่ยวกับการเรียนรู้ของเครื่องและปัญญาประดิษฐ์
IoT: ประวัติศาสตร์ ปัจจุบัน และอนาคต | บทช่วยสอนการเรียนรู้ของเครื่อง: เรียนรู้ ML | อัลกอริทึมคืออะไร? ง่ายและสะดวก |
เงินเดือนวิศวกรหุ่นยนต์ในอินเดีย: บทบาททั้งหมด | วันหนึ่งในชีวิตของวิศวกรแมชชีนเลิร์นนิง: พวกเขาทำอะไร? | IoT คืออะไร (Internet of Things) |
การเปลี่ยนแปลงและการรวมกัน: ความแตกต่างระหว่างการเปลี่ยนแปลงและการรวมกัน | แนวโน้ม 7 อันดับแรกในปัญญาประดิษฐ์และการเรียนรู้ของเครื่อง | แมชชีนเลิร์นนิงกับ R: ทุกสิ่งที่คุณต้องรู้ |
สรุปแล้ว
แมชชีนเลิร์นนิงเป็นสาขาที่น่าสนใจซึ่งมีโอกาสมากมายสำหรับทั้งการวิจัยและนวัตกรรม แม้ว่าจะดูยากหากคุณเป็นมือใหม่ แต่จะง่ายขึ้นเมื่อคุณทำตามขั้นตอนแรก
หากคุณสนใจในคอมพิวเตอร์ คณิตศาสตร์ เครื่องจักร หรือแม้แต่จิตวิทยา หรือเพียงแค่ต้องการทำความเข้าใจว่าแมชชีนเลิร์นนิงทำงานอย่างไร ลองดู Masters of Science in Machine Learning และ AI ซึ่งนำเสนอร่วมกับ IIIT Bangalore ด้วยกรณีศึกษามากกว่า 15 กรณี วิชาเลือก 3 วิชาให้เลือก และการให้คำปรึกษาด้านอาชีพแบบตัวต่อตัว โปรแกรมของเราได้รับการออกแบบมาเพื่อช่วยให้ทุกคน ตั้งแต่นักศึกษาใหม่ไปจนถึงมืออาชีพที่มีประสบการณ์ ขยายเส้นทางการเรียนรู้ของเครื่องให้สูงขึ้น
เข้าร่วม หลักสูตรการเรียนรู้ของเครื่อง จากมหาวิทยาลัยชั้นนำของโลก รับ Masters, Executive PGP หรือ Advanced Certificate Programs เพื่อติดตามอาชีพของคุณอย่างรวดเร็ว
อัลกอริธึมการเรียนรู้ของเครื่องใดดีที่สุดสำหรับงานจดจำลายมือ
ตัวแยกประเภท SVM นั้นแม่นยำที่สุดในแง่ของความแม่นยำ ดังนั้นจึงเป็นอัลกอริธึมที่ดีที่สุดสำหรับงานจดจำลายมือ
ซอฟต์แวร์รู้จำลายมือทำงานอย่างไร
ซอฟต์แวร์การรู้จำลายมือใช้การจับคู่รูปแบบ ซึ่งจะแปลงลายมือเป็นข้อความในคอมพิวเตอร์แบบเรียลไทม์
เหตุใดจึงต้องมีการจดจำลายมือด้วยการเรียนรู้ของเครื่อง
ก่อนแมชชีนเลิร์นนิง OCR เป็นเทคนิคพื้นฐานสำหรับการจดจำอักขระ ทำงานได้ดีสำหรับอักขระที่พิมพ์เพื่อให้ตรงกับแบบอักษรและอ่าน อย่างไรก็ตาม มันล้มเหลวในการจดจำลายมือของมนุษย์ เนื่องจากมีความแปรปรวนและความกำกวมสูงในแต่ละคน นั่นคือจุดที่แมชชีนเลิร์นนิงช่วยแก้ปัญหาและปูทางสำหรับการรู้จำลายมือ เนื่องจากเป็นสาขาที่พัฒนาตลอดเวลา เครื่องมือที่เรามีในปัจจุบันสำหรับการรู้จำลายมือจึงมีความซับซ้อนมากขึ้นเท่านั้น ส่งผลให้กลยุทธ์มีการพัฒนามากขึ้น