การรู้จำลายมือด้วยการเรียนรู้ของเครื่อง

เผยแพร่แล้ว: 2022-06-01

การรู้จำลายมือเป็นเพียงความสามารถของเครื่องหรือคอมพิวเตอร์ในการเขียนด้วยลายมือ จากแหล่งข้อมูลทางกายภาพและดิจิทัลต่างๆ และตีความว่าเป็นข้อความบนหน้าจอ อินพุตอาจอยู่ในรูปของรูปภาพที่มีข้อความที่เขียนด้วยลายมือ ในกรณีนั้น ก่อนอื่นต้องส่งผ่านซอฟต์แวร์การจดจำรูปแบบหรือซอฟต์แวร์การรู้จำแบบเรียลไทม์สำหรับการสแกนด้วยแสง

การรู้จำลายมือทำให้เครื่องสามารถอ่านลายมือเป็นข้อความจริงและแปลงเป็นรูปแบบดิจิทัลได้ การรู้จำลายมือเป็นที่แพร่หลาย ตั้งแต่กรณีของผู้บริโภค เช่น การอ่านข้อความจากการเขียนด้วยสไตลัสหรือแอปพลิเคชันกล้อง ไปจนถึงการวิจัยทางวิชาการเกี่ยวกับวิธีการทำงานของการรู้จำลายมือในมนุษย์

ก่อนการจดจำลายมือ มีการจดจำข้อความ Optical Character Recognition (OCR) เป็นเทคนิคการจดจำข้อความที่เป็นกระแสหลักและเป็นที่รู้จักกันดี OCR เป็นรูปแบบหนึ่งของการจดจำภาพที่จดจำตัวอักษรของลายมือแทนรูปร่าง ใบหน้า หรือจุดสังเกต ซึ่งทำให้แตกต่างจากการรู้จำลายมือจากการเรียนรู้ของเครื่องหรือการเรียนรู้เชิงลึก

สารบัญ

การรู้จำลายมือ – ต่างจาก OCR อย่างไร?

OCR ทำงานในการสแกนเอกสารและจดจำแบบอักษร ในขณะที่การรู้จำลายมือเป็นวิธีที่ชาญฉลาดกว่าและมีประสิทธิภาพมากกว่าด้วยกรณีการใช้งานและเทคนิคอื่นๆ ที่แตกต่างกัน ข้อเสียเปรียบหลักของ OCR คือฟอนต์จำนวนจำกัด แต่แต่ละคนมีสไตล์การเขียนที่แตกต่างกัน ดังนั้น แทนที่จะได้รับการฝึกอบรมในระดับอักขระให้รู้จักแบบอักษรเพื่อสร้างข้อความในคอมพิวเตอร์ อัลกอริธึมการรู้จำลายมือจึงใช้วิธีอัตโนมัติมากขึ้นโดยใช้การเรียนรู้ของเครื่อง

ในขณะที่แกนหลัก การรู้จำลายมือยังวิเคราะห์คำ อักขระ และตัวอักษรด้วย แต่ทำในลักษณะอัลกอริธึมมากขึ้นด้วยการแสดง "การจับคู่ที่ดีที่สุด" จากชุดตัวอักษร ด้วยเหตุนี้ เทคนิคการรู้จำลายมือจึงต้องทำงานกับคำและตัวอักษรต่างๆ ที่ OCR สามารถหลีกเลี่ยงได้ง่าย

ในการบรรลุงานที่ยากนี้ เทคนิคการรู้จำลายมือจะใช้เทคนิคการเรียนรู้ของเครื่อง เช่น คอมพิวเตอร์วิทัศน์และการเรียนรู้เชิงลึกเพื่อสร้างแบบจำลองนามธรรมของคำและตัวอักษร สิ่งนี้เป็นไปตามขั้นตอนการเขียนด้วยลายมือของมนุษย์เรา ซึ่งเราสามารถระบุตัวอักษรและคำได้ แม้ว่าจะเขียนในลักษณะที่บิดเบี้ยวหรืออ่านไม่ออกก็ตาม อัลกอริทึมเหล่านี้สามารถจดจำลายมือได้แนบเนียนยิ่งขึ้นโดยไร้ข้อจำกัดมากมาย

ด้วยการเรียนรู้เชิงลึก ประสิทธิภาพการรู้จำลายมือจึงมาไกลในระยะเวลาอันสั้น ในขณะที่รูปแบบการรู้จำลายมือแบบเก่าต้องการความช่วยเหลืออย่างมากในรูปแบบของพจนานุกรมและบริบทอื่นๆ การรู้จำแบบอาศัยการเรียนรู้เชิงลึกสามารถถอดความข้อมูลเต็มหน้าโดยไม่ต้องมีความช่วยเหลือใด ๆ และทำได้อย่างน่าเชื่อถือ

อย่างไรก็ตาม เนื่องจากประเภทและรูปแบบของการเขียนด้วยลายมือมีความแตกต่างกันอย่างมาก ประสิทธิภาพของการรู้จำลายมือโดยทั่วไปจึงลดลง และเพิ่มขึ้นเรื่อยๆ เมื่อเทียบกับเทคนิค OCR ที่ใช้กับการจดจำแบบอักษรเป็นหลัก

สำรวจหลักสูตรของเราเกี่ยวกับการเรียนรู้ของเครื่องและปัญญาประดิษฐ์

การรับรองขั้นสูงในการเรียนรู้ของเครื่องและคลาวด์จาก IITM วิทยาศาสตรมหาบัณฑิตสาขาวิชา Machine Learning & AI จาก LJMU Executive Post Graduate Program in Machine Learning & AI จาก IITB
โปรแกรมประกาศนียบัตรขั้นสูงในการเรียนรู้ของเครื่อง & NLP จาก IIITB โปรแกรมประกาศนียบัตรขั้นสูงในการเรียนรู้ของเครื่องและการเรียนรู้เชิงลึกจาก IIITB โปรแกรมใบรับรองขั้นสูงใน AI สำหรับผู้จัดการจาก IITR

มาพูดถึงความสัมพันธ์ระหว่างการรู้จำลายมือกับการเรียนรู้ของเครื่องกัน

ความสำคัญของการรู้จำลายมือด้วยการเรียนรู้ของเครื่อง

การคัดลอกข้อมูลที่เขียนด้วยลายมือจำนวนมากขึ้นเรื่อยๆ ด้วยตนเองนั้นเป็นงานที่น่ากลัวและแทบจะเป็นไปไม่ได้เลย นอกจากนี้ ด้วยเครื่องมือดิจิทัลมากมายที่เรามีอยู่ การจัดเตรียมผู้คนให้สามารถเขียนบนหน้าจอราวกับว่ามันเป็นกระดาษ และคอมพิวเตอร์สามารถอ่าน ตีความ และจัดเก็บด้วยตนเองได้ นี่เป็นเพียงหนึ่งในกรณีการใช้งานของการรู้จำลายมือด้วยการเรียนรู้ของเครื่อง และรายการจะยาวขึ้นและสมบูรณ์ยิ่งขึ้นเท่านั้น เครื่องมือและระบบการรู้จำลายมือแบบอัตโนมัติสามารถขจัดเวลาจำนวนมากที่เสียไปในการถอดความข้อความจำนวนมาก นอกจากนี้ยังสามารถปูทางสำหรับการวิจัยขั้นสูงในการรู้จำลายมือด้วยการเรียนรู้ของเครื่อง

การรู้จำลายมือใช้การเรียนรู้ของเครื่องในความหมายกว้าง การรู้จำลายมือสร้างขึ้นจากปัญญาประดิษฐ์ การมองเห็นด้วยคอมพิวเตอร์ การรู้จำอักขระ และการรู้จำรูปแบบในบริบทที่เฉพาะเจาะจงมากขึ้น อัลกอริธึมหรือระบบใดๆ ที่เรียนรู้ที่จะจดจำลายมือเขียนสามารถตรวจจับและเข้าใจรูปแบบจากรูปภาพ อุปกรณ์ ฯลฯ และแปลงเป็นรูปแบบที่เครื่องอ่านได้โดยไม่สูญเสียข้อมูลใดๆ

แม้ว่าจะมีอัลกอริธึม แบบจำลอง เทคนิค และกลยุทธ์การเรียนรู้ด้วยลายมือที่แตกต่างกันออกไป ในบริบทกว้างๆ อัลกอริธึมการรู้จำลายมือจะมีองค์ประกอบต่อไปนี้:

  • อัลกอริทึมการรู้จำอักขระ:

    อัลกอริทึมเหล่านี้จำเป็นสำหรับการประมวลผลภาพล่วงหน้า การแยกคุณลักษณะจากข้อความ/รูปภาพ/เอกสาร และจัดประเภทให้เป็นหมวดหมู่ที่ถูกต้อง อัลกอริทึมเหล่านี้มักใช้ในลำดับที่กล่าวถึง ตัวอย่างเช่น การประมวลผลภาพล่วงหน้าก่อนการแยกคุณลักษณะทำให้กระบวนการราบรื่นขึ้น ในขณะที่การแยกคุณลักษณะสนับสนุนการจัดประเภทที่ดีและแม่นยำยิ่งขึ้น

  • การประมวลผลภาพล่วงหน้า:

    การประมวลผลภาพล่วงหน้าเป็นหนึ่งในงานที่สำคัญในไปป์ไลน์การรู้จำลายมือทั้งหมด เพื่อการทำนายตัวอักษรอย่างแม่นยำ การประมวลผลล่วงหน้าโดยทั่วไปจะช่วยขจัดสัญญาณรบกวน แบ่งภาพ ดำเนินการทำความสะอาด ปรับขนาด ครอบตัด การปรับขนาด และอื่นๆ เนื่องจากการจับภาพดิจิทัลและการแปลงเพื่อจัดเก็บภาพทำให้เกิดสัญญาณรบกวนจำนวนมากในภาพ การประมวลผลล่วงหน้าจึงเป็นขั้นตอนที่จำเป็นในการระบุวัตถุที่สำคัญในภาพทั้งหมดและสัญญาณรบกวนที่สามารถหลีกเลี่ยงและกำจัดได้ แนวคิดคือการกำจัดสัญญาณรบกวนให้มากที่สุดเพื่อให้กระบวนการต่อไปง่ายขึ้น

  • การแบ่งส่วน:

    ในขั้นตอนการแบ่งส่วน อัลกอริธึมจะแบ่งอักขระในภาพย่อยของอักขระแต่ละตัวที่แตกต่างกัน เราจะไม่ลงลึกในด้านเทคนิคของเรื่องนี้ เพราะมันอยู่นอกเหนือขอบเขตของการสนทนานี้!

  • การแยกคุณสมบัติ:

    ตามคุณสมบัติ เราหมายถึงคุณสมบัติที่วัดได้ทั้งหมดจากข้อมูลอินพุตที่ใช้ในการจัดประเภทและวิเคราะห์ข้อมูล การแยกคุณลักษณะเป็นสิ่งจำเป็นสำหรับการระบุคุณลักษณะที่เกี่ยวข้องและการเลือกปฏิบัติอินสแตนซ์ที่เป็นอิสระจากกัน

  • การจำแนกประเภทและการรับรู้:

    ในขั้นตอนนี้ อัลกอริธึมจะทำการตัดสินใจขั้นสุดท้ายของการป้อนข้อมูลด้วยลายมือที่ได้รับ ทำได้โดยใช้โครงข่ายประสาทเทียมหรือตัวแยกประเภทอื่นๆ

อ่านบทความยอดนิยมของเราเกี่ยวกับการเรียนรู้ของเครื่องและปัญญาประดิษฐ์

IoT: ประวัติศาสตร์ ปัจจุบัน และอนาคต บทช่วยสอนการเรียนรู้ของเครื่อง: เรียนรู้ ML อัลกอริทึมคืออะไร? ง่ายและสะดวก
เงินเดือนวิศวกรหุ่นยนต์ในอินเดีย: บทบาททั้งหมด วันหนึ่งในชีวิตของวิศวกรแมชชีนเลิร์นนิง: พวกเขาทำอะไร? IoT คืออะไร (Internet of Things)
การเปลี่ยนแปลงและการรวมกัน: ความแตกต่างระหว่างการเปลี่ยนแปลงและการรวมกัน แนวโน้ม 7 อันดับแรกในปัญญาประดิษฐ์และการเรียนรู้ของเครื่อง แมชชีนเลิร์นนิงกับ R: ทุกสิ่งที่คุณต้องรู้

สรุปแล้ว

แมชชีนเลิร์นนิงเป็นสาขาที่น่าสนใจซึ่งมีโอกาสมากมายสำหรับทั้งการวิจัยและนวัตกรรม แม้ว่าจะดูยากหากคุณเป็นมือใหม่ แต่จะง่ายขึ้นเมื่อคุณทำตามขั้นตอนแรก

หากคุณสนใจในคอมพิวเตอร์ คณิตศาสตร์ เครื่องจักร หรือแม้แต่จิตวิทยา หรือเพียงแค่ต้องการทำความเข้าใจว่าแมชชีนเลิร์นนิงทำงานอย่างไร ลองดู Masters of Science in Machine Learning และ AI ซึ่งนำเสนอร่วมกับ IIIT Bangalore ด้วยกรณีศึกษามากกว่า 15 กรณี วิชาเลือก 3 วิชาให้เลือก และการให้คำปรึกษาด้านอาชีพแบบตัวต่อตัว โปรแกรมของเราได้รับการออกแบบมาเพื่อช่วยให้ทุกคน ตั้งแต่นักศึกษาใหม่ไปจนถึงมืออาชีพที่มีประสบการณ์ ขยายเส้นทางการเรียนรู้ของเครื่องให้สูงขึ้น

เข้าร่วม หลักสูตรการเรียนรู้ของเครื่อง จากมหาวิทยาลัยชั้นนำของโลก รับ Masters, Executive PGP หรือ Advanced Certificate Programs เพื่อติดตามอาชีพของคุณอย่างรวดเร็ว

อัลกอริธึมการเรียนรู้ของเครื่องใดดีที่สุดสำหรับงานจดจำลายมือ

ตัวแยกประเภท SVM นั้นแม่นยำที่สุดในแง่ของความแม่นยำ ดังนั้นจึงเป็นอัลกอริธึมที่ดีที่สุดสำหรับงานจดจำลายมือ

ซอฟต์แวร์รู้จำลายมือทำงานอย่างไร

ซอฟต์แวร์การรู้จำลายมือใช้การจับคู่รูปแบบ ซึ่งจะแปลงลายมือเป็นข้อความในคอมพิวเตอร์แบบเรียลไทม์

เหตุใดจึงต้องมีการจดจำลายมือด้วยการเรียนรู้ของเครื่อง

ก่อนแมชชีนเลิร์นนิง OCR เป็นเทคนิคพื้นฐานสำหรับการจดจำอักขระ ทำงานได้ดีสำหรับอักขระที่พิมพ์เพื่อให้ตรงกับแบบอักษรและอ่าน อย่างไรก็ตาม มันล้มเหลวในการจดจำลายมือของมนุษย์ เนื่องจากมีความแปรปรวนและความกำกวมสูงในแต่ละคน นั่นคือจุดที่แมชชีนเลิร์นนิงช่วยแก้ปัญหาและปูทางสำหรับการรู้จำลายมือ เนื่องจากเป็นสาขาที่พัฒนาตลอดเวลา เครื่องมือที่เรามีในปัจจุบันสำหรับการรู้จำลายมือจึงมีความซับซ้อนมากขึ้นเท่านั้น ส่งผลให้กลยุทธ์มีการพัฒนามากขึ้น