الترجمة الآلية في البرمجة اللغوية العصبية: أمثلة وتدفق ونماذج

نشرت: 2021-01-21

جدول المحتويات

مقدمة

هناك أكثر من 6500 لغة معترف بها في العالم. لقد شعرت بالحاجة إلى الوقت لفهم المورد المكتوب عبر الثقافات. في هذه المحاولة ، تمت ترجمة العديد من الكتب القديمة إلى اللغات المحلية وحفظها للرجوع إليها.

السنسكريتية ، على سبيل المثال ، يقال إن اللغة القديمة للتراث الهندوسي لديها معلومات مفيدة عن العصور القديمة. هذا لأن قلة قليلة منهم يعرفون اللغة السنسكريتية. من المحتمل أن تعتمد على آلية ما للحصول على معلومات من الكتب المقدسة والمخطوطات.

في كثير من الأحيان نريد أن تفهم أجهزة الكمبيوتر اللغة الطبيعية. الشيء الجيد في أجهزة الكمبيوتر هو أنها تستطيع الحساب بشكل أسرع من البشر. ومع ذلك ، فإن التحدي المتمثل في تعلم لغة طبيعية من الصعب جدًا تكراره على نموذج حسابي.

الترجمة الآلية

يشير مصطلح "الترجمة الآلية" (MT) إلى الأنظمة المحوسبة المسؤولة عن إنتاج الترجمات بمساعدة بشرية أو بدونها. يستثني أدوات الترجمة القائمة على الكمبيوتر التي تدعم المترجمين من خلال توفير الوصول إلى القواميس عبر الإنترنت ، وبنوك بيانات المصطلحات عن بُعد ، ونقل النصوص واستلامها ، وما إلى ذلك.

قبل عصر تقنية الذكاء الاصطناعي ، تم تطوير برامج الكمبيوتر للترجمة الآلية للنص من لغة إلى أخرى. في السنوات الأخيرة ، تم تكليف الذكاء الاصطناعي بإجراء الترجمة الآلية أو الآلية لسلاسة اللغات البشرية وتعدد استخدامات النصوص واللهجات والاختلافات. تعتبر الترجمة الآلية تحديًا نظرًا للغموض والمرونة المتأصلين في لغة الإنسان.

ما هو البرمجة اللغوية العصبية؟

تعد معالجة اللغة الطبيعية (NLP) أحد فروع انتشار تقنية الذكاء الاصطناعي (AI). يهتم هذا التخصص بإنشاء نماذج حسابية تعالج اللغة الطبيعية وتفهمها. تعمل نماذج NKP بشكل أساسي على جعل الكمبيوتر يفهم التجميع الدلالي للأشياء (على سبيل المثال ، الكلمات "القط والكلب" تشبه إلى حد بعيد الكلمات "القط والخفافيش") ، والنص إلى الكلام ، وترجمة اللغة ، وما إلى ذلك.

تجعل معالجة اللغة الطبيعية (NLP) نظام الكمبيوتر يستخدم ويفسر ويفهم اللغات البشرية والكلام اللفظي ، مثل الإنجليزية أو الألمانية أو "لغة طبيعية" أخرى. يتم مشاهدة مجموعة من تطبيقات البرمجة اللغوية العصبية في الممارسة العملية اليوم.

يتم تجميعها عادةً في حالات الاستخدام ذات الصلة ، مثل التعرف على الكلام وأنظمة الحوار واسترجاع المعلومات والإجابة على الأسئلة ، وقد بدأت الترجمة الآلية في إعادة تشكيل طريقة تحديد الأشخاص واسترجاعهم واستخدامهم لمورد المعلومات.

أمثلة البرمجة اللغوية العصبية

  • تعمل أنظمة التعرف على الصوت / الكلام ، أو أنظمة الاستعلام مثل Siri ، على السؤال وتعيد الإجابة. هنا تقوم بإدخال الصوت إلى الكمبيوتر ، ويفهم رسالتك.
  • برامج الكمبيوتر التي تقرأ التقارير المالية بلغة إنجليزية بسيطة وتنتج أرقامًا (على سبيل المثال ، معدل التضخم).
  • بوابة الوظائف التي تسترجع تفاصيل المرشح وتستأنف الإنشاءات التلقائية والتقدم للوظيفة المطابقة للمهارات.
  • تعالج خدمة الترجمة من Google النص في سلسلة الإدخال وتعيينه بلغة لترجمته بسرعة.
  • تقوم محركات البحث الشبيهة بجوجل بإرجاع المستندات الخاصة بك بعد كتابة كلمة للموضوع في مربع البحث. على سبيل المثال ، عند البحث عن Tajmahal ، تمنحك Google المستندات التي تحتوي على Tajmahal كقطعة أثرية وحتى علامة تجارية "Tajmahal". هنا ، يتم أخذ المرادفات الإنجليزية وأنماط الجمع الإنجليزية في الاعتبار.

تدفق البرمجة اللغوية العصبية

معالجة اللغة الطبيعية هي نوع من الذكاء الاصطناعي. إذا كنت ترغب في بناء برنامج البرمجة اللغوية العصبية ، يمكنك البدء في كتابة قواعد مثل "تجاهل s في نهاية الكلمة". هذه هي الطريقة القديمة لفعل الأشياء ، وتسمى بالنهج "القائم على القواعد".

ومع ذلك ، فإن الأساليب الأكثر تقدمًا تستخدم التعلم الإحصائي ، حيث تقوم ببرمجة جهاز الكمبيوتر الخاص بك لتعلم الأنماط في اللغة الإنجليزية. إذا قمت بذلك ، يمكنك كتابة برنامجك مرة واحدة فقط وتدريبه على العمل بالعديد من اللغات البشرية.

الهدف من البرمجة اللغوية العصبية هو جعل اللغات البشرية مفهومة بحيث يمكن لآلية مبرمجة تفسير وفهم المخطوطات. هنا ، الآلية المبرمجة التي نسميها آلة ، والمخطوطة هي نص اللغة الذي يتم تغذيته للبرنامج. وهكذا يستخرج البرنامج المحوسب البيانات اللغوية في شكل معرفة رقمية.

تقوم الآلة ، بدلاً من نماذج التعلم الإحصائي ، بتحويل سمات اللغة إلى نهج إحصائي قائم على القواعد يهدف إلى معالجة مشاكل محددة وأداء مهمة معالجة اللغة.

في العديد من الأنظمة القديمة ، لا سيما تلك الخاصة بنوع "الترجمة المباشرة" ، لم تكن مكونات التحليل والنقل والتركيب دائمًا مفصولة بوضوح. كما قام بعضهم أيضًا بخلط البيانات (القاموس والقواعد) ومعالجة القواعد والإجراءات.

أظهرت الأنظمة الجديدة درجات نمطية مختلفة ، لذلك يمكن تكييف مكونات النظام والبيانات والبرامج وتغييرها دون الإضرار بكفاءة النظام الإجمالية. هناك مرحلة أخرى في بعض الأنظمة الحديثة وهي إمكانية عكس مكونات التحليل والتركيب ، أي أن البيانات والتحويلات المستخدمة في تحليل لغة معينة يتم تطبيقها بشكل عكسي عند إنشاء نصوص بتلك اللغة. تعرف على المزيد حول تطبيقات معالجة اللغة الطبيعية.

تطور الترجمة الآلية

حتى أواخر الثمانينيات ، تم إجراء بحث كبير في الترجمة الآلية خلال هذه المرحلة ، عندما تم تطوير أول أنظمة الترجمة الآلية الإحصائية (SMT).

تقليديًا ، تم استخدام الأنظمة المستندة إلى القواعد لهذه المهمة ، وتم استبدالها لاحقًا في التسعينيات بأساليب إحصائية. في الآونة الأخيرة ، وصلت نماذج الشبكة العصبية العميقة لتحقيق أحدث النتائج في مجال يُطلق عليه بحق الترجمة الآلية العصبية.

حلت الترجمة الآلية الإحصائية محل الأنظمة الكلاسيكية القائمة على القواعد بنماذج تتعلم الترجمة من الأمثلة.

تناسب نماذج الترجمة الآلية العصبية نموذجًا واحدًا بدلاً من خط الأنابيب المكرر وتحقق حاليًا أحدث النتائج. منذ أوائل عام 2010 ، تخلى هذا المجال عن الأساليب الإحصائية إلى حد كبير ثم تحول إلى الشبكات العصبية للتعلم الآلي.

وصلت العديد من النجاحات المبكرة الملحوظة في الأساليب الإحصائية في البرمجة اللغوية العصبية إلى الترجمة الآلية ، والتي تهدف إلى العمل في IBM Research. كانت هذه الأنظمة قادرة على الاستفادة من الهيئات النصية متعددة اللغات الحالية التي أصدرها البرلمان الكندي والاتحاد الأوروبي كنتيجة للقوانين التي تتطلب ترجمة جميع الإجراءات الحكومية إلى مختلف اللغات الرسمية للأنظمة الحكومية المقابلة.

ومع ذلك ، كانت العديد من الأنظمة الأخرى تعتمد على الشركات التي تم تطويرها خصيصًا للمهام التي تنفذها هذه الأنظمة ، والتي كانت ولا تزال قيدًا رئيسيًا على تطوير الأنظمة. لذلك ، ظهرت الحاجة إلى قدر كبير من البحث في طرق التعلم الفعال من البيانات المحدودة.

على سبيل المثال ، يؤكد مصطلح الترجمة الآلية العصبية (NMT) على أن المناهج القائمة على التعلم العميق للترجمة الآلية تتعلم مباشرة تحويلات التسلسل إلى التسلسل ، مما يغني عن الحاجة إلى خطوات وسيطة مثل محاذاة الكلمات ونمذجة اللغة التي تم استخدامها في الترجمة الآلية الإحصائية (سمت). بدأت Google في استخدام هذا النموذج في الإنتاج لـ Google Translate في أواخر عام 2016.

التسلسل إلى نموذج التسلسل

عادة ، يتكون نموذج التسلسل إلى التسلسل من جزأين ؛ أولاً ، جهاز تشفير ، وثانيًا ، وحدة فك ترميز. إنهما نموذجان مختلفان للشبكات العصبية يعملان جنبًا إلى جنب كشبكة واحدة كبيرة.

ثم يقوم جزء وحدة فك التشفير من النموذج بإنشاء تسلسل معيّن في الإخراج. يقوم برنامج فك التشفير بتشفير السلسلة ويضيف معنى إلى التسلسل في التمثيل. يقوم نهج التشفير وفك التشفير ، للترجمة الآلية العصبية ، بترميز سلسلة الإدخال الكاملة للجملة إلى متجه محدود الطول من حيث يتم فك تشفير الترجمة.

على نطاق واسع ، تتمثل وظيفة شبكة التشفير في قراءة وتحليل تسلسل الإدخال لتكوين معنى ثم إنشاء تمثيل صغير الأبعاد لسلسلة الإدخال. يقوم النموذج بعد ذلك بإعادة توجيه هذا التمثيل إلى شبكة مفكك التشفير.

The Encoder - Decoder LSTM عبارة عن شبكة عصبية متكررة مصممة لمعالجة مشاكل التسلسل إلى التسلسل ، والتي تسمى أحيانًا seq2seq. الذاكرة طويلة المدى (LSTM) هي بنية شبكة عصبية اصطناعية متكررة (RNN) مستخدمة في التعلم العميق.

على سبيل المثال ، عندما تكون السلسلة في تسلسل الإدخال هي "ما هذا المكان" ، فبعد تحليل تسلسل الإدخال هذا من خلال شبكة وحدة فك التشفير ، تقوم بتوليف السلسلة باستخدام كتل LSTM (نوع من بنية RNN). يولد كلمات في التسلسل في كل خطوة من خطوات تكرار وحدة فك التشفير.

بعد الحلقة الإجمالية للتكرار ، يتم إنشاء تسلسل الإخراج ، قل شيئًا مثل "هذا المكان هو بيون". شبكة LSTM مناسبة للتصنيف بناءً على القواعد ، وتحليل لمعالجة المدخلات وإجراء تنبؤات باستخدام أمثلة البيانات المدربة.

نموذج الاهتمام

نموذج "الانتباه" ، الذي أدى إلى تحسين جودة أنظمة الترجمة الآلية بشكل كبير. يسمح الانتباه للنموذج بالتركيز على الأجزاء ذات الصلة من تسلسل الإدخال حسب الحاجة.

يختلف نموذج الانتباه عن نموذج التسلسل إلى التسلسل الكلاسيكي بطريقتين رئيسيتين:

  • يقوم المشفر بتمرير المزيد من البيانات إلى وحدة فك التشفير. بدلاً من اجتياز آخر حالة مخفية لمرحلة التشفير ، يمرر المشفر جميع الحالات المخفية إلى وحدة فك التشفير.
  • يقوم مفكك تشفير الانتباه بخطوة إضافية قبل إنتاج مخرجاته.

نموذج المحولات

لا يمكن موازاة الحساب المتسلسل حيث يتعين علينا انتظار الخطوة السابقة حتى تنتهي قبل الانتقال إلى الخطوة التالية. يؤدي هذا إلى إطالة وقت التدريب والوقت المستغرق لتشغيل الاستدلال. إحدى الطرق للتغلب على المعضلة المتسلسلة هي استخدام الشبكات العصبية التلافيفية (CNNs) بدلاً من الشبكات العصبية التلافيفية. المحول هو نموذج يستخدم الانتباه لزيادة السرعة. وبشكل أكثر تحديدًا ، يستخدم الاهتمام الذاتي. هنا ، يتكون كل برنامج تشفير من طبقتين:

  • الاهتمام الذاتي
  • شبكة التغذية العصبية إلى الأمام

تستخدم المحولات الشبكات العصبية التلافيفية مع نماذج الانتباه للترجمة الآلية. المحولات هي نوع من هندسة الشبكات العصبية التي تكتسب شعبية. تم استخدام Transformers مؤخرًا بواسطة OpenAI في نماذج لغتهم واستخدمتها مؤخرًا DeepMind لـ AlphaStar ، برنامجهم لهزيمة لاعب Starcraft محترف. تتفوق المحولات على نموذج الترجمة الآلية العصبية من Google في مهام محددة.

خاتمة

باختصار ، تتيح آلية الانتباه الذاتي في النظام تباين المدخلات للتفاعل مع بعضها البعض ("الذات") وتتيح لهم تحديد من يجب أن ينتبهوا إليه أكثر ("الاهتمام"). وبالتالي ، فإن النواتج المعالجة هي مجاميع من هذه التفاعلات ويتم ترجيحها بدرجات الانتباه.

يساعد الفهم الأساسي لـ MT في البرمجة اللغوية العصبية (NLP) محللي البيانات وعلماء البيانات على إعداد أنفسهم للقيام بمشاريع مرموقة تتضمن مشاريع في مجال البرمجة اللغوية العصبية للذكاء الاصطناعي. الدورات التدريبية في هذا الموضوع ، من قبل مقدمي الخدمات مثل upGrad ، تساعد في المضي قدمًا. العلامة التجارية upGrad هي عبارة عن منصة للتعليم العالي عبر الإنترنت توفر مجموعة واسعة من البرامج ذات الصلة بالصناعة الجاهزة لقيادة نجاحك المهني.

إذا كنت مهتمًا بمعرفة المزيد حول التعلم الآلي والذكاء الاصطناعي ، فراجع IIIT-B & upGrad's دبلوم PG في التعلم الآلي والذكاء الاصطناعي المصمم للمهنيين العاملين ويقدم أكثر من 450 ساعة من التدريب الصارم ، وأكثر من 30 دراسة حالة ومهمة ، حالة خريجي IIIT-B ، أكثر من 5 مشاريع تكميلية عملية ومساعدة وظيفية مع أفضل الشركات.

تعلم دورة ML من أفضل الجامعات في العالم. احصل على درجة الماجستير أو برنامج PGP التنفيذي أو برامج الشهادات المتقدمة لتسريع مسار حياتك المهنية.

س 1. ما هي أنواع الترجمة الآلية في البرمجة اللغوية العصبية؟

الترجمة الآلية ، المعروفة أيضًا باسم الترجمة الآلية ، هي العملية التي تقوم فيها أجهزة الكمبيوتر أو الآلات بترجمة كميات هائلة من النص بشكل مستقل وبسرعة من لغة مصدر معينة إلى لغة مستهدفة دون أي جهد يبذله البشر. بمعنى آخر ، تعمل الترجمة الآلية من خلال استخدام تطبيق يساعد في ترجمة النص من لغة إدخال إلى أخرى. هناك أربعة أنواع مختلفة من الترجمة الآلية في البرمجة اللغوية العصبية: الترجمة الآلية الإحصائية ، والترجمة الآلية القائمة على القواعد ، والترجمة الآلية الهجينة ، والترجمة الآلية العصبية. تتمثل الميزة الرئيسية للترجمة الآلية في تقديمها لمجموعة فعالة من السرعة والفعالية من حيث التكلفة.

س 2. هل البرمجة اللغوية العصبية هو نفسه الذكاء الاصطناعي؟

كما قال بعض الخبراء ، فإن الذكاء الاصطناعي هو في الأساس النسخ المحوسب للذكاء البشري ، والذي يمكن ضبطه لاتخاذ القرارات وتنفيذ عمليات معينة والتعلم من النتائج. وعندما تركز الذكاء الاصطناعي على علم اللغة البشري ، فإنه ينتج البرمجة اللغوية العصبية. لذا ، فإن البرمجة اللغوية العصبية هو حقل فرعي من الذكاء الاصطناعي ، والذي يمكّن البشر من التحدث إلى الآلات. مرة أخرى ، البرمجة اللغوية العصبية هي تلك المجموعة الفرعية من الذكاء الاصطناعي التي تمكن أجهزة الكمبيوتر من فهم وتفسير ومعالجة اللغة البشرية وأداء مهام محددة. بمساعدة البرمجة اللغوية العصبية ، يمكن لأجهزة الكمبيوتر اكتشاف العبارات والكلمات الرئيسية ، والاستشعار بالغرض من اللغة ، وترجمتها بدقة لتوليد استجابة مناسبة.

س 3. هل البرمجة اللغوية العصبية مجال وظيفي جيد؟

تطورت البرمجة اللغوية العصبية (NLP) باعتبارها تقنية ثورية في مجال علم البيانات والذكاء الاصطناعي خلال الآونة الأخيرة. تعد الزيادة في استخدام الأجهزة الذكية واعتماد الحلول السحابية وتطوير تطبيقات البرمجة اللغوية العصبية لتحسين تجربة خدمة العملاء من المساهمين الرئيسيين في التوسع المفاجئ في سوق البرمجة اللغوية العصبية. تشير الدراسات إلى أن البرمجة اللغوية العصبية هي واحدة من أعلى سبع مهارات فنية مطلوبة في عام 2021 ، ومن المتوقع أن يتجاوز حجم السوق 34 مليار دولار بمعدل نمو سنوي مركب يقارب 22 بالمائة. متوسط ​​الراتب لمتخصصي البرمجة اللغوية العصبية (NLP) يتراوح ما بين 80 ألف دولار إلى 110 آلاف دولار سنويًا في الولايات المتحدة.