تحليل التبعية في البرمجة اللغوية العصبية [موضح بالأمثلة]

نشرت: 2021-03-10

معالجة اللغة الطبيعية هي مفهوم متعدد التخصصات يأخذ أساسيات اللغويات الحاسوبية والذكاء الاصطناعي لفهم كيفية تفاعل اللغات البشرية مع التكنولوجيا.

يتطلب البرمجة اللغوية العصبية (NLP) فهمًا عميقًا للمصطلحات والمفاهيم المختلفة لتطبيقها بشكل ملموس على سيناريوهات العالم الحقيقي. تتضمن بعض هذه المفاهيم الأساسية علامات جزء من الكلام (POS) ، ونمذجة اللغة الإحصائية ، والتحليل النحوي والدلالي والمشاعر ، والتطبيع ، والترميز ، وتحليل التبعية ، وتحليل الدائرة الانتخابية ، من بين أمور أخرى.

في هذه المقالة ، سنلقي نظرة على أساسيات تحليل التبعية للحصول على منظور حول كيفية تنفيذه في البرمجة اللغوية العصبية.

جدول المحتويات

الاعراب التبعية

يشير تحليل التبعية (DP) إلى فحص التبعيات بين كلمات الجملة لتحليل بنيتها النحوية. بناءً على ذلك ، يتم تقسيم الجملة إلى عدة مكونات. تعتمد الآلية على مفهوم أن هناك صلة مباشرة بين كل وحدة لغوية في الجملة. تسمى هذه الروابط التبعيات.

لنأخذ على سبيل المثال الجملة " أفضل الرحلة الصباحية عبر دنفر."

يوضح الرسم البياني أدناه هيكل التبعية للجملة:

مصدر

يشار إلى العلاقات بين كل وحدة لغوية أو كلمة في الجملة باستخدام أقواس موجهة في بنية تبعية مكتوبة. كما هو موضح في الرسم التخطيطي ، فإن جذر الشجرة "يفضل" يشكل رأس الجملة أعلاه.

يتم تمييز العلاقة بين أي كلمتين بعلامة تبعية. على سبيل المثال ، كلمة "flight" تعدل معنى الاسم "دنفر". لذلك ، يمكنك ملاحظة التبعية من الرحلة -> دنفر حيث تكون الرحلة هي الرأس ودنفر هي الطفل أو المعال. يتم الإشارة إليه بواسطة nmod الذي يمثل معدلًا اسميًا.

هذا يشكل حالة التبعية بين كل كلمتين حيث تعمل إحداهما كرأس والأخرى هي التابعة. حاليًا ، يتكون تصنيف التبعية العالمية V2 من 37 علاقة نحوية عالمية كما هو محدد في الجدول أدناه:

علامة التبعية وصف
acl معدّل كلبيّ لاسم (جملة adnominal)
acl: relcl معدل شرط نسبي
advcl معدل شرط الظرف
advmod معدل الظرف
advmod: emph التأكيد على الكلمة ، المكثف
advmod: lmod معدل الظرف الموضعي
amod معدل صفة
أبوس المعدل الوضعي
مساعد مساعد
aux: تمرير المساعد السلبي
قضية وضع علامات الحالة
نسخة تنسيق الاقتران
سم مكعب: preconj ملتزم
كومب تكملة جماعية
clf مصنف
مجمع مجمع
المركب: lvc بناء الفعل الخفيف
المركب: prt جسيمات فعلية
المركب: redup مركبات مكررة
المركب: svc مركبات الأفعال التسلسلية
معا اقتران
شرطي كوبولا
csubj موضوع جماعي
csubj: تمرير موضوع سلبي جماعي
قسم تبعية غير محددة
Det المحدد
det: numgov المُحدِّد الكمّي الذي يحكم حالة الاسم
det: nummod المُحدِّد الكمّي المتوافق مع الاسم
det: بوس محدد ملكية
الحوار عنصر الخطاب
مخلوع عناصر مخلوعة
شرح كلمة بذيئة
اكسبلور: العارضات كلمة بذيئة غير شخصية
expl: تمرير الضمير الانعكاسي المستخدم في الانعكاسي المبني للمجهول
اكسبلور: الكهروضوئية clitic انعكاسي مع فعل انعكاسي بطبيعته
مثبت تعبير متعدد الكلمات ثابت
عريضة تعبير مسطح متعدد الكلمات
شقة: أجنبي كلمات اجنبية
شقة: الاسم الأسماء
يذهب مع يتماشى مع
iobj عنصر غير مباشر
قائمة قائمة
علامة علامة
نمود المعدل الاسمي
نمود: بوس المعدل الاسمي الملكية
nmod: tmod المعدل الزمني
نسوبج الموضوع الاسمي
nsubj: تمرير الموضوع الاسمي السلبي
نومود معدل رقمي
nummod: gov معدل رقمي يحكم حالة الاسم
الهدف هدف
إلزام اسمي مائل
Obel: وكيل معدل الوكيل
Obl: arg حجة مائلة
أوبل: lmod المعدل الموضعي
أوبل: tmod المعدل الزمني
يتيم يتيم
الأرداف الأرداف
نقطة علامات ترقيم
جبر عدم الطلاقة التي تم تجاوزها
جذر جذر
ندائي ندائي
xcomp تكملة clausal مفتوحة

تحليل التبعية باستخدام NLTK

يمكن إجراء تحليل التبعية باستخدام حزمة أدوات اللغة الطبيعية (NLTK) وهي عبارة عن مجموعة من المكتبات والرموز المستخدمة في معالجة اللغة الطبيعية الإحصائية (NLP) للغة البشرية.

يمكننا استخدام NLTK لتحقيق تحليل التبعية بإحدى الطرق التالية:

  1. محلل التبعية الاحتمالية الإسقاطية : يستخدم هؤلاء المحللون معرفة اللغة البشرية المستقاة من الجمل الموزعة يدويًا للتنبؤ بجمل جديدة. من المعروف أنهم يرتكبون أخطاء ويعملون مع مجموعة محدودة من بيانات التدريب.
  2. محلل ستانفورد : هذا محلل لغة طبيعي مطبق على Java. أنت بحاجة إلى محلل Stanford CoreNLP لإجراء تحليل التبعية. يتضمن المحلل اللغوي عدة لغات منها الإنجليزية والصينية والألمانية والعربية.

إليك كيفية استخدام المحلل اللغوي:

من nltk.parse.stanford استيراد StanfordDependencyParser

path_jar = 'path_to / stanford-parser-full-2014-08-27 / stanford-parser.jar'

path_models_jar = 'path_to / stanford-parser-full-2014-08-27 / stanford-parser-3.4.1-Models.jar'

dep_parser = StanfordDependencyParser (

path_to_jar = path_jar ، path_to_models_jar = path_models_jar

)

النتيجة = dep_parser.raw_parse ("لقد أطلقت النار على فيل أثناء نومي")

التبعية = result.next ()

قائمة (التبعية. ثلاثية ())

خرج البرنامج أعلاه كالتالي:

[

((u'shot '، u'VBD')، u'nsubj '، (u'I'، u'PRP ')) ،

((u'shot '، u'VBD')، u'dobj '، (u'elephant'، u'NN ')) ،

((u'elephant '، u'NN')، u'det '، (u'an'، u'DT ')) ،

((u'shot '، u'VBD')، u'prep '، (u'in'، u'IN ')) ،

((u'in '، u'IN')، u'pobj '، (u'sleep'، u'NN '))،

((u'sleep '، u'NN')، u'poss '، (u'my'، u'PRP $ '))

]

اعراب الدائرة الانتخابية

يعتمد تحليل الدائرة الانتخابية على قواعد نحوية خالية من السياق. هنا ، تتضمن شجرة التحليل جملًا مقسمة إلى عبارات فرعية ، كل منها ينتمي إلى فئة نحوية. تعمل كل وحدة أو كلمة لغوية في جملة ما كعقدة طرفية ، والتي لها العقدة الأصلية وعلامة جزء من الكلام.

على سبيل المثال ، عبارة "قطة" و "صندوق تحت السرير" عبارة عن عبارات اسمية ، في حين أن "كتابة حرف" و "قيادة سيارة" هي عبارات فعلية.

لنأخذ مثالاً على جملة " لقد أطلقت النار على فيل يرتدي بيجاما." فيما يلي تمثيل رسومي لشجرة تحليل الدائرة الانتخابية:

مصدر

تشير شجرة التحليل الموجودة على اليسار إلى إطلاق النار على فيل يرتدي البيجامة وتشير شجرة التحليل الموجودة على اليمين إلى أن الهدف يطلق النار على فيل وهو يرتدي بيجاما.

يتم تقسيم الجملة بأكملها إلى مراحل فرعية حتى يتبقى لدينا كلمات نهائية. يشير VP إلى عبارة فعل بينما يشير NP إلى عبارات الاسم.

الإعراب التبعية مقابل تحليل الدائرة

يمكن أيضًا تنفيذ تحليل الدائرة الانتخابية باستخدام محلل ستانفورد. إنه يوزع بشكل أساسي جملة معينة وفقًا لمحلل الدائرة الانتخابية ثم يحول شجرة تحليل الدائرة الانتخابية إلى شجرة تبعية.

إذا كان هدفك هو تقسيم الجملة إلى عبارات فرعية ، فيجب عليك تنفيذ تحليل الدائرة الانتخابية. ومع ذلك ، إذا كنت ترغب في استكشاف التبعيات بين الكلمات في جملة ما ، فيجب عليك استخدام تحليل التبعية.

الخروج: أفكار ومواضيع مشروع البرمجة اللغوية العصبية

خاتمة

إذا وجدت هذه المقالة مفيدة ، فيجب عليك الاطلاع على شهادة PG لمدة 6 أشهر من upGrad في التعلم الآلي و NLP التي تقدم إرشادًا مخصصًا من خبراء الصناعة في Flipkart و Gramener و Zee5.

تم تصميم البرنامج للمهندسين والبرمجيات / تكنولوجيا المعلومات والبيانات وغيرهم من المهنيين الذين يتطلعون إلى الحصول على موطئ قدم في علوم البيانات والتعلم الآلي. شهادة الدراسات العليا هذه من IIIT BBangaloret التي تفتخر برفع متوسط ​​الراتب بنسبة 58٪ هو كل ما تحتاجه للحصول على مناصب متقدمة لمحلل البيانات وعالم البيانات ومهندس ML ومهندس البرمجة اللغوية العصبية في أفضل الشركات. احجب مقعدك اليوم بسعر روبية فقط. 3،034 شهريا!

ما فائدة تحليل التبعية في البرمجة اللغوية العصبية؟

في معالجة اللغة الطبيعية ، يعد تحليل التبعية أسلوبًا يستخدم لتحديد العلاقات الدلالية بين الكلمات في الجملة. تُستخدم محللات التبعية لتعيين الكلمات في الجملة إلى الأدوار الدلالية ، وبالتالي تحديد العلاقات النحوية بين الكلمات. تحليل التبعية هو نهج معروف جيدًا للتحليل النحوي لنصوص اللغة الطبيعية على مستوى بنية السطح. في هذه الطريقة ، يتم استرداد البنية النحوية للجملة من تسلسل خطي من الرموز المميزة للكلمة ، عن طريق تحليل التبعيات النحوية بين الكلمات وتحديد الفئة النحوية لكل كلمة.

ما هي تطبيقات تحليل التبعية؟

فيما يلي قائمة بالعديد من مجالات التطبيق حيث يتم استخدام تحليل التبعية. أحد الاستخدامات الرئيسية لتحليل التبعية هو تصنيف الأدوار الدلالية (SRL) واستخراج المعلومات ، وهي مكونات معالجة اللغة الطبيعية. يستخدم تحليل التبعية أيضًا في التقسيم النحوي وتحليل الدائرة الانتخابية خارج مهام البرمجة اللغوية العصبية. يختلف تحليل التبعية اختلافًا جوهريًا عن تحليل بنية العبارة ، والذي يقوم بتعيين الكلمات في جملة ما إلى علامة العبارة المقابلة أو بنية الشجرة.

ما هو الفرق الأساسي بين الاعراب النحوي وتحليل التبعية؟

يتمثل الاختلاف بين المحلل اللغوي ومحلل التبعية في أن محلل التبعية يبني شجرة تحليل وأن المحلل اللغوي يبني شجرة بناء جملة. يتضمن التحليل النحوي استخدام قواعد محددة مسبقًا لتعريف بناء الجملة ومحلل التبعية ، من ناحية أخرى ، يمكنه فهم جميع أنواع العبارات ويمكنه أيضًا التعامل مع المدخلات الغامضة. يمكن استخدام محلل التبعية للتعرف على العبارة ، والتقطيع ، وتحليل التبعية ، والتقسيم والتحليل.