تحليل التبعية في البرمجة اللغوية العصبية [موضح بالأمثلة]

نشرت: 2021-03-10

معالجة اللغة الطبيعية هي مفهوم متعدد التخصصات يأخذ أساسيات اللغويات الحاسوبية والذكاء الاصطناعي لفهم كيفية تفاعل اللغات البشرية مع التكنولوجيا.

يتطلب البرمجة اللغوية العصبية (NLP) فهمًا عميقًا للمصطلحات والمفاهيم المختلفة لتطبيقها بشكل ملموس على سيناريوهات العالم الحقيقي. تتضمن بعض هذه المفاهيم الأساسية علامات جزء من الكلام (POS) ، ونمذجة اللغة الإحصائية ، والتحليل النحوي والدلالي والمشاعر ، والتطبيع ، والترميز ، وتحليل التبعية ، وتحليل الدائرة الانتخابية ، من بين أمور أخرى.

في هذه المقالة ، سنلقي نظرة على أساسيات تحليل التبعية للحصول على منظور حول كيفية تنفيذه في البرمجة اللغوية العصبية.

جدول المحتويات

الاعراب التبعية

يشير تحليل التبعية (DP) إلى فحص التبعيات بين كلمات الجملة لتحليل بنيتها النحوية. بناءً على ذلك ، يتم تقسيم الجملة إلى عدة مكونات. تعتمد الآلية على مفهوم أن هناك صلة مباشرة بين كل وحدة لغوية في الجملة. تسمى هذه الروابط التبعيات.

لنأخذ على سبيل المثال الجملة " أفضل الرحلة الصباحية عبر دنفر."

يوضح الرسم البياني أدناه هيكل التبعية للجملة:

مصدر

يشار إلى العلاقات بين كل وحدة لغوية أو كلمة في الجملة باستخدام أقواس موجهة في بنية تبعية مكتوبة. كما هو موضح في الرسم التخطيطي ، فإن جذر الشجرة "يفضل" يشكل رأس الجملة أعلاه.

يتم تمييز العلاقة بين أي كلمتين بعلامة تبعية. على سبيل المثال ، كلمة "flight" تعدل معنى الاسم "دنفر". لذلك ، يمكنك ملاحظة التبعية من الرحلة -> دنفر حيث تكون الرحلة هي الرأس ودنفر هي الطفل أو المعال. يتم الإشارة إليه بواسطة nmod الذي يمثل معدلًا اسميًا.

هذا يشكل حالة التبعية بين كل كلمتين حيث تعمل إحداهما كرأس والأخرى هي التابعة. حاليًا ، يتكون تصنيف التبعية العالمية V2 من 37 علاقة نحوية عالمية كما هو محدد في الجدول أدناه:

علامة التبعية	وصف
acl	معدّل كلبيّ لاسم (جملة adnominal)
acl: relcl	معدل شرط نسبي
advcl	معدل شرط الظرف
advmod	معدل الظرف
advmod: emph	التأكيد على الكلمة ، المكثف
advmod: lmod	معدل الظرف الموضعي
amod	معدل صفة
أبوس	المعدل الوضعي
مساعد	مساعد
aux: تمرير	المساعد السلبي
قضية	وضع علامات الحالة
نسخة	تنسيق الاقتران
سم مكعب: preconj	ملتزم
كومب	تكملة جماعية
clf	مصنف
مجمع	مجمع
المركب: lvc	بناء الفعل الخفيف
المركب: prt	جسيمات فعلية
المركب: redup	مركبات مكررة
المركب: svc	مركبات الأفعال التسلسلية
معا	اقتران
شرطي	كوبولا
csubj	موضوع جماعي
csubj: تمرير	موضوع سلبي جماعي
قسم	تبعية غير محددة
Det	المحدد
det: numgov	المُحدِّد الكمّي الذي يحكم حالة الاسم
det: nummod	المُحدِّد الكمّي المتوافق مع الاسم
det: بوس	محدد ملكية
الحوار	عنصر الخطاب
مخلوع	عناصر مخلوعة
شرح	كلمة بذيئة
اكسبلور: العارضات	كلمة بذيئة غير شخصية
expl: تمرير	الضمير الانعكاسي المستخدم في الانعكاسي المبني للمجهول
اكسبلور: الكهروضوئية	clitic انعكاسي مع فعل انعكاسي بطبيعته
مثبت	تعبير متعدد الكلمات ثابت
عريضة	تعبير مسطح متعدد الكلمات
شقة: أجنبي	كلمات اجنبية
شقة: الاسم	الأسماء
يذهب مع	يتماشى مع
iobj	عنصر غير مباشر
قائمة	قائمة
علامة	علامة
نمود	المعدل الاسمي
نمود: بوس	المعدل الاسمي الملكية
nmod: tmod	المعدل الزمني
نسوبج	الموضوع الاسمي
nsubj: تمرير	الموضوع الاسمي السلبي
نومود	معدل رقمي
nummod: gov	معدل رقمي يحكم حالة الاسم
الهدف	هدف
إلزام	اسمي مائل
Obel: وكيل	معدل الوكيل
Obl: arg	حجة مائلة
أوبل: lmod	المعدل الموضعي
أوبل: tmod	المعدل الزمني
يتيم	يتيم
الأرداف	الأرداف
نقطة	علامات ترقيم
جبر	عدم الطلاقة التي تم تجاوزها
جذر	جذر
ندائي	ندائي
xcomp	تكملة clausal مفتوحة

تحليل التبعية باستخدام NLTK

يمكن إجراء تحليل التبعية باستخدام حزمة أدوات اللغة الطبيعية (NLTK) وهي عبارة عن مجموعة من المكتبات والرموز المستخدمة في معالجة اللغة الطبيعية الإحصائية (NLP) للغة البشرية.

يمكننا استخدام NLTK لتحقيق تحليل التبعية بإحدى الطرق التالية:

محلل التبعية الاحتمالية الإسقاطية : يستخدم هؤلاء المحللون معرفة اللغة البشرية المستقاة من الجمل الموزعة يدويًا للتنبؤ بجمل جديدة. من المعروف أنهم يرتكبون أخطاء ويعملون مع مجموعة محدودة من بيانات التدريب.
محلل ستانفورد : هذا محلل لغة طبيعي مطبق على Java. أنت بحاجة إلى محلل Stanford CoreNLP لإجراء تحليل التبعية. يتضمن المحلل اللغوي عدة لغات منها الإنجليزية والصينية والألمانية والعربية.

إليك كيفية استخدام المحلل اللغوي:

من nltk.parse.stanford استيراد StanfordDependencyParser

path_jar = 'path_to / stanford-parser-full-2014-08-27 / stanford-parser.jar'

path_models_jar = 'path_to / stanford-parser-full-2014-08-27 / stanford-parser-3.4.1-Models.jar'

dep_parser = StanfordDependencyParser (

path_to_jar = path_jar ، path_to_models_jar = path_models_jar

)

النتيجة = dep_parser.raw_parse ("لقد أطلقت النار على فيل أثناء نومي")

التبعية = result.next ()

قائمة (التبعية. ثلاثية ())

خرج البرنامج أعلاه كالتالي:

[

((u'shot '، u'VBD')، u'nsubj '، (u'I'، u'PRP ')) ،

((u'shot '، u'VBD')، u'dobj '، (u'elephant'، u'NN ')) ،

((u'elephant '، u'NN')، u'det '، (u'an'، u'DT ')) ،

((u'shot '، u'VBD')، u'prep '، (u'in'، u'IN ')) ،

((u'in '، u'IN')، u'pobj '، (u'sleep'، u'NN '))،

((u'sleep '، u'NN')، u'poss '، (u'my'، u'PRP $ '))

]

اعراب الدائرة الانتخابية

يعتمد تحليل الدائرة الانتخابية على قواعد نحوية خالية من السياق. هنا ، تتضمن شجرة التحليل جملًا مقسمة إلى عبارات فرعية ، كل منها ينتمي إلى فئة نحوية. تعمل كل وحدة أو كلمة لغوية في جملة ما كعقدة طرفية ، والتي لها العقدة الأصلية وعلامة جزء من الكلام.

على سبيل المثال ، عبارة "قطة" و "صندوق تحت السرير" عبارة عن عبارات اسمية ، في حين أن "كتابة حرف" و "قيادة سيارة" هي عبارات فعلية.

لنأخذ مثالاً على جملة " لقد أطلقت النار على فيل يرتدي بيجاما." فيما يلي تمثيل رسومي لشجرة تحليل الدائرة الانتخابية:

مصدر

تشير شجرة التحليل الموجودة على اليسار إلى إطلاق النار على فيل يرتدي البيجامة وتشير شجرة التحليل الموجودة على اليمين إلى أن الهدف يطلق النار على فيل وهو يرتدي بيجاما.

يتم تقسيم الجملة بأكملها إلى مراحل فرعية حتى يتبقى لدينا كلمات نهائية. يشير VP إلى عبارة فعل بينما يشير NP إلى عبارات الاسم.

الإعراب التبعية مقابل تحليل الدائرة

يمكن أيضًا تنفيذ تحليل الدائرة الانتخابية باستخدام محلل ستانفورد. إنه يوزع بشكل أساسي جملة معينة وفقًا لمحلل الدائرة الانتخابية ثم يحول شجرة تحليل الدائرة الانتخابية إلى شجرة تبعية.

إذا كان هدفك هو تقسيم الجملة إلى عبارات فرعية ، فيجب عليك تنفيذ تحليل الدائرة الانتخابية. ومع ذلك ، إذا كنت ترغب في استكشاف التبعيات بين الكلمات في جملة ما ، فيجب عليك استخدام تحليل التبعية.

الخروج: أفكار ومواضيع مشروع البرمجة اللغوية العصبية

خاتمة

إذا وجدت هذه المقالة مفيدة ، فيجب عليك الاطلاع على شهادة PG لمدة 6 أشهر من upGrad في التعلم الآلي و NLP التي تقدم إرشادًا مخصصًا من خبراء الصناعة في Flipkart و Gramener و Zee5.

تم تصميم البرنامج للمهندسين والبرمجيات / تكنولوجيا المعلومات والبيانات وغيرهم من المهنيين الذين يتطلعون إلى الحصول على موطئ قدم في علوم البيانات والتعلم الآلي. شهادة الدراسات العليا هذه من IIIT BBangaloret التي تفتخر برفع متوسط الراتب بنسبة 58٪ هو كل ما تحتاجه للحصول على مناصب متقدمة لمحلل البيانات وعالم البيانات ومهندس ML ومهندس البرمجة اللغوية العصبية في أفضل الشركات. احجب مقعدك اليوم بسعر روبية فقط. 3،034 شهريا!

ما فائدة تحليل التبعية في البرمجة اللغوية العصبية؟

في معالجة اللغة الطبيعية ، يعد تحليل التبعية أسلوبًا يستخدم لتحديد العلاقات الدلالية بين الكلمات في الجملة. تُستخدم محللات التبعية لتعيين الكلمات في الجملة إلى الأدوار الدلالية ، وبالتالي تحديد العلاقات النحوية بين الكلمات. تحليل التبعية هو نهج معروف جيدًا للتحليل النحوي لنصوص اللغة الطبيعية على مستوى بنية السطح. في هذه الطريقة ، يتم استرداد البنية النحوية للجملة من تسلسل خطي من الرموز المميزة للكلمة ، عن طريق تحليل التبعيات النحوية بين الكلمات وتحديد الفئة النحوية لكل كلمة.

ما هي تطبيقات تحليل التبعية؟

فيما يلي قائمة بالعديد من مجالات التطبيق حيث يتم استخدام تحليل التبعية. أحد الاستخدامات الرئيسية لتحليل التبعية هو تصنيف الأدوار الدلالية (SRL) واستخراج المعلومات ، وهي مكونات معالجة اللغة الطبيعية. يستخدم تحليل التبعية أيضًا في التقسيم النحوي وتحليل الدائرة الانتخابية خارج مهام البرمجة اللغوية العصبية. يختلف تحليل التبعية اختلافًا جوهريًا عن تحليل بنية العبارة ، والذي يقوم بتعيين الكلمات في جملة ما إلى علامة العبارة المقابلة أو بنية الشجرة.

ما هو الفرق الأساسي بين الاعراب النحوي وتحليل التبعية؟

يتمثل الاختلاف بين المحلل اللغوي ومحلل التبعية في أن محلل التبعية يبني شجرة تحليل وأن المحلل اللغوي يبني شجرة بناء جملة. يتضمن التحليل النحوي استخدام قواعد محددة مسبقًا لتعريف بناء الجملة ومحلل التبعية ، من ناحية أخرى ، يمكنه فهم جميع أنواع العبارات ويمكنه أيضًا التعامل مع المدخلات الغامضة. يمكن استخدام محلل التبعية للتعرف على العبارة ، والتقطيع ، وتحليل التبعية ، والتقسيم والتحليل.