تحليل التبعية في البرمجة اللغوية العصبية [موضح بالأمثلة]
نشرت: 2021-03-10معالجة اللغة الطبيعية هي مفهوم متعدد التخصصات يأخذ أساسيات اللغويات الحاسوبية والذكاء الاصطناعي لفهم كيفية تفاعل اللغات البشرية مع التكنولوجيا.
يتطلب البرمجة اللغوية العصبية (NLP) فهمًا عميقًا للمصطلحات والمفاهيم المختلفة لتطبيقها بشكل ملموس على سيناريوهات العالم الحقيقي. تتضمن بعض هذه المفاهيم الأساسية علامات جزء من الكلام (POS) ، ونمذجة اللغة الإحصائية ، والتحليل النحوي والدلالي والمشاعر ، والتطبيع ، والترميز ، وتحليل التبعية ، وتحليل الدائرة الانتخابية ، من بين أمور أخرى.
في هذه المقالة ، سنلقي نظرة على أساسيات تحليل التبعية للحصول على منظور حول كيفية تنفيذه في البرمجة اللغوية العصبية.
جدول المحتويات
الاعراب التبعية
يشير تحليل التبعية (DP) إلى فحص التبعيات بين كلمات الجملة لتحليل بنيتها النحوية. بناءً على ذلك ، يتم تقسيم الجملة إلى عدة مكونات. تعتمد الآلية على مفهوم أن هناك صلة مباشرة بين كل وحدة لغوية في الجملة. تسمى هذه الروابط التبعيات.
لنأخذ على سبيل المثال الجملة " أفضل الرحلة الصباحية عبر دنفر."
يوضح الرسم البياني أدناه هيكل التبعية للجملة:
مصدر
يشار إلى العلاقات بين كل وحدة لغوية أو كلمة في الجملة باستخدام أقواس موجهة في بنية تبعية مكتوبة. كما هو موضح في الرسم التخطيطي ، فإن جذر الشجرة "يفضل" يشكل رأس الجملة أعلاه.
يتم تمييز العلاقة بين أي كلمتين بعلامة تبعية. على سبيل المثال ، كلمة "flight" تعدل معنى الاسم "دنفر". لذلك ، يمكنك ملاحظة التبعية من الرحلة -> دنفر حيث تكون الرحلة هي الرأس ودنفر هي الطفل أو المعال. يتم الإشارة إليه بواسطة nmod الذي يمثل معدلًا اسميًا.
هذا يشكل حالة التبعية بين كل كلمتين حيث تعمل إحداهما كرأس والأخرى هي التابعة. حاليًا ، يتكون تصنيف التبعية العالمية V2 من 37 علاقة نحوية عالمية كما هو محدد في الجدول أدناه:
علامة التبعية | وصف |
acl | معدّل كلبيّ لاسم (جملة adnominal) |
acl: relcl | معدل شرط نسبي |
advcl | معدل شرط الظرف |
advmod | معدل الظرف |
advmod: emph | التأكيد على الكلمة ، المكثف |
advmod: lmod | معدل الظرف الموضعي |
amod | معدل صفة |
أبوس | المعدل الوضعي |
مساعد | مساعد |
aux: تمرير | المساعد السلبي |
قضية | وضع علامات الحالة |
نسخة | تنسيق الاقتران |
سم مكعب: preconj | ملتزم |
كومب | تكملة جماعية |
clf | مصنف |
مجمع | مجمع |
المركب: lvc | بناء الفعل الخفيف |
المركب: prt | جسيمات فعلية |
المركب: redup | مركبات مكررة |
المركب: svc | مركبات الأفعال التسلسلية |
معا | اقتران |
شرطي | كوبولا |
csubj | موضوع جماعي |
csubj: تمرير | موضوع سلبي جماعي |
قسم | تبعية غير محددة |
Det | المحدد |
det: numgov | المُحدِّد الكمّي الذي يحكم حالة الاسم |
det: nummod | المُحدِّد الكمّي المتوافق مع الاسم |
det: بوس | محدد ملكية |
الحوار | عنصر الخطاب |
مخلوع | عناصر مخلوعة |
شرح | كلمة بذيئة |
اكسبلور: العارضات | كلمة بذيئة غير شخصية |
expl: تمرير | الضمير الانعكاسي المستخدم في الانعكاسي المبني للمجهول |
اكسبلور: الكهروضوئية | clitic انعكاسي مع فعل انعكاسي بطبيعته |
مثبت | تعبير متعدد الكلمات ثابت |
عريضة | تعبير مسطح متعدد الكلمات |
شقة: أجنبي | كلمات اجنبية |
شقة: الاسم | الأسماء |
يذهب مع | يتماشى مع |
iobj | عنصر غير مباشر |
قائمة | قائمة |
علامة | علامة |
نمود | المعدل الاسمي |
نمود: بوس | المعدل الاسمي الملكية |
nmod: tmod | المعدل الزمني |
نسوبج | الموضوع الاسمي |
nsubj: تمرير | الموضوع الاسمي السلبي |
نومود | معدل رقمي |
nummod: gov | معدل رقمي يحكم حالة الاسم |
الهدف | هدف |
إلزام | اسمي مائل |
Obel: وكيل | معدل الوكيل |
Obl: arg | حجة مائلة |
أوبل: lmod | المعدل الموضعي |
أوبل: tmod | المعدل الزمني |
يتيم | يتيم |
الأرداف | الأرداف |
نقطة | علامات ترقيم |
جبر | عدم الطلاقة التي تم تجاوزها |
جذر | جذر |
ندائي | ندائي |
xcomp | تكملة clausal مفتوحة |
تحليل التبعية باستخدام NLTK
يمكن إجراء تحليل التبعية باستخدام حزمة أدوات اللغة الطبيعية (NLTK) وهي عبارة عن مجموعة من المكتبات والرموز المستخدمة في معالجة اللغة الطبيعية الإحصائية (NLP) للغة البشرية.
يمكننا استخدام NLTK لتحقيق تحليل التبعية بإحدى الطرق التالية:
- محلل التبعية الاحتمالية الإسقاطية : يستخدم هؤلاء المحللون معرفة اللغة البشرية المستقاة من الجمل الموزعة يدويًا للتنبؤ بجمل جديدة. من المعروف أنهم يرتكبون أخطاء ويعملون مع مجموعة محدودة من بيانات التدريب.
- محلل ستانفورد : هذا محلل لغة طبيعي مطبق على Java. أنت بحاجة إلى محلل Stanford CoreNLP لإجراء تحليل التبعية. يتضمن المحلل اللغوي عدة لغات منها الإنجليزية والصينية والألمانية والعربية.
إليك كيفية استخدام المحلل اللغوي:
من nltk.parse.stanford استيراد StanfordDependencyParser
path_jar = 'path_to / stanford-parser-full-2014-08-27 / stanford-parser.jar'
path_models_jar = 'path_to / stanford-parser-full-2014-08-27 / stanford-parser-3.4.1-Models.jar'
dep_parser = StanfordDependencyParser (
path_to_jar = path_jar ، path_to_models_jar = path_models_jar
)
النتيجة = dep_parser.raw_parse ("لقد أطلقت النار على فيل أثناء نومي")
التبعية = result.next ()
قائمة (التبعية. ثلاثية ())
خرج البرنامج أعلاه كالتالي:
[
((u'shot '، u'VBD')، u'nsubj '، (u'I'، u'PRP ')) ،
((u'shot '، u'VBD')، u'dobj '، (u'elephant'، u'NN ')) ،
((u'elephant '، u'NN')، u'det '، (u'an'، u'DT ')) ،
((u'shot '، u'VBD')، u'prep '، (u'in'، u'IN ')) ،
((u'in '، u'IN')، u'pobj '، (u'sleep'، u'NN '))،
((u'sleep '، u'NN')، u'poss '، (u'my'، u'PRP $ '))
]
اعراب الدائرة الانتخابية
يعتمد تحليل الدائرة الانتخابية على قواعد نحوية خالية من السياق. هنا ، تتضمن شجرة التحليل جملًا مقسمة إلى عبارات فرعية ، كل منها ينتمي إلى فئة نحوية. تعمل كل وحدة أو كلمة لغوية في جملة ما كعقدة طرفية ، والتي لها العقدة الأصلية وعلامة جزء من الكلام.
على سبيل المثال ، عبارة "قطة" و "صندوق تحت السرير" عبارة عن عبارات اسمية ، في حين أن "كتابة حرف" و "قيادة سيارة" هي عبارات فعلية.
لنأخذ مثالاً على جملة " لقد أطلقت النار على فيل يرتدي بيجاما." فيما يلي تمثيل رسومي لشجرة تحليل الدائرة الانتخابية:
مصدر
تشير شجرة التحليل الموجودة على اليسار إلى إطلاق النار على فيل يرتدي البيجامة وتشير شجرة التحليل الموجودة على اليمين إلى أن الهدف يطلق النار على فيل وهو يرتدي بيجاما.
يتم تقسيم الجملة بأكملها إلى مراحل فرعية حتى يتبقى لدينا كلمات نهائية. يشير VP إلى عبارة فعل بينما يشير NP إلى عبارات الاسم.
الإعراب التبعية مقابل تحليل الدائرة
يمكن أيضًا تنفيذ تحليل الدائرة الانتخابية باستخدام محلل ستانفورد. إنه يوزع بشكل أساسي جملة معينة وفقًا لمحلل الدائرة الانتخابية ثم يحول شجرة تحليل الدائرة الانتخابية إلى شجرة تبعية.
إذا كان هدفك هو تقسيم الجملة إلى عبارات فرعية ، فيجب عليك تنفيذ تحليل الدائرة الانتخابية. ومع ذلك ، إذا كنت ترغب في استكشاف التبعيات بين الكلمات في جملة ما ، فيجب عليك استخدام تحليل التبعية.
الخروج: أفكار ومواضيع مشروع البرمجة اللغوية العصبية
خاتمة
إذا وجدت هذه المقالة مفيدة ، فيجب عليك الاطلاع على شهادة PG لمدة 6 أشهر من upGrad في التعلم الآلي و NLP التي تقدم إرشادًا مخصصًا من خبراء الصناعة في Flipkart و Gramener و Zee5.
تم تصميم البرنامج للمهندسين والبرمجيات / تكنولوجيا المعلومات والبيانات وغيرهم من المهنيين الذين يتطلعون إلى الحصول على موطئ قدم في علوم البيانات والتعلم الآلي. شهادة الدراسات العليا هذه من IIIT BBangaloret التي تفتخر برفع متوسط الراتب بنسبة 58٪ هو كل ما تحتاجه للحصول على مناصب متقدمة لمحلل البيانات وعالم البيانات ومهندس ML ومهندس البرمجة اللغوية العصبية في أفضل الشركات. احجب مقعدك اليوم بسعر روبية فقط. 3،034 شهريا!
ما فائدة تحليل التبعية في البرمجة اللغوية العصبية؟
في معالجة اللغة الطبيعية ، يعد تحليل التبعية أسلوبًا يستخدم لتحديد العلاقات الدلالية بين الكلمات في الجملة. تُستخدم محللات التبعية لتعيين الكلمات في الجملة إلى الأدوار الدلالية ، وبالتالي تحديد العلاقات النحوية بين الكلمات. تحليل التبعية هو نهج معروف جيدًا للتحليل النحوي لنصوص اللغة الطبيعية على مستوى بنية السطح. في هذه الطريقة ، يتم استرداد البنية النحوية للجملة من تسلسل خطي من الرموز المميزة للكلمة ، عن طريق تحليل التبعيات النحوية بين الكلمات وتحديد الفئة النحوية لكل كلمة.
ما هي تطبيقات تحليل التبعية؟
فيما يلي قائمة بالعديد من مجالات التطبيق حيث يتم استخدام تحليل التبعية. أحد الاستخدامات الرئيسية لتحليل التبعية هو تصنيف الأدوار الدلالية (SRL) واستخراج المعلومات ، وهي مكونات معالجة اللغة الطبيعية. يستخدم تحليل التبعية أيضًا في التقسيم النحوي وتحليل الدائرة الانتخابية خارج مهام البرمجة اللغوية العصبية. يختلف تحليل التبعية اختلافًا جوهريًا عن تحليل بنية العبارة ، والذي يقوم بتعيين الكلمات في جملة ما إلى علامة العبارة المقابلة أو بنية الشجرة.
ما هو الفرق الأساسي بين الاعراب النحوي وتحليل التبعية؟
يتمثل الاختلاف بين المحلل اللغوي ومحلل التبعية في أن محلل التبعية يبني شجرة تحليل وأن المحلل اللغوي يبني شجرة بناء جملة. يتضمن التحليل النحوي استخدام قواعد محددة مسبقًا لتعريف بناء الجملة ومحلل التبعية ، من ناحية أخرى ، يمكنه فهم جميع أنواع العبارات ويمكنه أيضًا التعامل مع المدخلات الغامضة. يمكن استخدام محلل التبعية للتعرف على العبارة ، والتقطيع ، وتحليل التبعية ، والتقسيم والتحليل.