20 أسئلة وأجوبة مقابلة R الشائعة لعام 2022

نشرت: 2021-01-10

على مدى السنوات القليلة الماضية ، اكتسبت لغة البرمجة R قوة جذب كبيرة في مجتمعات علوم البيانات والتعلم الآلي. هذا بشكل أساسي لأنها لغة متعددة الأغراض يمكن استخدامها للتحليل الإحصائي وتصور البيانات ومعالجة البيانات والنمذجة التنبؤية وتحليل التنبؤ وغير ذلك الكثير.

نظرًا لأن فرص العمل المحيطة بـ R تتزايد بسرعة وتزدهر دورات علوم البيانات ، سنركز اليوم على الجزء الأول من الحصول على وظيفة في المجال - مقابلة R. فيما يلي قائمة بالأسئلة الأكثر شيوعًا في مقابلات R!

ما هو R؟

R هي لغة برمجة وبيئة مصممة خصيصًا للحوسبة والرسومات الإحصائية. يأتي مع كتالوج واسع من الأساليب الإحصائية والرسومية بما في ذلك الانحدار الخطي ، والتصنيف ، والتكتل ، وتحليل السلاسل الزمنية ، والاستدلال الإحصائي ، وخوارزميات ML ، على سبيل المثال لا الحصر.

قم بتسمية هياكل البيانات المختلفة في R.

يحتوي R على أربعة هياكل بيانات أولية:

المتجه - هو سلسلة من عناصر البيانات التي تنتمي إلى نفس النوع. تُعرف الأعضاء داخل المتجه بالمكونات.
قائمة - هي كائن R يمكن أن يحتوي على عناصر من أنواع مختلفة ، بما في ذلك الأرقام أو السلاسل أو المتجهات أو قائمة أخرى.
المصفوفة - هي بنية بيانات ثنائية الأبعاد يمكنها ربط متجهات لها نفس الطول. يجب أن تكون العناصر داخل المصفوفة من نفس النوع - رقمية ، أو شخصية ، أو منطقية ، أو معقدة.
إطار البيانات - هو إصدار أكثر عمومية من المصفوفة ، أي أنه يمكن أن يحتوي على عناصر من أنواع بيانات مختلفة. يجمع إطار البيانات خصائص المصفوفات والقوائم مثل قائمة مستطيلة ، وعادة ما تحتوي أعمدتها على أنواع بيانات مختلفة.

اسم المكونات المختلفة لقواعد الرسومات؟

المكونات المختلفة لقواعد الرسومات هي:

طبقة البيانات
طبقة الوجه
طبقة السمات
طبقة الجماليات
طبقة هندسية
طبقة منسقة

كيفية تثبيت حزمة في R؟

لتثبيت حزمة في R ، عليك كتابة هذا الأمر:

install.packages (“<package_name>”)

كيف يتم استيراد البيانات في R؟

لاستيراد البيانات في R ، يجب عليك استخدام واجهة المستخدم الرسومية للقائد R بكتابة الأمر "Rcmdr" في وحدة التحكم R. توجد ثلاث طرق لاستيراد البيانات في R:

يمكنك إما إدخال اسم مجموعة البيانات أو اختيار مجموعة البيانات في مربع الحوار كما تراه مناسبًا.

يمكنك إدخال البيانات مباشرة باستخدام محرر R Commander: Data-> New Data Set. يعمل هذا بشكل أفضل مع مجموعات البيانات الصغيرة والمتوسطة الحجم.
يمكنك استيراد البيانات من الحافظة ، أو عنوان URL ، أو ملف نص عادي (ASCII) ، أو أي حزمة إحصائية.

ما هو Rmarkdown؟

RMarkdown هي أداة الإبلاغ الخاصة بـ R. يسمح لك بإنشاء تقارير عالية الجودة لرمز R.

هناك ثلاثة أنواع من تنسيق الإخراج لـ Rmarkdown:

لغة البرمجة
كلمة
بي دي إف

ما هي "اختبارات t ()" في R؟

في R ، يتم استخدام اختبار t () لتحديد ما إذا كانت وسائل مجموعتين متساوية مع بعضها البعض أم لا.

ما هي حزم R المستخدمة في احتساب البيانات؟

حزم R الأكثر استخدامًا في احتساب البيانات هي:

مي
الفئران
هميسك
اميليا
نسب
MissForest

ما هي "مصفوفة الارتباك" في R؟

في R ، يتم استخدام مصفوفة الارتباك لتقييم دقة نموذج مطور. يوفر حسابًا تبادليًا للفئات المرصودة والمتوقعة باستخدام وظيفة "confusionmatrix ()" الموجودة في حزمة "caTools".

10. ما هي الغابة العشوائية؟ كيف يمكنك بناء وتقييم غابة عشوائية في R؟

Random Forest هو مصنف مجموعة مبني من مجموعة من العديد من نماذج شجرة القرار. نظرًا لأنه يجمع بين نتائج العديد من نماذج شجرة القرار ، تكون النتيجة أكثر دقة من تلك الخاصة بالنماذج الفردية.

لبناء نموذج Random Forest في R ، يجب أن يكون لديك مجموعة بيانات تدريبية. ثم تابع بالقيام بما يلي:

أولاً ، افصل مجموعة البيانات في مجموعة التدريب ومجموعة الاختبار->

الآن ، قم ببناء نموذج Random Forest على مجموعة القطار->
أخيرًا ، توقع نموذج Random Forest في مجموعة الاختبار->

ما هو ShinyR؟

ShinyR هي حزمة R تسمح بالتطوير السهل والآمن لتطبيقات الويب التفاعلية مباشرة باستخدام R.

باستخدام ShinyR ، يمكنك استضافة تطبيقات مستقلة على صفحة ويب ، أو يمكنك أيضًا تضمينها في مستندات Rmarkdown. أيضًا ، يمكنك توسيع تطبيقاتك اللامعة للعمل مع سمات CSS وإجراءات JavaScript وأدوات HTML.

قم بتسمية الحزم المستخدمة في استخراج البيانات في R.

حزم R المستخدمة في استخراج البيانات هي:

Rpart و علامة الإقحام
جدول البيانات
تنبؤ بالمناخ
GGplot
أرول
تم

ما هي أغراض الانحدار اللوجستي وانحدار بواسون؟

بينما يساعد الانحدار اللوجستي على التنبؤ بالنتيجة الثنائية من مجموعة معينة من متغيرات التوقع المستمرة ، يتم استخدام انحدار بواسون للتنبؤ بمتغير النتيجة الذي يمثل "الأعداد" من مجموعة معينة من متغيرات التوقع المستمرة.

كيف يتم تمثيل القيم المفقودة في R؟

في R ، يتم تمثيل القيم المفقودة بواسطة دالة NA (غير متوفر). ومع ذلك ، بالنسبة للقيم المستحيلة ، يتم استخدام NaN (وليس رقمًا).

ما الوظيفة المستخدمة لإضافة مجموعات البيانات في R؟

في R ، تُستخدم وظيفة "rbind" لربط إطارين من إطارات البيانات أو مجموعات البيانات. ومع ذلك ، يجب أن يحتوي إطارا البيانات / مجموعتي البيانات على متغيرات من نفس النوع.

كيف تحفظ البيانات في R؟

في حين أن هناك العديد من الطرق لحفظ البيانات في R ، فإن الطريقة الأكثر فاعلية للقيام بذلك هي:

البيانات> مجموعة البيانات النشطة> تصدير مجموعة البيانات النشطة

بعد ذلك ، سترى مربع حوار يظهر أمامك. عند النقر فوق مربع الحوار هذا ، يمكنك حفظ بياناتك كما تفعل عادةً.

ما هي خوارزميات الفرز في R؟

لدى R خمسة أنواع من خوارزميات الفرز:

اختيار نوع
فرز دلو
فقاعة الفرز
دمج الفرز
فرز سريع

ما هو نموذج الضوضاء البيضاء؟

نموذج الضوضاء البيضاء (WN) هو نموذج متسلسل زمني. إنها أبسط طريقة لتصوير عملية ثابتة.

يتكون نموذج WN من:

متوسط ثابت ثابت
تباين ثابت ثابت
لا علاقة مع مرور الوقت

قم بتسمية وظائف الاستيراد في R.

تتضمن وظائف الاستيراد المختلفة في R ما يلي:

read.csv () ->
read_sas () ->
read_excel () ->
read_sav () ->

قم بتسمية الوظائف المستخدمة لتصحيح الأخطاء في R.

الوظائف المستخدمة لتصحيح الأخطاء في R هي:

تتبع الأثر()
تصحيح ()
متصفح ()
أثر()
استعادة()

لذا ، ها أنت ذا! هذه بعض الأسئلة الأكثر شيوعًا في مقابلة R. آمل أن يساعدك هذا في كسر الجمود والتعمق في اللغة باستمرار.

تعلم سعيد!

ما هي هياكل البيانات في R؟

هياكل البيانات هي الحاويات التي تخزن البيانات لاستخدامها بكفاءة. بشكل أساسي ، تحتوي لغة R على 4 هياكل بيانات: Vector عبارة عن بنية بيانات مخصصة ديناميكيًا تعمل كحاوية وتخزن القيم بأنواع بيانات مماثلة. تُعرف قيم البيانات المخزنة في ناقل بالمكونات. يمكن اعتبار القائمة ككائن R يمكنه تخزين قيم البيانات لأنواع بيانات متعددة مثل الأعداد الصحيحة أو السلاسل أو الأحرف أو قائمة أخرى. المصفوفة هي بنية بيانات شبيهة بالشبكة تربط متجهات لها نفس الطول. إنها بنية بيانات ثنائية الأبعاد ويجب أن تكون جميع العناصر الموجودة داخلها من نفس نوع البيانات. يشبه إطار البيانات المصفوفة إلا أنه أكثر عمومية. يمكن أن تحتوي على قيم بأنواع بيانات مختلفة مثل الأعداد الصحيحة والسلاسل والأحرف. يُظهر مجموعة خصائص القائمة والمصفوفة.

ما هو Random Forest؟

Random Forest هو مصنف مجموعة. كما يوحي الاسم ، فإنه يبني ويربط العديد من أشجار القرار لتحسين دقة التنبؤ للنموذج. يتم توفير كل ملاحظة لكل شجرة قرار وهي غير خطية بطبيعتها. تعد مجموعة بيانات التدريب ضرورية لإنشاء غابة عشوائية في R. بمجرد تجميع مجموعة بيانات التدريب ، هناك خطوتان بارزتان يجب اتباعهما من أجل تحقيق الغابة العشوائية: قسّم مجموعة البيانات إلى مجموعة بيانات التدريب ومجموعة بيانات الاختبار. استخدم مجموعة بيانات التدريب لإنشاء الغابة العشوائية واستخدم مجموعة بيانات الاختبار للتنبؤ بنموذج الغابة العشوائية.

ما هو ShinyR وما هي أهميته؟

ShinyR هي حزمة مفتوحة المصدر للغة R توفر إطار عمل ويب قويًا يستخدم لتطوير تطبيقات ومشاريع الويب التفاعلية. باستخدام ShinyR ، يمكنك تحويل تحليلاتك إلى تطبيقات ويب بدون تقنيات الويب البارزة مثل HTML أو CSS أو JavaScript. على الرغم من كونها أداة قوية ، إلا أنها سهلة التعلم والتلميح. يمكن توسيع التطبيقات التي تم تطويرها باستخدام ShinyR لاستخدامها بكفاءة مع أدوات HTML وموضوعات CSS وإجراءات JavaScript. أيضًا ، باستخدام ShinyR ، يمكنك استضافة تطبيقات مستقلة على صفحة ويب ، أو يمكنك أيضًا تضمينها في مستندات Rmarkdown.