أكثر 20 سؤالاً وأجوبة من الأسئلة والأجوبة المتعلقة بنمذجة البيانات الأكثر شيوعًا [للمبتدئين وذوي الخبرة]
نشرت: 2021-06-10علم البيانات هو أحد المجالات المهنية الأكثر ربحًا في سوق العمل الحالي. ومع تزايد المنافسة ، أصبحت المقابلات الوظيفية أيضًا أكثر إبداعًا يومًا بعد يوم. يريد أرباب العمل اختبار المعرفة المفاهيمية للمرشحين وفهمهم العملي للموضوعات ذات الصلة وأدوات التكنولوجيا. في هذه المدونة ، سنناقش بعض أسئلة مقابلة نمذجة البيانات ذات الصلة لمساعدتك في تكوين انطباع أول قوي!
جدول المحتويات
أهم أسئلة وأجوبة مقابلة نمذجة البيانات
فيما يلي 20 سؤالاً من أسئلة المقابلة الخاصة بنمذجة البيانات جنبًا إلى جنب مع نماذج الإجابات التي ستأخذك عبر مستويات المبتدئين والمتوسطين والمتقدمين للموضوع.
1. ما هي نمذجة البيانات؟ ضع قائمة بأنواع نماذج البيانات.
تتضمن نمذجة البيانات إنشاء تمثيل (أو نموذج) للبيانات المتاحة وتخزينها في قاعدة بيانات.
يتكون نموذج البيانات من الكيانات (مثل العملاء والمنتجات والشركات المصنعة والبائعين) التي تؤدي إلى ظهور كائنات وسمات يريد المستخدمون تتبعها. على سبيل المثال ، اسم العميل هو سمة من سمات كيان العميل. تأخذ هذه التفاصيل شكل جدول في قاعدة بيانات.
هناك ثلاثة أنواع أساسية من نماذج البيانات ، وهي:
- المفهوم: ينشئ مهندسو البيانات وأصحاب المصلحة هذا النموذج لتنظيم مفاهيم الأعمال ونطاقها وتعريفها. إنها تملي ما يجب أن يحتويه النظام.
- منطقي: تم تجميع هذا النموذج من قبل مهندسي البيانات ومحللي الأعمال ، حيث يرسم هذا النموذج القواعد الفنية وهياكل البيانات ، وبالتالي تحديد تنفيذ النظام بغض النظر عن نظام إدارة قاعدة البيانات أو نظام إدارة قواعد البيانات.
- المادي: ينشئ مهندسو ومطورو قواعد البيانات هذا النموذج لوصف كيفية عمل النظام مع نظام DBMS محدد.
2. ما هو الجدول؟ اشرح جدول الحقائق والوقائع.
يحتفظ الجدول بالبيانات في صفوف (محاذاة أفقية) وأعمدة (محاذاة رأسية). تُعرف الصفوف أيضًا بالسجلات أو المجموعات ، بينما يمكن الإشارة إلى الأعمدة باسم الحقول.
الحقيقة هي البيانات الكمية مثل "صافي المبيعات" أو "المبلغ المستحق". يخزن جدول الحقائق البيانات الرقمية بالإضافة إلى بعض السمات من جداول الأبعاد.
3. ماذا تقصد بـ (1) البعد (2) التقسيم (4) تباين البيانات (5) التجزئة (5) نظام إدارة قاعدة البيانات؟
(ط) تمثل الأبعاد البيانات النوعية مثل الفئة والمنتج. لذلك ، سيكون لجدول الأبعاد الذي يحتوي على بيانات المنتج سمات مثل فئة المنتج واسم المنتج وما إلى ذلك.
(2) تشير التقسيمات إلى مستوى المعلومات المخزنة في الجدول. يمكن أن يكون مرتفعًا أو منخفضًا ، حيث تحتوي الجداول على بيانات على مستوى المعاملات وجداول حقائق ، على التوالي.
(3) تباين البيانات يعني عدد الخلايا الفارغة في قاعدة البيانات. بمعنى آخر ، يوضح مقدار البيانات التي لدينا لكيان أو بُعد معين في نموذج البيانات. تؤدي المعلومات غير الكافية إلى قواعد بيانات كبيرة حيث يلزم توفير مساحة أكبر لحفظ التجميعات.
(4) تساعد تقنية التجزئة في البحث عن قيم فهرس لاسترداد البيانات المطلوبة. يتم استخدامه لحساب الموقع المباشر لسجلات البيانات بمساعدة هياكل الفهرس.
(5) نظام إدارة قواعد البيانات (DBMS) هو برنامج يتكون من مجموعة من البرامج لمعالجة قاعدة البيانات. الغرض الأساسي منه هو تخزين واسترداد بيانات المستخدم.
4. تعريف التطبيع. ما هو الغرض منه؟
تقسم تقنية التسوية الجداول الكبيرة إلى جداول أصغر ، وتربطها باستخدام علاقات مختلفة. ينظم الجداول بطريقة تقلل التبعية والتكرار في البيانات.
يمكن أن يكون هناك خمسة أنواع من التطبيع ، وهي:
- أول شكل عادي
- الشكل العادي الثاني
- النموذج العادي الثالث
- نموذج Boyce-Codd الرابع العادي
- النموذج العادي الخامس
5. ما فائدة عدم التطابق في نمذجة البيانات؟
يتم استخدام Denormalisation لإنشاء مستودع بيانات ، خاصة في المواقف التي تنطوي على مشاركة واسعة في الجداول. يتم استخدام هذه الاستراتيجية في قاعدة بيانات تم تطبيعها مسبقًا.
6. وضح الاختلافات بين المفتاح الأساسي والمفتاح الأساسي المركب والمفتاح الخارجي والمفتاح البديل.
المفتاح الأساسي هو الدعامة الأساسية في كل جدول بيانات. يشير إلى عمود أو مجموعة من الأعمدة ويتيح لك تحديد صفوف الجدول. لا يمكن أن تكون قيمة المفتاح الأساسي فارغة. عند تطبيق أكثر من عمود كجزء من المفتاح الأساسي ، يُعرف باسم المفتاح الأساسي المركب.
من ناحية أخرى ، المفتاح الخارجي هو مجموعة من السمات التي تسمح لك بربط الجداول الأصل والجداول الفرعية. تتم الإشارة إلى قيمة المفتاح الخارجي في الجدول الفرعي كقيمة المفتاح الأساسي في الجدول الأصل.
يتم استخدام مفتاح بديل لتعريف كل سجل في تلك المواقف التي لا يمتلك فيها المستخدمون مفتاحًا أساسيًا طبيعيًا. عادةً ما يتم تمثيل هذا المفتاح الاصطناعي على أنه عدد صحيح ولا يضفي أي معنى على البيانات الواردة في الجدول.
7. قارن نظام OLTP مع عملية OLAP.
OLTP هو نظام معاملات عبر الإنترنت يعتمد على قواعد البيانات التقليدية لأداء العمليات التجارية في الوقت الفعلي. تحتوي قاعدة بيانات OLTP على جداول قياسية ، ويكون وقت الاستجابة عادةً في غضون مللي ثانية.
على العكس من ذلك ، OLAP هي عملية عبر الإنترنت تهدف إلى تحليل البيانات واسترجاعها. إنه مصمم لتحليل كميات كبيرة من مقاييس الأعمال حسب الفئة والسمات. على عكس OLTP ، يستخدم OLAP مستودع بيانات وجداول غير طبيعية ويعمل بوقت استجابة من الثواني إلى الدقائق.
8. قائمة التصاميم القياسية لمخطط قاعدة البيانات.
المخطط هو رسم تخطيطي أو توضيح لعلاقات البيانات وهياكلها. يوجد تصميمان للمخطط في نمذجة البيانات ، وهما مخطط النجوم ومخطط ندفة الثلج.
- يشتمل المخطط النجمي على جدول حقائق مركزي والعديد من جداول الأبعاد المتصلة به. المفتاح الأساسي لجداول الأبعاد هو مفتاح خارجي في جدول الحقائق.
- يحتوي مخطط ندفة الثلج على نفس جدول الحقائق مثل مخطط النجوم ولكن بمستوى أعلى من التطبيع. تكون جداول الأبعاد طبيعية أو تحتوي على طبقات متعددة ، والتي تشبه ندفة الثلج.
9. شرح البيانات المنفصلة والمستمرة.
البيانات المنفصلة محدودة ومحددة ، مثل الجنس وأرقام الهواتف وما إلى ذلك. ومن ناحية أخرى ، تتغير البيانات المستمرة بطريقة منظمة ؛ على سبيل المثال ، العمر ودرجة الحرارة وما إلى ذلك.
10. ما هي خوارزميات تجميع التسلسل وخوارزميات السلاسل الزمنية؟
تجمع خوارزمية التجميع التسلسلي:
- تسلسل البيانات التي لها أحداث ، و
- المسارات ذات الصلة أو المشابهة.
تتنبأ خوارزميات السلاسل الزمنية بالقيم المستمرة في جداول البيانات. على سبيل المثال ، يمكنه التنبؤ بأرقام المبيعات والأرباح بناءً على أداء الموظف بمرور الوقت.
الآن بعد أن صقلت الأساسيات ، إليك عشرة أسئلة متكررة حول نماذج البيانات لممارستك!
11. وصف عملية تخزين البيانات.
تخزين البيانات يربط ويدير البيانات الخام من مصادر غير متجانسة. تسمح عملية جمع البيانات وتحليلها هذه لمؤسسات الأعمال بالحصول على رؤى ذات مغزى من مواقع متنوعة في مكان واحد ، والتي تشكل جوهر ذكاء الأعمال.
12. ما هي الاختلافات الرئيسية بين سوق البيانات ومخزن البيانات؟
يتيح متجر البيانات اتخاذ قرارات تكتيكية لنمو الأعمال من خلال التركيز على منطقة عمل واحدة واتباع نموذج تصاعدي. من ناحية أخرى ، يسهل مستودع البيانات اتخاذ القرار الاستراتيجي من خلال التأكيد على مجالات متعددة ومصادر البيانات واعتماد نهج من أعلى إلى أسفل.
13. اذكر أنواع العلاقات الحرجة الموجودة في نماذج البيانات.
يمكن تصنيف العلاقات الحرجة إلى:
- تحديد: يربط الجداول الأصل والتابعة بخط سميك. العمود المرجعي للجدول الفرعي هو جزء من المفتاح الأساسي.
- عدم تحديد الهوية: الجداول متصلة بخط منقط ، مما يدل على أن العمود المرجعي للجدول الفرعي ليس جزءًا من المفتاح الأساسي.
- Sef-recursive: عمود مستقل من الجدول متصل بالمفتاح الأساسي في علاقة تعاودية.
14. ما هي بعض الأخطاء الشائعة التي تواجهها أثناء نمذجة البيانات؟
قد يكون إنشاء نماذج بيانات واسعة أمرًا صعبًا. تزداد فرص الفشل أيضًا عند تشغيل الجداول أعلى من 200. ومن الأهمية بمكان أيضًا أن يكون لدى مصمم البيانات معرفة عملية كافية بمهمة العمل. خلاف ذلك ، فإن نماذج البيانات تتعرض لخطر الانهيار.
تشكل المفاتيح البديلة غير الضرورية مشكلة أخرى. يجب عدم استخدامها باعتدال ، ولكن فقط عندما لا تتمكن المفاتيح الطبيعية من أداء دور المفتاح الأساسي.
يمكن أن يواجه المرء أيضًا حالات عدم التطابق غير المناسب حيث يمكن أن يصبح الحفاظ على تكرار البيانات تحديًا كبيرًا.
15. مناقشة نظم إدارة قواعد البيانات الهرمية. ما هي عيوب نموذج البيانات هذا؟
يقوم نظام DBMS الهرمي بتخزين البيانات في هياكل تشبه الشجرة. يستخدم التنسيق العلاقة بين الوالدين والطفل حيث قد يكون للوالد العديد من الأطفال ، ولكن يمكن للطفل أن يكون له والد واحد فقط.
تشمل عيوب هذا النموذج ما يلي:
- الافتقار إلى المرونة والقدرة على التكيف مع احتياجات العمل المتغيرة ؛
- قضايا في الاتصالات بين الإدارات ، وبين الوكالات ، والرأسية ؛
- مشاكل الانقسام في البيانات.
16. تفصيل نوعين من تقنيات نمذجة البيانات.
العلاقة بين الكيانات (ER) ولغة النمذجة الموحدة (UML) هما تقنيتان قياسيتان لنمذجة البيانات.
يستخدم ER في هندسة البرمجيات لإنتاج نماذج البيانات أو الرسوم البيانية لأنظمة المعلومات. UML هي لغة للأغراض العامة لتطوير ونمذجة قواعد البيانات التي تساعد على تصور تصميم النظام.
17. ما هو البعد غير المرغوب فيه؟
يتم إنشاء بُعد البريد غير الهام من خلال الجمع بين السمات ذات العلاقة الأساسية المنخفضة (المؤشرات أو القيم المنطقية أو قيم العلم) في بُعد واحد. تتم إزالة هذه القيم من الجداول الأخرى ثم يتم تجميعها أو "غير المرغوب فيها" في جدول أبعاد مجرد ، وهي طريقة لبدء "التغيير السريع للأبعاد" داخل مستودعات البيانات.
18. اذكر بعض برامج DBMS الشائعة.
تعد MySQL و Oracle و Microsoft Access و dBase و SQLite و PostgreSQL و IBM DB2 و Microsoft SQL Server بعضًا من أدوات DBMS الأكثر استخدامًا في مجال تطوير البرامج في العصر الحديث.
19. ما هي مزايا وعيوب استخدام نمذجة البيانات؟
مميزات استخدام التنقيب عن البيانات:
- يمكن إدارة بيانات العمل بشكل أفضل من خلال تطبيع السمات وتعريفها.
- يسمح التنقيب عن البيانات بتكامل البيانات عبر الأنظمة ويقلل من التكرار.
- إنه يفسح المجال لتصميم قاعدة بيانات فعال.
- إنه يتيح التعاون والعمل الجماعي بين الإدارات.
- يسمح بسهولة الوصول إلى البيانات.
سلبيات استخدام نمذجة البيانات:
- يمكن أن تجعل نمذجة البيانات النظام أكثر تعقيدًا في بعض الأحيان.
- لديها تبعية هيكلية محدودة.
20. شرح التنقيب في البيانات وتحليلات النمذجة التنبؤية.
التنقيب عن البيانات هو مهارة متعددة التخصصات. يتضمن تطبيق المعرفة من مجالات مثل الذكاء الاصطناعي (AI) والتعلم الآلي (ML) وتقنيات قواعد البيانات. هنا ، يهتم الممارسون بكشف أسرار البيانات واكتشاف العلاقات غير المعروفة سابقًا.
تشير النمذجة التنبؤية إلى نماذج الاختبار والتحقق من الصحة التي يمكن أن تتنبأ بنتائج محددة. هذه العملية لها العديد من التطبيقات في الذكاء الاصطناعي والتعلم الآلي والإحصاء.
رؤى مهنية لمصممي البيانات الطموحين
سواء كنت تبحث عن وظيفة جديدة أو ترقية أو انتقال وظيفي ، فإن تحسين المهارات في تخصص ذي صلة يمكن أن يحسن بشكل كبير فرصك في التوظيف.
يجب أن تفكر في التحقق من IIIT-B & upGrad's Executive PG Program in Data Science الذي تم إنشاؤه للمهنيين العاملين ويقدم أكثر من 10 دراسات حالة ومشاريع ، وورش عمل عملية عملية ، وإرشاد مع خبراء الصناعة ، وجهاً لوجه مع موجهين في الصناعة ، 400+ ساعة من التعلم والمساعدة في العمل مع الشركات الكبرى.
بهذا ننهي هذه المناقشة حول وظائف نمذجة البيانات والمقابلات. نحن على يقين من أن البيانات المذكورة أعلاه لنمذجة أسئلة وأجوبة المقابلة ستساعدك على توضيح مجالات مشكلتك وأداء أفضل في عملية التنسيب!
هناك الكثير من العوامل التي من شأنها أن تؤثر حقًا على راتب أي فرد في مجال نمذجة البيانات. في المتوسط ، راتب مصمم البيانات هو روبية. 12،00،000 سنويًا. سيعتمد ذلك كثيرًا على الشركة التي تعمل معها. حتى إذا كنت تبدأ كمصمم بيانات ، فإن أقل حزمة هي Rs. 600000 سنويًا ، في حين أن أعلى حزمة يمكن أن يتوقعها المرء تصل إلى روبية. 20،00،000 سنويًا. نمذجة البيانات مجال ناشئ له طلب كبير في السوق. من ناحية أخرى ، فإن عدد المحترفين الذين يتقنون نمذجة البيانات أقل بكثير. قد تبدو المقابلة صعبة بعض الشيء إذا لم تكن قد أعدت بشكل صحيح ، لكن يمكنك توقع مقابلة لائقة مع التحضير المناسب. المهارات المطلوبة لتصبح مصمم بيانات مختلفة تمامًا عن تلك المطلوبة للدخول في إدارة الأنظمة أو البرمجة. عادة ، تتطلب هذه الأنواع من الوظائف مهارات تقنية ، لكن الحالة مختلفة هنا. يحتاج المرء إلى أن يكون على دراية بالجانب المنطقي ليصبح مصمم بيانات. بعض المهارات الأساسية التي يحتاج المرء إلى تطويرها هي:كم يكسب عارض البيانات سنة؟
هل من الصعب إجراء مقابلة مع نمذجة البيانات؟
إلى جانب توضيح أساسيات نمذجة البيانات ، يجب أن تفضل أيضًا الاطلاع على بعض أسئلة المقابلة الأكثر شيوعًا. سيسهل ذلك عليك الإجابة على الأسئلة التي يتم طرحها في المقابلة لأن لديك بالفعل فكرة عن الأسئلة المختلفة التي يتم طرحها وكذلك طريقة الإجابة عليها. ما المهارات التي أحتاجها لأكون مصمم بيانات؟
1. التصميم المفاهيمي
2. الاتصالات الداخلية
3. اتصالات المستخدم
4. التفكير المجرد
حتى إذا لم تكن ماهرًا جدًا في الجانب التقني ، يمكنك الحصول على وظيفة كمصمم بيانات إذا كنت تستطيع التفكير بشكل تجريدي ومفاهيمي.