دروس HBase: دليل شامل للمبتدئين [2022]
نشرت: 2021-01-08البيانات الضخمة هي أحد أسرع القطاعات نموًا. من عمالقة التكنولوجيا مثل Facebook إلى المؤسسات المالية ، يستخدم الجميع البيانات الضخمة لتحسين عملياتهم. وأحد أشهر حلول البيانات الضخمة هو Hadoop.
للتعرف على Hadoop ، ستحتاج إلى التعرف على جميع مكوناته الرئيسية. لهذا السبب في هذه المقالة ، سنناقش HBase ، وهو جزء أساسي من Hadoop. سنناقش أساسيات HBase مثل بنيتها وتاريخها وتطبيقاتها. يمكنك وضع إشارة مرجعية على هذه المقالة للرجوع إليها في المستقبل.
هيا بنا نبدأ.
جدول المحتويات
ما هو HBase؟
على غرار الجدول الكبير من Google ، يعد HBase نموذج بيانات يوفر لك وصولاً سريعًا إلى كميات كبيرة من البيانات المنظمة. إنه منتج من Apache Software Foundation وهو جزء من مشروع Hadoop. إنه مكتوب بلغة Java وهو قاعدة بيانات موزعة غير علائقية ومفتوحة المصدر. يتم تشغيله على نظام الملفات الموزعة Hadoop (HDFS) ، وهو مكون التخزين لبرنامج Hadoop.
HBase موزع ومتسق ومتعدد الأبعاد ومتناثر. يمكنك استخدامه بكميات هائلة من البيانات والمخطط المتغير والعديد من المتطلبات الأخرى.
قد تتساءل ما هي البيانات المتفرقة. حسنًا ، يشبه البحث عن إبرة في كومة قش.

تاريخ HBase
قبل أن نتحدث عن ميزاته ووظائفه ، يجب أن تعرف تاريخه. أصدرت Google ورقتها البحثية على BigTable في عام 2006 ، وبعد ذلك ، أنشأ المطورون أول نموذج أولي لـ HBase في عام 2007.
وصل الإصدار الأول من HBase إلى السوق في أكتوبر من عام 2007 جنبًا إلى جنب مع Hadoop. في عام 2008 ، أصبح المشروع الفرعي لـ Hadoop ، وفي عام 2010 ، أصبح مشروعًا عالي المستوى من Apache. يمكنك القول أنه تم تطويره جنبًا إلى جنب مع Hadoop ومكوناته الرئيسية الأخرى.
لماذا نحتاج HBase؟
قبل البيانات الضخمة ، كان نظام RDBMS هو الحل الرائد لمشاكل تخزين البيانات. ولكن مع زيادة كمية البيانات ، شعرت الشركات بالحاجة إلى حل أفضل لتخزين البيانات وإدارتها. هذا عندما وصل Hadoop.
يستخدم نظام التخزين الموزع ولديه MapReduce لمعالجة البيانات. يحتوي Hadoop على مكونات متعددة ، مثل HDFS و MapReduce.
HBase من بين تلك المكونات الأساسية. تجعل ميزاته عضوًا مهمًا في نظام Hadoop البيئي. يسمح لك بالعمل على كميات هائلة من البيانات بسرعة. يمنحك أيضًا إدارة آمنة للغاية لبياناتك. يمكنك أيضًا دعم وظائف MapReduce باستخدام HBase Tables.
علاوة على ذلك ، فإن Hadoop قادر على أداء معالجة الدُفعات فقط. إنه يصل إلى البيانات بشكل تسلسلي فقط. أدوات مثل HBase و MongoDB تمكن Hadoop من الوصول إلى البيانات بشكل عشوائي وليس بطريقة متسلسلة.
الاختلافات بين HDFS و HBase
نظرًا لأن كل من HDFS و HBase هما مكونان لـ Hadoop ، فقد يكون من المربك بعض الشيء لأي شخص أن يفهم الاختلافات بينهما ، على الرغم من اختلافهما الشديد ويقومان بمهام منفصلة.
HDFS هو نظام الملفات الموزع لـ Hadoop ، ويمكنك استخدامه لتخزين كميات هائلة من البيانات. HBase ، من ناحية أخرى ، هي قاعدة بيانات تعتمد على HDFS. لا يمكنك البحث عن السجلات الفردية بسرعة في HDFS ، ولكن يمكنك ذلك باستخدام HBase.
يوفر HDFS معالجة دفعات عالية زمن الوصول ، بينما يوفر HBase وصولاً منخفضًا للكمون. تحصل على وصول تسلسلي إلى ملفاتك في HDFS ، ولكن مع HBase ، تحصل على وصول عشوائي. بشكل عام ، يزيد HBase من سرعة عمليات معينة يمكنك إجراؤها باستخدام HDFS.

عمارة HBase
يمكننا تعريف بنية HBase كمخزن بيانات ذو قيمة أساسية يركز على العمود. كما أنشأنا من قبل ، فهو يعمل بشكل مثالي على رأس HDFS من خلال تحسين إمكانية الوصول إليه وسرعة التشغيل. الأجزاء الثلاثة الأساسية لـ HBase هي:
- خوادم المنطقة
- خادم HMaster
- حارس حديقة الحيوان
HMaster مسؤول عن الوظائف الإدارية وتنسيق خوادم المنطقة. Zookeeper مسؤول عن معلومات التكوين والمزامنة الموزعة.
التخزين في HBase
ستكون مدونة التدريب HBase هذه غير مكتملة دون مناقشة آلية التخزين الخاصة بها. لقد ذكرنا بالفعل أن HBase هي قاعدة بيانات موجهة نحو الأعمدة ، وتقوم بفرز جداولها حسب الصفوف. يحدد المخطط في HBase مجموعات الأعمدة التي تمثل أزواجًا ذات قيمة مفتاح. يمكن أن يحتوي جدول واحد على العديد من مجموعات الأعمدة ، ويمكن أن تحتوي عائلة الأعمدة على أعمدة متعددة. كل خلية في الجدول لها طابع زمني.
يمكننا تقسيمها بالطريقة التالية:
- يحتوي الجدول على عدة صفوف
- يحتوي الصف على مجموعات أعمدة متعددة
- عائلة الأعمدة لها أعمدة مختلفة
- يحتوي العمود على أزواج مختلفة من المفاتيح والقيمة
موجه الصف مقابل العمود الموجه
أنت تعلم أن HBase عبارة عن قاعدة بيانات موجهة نحو الأعمدة ، ولكن يمكنك معرفة ما يعنيه ذلك. حسنًا ، تعد قاعدة البيانات الموجهة نحو الصفوف ممتازة لعمليات المعاملات عبر الإنترنت ، بينما تعد قاعدة البيانات الموجهة نحو الأعمدة ممتازة للمعالجة التحليلية عبر الإنترنت. وبالمثل ، فإن الأول مناسب للعمل بكميات صغيرة من الصفوف والأعمدة ، بينما الأخير مناسب لكميات كبيرة من نفس النوع.
تطبيقات HBase
نظرًا لقدرة HBase على تحسين إمكانية الوصول وسرعة تخزين البيانات ، فإنه يجد تطبيقات في العديد من الصناعات. لقد قرأت في تاريخ HBase بالفعل أنه كان متاحًا في السوق لفترة طويلة. مع أكثر من عقد من التحديثات والتقدم ، أصبح أداة حيوية لأي متخصص في البيانات الضخمة.

فيما يلي تطبيقات HBase:
- نستخدم HBase عندما نحتاج إلى كتابة تطبيقات ثقيلة
- عندما نحتاج إلى إجراء تحليلات السجل عبر الإنترنت لإنشاء تقارير الامتثال
- عندما نحتاج إلى وصول سريع وعشوائي إلى بياناتنا المخزنة في HDFS
- عندما نحتاج إلى وصول للقراءة / الكتابة في الوقت الفعلي إلى كميات هائلة من البيانات (البيانات الضخمة)
تستخدم العديد من المنظمات المهمة مثل Google و Facebook HBase لعملياتها الداخلية. تنتشر البيانات الضخمة في كل مكان ، ولهذا السبب ازدادت أيضًا متطلبات HBase نسبيًا.
افكار اخيرة
مع طلب خبراء Hadoop في أعلى مستوياته على الإطلاق ، سيكون من المناسب لمتخصصي البيانات الضخمة معرفة أكبر قدر ممكن حول هذا الحل. يحتوي HBase على العديد من التطبيقات وهذا أيضًا في مجموعة متنوعة من القطاعات. لهذا السبب من الضروري التعرف على أساسيات HBase وجوانبها المتقدمة.
إذا كنت مهتمًا بمعرفة المزيد عن البيانات الضخمة ، فراجع دبلومة PG في تخصص تطوير البرمجيات في برنامج البيانات الضخمة المصمم للمهنيين العاملين ويوفر أكثر من 7 دراسات حالة ومشاريع ، ويغطي 14 لغة وأدوات برمجة ، وتدريب عملي عملي ورش العمل ، أكثر من 400 ساعة من التعلم الصارم والمساعدة في التوظيف مع الشركات الكبرى.
تحقق من دورات هندسة البرمجيات الأخرى لدينا في upGrad.