كيفية إنشاء Python Heatmap باستخدام Seaborn؟ [شرح شامل]
نشرت: 2021-10-06الأعمال التجارية في عصر البيانات الضخمة غارقة في كميات كبيرة من البيانات على أساس يومي. ومع ذلك ، ليس الكم الهائل من البيانات ذات الصلة هو المهم ولكن ما يتم عمله بالبيانات. ومن ثم ، يجب تحليل البيانات الضخمة لاكتساب رؤى من شأنها أن تملي في النهاية قرارات أفضل وتؤثر على تحركات الأعمال الاستراتيجية.
ومع ذلك ، لا يكفي تحليل البيانات وتركها هناك. الخطوة التالية هي تصور البيانات الذي يعرض البيانات في تنسيق مرئي لرؤية وفهم الأنماط والاتجاهات والقيم المتطرفة في البيانات. تعد خريطة التمثيل اللوني في بايثون واحدة من العديد من تقنيات تصور البيانات.
يشير تصور البيانات إلى التمثيل الرسومي للبيانات وقد يشمل الرسوم البيانية والمخططات والخرائط والعناصر المرئية الأخرى. إنه أمر بالغ الأهمية لتحليل كميات هائلة من المعلومات واتخاذ قرارات تعتمد على البيانات.
ستوجهك هذه المقالة إلى مفهوم الخريطة الحرارية في Python وكيفية إنشاء واحدة باستخدام Seaborn.
جدول المحتويات
ما هي خريطة التمثيل اللوني؟
خريطة الحرارة في بايثون هي تقنية تصور البيانات حيث تمثل الألوان كيف تتغير قيمة الفائدة مع قيم متغيرين آخرين. إنه تمثيل رسومي ثنائي الأبعاد للبيانات ذات القيم المشفرة بالألوان ، مما يعطي عرضًا مبسطًا وثاقبًا وجذابًا بصريًا للمعلومات. الصورة أدناه هي تمثيل مبسط لخريطة حرارية.
عادةً ما تكون خريطة التمثيل اللوني عبارة عن جدول بيانات يحتوي على صفوف وأعمدة تمثل مجموعات مختلفة من الفئات. تحتوي كل خلية في الجدول على قيمة منطقية أو عددية تحدد لون الخلية بناءً على لوحة ألوان معينة. وبالتالي ، تستخدم الخرائط الحرارية الألوان للتأكيد على العلاقة بين قيم البيانات التي سيكون من الصعب فهمها إذا تم ترتيبها في جدول عادي باستخدام أرقام أولية.
تجد الخرائط الحرارية تطبيقات في العديد من سيناريوهات العالم الحقيقي. على سبيل المثال ، ضع في اعتبارك الخريطة الحرارية أدناه. إنها خريطة حرارة لمؤشر الأسهم تحدد الاتجاهات السائدة في سوق الأسهم. تستخدم خريطة الحرارة مخطط ألوان بارد إلى ساخن لإظهار الأسهم الهبوطية وأيها صعودي. يتم تمثيل الأول باستخدام اللون الأحمر ، بينما تم تصوير الأخير باللون الأخضر.
مصدر
خرائط الحرارة تجد استخدامها في عدة مجالات أخرى. تتضمن بعض الأمثلة الخرائط الحرارية لموقع الويب وخرائط الحرارة الجغرافية وخرائط الحرارة الرياضية. على سبيل المثال ، يمكنك استخدام خريطة الحرارة لفهم كيفية اختلاف هطول الأمطار وفقًا لشهر السنة عبر مجموعة من المدن. خرائط الحرارة مفيدة للغاية لدراسة السلوك البشري.
الارتباط الحراري
خريطة حرارة الارتباط عبارة عن مصفوفة ثنائية الأبعاد توضح الارتباط بين متغيرين مختلفين. تظهر صفوف الجدول قيم المتغير الأول ، بينما يظهر المتغير الثاني كأعمدة. مثل خريطة الحرارة العادية ، تأتي خريطة حرارة الارتباط أيضًا مع شريط ألوان لقراءة البيانات وفهمها.
نظام الألوان المستخدم هو أن أحد طرفي مخطط الألوان يمثل نقاط البيانات ذات القيمة المنخفضة والطرف الآخر يمثل نقاط البيانات عالية القيمة. ومن ثم ، تعد خرائط الارتباط الحراري مثالية لتحليل البيانات لأنها تقدم أنماطًا في نموذج يمكن قراءته بسهولة مع إبراز التباين في البيانات أيضًا.
فيما يلي تمثيل كلاسيكي لخارطة حرارة الارتباط.
مصدر
إنشاء خريطة حرارة Seaborn في بايثون
Seaborn هي مكتبة Python تُستخدم لتصور البيانات وتستند إلى matplotlib. يوفر وسيلة إعلامية وجذابة بصريًا لتقديم البيانات في تنسيق رسم بياني إحصائي. في خريطة حرارية تم إنشاؤها باستخدام seaborn ، تصور لوحة الألوان التباين في البيانات ذات الصلة. إذا كنت مبتدئًا وترغب في اكتساب الخبرة في علم البيانات ، فراجع دورات علوم البيانات لدينا.
خطوات إنشاء خريطة حرارية في بايثون
تقدم الخطوات التالية مخططًا تقريبيًا لكيفية إنشاء خريطة حرارية بسيطة في بايثون:
- استيراد جميع الحزم المطلوبة
- قم باستيراد الملف حيث قمت بتخزين البيانات الخاصة بك
- ارسم خريطة الحرارة
- اعرض الخريطة الحرارية باستخدام matplotlib
الآن ، دعنا نوضح لك كيف يمكن استخدام البحر ، جنبًا إلى جنب مع matplotlib والباندا ، لإنشاء خريطة حرارية.
في هذا المثال ، سننشئ خريطة حرارة بحرية في Python لـ 30 شركة أدوية. ستعرض خريطة الحرارة الناتجة رموز الأسهم وتغير سعرها في اليوم الواحد. سنبدأ بجمع بيانات السوق عن الأسهم الصيدلانية وإنشاء ملف CSV (قيمة مفصولة بفواصل) يتكون من رموز الأسهم وتغير سعر النسبة المئوية المقابلة لها في أول عمودين من ملف CSV المذكور.
نظرًا لأننا نعمل مع 30 شركة فارما ، فسننشئ مصفوفة خريطة الحرارة تتكون من 6 صفوف و 5 أعمدة. بالإضافة إلى ذلك ، نريد أن توضح الخريطة الحرارية النسبة المئوية لتغير السعر بترتيب تنازلي. لذلك ، سنرتب المخزونات في ملف CSV بترتيب تنازلي ونضيف عمودين آخرين للإشارة إلى موضع كل سهم على المحورين X و Y لخريطة الحرارة البحرية.
الخطوة 1: استيراد حزم Python.
مصدر
الخطوة 2: تحميل مجموعة البيانات.
تتم قراءة مجموعة البيانات باستخدام وظيفة read_csv من الباندا. علاوة على ذلك ، نستخدم بيان الطباعة لتصور الصفوف العشرة الأولى.
مصدر
الخطوة 3: إنشاء مصفوفة Python Numpy.
مع مراعاة المصفوفة 6 × 5 ، سننشئ مصفوفة ذات أبعاد n لأعمدة "الرمز" و "التغيير".
مصدر
الخطوة 4: إنشاء المحور في بايثون.
من كائن إطار البيانات المحدد "df" ، تقوم الوظيفة المحورية بإنشاء جدول مشتق جديد. تأخذ الدالة المحورية ثلاث وسيطات - الفهرس والأعمدة والقيم. قيم خلايا الجدول الجديد مأخوذة من عمود "التغيير".
مصدر
الخطوة 5: إنشاء مصفوفة للتعليق على خريطة التمثيل اللوني.
الخطوة التالية هي إنشاء مصفوفة لتعليق خريطة الحرارة البحرية. لهذا ، سوف نسمي طريقة التسطيح على المصفوفات "النسبة المئوية" و "الرمز" لتسوية قائمة بايثون من القوائم في سطر واحد. علاوة على ذلك ، تعمل وظيفة zip على ضغط قائمة في Python. سنقوم بتشغيل Python for loop ونستخدم وظيفة التنسيق لتنسيق رموز الأسهم وقيم تغيير سعر النسبة المئوية حسب الحاجة.
مصدر
الخطوة 6: إنشاء شكل matplotlib وتحديد المؤامرة.
في هذه الخطوة ، سننشئ مخطط matplotlib فارغًا ونحدد حجم الشكل. بالإضافة إلى ذلك ، سنضيف عنوان الحبكة ، ونضبط حجم خط العنوان ، ونصلح المسافة بينه وبين الحبكة باستخدام طريقة set_position. أخيرًا ، نظرًا لأننا نريد فقط عرض رموز الأسهم وتغير النسبة المئوية المقابلة لها في اليوم الواحد ، فسوف نخفي علامات التجزئة الخاصة بالمحور X و Y ونزيل المحاور من المؤامرة.
مصدر
الخطوة السابعة: إنشاء خريطة التمثيل اللوني
في الخطوة الأخيرة ، سوف نستخدم وظيفة خريطة الحرارة من حزمة بايثون seaborn لإنشاء خريطة الحرارة. تأخذ وظيفة خريطة الحرارة لحزمة بايثون seaborn المجموعة التالية من الوسائط:
البيانات :
إنها مجموعة بيانات ثنائية الأبعاد يمكن إجبارها في مصفوفة. بالنظر إلى Pandas DataFrame ، سيتم تسمية الصفوف والأعمدة باستخدام معلومات الفهرس / العمود.
تعليق :
وهي عبارة عن مصفوفة من نفس شكل البيانات وتوضح خريطة التمثيل اللوني.
cmap:
إنه كائن matplotlib أو اسم مخطط ألوان ويرسم قيم البيانات إلى مساحة اللون.
Fmt :
إنه رمز تنسيق سلسلة يستخدم عند إضافة التعليقات التوضيحية.
خطوط الطول:
يقوم بتعيين عرض الخطوط التي تقسم كل خلية.
مصدر
سيبدو الناتج النهائي للخريطة الحرارية البحرية لشركات الأدوية المختارة كما يلي:
مصدر
المضي قدمًا: تعلم لغة Python من خلال برنامج الشهادة الاحترافية في علوم البيانات من upGrad
يعد برنامج الشهادة الاحترافية في علوم البيانات لاتخاذ قرارات الأعمال برنامجًا صارمًا عبر الإنترنت مدته 8 أشهر يركز على علوم البيانات ومفاهيم التعلم الآلي مع التركيز بشكل خاص على تطبيقات الأعمال في العالم الحقيقي. تم تصميم البرنامج بشكل قاطع للمديرين والمهنيين العاملين الذين يرغبون في تطوير المعرفة والمهارات العملية لعلوم البيانات التي ستساعدهم على اتخاذ قرارات الأعمال الاستراتيجية والقائمة على البيانات.
فيما يلي بعض النقاط البارزة في الدورة:
- تقدير مرموق من IIM Kozhikode
- 200+ ساعة من المحتوى
- 3 مشاريع صناعية وتتويجا
- 20+ جلسة تعليمية مباشرة
- 5+ جلسات تدريب خبراء
- تغطية Excel و Tableau و Python و R و Power BI
- وجهًا لوجه مع موجهين في المجال
- 360 درجة الدعم الوظيفي
- المساعدة في العمل مع الشركات الكبرى
قم بالتسجيل في upGrad وصقل مهارات خرائط Python الخاصة بك لجميع احتياجات تصور البيانات الخاصة بك!
خاتمة
يستخدم الإحصائيون ومحللو البيانات عددًا كبيرًا من الأدوات والتقنيات لفرز البيانات المجمعة وتقديمها بطريقة سهلة الفهم وسهلة الاستخدام. في هذا الصدد ، ساعدت الخرائط الحرارية كأسلوب لتصور البيانات الشركات في جميع القطاعات على تصور البيانات وفهمها بشكل أفضل.
باختصار ، تم استخدام خرائط الحرارة على نطاق واسع ولا تزال تستخدم كأحد الأدوات الإحصائية والتحليلية المفضلة. هذا لأنها توفر طريقة جذابة بصريًا ويمكن الوصول إليها لعرض البيانات ، وهي سهلة الفهم ومتعددة الاستخدامات وقابلة للتكيف وتتخلص من الخطوات المملة لعمليات تحليل البيانات التقليدية وعمليات التفسير من خلال تقديم جميع القيم في إطار واحد.
كيف ترسم خريطة حرارية؟
الخريطة الحرارية هي طريقة قياسية لرسم البيانات المجمعة في تنسيق رسومي ثنائي الأبعاد. الفكرة الأساسية وراء رسم خريطة حرارية هي أن الرسم البياني مقسم إلى مربعات أو مستطيلات ، كل منها يمثل خلية واحدة في جدول البيانات ومجموعة بيانات وصف واحد. يتم ترميز المربع أو المستطيل لونيًا وفقًا لقيمة تلك الخلية في الجدول.
هل تظهر خريطة الحرارة الارتباط؟
خريطة حرارة الارتباط هي تمثيل رسومي لمصفوفة الارتباط التي تصور العلاقة بين المتغيرات المختلفة. تعتبر خرائط حرارة الارتباط فعالة جدًا إذا تم استخدامها بشكل صحيح حيث يمكن تحديد المتغيرات شديدة الارتباط بسهولة.
لماذا يستخدم seaborn في بايثون؟
Seaborn هي مكتبة Python مفتوحة المصدر تعتمد على matplotlib. يتم استخدامه لتحليل البيانات الاستكشافية والتصور ويعمل بسهولة مع إطارات البيانات ومكتبة Pandas. بالإضافة إلى ذلك ، فإن الرسوم البيانية التي تم إنشاؤها باستخدام seaborn قابلة للتخصيص بسهولة.