إنشاء خريطة التمثيل اللوني باستخدام بايثون
نشرت: 2023-01-02تتكون الخريطة الحرارية من قيم تعرض ظلال مختلفة من لون واحد للقيم الفردية المراد رسمها. بشكل عام ، تمثل الظلال الأغمق للمخطط قيمًا أعلى من الظل الفاتح. للحصول على قيمة مختلفة بشكل واضح ، يمكن أيضًا استخدام لون مختلف تمامًا. يتم عرض قيم البيانات بمساعدة الألوان في الرسم البياني. الهدف الرئيسي للخريطة الحرارية هو توفير قائمة مرئية ملونة بالمعلومات المعطاة. الخريطة الحرارية (أو خريطة الحرارة) هي تقنية تصور البيانات التي تعرض حجم الظاهرة كلون في بعدين. الخريطة الحرارية ، على وجه الدقة ، هي تقنية لتصور البيانات التي تستخدم اللون لعرض كيفية اختلاف قيمة الفائدة على أساس قيم المتغيرين الآخرين. لتلخيص ذلك ، يمنحك استخدام ألوان مختلفة لتمثيل البيانات نظرة عامة على البيانات الرقمية. بالإضافة إلى ذلك ، تتضمن خريطة Python الحرارية تنفيذ تحليل الكتلة ، وتنظيم المصفوفات ، واختيار لوحة ألوان معينة وكذلك تبديل الصفوف والأعمدة لوضع قيم متشابهة في مكان قريب.
على سبيل المثال ، يمكنك الاستفادة من خريطة الحرارة لفهم كيف يتغير تلوث الهواء بالضبط وفقًا للوقت من اليوم عبر مجموعة من البلدات والمدن.
يمكن فهم الخريطة الحرارية لموقع الويب بطريقتين: من خلال رؤية التصور ومراجعة نقاط البيانات الأولية. يمكن ملاحظة اتجاهات النقرات والمشكلات في لمحة سريعة بسبب الطبيعة ذات الترميز اللوني لخرائط الحرارة (يشير اللون الأحمر إلى أكبر قدر من التفاعل ، بينما يشير اللون الأزرق إلى أقلها).
خريطة التمثيل اللوني ثنائية الأبعاد هي أداة تصور البيانات التي تسمح بتمثيل حجم الظاهرة في شكل ألوان. في Python ، يمكن رسم خرائط التمثيل اللوني ثنائية الأبعاد باستخدام حزمة Matplotlib. هناك عدة طرق يمكن استخدامها لرسم خرائط حرارية ثنائية الأبعاد. وبعض منها تناقش أدناه.
تحقق من دورات علوم البيانات لدينا لتحسين مهاراتك.
جدول المحتويات
الطريقة 1: استخدام دالة matplotlib.pyplot.imshow ()
بناء الجملة: matplotlib.pyplot.imshow (X ، cmap = لا شيء ، القاعدة = لا شيء ، الجانب = لا شيء ، الاستيفاء = لا شيء ، ألفا = لا شيء ، vmin = لا شيء ،
vmax = لا شيء ، الأصل = لا شيء ، المدى = بلا ، الشكل = <المعامل المهمل> ، filternorm = 1 ، filterrad = 4.0 ،
imlim = <المعلمة المهملة> ، إعادة العينة = بلا ، url = بلا ، \ ، البيانات = لا شيء ، \\ * kwargs)
الطريقة 2: استخدام مكتبة Seaborn
لهذا نستخدم seaborn.heatmap () وظيفة
بناء الجملة: seaborn.heatmap (data، *، vmin = None، vmax = None، cmap = None، center = None، robust = False، anot = None،
fmt = '. 2g' ، annot_kws = بلا ، خطوط الطول = 0 ، لون الخط = 'أبيض' ، cbar = صحيح ، cbar_kws = لا شيء ، cbar_ax = لا شيء ،
square = False، xticklabels = 'auto'، yticklabels = 'auto'، mask = None، ax = None، ** kwargs)
استكشف دوراتنا الشهيرة في علوم البيانات
برنامج الدراسات العليا التنفيذية في علوم البيانات من IIITB | برنامج الشهادة المهنية في علوم البيانات لاتخاذ قرارات الأعمال | ماجستير العلوم في علوم البيانات من جامعة أريزونا |
برنامج الشهادة المتقدمة في علوم البيانات من IIITB | برنامج الشهادة الاحترافية في علوم البيانات وتحليلات الأعمال من جامعة ماريلاند | دورات علوم البيانات |
الطريقة الثالثة: استخدام دالة matplotlib.pyplot.pcolormesh ()
بناء الجملة: matplotlib.pyplot.pcolormesh (* args، alpha = None، norm = None، cmap = None، vmin = None، vmax = None،
التظليل = 'مسطح' ، مضاد للتحيز = خطأ ، البيانات = لا شيء ، ** kwargs)
Seaborn هي مكتبة Python تمكننا من إنشاء مخططات أفضل بسهولة ، بمساعدة وظيفة خريطة الحرارة () الخاصة بها. يبدأ هذا القسم بمنشور يشرح الاستخدام الأساسي للوظيفة بناءً على أي نوع من إدخال البيانات. بعد ذلك ، سيرشدك إلى الطرق المختلفة لتخصيص المخطط ، مثل التحكم في اللون وتطبيع البيانات.
عادة ، نستخدم بعض تقنيات المجموعات على خريطة الحرارة. يتم ذلك من أجل تجميع العناصر التي لها نمط مماثل لمتغيراتها الرقمية.
بشكل عام ، يوصى بعرض مخطط الأسنان (مخطط الشجرة هو رسم تخطيطي يوضح العلاقة الهرمية بين الكائنات. وعادة ما يتم إجراؤه في شكل إخراج من التجميع الهرمي. تتمثل الوظيفة الأساسية لمخطط dendrogram في اكتشاف الطريقة الأنسب لتخصيص كائنات إلى مجموعات.) على
أعلى خريطة الحرارة لوصف كيفية تنفيذ التجميع. أخيرًا وليس آخرًا ، قد يكون من المفيد مقارنة التجميع الذي حصلنا عليه بالبنية المتوقعة ، والتي تظهر كلون إضافي.
كيفية تفسير خريطة التمثيل اللوني في بايثون:
مهارات علوم البيانات الأعلى للتعلم في عام 2022
SL. لا | مهارات علوم البيانات الأعلى للتعلم في عام 2022 | |
1 | دورة تحليل البيانات | دورات الإحصاء الاستنتاجي |
2 | برامج اختبار الفرضيات | دورات الانحدار اللوجستي |
3 | دورات الانحدار الخطي | الجبر الخطي للتحليل |
تصور بيانات بايثون - خرائط التمثيل اللوني
- استيراد الباندا كما pd. استيراد numpy كـ np. استيراد matplotlib .pyplot كـ PLT. ...
- التين ، الفأس = plt.subplots (figsize = (10،6)) sns. خريطة الحرارة ( data.corr () ، center = 0 ، cmap = 'Blues') ax.set_title ('علاقة خطية متعددة لسمات السيارة') 3. fig ، ax = plt.subplots (figsize = (10،6)) sns . خريطة الحرارة ( data.corr () ، المركز = 0 ، cmap = 'BrBG' ، التعليق التوضيحي = صحيح)
كيفية إنشاء خريطة حرارية:
- قم بتحميل مجموعة البيانات.
- اصنع مصفوفة Python Numpy.
- أنتج المحور في بايثون.
- قم بتصميم مصفوفة لإضافة تعليق توضيحي على خريطة التمثيل اللوني .
- بناء الشكل Matplotlib وتحديد المؤامرة .
- قم ببناء خريطة التمثيل اللوني.
الآن ، السؤال هو ، كيف يمكنك زيادة حجم التعليقات التوضيحية لخريطة الحرارة البحرية في بايثون؟ الأمر بسيط - يمكن شرح المولود البحري من حيث مكتبة Python التي تستند إلى matplotlib وتستخدم بالفعل لتصور البيانات.
اقرأ مقالاتنا الشهيرة في علوم البيانات
المسار الوظيفي لعلوم البيانات: دليل مهني شامل | النمو الوظيفي لعلوم البيانات: مستقبل العمل هنا | لماذا علم البيانات مهم؟ 8 طرق تضيف علوم البيانات قيمة إلى الأعمال |
أهمية علم البيانات للمديرين | ورقة الغش النهائية لعلم البيانات التي يجب أن يمتلكها علماء البيانات | أهم 6 أسباب لماذا يجب أن تصبح عالم بيانات |
يوم في حياة عالم البيانات: ماذا يفعلون؟ | ضبطت الأسطورة: علم البيانات لا يحتاج إلى تشفير | ذكاء الأعمال مقابل علوم البيانات: ما هي الاختلافات؟ |
يقترب
- الوحدة المراد استيرادها
- تحميل أو إنتاج البيانات
- استدعاء وظيفة heatmap () مع تعيين التعليق التوضيحي على True.
- يجب تخصيص الحجم لمعامل annot_kws
- المؤامرة التي سيتم عرضها
تغيير لون خريطة التمثيل اللوني:
يمكن تغيير لون مخطط الحرارة البحري باستخدام سمة cmap لخريطة الألوان لخريطة الحرارة.
أنواع الخرائط الحرارية:
يوجد عادةً نوعان من خرائط التمثيل اللوني:
- خريطة الحرارة للشبكة: يوجد مقدار من القيم يتم عرضه من خلال الألوان الموضوعة في مصفوفة من الصفوف وكذلك الأعمدة ، في أغلب الأحيان بواسطة دالة تعتمد على الكثافة. المدرجة أدناه هي بعض خرائط الحرارة للشبكة
- خريطة الحرارة العنقودية - الهدف المطلق لخريطة الحرارة العنقودية هو ببساطة بناء ارتباطات بين كل من الميزات ونقاط البيانات. هذا هو نوع الخرائط الحرارية التي تنفذ التجميع كجزء من عملية تجميع الميزات المتشابهة في الطبيعة.
تُستخدم خرائط الحرارة العنقودية أيضًا على نطاق واسع في العلوم البيولوجية من أجل دراسة أوجه التشابه الجيني بين مختلف الأفراد.
- خريطة الحرارة المكانية - تحتوي خريطة الحرارة على عدة مربعات وكل مربع في خريطة الحرارة يتم تعيينه في الواقع لتمثيل اللون على أساس قيمة الخلايا المجاورة. يعتمد موقع اللون ذاته على مقدار القيمة في مساحة معينة. هذه الخرائط الحرارية هي في الواقع رسم مبني على البيانات بواسطة لوحة أرقام مغطاة أعلى الصورة. يتم تعيين لون ساخن للخلايا التي لها قيمة أعلى من الخلايا الأخرى ، بينما يتم تعيين لون بارد للخلايا التي تحتوي على قيم أقل.
استخدامات HEATMAPS:
- تحليلات الأعمال: تُستخدم خريطة التمثيل اللوني كأداة مرئية لتحليل الأعمال وتوفر إشارات مرئية سريعة حقًا حول الأداء الحالي والنتائج بالإضافة إلى أي مجال للتحسينات. يمكن لخرائط الحرارة أيضًا تحليل البيانات الموجودة وكذلك العثور على مناطق شدة قد تعكس مكان إقامة معظم العملاء. يمكن أيضًا تحديث خرائط الحرارة باستمرار لتعكس النمو والجهود. يمكن أيضًا دمج هذه الخرائط في سير عمل الأعمال وبالتالي تصبح جزءًا من التحليلات المستمرة. هؤلاء
تقديم البيانات بطريقة ممتعة بصريًا كما يسهل فهم أعضاء الفريق أو العملاء والتواصل معهم.
- الموقع الإلكتروني: تُستخدم الخرائط الحرارية فعليًا في مواقع الويب لتصور بيانات الزوار. يساعد هذا النوع من التصور أصحاب الأعمال والمسوقين على تحديد القسم الأفضل والأسوأ أداءً في صفحة ويب معينة. تساعدهم هذه الرؤى أيضًا على تحسين موقع الويب الخاص بهم بشكل أفضل.
- تحليل البيانات الاستكشافية: يُعرف هذا أيضًا باسم EDA وهي مهمة يقوم بها علماء البيانات من أجل التعرف على جميع البيانات. في الواقع ، تم إجراء جميع الدراسات الأولية لفهم البيانات المعروفة باسم EDA . يمكن أيضًا تفسيرها على أنها عملية تحليل مجموعات البيانات قبل بدء مهمة النمذجة. في الواقع ، إنها مهمة مملة تمامًا النظر إلى جدول بيانات مليء بالأرقام من أجل تحديد الخصائص المهمة في مجموعة البيانات. وبالتالي ، يتم إجراء EDA من أجل تلخيص ميزاتها ومواصفاتها الرئيسية ، غالبًا بطرق مرئية ، والتي تتضمن أيضًا خرائط التمثيل اللوني. هذه طريقة آسرة لتصور العلاقات بين المتغيرات في مساحة عالية الأبعاد. يمكن القيام بذلك بسهولة باستخدام متغيرات الميزات كرؤوس الصفوف وكذلك رؤوس الأعمدة.
- البيولوجيا الجزيئية : تُستخدم الخرائط الحرارية من أجل دراسة التباين وكذلك أنماط التشابه في الحمض النووي الريبي ، والحمض النووي ، وما إلى ذلك.
- التصور الجغرافي: تعد مخططات الخرائط الحرارية الجغرافية المكانية مفيدة جدًا عندما يتعلق الأمر بعرض كيفية مقارنة المناطق الجغرافية للخريطة ببعضها البعض على أساس معايير محددة. تساعد الخرائط الحرارية أيضًا في تحليل الكتلة أو تحليل النقاط الساخنة من أجل اكتشاف مجموعات التراكيز العالية من النشاط. خذ على سبيل المثال تحليل سعر الإيجار عبر Airbnb!
- التسويق والمبيعات: تُستخدم قدرة خريطة الحرارة على اكتشاف البرد ، وكذلك النقاط الدافئة ، من أجل تعزيز معدلات استجابة التسويق من خلال التسويق المستهدف. تسهل الخرائط الحرارية أيضًا اكتشاف المناطق التي تستجيب للحملات والأسواق غير المخدومة وإقامة العملاء بالإضافة إلى اتجاهات البيع المرتفعة - تساعد هذه على تعزيز مجموعات المنتجات والاستفادة من المبيعات وكذلك بناء شرائح مستهدفة من العملاء مع تحليل التركيبة السكانية الإقليمية.
استنتاج
في حين أن هناك العديد من أنظمة الألوان المختلفة التي يمكن أن توضح الخريطة الحرارية ، فإنها تأتي أيضًا مع مجموعة من المزايا الإدراكية بالإضافة إلى عيوب كل منها. تتجاوز اختيارات لوحة الألوان في الواقع مجرد الجماليات ، خاصةً لأن الألوان الموجودة في خريطة الحرارة تكشف عن أنماط في البيانات. في الواقع ، يمكن أن تعزز أنظمة الألوان الجيدة اكتشاف الأنماط. ومع ذلك ، فإن الخيارات السيئة يمكن أن تخفيه في الواقع . بالإضافة إلى ذلك ، خرائط الحرارة البحرية هي خرائط الحرارة الشبكية التي يمكن أن تأخذ أنواعًا مختلفة من البيانات من أجل إنشاء خرائط حرارية. لذلك ، فإن الغرض الأساسي من خريطة الحرارة البحرية هو ببساطة إظهار مصفوفة الارتباط من خلال تصور البيانات. كما أنه يساعد في العثور على العلاقة بين الميزات المتعددة وكذلك الميزات الأفضل لبناء نموذج التعلم الآلي.
إذا كنت ترغب في التعمق أكثر في العمل مع Python ، خاصة لعلوم البيانات ، فإن upGrad تقدم لك PGP التنفيذي في علوم البيانات. تم تصميم هذا البرنامج لمتخصصي تكنولوجيا المعلومات من المستوى المتوسط ، ومهندسي البرمجيات الذين يتطلعون إلى استكشاف علوم البيانات ، والمحللين غير التقنيين ، والمهنيين في بداية حياتهم المهنية ، وما إلى ذلك. يضمن منهجنا المنظم ودعمنا المكثف أن يصل طلابنا إلى إمكاناتهم الكاملة دون صعوبات.