Comment créer une carte thermique Python avec Seaborn ? [Explication complète]

Publié: 2021-10-06

À l'ère du Big Data, les entreprises sont quotidiennement submergées par de gros volumes de données. Cependant, ce n'est pas la quantité de données pertinentes mais ce qui est fait avec les données qui compte. Par conséquent, le Big Data doit être analysé pour obtenir des informations qui dicteront finalement de meilleures décisions et influenceront les mouvements commerciaux stratégiques.

Pourtant, il ne suffit pas d'analyser les données et de les laisser là. L'étape suivante est la visualisation des données qui présente les données dans un format visuel pour voir et comprendre les modèles, les tendances et les valeurs aberrantes dans les données. Heatmap en Python est l'une des nombreuses techniques de visualisation de données.

La visualisation des données fait référence à la représentation graphique des données et peut inclure des graphiques, des diagrammes, des cartes et d'autres éléments visuels. Il est très essentiel pour analyser d'énormes quantités d'informations et prendre des décisions fondées sur des données.

Cet article vous expliquera le concept d'une carte thermique en Python et comment en créer une à l'aide de Seaborn.

Table des matières

Qu'est-ce qu'une carte thermique ?

Une carte thermique en Python est une technique de visualisation de données où les couleurs représentent comment une valeur d'intérêt change avec les valeurs de deux autres variables. Il s'agit d'une représentation graphique bidimensionnelle de données avec des valeurs codées en couleurs, donnant ainsi une vue simplifiée, perspicace et visuellement attrayante de l'information. L'image ci-dessous est une représentation simplifiée d'une carte thermique.

En règle générale, une carte thermique est un tableau de données avec des lignes et des colonnes représentant différents ensembles de catégories. Chaque cellule du tableau contient une valeur logique ou numérique qui détermine la couleur de la cellule en fonction d'une palette de couleurs donnée. Ainsi, les cartes thermiques utilisent des couleurs pour souligner la relation entre les valeurs de données qui seraient autrement difficiles à comprendre si elles étaient disposées dans un tableau régulier à l'aide de nombres bruts.

Les cartes thermiques trouvent des applications dans plusieurs scénarios réels. Par exemple, considérez la carte thermique ci-dessous. Il s'agit d'une carte thermique des indices boursiers qui identifie les tendances dominantes du marché boursier. La carte thermique utilise une palette de couleurs froide à chaude pour montrer quelles actions sont baissières et lesquelles sont haussières. Le premier est représenté en rouge, tandis que le second est représenté en vert.

La source

Les cartes thermiques trouvent une utilisation dans plusieurs autres domaines. Certains exemples incluent les cartes thermiques de sites Web, les cartes thermiques géographiques et les cartes thermiques sportives. Par exemple, vous pouvez utiliser une carte thermique pour comprendre comment les précipitations varient selon le mois de l'année dans un ensemble de villes. Les cartes thermiques sont également extrêmement utiles pour étudier le comportement humain.

Carte thermique de corrélation

Une carte thermique de corrélation est une matrice bidimensionnelle montrant la corrélation entre deux variables distinctes. Les lignes du tableau affichent les valeurs de la première variable, tandis que la seconde variable apparaît sous forme de colonnes. Comme une carte thermique classique, une carte thermique de corrélation est également livrée avec une barre de couleur pour lire et comprendre les données.

Le schéma de couleurs utilisé est tel qu'une extrémité du schéma de couleurs représente les points de données de faible valeur et l'autre extrémité les points de données de valeur élevée. Par conséquent, les cartes thermiques de corrélation sont idéales pour l'analyse des données car elles présentent des modèles sous une forme facilement lisible tout en soulignant la variation des données.

Vous trouverez ci-dessous une représentation classique d'une carte thermique de corrélation.

La source

Création d'une carte thermique Seaborn en Python

Seaborn est une bibliothèque Python utilisée pour la visualisation de données et est basée sur matplotlib. Il fournit un support informatif et visuellement attrayant pour présenter les données sous forme de graphique statistique. Dans une carte thermique créée à l'aide de seaborn, une palette de couleurs représente la variation des données associées. Si vous êtes débutant et souhaitez acquérir une expertise en science des données, consultez nos cours de science des données.

Étapes pour créer une carte thermique en Python

Les étapes suivantes donnent un aperçu approximatif de la création d'une carte thermique simple en Python :

  • Importer tous les packages requis
  • Importez le fichier où vous avez stocké vos données
  • Tracer la carte thermique
  • Afficher la carte thermique à l'aide de matplotlib

Maintenant, laissez-nous vous montrer comment seaborn, avec matplotlib et pandas, peut être utilisé pour générer une carte thermique.

Dans cet exemple, nous allons construire une carte thermique Seaborn en Python pour 30 actions de sociétés pharmaceutiques. La carte thermique résultante affichera les symboles boursiers et leur variation de prix respective en pourcentage sur une journée. Nous commencerons par collecter les données de marché sur les actions pharmaceutiques et créerons un fichier CSV (Comma-separated Value) composé des symboles boursiers et de leur pourcentage de variation de prix correspondant dans les deux premières colonnes dudit fichier CSV.

Puisque nous travaillons avec 30 sociétés pharmaceutiques, nous allons construire une matrice de carte thermique comprenant 6 lignes et 5 colonnes. De plus, nous voulons que la carte thermique représente le changement de prix en pourcentage dans l'ordre décroissant. Ainsi, nous allons organiser les stocks dans le fichier CSV par ordre décroissant et ajouter deux colonnes supplémentaires pour indiquer la position de chaque stock sur les axes X et Y de la carte thermique de Seaborn.

Étape 1 : Importation des packages Python.

La source

Étape 2 : chargement du jeu de données.

L'ensemble de données est lu à l'aide de la fonction read_csv de pandas. De plus, nous utilisons l'instruction print pour visualiser les 10 premières lignes.

La source

Étape 3 : Création d'un tableau Python Numpy.

En gardant à l'esprit la matrice 6 x 5, nous allons créer un tableau à n dimensions pour les colonnes "Symbole" et "Modifier".

La source

Étape 4 : Création d'un pivot en Python.

À partir de l'objet de cadre de données donné "df", la fonction pivot crée une nouvelle table dérivée. La fonction pivot prend trois arguments : index, colonnes et valeurs. Les valeurs des cellules du nouveau tableau sont extraites de la colonne "Modifier".

La source

Étape 5 : Création d'un tableau pour annoter la carte thermique.

L'étape suivante consiste à créer un tableau pour annoter la carte thermique de Seaborn. Pour cela, nous appellerons la méthode flatten sur les tableaux "percentage" et "symbol" pour aplatir une liste Python de listes en une seule ligne. De plus, la fonction zip compresse une liste en Python. Nous allons exécuter une boucle for Python et utiliser la fonction de format pour formater les symboles boursiers et les valeurs de variation de prix en pourcentage selon les besoins.

La source

Étape 6 : Création de la figure matplotlib et définition du tracé.

Dans cette étape, nous allons créer un tracé matplotlib vide et définir la taille de la figure. De plus, nous allons ajouter le titre du tracé, définir la taille de la police du titre et fixer sa distance par rapport au tracé en utilisant la méthode set_position. Enfin, puisque nous voulons uniquement afficher les symboles boursiers et leur variation de prix en pourcentage sur une journée correspondante, nous allons masquer les graduations des axes X et Y et supprimer les axes du graphique.

La source

Étape 7 : Création de la carte thermique

Dans la dernière étape, nous utiliserons la fonction heatmap du package Seaborn Python pour créer la carte thermique. La fonction heatmap du package seaborn Python prend l' ensemble d'arguments suivant :

  • Données :

Il s'agit d'un ensemble de données à deux dimensions qui peut être converti en un tableau. Étant donné un Pandas DataFrame, les lignes et les colonnes seront étiquetées à l'aide des informations d'index/colonne.

  • Annot :

C'est un tableau de la même forme que les données et annote la carte thermique.

  • cmmap :

Il s'agit d'un objet matplotlib ou d'un nom de palette de couleurs et mappe les valeurs de données à l'espace colorimétrique.

  • Fmt :

Il s'agit d'un code de formatage de chaîne utilisé lors de l'ajout d'annotations.

  • Largeurs de ligne :

Il définit la largeur des lignes qui divisent chaque cellule.

La source

La sortie finale de la carte thermique Seaborn pour les sociétés pharmaceutiques choisies ressemblera à ceci :

La source

Aller de l'avant : apprenez Python avec le programme de certificat professionnel d'upGrad en science des données

Le programme de certificat professionnel en science des données pour la prise de décision commerciale est un programme en ligne rigoureux de 8 mois axé sur la science des données et les concepts d'apprentissage automatique, avec un accent particulier sur leurs applications commerciales réelles. Le programme est catégoriquement conçu pour les gestionnaires et les professionnels qui souhaitent développer les connaissances et les compétences pratiques de la science des données qui les aideront à prendre des décisions commerciales stratégiques et basées sur les données.

Voici quelques faits saillants du cours :

  • Reconnaissance prestigieuse de l'IIM Kozhikode
  • Plus de 200 heures de contenu
  • 3 projets industriels et un capstone
  • Plus de 20 sessions d'apprentissage en direct
  • 5+ séances de coaching d'experts
  • Couverture d'Excel, Tableau, Python, R et Power BI
  • Tête-à-tête avec des mentors de l'industrie
  • Un accompagnement de carrière à 360 degrés
  • Assistance à l'emploi avec les meilleures entreprises

Inscrivez-vous à upGrad et perfectionnez vos compétences en matière de cartes thermiques Python pour tous vos besoins en visualisation de données !

Conclusion

Les statisticiens et les analystes de données utilisent une pléthore d'outils et de techniques pour trier les données rassemblées et les présenter d'une manière facilement compréhensible et conviviale. À cet égard, les cartes thermiques en tant que technique de visualisation de données ont aidé les entreprises de tous les secteurs à mieux visualiser et comprendre les données.

En résumé, les cartes thermiques ont été largement utilisées et sont toujours utilisées comme l'un des outils statistiques et analytiques de choix. En effet, ils offrent un mode de présentation des données visuellement attrayant et accessible, sont facilement compréhensibles, polyvalents, adaptables et suppriment les étapes fastidieuses des processus traditionnels d'analyse et d'interprétation des données en présentant toutes les valeurs dans un seul cadre.

Comment tracer une carte thermique ?

Une carte thermique est un moyen standard de tracer des données groupées dans un format graphique en deux dimensions. L'idée de base derrière le traçage d'une carte thermique est que le graphique est divisé en carrés ou rectangles, chacun représentant une cellule sur la table de données, un ensemble de données et une ligne. Le carré ou le rectangle est codé par couleur en fonction de la valeur de cette cellule dans le tableau.

Une carte thermique montre-t-elle une corrélation ?

Une carte thermique de corrélation est une représentation graphique d'une matrice de corrélation illustrant la corrélation entre différentes variables. Les cartes thermiques de corrélation sont très efficaces si elles sont utilisées correctement, car les variables hautement corrélées peuvent être facilement identifiées.

Pourquoi seaborn est utilisé en Python ?

Seaborn est une bibliothèque Python open source basée sur matplotlib. Il est utilisé pour l'analyse et la visualisation exploratoire des données et fonctionne facilement avec les cadres de données et la bibliothèque Pandas. De plus, les graphiques créés à l'aide de Seaborn sont facilement personnalisables.