Matplotlib en Python : explication de divers tracés avec des exemples

Publié: 2021-06-21

Table des matières

Qu'est-ce que matplotlib ?

Parmi les nombreuses bibliothèques disponibles en Python, matplotlib en python est l'une de ces bibliothèques de visualisation qui aide à la visualisation des tracés 2D d'un tableau. La bibliothèque de visualisation de données est construite sur des tableaux NumPy. C'est en 2002 que la bibliothèque de visualisation de données multiplateforme a été introduite par John Hunter. La bibliothèque offre la visualisation des données et le traçage graphique des données offrant une alternative à MATLAB. Les API de Matplotlib, c'est-à-dire les interfaces de programmation d'applications, sont utilisées par les développeurs pour intégrer des tracés dans des applications GUI.

Plusieurs tracés graphiques comme la barre, la ligne, l'histogramme, la dispersion, etc. sont proposés par matplotlib. La visualisation offerte par le tracé matplotlib permet d'accéder visuellement à d'énormes quantités de données. Le tracé visuel des données peut être généré via un code de quelques lignes uniquement en raison de la nature structurée d'un script python matplotlib.

Deux API sont utilisées pour superposer la couche de script matplotlib :

  • API Python : il s'agit d'une hiérarchie d'objets de code Python.
  • API OO (Object Oriented) : Un accès direct aux couches backend de Matplotlib est fourni par l'API.

Installation

L'installation de la bibliothèque matplotlib peut être effectuée en téléchargeant matplotlib et ses dépendances à partir de Python Package Index (PyPI) en tant que package binaire.

La commande qui peut être utilisée pour installer la bibliothèque est

python -m pip installer matplotlib

Dans un système d'exploitation comme Windows, Linux et macOS, matplotlib et ses dépendances sont présents sous forme de packages de roue. Dans de tels cas, la commande à exécuter est.

python -mpip install -U matplotlib

La bibliothèque est également disponible sous forme de fichiers source non compilés dont l'installation est assez complexe car le système local nécessitera d'avoir le compilateur approprié pour le système d'exploitation. En outre, la plate-forme ActiveState peut être utilisée pour créer matplotlib à partir de la source et l'empaqueter pour le système d'exploitation requis.

Importation

L'import de la matplotlib en python s'effectue via les commandes

  • de matplotlib importer pyplot en tant que plt
  • importer matplotlib.pyplot en tant que plt

Divers tracés et exemples

1. Menu de l'interface utilisateur Matplotlib

Le menu de l'interface utilisateur Matplotlib est généré lorsque des tracés sont créés via Matplotlib. La personnalisation du tracé et le basculement des éléments ainsi que la possibilité de zoomer sur les tracés sont offerts par l'interface utilisateur Matplotlib.

2. Matplotlib et NumPy

Le NumPy est un package sous python permettant de réaliser des calculs scientifiques. Matplotlib est construit sur NumPy et utilise les fonctions fournies par NumPy pour ses données numériques et ses tableaux multidimensionnels.

3. Matplotlib et Pandas

Pandas est une bibliothèque de python utilisée pour la manipulation de données et l'analyse par matplotlib. Ce n'est pas une dépendance requise pour le matplotlib mais fournit une trame de données.

Les tracés Matplotlib permettent la représentation visuelle d'énormes volumes de données. Avec les graphiques, les tendances et les modèles spécifiques présents dans les données pourraient être identifiés, ce qui est essentiel pour établir des corrélations. Matplotlib Plots fournit essentiellement un moyen de raisonner sur des informations quantitatives.

Certains des types de tracés matplotlib sont :

1. Tracé linéaire :

Utilisation de deux points

  • Le tracé de ligne Matplotlib est généré via l'importation de pyplot.
  • Pour dessiner des points dans un diagramme, la fonction plot() est utilisée qui trace par défaut une ligne d'un point à un autre.
  • Deux paramètres sont pris en compte qui précisent les points de tracé de la ligne.
  • Les points de l'axe X sont stockés sous forme de tableau dans le paramètre 1.
  • Les points de l'axe Y sont stockés sous forme de tableau dans le paramètre 2.
  • Exemple : Si une ligne doit être tracée des points (2, 6) à (10, 15), alors deux tableaux doivent être passés, c'est-à-dire [2, 10] et [6, 15].

Exemple : un code montrant le tracé des lignes et le tracé généré

La source

2. Utilisation de plusieurs points

  • Comme la façon dont deux points sont utilisés pour le traçage, plusieurs points peuvent être tracés à l'aide de matplotlib en python .
  • Les points doivent être au même nombre dans les deux axes pour tracer un certain nombre de points.
  • Contribution:

La source

3. Points de ligne sans points d'axe x

  • Si les points de l'axe X ne sont pas spécifiés, les valeurs par défaut pour l'axe X sont prises en fonction des points de l'axe Y.
  • Entrée : Le code restera le même que les codes ci-dessus pour tracer des lignes mais avec un seul tableau en entrée, c'est-à-dire un tableau pour l'axe Y. L'axe X sera pris par défaut.

ypoints = np.array([10, 8, 12, 20, 3, 9])

  • Tracé généré :

Diverses options sont présentes dans la matplotlib qui permettent d'augmenter les effets visuels des tracés :

1. Marqueurs

  • Pour améliorer les effets visuels des points dans un diagramme, un marqueur spécifié peut être utilisé à l'aide du mot-clé marqueur .
  • Les marqueurs peuvent être une étoile, un cercle, un point, un pixel, un X, etc.
  • Exemple : plt.plot(ypoints, marker = 'o') peut être utilisé pour tracer des points
  • Les autres listes de marqueurs sont présentées dans l'extrait ci-dessous tiré de

La source

  • Le marqueur peut être modifié en fonction de la couleur (140 couleurs prises en charge), de la taille et du type de ligne pouvant être utilisée, comme une ligne pointillée, continue ou pointillée.
  • Les commandes markeredge ( mec ) et markerfacecolor ( mfc ) sont utilisées pour colorer tout le marqueur.
  • Il offre la possibilité de colorer uniquement le bord du marqueur ou tout le marqueur.
  • Markersize ou en bref ms est utilisé pour définir la taille du marqueur.

Syntaxe : plt.plot(ypoints, marker = 'o', ms = 30)

2. Ligne Matplotlib

  • Le style de la ligne tracée peut être modifié en conséquence avec les options de style de ligne, en pointillés ou en tirets représentés par ls , : ou .

Syntaxe : plt.plot(ypoints, ls = ':')

  • La couleur de la ligne peut être modifiée en conséquence avec le mot-clé color ou sous une forme plus courte en utilisant c . matplotlib fournit 140 couleurs prises en charge pour modifier l'apparence des couleurs de la ligne.
  • La largeur de la ligne peut être modifiée avec l'argument linewidth ou lw . C'est un nombre flottant en points.
  • Plusieurs lignes peuvent être tracées dans le même graphique à l'aide des fonctions plt.plot() .
  • La fonction grid () est utilisée pour ajouter des lignes de grille dans le tracé. Des paramètres d'axe peuvent être ajoutés pour spécifier dans quel axe la ligne de grille est requise.

Syntaxe : plt.grid(axe = 'x')

  • Les propriétés de la grille peuvent être modifiées en conséquence, telles que la couleur, le style de ligne et la largeur via les arguments, la couleur, les styles de ligne et le nombre.

Syntaxe : plt.grid(color = 'green', linestyle = '–', linewidth = 0.5)

3. Étiquettes et titres Matplotlib

  • Les fonctions xlabel() et ylabel() sont utilisées pour étiqueter l'asex respectif.
  • La fonction title() est utilisée pour définir un titre pour l'intrigue.
  • Les propriétés de police du tracé peuvent être modifiées avec le paramètre fontdict .
  • Le paramètre loc peut être utilisé pour spécifier la position du titre.

Plusieurs tracés peuvent être dessinés dans une figure à l'aide de la fonction subplots() .

4. Nuage de points Matplotlib

  • La fonction scatter() peut être utilisée avec pyplot pour dessiner un nuage de points.
  • Deux tableaux de même longueur sont nécessaires, c'est-à-dire un tableau pour chaque axe.
  • Exemple:

La source

Parcelle générée

  • Couleur ou l' argument c est utilisé pour colorer les points du nuage de points.
  • La palette de couleurs peut être utilisée pour spécifier la couleur requise dans le nuage de points. Chaque couleur de la palette de couleurs a une valeur spécifique. Il peut être inclus via l'argument cmap puis en attribuant le nom de la palette de couleurs. Plusieurs palettes de couleurs in=built sont disponibles dans matplotlib.

Syntaxe : plt.scatter(x, y, c=couleurs, cmap='viridis')

Viridis est une palette de couleurs intégrée disponible dans matplotlib.

  • La taille et la transparence des points peuvent être modifiées via les arguments s et alpha .
  • La palette de couleurs peut être combinée avec différentes tailles de points.

5. Diagrammes de barres Matplotlib

  • La fonction bar() est utilisée pour dessiner les diagrammes à barres . Les arguments pour la disposition des barres sont mentionnés dans la fonction bar(). Il trace des diagrammes à barres verticales.

  • Pour tracer des diagrammes à barres horizontales, la fonction barh() est utilisée.
  • Contribution:

  • Tracé généré :

La source

  • L' argument color est utilisé avec les fonctions bar() et barh() pour définir les couleurs des barres.

Syntaxe : plt.bar(x, y, color = "vert").

  • L' argument width est utilisé avec les fonctions bar() et barh() pour définir la largeur de la barre.

Syntaxe : plt.bar(x, y, largeur = 0,2).

  • Un autre argument pris par les fonctions bar() et barh() est la hauteur qui est utilisée pour définir la hauteur de la barre.

6. Matplotlib Pie plot

  • Un graphique à secteurs est créé via la fonction pie() de la bibliothèque matplotlib.
  • Exemple : Entrée :

  • Tracé généré :

La source

  • Chaque coin peut être étiqueté avec le paramètre label qui est un tableau avec les étiquettes de chaque coin.

Syntaxe : mylabels = [ "cars" , "bikes" , "cycles" , "buses" ]

  • L'angle de départ par défaut dans un camembert est l'axe X, qui peut être modifié avec le paramètre startangle. L'angle est défini en degrés et l'angle par défaut est 0.
  • Avec le paramètre d'éclatement, le coin requis peut être affiché pour se démarquer. Il est spécifié via un tableau avec la valeur du coin à distinguer et les valeurs restantes conservées à 0.

Syntaxe : myexplode = [0.2, 0, 0, 0]

  • Définir le paramètre shadows sur true créera une ombre pour le camembert.
  • Le paramètre couleurs est utilisé pour spécifier les couleurs de chaque coin à travers un tableau.

Syntaxe : mylabels = [ "cars" , "bikes" , "cycles" , "buses" ]

mescouleurs = ["noir", "rose vif", "bleu", vert""]

  • La fonction legend() est utilisée pour ajouter une explication à chaque coin.

7. Histogramme

  • L'histogramme est utilisé pour tracer les distributions de fréquence.
  • La fonction hist () est utilisée pour créer un histogramme qui utilise un tableau de nombres pour créer l'histogramme.
  • Exemple : Saisie : les lignes ci-dessus seront les mêmes que celles utilisées pour tracer les diagrammes à barres.

x = np.aléatoire.normal(90, 100, 200)

impression(x)

  • Tracé généré :

Conclusion

Comme indiqué dans l'article, matplotlib en python peut être utilisé pour le traçage des données dans différents styles. D'autres options diverses sont disponibles pour améliorer nos tracés permettant à l'utilisateur d'étiqueter, de redimensionner et de colorier selon son souhait. Par conséquent, Python et ses bibliothèques sont très utiles pour l'analyse et la gestion des données à l'ère actuelle.

Une formation en programmation Python dans le domaine de la science des données est disponible dans le cours Executive PG Program in Data Science proposé par upGrad . Si vous êtes prêt à vous former auprès d'experts de l'industrie et à explorer les diverses opportunités offertes par la science des données, vous pouvez vous inscrire au cours. Le cours est proposé par IIIT-Bangalore et conçu spécialement pour les professionnels débutants et de niveau intermédiaire dans la tranche d'âge des 21 à 45 ans. Quel que soit votre sexe, si vous appartenez à cette catégorie et rêvez de devenir un spécialiste des données de premier plan, rejoignez-nous dans cette aventure. Pour tout navire d'assistance, notre équipe est prête à vous aider.

Où sont les avantages du module Pandas ?

Pandas est l'un des modules Python les plus importants et les plus utiles qui a divers cas d'utilisation. Voici quelques-uns des avantages du module Pandas.
1. Les pandas permettent un filtrage et un sous-ensemble pratiques des données.
2. Son code est clair et compréhensible afin que les utilisateurs puissent se concentrer davantage sur l'objectif principal.
3. Puisqu'il est écrit en NumPy, il hérite également de certaines des fonctionnalités utiles de NumPy.

A quoi sert la librairie Matplotlib ?

1. La bibliothèque Matplotlib fournit de nombreuses API utiles pour intégrer différents types de tracés, notamment des histogrammes, des tracés linéaires et à barres, des nuages ​​de points et des graphiques à barres.
2. Cette bibliothèque puissante peut vous aider à créer des tracés 2D à l'aide de données stockées dans un tableau. Sa structure de code simple vous permet d'intégrer n'importe quel type de tracé en ajoutant simplement quelques lignes de code simples.
3. Il possède une interface orientée objet qui en fait une alternative puissante à MATLAB et Pyplot. Il est hautement personnalisable et nécessite une certaine expérience pour utiliser les fonctionnalités avancées.
4. Si vous avez besoin d'intégrer des tracés plus simples dans votre application, vous devriez opter pour son interface Python de style MATLAB. Cependant, si vous avez des tracés complexes, son interface OOP serait une bien meilleure option.