Groupe de barres segmenté dans l'analyse de données : guide complet

Publié: 2021-08-14

Un graphique à barres segmenté est un concept familier dans Data Analytics. Mais connaissez-vous ses bases ?

Les graphiques sont l'un des moyens les plus courants de représenter la relation entre les données, en particulier celles qui sont trop compliquées et nombreuses pour une illustration pratique dans un espace et un temps limités. Avec la quantité massive d'informations collectées et traitées par l'analyse des données, il est pertinent d'avoir un moyen de présenter ces données pour une interprétation et une inférence précises. La visualisation des données nous donne une image lucide de ce que signifie l'information en lui donnant une forme visuelle à travers des tableaux et des graphiques. Par conséquent, les données deviennent plus compréhensibles pour l'esprit humain et ils peuvent rapidement identifier des modèles, des tendances et des anomalies dans de grands ensembles de données. Si vous êtes un débutant en analyse de données et en science des données, les certifications en science des données d'upGrad peuvent certainement vous aider à plonger plus profondément dans le monde des données et de l'analyse.

La capacité à présenter des arguments convaincants grâce à la visualisation des données est l'une des qualités exceptionnelles d'un professionnel qualifié en science des données. Bien qu'il existe plusieurs options de graphique et de graphique

on peut choisir pour illustrer les données dans différents scénarios, un graphique à barres segmenté ou un graphique à barres segmenté attire l'attention des analystes de données.

Cet article vous guidera à travers les principes fondamentaux du graphique à barres segmenté, pourquoi il est utilisé, où il est utilisé, et les cours upGrad Data Science qui peuvent vous aider à maîtriser les compétences requises pour être un analyste de données performant.

Mais d'abord, rafraîchissons-nous les graphiques à barres.

Table des matières

Graphiques à barres

Parmi les types de graphiques/graphiques les plus fréquemment utilisés, un diagramme à barres ou un graphique à barres est composé d'une série de barres décrivant la comparaison entre des catégories distinctes de données. Les graphiques à barres sont l'un des types de graphiques les plus courants et sont généralement facilement compréhensibles en raison de leur familiarité.

Malgré la simplicité des graphiques à barres, leur utilisation est limitée. Avant d'illustrer des données dans un graphique à barres, il est crucial d'évaluer la nature des données et le nombre de variables ajoutées au graphique. Idéalement, les diagrammes à barres sont un excellent choix lorsque nous voulons suivre l'évolution d'une ou peut-être deux variables au fil du temps. On peut en effet les utiliser pour comparer plusieurs variables sous la forme d'un histogramme clusterisé. Cependant, de telles comparaisons peuvent conduire à une représentation encombrée qui pourrait prêter à confusion.

Vous trouverez ci-dessous deux illustrations - la première est un graphique à barres simple (utilisant une variable) et le deuxième exemple montre un graphique à barres groupées (utilisant deux variables). Les deux illustrations montrent l'évolution des revenus de l'entreprise sur une période donnée - une application typique des graphiques à barres dans les scénarios d'entreprise. Le deuxième exemple montre la comparaison des revenus de deux entreprises au cours d'une période donnée.


Illustration 1 ( Source de l'image )


Illustration 2 ( Source de l'image )

Graphiques à barres empilées

Contrairement à un graphique à barres groupées qui affiche les barres côte à côte, les graphiques à barres empilées divisent les barres en sections. Les graphiques à barres empilées sont utilisés pour montrer comment une catégorie plus grande est fragmentée en catégories plus petites et comment chaque partie a un impact sur le montant total. Les barres d'un graphique à barres empilées sont classées par ordre d'empilement, représentant différentes valeurs. Un axe montre les valeurs discrètes et l'autre axe indique les barres variables dans l'ordre d'empilement. Différentes couleurs sont utilisées pour montrer les parties distinctives de la barre entière.

Vous trouverez ci-dessous une illustration représentant un graphique à barres empilées : Source des images

Graphique à barres empilées et graphique à barres segmentées

Les graphiques à barres empilées sont de deux types : les graphiques à barres empilées simples et les graphiques à barres empilées à 100 %.

  • Dans les graphiques à barres empilées simples , chaque valeur du segment est placée après la précédente. Par conséquent, la valeur totale de la barre est la somme de toutes les valeurs de segment. Ainsi, de simples graphiques à barres empilées sont parfaits pour comparer le montant total avec chaque groupe/barre segmentée.
  • Un graphique à barres empilées de 100 % ou un graphique à barres segmentées est un graphique à barres empilées où les barres segmentées totalisent 100 %. En d'autres termes, les barres empilées indiquent le pourcentage relatif de plusieurs séries de données, et le total de chaque barre empilée est toujours de 100 %. Par conséquent, il est essentiel de s'assurer que chaque barre représente 100 % lors de la construction d'un graphique à barres segmenté. Sinon, il deviendra un simple graphique à barres empilées.

Les graphiques à barres empilées montrent une relation partie-à-tout et peuvent même montrer comment les parties changent au fil du temps. Vous trouverez ci-dessous une illustration simple d'un graphique à barres segmenté montrant comment la part de marché d'un produit change chaque année. Un inconvénient important de ces diagrammes à barres segmentées est que s'il est facile de comparer la première série de données (juste à côté de l'axe vertical dans l'illustration ci-dessous), les suivantes sont plus difficiles à comparer car elles ne sont pas alignées sur une ligne de base commune.

Source des images

Obtenez une certification en science des données en ligne auprès des meilleures universités du monde. Gagnez des programmes Executive PG, des programmes de certificat avancés ou des programmes de maîtrise pour accélérer votre carrière.

L'illustration suivante clarifiera davantage la différence anatomique entre un graphique à barres empilées simple et un graphique à barres segmentées :

Source des images

Points à retenir lors de la construction d'un graphique à barres segmenté

  • Les graphiques à barres empilées et segmentées ont une représentation bidimensionnelle avec deux axes - un axe montre les catégories et l'autre montre les valeurs numériques. L'axe représentant les catégories n'a pas d'échelle pour indiquer qu'il se réfère à des groupes mutuellement exclusifs (par exemple, les entreprises, les années, etc.). Mais l'axe avec des valeurs numériques a une échelle avec les unités de mesure correspondantes.
  • Les barres peuvent être orientées verticalement ou horizontalement. Chaque catégorie principale est divisée en segments, où chaque segment représente des sous-catégories d'une deuxième variable catégorielle.
  • La hauteur ou la longueur des segments rectangulaires indique la quantité de chaque sous-catégorie et sont empilés bout à bout verticalement ou horizontalement.
  • La longueur ou la hauteur finale de chaque barre représente le montant total dans chaque catégorie principale (100 % dans les graphiques à barres segmentées).
  • Les sous-catégories équivalentes doivent être représentées avec la même couleur.
  • Un espace doit être laissé entre les barres des catégories principales pour indiquer qu'elles représentent des groupes discrets.

Avantages et inconvénients des graphiques à barres segmentés

Un graphique à barres segmenté est un outil pratique pour la visualisation des données. Il a la simplicité inhérente d'un graphique à barres et trouve pourtant une application dans de nombreuses opérations d'analyse de données. Cependant, il présente plusieurs inconvénients, qui limitent son utilisation à des scénarios spécifiques d'analyse de données.

Voici les avantages et les inconvénients des graphiques à barres segmentés :

Avantages:

  • Il est assez facile de comprendre la composition des données catégorielles.
  • Ils décrivent les changements d'une partie à l'autre au fil du temps.
  • Ils peuvent représenter plusieurs catégories et séries de données dans un espace compact.

Les inconvénients:

  • Il devient plus difficile à lire avec l'augmentation des segments dans chaque barre.
  • La comparaison des segments entre eux devient difficile car ils ne sont pas alignés sur une ligne de base commune.
  • Étant donné que les barres empilées sont normalisées à 100 %, la dimension de la valeur absolue est perdue.

Aller de l'avant : pérenniser votre carrière avec upGrad

upGrad est une plate-forme d'enseignement supérieur en ligne de premier plan proposant des programmes et des cours pertinents pour l'industrie. Avec plus de 40 000 apprenants rémunérés répartis dans 85 pays, l'innovation d'upGrad consistant à combiner les dernières technologies et pratiques éducatives a aidé plus de 500 000 professionnels en activité dans leurs domaines respectifs.

Voici ce que l' avantage upGrad offre aux apprenants :

  • Apprentissage flexible et programme adapté à l'industrie avec un mentorat personnalisé de l'industrie, un projet pratique de l'industrie et des sessions en direct avec des professeurs et des experts.
  • Réseautage entre pairs, forums de résolution de doutes et opportunités de réseautage.
  • Corps professoral des meilleures universités et entreprises
  • Une équipe de mentors dédiée
  • Approche axée sur les résultats
  • Accompagnement carrière à 360 degrés

La certification Executive PG en science des données et la maîtrise en science des données d'upGrad sont deux programmes bien structurés qui vous aideront à bien saisir les compétences et les connaissances nécessaires pour prospérer dans les carrières en science des données. Chaque programme a ses avantages à offrir, mais les deux sont conçus pour offrir une expérience d'apprentissage engageante alignée sur les dernières normes de l'industrie. Avec de nombreux projets pratiques pertinents pour l'industrie, les titulaires de certificat peuvent être assurés qu'ils seront prêts à affronter le marché du travail difficile et toujours compétitif qui nécessite une mise à niveau professionnelle constante. De plus, les programmes sont une occasion unique de se connecter avec des professionnels de la science des données dans tous les secteurs de l'industrie.

Points forts du programme de certification PG en science des données :

  • Durée du cours de sept mois avec un format entièrement en ligne.
  • Spécialement conçu pour les professionnels en activité.
  • Certification de troisième cycle de l'IIIT Bangalore.
  • Couvre les langages de programmation et les outils tels qu'Excel, Python, Tableau et MySQL.
  • Plus de 300 heures de contenu avec plus de 7 études de cas et projets, plus de 20 sessions en direct et six missions de codage.

Master en science des données de l'Université internationale des sciences appliquées, Allemagne

Faits saillants du programme :

  • Durée du cours de 24 mois (première année en ligne et deuxième année sur le campus en Allemagne).
  • Double accréditation (Executive PG Program de IIIT-B et Master de IU, Allemagne) et certificat NASSCOM.
  • Aucun IELTS n'est requis pour les apprenants upGrad.
  • Couverture complète de plus de 14 outils et logiciels.
  • Plus de 500 heures de contenu avec plus de 60 études de cas et projets, plus de 20 sessions en direct et 25 sessions de coaching 1: 8 avec des experts de l'industrie.

En conclusion

Savoir construire un graphique à barres segmenté est un must pour Data Analytics, surtout si vous êtes débutant et que vous débutez avec les techniques de visualisation de données. De tels graphiques peuvent être facilement construits dans Excel et ne nécessitent aucune connaissance avancée d'outils et de logiciels compliqués. Cependant, il est tout d'abord crucial d'avoir une idée claire des données avec lesquelles vous travaillez et de savoir si elles s'intègrent dans une représentation graphique à barres segmentées.

Le marché mondial potentiel du Big Data et de l'analyse commerciale montrant des tendances prometteuses pour l'avenir, il est prudent de considérer qu'une carrière dans les sciences des données est pleine de possibilités. Alors, inscrivez-vous avec upGrad et commencez à apprendre avec les meilleurs !

Quelle est la différence entre un graphique et un tableau ?

Les graphiques sont une forme de représentation visuelle des données qui peut prendre la forme d'un diagramme, d'une image ou d'un graphique. Dans un graphique, les catégories peuvent ou non être liées les unes aux autres. D'autre part, un graphique est une représentation numérique de données qui montre comment le changement d'un nombre ou d'une variable affecte un autre. En d'autres termes, un graphique est un type de graphique qui se concentre sur les données brutes et décrit la tendance de ces données au fil du temps.

Qu'est-ce qu'un histogramme vs un graphique à barres ?

Un graphique à barres utilise des barres verticales ou horizontales pour représenter des données catégorielles, où la longueur de chaque barre est proportionnelle à la valeur de données qu'elles représentent. Un histogramme, d'autre part, est une représentation graphique des données où les données sont organisées en plages de nombres continus. Dans un histogramme, chaque barre verticale correspond à une plage.

Comment créer un graphique à barres segmenté dans MS Excel ?

Voici les étapes pour créer un graphique à barres segmenté dans MS Excel :
Étape 1 : Entrez vos données dans Excel dans des colonnes clairement étiquetées.
Étape 2 : Mettez les données en surbrillance.
Étape 3 : Cliquez sur l'onglet Insertion. Ensuite, cliquez sur Insérer un graphique à colonnes ou à barres sous la section Graphiques.
Étape 4 : Cliquez sur l'option Colonne empilée à 100 %.
Excel produira automatiquement le graphique à barres segmenté.