Segmentierte Balkengruppe in der Datenanalyse: Vollständiger Leitfaden

Veröffentlicht: 2021-08-14

Ein segmentiertes Balkendiagramm ist ein bekanntes Konzept in der Datenanalyse. Aber sind Sie sich seiner Grundlagen bewusst?

Diagramme sind eine der gebräuchlichsten Methoden, um die Beziehung zwischen Daten darzustellen, insbesondere solche, die zu kompliziert und zahlreich sind, um sie innerhalb eines begrenzten Raums und einer begrenzten Zeit bequem darzustellen. Angesichts der enormen Menge an Informationen, die durch Datenanalyse gesammelt und verarbeitet werden, ist es wichtig, eine Möglichkeit zu haben, diese Daten für eine genaue Interpretation und Schlussfolgerung darzustellen. Die Datenvisualisierung gibt uns ein klares Bild davon, was die Informationen bedeuten, indem sie ihnen durch Diagramme und Grafiken eine visuelle Form gibt. Daher werden Daten für den menschlichen Verstand verständlicher und sie können Muster, Trends und Anomalien in großen Datensätzen schnell erkennen. Wenn Sie ein Anfänger in Data Analytics und Data Science sind, können Ihnen die Data Science-Zertifizierungen von upGrad definitiv helfen, tiefer in die Welt der Daten und Analysen einzutauchen.

Die Fähigkeit, durch Datenvisualisierung überzeugend zu argumentieren, ist eine der herausragenden Eigenschaften eines erfahrenen Data Science-Profis. Es gibt zwar mehrere Diagramm- und Diagrammoptionen

Man kann wählen, um Daten in verschiedenen Szenarien zu veranschaulichen, ein segmentiertes Balkendiagramm oder ein segmentiertes Balkendiagramm erhält bei Datenanalysten große Aufmerksamkeit.

Dieser Artikel führt Sie durch die Grundlagen des segmentierten Balkendiagramms, warum es verwendet wird, wo es verwendet wird, und die upGrad Data Science-Kurse , die Ihnen helfen können, die Fähigkeiten zu erwerben, die für einen erfolgreichen Datenanalysten erforderlich sind.

Aber lassen Sie uns zuerst die Balkendiagramme auffrischen.

Inhaltsverzeichnis

Balkendiagramme

Unter den am häufigsten verwendeten Diagrammtypen besteht ein Balkendiagramm oder ein Balkendiagramm aus einer Reihe von Balken, die den Vergleich zwischen verschiedenen Datenkategorien darstellen. Balkendiagramme gehören zu den gängigsten Diagrammtypen und sind aufgrund ihrer Vertrautheit meist leicht verständlich.

Trotz der Einfachheit von Balkendiagrammen haben sie einen begrenzten Nutzen. Bevor Daten in einem Balkendiagramm dargestellt werden, ist es wichtig, die Art der Daten und die Anzahl der dem Diagramm hinzugefügten Variablen zu beurteilen. Idealerweise sind Balkendiagramme eine ausgezeichnete Wahl, wenn wir die Entwicklung einer oder vielleicht zweier Variablen über die Zeit verfolgen wollen. Wir können sie tatsächlich verwenden, um mehrere Variablen in Form eines gruppierten Balkendiagramms zu vergleichen. Solche Vergleiche können jedoch zu einer unübersichtlichen Darstellung führen, die zu Verwirrung führen könnte.

Unten sind zwei Abbildungen – die erste zeigt ein einfaches Balkendiagramm (unter Verwendung einer Variablen), und das zweite Beispiel zeigt ein gruppiertes Balkendiagramm (unter Verwendung von zwei Variablen). Beide Abbildungen zeigen die Entwicklung des Unternehmensumsatzes über einen bestimmten Zeitraum – eine typische Anwendung von Balkendiagrammen in Unternehmensszenarien. Das zweite Beispiel zeigt den Vergleich der Umsätze zweier Unternehmen in einem bestimmten Zeitraum.


Abbildung 1 ( Bildquelle )


Abbildung 2 ( Bildquelle )

Gestapelte Balkendiagramme

Im Gegensatz zu einem gruppierten Balkendiagramm, das die Balken nebeneinander anzeigt, unterteilen gestapelte Balkendiagramme die Balken in Abschnitte. Gestapelte Balkendiagramme werden verwendet, um zu zeigen, wie eine größere Kategorie in kleinere Kategorien aufgeteilt wird und wie sich jeder Teil auf die Gesamtmenge auswirkt. Die Balken in einem gestapelten Balkendiagramm sind in Stapelreihenfolge kategorisiert und repräsentieren unterschiedliche Werte. Eine Achse zeigt die diskreten Werte und die andere Achse gibt die variablen Balken in Stapelreihenfolge an. Unterschiedliche Farben werden verwendet, um die charakteristischen Teile des gesamten Balkens darzustellen.

Unten sehen Sie eine Abbildung, die ein gestapeltes Balkendiagramm darstellt: Bildquelle

Gestapeltes Balkendiagramm und segmentiertes Balkendiagramm

Es gibt zwei Arten von gestapelten Balkendiagrammen: Einfache gestapelte Balkendiagramme und 100 % gestapelte Balkendiagramme.

  • In einfachen gestapelten Balkendiagrammen wird jeder Wert für das Segment hinter dem vorherigen platziert. Daher ist der Gesamtwert des Balkens die Summe aller Segmentwerte. Daher eignen sich einfache gestapelte Balkendiagramme hervorragend zum Vergleichen des Gesamtbetrags mit jeder Gruppe/segmentiertem Balken.
  • Ein 100-%-Stack-Balkendiagramm oder ein segmentiertes Balkendiagramm ist ein gestapeltes Balkendiagramm, bei dem die segmentierten Balken zusammen 100 % ergeben. Mit anderen Worten, die gestapelten Balken zeigen den relativen Prozentsatz mehrerer Datenreihen, und die Summe jedes gestapelten Balkens ist immer 100 %. Daher ist es wichtig sicherzustellen, dass jeder Balken 100 % darstellt, wenn Sie ein segmentiertes Balkendiagramm erstellen. Andernfalls wird es zu einem einfachen gestapelten Balkendiagramm.

Gestapelte Balkendiagramme zeigen eine Teil-zu-Ganzes-Beziehung und können sogar zeigen, wie sich Teile im Laufe der Zeit verändern. Unten sehen Sie eine einfache Illustration eines segmentierten Balkendiagramms, das zeigt, wie sich der Marktanteil eines Produkts jedes Jahr ändert. Ein wesentlicher Nachteil solcher segmentierter Balkendiagramme besteht darin, dass es zwar einfach ist, die erste Datenreihe (direkt neben der vertikalen Achse in der Abbildung unten) zu vergleichen, nachfolgende Datenreihen jedoch schwieriger zu vergleichen sind, da sie nicht an einer gemeinsamen Basislinie ausgerichtet sind.

Bildquelle

Holen Sie sich online eine Data-Science-Zertifizierung von den besten Universitäten der Welt. Verdienen Sie Executive PG-Programme, Advanced Certificate-Programme oder Master-Programme, um Ihre Karriere zu beschleunigen.

Die folgende Abbildung verdeutlicht den anatomischen Unterschied zwischen einem einfachen gestapelten Balkendiagramm und einem segmentierten Balkendiagramm:

Bildquelle

Punkte, die Sie beim Erstellen eines segmentierten Balkendiagramms beachten sollten

  • Sowohl gestapelte als auch segmentierte Balkendiagramme haben eine zweidimensionale Darstellung mit zwei Achsen – eine Achse zeigt die Kategorien und die andere die numerischen Werte. Die Achse, die die Kategorien darstellt, hat keine Skala, um anzuzeigen, dass sie sich auf sich gegenseitig ausschließende Gruppen bezieht (z. B. Unternehmen, Jahre usw.). Aber die Achse mit Zahlenwerten hat eine Skala mit den entsprechenden Maßeinheiten.
  • Die Balken können entweder vertikal oder horizontal ausgerichtet werden. Jede Hauptkategorie ist in Segmente unterteilt, wobei jedes Segment Unterkategorien einer zweiten kategorialen Variablen darstellt.
  • Die Höhe oder Länge der rechteckigen Segmente zeigt die Menge jeder Unterkategorie und wird vertikal oder horizontal Ende an Ende gestapelt.
  • Die endgültige Länge oder Höhe jedes Balkens stellt den Gesamtbetrag in jeder Hauptkategorie dar (100 % in segmentierten Balkendiagrammen).
  • Äquivalente Unterkategorien sollten mit derselben Farbe dargestellt werden.
  • Zwischen den Balken der Hauptkategorien muss etwas Platz gelassen werden, um anzuzeigen, dass sie diskrete Gruppen darstellen.

Vor- und Nachteile von segmentierten Balkendiagrammen

Ein segmentiertes Balkendiagramm ist ein praktisches Werkzeug zur Datenvisualisierung. Es hat die inhärente Einfachheit eines Balkendiagramms und findet dennoch Anwendung in vielen Datenanalyseoperationen. Es hat jedoch mehrere Nachteile, die seine Verwendung auf bestimmte Szenarien der Datenanalyse beschränken.

Im Folgenden sind die Vor- und Nachteile von segmentierten Balkendiagrammen aufgeführt:

Vorteile:

  • Die Zusammensetzung kategorialer Daten ist ziemlich einfach zu verstehen.
  • Sie zeigen Teil-zu-Ganzes-Veränderungen im Laufe der Zeit.
  • Sie können mehrere Kategorien und Datenreihen auf kompaktem Raum darstellen.

Nachteile:

  • Mit zunehmenden Segmenten in jedem Balken wird es schwieriger zu lesen.
  • Segmente miteinander zu vergleichen wird schwierig, da sie nicht auf eine gemeinsame Grundlinie ausgerichtet sind.
  • Da die gestapelten Balken auf 100 % normiert sind, geht die Absolutwertdimension verloren.

Way Forward: Machen Sie Ihre Karriere zukunftssicher mit upGrad

upGrad ist eine führende Online-Plattform für Hochschulbildung, die branchenrelevante Programme und Kurse anbietet. Mit über 40.000 bezahlten Lernenden in 85 Ländern hat die Innovation von upGrad, die neueste Technologie und Bildungspraktiken zu kombinieren, mehr als 500.000 Berufstätigen in ihren jeweiligen Bereichen geholfen.

Folgendes bietet der upGrad-Vorteil für Lernende:

  • Flexibles Lernen und branchenrelevanter Lehrplan mit personalisierter Branchenbetreuung, praktischem Branchenprojekt und Live-Sitzungen mit Dozenten und Experten.
  • Peer-to-Peer-Networking, Foren zur Zweifelslösung und Networking-Möglichkeiten.
  • Fakultät von führenden Universitäten und Unternehmen
  • Ein engagiertes Team von Mentoren
  • Ergebnisorientierter Ansatz
  • 360-Grad-Karrierehilfe

Die Executive PG-Zertifizierung in Data Science und der Master-Abschluss in Data Science von upGrad sind zwei gut strukturierte Programme, die Ihnen helfen, die Fähigkeiten und Kenntnisse zu verstehen, die erforderlich sind, um in Data Science-Karrieren erfolgreich zu sein. Jedes Programm hat seine Vorteile zu bieten, aber beide sind so konzipiert, dass sie eine ansprechende Lernerfahrung bieten, die den neuesten Industriestandards entspricht. Mit zahlreichen praktischen branchenrelevanten Projekten können Zertifikatsinhaber sicher sein, dass sie bereit sind, sich dem herausfordernden und ständig wettbewerbsorientierten Arbeitsmarkt zu stellen, der eine ständige berufliche Weiterbildung erfordert. Darüber hinaus bieten die Programme eine einzigartige Gelegenheit, mit Data Science-Experten aus allen Branchen in Kontakt zu treten.

Höhepunkte des PG-Zertifizierungsprogramms für Data Science :

  • Sieben Monate Kursdauer mit einem vollständigen Online-Format.
  • Speziell für Berufstätige entwickelt.
  • Postgraduale Zertifizierung vom IIIT Bangalore.
  • Behandelt Programmiersprachen und Tools wie Excel, Python, Tableau und MySQL.
  • Über 300 Stunden Inhalt mit über 7 Fallstudien und Projekten, über 20 Live-Sitzungen und sechs Programmieraufgaben.

Master-Abschluss in Data Science von der International University of Applied Sciences, Deutschland

Programm-Highlights:

  • 24 Monate Kursdauer (erstes Jahr online und zweites Jahr auf dem Campus in Deutschland).
  • Doppelte Akkreditierung (Executive PG Program von IIIT-B und Master's Degree von IU, Deutschland) und NASSCOM-Zertifikat.
  • Für upGrad-Lernende ist kein IELTS erforderlich.
  • Umfassende Abdeckung von über 14 Tools und Software.
  • Über 500 Stunden Inhalt mit über 60 Fallstudien und Projekten, über 20 Live-Sitzungen und 25 1:8-Coaching-Sitzungen mit Branchenexperten.

Abschließend

Zu wissen, wie man ein segmentiertes Balkendiagramm erstellt, ist ein Muss für die Datenanalyse, insbesondere wenn Sie Anfänger sind und gerade erst mit Datenvisualisierungstechniken beginnen. Solche Diagramme können einfach in Excel erstellt werden und erfordern keine fortgeschrittenen Kenntnisse komplizierter Tools und Software. Zunächst ist es jedoch entscheidend, eine klare Vorstellung davon zu haben, mit welchen Daten Sie arbeiten und ob sie in eine segmentierte Balkendiagrammdarstellung passen.

Da der potenzielle globale Markt für Big Data und Business Analytics vielversprechende Trends für die Zukunft aufweist, kann man mit Sicherheit davon ausgehen, dass eine Karriere in den Datenwissenschaften voller Möglichkeiten ist. Melden Sie sich also bei upGrad an und lernen Sie mit den Besten!

Was ist der Unterschied zwischen einem Diagramm und einem Diagramm?

Diagramme sind eine Form der visuellen Darstellung von Daten, die die Form eines Diagramms, Bildes oder Diagramms annehmen können. In einem Diagramm können die Kategorien miteinander in Beziehung stehen oder nicht. Andererseits ist ein Diagramm eine numerische Darstellung von Daten, die zeigt, wie sich die Änderung einer Zahl oder Variablen auf eine andere auswirkt. Mit anderen Worten, ein Diagramm ist eine Art Diagramm, das sich auf Rohdaten konzentriert und den Trend dieser Daten im Laufe der Zeit darstellt.

Was ist ein Histogramm im Vergleich zu einem Balkendiagramm?

Ein Balkendiagramm verwendet vertikale oder horizontale Balken, um kategoriale Daten darzustellen, wobei die Länge jedes Balkens proportional zu dem Datenwert ist, den sie darstellen. Ein Histogramm hingegen ist eine grafische Darstellung von Daten, bei der die Daten in fortlaufenden Zahlenbereichen organisiert sind. In einem Histogramm entspricht jeder vertikale Balken einem Bereich.

Wie erstelle ich ein segmentiertes Balkendiagramm in MS Excel?

Im Folgenden sind die Schritte zum Erstellen eines segmentierten Balkendiagramms in MS Excel aufgeführt:
Schritt 1: Geben Sie Ihre Daten in Excel in klar beschriftete Spalten ein.
Schritt 2: Markieren Sie die Daten.
Schritt 3: Klicken Sie auf die Registerkarte Einfügen. Klicken Sie dann im Abschnitt Diagramme auf Säulen- oder Balkendiagramm einfügen.
Schritt 4: Klicken Sie auf die Option 100 % gestapelte Spalte.
Excel erstellt automatisch das segmentierte Balkendiagramm.