Segmentowana grupa słupków w analizie danych: kompletny przewodnik
Opublikowany: 2021-08-14Segmentowany wykres słupkowy to pojęcie znane w analizie danych. Ale czy znasz jego podstawy?
Wykresy to jeden z najczęstszych sposobów przedstawiania relacji między danymi, zwłaszcza tymi, które są zbyt skomplikowane i liczne, aby można je było wygodnie zilustrować w ograniczonej przestrzeni i czasie. Ze względu na ogromną ilość informacji gromadzonych i przetwarzanych w wyniku analizy danych istotne jest posiadanie sposobu na przedstawienie tych danych w celu dokładnej interpretacji i wnioskowania. Wizualizacja danych daje nam jasny obraz tego, co oznaczają informacje, nadając im wizualną formę za pomocą wykresów i wykresów. Dzięki temu dane stają się bardziej zrozumiałe dla ludzkiego umysłu i mogą szybko identyfikować wzorce, trendy i anomalie w dużych zbiorach danych. Jeśli jesteś początkującym w analityce danych i nauce o danych, certyfikaty data science upGrad z pewnością pomogą ci głębiej zagłębić się w świat danych i analityki.
Umiejętność przedstawiania przekonujących argumentów poprzez wizualizację danych jest jedną z wyjątkowych cech wykwalifikowanego specjalisty Data Science. Chociaż istnieje kilka opcji wykresów i wykresów
można wybierać spośród ilustrujących dane w różnych scenariuszach, segmentowany wykres słupkowy lub segmentowany wykres słupkowy przyciąga uwagę analityków danych.
Ten artykuł przeprowadzi Cię przez podstawy segmentowanego wykresu słupkowego, dlaczego jest używany, gdzie jest używany, oraz kursy uaktualnienia Data Science, które mogą pomóc w opanowaniu umiejętności wymaganych, aby odnieść sukces jako analityk danych.
Ale najpierw odświeżmy wykresy słupkowe.
Spis treści
Wykresy słupkowe
Wśród najczęściej używanych typów wykresów/wykresów wykres słupkowy lub wykres słupkowy składa się z serii słupków przedstawiających porównanie między różnymi kategoriami danych. Wykresy słupkowe są jednym z najczęstszych typów wykresów i zazwyczaj są łatwe do zrozumienia ze względu na ich znajomość.
Pomimo prostoty wykresów słupkowych mają one ograniczone zastosowanie. Przed zilustrowaniem danych na wykresie słupkowym należy ocenić charakter danych oraz liczbę zmiennych dodawanych do wykresu. Idealnie, wykresy słupkowe są doskonałym wyborem, gdy chcemy śledzić rozwój jednej lub dwóch zmiennych w czasie. Rzeczywiście możemy ich użyć do porównania kilku zmiennych w formie grupowanego wykresu słupkowego. Jednak takie porównania mogą prowadzić do zagraconej reprezentacji, która może prowadzić do zamieszania.
Poniżej znajdują się dwie ilustracje – pierwsza przedstawia prosty wykres słupkowy (przy użyciu jednej zmiennej), a drugi przykład przedstawia skupiony wykres słupkowy (przy użyciu dwóch zmiennych). Obie ilustracje pokazują rozwój przychodów firmy w danym okresie – typowe zastosowanie wykresów słupkowych w scenariuszach korporacyjnych. Drugi przykład pokazuje porównanie przychodów dwóch firm w określonym przedziale czasowym.
Ilustracja 1 ( źródło obrazu )
Ilustracja 2 ( źródło obrazu )
Skumulowane wykresy słupkowe
W przeciwieństwie do grupowanego wykresu słupkowego, który wyświetla słupki obok siebie, skumulowane wykresy słupkowe dzielą słupki na sekcje. Skumulowane wykresy słupkowe służą do pokazania, w jaki sposób większa kategoria jest podzielona na mniejsze kategorie i jak każda część wpływa na całkowitą kwotę. Słupki na skumulowanym wykresie słupkowym są podzielone na kategorie w kolejności układania, reprezentujące różne wartości. Jedna oś pokazuje wartości dyskretne, a druga oś wskazuje zmienne słupki w kolejności ułożenia. Różne kolory służą do pokazania charakterystycznych części całego paska.
Poniżej znajduje się ilustracja przedstawiająca skumulowany wykres słupkowy: Źródło obrazu
Skumulowany wykres słupkowy i segmentowany wykres słupkowy
Skumulowane wykresy słupkowe są dwojakiego rodzaju: proste skumulowane wykresy słupkowe i 100% skumulowane wykresy słupkowe.
- W prostych skumulowanych wykresach słupkowych każda wartość segmentu jest umieszczana za poprzednią. Stąd całkowita wartość słupka jest sumą wszystkich wartości segmentów. Dlatego proste skumulowane wykresy słupkowe świetnie nadają się do porównywania łącznej kwoty z każdym słupkiem grupy/segmentu.
- Wykres słupkowy skumulowany 100% lub wykres słupkowy segmentowany to skumulowany wykres słupkowy, w którym segmentowane słupki sumują się do 100%. Innymi słowy, słupki skumulowane pokazują względny procent wielu serii danych, a suma każdego słupka skumulowanego wynosi zawsze 100%. Dlatego ważne jest, aby podczas konstruowania segmentowanego wykresu słupkowego upewnić się, że każdy słupek reprezentuje 100%. Albo stanie się prostym skumulowanym wykresem słupkowym.
Skumulowane wykresy słupkowe pokazują relację części do całości i mogą nawet pokazać, jak części zmieniają się w czasie. Poniżej znajduje się prosta ilustracja podzielonego na segmenty wykresu słupkowego pokazującego, jak udział produktu w rynku zmienia się każdego roku. Istotną wadą takich segmentowanych wykresów słupkowych jest to, że o ile pierwsze serie danych (tuż obok osi pionowej na poniższej ilustracji) można łatwo porównać, o tyle kolejne są trudniejsze do porównania, ponieważ nie są wyrównane do wspólnej linii bazowej.
Źródło obrazu
Uzyskaj certyfikat naukowy online z najlepszych światowych uniwersytetów. Zdobywaj programy Executive PG, Advanced Certificate Programs lub Masters Programs, aby przyspieszyć swoją karierę.
Poniższa ilustracja dokładniej wyjaśnia różnicę anatomiczną między prostym skumulowanym wykresem słupkowym a segmentowanym wykresem słupkowym:
Źródło obrazu
Punkty do zapamiętania podczas konstruowania segmentowanego wykresu słupkowego
- Zarówno skumulowane, jak i segmentowane wykresy słupkowe mają dwuwymiarową reprezentację z dwiema osiami – jedna oś przedstawia kategorie, a druga pokazuje wartości liczbowe. Oś reprezentująca kategorie nie ma skali wskazującej, że odnosi się do wzajemnie wykluczających się grup (np. firmy, lata itp.). Ale oś z wartościami liczbowymi ma skalę z odpowiednimi jednostkami miary.
- Pręty mogą być zorientowane pionowo lub poziomo. Każda kategoria główna jest podzielona na segmenty, gdzie każdy segment reprezentuje podkategorie drugiej zmiennej kategorialnej.
- Wysokość lub długość prostokątnych segmentów pokazuje ilość każdej podkategorii i jest ułożona od końca do końca w pionie lub poziomie.
- Ostateczna długość lub wysokość każdego słupka reprezentuje całkowitą kwotę w każdej głównej kategorii (100% na segmentowanych wykresach słupkowych).
- Równoważne podkategorie powinny być reprezentowane tym samym kolorem.
- Pomiędzy słupkami kategorii głównych należy pozostawić trochę odstępu, aby wskazać, że reprezentują one grupy dyskretne.
Plusy i minusy segmentowanych wykresów słupkowych
Segmentowany wykres słupkowy to przydatne narzędzie do wizualizacji danych. Charakteryzuje się prostotą wykresu słupkowego, a mimo to znajduje zastosowanie w wielu operacjach analizy danych. Ma jednak kilka wad, które ograniczają jego zastosowanie do konkretnych scenariuszy analizy danych.
Poniżej znajdują się zalety i wady segmentowanych wykresów słupkowych:
Plusy:
- Łatwo jest zrozumieć skład danych kategorycznych.
- Przedstawiają zmiany od części do całości w czasie.
- Mogą reprezentować wiele kategorii i serii danych w niewielkiej przestrzeni.
Cons:
- Wraz ze wzrostem liczby segmentów w każdym takcie czytanie staje się trudniejsze.
- Porównywanie segmentów ze sobą staje się trudne, ponieważ nie są one wyrównane do wspólnej linii bazowej.
- Ponieważ skumulowane słupki są znormalizowane do 100%, wymiar wartości bezwzględnej zostaje utracony.
Dalsza droga: zabezpiecz swoją karierę na przyszłość dzięki upGrad
upGrad to wiodąca internetowa platforma szkolnictwa wyższego oferująca programy i kursy odpowiednie dla branży. Dzięki ponad 40 000 płatnych uczniów w 85 krajach, innowacja upGrad polegająca na łączeniu najnowszych technologii i praktyk edukacyjnych pomogła ponad 500 000 profesjonalistów pracujących w swoich dziedzinach.
Oto, co przewaga upGrad oferuje uczącym się:
- Elastyczne nauczanie i odpowiedni dla branży program nauczania ze spersonalizowanym mentoringiem branżowym, praktycznymi praktycznymi projektami branżowymi oraz sesjami na żywo z wykładowcami i ekspertami.
- Sieci peer-to-peer, fora rozwiązywania wątpliwości i możliwości nawiązywania kontaktów.
- Wydział z czołowych uniwersytetów i firm
- Dedykowany zespół mentorów
- Podejście zorientowane na wyniki
- Pomoc w karierze 360 stopni
UpGrad's Executive PG Certification w Data Science i Master's Degree w Data Science to dwa dobrze ustrukturyzowane programy, które pomogą Ci zdobyć mocne zrozumienie umiejętności i wiedzy wymaganej do rozkwitu kariery w Data Science. Każdy program ma do zaoferowania swoje korzyści, ale oba zostały zaprojektowane tak, aby zapewnić wciągające doświadczenie edukacyjne zgodne z najnowszymi standardami branżowymi. Dzięki licznym praktycznym projektom związanym z branżą posiadacze certyfikatów mogą być pewni, że będą gotowi stawić czoła wymagającym i zawsze konkurencyjnym rynkom pracy, które wymagają stałego podnoszenia kwalifikacji zawodowych. Co więcej, programy są wyjątkową okazją do nawiązania kontaktu ze specjalistami Data Science we wszystkich sektorach przemysłu.
Najważniejsze informacje o certyfikacji PG w programie Data Science :
- Siedmiomiesięczny czas trwania kursu w pełni online.
- Specjalnie zaprojektowany dla pracujących profesjonalistów.
- Certyfikat podyplomowy z IIIT Bangalore.
- Obejmuje języki programowania i narzędzia, takie jak Excel, Python, Tableau i MySQL.
- Ponad 300 godzin treści z ponad 7 studiami przypadków i projektami, ponad 20 sesjami na żywo i sześcioma zadaniami kodowania.
Tytuł magistra nauk o danych uzyskany na Międzynarodowym Uniwersytecie Nauk Stosowanych w Niemczech
Najważniejsze punkty programu:
- Czas trwania kursu 24 miesiące (pierwszy rok online, drugi rok na terenie kampusu w Niemczech).
- Podwójna akredytacja (Executive PG Program z IIIT-B i Master's Degree z IU, Niemcy) oraz certyfikat NASSCOM.
- Nie jest wymagany IELTS dla uczniów upGrad.
- Kompleksowa oferta 14+ narzędzi i oprogramowania.
- Ponad 500 godzin treści z ponad 60 studiami przypadków i projektami, ponad 20 sesjami na żywo i 25 sesjami coachingowymi 1:8 z ekspertami z branży.
Na zakończenie
Wiedza o tym, jak skonstruować segmentowany wykres słupkowy, jest niezbędna do analizy danych, zwłaszcza jeśli jesteś początkującym i dopiero zaczynasz od technik wizualizacji danych. Takie wykresy można łatwo skonstruować w Excelu i nie wymagają one zaawansowanej znajomości skomplikowanych narzędzi i oprogramowania. Najpierw jednak ważne jest, aby mieć jasny obraz danych, z którymi pracujesz i czy pasują one do podzielonej reprezentacji na wykresie słupkowym.
Ponieważ potencjalny globalny rynek Big Data i Business Analytics pokazuje obiecujące trendy na przyszłość, można śmiało uznać, że kariera w Data Science jest pełna możliwości. Zarejestruj się w upGrad i zacznij uczyć się z najlepszymi!
Wykresy to forma wizualnej reprezentacji danych, która może przybrać formę diagramu, obrazu lub wykresu. Na wykresie kategorie mogą być ze sobą powiązane lub nie. Z drugiej strony wykres jest liczbową reprezentacją danych, która pokazuje, jak zmiana jednej liczby lub zmiennej wpływa na inną. Innymi słowy, wykres to rodzaj wykresu, który koncentruje się na surowych danych i przedstawia trend tych danych w czasie. Wykres słupkowy wykorzystuje pionowe lub poziome słupki do przedstawiania danych kategorialnych, gdzie długość każdego słupka jest proporcjonalna do wartości danych, które reprezentują. Z drugiej strony histogram to graficzna reprezentacja danych, w której dane są zorganizowane w ciągłe zakresy liczbowe. Na histogramie każdy pionowy pasek odpowiada zakresowi. Oto kroki, aby utworzyć segmentowany wykres słupkowy w MS Excel:Jaka jest różnica między wykresem a wykresem?
Czym jest histogram a wykres słupkowy?
Jak utworzyć segmentowany wykres słupkowy w MS Excel?
Krok 1: Wprowadź swoje dane w Excelu w wyraźnie oznaczonych kolumnach.
Krok 2: Zaznacz dane.
Krok 3: Kliknij kartę Wstaw. Następnie kliknij Wstaw wykres kolumnowy lub słupkowy w sekcji Wykresy.
Krok 4: Kliknij opcję 100% skumulowana kolumna.
Excel automatycznie utworzy segmentowany wykres słupkowy.