Projektowanie Octoverse na GitHubie: studium przypadku wizualizacji danych

Opublikowany: 2022-07-22

W zeszłym roku współpracowałem z GitHub, aby zaprojektować raport o stanie Octoverse 2021. Octoverse firmy GitHub analizuje dane ze świata rzeczywistego pochodzące od milionów programistów i repozytoriów, aby zaprezentować tegoroczne spostrzeżenia dotyczące branży programistycznej. Raport 2021 obejmuje trzy główne trendy: poprawę wydajności i dobrego samopoczucia poprzez opracowywanie kodu, tworzenie dokumentacji i wspieranie społeczności w inteligentniejszy i bardziej zrównoważony sposób.

Jako kreatywny łącznik projektu, moim zadaniem było pomóc zespołowi GitHub w uczynieniu raportu z dużą ilością danych łatwym do zrozumienia. Korzystając z wizualizacji danych, zaprojektowałem ponad 20 wykresów, map i wykresów, aby pomóc czytelnikom w rozwikłaniu informacji zebranych przez analityków danych GitHub.

W tym studium przypadku wizualizacji danych wyjaśniam mój proces projektowania, przedstawiam stronę internetową, którą pomogłem stworzyć dla Octoverse na GitHub i dzielę się kluczowymi informacjami z projektu.

Projektowanie angażujących doświadczeń cyfrowych za pomocą wizualizacji danych

State of the Octoverse 2021 to obszerny raport zawierający dane zebrane od ponad 73 milionów programistów GitHub i ponad 61 milionów nowych repozytoriów. Po raz pierwszy uwzględniono również ankietę dotyczącą demografii respondentów. Zrozumienie danych wymagało dużego wysiłku projektowego.

Nasz skromny zespół, w skład którego wchodzili programista Jose Luis Garrido i kierownik projektu Miquel Lopez, miał za zadanie zsyntetyzować tę ogromną ilość informacji dla czytelników. Pomimo opóźnionego startu i innych równoczesnych projektów, zrealizowaliśmy.

Rozpoczęcie procesu projektowania

Pierwszym etapem mojego procesu projektowania wizualizacji danych było odkrycie. Analitycy danych GitHub zbierali i analizowali informacje od programistów i repozytoriów za pomocą plików Excel, prezentacji PowerPoint i innych zestawów danych.

Dzięki tym informacjom, wraz z wstępnymi szkicami wizualizacji danych GitHub i 60-stronicowym dokumentem kontekstowym, zacząłem zastanawiać się, jak najlepiej zilustrować każdy zestaw danych. Następnie zabrałem się za zaprojektowanie każdego wykresu, mapy i diagramu w celu maksymalnego zaangażowania użytkownika i intuicyjnego doświadczenia użytkownika.

Wybór wykresu

Istnieją trzy kluczowe punkty wyboru skutecznej wizualizacji danych:

1. Określ cel wykresu

Dane mogą być reprezentowane na wiele sposobów – na wykresach słupkowych, wykresach liniowych, mapach termicznych, wykresach kaskadowych i nie tylko. Każdy wykres służy celowi i ważne jest, aby użyć właściwego, aby zapewnić jasny i dokładny przekaz.

Na przykład, jeśli chcesz przedstawić różnicę między dwiema wielkościami, użyj wykresu słupkowego. Jeśli chcesz pokazać trend w czasie, użyj wykresu liniowego.

2. Rozważ użytkownika końcowego

Musisz także mieć świadomość, że użytkownicy potrafią czytać i analizować dane. Większość z nas zna wykresy kołowe, słupkowe i liniowe. Widzimy je wszędzie i wiemy, jak je czytać.

Z drugiej strony mniej osób umie czytać wykresy pudełkowe, które są wykorzystywane w wielu publikacjach badawczych do podsumowania wielu zmiennych danych na jednym wykresie.

Jeśli przedstawisz użytkownikom nieznane wizualizacje, będzie im trudno zinterpretować dane.

3. Projektuj z jasnością

Czy wizualizacja danych jest przejrzysta i zwięzła, czy też jest za dużo szumu? Wykresy słupkowe mogą być świetnym sposobem wyświetlania danych, ale nie w przypadku 100 słupków z indywidualnymi etykietami. Podobnie wykresy strumieniowe są piękne i funkcjonalne, ale tylko wtedy, gdy istnieje wyraźny wzorzec danych. Czasami mniej znaczy więcej.

Projektowanie doskonałych wizualizacji danych

W raporcie Stan Octoverse z 2021 r. znajdziesz różnorodne wizualizacje danych, które zostały starannie skomponowane zgodnie z odpowiednimi wglądami w dane.

Wykres Motyli

Na stronie Przegląd musiałem zaprojektować infografikę dla dwóch zestawów danych — pokazującą, gdzie respondenci pracowali przed pandemią i po niej. GitHub dostarczył mi dwa wykresy kołowe, z których każdy przedstawiał cztery punkty danych: skolokowane, hybrydowe, w pełni zdalne i nie mające zastosowania. Jednak wykresy kołowe nie są szczególnie skuteczne przy porównywaniu dwóch zestawów danych.

Zamiast tego zdecydowałem się na wykres motylkowy. Wykresy motylkowe przedstawiają dane jako dwa poziome słupki obok siebie, przypominające skrzydła motyla. Wykresy te wyraźnie pokazują różnicę między dwiema grupami o tych samych parametrach i znacznie ułatwiają porównywanie dwóch zestawów danych.

Wykres motylkowy dla raportu GitHub's Octoverse przedstawiający dwa zestawy danych obok siebie. Dane porównują, gdzie respondenci pracowali przed (po lewej) i po (po prawej) pandemii. Istnieją cztery punkty danych: kolokowane, hybrydowe, w pełni zdalne i nie mają zastosowania do obu zestawów danych.
GitHub dostarczył mi dwa wykresy kołowe, które identyfikowały, gdzie respondenci pracowali przed i po pandemii. Uznałem, że bardziej efektywne jest stworzenie wykresu motylkowego, który wyświetla dwa zestawy danych obok siebie w celu łatwego porównania.

Wykres wypukłości

Inną skuteczną wizualizacją danych jest wykres wypukłości. Wykorzystaliśmy ten wykres, aby przedstawić informacje na temat najpopularniejszych języków programowania komputerów używanych przez programistów w ciągu ostatnich ośmiu lat. Wykresy wypukłości świetnie nadają się do przedstawiania zmian rang na przestrzeni czasu i stały się podstawą w raporcie Octoverse.

Wykres bump do raportu GitHub Octoverse, który pokazuje najpopularniejsze języki programowania komputerowego używane przez programistów w ciągu ostatnich ośmiu lat. Każdy język jest reprezentowany przez inną kolorową linię. W sumie jest 10 języków.
Do wizualizacji danych użyłem interaktywnego wykresu wypukłości, aby pokazać najpopularniejsze języki programowania komputerowego używane przez programistów w ciągu ostatnich ośmiu lat.

Mapa drzewa

Musiałem zilustrować różne sektory, do których respondenci wnoszą kod. Ostateczna decyzja sprowadzała się do wykresów kołowych i map drzew.

Wykresy kołowe są przydatne, gdy masz trzy lub cztery sektory, a ich ilości są wyraźnie różne. Jednak nasze mózgi nie przetwarzają dobrze kątów, więc kiedy istnieje wykres kołowy z dużą ilością klinów o podobnej wielkości, ludzie mają trudności z rozszyfrowaniem, który jest większy.

Natomiast mapy drzewa pozwalają użytkownikom na łatwe porównywanie segmentów ze sobą, a także z całością. Największe prostokąty są umieszczane w lewym górnym rogu, po których następują stopniowo mniejsze prostokąty. Łatwiej jest porównywać linie proste niż porównywać kliny lub kąty.

Mapa drzewa dla raportu GitHub Octoverse ilustruje różne sektory, do których respondenci wnieśli kod w 2021 r. Każdy sektor jest reprezentowany przez prostokąt. Największe prostokąty są umieszczane w lewym górnym rogu, po których następują stopniowo mniejsze prostokąty. Każdy prostokąt ma inny kolor.
Użyłem mapy drzewa, aby przedstawić różne sektory, do których respondenci wnieśli kod. W niektórych przypadkach mapy drzewa są lepsze niż wykresy kołowe, ponieważ łatwiej jest porównywać prostokąty niż wycinki.

Kartogram

Na koniec musiałem zilustrować rozkład geograficzny organizacji korzystających z GitHub w 2021 roku według regionu lub kraju. W tym celu użyłem kartogramu populacyjnego. Kartogramy to mapy, w których geometria jest zniekształcona w celu dostosowania do określonej cechy ekonomicznej, społecznej, politycznej lub środowiskowej.

W tej wizualizacji danych wielkość kwadratów wskazuje wielkość populacji. Dodatkowo nasycenie koloru kwadratu wskazuje, ile organizacji w tym obszarze korzysta z GitHub.

Kartogram populacji dla raportu GitHub Octoverse przedstawia rozkład geograficzny organizacji w 2021 roku. Mapa ta zmienia rzeczywistość fizycznej lokalizacji, aby lepiej zobrazować konkretny czynnik, w tym przypadku biznes. Nasycenie koloru kwadratu wskazuje, ile organizacji korzysta z usługi GitHub, przy czym jaśniejsze odcienie oznaczają mniej, a ciemniejsze odcienie więcej.
Kartogramy doskonale nadają się do mapowania tematycznego, gdy chcesz podkreślić informacje inne niż fizyczna lokalizacja, takie jak cechy gospodarcze, społeczne, polityczne lub środowiskowe.

Responsywny projekt strony internetowej dla GitHub Octoverse 2021

Oprócz projektowania wizualizacji danych pomogłem także zespołowi GitHub w stworzeniu witryny internetowej dla Octoverse 2021. Ta witryna była miejscem, w którym użytkownicy mogli czytać, eksplorować i wchodzić w interakcje z danymi zawartymi w raporcie.

Aby zachęcić użytkowników do zaangażowania, zdecydowaliśmy się na w pełni responsywną witrynę internetową, która dostosuje renderowanie witryny do różnych rozmiarów rzutni. GitHub poprosił nas o zwrócenie szczególnej uwagi na wersję na komputery stacjonarne po stwierdzeniu, że większe urządzenia były przyczyną większości odwiedzin Octoverse.

Projektując responsywną witrynę, kierowałem się tymi najlepszymi praktykami:

  • Tworzenie tekstu przy użyciu krojów pisma przyjaznych komputerom i urządzeniom mobilnym. Obejmowało to wybór optymalnych rozmiarów czcionek, krojów pisma oraz długości i wysokości linii, a także dopracowanie wyglądu tekstu w różnych punktach przerwania.
  • Rozmieszczenie elementów wizualnych na każdej stronie, aby zachęcić do przewijania.
  • Zaprojektowanie przyjaznego dla użytkownika górnego paska nawigacyjnego, który dostosowuje swój układ do rozmiaru rzutni.

Ponieważ od początku projektowałem stronę z myślą o różnych urządzeniach, większość wykresów renderowała się dobrze na wszystkich rozmiarach ekranu. Musiałem tylko wprowadzić drobne poprawki, aby uzyskać optymalną widoczność, na przykład okrągły dendrogram na końcu sekcji „Zrównoważone społeczności”.

Okrągły dendrogram do raportu Octoverse na GitHub. Każde koło reprezentuje jedno z 20 największych repozytoriów według kategorii i współtwórców repozytoriów. Każdy sektor jest reprezentowany przez inny kolor.
Dendrogramy to świetny sposób na pokazanie relacji między kategoriami. Możesz kliknąć kółka w tym interaktywnym dendrogramie, aby sprawdzić liczbę współtwórców repozytoriów i % współtwórców z wiekiem konta <2 lat.

Organizowanie architektury informacji

Zbadałem różne opcje architektury informacji na stronie. Nie chciałem przytłaczać użytkowników zbyt dużą ilością informacji, ale nie chciałem też, aby strona była rozproszona lub trudna w nawigacji.

Mając to na uwadze, zacząłem od zaprojektowania długiej przewijanej strony internetowej, z całą zawartością na tej samej stronie. Kiedy stało się to wizualnie przytłaczające, spróbowałem umieścić każdy wykres na osobnej stronie. Aby pomóc w nawigacji, dodałem boczne menu nawigacyjne do każdej strony ze spisem treści, podobnym do tego, który można znaleźć w książce. Ostateczny projekt witryny Octoverse składa się z oddzielnych stron internetowych dla trzech głównych trendów oraz strony głównej, która służy jako podsumowanie najważniejszych danych.

Po podjęciu decyzji o architekturze informacji przeszedłem do projektowania struktury treści witryny, przepływu nawigacji, obrazów i grafik. Stworzyłem makiety do mapowania treści i pokazywania ścieżek między różnymi stronami.

Tworzenie interaktywnej strony internetowej

Wskaźnik postępu przewijania

Aby spełnić prośbę GitHuba o angażującą, dynamiczną stronę internetową, dodaliśmy elementy interaktywne. Na przykład pod górnym paskiem nawigacyjnym zaprojektowałem wskaźnik postępu przewijania, aby odwiedzający mogli śledzić, gdzie byli w witrynie. Gdy czytelnicy przewijają stronę w dół, pasek wskaźnika jest stopniowo skalowany, a każda strona ma inny kolor wypełnienia paska: szary, fioletowy, niebieski lub zielony.

Część strony internetowej „Zrównoważone społeczności” w witrynie GitHub Octoverse 2021. Wskaźnik postępu przewijania u góry jest interaktywny. Gdy użytkownik przewija stronę, pasek wskaźnika zmienia się z jasnoszarego na zielony.
Subtelne akcenty interaktywności: pasek wskaźnika postępu przewijania zmienia się z jasnoszarego na zielony podczas przewijania strony.

Animowane nagłówki, obrazy i wizualizacja danych

Aby strona nie wyglądała płasko, zdecydowaliśmy się animować nagłówki sekcji. Stworzyłem ilustracje, a programista naszego zespołu je animował. Animowaliśmy również obraz bohatera na stronie głównej i każdej podsekcji oraz odpowiadające im karty rozdziałów na dole każdej strony internetowej.

Animowany gif z trzema kartami rozdziałów, które można znaleźć na dole każdej strony internetowej w witrynie GitHub Octoverse. Są to: szybsze pisanie i wysyłanie kodu (z interaktywnym fioletowym nagłówkiem), tworzenie dokumentacji wspierającej programistów (z interaktywnym niebieskim nagłówkiem) oraz wspieranie zrównoważonych społeczności (z interaktywnym zielonym nagłówkiem).
Na dole każdej strony internetowej znajdziesz animowane karty rozdziałów dla każdego z trzech głównych trendów prezentowanych w Octoverse na GitHubie.

Stworzyliśmy również interaktywne wykresy wizualizacji danych statycznych. Na przykład podczas przewijania linii na wykresie wypukłym linia ta pogrubia się, aby podkreślić odpowiedni punkt danych. Jest to prosta, ale skuteczna animacja, która umożliwia odwiedzającym witrynę interakcję z danymi i szybkie porównywanie języków.

Tworzenie udanych wizualizacji danych i projektów cyfrowych dla GitHub: Kluczowe wnioski

Dane są przydatne tylko wtedy, gdy potrafisz je zrozumieć, a proces projektowania treści z dużą ilością danych, które użytkownicy mogą łatwo odszyfrować, jest trudny. Niemniej jednak ta współpraca z GitHub poszerzyła moją wiedzę w zakresie projektowania wizualizacji danych. Oto najważniejsze wnioski z tego studium przypadku wizualizacji danych:

  • Poznaj markę: zapoznanie się z podstawowymi wytycznymi dotyczącymi stylu marki — takimi jak użycie czcionki, koloru i obrazów — przyspiesza proces projektowania, ponieważ pozwala projektantom przejść do procesu twórczego. Miałem szczęście, że dużo wiedziałem o marce GitHub przed współpracą i mogłem wykorzystać tę wiedzę do tworzenia swoich projektów.
  • Wybierz odpowiednie typy wizualizacji danych: wybór odpowiedniej wizualizacji reprezentującej punkt danych jest niezbędny. Nieprawidłowa reprezentacja może spowodować zamieszanie lub przekazać niewłaściwą wiadomość.
  • Używaj kolorów mądrze: właściwa kombinacja kolorów pokieruje wzrokiem czytelnika i zwróci uwagę na konkretny punkt danych.
  • Zachowaj ciekawość: gdy próbujesz opowiedzieć przekonującą historię danych, na pewno napotkasz złożone problemy projektowe, dlatego ważne jest, aby być otwartym na nietypowe rozwiązania i ciągłe uczenie się.