Jak stworzyć mapę termiczną Pythona za pomocą Seaborn? [Kompleksowe wyjaśnienie]
Opublikowany: 2021-10-06Firmy w erze Big Data są na co dzień przytłoczone dużymi ilościami danych. Jednak to nie sama ilość istotnych danych ma znaczenie, ale to, co się z nimi robi. W związku z tym należy przeanalizować Big Data, aby uzyskać wgląd, który ostatecznie podyktuje lepsze decyzje i wpłynie na strategiczne posunięcia biznesowe.
Nie wystarczy jednak przeanalizować dane i je tam zostawić. Następnym krokiem jest wizualizacja danych, która przedstawia dane w formacie wizualnym, aby zobaczyć i zrozumieć wzorce, trendy i wartości odstające w danych. Heatmap w Pythonie to jedna z wielu technik wizualizacji danych.
Wizualizacja danych odnosi się do graficznej reprezentacji danych i może obejmować wykresy, wykresy, mapy i inne elementy wizualne. Jest to bardzo ważne dla analizowania ogromnych ilości informacji i podejmowania decyzji opartych na danych.
Ten artykuł przeprowadzi Cię przez koncepcję mapy cieplnej w Pythonie i jak ją stworzyć za pomocą Seaborn.
Spis treści
Co to jest mapa termiczna?
Mapa cieplna w Pythonie to technika wizualizacji danych, w której kolory przedstawiają, jak zmienia się interesująca wartość z wartościami dwóch innych zmiennych. Jest to dwuwymiarowa graficzna reprezentacja danych z wartościami zakodowanymi w kolorach, dająca w ten sposób uproszczony, wnikliwy i atrakcyjny wizualnie widok informacji. Poniższy obraz jest uproszczoną reprezentacją mapy termicznej.
Zazwyczaj mapa termiczna to tabela danych z wierszami i kolumnami reprezentującymi różne zestawy kategorii. Każda komórka w tabeli zawiera wartość logiczną lub liczbową, która określa kolor komórki na podstawie danej palety kolorów. W związku z tym mapy cieplne wykorzystują kolory w celu podkreślenia relacji między wartościami danych, które w przeciwnym razie byłyby trudne do zrozumienia, gdyby zostały ułożone w zwykłej tabeli przy użyciu nieprzetworzonych liczb.
Mapy ciepła znajdują zastosowanie w kilku rzeczywistych scenariuszach. Weźmy na przykład pod uwagę poniższą mapę cieplną. Jest to mapa cieplna indeksów giełdowych, która identyfikuje dominujące trendy na rynku akcji. Mapa termiczna wykorzystuje schemat kolorów od zimnego do gorącego, aby pokazać, które akcje są niedźwiedzie, a które bycze. Pierwsza jest reprezentowana za pomocą koloru czerwonego, podczas gdy druga jest przedstawiona na zielono.
Źródło
Mapy ciepła znajdują zastosowanie w kilku innych obszarach. Niektóre przykłady obejmują mapy popularności witryn, geograficzne mapy popularności i mapy popularności dotyczące sportu. Na przykład, możesz użyć mapy cieplnej, aby zrozumieć, jak opady zmieniają się w zależności od miesiąca w roku w zbiorze miast. Mapy termiczne są również niezwykle przydatne do badania ludzkich zachowań.
Mapa termiczna korelacji
Korelacyjna mapa cieplna to dwuwymiarowa macierz pokazująca korelację między dwiema różnymi zmiennymi. Wiersze tabeli pokazują wartości pierwszej zmiennej, natomiast druga zmienna pojawia się jako kolumny. Podobnie jak zwykła mapa termiczna, mapa termiczna korelacji zawiera również kolorowy pasek do odczytywania i rozumienia danych.
Zastosowany schemat kolorów jest taki, że jeden koniec schematu kolorów reprezentuje punkty danych o niskiej wartości, a drugi koniec punkty danych o wysokiej wartości. Dlatego mapy cieplne korelacji są idealne do analizy danych, ponieważ przedstawiają wzorce w czytelnej formie, jednocześnie podkreślając zmienność danych.
Poniżej przedstawiono klasyczną reprezentację mapy cieplnej korelacji.
Źródło
Tworzenie mapy termicznej Seaborn w Pythonie
Seaborn to biblioteka Pythona używana do wizualizacji danych i oparta na matplotlib. Stanowi informacyjne i atrakcyjne wizualnie medium do prezentacji danych w formacie wykresu statystycznego. Na mapie termicznej utworzonej za pomocą seaborn paleta kolorów przedstawia zmienność powiązanych danych. Jeśli jesteś początkującym i chciałbyś zdobyć doświadczenie w nauce o danych, zapoznaj się z naszymi kursami z nauk o danych.
Kroki tworzenia mapy cieplnej w Pythonie
Poniższe kroki dają ogólny zarys tego, jak stworzyć prostą mapę cieplną w Pythonie:
- Importuj wszystkie wymagane pakiety
- Zaimportuj plik, w którym przechowujesz swoje dane
- Sporządź mapę termiczną
- Wyświetl mapę termiczną za pomocą matplotlib
Teraz pokażemy, jak seaborn, wraz z matplotlib i pandas, może zostać użyty do wygenerowania mapy ciepła.
W tym przykładzie zbudujemy w Pythonie mapę popularności dla 30 akcji firmy farmaceutycznej. Powstała mapa termiczna pokaże symbole giełdowe i ich odpowiednią jednodniową zmianę ceny procentowej. Zaczniemy od zebrania danych rynkowych o akcjach farmaceutycznych i utworzymy plik CSV (wartość oddzielona przecinkami) składający się z symboli akcji i odpowiadającej im zmiany procentowej ceny w pierwszych dwóch kolumnach wspomnianego pliku CSV.
Ponieważ współpracujemy z 30 firmami farmaceutycznymi, zbudujemy macierz heatmap składającą się z 6 wierszy i 5 kolumn. Ponadto chcemy, aby mapa cieplna przedstawiała procentową zmianę ceny w porządku malejącym. Tak więc uporządkujemy zapasy w pliku CSV w kolejności malejącej i dodamy dwie dodatkowe kolumny, aby wskazać pozycję każdego zapasu na osiach X i Y mapy termicznej Seaborn.
Krok 1: Importowanie pakietów Pythona.
Źródło
Krok 2: Ładowanie zbioru danych.
Zbiór danych jest odczytywany za pomocą funkcji read_csv z pand. Ponadto używamy instrukcji print do wizualizacji pierwszych 10 wierszy.
Źródło
Krok 3: Tworzenie tablicy Numpy w Pythonie.
Mając na uwadze macierz 6 x 5, utworzymy tablicę n-wymiarową dla kolumn „Symbol” i „Zmiana”.
Źródło
Krok 4: Tworzenie osi w Pythonie.
Z danego obiektu ramki danych „df” funkcja przestawna tworzy nową tabelę pochodną. Funkcja przestawna przyjmuje trzy argumenty — indeks, kolumny i wartości. Wartości komórek nowej tabeli są pobierane z kolumny „Zmiana”.
Źródło
Krok 5: Tworzenie tablicy do opisywania mapy termicznej.
Następnym krokiem jest utworzenie tablicy do opisywania mapy popularności seaborn. W tym celu wywołamy metodę flatten na tablicach „procent” i „symbol”, aby spłaszczyć listę list Pythona w jednym wierszu. Ponadto funkcja zip zipuje listę w Pythonie. Uruchomimy pętlę for Pythona i użyjemy funkcji format, aby sformatować symbole giełdowe i wartości procentowej zmiany ceny zgodnie z potrzebami.
Źródło
Krok 6: Tworzenie figury matplotlib i definiowanie wykresu.
W tym kroku utworzymy pusty wykres matplotlib i zdefiniujemy rozmiar figury. Dodatkowo dodamy tytuł wykresu, ustawimy wielkość czcionki tytułu oraz ustalimy jego odległość od wykresu za pomocą metody set_position. Wreszcie, ponieważ chcemy wyświetlać tylko symbole giełdowe i odpowiadającą im jednodniową zmianę ceny procentowej, ukryjemy tiki dla osi X i Y i usuniemy osie z wykresu.
Źródło
Krok 7: Tworzenie mapy termicznej
W ostatnim kroku użyjemy funkcji heatmap z pakietu Seaborn Python do stworzenia mapy ciepła. Funkcja heatmap pakietu seaborn Python przyjmuje następujący zestaw argumentów:
Dane :
Jest to dwuwymiarowy zbiór danych, który można przekształcić w tablicę. Biorąc pod uwagę Pandas DataFrame, wiersze i kolumny zostaną oznaczone przy użyciu informacji o indeksie/kolumnie.
Adnotacja :
Jest to tablica o tym samym kształcie co dane i zawiera adnotacje do mapy termicznej.
cmmapa:
Jest to obiekt matplotlib lub nazwa mapy kolorów i mapuje wartości danych do przestrzeni kolorów.
Fmt :
Jest to kod formatujący ciąg znaków używany podczas dodawania adnotacji.
Szerokości linii:
Określa szerokość linii dzielących każdą komórkę.
Źródło
Ostateczny wynik mapy termicznej seaborn dla wybranych firm farmaceutycznych będzie wyglądał następująco:
Źródło
Way Forward: Naucz się Pythona z programem upGrad Professional Certificate w dziedzinie nauki o danych
Professional Certificate Program in Data Science for Business Decision Making to rygorystyczny, 8-miesięczny program online skupiający się na naukach o danych i koncepcjach uczenia maszynowego, ze szczególnym naciskiem na ich rzeczywiste zastosowania biznesowe. Program jest kategorycznie przeznaczony dla menedżerów i pracujących profesjonalistów, którzy chcą rozwinąć praktyczną wiedzę i umiejętności z zakresu data science, które pomogą im podejmować strategiczne i oparte na danych decyzje biznesowe.
Oto kilka najważniejszych punktów kursu:
- Prestiżowe wyróżnienie od IIM Kozhikode
- 200+ godzin treści
- 3 projekty branżowe i zwieńczenie
- 20+ sesji edukacyjnych na żywo
- 5+ eksperckich sesji coachingowych
- Zasięg programów Excel, Tableau, Python, R i Power BI
- Indywidualnie z mentorami branżowymi
- Wsparcie kariery 360 stopni
- Pomoc w pracy w najlepszych firmach
Zarejestruj się w upGrad i doskonal swoje umiejętności tworzenia map termicznych w Pythonie, aby zaspokoić wszystkie potrzeby związane z wizualizacją danych!
Wniosek
Statystycy i analitycy danych wykorzystują mnóstwo narzędzi i technik do sortowania zebranych danych i przedstawiania ich w sposób zrozumiały i przyjazny dla użytkownika. W związku z tym mapy cieplne jako technika wizualizacji danych pomogły firmom ze wszystkich sektorów lepiej wizualizować i rozumieć dane.
Podsumowując, heatmapy były szeroko stosowane i nadal są jednym z najczęściej wybieranych narzędzi statystycznych i analitycznych. Dzieje się tak, ponieważ oferują atrakcyjny wizualnie i przystępny sposób prezentacji danych, są łatwo zrozumiałe, wszechstronne, adaptowalne i eliminują żmudne etapy tradycyjnych procesów analizy i interpretacji danych, prezentując wszystkie wartości w jednej ramce.
Jak narysować mapę termiczną?
Mapa termiczna to standardowy sposób wykreślania zgrupowanych danych w dwuwymiarowym formacie graficznym. Podstawową ideą tworzenia mapy cieplnej jest to, że wykres jest podzielony na kwadraty lub prostokąty, z których każdy reprezentuje jedną komórkę w tabeli danych, jeden zestaw danych i jeden wiersz. Kwadrat lub prostokąt jest kodowany kolorami zgodnie z wartością tej komórki w tabeli.
Czy mapa cieplna pokazuje korelację?
Korelacyjna mapa cieplna to graficzna reprezentacja macierzy korelacji przedstawiającej korelację między różnymi zmiennymi. Korelacyjne mapy cieplne są bardzo skuteczne, jeśli są używane prawidłowo, ponieważ można łatwo zidentyfikować wysoce skorelowane zmienne.
Dlaczego seaborn jest używany w Pythonie?
Seaborn to biblioteka Pythona o otwartym kodzie źródłowym oparta na matplotlib. Służy do eksploracyjnej analizy i wizualizacji danych oraz z łatwością współpracuje z ramkami danych i biblioteką Pandas. Ponadto wykresy utworzone za pomocą seaborn można łatwo dostosować.