Cum se creează o hartă termică Python cu Seaborn? [Explicație cuprinzătoare]
Publicat: 2021-10-06Întreprinderile din era Big Data sunt copleșite de volume mari de date în fiecare zi. Cu toate acestea, nu cantitatea mare de date relevante contează, ci ceea ce se face cu datele. Prin urmare, Big Data trebuie analizată pentru a obține informații care, în cele din urmă, vor dicta decizii mai bune și vor influența mișcările strategice ale afacerii.
Totuși, nu este suficient să analizezi datele și să le lași acolo. Următorul pas este vizualizarea datelor care prezintă datele într-un format vizual pentru a vedea și înțelege modelele, tendințele și valorile aberante din date. Heatmap în Python este una dintre numeroasele tehnici de vizualizare a datelor.
Vizualizarea datelor se referă la reprezentarea grafică a datelor și poate include grafice, diagrame, hărți și alte elemente vizuale. Este extrem de critic pentru analizarea unor cantități uriașe de informații și luarea deciziilor bazate pe date.
Acest articol vă va prezenta conceptul de hărți termice în Python și cum să creați una folosind Seaborn.
Cuprins
Ce este o hartă termică?
O hartă termică în Python este o tehnică de vizualizare a datelor în care culorile reprezintă modul în care o valoare de interes se schimbă cu valorile altor două variabile. Este o reprezentare grafică bidimensională a datelor cu valori codificate în culori, oferind astfel o imagine simplificată, perspicace și atractivă din punct de vedere vizual a informațiilor. Imaginea de mai jos este o reprezentare simplificată a unei hărți termice.
De obicei, o hartă termică este un tabel de date cu rânduri și coloane care reprezintă diferite seturi de categorii. Fiecare celulă din tabel conține o valoare logică sau numerică care determină culoarea celulei pe baza unei palete de culori date. Astfel, hărțile termice folosesc culori pentru a sublinia relația dintre valorile datelor care altfel ar fi dificil de înțeles dacă ar fi aranjate într-un tabel obișnuit folosind numere brute.
Hărțile termice găsesc aplicații în mai multe scenarii din lumea reală. De exemplu, luați în considerare harta termică de mai jos. Este o hartă termică a indicelui bursier care identifică tendințele predominante pe piața de valori. Harta termică folosește o schemă de culori de la rece la fierbinte pentru a arăta care acțiuni sunt urcare și care sunt optimiste. Primul este reprezentat folosind culoarea roșie, în timp ce cel din urmă este reprezentat în verde.
Sursă
Hărțile termice își găsesc utilizare în mai multe alte domenii. Unele exemple includ hărți termice pentru site-uri web, hărți termice geografice și hărți termice pentru sport. De exemplu, puteți folosi o hartă termică pentru a înțelege cum variază precipitațiile în funcție de luna anului într-un set de orașe. Hărțile termice sunt, de asemenea, extrem de utile pentru a studia comportamentul uman.
Harta termică de corelație
O hartă termică a corelației este o matrice bidimensională care arată corelația dintre două variabile distincte. Rândurile tabelului arată valorile primei variabile, în timp ce a doua variabilă apare sub formă de coloane. La fel ca o hartă termică obișnuită, o hartă termică de corelare vine și cu o bară de culoare pentru a citi și înțelege datele.
Schema de culori utilizată este astfel încât un capăt al schemei de culori reprezintă punctele de date cu valoare mică, iar celălalt capăt punctele de date cu valoare mare. Prin urmare, hărțile de corelație sunt ideale pentru analiza datelor, deoarece prezintă modele într-o formă ușor de citit, subliniind și variația datelor.
Mai jos este o reprezentare clasică a unei hărți de corelație.
Sursă
Crearea unei hărți de căldură Seaborn în Python
Seaborn este o bibliotecă Python folosită pentru vizualizarea datelor și se bazează pe matplotlib. Oferă un mediu informativ și atractiv din punct de vedere vizual pentru a prezenta datele într-un format de grafic statistic. Într-o hartă termică creată folosind seaborn, o paletă de culori prezintă variația datelor aferente. Dacă sunteți începător și doriți să obțineți experiență în știința datelor, consultați cursurile noastre de știință a datelor.
Pași pentru a crea o hartă termică în Python
Următorii pași oferă o schiță aproximativă a modului de a crea o hartă termică simplă în Python:
- Importați toate pachetele necesare
- Importați fișierul în care ați stocat datele
- Trasează harta termică
- Afișați harta termică folosind matplotlib
Acum, permiteți-ne să vă arătăm cum seaborn, împreună cu matplotlib și panda, poate fi folosit pentru a genera o hartă termică.
În acest exemplu, vom construi o hartă termică pe mare în Python pentru 30 de acțiuni ale companiilor farmaceutice. Harta termică rezultată va afișa simbolurile bursiere și modificarea procentuală a prețului pe o singură zi. Vom începe prin a colecta datele pieței privind acțiunile farmaceutice și vom crea un fișier CSV (Comma-separated Value) format din simbolurile bursiere și modificarea procentuală corespunzătoare a prețului în primele două coloane ale fișierului CSV menționat.
Deoarece lucrăm cu 30 de companii farmaceutice, vom construi o matrice de hărți termice care cuprinde 6 rânduri și 5 coloane. În plus, dorim ca harta termică să ilustreze modificarea procentuală a prețului în ordine descrescătoare. Deci, vom aranja stocurile în fișierul CSV în ordine descrescătoare și vom adăuga încă două coloane pentru a indica poziția fiecărui stoc pe axele X și Y ale hărții maritime.
Pasul 1: Importul pachetelor Python.
Sursă
Pasul 2: Încărcarea setului de date.
Setul de date este citit folosind funcția read_csv de la panda. În plus, folosim instrucțiunea print pentru a vizualiza primele 10 rânduri.

Sursă
Pasul 3: Crearea unei matrice Python Numpy.
Ținând cont de matricea 6 x 5, vom crea o matrice n-dimensională pentru coloanele „Simbol” și „Modificare”.
Sursă
Pasul 4: Crearea unui pivot în Python.
Din obiectul cadru de date dat „df”, funcția pivot creează un nou tabel derivat. Funcția pivot ia trei argumente – index, coloane și valori. Valorile celulelor noului tabel sunt preluate din coloana „Modificare”.
Sursă
Pasul 5: Crearea unei matrice pentru adnotarea hărții termice.
Următorul pas este să creați o matrice pentru adnotarea hărții de căldură pe mare. Pentru aceasta, vom numi metoda de aplatizare pe tablouri „procent” și „simbol” pentru a aplatiza o listă Python de liste într-o singură linie. În plus, funcția zip arhivează o listă în Python. Vom rula o buclă Python for și vom folosi funcția de format pentru a formata simbolurile bursiere și valorile procentuale de modificare a prețului, după cum este necesar.
Sursă
Pasul 6: Crearea figurii matplotlib și definirea plotului.
În acest pas, vom crea un grafic matplotlib gol și vom defini dimensiunea figurii. În plus, vom adăuga titlul complotului, vom seta dimensiunea fontului titlului și vom fixa distanța acestuia față de complot folosind metoda set_position. În cele din urmă, deoarece dorim să afișăm doar simbolurile bursiere și modificarea procentuală a prețului pe o singură zi corespunzătoare, vom ascunde bifările pentru axele X și Y și vom elimina axele din grafic.
Sursă
Pasul 7: Crearea hărții termice
În ultimul pas, vom folosi funcția heatmap din pachetul seaborn Python pentru a crea heatmap. Funcția heatmap a pachetului seaborn Python ia următorul set de argumente:
Date :
Este un set de date bidimensional care poate fi forțat într-o matrice. Având un Pandas DataFrame, rândurile și coloanele vor fi etichetate folosind informațiile de index/coloană.
Annot :
Este o matrice de aceeași formă ca și datele și adnotă harta termică.
cmap:
Este un obiect matplotlib sau un nume de hartă de culori și mapează valorile datelor la spațiul de culoare.
Fmt :
Este un cod de formatare a șirurilor de caractere utilizat atunci când adăugați adnotări.
Lățimi de linii:
Setează lățimea liniilor care împart fiecare celulă.
Sursă
Rezultatul final al hărții de căldură pe mare pentru companiile farmaceutice alese va arăta astfel:
Sursă
Cale înainte: învață Python cu programul de certificat profesional upGrad în știința datelor
Programul de certificat profesional în știința datelor pentru luarea deciziilor în afaceri este un program online riguros, de 8 luni, care se concentrează pe știința datelor și conceptele de învățare automată, cu accent deosebit pe aplicațiile lor de afaceri din lumea reală. Programul este conceput categoric pentru manageri și profesioniști care doresc să dezvolte cunoștințele practice și abilitățile științei datelor care îi vor ajuta să ia decizii de afaceri strategice și bazate pe date.
Iată câteva momente importante ale cursului:
- Recunoaștere de prestigiu din partea IIM Kozhikode
- Peste 200 de ore de conținut
- 3 proiecte industriale și o piatră de temelie
- Peste 20 de sesiuni de învățare live
- Peste 5 sesiuni de coaching expert
- Acoperire pentru Excel, Tableau, Python, R și Power BI
- Unu-la-unu cu mentori din industrie
- Suport în carieră la 360 de grade
- Asistență pentru locuri de muncă cu firme de top
Înscrieți-vă la upGrad și perfecționați-vă abilitățile de hărți termice Python pentru toate nevoile dvs. de vizualizare a datelor!
Concluzie
Statisticienii și analiștii de date folosesc o multitudine de instrumente și tehnici pentru a sorta datele adunate și pentru a le prezenta într-un mod ușor de înțeles și ușor de utilizat. În acest sens, hărțile termice ca tehnică de vizualizare a datelor au ajutat companiile din toate sectoarele să vizualizeze și să înțeleagă mai bine datele.
Pentru a rezuma, hărțile termice au fost utilizate pe scară largă și sunt încă folosite ca unul dintre instrumentele statistice și analitice alese. Acest lucru se datorează faptului că oferă un mod vizual atractiv și accesibil de prezentare a datelor, sunt ușor de înțeles, versatile, adaptabile și elimină etapele obositoare ale proceselor tradiționale de analiză și interpretare a datelor prin prezentarea tuturor valorilor într-un singur cadru.
Cum trasezi o hartă termică?
O hartă termică este o modalitate standard de a reprezenta datele grupate într-un format grafic bidimensional. Ideea de bază din spatele trasării unei hărți termice este că graficul este împărțit în pătrate sau dreptunghiuri, fiecare reprezentând o celulă din tabelul de date, un set de date și un rând. Pătratul sau dreptunghiul este codificat în culori în funcție de valoarea acelei celule din tabel.
O hartă termică arată corelație?
O hartă termică a corelației este o reprezentare grafică a unei matrice de corelație care ilustrează corelația dintre diferite variabile. Hărțile termice de corelare sunt foarte eficiente dacă sunt utilizate în mod corespunzător, deoarece variabilele foarte corelate pot fi identificate cu ușurință.
De ce se folosește seaborn în Python?
Seaborn este o bibliotecă Python open-source bazată pe matplotlib. Este folosit pentru analiza și vizualizarea exploratorie a datelor și funcționează cu ușurință cu cadre de date și cu biblioteca Pandas. În plus, graficele create folosind seaborn sunt ușor de personalizat.