Crearea Heatmap cu Python

Publicat: 2023-01-02

O hartă termică constă din valori care prezintă diferite nuanțe ale unei singure culori pentru valori individuale care urmează să fie reprezentate. În general, nuanțele mai închise ale diagramei reprezintă valori care sunt mai mari decât nuanța mai deschisă. Pentru o valoare distinct diferită, poate fi folosită și o culoare total diferită. Valorile datelor sunt afișate cu ajutorul culorilor în grafic. Scopul principal al unei hărți termice este de a oferi o listă vizuală colorată a informațiilor date. O hartă termică (sau hartă termică) este o tehnică de vizualizare a datelor care afișează magnitudinea unui fenomen sub formă de culoare în două dimensiuni. O hartă termică, mai exact, este o tehnică de vizualizare a datelor care utilizează culoarea pentru a arăta modul în care o valoare de interes variază pe baza valorilor celorlalte două variabile. Pentru a rezuma, utilizarea diferitelor culori pentru a reprezenta datele vă oferă o vedere generală a datelor numerice. În plus, harta termică Python include executarea analizei cluster, regularizarea matricelor, alegerea unei anumite palete de culori, precum și comutarea rândurilor și coloanelor pentru a plasa valori similare în apropiere.

De exemplu, puteți folosi o hartă termică pentru a înțelege cum se schimbă exact poluarea aerului în funcție de ora din zi într-un set de orașe.

O hartă termică a site-ului web poate fi înțeleasă în două moduri: prin vizualizarea vizualizării și prin revizuirea punctelor de date brute. Tendințele și problemele de clic pot fi observate dintr-o privire din cauza naturii codificate prin culori a hărților termice (roșul indică cea mai mare interacțiune, albastru cel mai puțin).

O hartă termică 2-D este un instrument de vizualizare a datelor care permite reprezentarea amplitudinii fenomenului sub formă de culori. În Python, hărțile termice 2-D pot fi reprezentate folosind pachetul Matplotlib. Există mai multe metode care pot fi folosite pentru a reprezenta hărțile termice 2-D. unele dintre ele sunt discutate mai jos.

Consultați cursurile noastre de știință a datelor pentru a vă perfecționa.

Cuprins

Metoda 1: Utilizarea funcției matplotlib.pyplot.imshow().

Sintaxă: matplotlib.pyplot.imshow(X, cmap=None, norm=None, aspect=None, interpolation=None, alpha=None, vmin=None,

vmax=Niciuna, origine=Niciuna, extindere=Niciuna, forma=<parametru depreciat>, filternorm=1, filterrad=4.0,

imlim=<parametru depreciat>, resample=Niciunul, url=Niciuna, \, date=Niciuna, \\*kwargs)

Metoda 2: Utilizarea bibliotecii Seaborn

Pentru aceasta folosim funcția seaborn.heatmap().

Sintaxă: seaborn.heatmap(data, *, vmin=None, vmax=None, cmap=None, center=None, robust=False,annot=None,

fmt='.2g', annot_kws=Niciuna, linewidths=0, linecolor='white', cbar=True, cbar_kws=None, cbar_ax=Niciuna,

square=False, xticklabels='auto', yticklabels='auto', mask=Niciunul, ax=Niciunul, **kwargs)

Explorați cursurile noastre populare de știință a datelor

Program Executive Postuniversitar în Știința Datelor de la IIITB Program de certificat profesional în știința datelor pentru luarea deciziilor de afaceri Master în Știința Datelor de la Universitatea din Arizona
Program de certificat avansat în știința datelor de la IIITB Program de certificat profesional în știința datelor și analiză de afaceri de la Universitatea din Maryland Cursuri de știință a datelor

Metoda 3: Utilizarea funcției matplotlib.pyplot.pcolormesh().

Sintaxă: matplotlib.pyplot.pcolormesh(*args, alpha=None, norm=None, cmap=None, vmin=None, vmax=None,

shading='plat', antialiased=False, date=Niciunul, **kwargs)

Seaborn este o bibliotecă Python care ne permite să creăm cu ușurință diagrame mai bune, cu ajutorul funcției heatmap(). Această secțiune începe cu o postare care explică utilizarea fundamentală a funcției pe baza oricărui tip de date introduse. Apoi, vă va ghida prin diferitele moduri de a personaliza diagrama, cum ar fi controlul culorilor și normalizarea datelor.

De obicei, folosim câteva tehnici de grupare pe o hartă termică. Acest lucru se face pentru a grupa elementele care au un tip similar pentru variabilele lor numerice.

În general, se recomandă afișarea unei dendrograme (O dendrogramă este o diagramă care arată relația ierarhică dintre obiecte. De obicei, este realizată sub formă de ieșire din clustering ierarhic. Funcția principală a unei dendrograme este de a afla cel mai potrivit mod pentru a aloca obiecte clusterelor.) pe

partea de sus a hărții termice pentru a descrie modul în care a fost realizată clusterizarea. Nu în ultimul rând, poate fi util să comparăm gruparea pe care am obținut-o cu o structură așteptată, afișată ca o culoare suplimentară.

Cum se interpretează o hartă termică în Python:

Cele mai bune abilități de știință a datelor de învățat în 2022

SL. Nu Cele mai bune abilități de știință a datelor de învățat în 2022
1 Curs Analiza Datelor Cursuri de Statistică Inferenţială
2 Programe de testare a ipotezelor Cursuri de regresie logistică
3 Cursuri de regresie liniară Algebră liniară pentru analiză

Vizualizarea datelor Python — Hărți termice

  1. import panda ca pd. import numpy ca np. import matplotlib .pyplot ca plt.
  2. fig, ax = plt.subplots(figsize=(10,6)) sns. heatmap (data.corr(), center=0, cmap='Blues') ax.set_title('Multi-Colinearity of Car Attributes') 3. fig, ax = plt.subplots(figsize=(10,6)) sns . heatmap (data.corr(), center=0, cmap='BrBG', annot=True)

Cum se creează o hartă termică:

  1. Încărcați setul de date.
  2. Creați o matrice Python Numpy.
  3. Produceți un Pivot în Python.
  4. Modelați o matrice pentru adnotarea hărții termice .
  5. Construiți figura Matplotlib și definiți diagrama .
  6. Construiți harta termică.

Acum, întrebarea este, cum puteți crește dimensiunea adnotărilor unei hărți termice de pe mare în Python? Este simplu – Un seaborn poate fi explicat în termenii unei biblioteci Python care se bazează pe matplotlib și este de fapt folosită pentru vizualizarea datelor.

Citiți articolele noastre populare despre știința datelor

Calea de carieră în știința datelor: un ghid cuprinzător de carieră Creșterea carierei în știința datelor: viitorul muncii este aici De ce este importantă știința datelor? 8 moduri în care știința datelor aduce valoare afacerii
Relevanța științei datelor pentru manageri Ultima fișă pentru știința datelor pe care ar trebui să o aibă fiecare cercetător de date Top 6 motive pentru care ar trebui să devii un Data Scientist
O zi în viața omului de știință a datelor: ce fac ei? Mitul distrus: Știința datelor nu are nevoie de codare Business Intelligence vs Data Science: Care sunt diferențele?

Abordare

  • Modul de importat
  • Încărcați sau produceți date
  • Apelați funcția heatmap () cu annot setat la True.
  • Dimensiunea trebuie personalizată la parametrul annot_kws
  • Parcela care urmează să fie expusă

Schimbarea culorii hărții termice:

Culoarea hărții termice seaborn poate fi schimbată utilizând atributul cmap al hărții de căldură al hărții de culori.

Tipuri de hărți termice:

Există de obicei două tipuri de hărți termice:

  1. Harta termică grilă: există o magnitudine de valori afișate prin culori care sunt așezate într-o matrice de rânduri, precum și de coloane, cel mai frecvent printr -o funcție bazată pe densitate. Mai jos sunt enumerate câteva hărți termice Grid
  • Clustered heatmap – Scopul absolut al hărții clustered heatmap este de a construi pur și simplu asocieri între atât caracteristici, cât și puncte de date. Acesta este genul de hartă termică care implementează gruparea ca parte a procesului de grupare a caracteristicilor de natură similară.

Hărțile termice grupate sunt, de asemenea, utilizate pe scară largă în științele biologice pentru a studia asemănările genelor la diverși indivizi.

  • Hartă termică spațială – O hartă termică are mai multe pătrate și fiecărui pătrat dintr- o hartă termică i se atribuie de fapt o reprezentare de culoare pe baza valorii celulelor din apropiere. Însăși locația culorii se bazează pe mărimea valorii în spațiul respectiv. Aceste hărți termice sunt de fapt o pânză de vopsea prin numere bazată pe date care este acoperită deasupra unei imagini. Celulelor care au o valoare mai mare decât alte celule li se atribuie o culoare fierbinte, în timp ce celulelor care au valori mai mici li se atribuie o culoare rece.

UTILIZĂRI ALE HĂRȚILOR DE căldură:

  • Analiză de afaceri: o hartă termică este utilizată ca instrument de analiză vizuală a afacerilor și oferă indicii vizuale foarte rapide despre performanța curentă, rezultate, precum și orice posibilitate de îmbunătățire. De asemenea, hărțile termice pot analiza datele existente și pot găsi zone de intensitate care ar putea reflecta locul în care locuiesc majoritatea clienților. Hărțile termice pot fi, de asemenea, actualizate continuu pentru a reflecta creșterea și eforturile. Aceste hărți pot fi, de asemenea, integrate în fluxul de lucru al unei afaceri și, prin urmare, pot deveni o parte a analizei continue. Aceste

prezentați datele într-o manieră plăcută din punct de vedere vizual și, de asemenea, ușurează înțelegerea și comunicarea membrilor echipei sau clienților.

  • Site web: hărțile termice sunt de fapt utilizate pe site-uri web pentru a vizualiza datele vizitatorilor. Acest tip de vizualizare îi ajută pe proprietarii de afaceri, precum și pe agenții de marketing, să identifice secțiunea cea mai bună, precum și cea cu cele mai slabe performanțe ale unei anumite pagini web. Aceste viziuni îi ajută, de asemenea, să își optimizeze mai bine site-ul web.
  • Analiza exploratorie a datelor: Aceasta este, de asemenea, cunoscută sub numele de EDA și este o sarcină care este efectuată de oamenii de știință de date pentru a se familiariza cu toate datele. De fapt, toate studiile inițiale sunt făcute pentru a înțelege datele cunoscute sub numele de EDA . Poate fi explicat și ca procesul de analiză a seturilor de date înainte de începerea sarcinii de modelare. De fapt, este o sarcină destul de plictisitoare să te uiți la o foaie de calcul plină cu numere pentru a determina caracteristicile importante dintr-un set de date. Astfel, EDA se face cu scopul de a rezuma caracteristicile și specificațiile lor principale, adesea cu metode vizuale, care include și hărți termice. Acestea sunt o modalitate captivantă de a vizualiza relațiile dintre variabile într-un spațiu de dimensiuni mari. Acest lucru se poate face cu ușurință utilizând variabilele caracteristice ca antete de rând, precum și antete de coloană.
  • Biologie moleculară : hărțile termice sunt utilizate pentru a studia disparitățile, precum și modelele de similaritate în ARN, ADN etc.
  • Geovizualizare : Diagramele cu hărți geospațiale sunt destul de utile atunci când vine vorba de afișarea modului în care zonele geografice ale unei hărți sunt comparate între ele pe baza unor criterii specifice. Hărțile termice ajută, de asemenea, la analiza clusterelor sau la analiza punctelor fierbinți pentru a detecta grupuri cu concentrații mari de activitate. Luați, de exemplu, analiza prețului de închiriere Airbnb!
  • Marketing și vânzări: capacitatea unei hărți termice de a detecta punctele reci, precum și cele calde, este utilizată pentru a crește ratele de răspuns de marketing prin marketing direcționat. Hărțile termice facilitează, de asemenea, detectarea zonelor care răspund la campanii, piețe slab deservite, rezidența clienților, precum și tendințe înalte de vânzări - acestea ajută la îmbunătățirea gamei de produse, la valorificarea vânzărilor și la construirea de segmente de clienți vizate, analizând și demografiile regionale.

Concluzie

Deși există multe scheme de culori diferite care pot ilustra harta termică, aceasta vine, de asemenea, cu un set de avantaje perceptuale , precum și dezavantaje pentru fiecare. Opțiunile paletei de culori depășesc de fapt doar aspectul estetic, mai ales că culorile din harta termică dezvăluie modele în date. De fapt, schemele de culori bune pot îmbunătăți descoperirea modelelor. Cu toate acestea, alegerile proaste o pot ascunde de fapt . În plus, hărțile termice seaborn sunt hărțile termice ale grilei care pot prelua de fapt diferite tipuri de date pentru a genera hărți termice. Prin urmare, scopul principal al hărții de căldură pe mare este de a arăta pur și simplu matricea de corelație prin vizualizarea datelor. De asemenea, ajută la găsirea relației dintre mai multe caracteristici, precum și care sunt cele mai bune caracteristici pentru construirea modelelor de învățare automată.

Dacă doriți să vă aprofundați în lucrul cu Python, în special pentru știința datelor, upGrad vă oferă Executive PGP în Data Science. Acest program este conceput pentru profesioniști IT de nivel mediu, ingineri software care doresc să exploreze știința datelor, analiști non-tech, profesioniști de la începutul carierei etc. Curriculumul nostru structurat și sprijinul extins asigură că studenții noștri își ating întregul potențial fără dificultăți.

Vrei să distribui acest articol?

Pregătiți-vă pentru o carieră a viitorului

Aplicați pentru Master of Science în Data Science - LJMU & IIIT Bangalore