Creazione di mappe di calore con Python
Pubblicato: 2023-01-02Una mappa termica è costituita da valori che presentano diverse sfumature di un colore per i singoli valori da tracciare. Generalmente, le tonalità più scure del grafico rappresentano valori superiori rispetto alla tonalità più chiara. Per un valore nettamente diverso, può essere utilizzato anche un colore totalmente diverso. I valori dei dati vengono visualizzati con l'aiuto dei colori nel grafico. Lo scopo principale di una heatmap è quello di fornire un elenco visivo colorato delle informazioni fornite. Una mappa termica (o heatmap) è una tecnica di visualizzazione dei dati che mostra l'entità di un fenomeno come colore in due dimensioni. Una heatmap, per la precisione, è una tecnica di visualizzazione dei dati che fa uso del colore per mostrare come varia un valore di interesse in base ai valori delle altre due variabili. Per riassumere, l'utilizzo di colori diversi per rappresentare i dati offre una visione generale dei dati numerici. Oltre a ciò, la mappa termica di Python include l'esecuzione dell'analisi dei cluster, la regolarizzazione delle matrici, la scelta di una determinata tavolozza di colori e la commutazione di righe e colonne per posizionare valori simili nelle vicinanze.
Ad esempio, potresti utilizzare una mappa di calore per capire come cambia esattamente l'inquinamento atmosferico in base all'ora del giorno in un insieme di paesi e città.
Una mappa termica di un sito Web può essere compresa in due modi: osservando la visualizzazione e rivedendo i punti dati grezzi. Le tendenze e i problemi relativi ai clic possono essere notati a colpo d'occhio a causa della natura codificata a colori delle mappe di calore (il rosso indica la maggiore interazione, il blu la minore).
Una Heatmap 2-D è uno strumento di visualizzazione dei dati che consente la rappresentazione dell'entità del fenomeno sotto forma di colori. In Python, le mappe di calore 2D possono essere tracciate utilizzando il pacchetto Matplotlib. Esistono diversi metodi che possono essere impiegati per tracciare mappe di calore 2D. alcuni di essi sono discussi di seguito.
Dai un'occhiata ai nostri corsi di scienza dei dati per migliorare te stesso.
Sommario
Metodo 1: utilizzo della funzione matplotlib.pyplot.imshow()
Sintassi: matplotlib.pyplot.imshow(X, cmap=None, norm=None, aspect=None, interpolation=None, alpha=None, vmin=None,
vmax=None, origin=None, extent=None, shape=<parametro obsoleto>, filternorm=1, filterrad=4.0,
imlim=<parametro deprecato>, resample=Nessuno, url=Nessuno, \, data=Nessuno, \\*kwargs)
Metodo 2: utilizzo della libreria Seaborn
Per questo usiamo la funzione seaborn.heatmap()
Sintassi: seaborn.heatmap(data, *, vmin=None, vmax=None, cmap=None, center=None, robust=False,annot=None,
fmt='.2g', annot_kws=None, linewidths=0, linecolor='white', cbar=True, cbar_kws=None, cbar_ax=Nessuno,
square=False, xticklabels='auto', yticklabels='auto', mask=Nessuno, ax=Nessuno, **kwargs)
Esplora i nostri popolari corsi di scienza dei dati
Executive Post Graduate Program in Data Science presso IIITB | Programma di certificazione professionale in Data Science per il processo decisionale aziendale | Master of Science in Data Science presso l'Università dell'Arizona |
Programma di certificazione avanzata in Data Science da IIITB | Programma di certificazione professionale in scienza dei dati e analisi aziendale presso l'Università del Maryland | Corsi di scienza dei dati |
Metodo 3: utilizzo della funzione matplotlib.pyplot.pcolormesh()
Sintassi: matplotlib.pyplot.pcolormesh(*args, alpha=None, norm=None, cmap=None, vmin=None, vmax=None,
shading='flat', antialiased=False, data=Nessuno, **kwargs)
Seaborn è una libreria Python che ci consente di creare grafici migliori con facilità, con l'aiuto della sua funzione heatmap(). Questa sezione inizia con un post che spiega l'utilizzo fondamentale della funzione in base a qualsiasi tipo di input di dati. Quindi, ti guiderà attraverso i vari modi per personalizzare il grafico, come il controllo del colore e la normalizzazione dei dati.
Di solito, utilizziamo alcune tecniche di clustering su una heatmap. Questo viene fatto per raggruppare elementi che hanno un modello simile per le loro variabili numeriche.
In generale, si consiglia di visualizzare un dendrogramma (Un dendrogramma è un diagramma che mostra la relazione gerarchica tra gli oggetti. È tipicamente realizzato sotto forma di output dal raggruppamento gerarchico. La funzione principale di un dendrogramma è scoprire il modo più adatto per allocare oggetti ai cluster.) on
parte superiore della heatmap per descrivere come è stata eseguita la clusterizzazione. Ultimo ma non meno importante, può essere utile confrontare il raggruppamento che abbiamo ottenuto con una struttura prevista, mostrata come colore aggiuntivo.
Come interpretare una heatmap in Python:
Le migliori competenze nel campo della scienza dei dati da apprendere nel 2022
SL. No | Le migliori competenze nel campo della scienza dei dati da apprendere nel 2022 | |
1 | Corso di analisi dei dati | Corsi di statistica inferenziale |
2 | Programmi di verifica delle ipotesi | Corsi di regressione logistica |
3 | Corsi di regressione lineare | Algebra lineare per l'analisi |
Visualizzazione dei dati in Python: mappe di calore
- importa panda come pd. importa numpy come np. importa matplotlib .pyplot come plt. …
- fig, ax = plt.subplots(figsize=(10,6)) sns. heatmap (data.corr(), center=0, cmap='Blues') ax.set_title('Multi-collinearità degli attributi dell'auto') 3. fig, ax = plt.subplots(figsize=(10,6)) sns . heatmap (data.corr(), center=0, cmap='BrBG', annot=True)
Come creare una mappa termica:
- Carica il set di dati.
- Crea un array Python Numpy.
- Produrre un pivot in Python.
- Crea un array per annotare la mappa di calore .
- Costruisci la figura Matplotlib e definisci il grafico .
- Costruisci la mappa termica.
Ora, la domanda è: come puoi aumentare la dimensione delle annotazioni di una heatmap nata dal mare in Python ? È semplice: un Seaborn può essere spiegato in termini di una libreria Python basata su matplotlib ed è effettivamente utilizzata per la visualizzazione dei dati.
Leggi i nostri popolari articoli sulla scienza dei dati
Percorso di carriera nella scienza dei dati: una guida completa alla carriera | Crescita della carriera nella scienza dei dati: il futuro del lavoro è qui | Perché la scienza dei dati è importante? 8 modi in cui la scienza dei dati apporta valore al business |
Rilevanza della scienza dei dati per i manager | Il foglio informativo definitivo sulla scienza dei dati che ogni scienziato di dati dovrebbe avere | I 6 motivi principali per cui dovresti diventare un data scientist |
Un giorno nella vita dei data scientist: cosa fanno? | Mito sfatato: la scienza dei dati non ha bisogno di codifica | Business Intelligence vs Data Science: quali sono le differenze? |
Approccio
- Modulo da importare
- Caricare o produrre dati
- Chiama la funzione heatmap () con annot impostato su True.
- La dimensione deve essere personalizzata in base al parametro annot_kws
- Trama da esporre
Modifica del colore della mappa di calore:
Il colore della mappa termica di Seaborn può essere modificato utilizzando l'attributo cmap della mappa dei colori della mappa termica.
Tipi di mappe di calore:
Esistono in genere due tipi di mappe di calore:
- Mappa di calore della griglia: esiste una grandezza di valori mostrati attraverso i colori che sono disposti in una matrice di righe e colonne, più comunemente da una funzione basata sulla densità. Di seguito sono elencate alcune mappe di calore Grid
- Mappa termica in cluster: l'obiettivo puro e semplice della mappa termica in cluster è creare semplicemente associazioni tra le caratteristiche e i punti dati. Questo è il tipo di heatmap che implementa il clustering come parte del processo di raggruppamento di funzionalità di natura simile.
Le mappe di calore raggruppate sono anche ampiamente utilizzate nelle scienze biologiche per studiare le somiglianze genetiche tra vari individui.
- Mappa termica spaziale: una mappa termica ha diversi quadrati e a ogni quadrato in una mappa termica viene effettivamente assegnata una rappresentazione cromatica sulla base del valore delle celle vicine. La posizione stessa del colore si basa sulla grandezza del valore nello spazio particolare. Queste mappe di calore sono in realtà una tela dipinta dai dati basata sui numeri che è coperta sopra un'immagine. Alle celle che hanno un valore più alto rispetto alle altre celle viene assegnato un colore caldo, mentre alle celle che hanno valori più bassi viene assegnato un colore freddo.
USI DELLE MAPPE DI CALORE:
- Analisi aziendale: una mappa termica viene utilizzata come strumento di analisi aziendale visiva e fornisce indicazioni visive molto rapide sulle prestazioni attuali, sui risultati e su qualsiasi possibilità di miglioramento. Le mappe di calore possono anche analizzare i dati esistenti e trovare aree di intensità che potrebbero riflettere dove risiede la maggior parte dei clienti. Le mappe di calore possono anche essere continuamente aggiornate per riflettere la crescita e gli sforzi. Queste mappe possono anche essere integrate nel flusso di lavoro di un'azienda e quindi diventare parte dell'analisi continua. Questi
presentare i dati in modo visivamente piacevole e facilita anche la comprensione e la comunicazione ai membri del team o ai clienti.
- Sito Web: le mappe di calore vengono effettivamente utilizzate nei siti Web per visualizzare i dati dei visitatori. Questo tipo di visualizzazione aiuta gli imprenditori, così come i professionisti del marketing, a identificare la sezione migliore e quella con le peggiori prestazioni di una determinata pagina web. Queste visioni li aiutano anche a ottimizzare meglio il loro sito web.
- Analisi esplorativa dei dati: questa è anche nota come EDA ed è un'attività che viene eseguita dai data scientist per acquisire familiarità con tutti i dati. Infatti, tutti gli studi iniziali sono fatti per comprendere i dati noti come EDA . Può anche essere spiegato come il processo di analisi dei set di dati prima dell'inizio dell'attività di modellazione. In effetti, è un compito piuttosto noioso guardare un foglio di calcolo pieno di numeri per determinare caratteristiche importanti in un set di dati. Pertanto, l'EDA viene eseguito per riassumere le loro principali caratteristiche e specifiche, spesso con metodi visivi, che includono anche mappe di calore. Questi sono un modo accattivante di visualizzare le relazioni tra le variabili in uno spazio ad alta dimensione. Questo può essere fatto facilmente usando le variabili feature come intestazioni di riga e di colonna.
- Biologia molecolare : le mappe di calore vengono utilizzate per studiare la disparità e i modelli di somiglianza nell'RNA, nel DNA, ecc.
- Geovisualizzazione : i grafici delle mappe termiche geospaziali sono molto utili quando si tratta di visualizzare come le aree geografiche di una mappa vengono confrontate tra loro sulla base di criteri specifici. Le mappe di calore aiutano anche nell'analisi dei cluster o nell'analisi degli hotspot per rilevare cluster di alte concentrazioni di attività. Prendi, ad esempio, l'analisi dei prezzi degli affitti di Airbnb!
- Marketing e vendite: la capacità di una mappa termica di rilevare punti freddi e caldi viene utilizzata per far avanzare i tassi di risposta del marketing mediante un marketing mirato. Le mappe di calore facilitano anche il rilevamento di aree che rispondono a campagne, mercati poco serviti, residenza dei clienti e tendenze di vendita elevate: questi aiutano a migliorare le linee di prodotti, a capitalizzare le vendite e a creare segmenti di clienti mirati, analizzando anche i dati demografici regionali.
Conclusione
Sebbene ci siano molti schemi di colori diversi che possono illustrare la mappa di calore, presenta anche una serie di vantaggi percettivi e svantaggi per ciascuno. Le scelte della tavolozza dei colori in realtà vanno oltre la semplice estetica, soprattutto perché i colori nella heatmap rivelano schemi nei dati. In effetti, buone combinazioni di colori possono migliorare la scoperta del modello. Tuttavia, scelte sbagliate possono effettivamente nasconderlo . Oltre a questo, le mappe di calore marine sono le mappe di calore della griglia che possono effettivamente prendere vari tipi di dati per generare mappe di calore. Pertanto, lo scopo principale della mappa di calore nata dal mare è semplicemente mostrare la matrice di correlazione mediante la visualizzazione dei dati. Aiuta anche a trovare la relazione tra più funzionalità e quali funzionalità sono le migliori per la creazione di modelli di machine learning.
Se desideri approfondire il lavoro con Python, in particolare per la scienza dei dati, upGrad ti offre Executive PGP in Data Science. Questo programma è progettato per professionisti IT di medio livello, ingegneri del software che desiderano esplorare la scienza dei dati, analisti non tecnologici, professionisti all'inizio della carriera, ecc. Il nostro curriculum strutturato e l'ampio supporto assicurano che i nostri studenti raggiungano il loro pieno potenziale senza difficoltà.