Heatmap mit Python erstellen

Veröffentlicht: 2023-01-02

Eine Heatmap besteht aus Werten, die unterschiedliche Schattierungen einer Farbe für einzelne darzustellende Werte aufweisen. Im Allgemeinen stellen die dunkleren Schattierungen des Diagramms Werte dar, die höher sind als die helleren Schattierungen. Für einen deutlich anderen Wert kann auch eine ganz andere Farbe verwendet werden. Die Datenwerte werden mit Hilfe von Farben in der Grafik dargestellt. Das Hauptziel einer Heatmap ist es, eine farbige visuelle Liste der gegebenen Informationen bereitzustellen. Eine Heatmap (oder Heatmap) ist eine Datenvisualisierungstechnik, die das Ausmaß eines Phänomens als Farbe in zwei Dimensionen anzeigt. Eine Heatmap, um genau zu sein, ist eine Technik der Datenvisualisierung, die Farbe verwendet, um darzustellen, wie ein interessierender Wert auf der Grundlage der Werte der beiden anderen Variablen variiert. Zusammenfassend lässt sich sagen, dass Sie durch die Verwendung verschiedener Farben zur Darstellung von Daten einen allgemeinen Überblick über die numerischen Daten erhalten. Darüber hinaus umfasst die Python-Heatmap das Ausführen von Clusteranalysen, das Regularisieren der Matrizen, das Auswählen einer bestimmten Farbpalette sowie das Pendeln von Zeilen und Spalten, um ähnliche Werte in der Nähe zu platzieren.

Sie könnten beispielsweise eine Heatmap verwenden, um zu verstehen, wie sich die Luftverschmutzung je nach Tageszeit in einer Reihe von Städten und Gemeinden genau ändert.

Eine Website-Heatmap kann auf zwei Arten verstanden werden: durch Anzeigen der Visualisierung und durch Überarbeiten der Rohdatenpunkte. Klicktrends und Probleme sind aufgrund der farbcodierten Natur von Heatmaps auf einen Blick erkennbar (Rot zeigt die meisten Interaktionen an, Blau die wenigsten).

Eine 2D-Heatmap ist ein Datenvisualisierungstool, das die Darstellung des Ausmaßes des Phänomens in Form von Farben ermöglicht. In Python können 2D-Heatmaps mit dem Matplotlib-Paket geplottet werden. Es gibt mehrere Methoden, die zum Zeichnen von 2-D-Heatmaps verwendet werden können. einige von ihnen werden unten besprochen.

Sehen Sie sich unsere Data-Science-Kurse an, um sich weiterzubilden.

Inhaltsverzeichnis

Methode 1: Verwenden der Funktion matplotlib.pyplot.imshow()

Syntax: matplotlib.pyplot.imshow(X, cmap=Keine, Norm=Keine, Aspekt=Keine, Interpolation=Keine, alpha=Keine, vmin=Keine,

vmax=Keine, Ursprung=Keine, Ausdehnung=Keine, Form=<veralteter Parameter>, Filternorm=1, Filterrad=4.0,

imlim=<veralteter Parameter>, resample=Keine, url=Keine, \, data=Keine, \\*kwargs)

Methode 2: Verwenden der Seaborn Library

Dazu verwenden wir die Funktion seaborn.heatmap()

Syntax: seaborn.heatmap(data, *, vmin=Keine, vmax=Keine, cmap=Keine, center=Keine, robust=Falsch,annot=Keine,

fmt='.2g', annot_kws=Keine, Linienbreiten=0, Linienfarbe='white', cbar=True, cbar_kws=Keine, cbar_ax=Keine,

square=False, xticklabels='auto', yticklabels='auto', mask=None, ax=None, **kwargs)

Entdecken Sie unsere beliebten Data Science-Kurse

Executive Post Graduate Program in Data Science vom IIITB Professional Certificate Program in Data Science für die Entscheidungsfindung in Unternehmen Master of Science in Data Science von der University of Arizona
Advanced Certificate Program in Data Science vom IIITB Professional Certificate Program in Data Science und Business Analytics von der University of Maryland Data Science-Kurse

Methode 3: Verwenden der Funktion matplotlib.pyplot.pcolormesh()

Syntax: matplotlib.pyplot.pcolormesh(*args, alpha=Keine, norm=Keine, cmap=Keine, vmin=Keine, vmax=Keine,

shading='flat', antialiased=False, data=None, **kwargs)

Seaborn ist eine Python-Bibliothek, die es uns ermöglicht, mit Hilfe ihrer Funktion heatmap() auf einfache Weise bessere Diagramme zu erstellen. Dieser Abschnitt beginnt mit einem Beitrag, der die grundlegende Verwendung der Funktion basierend auf jeder Art von Dateneingabe erklärt. Anschließend werden Sie durch die verschiedenen Möglichkeiten zum Anpassen des Diagramms geführt, z. B. durch Steuern der Farbe und Datennormalisierung.

Normalerweise verwenden wir einige Clustering-Techniken auf einer Heatmap. Dies geschieht, um Elemente mit einer ähnlichen Art von Muster für ihre numerischen Variablen zu gruppieren.

Im Allgemeinen wird empfohlen, ein Dendrogramm anzuzeigen (Ein Dendrogramm ist ein Diagramm, das die hierarchische Beziehung zwischen Objekten zeigt. Es wird normalerweise in Form einer Ausgabe von hierarchischem Clustering erstellt. Die Hauptfunktion eines Dendrogramms besteht darin, den am besten geeigneten Weg zu finden um Objekte Clustern zuzuweisen.) an

oben auf der Heatmap, um zu beschreiben, wie die Clusterisierung durchgeführt wurde. Zu guter Letzt kann es hilfreich sein, die erhaltene Gruppierung mit einer erwarteten Struktur zu vergleichen, die als zusätzliche Farbe angezeigt wird.

So interpretieren Sie eine Heatmap in Python:

Die besten datenwissenschaftlichen Fähigkeiten, die Sie 2022 lernen können

SL. Nein Die besten datenwissenschaftlichen Fähigkeiten, die Sie 2022 lernen können
1 Datenanalysekurs Inferenzstatistik-Kurse
2 Programme zum Testen von Hypothesen Logistische Regressionskurse
3 Lineare Regressionskurse Lineare Algebra für die Analyse

Python-Datenvisualisierung – Heatmaps

  1. pandas als pd importieren. importiere numpy als np. matplotlib .pyplot als plt importieren.
  2. fig, ax = plt.subplots(figsize=(10,6)) sns. Heatmap (data.corr(), center=0, cmap='Blues') ax.set_title('Multi-Collinearity of Car Attributes') 3. fig, ax = plt.subplots(figsize=(10,6)) sns . Heatmap (data.corr(), center=0, cmap='BrBG', annot=True)

So erstellen Sie eine Heatmap:

  1. Laden Sie den Datensatz.
  2. Erstellen Sie ein Python-Numpy-Array.
  3. Erstellen Sie einen Pivot in Python.
  4. Gestalten Sie ein Array, um die Heatmap mit Anmerkungen zu versehen .
  5. Erstellen Sie die Matplotlib-Figur und definieren Sie den Plot .
  6. Erstellen Sie die Heatmap.

Nun stellt sich die Frage, wie Sie die Größe der Anmerkungen einer Seaborn-Heatmap in Python erhöhen können. Es ist ganz einfach – Ein Seaborn lässt sich anhand einer Python-Bibliothek erklären, die auf Matplotlib basiert und eigentlich zur Datenvisualisierung verwendet wird.

Lesen Sie unsere beliebten Data Science-Artikel

Data Science Career Path: Ein umfassender Karriereleitfaden Data Science Karrierewachstum: Die Zukunft der Arbeit ist da Warum ist Data Science wichtig? 8 Wege, wie Data Science dem Unternehmen einen Mehrwert bringt
Relevanz von Data Science für Manager Der ultimative Data Science Spickzettel, den jeder Data Scientist haben sollte Die 6 wichtigsten Gründe, warum Sie Data Scientist werden sollten
Ein Tag im Leben von Data Scientists: Was machen sie? Mythos gesprengt: Data Science braucht keine Codierung Business Intelligence vs. Data Science: Was sind die Unterschiede?

Ansatz

  • Zu importierendes Modul
  • Daten laden oder produzieren
  • Rufen Sie die Funktion heatmap() auf, wobei annot auf True gesetzt ist.
  • Die Größe muss an den annot_kws-Parameter angepasst werden
  • Grundstück ausgestellt werden

Heatmap-Farbe ändern:

Die Farbe der Seaborn-Heatmap kann mithilfe des cmap- Attributs der Farbkarte der Heatmap geändert werden.

Arten von Heatmaps:

Es gibt normalerweise zwei Arten von Heatmaps:

  1. Raster-Heatmap: Es gibt eine Menge von Werten, die durch Farben angezeigt werden, die in einer Matrix aus Zeilen und Spalten angeordnet sind, am häufigsten durch eine dichtebasierte Funktion. Nachfolgend sind einige Grid-Heatmaps aufgeführt
  • Geclusterte Heatmap – Das bloße Ziel der geclusterten Heatmap besteht darin, einfach Assoziationen zwischen den Merkmalen und den Datenpunkten herzustellen. Dies ist die Art von Heatmap, die Clustering als Teil des Prozesses zum Gruppieren von Merkmalen mit ähnlicher Natur implementiert.

Cluster-Heatmaps werden auch häufig in den Biowissenschaften verwendet, um Genähnlichkeiten zwischen verschiedenen Individuen zu untersuchen.

  • Räumliche Heatmap – Eine Heatmap hat mehrere Quadrate und jedem Quadrat in einer Heatmap wird tatsächlich eine Farbdarstellung auf der Grundlage des Werts der benachbarten Zellen zugewiesen. Die genaue Position der Farbe basiert auf der Größe des Werts in dem bestimmten Raum. Diese Heatmaps sind eigentlich datengesteuerte Malen-nach-Zahlen - Leinwände, die über ein Bild gelegt werden. Den Zellen, die einen höheren Wert als andere Zellen haben , wird eine heiße Farbe zugewiesen, während Zellen mit niedrigeren Werten eine kalte Farbe zugewiesen wird.

VERWENDUNG VON HEATMAPS:

  • Business Analytics: Eine Heatmap wird als visuelles Business-Analytics-Tool verwendet und bietet sehr schnelle visuelle Hinweise auf die aktuelle Leistung, Ergebnisse sowie Verbesserungsmöglichkeiten. Heatmaps können auch die vorhandenen Daten analysieren und Intensitätsbereiche finden, die widerspiegeln könnten, wo die meisten Kunden wohnen. Heatmaps können auch kontinuierlich aktualisiert werden, um das Wachstum und die Bemühungen widerzuspiegeln. Diese Karten können auch in den Arbeitsablauf eines Unternehmens integriert und so zu einem Teil laufender Analysen werden. Diese

Präsentieren Sie die Daten auf optisch ansprechende Weise und machen Sie sie auch leicht verständlich und mit Teammitgliedern oder Kunden kommunizierbar.

  • Website: Heatmaps werden eigentlich in Websites verwendet, um Daten von Besuchern zu visualisieren. Diese Art der Visualisierung hilft Geschäftsinhabern und Vermarktern, den Abschnitt mit der besten und der schlechtesten Leistung einer bestimmten Webseite zu identifizieren. Diese Visionen helfen ihnen auch, ihre Website besser zu optimieren.
  • Explorative Datenanalyse: Dies wird auch als EDA bezeichnet und ist eine Aufgabe, die von Datenwissenschaftlern ausgeführt wird, um sich mit allen Daten vertraut zu machen. Tatsächlich werden alle anfänglichen Studien durchgeführt, um die als EDA bekannten Daten zu verstehen . Es kann auch als Prozess der Analyse von Datensätzen vor Beginn der Modellierungsaufgabe erklärt werden. Tatsächlich ist es eine ziemlich langweilige Aufgabe, eine mit Zahlen gefüllte Tabelle zu betrachten, um wichtige Merkmale in einem Datensatz zu bestimmen. Daher wird EDA durchgeführt, um ihre Hauptmerkmale und Spezifikationen zusammenzufassen, oft mit visuellen Methoden, die auch Heatmaps beinhalten. Dies ist eine fesselnde Art, Beziehungen zwischen Variablen in einem hochdimensionalen Raum zu visualisieren. Dies lässt sich leicht bewerkstelligen, indem Feature-Variablen sowohl als Zeilen- als auch als Spaltenüberschriften verwendet werden.
  • Molekularbiologie : Heatmaps werden verwendet, um Disparitäten sowie Ähnlichkeitsmuster in RNA, DNA usw. zu untersuchen.
  • Geovisualisierung : Geospatiale Heatmap-Diagramme sind sehr nützlich, wenn es darum geht, darzustellen, wie geografische Bereiche einer Karte anhand bestimmter Kriterien miteinander verglichen werden. Heatmaps helfen auch bei der Clusteranalyse oder Hotspot-Analyse, um Cluster mit hohen Aktivitätskonzentrationen zu erkennen. Nehmen Sie zum Beispiel die Mietpreisanalyse von Airbnb!
  • Marketing & Vertrieb: Die Fähigkeit einer Heatmap, sowohl kalte als auch warme Stellen zu erkennen, wird genutzt, um die Marketing-Antwortraten durch gezieltes Marketing zu verbessern. Heatmaps erleichtern auch die Erkennung von Bereichen, die auf Kampagnen reagieren, unterversorgten Märkten, Kundenwohnsitz sowie hohen Verkaufstrends – diese helfen, Produktpaletten zu verbessern, aus Verkäufen Kapital zu schlagen sowie gezielte Kundensegmente aufzubauen und gleichzeitig regionale Demografien zu analysieren.

Fazit

Während es viele verschiedene Farbschemata gibt, die die Heatmap veranschaulichen können, bringt sie auch eine Reihe von wahrnehmungsbezogenen Vor- und Nachteilen mit sich. Die Auswahl der Farbpalette geht tatsächlich über die bloße Ästhetik hinaus, insbesondere weil die Farben in der Heatmap Muster in den Daten offenbaren. Tatsächlich können gute Farbschemata die Erkennung von Mustern verbessern. Schlechte Entscheidungen können es jedoch tatsächlich verbergen . Darüber hinaus sind die Seaborn-Heatmaps die Grid-Heatmaps, die tatsächlich verschiedene Arten von Daten aufnehmen können, um Heatmaps zu generieren. Daher besteht der Hauptzweck der seeseitigen Heatmap darin, die Korrelationsmatrix einfach durch Datenvisualisierung darzustellen. Es hilft auch dabei, die Beziehung zwischen mehreren Merkmalen zu finden und herauszufinden, welche Merkmale am besten für die Erstellung von Modellen für maschinelles Lernen geeignet sind.

Wenn Sie tiefer in die Arbeit mit Python eintauchen möchten, insbesondere für Data Science, bringt Ihnen upGrad das Executive PGP in Data Science. Dieses Programm richtet sich an IT-Experten auf mittlerer Ebene, Softwareingenieure, die Data Science erforschen möchten, Nicht-Tech-Analysten, Berufsanfänger usw. Unser strukturierter Lehrplan und unsere umfassende Unterstützung stellen sicher, dass unsere Studenten ihr volles Potenzial ohne Schwierigkeiten erreichen.

Möchten Sie diesen Artikel teilen?

Bereiten Sie sich auf eine Karriere der Zukunft vor

Bewerben Sie sich für den Master of Science in Data Science - LJMU & IIIT Bangalore