Membuat Peta Panas dengan Python
Diterbitkan: 2023-01-02Peta panas terdiri dari nilai-nilai yang menunjukkan nuansa berbeda dari satu warna untuk masing-masing nilai yang akan diplot. Umumnya, warna bagan yang lebih gelap menunjukkan nilai yang lebih tinggi daripada warna yang lebih terang. Untuk nilai yang sangat berbeda, warna yang sama sekali berbeda juga dapat digunakan. Nilai data ditampilkan dengan bantuan warna dalam grafik. Tujuan utama peta panas adalah untuk memberikan daftar visual berwarna dari informasi yang diberikan. Peta panas (atau peta panas) adalah teknik visualisasi data yang menampilkan besarnya fenomena sebagai warna dalam dua dimensi. Peta panas, tepatnya, adalah teknik visualisasi data yang menggunakan warna untuk menunjukkan bagaimana nilai minat bervariasi berdasarkan nilai dari dua variabel lainnya. Singkatnya, menggunakan warna berbeda untuk mewakili data memberi Anda pandangan umum tentang data numerik. Selain itu, peta panas Python termasuk mengeksekusi analisis kluster, mengatur matriks, memilih palet warna tertentu serta mengubah baris dan kolom untuk menempatkan nilai yang serupa di dekatnya.
Misalnya, Anda dapat menggunakan peta panas untuk memahami bagaimana sebenarnya polusi udara berubah menurut waktu di berbagai kota besar dan kecil.
Peta panas situs web dapat dipahami dengan dua cara: dengan melihat visualisasi dan dengan merevisi poin data mentah. Tren dan masalah klik dapat dilihat sekilas karena sifat kode warna dari peta panas (merah menunjukkan interaksi paling banyak, biru paling sedikit).
Peta Panas 2-D adalah alat visualisasi data yang memungkinkan representasi besaran fenomena dalam bentuk warna. Dengan Python, Peta Panas 2-D dapat diplot menggunakan paket Matplotlib. Ada beberapa metode yang dapat digunakan untuk memplot 2-D Heatmaps. beberapa di antaranya dibahas di bawah ini.
Lihat kursus ilmu data kami untuk meningkatkan keterampilan Anda.
Daftar isi
Metode 1: Menggunakan fungsi matplotlib.pyplot.imshow()
Sintaks: matplotlib.pyplot.imshow(X, cmap=Tidak ada, norma=Tidak ada, aspek=Tidak ada, interpolasi=Tidak ada, alfa=Tidak ada, vmin=Tidak ada,
vmax=Tidak ada, asal=Tidak ada, luas=Tidak ada, bentuk=<parameter usang>, filternorm=1, filterrad=4.0,
imlim=<parameter usang>, resample=Tidak ada, url=Tidak ada, \, data=Tidak ada, \\*kwargs)
Metode 2: Menggunakan Perpustakaan Seaborn
Untuk ini kami menggunakan fungsi seaborn.heatmap()
Sintaks: seaborn.heatmap(data, *, vmin=None, vmax=None, cmap=None, center=None, robust=False,annot=None,
fmt='.2g', annot_kws=Tidak ada, linewidths=0, linecolor='putih', cbar=Benar, cbar_kws=Tidak ada, cbar_ax=Tidak ada,
square=False, xticklabels='auto', yticklabels='auto', mask=None, ax=None, **kwargs)
Jelajahi Kursus Ilmu Data Populer kami
Program Pascasarjana Eksekutif dalam Ilmu Data dari IIITB | Program Sertifikat Profesional dalam Ilmu Data untuk Pengambilan Keputusan Bisnis | Master of Science dalam Ilmu Data dari University of Arizona |
Program Sertifikat Lanjutan dalam Ilmu Data dari IIITB | Program Sertifikat Profesional dalam Ilmu Data dan Analisis Bisnis dari University of Maryland | Kursus Ilmu Data |
Metode 3: Menggunakan fungsi matplotlib.pyplot.pcolormesh()
Sintaks: matplotlib.pyplot.pcolormesh(*args, alpha=Tidak ada, norma=Tidak ada, cmap=Tidak ada, vmin=Tidak ada, vmax=Tidak ada,
shading='flat', antialiased=Salah, data=Tidak ada, **kwargs)
Seaborn adalah pustaka Python yang memungkinkan kita membuat bagan yang lebih baik dengan mudah, dengan bantuan fungsi peta panas(). Bagian ini dimulai dengan postingan yang menjelaskan penggunaan mendasar dari fungsi berdasarkan input data apa pun. Kemudian, ini akan memandu Anda melalui berbagai cara untuk menyesuaikan bagan, seperti mengontrol warna dan normalisasi data.
Biasanya, kami menggunakan beberapa teknik pengelompokan pada peta panas. Hal ini dilakukan untuk mengelompokkan item yang memiliki pola serupa untuk variabel numeriknya.
Secara umum, disarankan untuk menampilkan dendrogram (Dendrogram adalah diagram yang menunjukkan hubungan hirarki antar objek. Biasanya dibuat dalam bentuk keluaran dari pengelompokan hierarki. Fungsi utama dendrogram adalah untuk mengetahui cara yang paling sesuai untuk mengalokasikan objek ke cluster.) pada
atas peta panas untuk menggambarkan bagaimana pengelompokan telah dilakukan. Last but not least, akan sangat membantu untuk membandingkan pengelompokan yang kita dapatkan dengan struktur yang diharapkan, ditampilkan sebagai warna tambahan.
Cara menginterpretasikan peta panas dengan Python:
Keterampilan Ilmu Data Teratas untuk Dipelajari pada tahun 2022
SL. Tidak | Keterampilan Ilmu Data Teratas untuk Dipelajari pada tahun 2022 | |
1 | Kursus Analisis Data | Kursus Statistik Inferensial |
2 | Program Pengujian Hipotesis | Kursus Regresi Logistik |
3 | Kursus Regresi Linear | Aljabar Linier untuk Analisis |
Visualisasi Data Python — Heatmaps
- impor panda sebagai pd. impor numpy sebagai np. impor matplotlib .pyplot sebagai plt. …
- gbr, ax = plt.subplots(figsize=(10,6)) sns. heatmap (data.corr(), center=0, cmap='Blues') ax.set_title('Multi-Kolinearitas Atribut Mobil') 3. fig, ax = plt.subplots(figsize=(10,6)) sns . peta panas ( data.corr (), center=0, cmap='BrBG', annot=True)
Cara membuat peta panas:
- Muat kumpulan data.
- Buat larik Python Numpy.
- Menghasilkan Pivot dengan Python.
- Membuat Array untuk Menganotasi Heatmap .
- Bangun figur Matplotlib dan tentukan plotnya .
- Bangun Peta Panas.
Sekarang, pertanyaannya adalah, bagaimana cara meningkatkan ukuran anotasi heatmap seaborn dengan Python ? Sederhana saja – Seaborn dapat dijelaskan dengan istilah pustaka Python yang didasarkan pada matplotlib dan sebenarnya digunakan untuk visualisasi data.
Baca Artikel Ilmu Data populer kami
Jalur Karir Ilmu Data: Panduan Karir Komprehensif | Pertumbuhan Karir Ilmu Data: Masa Depan Pekerjaan ada di sini | Mengapa Ilmu Data Penting? 8 Cara Ilmu Data Membawa Nilai bagi Bisnis |
Relevansi Ilmu Data untuk Manajer | Cheat Sheet Ilmu Data Utama Yang Harus Dimiliki Setiap Ilmuwan Data | 6 Alasan Teratas Mengapa Anda Harus Menjadi Ilmuwan Data |
Sehari dalam Kehidupan Ilmuwan Data: Apa yang mereka lakukan? | Myth Busted: Data Science tidak membutuhkan Coding | Kecerdasan Bisnis vs Ilmu Data: Apa perbedaannya? |
Mendekati
- Modul yang akan diimpor
- Memuat atau menghasilkan data
- Panggil fungsi peta panas () dengan anot disetel ke True.
- Ukuran harus disesuaikan dengan parameter annot_kws
- Plot yang akan dipamerkan
Mengubah warna peta panas:
Warna peta panas seaborn dapat diubah dengan menggunakan atribut cmap peta warna dari peta panas tersebut.
Jenis Peta Panas:
Biasanya ada dua jenis Peta Panas:
- Peta panas kisi: Ada besarnya nilai yang ditunjukkan melalui warna yang ditata ke dalam matriks baris dan juga kolom, paling sering oleh fungsi berbasis kerapatan. Di bawah ini adalah beberapa peta panas Grid
- Clustered heatmap – Tujuan utama dari clustered heatmap adalah untuk membangun asosiasi antara fitur dan titik data. Ini adalah jenis peta panas yang mengimplementasikan pengelompokan sebagai bagian dari proses pengelompokan fitur yang sifatnya serupa.
Peta panas berkelompok juga banyak digunakan dalam ilmu biologi untuk mempelajari kesamaan gen di berbagai individu.
- Peta panas spasial – Peta panas memiliki beberapa kotak dan setiap kotak dalam peta panas sebenarnya diberi representasi warna berdasarkan nilai sel terdekat. Lokasi warna itu sendiri didasarkan pada besarnya nilai dalam ruang tertentu. Heatmaps ini sebenarnya adalah cat berbasis data dengan kanvas angka yang ditutupi di atas gambar. Sel yang memiliki nilai lebih tinggi dari sel lain diberi warna panas, sedangkan sel yang memiliki nilai lebih rendah diberi warna dingin.
PENGGUNAAN PETA PANAS:
- Analitik bisnis: Peta panas digunakan sebagai alat analisis bisnis visual dan memberikan isyarat visual yang sangat cepat tentang kinerja saat ini, hasil, serta ruang lingkup apa pun untuk perbaikan. Peta panas juga dapat menganalisis data yang ada serta menemukan area intensitas yang mungkin mencerminkan tempat tinggal sebagian besar pelanggan. Peta panas juga dapat terus diperbarui untuk mencerminkan pertumbuhan dan upaya. Peta-peta ini juga dapat diintegrasikan ke dalam alur kerja bisnis dan karenanya menjadi bagian dari analitik berkelanjutan. Ini
menyajikan data dengan cara yang menyenangkan secara visual dan juga membuatnya mudah untuk dipahami dan dikomunikasikan kepada anggota tim atau klien.
- Situs web: Peta panas sebenarnya digunakan di situs web untuk memvisualisasikan data pengunjung. Jenis visualisasi ini membantu pemilik bisnis, serta pemasar, mengidentifikasi bagian terbaik dan terburuk dari halaman web tertentu. Visi ini juga membantu mereka mengoptimalkan situs web mereka dengan lebih baik.
- Analisis Data Eksplorasi: Ini juga dikenal sebagai EDA dan merupakan tugas yang dilakukan oleh ilmuwan data untuk membiasakan diri dengan semua data. Faktanya, semua studi awal dilakukan untuk memahami data yang dikenal sebagai EDA . Ini juga dapat dijelaskan sebagai proses menganalisis kumpulan data sebelum tugas pemodelan dimulai. Faktanya, melihat spreadsheet berisi angka untuk menentukan karakteristik penting dalam kumpulan data merupakan tugas yang cukup membosankan. Dengan demikian, EDA dilakukan untuk meringkas fitur dan spesifikasi utamanya, seringkali dengan metode visual, yang juga mencakup Heatmaps. Ini adalah cara yang menarik untuk memvisualisasikan hubungan antar variabel dalam ruang berdimensi tinggi. Ini dapat dengan mudah dilakukan dengan menggunakan variabel fitur sebagai tajuk baris dan juga tajuk kolom.
- Biologi Molekuler : Peta panas digunakan untuk mempelajari perbedaan serta pola kesamaan dalam RNA, DNA, dll.
- Geovisualisasi : Bagan peta panas geospasial cukup berguna untuk menampilkan bagaimana wilayah geografis suatu peta dibandingkan satu sama lain berdasarkan kriteria tertentu. Peta panas juga membantu dalam analisis kluster atau analisis hotspot untuk mendeteksi kluster dengan aktivitas konsentrasi tinggi. Ambil contoh, analisis harga sewa Airbnb!
- Pemasaran & Penjualan: Kemampuan peta panas untuk mendeteksi titik dingin dan hangat, digunakan untuk meningkatkan tingkat respons pemasaran melalui pemasaran yang ditargetkan. Heatmaps juga memfasilitasi pendeteksian area yang merespons kampanye, pasar yang kurang terlayani, tempat tinggal pelanggan, serta tren penjualan yang tinggi – ini membantu meningkatkan jajaran produk, memanfaatkan penjualan, serta membangun segmen pelanggan yang ditargetkan sambil juga menganalisis demografi regional.
Kesimpulan
Meskipun ada banyak skema warna berbeda yang dapat mengilustrasikan peta panas, ini juga dilengkapi dengan serangkaian keunggulan perseptual serta kerugian masing-masing. Pilihan palet warna sebenarnya lebih dari sekadar estetika, terutama karena warna dalam peta panas mengungkapkan pola dalam data. Faktanya, skema warna yang baik dapat meningkatkan penemuan pola. Namun, pilihan yang buruk sebenarnya bisa menyembunyikannya . Selain itu, peta panas seaborn adalah peta panas grid yang benar-benar dapat mengambil berbagai jenis data untuk menghasilkan peta panas. Oleh karena itu, tujuan utama seaborn heatmap adalah untuk menunjukkan matriks korelasi dengan visualisasi data. Ini juga membantu dalam menemukan hubungan antara beberapa fitur serta fitur mana yang terbaik untuk pembuatan model pembelajaran mesin.
Jika Anda ingin menyelam lebih dalam untuk bekerja dengan Python, terutama untuk ilmu data, upGrad memberi Anda PGP Eksekutif dalam Ilmu Data. Program ini dirancang untuk profesional TI tingkat menengah, insinyur perangkat lunak yang ingin menjelajahi Ilmu Data, analis non-teknologi, profesional karir awal, dll. Kurikulum terstruktur dan dukungan ekstensif kami memastikan siswa kami mencapai potensi penuh mereka tanpa kesulitan.