Bagaimana Cara Membuat Peta Panas Python dengan Seaborn? [Penjelasan Lengkap]
Diterbitkan: 2021-10-06Bisnis di Era Big Data kewalahan oleh volume data yang besar setiap hari. Namun, yang penting bukanlah jumlah data yang relevan, tetapi apa yang dilakukan dengan data tersebut. Oleh karena itu, Big Data perlu dianalisis untuk mendapatkan wawasan yang pada akhirnya akan menentukan keputusan yang lebih baik dan memengaruhi langkah bisnis strategis.
Namun, itu tidak cukup untuk menganalisis data dan meninggalkannya di sana. Langkah selanjutnya adalah visualisasi data yang menyajikan data dalam format visual untuk melihat dan memahami pola, tren, dan outlier pada data. Heatmap di Python adalah salah satu dari sekian banyak teknik visualisasi data.
Visualisasi data mengacu pada representasi grafis dari data dan dapat mencakup grafik, bagan, peta, dan elemen visual lainnya. Sangat penting untuk menganalisis sejumlah besar informasi dan membuat keputusan berdasarkan data.
Artikel ini akan memandu Anda melalui konsep peta panas dengan Python dan cara membuatnya menggunakan Seaborn.
Daftar isi
Apa itu Peta Panas?
Peta panas di Python adalah teknik visualisasi data di mana warna mewakili bagaimana nilai minat berubah dengan nilai dua variabel lainnya. Ini adalah representasi grafis dua dimensi dari data dengan nilai yang dikodekan dalam warna, sehingga memberikan tampilan informasi yang disederhanakan, berwawasan luas, dan menarik secara visual. Gambar di bawah adalah representasi peta panas yang disederhanakan.
Biasanya, peta panas adalah tabel data dengan baris dan kolom yang mewakili kumpulan kategori yang berbeda. Setiap sel dalam tabel berisi nilai logis atau numerik yang menentukan warna sel berdasarkan palet warna yang diberikan. Jadi, peta panas menggunakan warna untuk menekankan hubungan antara nilai data yang akan sulit dipahami jika disusun dalam tabel biasa menggunakan angka mentah.
Peta panas menemukan aplikasi dalam beberapa skenario dunia nyata. Misalnya, perhatikan peta panas di bawah ini. Ini adalah peta panas indeks saham yang mengidentifikasi tren yang berlaku di pasar saham. Peta panas menggunakan skema warna dingin-ke-panas untuk menunjukkan saham mana yang bearish dan mana yang bullish. Yang pertama diwakili menggunakan warna merah, sedangkan yang terakhir digambarkan dengan warna hijau.
Sumber
Peta panas digunakan di beberapa area lain. Beberapa contoh termasuk peta panas situs web, peta panas geografis, dan peta panas olahraga. Misalnya, Anda dapat menggunakan peta panas untuk memahami bagaimana curah hujan bervariasi menurut bulan dalam setahun di serangkaian kota. Peta panas juga sangat berguna untuk mempelajari perilaku manusia.
Peta Panas Korelasi
Peta panas korelasi adalah matriks dua dimensi yang menunjukkan korelasi antara dua variabel yang berbeda. Baris tabel menunjukkan nilai variabel pertama, sedangkan variabel kedua muncul sebagai kolom. Seperti peta panas biasa, peta panas korelasi juga dilengkapi dengan bilah warna untuk membaca dan memahami data.
Skema warna yang digunakan sedemikian rupa sehingga salah satu ujung skema warna mewakili titik data bernilai rendah dan ujung lainnya mewakili titik data bernilai tinggi. Oleh karena itu, peta panas korelasi ideal untuk analisis data karena menyajikan pola dalam bentuk yang mudah dibaca sambil juga menyoroti variasi dalam data.
Diberikan di bawah ini adalah representasi klasik dari peta panas korelasi.
Sumber
Membuat Peta Panas Seaborn dengan Python
Seaborn adalah pustaka Python yang digunakan untuk visualisasi data dan didasarkan pada matplotlib. Ini menyediakan media yang informatif dan menarik secara visual untuk menyajikan data dalam format grafik statistik. Dalam peta panas yang dibuat menggunakan seaborn, palet warna menggambarkan variasi dalam data terkait. Jika Anda seorang pemula dan ingin mendapatkan keahlian dalam ilmu data, lihat kursus ilmu data kami.
Langkah-langkah untuk Membuat peta panas dengan Python
Langkah-langkah berikut memberikan gambaran kasar tentang cara membuat peta panas sederhana dengan Python:
- Impor semua paket yang diperlukan
- Impor file tempat Anda menyimpan data
- Plot peta panasnya
- Tampilkan peta panas menggunakan matplotlib
Sekarang, izinkan kami menunjukkan kepada Anda bagaimana seaborn, bersama dengan matplotlib dan panda, dapat digunakan untuk menghasilkan peta panas.
Dalam contoh ini, kami akan membuat peta panas seaborn dengan Python untuk 30 saham perusahaan farmasi. Peta panas yang dihasilkan akan menunjukkan simbol saham dan persentase perubahan harga satu hari masing-masing. Kami akan mulai dengan mengumpulkan data pasar pada saham farmasi dan membuat file CSV (Comma-separated Value) yang terdiri dari simbol saham dan persentase perubahan harga yang sesuai di dua kolom pertama dari file CSV tersebut.
Karena kami bekerja dengan 30 perusahaan farmasi, kami akan membuat matriks peta panas yang terdiri dari 6 baris dan 5 kolom. Selain itu, kami ingin peta panas menggambarkan persentase perubahan harga dalam urutan menurun. Jadi, kami akan mengatur stok dalam file CSV dalam urutan menurun dan menambahkan dua kolom lagi untuk menunjukkan posisi masing-masing stok pada sumbu X dan Y dari peta panas seaborn.
Langkah 1: Mengimpor paket Python.
Sumber
Langkah 2: Memuat kumpulan data.
Dataset dibaca menggunakan fungsi read_csv dari pandas. Selanjutnya, kami menggunakan pernyataan cetak untuk memvisualisasikan 10 baris pertama.
Sumber
Langkah 3: Membuat array Python Numpy.
Dengan mengingat matriks 6 x 5, kita akan membuat larik n-dimensi untuk kolom “Simbol” dan “Ubah”.
Sumber
Langkah 4: Membuat pivot dengan Python.
Dari objek bingkai data yang diberikan “df”, fungsi pivot membuat tabel turunan baru. Fungsi pivot membutuhkan tiga argumen – indeks, kolom, dan nilai. Nilai sel tabel baru diambil dari kolom "Ubah".
Sumber
Langkah 5: Membuat array untuk membubuhi keterangan pada peta panas.
Langkah selanjutnya adalah membuat larik untuk membuat anotasi peta panas seaborn. Untuk ini, kita akan memanggil metode flatten pada array "persentase" dan "simbol" untuk meratakan daftar daftar Python dalam satu baris. Selanjutnya, fungsi zip membuat ritsleting daftar dengan Python. Kami akan menjalankan Python for loop dan menggunakan fungsi format untuk memformat simbol saham dan nilai persentase perubahan harga sesuai kebutuhan.
Sumber
Langkah 6: Membuat gambar matplotlib dan mendefinisikan plot.
Pada langkah ini, kita akan membuat plot matplotlib kosong dan menentukan ukuran gambar. Selain itu, kita akan menambahkan judul plot, mengatur ukuran font judul, dan memperbaiki jaraknya dari plot dengan menggunakan metode set_position. Terakhir, karena kami hanya ingin menampilkan simbol saham dan perubahan harga persentase satu hari yang sesuai, kami akan menyembunyikan tanda centang untuk sumbu X dan Y dan menghapus sumbu dari plot.
Sumber
Langkah 7: Membuat peta panas
Pada langkah terakhir, kita akan menggunakan fungsi peta panas dari paket Python seaborn untuk membuat peta panas. Fungsi peta panas dari paket Python seaborn mengambil serangkaian argumen berikut:
data :
Ini adalah dataset dua dimensi yang dapat dimasukkan ke dalam array. Diberikan Pandas DataFrame, baris dan kolom akan diberi label menggunakan informasi indeks/kolom.
anot :
Ini adalah larik dengan bentuk yang sama dengan data dan memberi anotasi pada peta panas.
cmap:
Ini adalah objek matplotlib atau nama colormap dan memetakan nilai data ke ruang warna.
Fmt :
Ini adalah kode pemformatan string yang digunakan saat menambahkan anotasi.
Lebar baris:
Ini mengatur lebar garis yang membagi setiap sel.
Sumber
Hasil akhir dari peta panas seaborn untuk perusahaan farmasi yang dipilih akan terlihat seperti ini:
Sumber
Langkah ke Depan: Belajar Python dengan Program Sertifikat Profesional upGrad dalam Ilmu Data
Program Sertifikat Profesional dalam Ilmu Data untuk Pengambilan Keputusan Bisnis adalah program online 8 bulan yang ketat yang berfokus pada ilmu data dan konsep pembelajaran mesin dengan penekanan khusus pada aplikasi bisnis dunia nyata mereka. Program ini dirancang secara kategoris untuk manajer dan profesional yang bekerja yang ingin mengembangkan pengetahuan praktis dan keterampilan ilmu data yang akan membantu mereka mengambil keputusan bisnis yang strategis dan berbasis data.
Berikut adalah beberapa sorotan kursus:
- Pengakuan bergengsi dari IIM Kozhikode
- 200+ jam konten
- 3 proyek industri dan batu penjuru
- 20+ sesi pembelajaran langsung
- 5+ sesi pelatihan ahli
- Cakupan Excel, Tableau, Python, R, dan Power BI
- Satu-satu dengan mentor industri
- Dukungan karir 360 derajat
- Bantuan pekerjaan dengan perusahaan-perusahaan top
Daftar dengan upGrad dan asah keterampilan peta panas Python Anda untuk semua kebutuhan visualisasi data Anda!
Kesimpulan
Ahli statistik dan analis data menggunakan sejumlah besar alat dan teknik untuk menyortir data yang dikumpulkan dan menyajikannya dengan cara yang mudah dimengerti dan ramah pengguna. Dalam hal ini, peta panas sebagai teknik visualisasi data telah membantu bisnis di semua sektor untuk memvisualisasikan dan memahami data dengan lebih baik.
Singkatnya, peta panas telah digunakan secara luas dan masih digunakan sebagai salah satu alat statistik dan analitis pilihan. Ini karena mereka menawarkan mode presentasi data yang menarik secara visual dan dapat diakses, mudah dipahami, serbaguna, mudah beradaptasi, dan menghilangkan langkah-langkah membosankan dari analisis data tradisional dan proses interpretasi dengan menyajikan semua nilai dalam satu bingkai.
Bagaimana Anda merencanakan peta panas?
Peta panas adalah cara standar untuk memplot data yang dikelompokkan dalam format grafis dua dimensi. Ide dasar di balik merencanakan peta panas adalah bahwa grafik dibagi menjadi kotak atau persegi panjang, masing-masing mewakili satu sel pada tabel data, satu kumpulan data, dan satu baris. Kotak atau persegi panjang diberi kode warna sesuai dengan nilai sel itu di tabel.
Apakah peta panas menunjukkan korelasi?
Peta panas korelasi adalah representasi grafis dari matriks korelasi yang menggambarkan korelasi antara variabel yang berbeda. Peta panas korelasi sangat efektif jika digunakan dengan benar karena variabel yang sangat berkorelasi dapat dengan mudah diidentifikasi.
Mengapa seaborn digunakan dalam Python?
Seaborn adalah pustaka Python open-source berdasarkan matplotlib. Ini digunakan untuk analisis dan visualisasi data eksplorasi dan bekerja dengan mudah dengan bingkai data dan perpustakaan Pandas. Plus, grafik yang dibuat menggunakan seaborn mudah disesuaikan.