Seaborn ile Python Isı Haritası Nasıl Oluşturulur? [Kapsamlı Açıklama]
Yayınlanan: 2021-10-06Büyük Veri Çağındaki işletmeler, günlük bazda büyük miktarda verinin altında eziliyor. Bununla birlikte, önemli olan ilgili verilerin miktarı değil, verilerle ne yapıldığıdır. Bu nedenle, nihayetinde daha iyi kararları dikte edecek ve stratejik iş hareketlerini etkileyecek içgörüler elde etmek için Büyük Veri'nin analiz edilmesi gerekiyor.
Yine de verileri analiz edip orada bırakmak yeterli değil. Sonraki adım, verilerdeki kalıpları, eğilimleri ve aykırı değerleri görmek ve anlamak için verileri görsel bir biçimde sunan veri görselleştirmedir. Python'daki ısı haritası, birçok veri görselleştirme tekniğinden biridir.
Veri görselleştirme, verilerin grafiksel temsilini ifade eder ve grafikler, çizelgeler, haritalar ve diğer görsel unsurları içerebilir. Muazzam miktarda bilgiyi analiz etmek ve veriye dayalı kararlar vermek için son derece kritiktir.
Bu makale, Python'da bir ısı haritası kavramı ve Seaborn kullanarak bir ısı haritasının nasıl oluşturulacağı konusunda size yol gösterecektir.
İçindekiler
Isı Haritası nedir?
Python'daki bir ısı haritası, renklerin bir ilgi değerinin diğer iki değişkenin değerleriyle nasıl değiştiğini temsil ettiği bir veri görselleştirme tekniğidir. Renklerle kodlanmış değerlere sahip verilerin iki boyutlu grafiksel bir temsilidir, böylece basitleştirilmiş, anlaşılır ve görsel olarak çekici bir bilgi görünümü sağlar. Aşağıdaki resim, bir ısı haritasının basitleştirilmiş bir temsilidir.
Tipik olarak, bir ısı haritası, farklı kategori kümelerini temsil eden satırlar ve sütunlar içeren bir veri tablosudur. Tablodaki her hücre, belirli bir renk paletine göre hücrenin rengini belirleyen mantıksal veya sayısal bir değer içerir. Bu nedenle, ısı haritaları, ham sayılar kullanılarak normal bir tabloda düzenlendiğinde anlaşılması zor olan veri değerleri arasındaki ilişkiyi vurgulamak için renkleri kullanır.
Isı haritaları, çeşitli gerçek dünya senaryolarında uygulamalar bulur. Örneğin, aşağıdaki ısı haritasını düşünün. Borsadaki hakim eğilimleri tanımlayan bir hisse senedi endeksi ısı haritasıdır. Isı haritası, hangi hisselerin düşüşte, hangilerinin yükselişte olduğunu göstermek için soğuktan soğuğa bir renk şeması kullanır. İlki kırmızı renkle, ikincisi ise yeşil renkle gösterilir.
Kaynak
Isı haritaları diğer birçok alanda kullanım bulur. Bazı örnekler, web sitesi ısı haritalarını, coğrafi ısı haritalarını ve spor ısı haritalarını içerir. Örneğin, bir dizi şehirde yağışın yılın ayına göre nasıl değiştiğini anlamak için bir ısı haritası kullanabilirsiniz. Isı haritaları ayrıca insan davranışlarını incelemek için son derece kullanışlıdır.
Korelasyon Isı Haritası
Bir korelasyon ısı haritası, iki farklı değişken arasındaki korelasyonu gösteren iki boyutlu bir matristir. Tablonun satırları ilk değişkenin değerlerini gösterirken, ikinci değişken sütunlar olarak görünür. Normal bir ısı haritası gibi, bir korelasyon ısı haritası da verileri okumak ve anlamak için bir renk çubuğuyla birlikte gelir.
Kullanılan renk şeması, renk şemasının bir ucu düşük değerli veri noktalarını ve diğer ucu yüksek değerli veri noktalarını temsil edecek şekildedir. Bu nedenle, korelasyon ısı haritaları, desenleri kolayca okunabilir bir biçimde sunarken aynı zamanda verilerdeki varyasyonu da vurguladıkları için veri analizi için idealdir.
Aşağıda verilen bir korelasyon ısı haritasının klasik bir temsilidir.
Kaynak
Python'da Seaborn Isı Haritası Oluşturma
Seaborn, veri görselleştirme için kullanılan bir Python kütüphanesidir ve matplotlib tabanlıdır. Verileri istatistiksel bir grafik formatında sunmak için bilgilendirici ve görsel olarak çekici bir ortam sağlar. Seaborn kullanılarak oluşturulan bir ısı haritasında, bir renk paleti ilgili verilerdeki varyasyonu gösterir. Yeni başlayan biriyseniz ve veri biliminde uzmanlık kazanmak istiyorsanız, veri bilimi kurslarımıza göz atın.
Python'da ısı haritası oluşturma adımları
Aşağıdaki adımlar, Python'da basit bir ısı haritasının nasıl oluşturulacağının kaba bir taslağını verir:
- Gerekli tüm paketleri içe aktarın
- Verilerinizi depoladığınız dosyayı içe aktarın
- Isı haritasını çizin
- matplotlib kullanarak ısı haritasını görüntüleyin
Şimdi size matplotlib ve pandalarla birlikte seaborn'un bir ısı haritası oluşturmak için nasıl kullanılabileceğini gösterelim.
Bu örnekte, 30 ilaç şirketi hissesi için Python'da bir deniz ısı haritası oluşturacağız. Ortaya çıkan ısı haritası, hisse senedi sembollerini ve ilgili tek günlük yüzde fiyat değişimini gösterecektir. İlaç hisse senetlerine ilişkin piyasa verilerini toplayarak başlayacağız ve söz konusu CSV dosyasının ilk iki sütununda hisse senedi sembollerinden ve bunlara karşılık gelen yüzde fiyat değişiminden oluşan bir CSV (Virgülle Ayrılmış Değer) dosyası oluşturacağız.
30 ilaç firması ile çalıştığımız için 6 satır ve 5 sütundan oluşan bir heatmap matrisi oluşturacağız. Ek olarak, ısı haritasının azalan düzende yüzde fiyat değişimini göstermesini istiyoruz. Bu nedenle, CSV dosyasındaki hisse senetlerini azalan düzende düzenleyeceğiz ve her stoğun denizdeki ısı haritasının X ve Y eksenlerindeki konumunu belirtmek için iki sütun daha ekleyeceğiz.
Adım 1: Python paketlerini içe aktarma.
Kaynak
Adım 2: Veri kümesini yükleme.
Veri kümesi, pandalardan read_csv işlevi kullanılarak okunur. Ayrıca, ilk 10 satırı görselleştirmek için print ifadesini kullanıyoruz.
Kaynak
Adım 3: Bir Python Numpy dizisi oluşturma.
6 x 5 matrisini göz önünde bulundurarak, “Sembol” ve “Değiştir” sütunları için n boyutlu bir dizi oluşturacağız.
Kaynak
Adım 4: Python'da bir pivot oluşturma.
Pivot işlevi, verilen veri çerçevesi nesnesi "df"den yeni bir türetilmiş tablo oluşturur. Pivot işlevi üç bağımsız değişken alır: dizin, sütunlar ve değerler. Yeni tablonun hücrelerinin değerleri “Değiştir” sütunundan alınmıştır.
Kaynak
Adım 5: Isı haritasına açıklama eklemek için bir dizi oluşturma.
Bir sonraki adım, denizdeki ısı haritasına açıklama eklemek için bir dizi oluşturmaktır. Bunun için, bir satırdaki Python listelerini düzleştirmek için “yüzde” ve “sembol” dizilerindeki düzleştirme yöntemini çağıracağız. Ayrıca, zip işlevi Python'da bir listeyi sıkıştırır. Döngü için bir Python çalıştıracağız ve hisse senedi sembollerini ve yüzde fiyat değişim değerlerini gerektiği gibi biçimlendirmek için format işlevini kullanacağız.
Kaynak
Adım 6: matplotlib şeklinin oluşturulması ve grafiğin tanımlanması.
Bu adımda boş bir matplotlib grafiği oluşturacağız ve şeklin boyutunu tanımlayacağız. Ayrıca, arsa başlığını ekleyeceğiz, başlığın yazı tipi boyutunu ayarlayacağız ve set_position yöntemini kullanarak arsaya olan mesafesini sabitleyeceğiz. Son olarak, yalnızca hisse senedi sembollerini ve bunlara karşılık gelen tek günlük yüzde fiyat değişimini görüntülemek istediğimizden, X ve Y eksenleri için onay işaretlerini gizleyip eksenleri grafikten kaldıracağız.
Kaynak
7. Adım: Isı haritasının oluşturulması
Son adımda, ısı haritasını oluşturmak için seaborn Python paketindeki ısı haritası işlevini kullanacağız. Denizde doğan Python paketinin ısı haritası işlevi aşağıdaki argüman setini alır:
Veri :
Bir diziye zorlanabilen iki boyutlu bir veri kümesidir. Bir Pandas DataFrame verildiğinde, satırlar ve sütunlar dizin/sütun bilgileri kullanılarak etiketlenecektir.
Açıklama :
Verilerle aynı şekle sahip bir dizidir ve ısı haritasına açıklama ekler.
harita:
Bu bir matplotlib nesnesi veya renk haritası adıdır ve veri değerlerini renk uzayına eşler.
Fmt :
Açıklama eklerken kullanılan bir dize biçimlendirme kodudur.
Çizgi genişlikleri:
Her hücreyi bölen çizgilerin genişliğini ayarlar.
Kaynak
Seçilen ilaç şirketleri için denizdeki ısı haritasının nihai çıktısı şöyle görünecek:
Kaynak
İleriye Doğru: upGrad'ın Veri Biliminde Profesyonel Sertifika Programı ile Python Öğrenin
İş Karar Verme için Veri Biliminde Profesyonel Sertifika Programı , gerçek dünyadaki iş uygulamalarına özellikle vurgu yaparak veri bilimi ve makine öğrenimi kavramlarına odaklanan 8 aylık titiz bir çevrimiçi programdır. Program, stratejik ve veriye dayalı iş kararları almalarına yardımcı olacak veri biliminin pratik bilgi ve becerilerini geliştirmek isteyen yöneticiler ve çalışan profesyoneller için kategorik olarak tasarlanmıştır.
İşte bazı önemli kurslar:
- IIM Kozhikode'den prestijli tanıma
- 200+ saat içerik
- 3 endüstri projesi ve bir kapak taşı
- 20+ canlı öğrenme seansı
- 5+ uzman koçluk seansı
- Excel, Tableau, Python, R ve Power BI kapsamı
- Sektör danışmanlarıyla bire bir
- 360 derece kariyer desteği
- En iyi firmalarla iş yardımı
upGrad'a kaydolun ve tüm veri görselleştirme ihtiyaçlarınız için Python ısı haritası becerilerinizi geliştirin!
Çözüm
İstatistikçiler ve veri analistleri, derlenen verileri sıralamak ve bunları kolayca anlaşılabilir ve kullanıcı dostu bir şekilde sunmak için çok sayıda araç ve teknik kullanır. Bu bağlamda, bir veri görselleştirme tekniği olarak ısı haritaları, tüm sektörlerdeki işletmelerin verileri daha iyi görselleştirmelerine ve anlamalarına yardımcı olmuştur.
Özetlemek gerekirse, ısı haritaları yaygın olarak kullanılmıştır ve halen tercih edilen istatistiksel ve analitik araçlardan biri olarak kullanılmaktadır. Bunun nedeni, görsel olarak çekici ve erişilebilir bir veri sunumu modu sunmaları, kolayca anlaşılabilir, çok yönlü, uyarlanabilir olmaları ve tüm değerleri tek bir çerçevede sunarak geleneksel veri analizi ve yorumlama süreçlerinin sıkıcı adımlarını ortadan kaldırmalarıdır.
Bir ısı haritası nasıl çizilir?
Isı haritası, gruplandırılmış verileri iki boyutlu grafik biçiminde çizmenin standart bir yoludur. Bir ısı haritası çizmenin ardındaki temel fikir, grafiğin, her biri veri tablosunda bir hücreyi, bir veri kümesini ve bir satırı temsil eden karelere veya dikdörtgenlere bölünmesidir. Kare veya dikdörtgen, tablodaki o hücrenin değerine göre renk kodludur.
Bir ısı haritası korelasyon gösteriyor mu?
Bir korelasyon ısı haritası, farklı değişkenler arasındaki korelasyonu gösteren bir korelasyon matrisinin grafiksel bir temsilidir. Yüksek korelasyonlu değişkenler kolayca tanımlanabildiğinden, doğru kullanıldığında korelasyon ısı haritaları çok etkilidir.
Python'da neden seaborn kullanılıyor?
Seaborn, matplotlib tabanlı açık kaynaklı bir Python kütüphanesidir. Keşif amaçlı veri analizi ve görselleştirme için kullanılır ve veri çerçeveleri ve Pandas kitaplığı ile kolayca çalışır. Ayrıca, seaborn kullanılarak oluşturulan grafikler kolayca özelleştirilebilir.