使用 Python 創建熱圖

已發表: 2023-01-02

熱圖由顯示一種顏色的不同陰影的值組成,用於繪製各個值。 通常,圖表的深色陰影表示高於淺色陰影的值。 對於明顯不同的值,也可以使用完全不同的顏色。 數據值借助圖表中的顏色顯示。 熱圖的主要目的是提供給定信息的彩色視覺列表。 熱圖(或熱圖)是一種數據可視化技術,它以二維顏色顯示現象的大小。 準確地說,熱圖是一種數據可視化技術,它利用顏色來展示感興趣的值如何根據其他兩個變量的值而變化。 總而言之,使用不同的顏色來表示數據可以讓您對數值數據有一個總體的了解。 除此之外,Python 熱圖還包括執行聚類分析、正則化矩陣、選擇特定的調色板以及交換行和列以放置附近相似的值。

例如,您可以使用熱圖來了解一組城鎮的空氣污染如何根據一天中的時間準確變化。

可以通過兩種方式理解網站熱圖:查看可視化效果和修改原始數據點。 由於熱圖的顏色編碼特性(紅色表示交互最多,藍色表示最少),點擊趨勢和問題可以一目了然。

二維熱圖是一種數據可視化工具,可以以顏色的形式表示現象的大小。 在 Python 中,可以使用 Matplotlib 包繪製二維熱圖。 有幾種方法可用於繪製二維熱圖。 下面討論其中一些。

查看我們的數據科學課程以提高自己的技能。

目錄

方法一:使用matplotlib.pyplot.imshow()函數

語法:matplotlib.pyplot.imshow(X, cmap=None, norm=None, aspect=None, interpolation=None, alpha=None, vmin=None,

vmax=None, origin=None, extent=None, shape=<不推薦使用的參數>, filternorm=1, filterrad=4.0,

imlim=<不推薦使用的參數>, resample=None, url=None, \, data=None, \\*kwargs)

方法二:使用Seaborn庫

為此,我們使用 seaborn.heatmap() 函數

語法:seaborn.heatmap(data, *, vmin=None, vmax=None, cmap=None, center=None, robust=False,annot=None,

fmt='.2g', annot_kws=None, linewidths=0, linecolor='white', cbar=True, cbar_kws=None, cbar_ax=None,

square=False,xticklabels='auto',yticklabels='auto',mask=None,ax=None,**kwargs)

探索我們的熱門數據科學課程

IIITB 的數據科學執行研究生課程 商業決策數據科學專業證書課程 亞利桑那大學數據科學碩士
IIITB 的數據科學高級證書課程 馬里蘭大學數據科學和商業分析專業證書課程 數據科學課程

方法三:使用matplotlib.pyplot.pcolormesh()函數

語法:matplotlib.pyplot.pcolormesh(*args, alpha=None, norm=None, cmap=None, vmin=None, vmax=None,

shading='flat', antialiased=False, data=None, **kwargs)

Seaborn 是一個 Python 庫,借助它的 heatmap() 函數,我們可以輕鬆創建更好的圖表。 本節以一篇文章開頭,解釋了基於任何類型的數據輸入的函數的基本用法。 然後,它將指導您通過各種方式自定義圖表,例如控制顏色和數據規範化。

通常,我們在熱圖上使用一些聚類技術。 這樣做是為了將具有類似數字變量模式的項目分組。

一般推薦顯示樹狀圖(樹狀圖是顯示對象之間層次關係的圖。它通常以層次聚類輸出的形式製作。樹狀圖的主要功能是找出最合適的方式將對象分配給集群。)

熱圖的頂部描述了聚類是如何進行的。 最後但同樣重要的是,將我們得到的分組與預期結構進行比較可能會有所幫助,顯示為附加顏色。

如何在 Python 中解釋熱圖:

2022 年要學習的頂級數據科學技能

SL。 不 2022 年要學習的頂級數據科學技能
1個 數據分析課程 推理統計課程
2個 假設檢驗程序 邏輯回歸課程
3個 線性回歸課程 線性代數分析

Python 數據可視化——熱圖

  1. 將 pandas 導入為 pd. 將 numpy 導入為 np. matplotlib .pyplot 導入為 plt。 ……
  2. 圖,ax = plt.subplots(figsize=(10,6)) sns。 heatmap ( data.corr (), center=0, cmap='Blues') ax.set_title('汽車屬性的多重共線性') 3. fig, ax = plt.subplots(figsize=(10,6)) sns . 熱圖(data.corr(), center=0, cmap='BrBG', annot=True)

如何創建熱圖:

  1. 加載數據集。
  2. 製作一個 Python Numpy 數組。
  3. 在 Python 中生成一個 Pivot。
  4. 設計一個數組來註釋熱圖
  5. 構建 Matplotlib 圖並定義繪圖
  6. 構建熱圖。

現在的問題是,如何在 Python 中增加 seaborn 熱圖的註釋大小 很簡單——seaborn 可以用基於 matplotlib 的 Python 庫來解釋,實際上用於數據可視化。

閱讀我們流行的數據科學文章

數據科學職業道路:綜合職業指南 數據科學職業發展:工作的未來就在這裡 為什麼數據科學很重要? 數據科學為企業帶來價值的 8 種方式
數據科學對管理者的相關性 每個數據科學家都應該擁有的終極數據科學備忘單 你應該成為數據科學家的 6 大理由
數據科學家的一天:他們做什麼? 神話破滅:數據科學不需要編碼 商業智能與數據科學:有什麼區別?

方法

  • 要導入的模塊
  • 加載或生成數據
  • 調用 heatmap () 函數並將 annot 設置為 True。
  • 大小必須自定義為 annot_kws 參數
  • 待展示地塊

改變熱圖顏色:

seaborn 熱圖的顏色可以通過使用熱圖的顏色圖的 cmap屬性來改變。

熱圖的類型:

通常有兩種類型的熱圖:

  1. 網格熱圖:通過顏色顯示值的大小,這些值被佈置到行和列的矩陣中,最常見的是基於密度的函數。 下面列出了一些網格熱圖
  • 聚類熱圖——聚類熱圖的純粹目標是簡單地在特徵和數據之間建立關聯這是一種將聚類作為對本質上相似的特徵進行分組過程的一部分的熱圖。

聚類熱圖也廣泛用於生物科學,以研究不同個體之間的基因相似性。

  • 空間熱圖——一個熱圖有幾個方塊,熱圖中的每個方塊實際上都根據附近單元格的值分配了一種顏色表示。 顏色的位置取決於特定空間中值的大小。 這些熱圖實際上是由覆蓋在圖像頂部數字畫布繪製的數據驅動圖。 值高於其他單元格的單元格被指定為暖色,而值低於其他單元格的單元格被指定為冷色。

熱圖的用途:

  • 業務分析:熱圖用作可視化業務分析工具,它提供有關當前性能、結果以及任何改進範圍的真正快速的視覺提示。 熱圖還可以分析現有數據,並找到可能反映大多數客戶居住地的強度區域。 熱圖也可以不斷更新,以反映增長和努力。 這些地圖還可以集成到企業的工作流程中,從而成為持續分析的一部分。 這些

以視覺上令人愉悅的方式呈現數據,並且易於理解和與團隊成員或客戶溝通。

  • 網站:熱圖實際上用於網站,以可視化訪問者的數據。 這種可視化可以幫助企業主和營銷人員識別某個網頁中表現最好和最差的部分。 這些願景也幫助他們更好地優化網站。
  • 探索性數據分析:這也稱為 EDA,它是數據科學家為了熟悉所有數據而執行的一項任務。 事實上,所有的初始研究都是為了理解稱為EDA的數據 它也可以解釋為在建模任務開始之前分析數據集的過程。 事實上,查看充滿數字的電子表格以確定數據集中的重要特徵是一項非常無聊的任務。 因此,EDA 是為了總結它們的主要特徵和規格,通常使用視覺方法,其中還包括熱圖。 這些是在高維空間中可視化變量之間關係的迷人方式。 這可以通過使用特徵變量作為行標題和列標題輕鬆完成。
  • 分子生物學:熱圖用於研究 RNA、DNA 等的差異和相似模式。
  • 地理可視化:地理空間熱圖圖表在顯示地圖的地理區域如何根據特定標準相互比較時非常有用。 熱圖還有助於聚類分析或熱點分析,以檢測高濃度活動的聚類。 以 Airbnb 租金價格分析為例!
  • 營銷與銷售:熱圖檢測冷點和熱點的能力用於通過有針對性的營銷提高營銷響應率。 熱圖還有助於檢測響應活動的區域、服務不足的市場、客戶居住地以及高銷售趨勢——這些有助於增強產品陣容、利用銷售以及建立目標客戶群,同時還可以分析區域人口統計數據。

結論

雖然有許多不同的配色方案可以說明熱圖,但它也具有一組感知優勢以及每種配色方案的劣勢。 調色板的選擇實際上不僅僅是美學,特別是因為熱圖中的顏色揭示了數據中的模式。 事實上,良好的配色方案可以增強模式發現。 然而,糟糕的選擇實際上可以隱藏它。 除此之外,seaborn 熱圖是網格熱圖,實際上可以採用各種類型的數據來生成熱圖。 因此, seaborn heatmap的主要目的是通過數據可視化的方式簡單展示相關矩陣。 它還有助於找到多個特徵之間的關係以及哪些特徵最適合機器學習模型構建。

如果您想更深入地使用 Python,尤其是數據科學,upGrad 會為您帶來數據科學領域的執行 PGP。 該計劃專為中級 IT 專業人員、希望探索數據科學的軟件工程師、非技術分析師、早期職業專業人員等而設計。我們結構化的課程和廣泛的支持確保我們的學生毫無困難地充分發揮潛力。

想要分享這篇文章?

為未來的職業做準備

申請數據科學理學碩士 - LJMU & IIT Bangalore