การสร้าง Heatmap ด้วย Python

เผยแพร่แล้ว: 2023-01-02

แผนที่ความร้อนประกอบด้วยค่าที่แสดงเฉดสีต่างๆ ของสีเดียวสำหรับแต่ละค่าที่จะลงจุด โดยทั่วไป เฉดสีเข้มของแผนภูมิแสดงค่าที่สูงกว่าเฉดสีอ่อน สำหรับค่าที่แตกต่างกันอย่างชัดเจน สามารถใช้สีที่แตกต่างกันโดยสิ้นเชิงได้ ค่าข้อมูลจะแสดงด้วยความช่วยเหลือของสีในกราฟ จุดมุ่งหมายหลักของแผนที่ความร้อนคือการจัดเตรียมรายการภาพสีของข้อมูลที่กำหนด แผนที่ความร้อน (หรือแผนที่ความร้อน) เป็นเทคนิคการแสดงข้อมูลที่แสดงขนาดของปรากฏการณ์เป็นสีในสองมิติ ถ้าพูดให้ตรงก็คือ แผนที่ความร้อน คือเทคนิคการแสดงข้อมูลโดยใช้สีเพื่อแสดงให้เห็นว่าค่าที่น่าสนใจแตกต่างกันไปตามค่าของตัวแปรอีกสองตัวอย่างไร กล่าวโดยสรุป การใช้สีต่างๆ เพื่อแสดงข้อมูลทำให้คุณเห็นภาพรวมของข้อมูลตัวเลข นอกจากนี้ Python heatmap ยังรวมถึงการดำเนินการวิเคราะห์คลัสเตอร์ การทำให้เมทริกซ์เป็นมาตรฐาน การเลือกจานสีที่แน่นอน ตลอดจนการเปลี่ยนแถวและคอลัมน์เพื่อวางค่าที่ใกล้เคียงกัน

ตัวอย่างเช่น คุณสามารถใช้แผนที่ความร้อนเพื่อทำความเข้าใจว่ามลพิษทางอากาศเปลี่ยนแปลงไปอย่างไรตามเวลาของวันในเมืองต่างๆ

แผนผังความหนาแน่นของเว็บไซต์สามารถเข้าใจได้สองวิธี: โดยการดูภาพและโดยการแก้ไขจุดข้อมูลดิบ แนวโน้มการคลิกและปัญหาสามารถสังเกตได้อย่างรวดเร็วเนื่องจากลักษณะของรหัสสีของแผนที่ความร้อน (สีแดงหมายถึงการโต้ตอบมากที่สุด สีน้ำเงินน้อยที่สุด)

แผนที่ความร้อนแบบ 2 มิติเป็นเครื่องมือสร้างภาพข้อมูลที่ช่วยให้สามารถแสดงขนาดของปรากฏการณ์ในรูปแบบของสีได้ ใน Python สามารถลงจุดแผนที่ความร้อน 2 มิติได้โดยใช้แพ็คเกจ Matplotlib มีหลายวิธีที่สามารถใช้ในการลงจุดแผนที่ความร้อน 2 มิติ บางส่วนจะกล่าวถึงด้านล่าง

ตรวจสอบหลักสูตรวิทยาศาสตร์ข้อมูลของเราเพื่อเพิ่มพูนทักษะให้กับตัวคุณเอง

สารบัญ

วิธีที่ 1: การใช้ฟังก์ชัน matplotlib.pyplot.imshow()

ไวยากรณ์: matplotlib.pyplot.imshow(X, cmap=ไม่มี, บรรทัดฐาน=ไม่มี, ลักษณะ=ไม่มี, การแก้ไข=ไม่มี, alpha=ไม่มี, vmin=ไม่มี,

vmax=ไม่มี, กำเนิด=ไม่มี, ขอบเขต=ไม่มี, รูปร่าง=<พารามิเตอร์ที่เลิกใช้แล้ว>, filternorm=1, filterrad=4.0,

imlim=<พารามิเตอร์ที่เลิกใช้แล้ว>, resample=ไม่มี, url=ไม่มี, \, data=ไม่มี, \\*kwargs)

วิธีที่ 2: การใช้ Seaborn Library

สำหรับสิ่งนี้ เราใช้ฟังก์ชัน seaborn.heatmap()

ไวยากรณ์: seaborn.heatmap(data, *, vmin=None, vmax=None, cmap=None, center=None, robust=False,annot=None,

fmt='.2g', annot_kws=ไม่มี, linewidths=0, linecolor='white', cbar=True, cbar_kws=ไม่มี, cbar_ax=ไม่มี,

square=False, xticklabels='auto', yticklabels='auto', mask=None, ax=None, **kwargs)

สำรวจหลักสูตรวิทยาศาสตร์ข้อมูลยอดนิยมของเรา

หลักสูตรบริหารธุรกิจบัณฑิตสาขาวิทยาศาสตร์ข้อมูลจาก IIITB หลักสูตรประกาศนียบัตรวิชาชีพด้านวิทยาศาสตร์ข้อมูลเพื่อการตัดสินใจทางธุรกิจ วิทยาศาสตรมหาบัณฑิต สาขา Data Science จาก University of Arizona
หลักสูตรประกาศนียบัตรขั้นสูงด้านวิทยาศาสตร์ข้อมูลจาก IIITB หลักสูตรประกาศนียบัตรวิชาชีพด้าน Data Science and Business Analytics จาก University of Maryland หลักสูตรวิทยาศาสตร์ข้อมูล

วิธีที่ 3: การใช้ฟังก์ชัน matplotlib.pyplot.pcolormesh()

ไวยากรณ์: matplotlib.pyplot.pcolormesh(*args, alpha=None, norm=None, cmap=None, vmin=None, vmax=None,

shading='flat', antialiased=False, data=None, **kwargs)

Seaborn เป็นไลบรารี Python ที่ช่วยให้เราสร้างแผนภูมิที่ดีขึ้นได้อย่างง่ายดายด้วยความช่วยเหลือของฟังก์ชัน heatmap() ส่วนนี้เริ่มต้นด้วยโพสต์ที่อธิบายการใช้งานพื้นฐานของฟังก์ชันโดยอิงจากการป้อนข้อมูลประเภทใดก็ได้ จากนั้น จะแนะนำคุณเกี่ยวกับวิธีต่างๆ ในการปรับแต่งแผนภูมิ เช่น การควบคุมสีและการปรับข้อมูลให้เป็นมาตรฐาน

โดยปกติแล้ว เราใช้เทคนิคการจัดกลุ่มบางอย่างในแผนที่ความร้อน สิ่งนี้ทำเพื่อจัดกลุ่มรายการที่มีรูปแบบการจัดเรียงที่คล้ายกันสำหรับตัวแปรตัวเลข

โดยทั่วไป แนะนำให้แสดง dendrogram (dendrogram คือไดอะแกรมที่แสดงความสัมพันธ์แบบลำดับขั้นระหว่างวัตถุ โดยทั่วไปจะทำในรูปแบบของเอาต์พุตจากการจัดกลุ่มแบบลำดับชั้น หน้าที่หลักของ dendrogram คือการค้นหาวิธีที่เหมาะสมที่สุด เพื่อจัดสรรวัตถุให้กับคลัสเตอร์) บน

ด้านบนสุดของแผนที่ความร้อนเพื่ออธิบายวิธีดำเนินการจัดกลุ่ม สุดท้าย แต่ไม่ท้ายสุด การเปรียบเทียบการจัดกลุ่มที่เราได้รับกับโครงสร้างที่คาดไว้จะแสดงเป็นสีเพิ่มเติมจะเป็นประโยชน์

วิธีตีความแผนที่ความร้อนใน Python:

ทักษะด้านวิทยาศาสตร์ข้อมูลอันดับต้น ๆ ที่ต้องเรียนรู้ในปี 2565

ส. ไม่ ทักษะด้านวิทยาศาสตร์ข้อมูลอันดับต้น ๆ ที่ต้องเรียนรู้ในปี 2565
1 หลักสูตรการวิเคราะห์ข้อมูล หลักสูตร สถิติอนุมาน
2 โปรแกรมทดสอบสมมติฐาน หลักสูตรการถดถอยโลจิสติก
3 หลักสูตร การถดถอยเชิงเส้น พีชคณิตเชิงเส้นสำหรับการวิเคราะห์

Python Data Visualization — แผนที่ความร้อน

  1. นำเข้าแพนด้าเป็น pd นำเข้า numpy เป็น np นำเข้า matplotlib .pyplot เป็น plt
  2. รูปขวาน = plt.subplots(figsize=(10,6)) sns แผนที่ความร้อน ( data.corr (), center=0, cmap='Blues') ax.set_title('Multi-Collinearity of Car Attributes') 3. fig, ax = plt.subplots(figsize=(10,6)) sns . แผนที่ความร้อน ( data.corr (), center=0, cmap='BrBG', annot=True)

วิธีสร้างแผนที่ความร้อน:

  1. โหลดชุดข้อมูล
  2. สร้างอาร์เรย์ Python Numpy
  3. สร้าง Pivot ใน Python
  4. สร้าง Array เพื่อ อธิบาย Heatmap
  5. สร้างร่าง Matplotlib และ กำหนด โครงเรื่อง
  6. สร้างแผนที่ความ ร้อน

ตอนนี้ คำถามคือ คุณจะเพิ่มขนาดของคำอธิบายประกอบของ แผนที่ ความ ร้อนในทะเลใน Python ได้อย่างไร ง่ายมาก – สามารถอธิบายซีบอร์นได้ในแง่ของ ไลบรารี Python ที่ใช้ matplotlib และใช้จริงสำหรับการ แสดง ข้อมูล

อ่านบทความวิทยาศาสตร์ข้อมูลยอดนิยมของเรา

เส้นทางอาชีพด้านวิทยาศาสตร์ข้อมูล: คู่มืออาชีพที่ครอบคลุม Data Science Career Growth: อนาคตของงานมาถึงแล้ว เหตุใดวิทยาศาสตร์ข้อมูลจึงมีความสำคัญ 8 วิธีที่วิทยาการข้อมูลนำคุณค่ามาสู่ธุรกิจ
ความเกี่ยวข้องของวิทยาศาสตร์ข้อมูลสำหรับผู้จัดการ สุดยอดสูตรโกงวิทยาศาสตร์ข้อมูลที่นักวิทยาศาสตร์ข้อมูลทุกคนควรมี เหตุผล 6 อันดับแรกที่คุณควรมาเป็นนักวิทยาศาสตร์ข้อมูล
หนึ่งวันในชีวิตของ Data Scientist: พวกเขาทำอะไร? Myth Busted: Data Science ไม่ต้องการการเข้ารหัส Business Intelligence vs Data Science: อะไรคือความแตกต่าง?

เข้าใกล้

  • โมดูลที่จะนำเข้า
  • โหลดหรือสร้างข้อมูล
  • เรียกฟังก์ชันแผนที่ความร้อน () โดยไม่ได้ตั้งค่าเป็น True
  • ต้องปรับแต่งขนาดเป็นพารามิเตอร์ annot_kws
  • แผนผังที่จะจัดแสดง

การเปลี่ยนสีแผนที่ความร้อน:

สีของแผนที่ความร้อนในทะเลสามารถเปลี่ยนแปลงได้โดยใช้ แอตทริบิวต์ cmap ของแผนที่สีของแผนที่ ความร้อน

ประเภทของแผนที่ความร้อน:

โดยทั่วไปจะมี Heatmaps สองประเภท:

  1. แผนที่ความร้อนแบบ กริด: มีขนาดของค่าที่แสดงผ่านสีที่ วางออกเป็นเมทริกซ์ของแถวและคอลัมน์ โดยทั่วไปส่วนใหญ่จะ ใช้ฟังก์ชันตามความหนาแน่น รายการด้านล่างนี้คือแผนที่ความร้อนของกริดบางส่วน
  • แผนที่ความร้อนแบบกลุ่ม – เป้าหมายที่แท้จริงของแผนที่ความร้อนแบบกลุ่มคือการ สร้างความสัมพันธ์ระหว่างคุณลักษณะทั้งสองและ จุด ข้อมูล นี่คือประเภทของแผนที่ความร้อนที่ใช้การจัดกลุ่มเป็นส่วนหนึ่ง ของกระบวนการจัดกลุ่มคุณสมบัติที่มีลักษณะคล้ายกัน

แผนที่ความร้อนแบบกลุ่มยังใช้กันอย่างแพร่หลายในวิทยาศาสตร์ชีวภาพ เพื่อศึกษาความคล้ายคลึงกันของยีนในบุคคลต่างๆ

  • แผนที่ความร้อนเชิงพื้นที่ – แผนที่ความร้อนมีสี่เหลี่ยมหลายช่อง และแต่ละช่องใน แผนที่ความร้อนถูกกำหนดให้แสดงสีตามค่าของ เซลล์ที่อยู่ใกล้เคียง ตำแหน่งของสีนั้นขึ้นอยู่กับ ขนาดของค่าในพื้นที่นั้น ๆ Heatmaps เหล่านี้เป็น ภาพวาด ที่ขับเคลื่อนด้วยข้อมูล โดยผืนผ้าใบตัวเลข ที่ปกคลุมด้านบน ของภาพ เซลล์ที่มีค่าสูงกว่าเซลล์อื่นถูก กำหนดให้เป็นสีร้อน ในขณะที่เซลล์ที่มีค่าต่ำกว่าจะถูกกำหนดให้ เป็นสีเย็น

การใช้แผนที่ความร้อน:

  • การวิเคราะห์ธุรกิจ: แผนที่ความร้อนใช้เป็นเครื่องมือวิเคราะห์ธุรกิจด้วยภาพ และให้ข้อมูลเชิงภาพอย่างรวดเร็วเกี่ยวกับประสิทธิภาพปัจจุบัน ผลลัพธ์ ตลอดจนขอบเขตสำหรับการปรับปรุงใดๆ แผนที่ความร้อนยังสามารถวิเคราะห์ข้อมูลที่มีอยู่และค้นหาพื้นที่ที่มีความรุนแรงซึ่งอาจสะท้อนถึงที่ที่ลูกค้าส่วนใหญ่อาศัยอยู่ นอกจากนี้ยังสามารถอัปเดตแผนที่ความร้อนได้อย่างต่อเนื่องเพื่อสะท้อนถึงการเติบโตและความพยายาม แผนที่เหล่านี้สามารถรวมเข้ากับเวิร์กโฟลว์ของธุรกิจและกลายเป็นส่วนหนึ่งของการวิเคราะห์อย่างต่อเนื่อง เหล่านี้

นำเสนอข้อมูลในลักษณะที่น่าดูและยังทำให้ง่ายต่อการเข้าใจและสื่อสารกับสมาชิกในทีมหรือลูกค้า

  • เว็บไซต์: แผนที่ความร้อนถูกใช้จริงในเว็บไซต์เพื่อแสดงข้อมูลของผู้เยี่ยมชม การแสดงภาพในลักษณะนี้ช่วยให้เจ้าของธุรกิจและนักการตลาดสามารถระบุส่วนที่ดีที่สุดและประสิทธิภาพแย่ที่สุดของหน้าเว็บหนึ่งๆ ได้ วิสัยทัศน์เหล่านี้ยังช่วยเพิ่มประสิทธิภาพเว็บไซต์ให้ดียิ่งขึ้น
  • การวิเคราะห์ข้อมูลเชิงสำรวจ: สิ่งนี้เรียกอีกอย่างว่า EDA และเป็นงานที่ดำเนินการโดยนักวิทยาศาสตร์ข้อมูลเพื่อทำความคุ้นเคยกับข้อมูลทั้งหมด อันที่จริงแล้ว การศึกษาเบื้องต้นทั้งหมดทำขึ้นเพื่อให้เข้าใจข้อมูลที่เรียก ว่า EDA นอกจากนี้ยังสามารถอธิบายได้ว่าเป็นกระบวนการวิเคราะห์ชุดข้อมูลก่อนที่งานสร้างแบบจำลองจะเริ่มต้นขึ้น ตามความเป็นจริงแล้ว การดูสเปรดชีตที่เต็มไปด้วยตัวเลขเป็นงานที่ค่อนข้างน่าเบื่อเพื่อกำหนดคุณลักษณะที่สำคัญในชุดข้อมูล ดังนั้น EDA จึงทำขึ้นเพื่อสรุปคุณลักษณะและข้อกำหนดหลัก โดยมักจะใช้วิธีการแสดงภาพ ซึ่งรวมถึงแผนที่ความร้อนด้วย นี่เป็นวิธีที่น่าสนใจในการแสดงภาพความสัมพันธ์ระหว่างตัวแปรในพื้นที่ที่มีมิติสูง ซึ่งสามารถทำได้ง่ายๆ โดยใช้ตัวแปรคุณลักษณะเป็นส่วนหัวของแถวและส่วนหัวของคอลัมน์
  • อณูชีววิทยา : แผนที่ความร้อนใช้เพื่อศึกษาความแตกต่างและรูปแบบความคล้ายคลึงกันใน RNA, DNA ฯลฯ
  • การแสดงภาพทาง ภูมิศาสตร์ : แผนภูมิแผนที่ความร้อนเชิงพื้นที่ค่อนข้างมีประโยชน์เมื่อต้องแสดงการเปรียบเทียบพื้นที่ทางภูมิศาสตร์ของแผนที่โดยพิจารณาจากเกณฑ์เฉพาะ แผนที่ความร้อนยังช่วยในการวิเคราะห์คลัสเตอร์หรือการวิเคราะห์ฮอตสปอตเพื่อตรวจหากลุ่มกิจกรรมที่มีความเข้มข้นสูง ยกตัวอย่างเช่น การวิเคราะห์ราคาเช่า Airbnb!
  • การ ตลาดและการขาย: ความสามารถของแผนที่ความร้อนในการตรวจจับความเย็นและจุดที่อุ่นจะถูกใช้เพื่อเพิ่มอัตราการตอบสนองทางการตลาดโดยการตลาดแบบกำหนดเป้าหมาย แผนที่ความร้อนยังอำนวยความสะดวกในการตรวจหาพื้นที่ที่ตอบสนองต่อแคมเปญ ตลาดที่มีบริการน้อย ที่พักของลูกค้า รวมถึงแนวโน้มการขายที่สูง – สิ่งเหล่านี้ช่วยปรับปรุงกลุ่มผลิตภัณฑ์ ใช้ประโยชน์จากการขายและสร้างกลุ่มลูกค้าเป้าหมายในขณะเดียวกันก็วิเคราะห์ข้อมูลประชากรในภูมิภาค

บทสรุป

แม้ว่าจะมีชุดสีที่แตกต่างกันมากมายที่สามารถแสดงแผนที่ความร้อนได้ แต่ก็ ยังมาพร้อมกับ ข้อดี และข้อเสียสำหรับแต่ละชุด ตัวเลือกจานสีเป็นมากกว่าความสวยงาม โดยเฉพาะอย่างยิ่งเนื่องจาก สีในแผนที่ความร้อนเปิดเผยรูปแบบในข้อมูล ในความเป็นจริง โครงร่างสีที่ดี สามารถปรับปรุงการค้นพบรูปแบบได้ อย่างไรก็ตาม ตัวเลือกที่ไม่ดีสามารถซ่อน มันได้ นอกจากนี้ แผนที่ความร้อนในทะเลยังเป็นแผนที่ความร้อนแบบกริดที่สามารถ นำข้อมูลประเภทต่างๆ มาสร้างแผนที่ความร้อนได้ ดังนั้น จุดประสงค์หลักของแผนที่ความร้อนใต้ท้องทะเลคือการแสดงเมทริกซ์สหสัมพันธ์ โดยการแสดงข้อมูลเป็นภาพ นอกจากนี้ยังช่วยในการค้นหาความสัมพันธ์ระหว่าง คุณสมบัติต่างๆ รวมถึงคุณสมบัติที่ดีที่สุดสำหรับการสร้างแบบจำลองการเรียนรู้ด้วยเครื่อง

หากคุณต้องการเจาะลึกการทำงานกับ Python โดยเฉพาะอย่างยิ่งสำหรับวิทยาศาสตร์ข้อมูล upGrad ขอนำเสนอ Executive PGP ใน Data Science โปรแกรมนี้ออกแบบมาสำหรับผู้เชี่ยวชาญด้านไอทีระดับกลาง วิศวกรซอฟต์แวร์ที่ต้องการสำรวจข้อมูล นักวิเคราะห์ที่ไม่ใช่เทคโนโลยี ผู้เชี่ยวชาญด้านอาชีพเริ่มต้น ฯลฯ หลักสูตรที่มีโครงสร้างของเราและการสนับสนุนที่กว้างขวางทำให้นักเรียนของเราบรรลุศักยภาพสูงสุดโดยไม่มีปัญหา

ต้องการแบ่งปันบทความนี้หรือไม่?

เตรียมพร้อมสำหรับอาชีพแห่งอนาคต

สมัครปริญญาโทสาขาวิทยาศาสตร์ข้อมูล - LJMU & IIIT Bangalore