การสร้าง Heatmap ด้วย Python
เผยแพร่แล้ว: 2023-01-02แผนที่ความร้อนประกอบด้วยค่าที่แสดงเฉดสีต่างๆ ของสีเดียวสำหรับแต่ละค่าที่จะลงจุด โดยทั่วไป เฉดสีเข้มของแผนภูมิแสดงค่าที่สูงกว่าเฉดสีอ่อน สำหรับค่าที่แตกต่างกันอย่างชัดเจน สามารถใช้สีที่แตกต่างกันโดยสิ้นเชิงได้ ค่าข้อมูลจะแสดงด้วยความช่วยเหลือของสีในกราฟ จุดมุ่งหมายหลักของแผนที่ความร้อนคือการจัดเตรียมรายการภาพสีของข้อมูลที่กำหนด แผนที่ความร้อน (หรือแผนที่ความร้อน) เป็นเทคนิคการแสดงข้อมูลที่แสดงขนาดของปรากฏการณ์เป็นสีในสองมิติ ถ้าพูดให้ตรงก็คือ แผนที่ความร้อน คือเทคนิคการแสดงข้อมูลโดยใช้สีเพื่อแสดงให้เห็นว่าค่าที่น่าสนใจแตกต่างกันไปตามค่าของตัวแปรอีกสองตัวอย่างไร กล่าวโดยสรุป การใช้สีต่างๆ เพื่อแสดงข้อมูลทำให้คุณเห็นภาพรวมของข้อมูลตัวเลข นอกจากนี้ Python heatmap ยังรวมถึงการดำเนินการวิเคราะห์คลัสเตอร์ การทำให้เมทริกซ์เป็นมาตรฐาน การเลือกจานสีที่แน่นอน ตลอดจนการเปลี่ยนแถวและคอลัมน์เพื่อวางค่าที่ใกล้เคียงกัน
ตัวอย่างเช่น คุณสามารถใช้แผนที่ความร้อนเพื่อทำความเข้าใจว่ามลพิษทางอากาศเปลี่ยนแปลงไปอย่างไรตามเวลาของวันในเมืองต่างๆ
แผนผังความหนาแน่นของเว็บไซต์สามารถเข้าใจได้สองวิธี: โดยการดูภาพและโดยการแก้ไขจุดข้อมูลดิบ แนวโน้มการคลิกและปัญหาสามารถสังเกตได้อย่างรวดเร็วเนื่องจากลักษณะของรหัสสีของแผนที่ความร้อน (สีแดงหมายถึงการโต้ตอบมากที่สุด สีน้ำเงินน้อยที่สุด)
แผนที่ความร้อนแบบ 2 มิติเป็นเครื่องมือสร้างภาพข้อมูลที่ช่วยให้สามารถแสดงขนาดของปรากฏการณ์ในรูปแบบของสีได้ ใน Python สามารถลงจุดแผนที่ความร้อน 2 มิติได้โดยใช้แพ็คเกจ Matplotlib มีหลายวิธีที่สามารถใช้ในการลงจุดแผนที่ความร้อน 2 มิติ บางส่วนจะกล่าวถึงด้านล่าง
ตรวจสอบหลักสูตรวิทยาศาสตร์ข้อมูลของเราเพื่อเพิ่มพูนทักษะให้กับตัวคุณเอง
สารบัญ
วิธีที่ 1: การใช้ฟังก์ชัน matplotlib.pyplot.imshow()
ไวยากรณ์: matplotlib.pyplot.imshow(X, cmap=ไม่มี, บรรทัดฐาน=ไม่มี, ลักษณะ=ไม่มี, การแก้ไข=ไม่มี, alpha=ไม่มี, vmin=ไม่มี,
vmax=ไม่มี, กำเนิด=ไม่มี, ขอบเขต=ไม่มี, รูปร่าง=<พารามิเตอร์ที่เลิกใช้แล้ว>, filternorm=1, filterrad=4.0,
imlim=<พารามิเตอร์ที่เลิกใช้แล้ว>, resample=ไม่มี, url=ไม่มี, \, data=ไม่มี, \\*kwargs)
วิธีที่ 2: การใช้ Seaborn Library
สำหรับสิ่งนี้ เราใช้ฟังก์ชัน seaborn.heatmap()
ไวยากรณ์: seaborn.heatmap(data, *, vmin=None, vmax=None, cmap=None, center=None, robust=False,annot=None,
fmt='.2g', annot_kws=ไม่มี, linewidths=0, linecolor='white', cbar=True, cbar_kws=ไม่มี, cbar_ax=ไม่มี,
square=False, xticklabels='auto', yticklabels='auto', mask=None, ax=None, **kwargs)
สำรวจหลักสูตรวิทยาศาสตร์ข้อมูลยอดนิยมของเรา
หลักสูตรบริหารธุรกิจบัณฑิตสาขาวิทยาศาสตร์ข้อมูลจาก IIITB | หลักสูตรประกาศนียบัตรวิชาชีพด้านวิทยาศาสตร์ข้อมูลเพื่อการตัดสินใจทางธุรกิจ | วิทยาศาสตรมหาบัณฑิต สาขา Data Science จาก University of Arizona |
หลักสูตรประกาศนียบัตรขั้นสูงด้านวิทยาศาสตร์ข้อมูลจาก IIITB | หลักสูตรประกาศนียบัตรวิชาชีพด้าน Data Science and Business Analytics จาก University of Maryland | หลักสูตรวิทยาศาสตร์ข้อมูล |
วิธีที่ 3: การใช้ฟังก์ชัน matplotlib.pyplot.pcolormesh()
ไวยากรณ์: matplotlib.pyplot.pcolormesh(*args, alpha=None, norm=None, cmap=None, vmin=None, vmax=None,
shading='flat', antialiased=False, data=None, **kwargs)
Seaborn เป็นไลบรารี Python ที่ช่วยให้เราสร้างแผนภูมิที่ดีขึ้นได้อย่างง่ายดายด้วยความช่วยเหลือของฟังก์ชัน heatmap() ส่วนนี้เริ่มต้นด้วยโพสต์ที่อธิบายการใช้งานพื้นฐานของฟังก์ชันโดยอิงจากการป้อนข้อมูลประเภทใดก็ได้ จากนั้น จะแนะนำคุณเกี่ยวกับวิธีต่างๆ ในการปรับแต่งแผนภูมิ เช่น การควบคุมสีและการปรับข้อมูลให้เป็นมาตรฐาน
โดยปกติแล้ว เราใช้เทคนิคการจัดกลุ่มบางอย่างในแผนที่ความร้อน สิ่งนี้ทำเพื่อจัดกลุ่มรายการที่มีรูปแบบการจัดเรียงที่คล้ายกันสำหรับตัวแปรตัวเลข
โดยทั่วไป แนะนำให้แสดง dendrogram (dendrogram คือไดอะแกรมที่แสดงความสัมพันธ์แบบลำดับขั้นระหว่างวัตถุ โดยทั่วไปจะทำในรูปแบบของเอาต์พุตจากการจัดกลุ่มแบบลำดับชั้น หน้าที่หลักของ dendrogram คือการค้นหาวิธีที่เหมาะสมที่สุด เพื่อจัดสรรวัตถุให้กับคลัสเตอร์) บน
ด้านบนสุดของแผนที่ความร้อนเพื่ออธิบายวิธีดำเนินการจัดกลุ่ม สุดท้าย แต่ไม่ท้ายสุด การเปรียบเทียบการจัดกลุ่มที่เราได้รับกับโครงสร้างที่คาดไว้จะแสดงเป็นสีเพิ่มเติมจะเป็นประโยชน์
วิธีตีความแผนที่ความร้อนใน Python:
ทักษะด้านวิทยาศาสตร์ข้อมูลอันดับต้น ๆ ที่ต้องเรียนรู้ในปี 2565
ส. ไม่ | ทักษะด้านวิทยาศาสตร์ข้อมูลอันดับต้น ๆ ที่ต้องเรียนรู้ในปี 2565 | |
1 | หลักสูตรการวิเคราะห์ข้อมูล | หลักสูตร สถิติอนุมาน |
2 | โปรแกรมทดสอบสมมติฐาน | หลักสูตรการถดถอยโลจิสติก |
3 | หลักสูตร การถดถอยเชิงเส้น | พีชคณิตเชิงเส้นสำหรับการวิเคราะห์ |
Python Data Visualization — แผนที่ความร้อน
- นำเข้าแพนด้าเป็น pd นำเข้า numpy เป็น np นำเข้า matplotlib .pyplot เป็น plt …
- รูปขวาน = plt.subplots(figsize=(10,6)) sns แผนที่ความร้อน ( data.corr (), center=0, cmap='Blues') ax.set_title('Multi-Collinearity of Car Attributes') 3. fig, ax = plt.subplots(figsize=(10,6)) sns . แผนที่ความร้อน ( data.corr (), center=0, cmap='BrBG', annot=True)
วิธีสร้างแผนที่ความร้อน:
- โหลดชุดข้อมูล
- สร้างอาร์เรย์ Python Numpy
- สร้าง Pivot ใน Python
- สร้าง Array เพื่อ อธิบาย Heatmap
- สร้างร่าง Matplotlib และ กำหนด โครงเรื่อง
- สร้างแผนที่ความ ร้อน
ตอนนี้ คำถามคือ คุณจะเพิ่มขนาดของคำอธิบายประกอบของ แผนที่ ความ ร้อนในทะเลใน Python ได้อย่างไร ง่ายมาก – สามารถอธิบายซีบอร์นได้ในแง่ของ ไลบรารี Python ที่ใช้ matplotlib และใช้จริงสำหรับการ แสดง ข้อมูล
อ่านบทความวิทยาศาสตร์ข้อมูลยอดนิยมของเรา
เส้นทางอาชีพด้านวิทยาศาสตร์ข้อมูล: คู่มืออาชีพที่ครอบคลุม | Data Science Career Growth: อนาคตของงานมาถึงแล้ว | เหตุใดวิทยาศาสตร์ข้อมูลจึงมีความสำคัญ 8 วิธีที่วิทยาการข้อมูลนำคุณค่ามาสู่ธุรกิจ |
ความเกี่ยวข้องของวิทยาศาสตร์ข้อมูลสำหรับผู้จัดการ | สุดยอดสูตรโกงวิทยาศาสตร์ข้อมูลที่นักวิทยาศาสตร์ข้อมูลทุกคนควรมี | เหตุผล 6 อันดับแรกที่คุณควรมาเป็นนักวิทยาศาสตร์ข้อมูล |
หนึ่งวันในชีวิตของ Data Scientist: พวกเขาทำอะไร? | Myth Busted: Data Science ไม่ต้องการการเข้ารหัส | Business Intelligence vs Data Science: อะไรคือความแตกต่าง? |
เข้าใกล้
- โมดูลที่จะนำเข้า
- โหลดหรือสร้างข้อมูล
- เรียกฟังก์ชันแผนที่ความร้อน () โดยไม่ได้ตั้งค่าเป็น True
- ต้องปรับแต่งขนาดเป็นพารามิเตอร์ annot_kws
- แผนผังที่จะจัดแสดง
การเปลี่ยนสีแผนที่ความร้อน:
สีของแผนที่ความร้อนในทะเลสามารถเปลี่ยนแปลงได้โดยใช้ แอตทริบิวต์ cmap ของแผนที่สีของแผนที่ ความร้อน
ประเภทของแผนที่ความร้อน:
โดยทั่วไปจะมี Heatmaps สองประเภท:
- แผนที่ความร้อนแบบ กริด: มีขนาดของค่าที่แสดงผ่านสีที่ วางออกเป็นเมทริกซ์ของแถวและคอลัมน์ โดยทั่วไปส่วนใหญ่จะ ใช้ฟังก์ชันตามความหนาแน่น รายการด้านล่างนี้คือแผนที่ความร้อนของกริดบางส่วน
- แผนที่ความร้อนแบบกลุ่ม – เป้าหมายที่แท้จริงของแผนที่ความร้อนแบบกลุ่มคือการ สร้างความสัมพันธ์ระหว่างคุณลักษณะทั้งสองและ จุด ข้อมูล นี่คือประเภทของแผนที่ความร้อนที่ใช้การจัดกลุ่มเป็นส่วนหนึ่ง ของกระบวนการจัดกลุ่มคุณสมบัติที่มีลักษณะคล้ายกัน
แผนที่ความร้อนแบบกลุ่มยังใช้กันอย่างแพร่หลายในวิทยาศาสตร์ชีวภาพ เพื่อศึกษาความคล้ายคลึงกันของยีนในบุคคลต่างๆ
- แผนที่ความร้อนเชิงพื้นที่ – แผนที่ความร้อนมีสี่เหลี่ยมหลายช่อง และแต่ละช่องใน แผนที่ความร้อนถูกกำหนดให้แสดงสีตามค่าของ เซลล์ที่อยู่ใกล้เคียง ตำแหน่งของสีนั้นขึ้นอยู่กับ ขนาดของค่าในพื้นที่นั้น ๆ Heatmaps เหล่านี้เป็น ภาพวาด ที่ขับเคลื่อนด้วยข้อมูล โดยผืนผ้าใบตัวเลข ที่ปกคลุมด้านบน ของภาพ เซลล์ที่มีค่าสูงกว่าเซลล์อื่นถูก กำหนดให้เป็นสีร้อน ในขณะที่เซลล์ที่มีค่าต่ำกว่าจะถูกกำหนดให้ เป็นสีเย็น
การใช้แผนที่ความร้อน:
- การวิเคราะห์ธุรกิจ: แผนที่ความร้อนใช้เป็นเครื่องมือวิเคราะห์ธุรกิจด้วยภาพ และให้ข้อมูลเชิงภาพอย่างรวดเร็วเกี่ยวกับประสิทธิภาพปัจจุบัน ผลลัพธ์ ตลอดจนขอบเขตสำหรับการปรับปรุงใดๆ แผนที่ความร้อนยังสามารถวิเคราะห์ข้อมูลที่มีอยู่และค้นหาพื้นที่ที่มีความรุนแรงซึ่งอาจสะท้อนถึงที่ที่ลูกค้าส่วนใหญ่อาศัยอยู่ นอกจากนี้ยังสามารถอัปเดตแผนที่ความร้อนได้อย่างต่อเนื่องเพื่อสะท้อนถึงการเติบโตและความพยายาม แผนที่เหล่านี้สามารถรวมเข้ากับเวิร์กโฟลว์ของธุรกิจและกลายเป็นส่วนหนึ่งของการวิเคราะห์อย่างต่อเนื่อง เหล่านี้
นำเสนอข้อมูลในลักษณะที่น่าดูและยังทำให้ง่ายต่อการเข้าใจและสื่อสารกับสมาชิกในทีมหรือลูกค้า
- เว็บไซต์: แผนที่ความร้อนถูกใช้จริงในเว็บไซต์เพื่อแสดงข้อมูลของผู้เยี่ยมชม การแสดงภาพในลักษณะนี้ช่วยให้เจ้าของธุรกิจและนักการตลาดสามารถระบุส่วนที่ดีที่สุดและประสิทธิภาพแย่ที่สุดของหน้าเว็บหนึ่งๆ ได้ วิสัยทัศน์เหล่านี้ยังช่วยเพิ่มประสิทธิภาพเว็บไซต์ให้ดียิ่งขึ้น
- การวิเคราะห์ข้อมูลเชิงสำรวจ: สิ่งนี้เรียกอีกอย่างว่า EDA และเป็นงานที่ดำเนินการโดยนักวิทยาศาสตร์ข้อมูลเพื่อทำความคุ้นเคยกับข้อมูลทั้งหมด อันที่จริงแล้ว การศึกษาเบื้องต้นทั้งหมดทำขึ้นเพื่อให้เข้าใจข้อมูลที่เรียก ว่า EDA นอกจากนี้ยังสามารถอธิบายได้ว่าเป็นกระบวนการวิเคราะห์ชุดข้อมูลก่อนที่งานสร้างแบบจำลองจะเริ่มต้นขึ้น ตามความเป็นจริงแล้ว การดูสเปรดชีตที่เต็มไปด้วยตัวเลขเป็นงานที่ค่อนข้างน่าเบื่อเพื่อกำหนดคุณลักษณะที่สำคัญในชุดข้อมูล ดังนั้น EDA จึงทำขึ้นเพื่อสรุปคุณลักษณะและข้อกำหนดหลัก โดยมักจะใช้วิธีการแสดงภาพ ซึ่งรวมถึงแผนที่ความร้อนด้วย นี่เป็นวิธีที่น่าสนใจในการแสดงภาพความสัมพันธ์ระหว่างตัวแปรในพื้นที่ที่มีมิติสูง ซึ่งสามารถทำได้ง่ายๆ โดยใช้ตัวแปรคุณลักษณะเป็นส่วนหัวของแถวและส่วนหัวของคอลัมน์
- อณูชีววิทยา : แผนที่ความร้อนใช้เพื่อศึกษาความแตกต่างและรูปแบบความคล้ายคลึงกันใน RNA, DNA ฯลฯ
- การแสดงภาพทาง ภูมิศาสตร์ : แผนภูมิแผนที่ความร้อนเชิงพื้นที่ค่อนข้างมีประโยชน์เมื่อต้องแสดงการเปรียบเทียบพื้นที่ทางภูมิศาสตร์ของแผนที่โดยพิจารณาจากเกณฑ์เฉพาะ แผนที่ความร้อนยังช่วยในการวิเคราะห์คลัสเตอร์หรือการวิเคราะห์ฮอตสปอตเพื่อตรวจหากลุ่มกิจกรรมที่มีความเข้มข้นสูง ยกตัวอย่างเช่น การวิเคราะห์ราคาเช่า Airbnb!
- การ ตลาดและการขาย: ความสามารถของแผนที่ความร้อนในการตรวจจับความเย็นและจุดที่อุ่นจะถูกใช้เพื่อเพิ่มอัตราการตอบสนองทางการตลาดโดยการตลาดแบบกำหนดเป้าหมาย แผนที่ความร้อนยังอำนวยความสะดวกในการตรวจหาพื้นที่ที่ตอบสนองต่อแคมเปญ ตลาดที่มีบริการน้อย ที่พักของลูกค้า รวมถึงแนวโน้มการขายที่สูง – สิ่งเหล่านี้ช่วยปรับปรุงกลุ่มผลิตภัณฑ์ ใช้ประโยชน์จากการขายและสร้างกลุ่มลูกค้าเป้าหมายในขณะเดียวกันก็วิเคราะห์ข้อมูลประชากรในภูมิภาค
บทสรุป
แม้ว่าจะมีชุดสีที่แตกต่างกันมากมายที่สามารถแสดงแผนที่ความร้อนได้ แต่ก็ ยังมาพร้อมกับ ข้อดี และข้อเสียสำหรับแต่ละชุด ตัวเลือกจานสีเป็นมากกว่าความสวยงาม โดยเฉพาะอย่างยิ่งเนื่องจาก สีในแผนที่ความร้อนเปิดเผยรูปแบบในข้อมูล ในความเป็นจริง โครงร่างสีที่ดี สามารถปรับปรุงการค้นพบรูปแบบได้ อย่างไรก็ตาม ตัวเลือกที่ไม่ดีสามารถซ่อน มันได้ นอกจากนี้ แผนที่ความร้อนในทะเลยังเป็นแผนที่ความร้อนแบบกริดที่สามารถ นำข้อมูลประเภทต่างๆ มาสร้างแผนที่ความร้อนได้ ดังนั้น จุดประสงค์หลักของแผนที่ความร้อนใต้ท้องทะเลคือการแสดงเมทริกซ์สหสัมพันธ์ โดยการแสดงข้อมูลเป็นภาพ นอกจากนี้ยังช่วยในการค้นหาความสัมพันธ์ระหว่าง คุณสมบัติต่างๆ รวมถึงคุณสมบัติที่ดีที่สุดสำหรับการสร้างแบบจำลองการเรียนรู้ด้วยเครื่อง
หากคุณต้องการเจาะลึกการทำงานกับ Python โดยเฉพาะอย่างยิ่งสำหรับวิทยาศาสตร์ข้อมูล upGrad ขอนำเสนอ Executive PGP ใน Data Science โปรแกรมนี้ออกแบบมาสำหรับผู้เชี่ยวชาญด้านไอทีระดับกลาง วิศวกรซอฟต์แวร์ที่ต้องการสำรวจข้อมูล นักวิเคราะห์ที่ไม่ใช่เทคโนโลยี ผู้เชี่ยวชาญด้านอาชีพเริ่มต้น ฯลฯ หลักสูตรที่มีโครงสร้างของเราและการสนับสนุนที่กว้างขวางทำให้นักเรียนของเราบรรลุศักยภาพสูงสุดโดยไม่มีปัญหา