¿Cómo crear un mapa de calor de Python con Seaborn? [Explicación completa]
Publicado: 2021-10-06Las empresas en la era de Big Data se ven abrumadas por grandes volúmenes de datos en el día a día. Sin embargo, no es la gran cantidad de datos relevantes sino lo que se hace con los datos lo que importa. Por lo tanto, Big Data debe analizarse para obtener información que, en última instancia, dictará mejores decisiones e influirá en los movimientos comerciales estratégicos.
Aún así, no es suficiente analizar los datos y dejarlos ahí. El siguiente paso es la visualización de datos que presenta los datos en un formato visual para ver y comprender patrones, tendencias y valores atípicos en los datos. Heatmap en Python es una de las muchas técnicas de visualización de datos.
La visualización de datos se refiere a la representación gráfica de datos y puede incluir gráficos, cuadros, mapas y otros elementos visuales. Es muy importante para analizar enormes cantidades de información y tomar decisiones basadas en datos.
Este artículo lo guiará a través del concepto de un mapa de calor en Python y cómo crear uno usando Seaborn.
Tabla de contenido
¿Qué es un mapa de calor?
Un mapa de calor en Python es una técnica de visualización de datos donde los colores representan cómo cambia un valor de interés con los valores de otras dos variables. Es una representación gráfica bidimensional de datos con valores codificados en colores, lo que brinda una vista simplificada, perspicaz y visualmente atractiva de la información. La siguiente imagen es una representación simplificada de un mapa de calor.
Por lo general, un mapa de calor es una tabla de datos con filas y columnas que representan diferentes conjuntos de categorías. Cada celda de la tabla contiene un valor lógico o numérico que determina el color de la celda en función de una paleta de colores determinada. Por lo tanto, los mapas de calor usan colores para enfatizar la relación entre los valores de los datos que, de otro modo, serían difíciles de entender si se organizaran en una tabla regular usando números sin procesar.
Los mapas de calor encuentran aplicaciones en varios escenarios del mundo real. Por ejemplo, considere el siguiente mapa de calor. Es un mapa de calor del índice bursátil que identifica las tendencias predominantes en el mercado de valores. El mapa de calor utiliza un esquema de color de frío a caliente para mostrar qué acciones son bajistas y cuáles son alcistas. El primero se representa con el color rojo, mientras que el segundo se representa con el verde.
Fuente
Los mapas de calor encuentran uso en varias otras áreas. Algunos ejemplos incluyen mapas de calor de sitios web, mapas de calor geográficos y mapas de calor deportivos. Por ejemplo, podría usar un mapa de calor para comprender cómo varía la precipitación según el mes del año en un conjunto de ciudades. Los mapas de calor también son extremadamente útiles para estudiar el comportamiento humano.
Mapa de calor de correlación
Un mapa de calor de correlación es una matriz bidimensional que muestra la correlación entre dos variables distintas. Las filas de la tabla muestran los valores de la primera variable, mientras que la segunda variable aparece como las columnas. Al igual que un mapa de calor regular, un mapa de calor de correlación también viene con una barra de colores para leer y comprender los datos.
El esquema de color utilizado es tal que un extremo del esquema de color representa los puntos de datos de bajo valor y el otro extremo los puntos de datos de alto valor. Por lo tanto, los mapas de calor de correlación son ideales para el análisis de datos, ya que presentan patrones en una forma fácil de leer y, al mismo tiempo, resaltan la variación en los datos.
A continuación se muestra una representación clásica de un mapa de calor de correlación.
Fuente
Crear un mapa de calor de Seaborn en Python
Seaborn es una biblioteca de Python utilizada para la visualización de datos y se basa en matplotlib. Proporciona un medio informativo y visualmente atractivo para presentar datos en un formato de gráfico estadístico. En un mapa de calor creado con seaborn, una paleta de colores representa la variación en los datos relacionados. Si es un principiante y le gustaría adquirir experiencia en ciencia de datos, consulte nuestros cursos de ciencia de datos.
Pasos para crear un mapa de calor en Python
Los siguientes pasos brindan un resumen aproximado de cómo crear un mapa de calor simple en Python:
- Importar todos los paquetes requeridos
- Importa el archivo donde tienes guardados tus datos
- Trazar el mapa de calor
- Mostrar el mapa de calor usando matplotlib
Ahora, permítanos mostrarle cómo se puede usar seaborn, junto con matplotlib y pandas, para generar un mapa de calor.
En este ejemplo, construiremos un mapa de calor marítimo en Python para 30 acciones de compañías farmacéuticas. El mapa de calor resultante mostrará los símbolos bursátiles y su respectivo porcentaje de cambio de precio de un solo día. Comenzaremos recopilando los datos de mercado sobre las acciones farmacéuticas y crearemos un archivo CSV (Valor separado por comas) que consiste en los símbolos de las acciones y su cambio de precio porcentual correspondiente en las dos primeras columnas de dicho archivo CSV.
Dado que estamos trabajando con 30 compañías farmacéuticas, construiremos una matriz de mapa de calor que comprende 6 filas y 5 columnas. Además, queremos que el mapa de calor represente el cambio de precio porcentual en orden descendente. Entonces, ordenaremos las acciones en el archivo CSV en orden descendente y agregaremos dos columnas más para indicar la posición de cada acción en los ejes X e Y del mapa de calor marítimo.
Paso 1: Importación de los paquetes de Python.
Fuente
Paso 2: Cargar el conjunto de datos.
El conjunto de datos se lee usando la función read_csv de pandas. Además, usamos la declaración de impresión para visualizar las primeras 10 filas.
Fuente
Paso 3: Creación de una matriz Python Numpy.
Teniendo en cuenta la matriz de 6 x 5, crearemos una matriz de n dimensiones para las columnas "Símbolo" y "Cambio".
Fuente
Paso 4: Crear un pivote en Python.
A partir del objeto de marco de datos dado "df", la función pivote crea una nueva tabla derivada. La función pivote toma tres argumentos: índice, columnas y valores. Los valores de las celdas de la nueva tabla se toman de la columna “Cambiar”.
Fuente
Paso 5: crear una matriz para anotar el mapa de calor.
El siguiente paso es crear una matriz para anotar el mapa de calor marino. Para esto, llamaremos al método flatten en las matrices "porcentaje" y "símbolo" para aplanar una lista de listas de Python en una línea. Además, la función zip comprime una lista en Python. Ejecutaremos un bucle for de Python y usaremos la función de formato para formatear los símbolos de acciones y los valores de cambio de precio porcentual según sea necesario.
Fuente
Paso 6: Creación de la figura de matplotlib y definición de la trama.
En este paso, crearemos un gráfico matplotlib vacío y definiremos el tamaño de la figura. Además, agregaremos el título de la trama, estableceremos el tamaño de fuente del título y fijaremos su distancia de la trama mediante el método set_position. Finalmente, dado que solo queremos mostrar los símbolos bursátiles y su correspondiente cambio de precio porcentual de un solo día, ocultaremos las marcas de los ejes X e Y y eliminaremos los ejes del gráfico.
Fuente
Paso 7: Creando el mapa de calor
En el último paso, usaremos la función de mapa de calor del paquete Seaborn de Python para crear el mapa de calor. La función de mapa de calor del paquete Seaborn de Python toma el siguiente conjunto de argumentos:
Datos :
Es un conjunto de datos bidimensional que se puede convertir en una matriz. Dado un DataFrame de Pandas, las filas y columnas se etiquetarán utilizando la información de índice/columna.
Anotar :
Es una matriz de la misma forma que los datos y anota el mapa de calor.
mapa:
Es un objeto matplotlib o un nombre de mapa de colores y asigna los valores de datos al espacio de color.
Fmt :
Es un código de formato de cadena que se usa al agregar anotaciones.
anchos de línea:
Establece el ancho de las líneas que dividen cada celda.
Fuente
El resultado final del mapa de calor marino para las compañías farmacéuticas elegidas se verá así:
Fuente
Camino a seguir: aprenda Python con el programa de certificado profesional en ciencia de datos de upGrad
El Programa de Certificado Profesional en Ciencia de Datos para la Toma de Decisiones Empresariales es un riguroso programa en línea de 8 meses que se enfoca en conceptos de ciencia de datos y aprendizaje automático con énfasis particular en sus aplicaciones comerciales del mundo real. El programa está diseñado categóricamente para gerentes y profesionales en activo que desean desarrollar el conocimiento práctico y las habilidades de la ciencia de datos que los ayudarán a tomar decisiones comerciales estratégicas y basadas en datos.
Aquí hay algunos aspectos destacados del curso:
- Prestigioso reconocimiento de IIM Kozhikode
- Más de 200 horas de contenido
- 3 proyectos industriales y un capstone
- Más de 20 sesiones de aprendizaje en vivo
- Más de 5 sesiones de coaching de expertos
- Cobertura de Excel, Tableau, Python, R y Power BI
- Uno a uno con mentores de la industria
- Apoyo profesional de 360 grados
- Asistencia laboral con las mejores empresas.
¡Regístrese en upGrad y perfeccione sus habilidades de mapa de calor de Python para todas sus necesidades de visualización de datos!
Conclusión
Los estadísticos y los analistas de datos utilizan una gran cantidad de herramientas y técnicas para clasificar los datos recopilados y presentarlos de una manera fácilmente comprensible y fácil de usar. En este sentido, los mapas de calor como técnica de visualización de datos han ayudado a las empresas de todos los sectores a visualizar y comprender mejor los datos.
En resumen, los mapas de calor se han utilizado ampliamente y todavía se utilizan como una de las herramientas estadísticas y analíticas preferidas. Esto se debe a que ofrecen un modo de presentación de datos visualmente atractivo y accesible, son fácilmente comprensibles, versátiles, adaptables y eliminan los tediosos pasos de los procesos tradicionales de análisis e interpretación de datos al presentar todos los valores en un solo marco.
¿Cómo trazas un mapa de calor?
Un mapa de calor es una forma estándar de trazar datos agrupados en un formato gráfico bidimensional. La idea básica detrás de trazar un mapa de calor es que el gráfico se divide en cuadrados o rectángulos, cada uno de los cuales representa una celda en la tabla de datos, un conjunto de datos y una fila. El cuadrado o rectángulo está codificado por colores según el valor de esa celda en la tabla.
¿Un mapa de calor muestra correlación?
Un mapa de calor de correlación es una representación gráfica de una matriz de correlación que muestra la correlación entre diferentes variables. Los mapas de calor de correlación son muy efectivos si se usan correctamente, ya que las variables altamente correlacionadas se pueden identificar fácilmente.
¿Por qué se usa seaborn en Python?
Seaborn es una biblioteca Python de código abierto basada en matplotlib. Se utiliza para el análisis y la visualización de datos exploratorios y funciona fácilmente con marcos de datos y la biblioteca Pandas. Además, los gráficos creados con Seaborn son fácilmente personalizables.