Como criar um mapa de calor do Python com o Seaborn? [Explicação abrangente]

Publicados: 2021-10-06

As empresas na era do Big Data estão sobrecarregadas com grandes volumes de dados diariamente. No entanto, não é a grande quantidade de dados relevantes, mas o que é feito com os dados que importa. Portanto, o Big Data precisa ser analisado para obter insights que, em última análise, ditarão melhores decisões e influenciarão os movimentos estratégicos de negócios.

Ainda assim, não basta analisar os dados e deixá-los lá. A próxima etapa é a visualização de dados que apresenta os dados em um formato visual para ver e entender padrões, tendências e discrepâncias nos dados. Heatmap em Python é uma das muitas técnicas de visualização de dados.

A visualização de dados refere-se à representação gráfica de dados e pode incluir gráficos, tabelas, mapas e outros elementos visuais. É altamente crítico para analisar grandes quantidades de informações e tomar decisões baseadas em dados.

Este artigo o guiará pelo conceito de um mapa de calor em Python e como criar um usando o Seaborn.

Índice

O que é um mapa de calor?

Um mapa de calor em Python é uma técnica de visualização de dados em que as cores representam como um valor de interesse muda com os valores de duas outras variáveis. É uma representação gráfica bidimensional de dados com valores codificados em cores, proporcionando assim uma visão simplificada, perspicaz e visualmente atraente das informações. A imagem abaixo é uma representação simplificada de um mapa de calor.

Normalmente, um mapa de calor é uma tabela de dados com linhas e colunas representando diferentes conjuntos de categorias. Cada célula na tabela contém um valor lógico ou numérico que determina a cor da célula com base em uma determinada paleta de cores. Assim, os mapas de calor usam cores para enfatizar a relação entre os valores de dados que, de outra forma, seriam difíceis de entender se organizados em uma tabela regular usando números brutos.

Os mapas de calor encontram aplicativos em vários cenários do mundo real. Por exemplo, considere o mapa de calor abaixo. É um mapa de calor do índice de ações que identifica as tendências predominantes no mercado de ações. O mapa de calor usa um esquema de cores frio para quente para mostrar quais ações são de baixa e quais são de alta. O primeiro é representado usando a cor vermelha, enquanto o último é representado em verde.

Fonte

Heatmaps encontram uso em várias outras áreas. Alguns exemplos incluem mapas de calor de sites, mapas de calor geográficos e mapas de calor de esportes. Por exemplo, você pode usar um mapa de calor para entender como a precipitação varia de acordo com o mês do ano em um conjunto de cidades. Os mapas de calor também são extremamente úteis para estudar o comportamento humano.

Mapa de calor de correlação

Um mapa de calor de correlação é uma matriz bidimensional que mostra a correlação entre duas variáveis ​​distintas. As linhas da tabela mostram os valores da primeira variável, enquanto a segunda variável aparece como colunas. Como um mapa de calor normal, um mapa de calor de correlação também vem com uma barra de cores para ler e entender os dados.

O esquema de cores usado é tal que uma extremidade do esquema de cores representa os pontos de dados de baixo valor e a outra extremidade os pontos de dados de alto valor. Portanto, os mapas de calor de correlação são ideais para análise de dados, pois apresentam padrões de forma facilmente legível, ao mesmo tempo em que destacam a variação nos dados.

Dada a seguir é uma representação clássica de um mapa de calor de correlação.

Fonte

Criando um mapa de calor Seaborn em Python

Seaborn é uma biblioteca Python usada para visualização de dados e é baseada em matplotlib. Ele fornece um meio informativo e visualmente atraente para apresentar dados em formato de gráfico estatístico. Em um mapa de calor criado usando seaborn, uma paleta de cores retrata a variação nos dados relacionados. Se você é iniciante e gostaria de ganhar experiência em ciência de dados, confira nossos cursos de ciência de dados.

Etapas para criar um mapa de calor em Python

As etapas a seguir fornecem um esboço de como criar um mapa de calor simples em Python:

  • Importe todos os pacotes necessários
  • Importe o arquivo onde você armazenou seus dados
  • Traçar o mapa de calor
  • Exibir o mapa de calor usando matplotlib

Agora, vamos mostrar como o seaborn, junto com matplotlib e pandas, pode ser usado para gerar um mapa de calor.

Neste exemplo, construiremos um mapa de calor marítimo em Python para 30 ações de empresas farmacêuticas. O mapa de calor resultante mostrará os símbolos de ações e sua respectiva alteração percentual de preço de um dia. Começaremos coletando os dados de mercado das ações farmacêuticas e criaremos um arquivo CSV (Valor separado por vírgula) composto pelos símbolos de ações e sua variação percentual de preço correspondente nas duas primeiras colunas do referido arquivo CSV.

Como estamos trabalhando com 30 empresas farmacêuticas, construiremos uma matriz de mapa de calor com 6 linhas e 5 colunas. Além disso, queremos que o mapa de calor represente a alteração percentual do preço em ordem decrescente. Assim, vamos organizar os estoques no arquivo CSV em ordem decrescente e adicionar mais duas colunas para indicar a posição de cada estoque nos eixos X e Y do mapa de calor marítimo.

Etapa 1: Importando os pacotes Python.

Fonte

Etapa 2: Carregando o conjunto de dados.

O conjunto de dados é lido usando a função read_csv de pandas. Além disso, usamos a instrução print para visualizar as primeiras 10 linhas.

Fonte

Etapa 3: Criando um array Python Numpy.

Tendo em mente a matriz 6 x 5, criaremos um array n-dimensional para as colunas “Symbol” e “Change”.

Fonte

Etapa 4: Criando um pivô em Python.

A partir do objeto de quadro de dados “df”, a função pivô cria uma nova tabela derivada. A função pivot recebe três argumentos – índice, colunas e valores. Os valores das células da nova tabela são retirados da coluna “Alterar”.

Fonte

Etapa 5: Criando uma matriz para anotar o mapa de calor.

O próximo passo é criar uma matriz para anotar o mapa de calor do mar. Para isso, chamaremos o método flatten nas matrizes de “porcentagem” e “símbolo” para nivelar uma lista de listas do Python em uma linha. Além disso, a função zip compacta uma lista em Python. Executaremos um loop for do Python e usaremos a função format para formatar os símbolos de ações e os valores de alteração de preço percentual conforme necessário.

Fonte

Passo 6: Criando a figura do matplotlib e definindo o gráfico.

Nesta etapa, criaremos um gráfico matplotlib vazio e definiremos o tamanho da figura. Além disso, adicionaremos o título do gráfico, definiremos o tamanho da fonte do título e corrigiremos sua distância do gráfico usando o método set_position. Por fim, como queremos exibir apenas os símbolos de ações e sua variação de preço percentual de um dia correspondente, ocultaremos os ticks dos eixos X e Y e removeremos os eixos do gráfico.

Fonte

Etapa 7: criando o mapa de calor

Na última etapa, usaremos a função heatmap do pacote Seaborn Python para criar o mapa de calor. A função heatmap do pacote Seaborn Python usa o seguinte conjunto de argumentos:

  • Dados :

É um conjunto de dados bidimensional que pode ser coagido em uma matriz. Dado um Pandas DataFrame, as linhas e colunas serão rotuladas usando as informações de índice/coluna.

  • Anotar :

É uma matriz da mesma forma que os dados e anota o mapa de calor.

  • cmap:

É um objeto matplotlib ou nome de mapa de cores e mapeia os valores de dados para o espaço de cores.

  • Fmt :

É um código de formatação de string usado ao adicionar anotações.

  • Larguras de linha:

Ele define a largura das linhas que dividem cada célula.

Fonte

A saída final do mapa de calor marítimo para as empresas farmacêuticas escolhidas será assim:

Fonte

Caminho a seguir: Aprenda Python com o Programa de Certificação Profissional do upGrad em Ciência de Dados

O Programa de Certificação Profissional em Ciência de Dados para Tomada de Decisões de Negócios é um programa on-line rigoroso de 8 meses com foco em conceitos de ciência de dados e aprendizado de máquina, com ênfase particular em seus aplicativos de negócios do mundo real. O programa é categoricamente projetado para gerentes e profissionais que desejam desenvolver o conhecimento prático e as habilidades da ciência de dados que os ajudarão a tomar decisões de negócios estratégicas e orientadas por dados.

Veja alguns destaques do curso:

  • Reconhecimento de prestígio do IIM Kozhikode
  • Mais de 200 horas de conteúdo
  • 3 projetos da indústria e uma pedra angular
  • Mais de 20 sessões de aprendizado ao vivo
  • 5+ sessões de coaching especializadas
  • Cobertura de Excel, Tableau, Python, R e Power BI
  • One-on-one com mentores da indústria
  • Suporte de carreira 360 graus
  • Auxílio emprego nas principais empresas

Inscreva-se no upGrad e aprimore suas habilidades de mapa de calor Python para todas as suas necessidades de visualização de dados!

Conclusão

Estatísticos e analistas de dados usam uma infinidade de ferramentas e técnicas para classificar os dados coletados e apresentá-los de maneira fácil de entender e de usar. Nesse sentido, os mapas de calor como técnica de visualização de dados ajudaram empresas de todos os setores a visualizar e entender melhor os dados.

Para resumir, os mapas de calor têm sido amplamente utilizados e ainda são usados ​​como uma das ferramentas estatísticas e analíticas de escolha. Isso ocorre porque eles oferecem um modo de apresentação de dados visualmente atraente e acessível, são facilmente compreensíveis, versáteis, adaptáveis ​​e eliminam as etapas tediosas dos processos tradicionais de análise e interpretação de dados, apresentando todos os valores em um único quadro.

Como você traça um mapa de calor?

Um mapa de calor é uma maneira padrão de plotar dados agrupados em um formato gráfico bidimensional. A ideia básica por trás da plotagem de um mapa de calor é que o gráfico seja dividido em quadrados ou retângulos, cada um representando uma célula na tabela de dados, um conjunto de dados e uma linha. O quadrado ou retângulo é codificado por cores de acordo com o valor dessa célula na tabela.

Um mapa de calor mostra correlação?

Um mapa de calor de correlação é uma representação gráfica de uma matriz de correlação que descreve a correlação entre diferentes variáveis. Os mapas de calor de correlação são muito eficazes se usados ​​corretamente, pois variáveis ​​altamente correlacionadas podem ser facilmente identificadas.

Por que o seaborn é usado em Python?

Seaborn é uma biblioteca Python de código aberto baseada em matplotlib. Ele é usado para análise e visualização exploratória de dados e funciona facilmente com quadros de dados e a biblioteca Pandas. Além disso, os gráficos criados usando seaborn são facilmente personalizáveis.