Как создать тепловую карту Python с помощью Seaborn? [Подробное объяснение]

Опубликовано: 2021-10-06

Компании в эпоху больших данных ежедневно перегружены большими объемами данных. Однако важно не простое количество релевантных данных, а то, что с ними делается. Следовательно, необходимо анализировать большие данные, чтобы получать информацию, которая в конечном итоге будет определять более эффективные решения и влиять на стратегические ходы бизнеса.

Тем не менее, недостаточно просто проанализировать данные и оставить их там. Следующим шагом является визуализация данных, которая представляет данные в визуальном формате, чтобы увидеть и понять закономерности, тенденции и выбросы в данных. Тепловая карта в Python — это один из многих методов визуализации данных.

Визуализация данных относится к графическому представлению данных и может включать в себя графики, диаграммы, карты и другие визуальные элементы. Это очень важно для анализа огромных объемов информации и принятия решений на основе данных.

Эта статья расскажет вам о концепции тепловой карты в Python и о том, как создать ее с помощью Seaborn.

Оглавление

Что такое тепловая карта?

Тепловая карта в Python — это метод визуализации данных, в котором цвета представляют, как интересующее значение изменяется со значениями двух других переменных. Это двумерное графическое представление данных со значениями, закодированными в цветах, что обеспечивает упрощенное, информативное и визуально привлекательное представление информации. Изображение ниже представляет собой упрощенное представление тепловой карты.

Как правило, тепловая карта представляет собой таблицу данных со строками и столбцами, представляющими различные наборы категорий. Каждая ячейка в таблице содержит логическое или числовое значение, определяющее цвет ячейки на основе заданной цветовой палитры. Таким образом, тепловые карты используют цвета, чтобы подчеркнуть взаимосвязь между значениями данных, которые в противном случае было бы сложно понять, если бы они были организованы в обычную таблицу с использованием необработанных чисел.

Тепловые карты находят применение в нескольких реальных сценариях. Например, рассмотрим тепловую карту ниже. Это тепловая карта фондового индекса, которая определяет преобладающие тенденции на фондовом рынке. Тепловая карта использует цветовую схему от холодного к горячему, чтобы показать, какие акции являются медвежьими, а какие бычьими. Первый представлен красным цветом, а второй - зеленым.

Источник

Тепловые карты находят применение и в ряде других областей. Некоторые примеры включают тепловые карты веб-сайтов, географические тепловые карты и спортивные тепловые карты. Например, вы можете использовать тепловую карту, чтобы понять, как количество осадков меняется в зависимости от месяца года в ряде городов. Тепловые карты также очень удобны для изучения человеческого поведения.

Тепловая карта корреляции

Тепловая карта корреляции — это двумерная матрица, показывающая корреляцию между двумя различными переменными. Строки таблицы показывают значения первой переменной, тогда как вторая переменная отображается в виде столбцов. Как и обычная тепловая карта, тепловая карта корреляции также имеет цветную полосу для чтения и понимания данных.

Используемая цветовая схема такова, что один конец цветовой схемы представляет точки данных с низким значением, а другой конец - точки данных с высоким значением. Следовательно, тепловые карты корреляции идеально подходят для анализа данных, поскольку они представляют закономерности в легко читаемой форме, а также выделяют различия в данных.

Ниже приведено классическое представление тепловой карты корреляции.

Источник

Создание тепловой карты Seaborn в Python

Seaborn — это библиотека Python, используемая для визуализации данных и основанная на matplotlib. Он обеспечивает информативную и визуально привлекательную среду для представления данных в формате статистического графика. В тепловой карте, созданной с помощью Seaborn, цветовая палитра отображает изменение связанных данных. Если вы новичок и хотите получить опыт в науке о данных, ознакомьтесь с нашими курсами по науке о данных.

Шаги по созданию тепловой карты в Python

Следующие шаги дают приблизительную схему того, как создать простую тепловую карту в Python:

  • Импортируйте все необходимые пакеты
  • Импортируйте файл, в котором вы сохранили свои данные
  • Постройте тепловую карту
  • Отображение тепловой карты с помощью matplotlib

Теперь давайте покажем вам, как можно использовать seaborn вместе с matplotlib и pandas для создания тепловой карты.

В этом примере мы создадим тепловую карту моря в Python для акций 30 фармацевтических компаний. Полученная тепловая карта покажет символы акций и их соответствующее процентное изменение цены за один день. Мы начнем со сбора рыночных данных об акциях фармацевтических компаний и создадим файл CSV (значения, разделенные запятыми), состоящий из символов акций и соответствующего процентного изменения цены в первых двух столбцах указанного файла CSV.

Поскольку мы работаем с 30 фармацевтическими компаниями, мы построим матрицу тепловой карты, состоящую из 6 строк и 5 столбцов. Кроме того, мы хотим, чтобы тепловая карта отображала процентное изменение цены в порядке убывания. Итак, мы расположим акции в CSV-файле в порядке убывания и добавим еще два столбца, чтобы указать положение каждой акции по осям X и Y тепловой карты Seaborn.

Шаг 1: Импорт пакетов Python.

Источник

Шаг 2: Загрузка набора данных.

Набор данных читается с помощью функции read_csv от pandas. Далее мы используем оператор печати для визуализации первых 10 строк.

Источник

Шаг 3: Создание массива Python Numpy.

Помня о матрице 6 x 5, мы создадим n-мерный массив для столбцов «Символ» и «Изменение».

Источник

Шаг 4: Создание сводки в Python.

Из заданного объекта фрейма данных «df» функция свода создает новую производную таблицу. Функция сводки принимает три аргумента — индекс, столбцы и значения. Значения ячеек новой таблицы берутся из столбца «Изменить».

Источник

Шаг 5: Создание массива для аннотирования тепловой карты.

Следующим шагом является создание массива для аннотирования тепловой карты моря. Для этого мы вызовем метод flatten для массивов «процент» и «символ», чтобы сгладить список списков Python в одну строку. Кроме того, функция zip заархивирует список в Python. Мы запустим цикл Python for и используем функцию форматирования для форматирования символов акций и процентных значений изменения цены по мере необходимости.

Источник

Шаг 6: Создание рисунка matplotlib и определение графика.

На этом шаге мы создадим пустой график matplotlib и определим размер фигуры. Кроме того, мы добавим заголовок графика, установим размер шрифта заголовка и зафиксируем его расстояние от графика с помощью метода set_position. Наконец, поскольку мы хотим отображать только символы акций и их соответствующее процентное изменение цены за один день, мы скроем галочки для осей X и Y и удалим оси с графика.

Источник

Шаг 7: Создание тепловой карты

На последнем шаге мы будем использовать функцию тепловой карты из пакета Seaborn Python для создания тепловой карты. Функция тепловой карты пакета Seaborn Python принимает следующий набор аргументов:

  • Данные :

Это двумерный набор данных, который можно преобразовать в массив. Учитывая Pandas DataFrame, строки и столбцы будут помечены с использованием информации индекса/столбца.

  • Аннот :

Это массив той же формы, что и данные, и он аннотирует тепловую карту.

  • смап:

Это имя объекта matplotlib или цветовой карты, которое сопоставляет значения данных с цветовым пространством.

  • Фмт :

Это код форматирования строки, используемый при добавлении аннотаций.

  • Ширина линии:

Он устанавливает ширину линий, разделяющих каждую ячейку.

Источник

Окончательный результат тепловой карты Seaborn для выбранных фармкомпаний будет выглядеть следующим образом:

Источник

Путь вперед: изучайте Python с помощью программы профессионального сертификата upGrad в области науки о данных

Программа профессионального сертификата в области науки о данных для принятия бизнес-решений — это строгая 8-месячная онлайн-программа, посвященная науке о данных и концепциям машинного обучения с особым акцентом на их реальных бизнес-приложениях. Программа категорически предназначена для менеджеров и работающих специалистов, которые хотят развить практические знания и навыки в области науки о данных, которые помогут им принимать стратегические и основанные на данных бизнес-решения.

Вот некоторые основные моменты курса:

  • Престижное признание от ИИМ Кожикоде
  • 200+ часов контента
  • 3 отраслевых проекта и замковый камень
  • 20+ живых обучающих сессий
  • 5+ экспертных коуч-сессий
  • Покрытие Excel, Tableau, Python, R и Power BI
  • Один на один с отраслевыми наставниками
  • Карьерная поддержка на 360 градусов
  • Помощь в трудоустройстве с ведущими фирмами

Зарегистрируйтесь в upGrad и отточите свои навыки работы с тепловыми картами Python для всех ваших потребностей в визуализации данных!

Заключение

Статистики и аналитики данных используют множество инструментов и методов для сортировки сопоставленных данных и представления их в понятном и удобном для пользователя виде. В связи с этим тепловые карты как метод визуализации данных помогли предприятиям во всех секторах лучше визуализировать и понимать данные.

Подводя итог, можно сказать, что тепловые карты широко использовались и до сих пор используются в качестве одного из предпочтительных статистических и аналитических инструментов. Это связано с тем, что они предлагают визуально привлекательный и доступный способ представления данных, легко понятны, универсальны, адаптируемы и устраняют утомительные этапы традиционных процессов анализа и интерпретации данных, представляя все значения в одном кадре.

Как построить тепловую карту?

Тепловая карта — это стандартный способ отображения сгруппированных данных в двумерном графическом формате. Основная идея построения тепловой карты заключается в том, что график делится на квадраты или прямоугольники, каждый из которых представляет одну ячейку в таблице данных, один набор данных и одну строку. Квадрат или прямоугольник имеют цветовую кодировку в соответствии со значением этой ячейки в таблице.

Показывает ли тепловая карта корреляцию?

Тепловая карта корреляции — это графическое представление корреляционной матрицы, отображающее корреляцию между различными переменными. Тепловые карты корреляции очень эффективны при правильном использовании, поскольку можно легко идентифицировать сильно коррелированные переменные.

Почему Seaborn используется в Python?

Seaborn — это библиотека Python с открытым исходным кодом, основанная на matplotlib. Он используется для исследовательского анализа и визуализации данных и легко работает с фреймами данных и библиотекой Pandas. Кроме того, графики, созданные с помощью Seaborn, легко настраиваются.