Как создать тепловую карту Python с помощью Seaborn? [Подробное объяснение]
Опубликовано: 2021-10-06Компании в эпоху больших данных ежедневно перегружены большими объемами данных. Однако важно не простое количество релевантных данных, а то, что с ними делается. Следовательно, необходимо анализировать большие данные, чтобы получать информацию, которая в конечном итоге будет определять более эффективные решения и влиять на стратегические ходы бизнеса.
Тем не менее, недостаточно просто проанализировать данные и оставить их там. Следующим шагом является визуализация данных, которая представляет данные в визуальном формате, чтобы увидеть и понять закономерности, тенденции и выбросы в данных. Тепловая карта в Python — это один из многих методов визуализации данных.
Визуализация данных относится к графическому представлению данных и может включать в себя графики, диаграммы, карты и другие визуальные элементы. Это очень важно для анализа огромных объемов информации и принятия решений на основе данных.
Эта статья расскажет вам о концепции тепловой карты в Python и о том, как создать ее с помощью Seaborn.
Оглавление
Что такое тепловая карта?
Тепловая карта в Python — это метод визуализации данных, в котором цвета представляют, как интересующее значение изменяется со значениями двух других переменных. Это двумерное графическое представление данных со значениями, закодированными в цветах, что обеспечивает упрощенное, информативное и визуально привлекательное представление информации. Изображение ниже представляет собой упрощенное представление тепловой карты.
Как правило, тепловая карта представляет собой таблицу данных со строками и столбцами, представляющими различные наборы категорий. Каждая ячейка в таблице содержит логическое или числовое значение, определяющее цвет ячейки на основе заданной цветовой палитры. Таким образом, тепловые карты используют цвета, чтобы подчеркнуть взаимосвязь между значениями данных, которые в противном случае было бы сложно понять, если бы они были организованы в обычную таблицу с использованием необработанных чисел.
Тепловые карты находят применение в нескольких реальных сценариях. Например, рассмотрим тепловую карту ниже. Это тепловая карта фондового индекса, которая определяет преобладающие тенденции на фондовом рынке. Тепловая карта использует цветовую схему от холодного к горячему, чтобы показать, какие акции являются медвежьими, а какие бычьими. Первый представлен красным цветом, а второй - зеленым.
Источник
Тепловые карты находят применение и в ряде других областей. Некоторые примеры включают тепловые карты веб-сайтов, географические тепловые карты и спортивные тепловые карты. Например, вы можете использовать тепловую карту, чтобы понять, как количество осадков меняется в зависимости от месяца года в ряде городов. Тепловые карты также очень удобны для изучения человеческого поведения.
Тепловая карта корреляции
Тепловая карта корреляции — это двумерная матрица, показывающая корреляцию между двумя различными переменными. Строки таблицы показывают значения первой переменной, тогда как вторая переменная отображается в виде столбцов. Как и обычная тепловая карта, тепловая карта корреляции также имеет цветную полосу для чтения и понимания данных.
Используемая цветовая схема такова, что один конец цветовой схемы представляет точки данных с низким значением, а другой конец - точки данных с высоким значением. Следовательно, тепловые карты корреляции идеально подходят для анализа данных, поскольку они представляют закономерности в легко читаемой форме, а также выделяют различия в данных.
Ниже приведено классическое представление тепловой карты корреляции.
Источник
Создание тепловой карты Seaborn в Python
Seaborn — это библиотека Python, используемая для визуализации данных и основанная на matplotlib. Он обеспечивает информативную и визуально привлекательную среду для представления данных в формате статистического графика. В тепловой карте, созданной с помощью Seaborn, цветовая палитра отображает изменение связанных данных. Если вы новичок и хотите получить опыт в науке о данных, ознакомьтесь с нашими курсами по науке о данных.
Шаги по созданию тепловой карты в Python
Следующие шаги дают приблизительную схему того, как создать простую тепловую карту в Python:
- Импортируйте все необходимые пакеты
- Импортируйте файл, в котором вы сохранили свои данные
- Постройте тепловую карту
- Отображение тепловой карты с помощью matplotlib
Теперь давайте покажем вам, как можно использовать seaborn вместе с matplotlib и pandas для создания тепловой карты.
В этом примере мы создадим тепловую карту моря в Python для акций 30 фармацевтических компаний. Полученная тепловая карта покажет символы акций и их соответствующее процентное изменение цены за один день. Мы начнем со сбора рыночных данных об акциях фармацевтических компаний и создадим файл CSV (значения, разделенные запятыми), состоящий из символов акций и соответствующего процентного изменения цены в первых двух столбцах указанного файла CSV.
Поскольку мы работаем с 30 фармацевтическими компаниями, мы построим матрицу тепловой карты, состоящую из 6 строк и 5 столбцов. Кроме того, мы хотим, чтобы тепловая карта отображала процентное изменение цены в порядке убывания. Итак, мы расположим акции в CSV-файле в порядке убывания и добавим еще два столбца, чтобы указать положение каждой акции по осям X и Y тепловой карты Seaborn.
Шаг 1: Импорт пакетов Python.
Источник
Шаг 2: Загрузка набора данных.
Набор данных читается с помощью функции read_csv от pandas. Далее мы используем оператор печати для визуализации первых 10 строк.
Источник
Шаг 3: Создание массива Python Numpy.
Помня о матрице 6 x 5, мы создадим n-мерный массив для столбцов «Символ» и «Изменение».
Источник
Шаг 4: Создание сводки в Python.
Из заданного объекта фрейма данных «df» функция свода создает новую производную таблицу. Функция сводки принимает три аргумента — индекс, столбцы и значения. Значения ячеек новой таблицы берутся из столбца «Изменить».
Источник
Шаг 5: Создание массива для аннотирования тепловой карты.
Следующим шагом является создание массива для аннотирования тепловой карты моря. Для этого мы вызовем метод flatten для массивов «процент» и «символ», чтобы сгладить список списков Python в одну строку. Кроме того, функция zip заархивирует список в Python. Мы запустим цикл Python for и используем функцию форматирования для форматирования символов акций и процентных значений изменения цены по мере необходимости.
Источник
Шаг 6: Создание рисунка matplotlib и определение графика.
На этом шаге мы создадим пустой график matplotlib и определим размер фигуры. Кроме того, мы добавим заголовок графика, установим размер шрифта заголовка и зафиксируем его расстояние от графика с помощью метода set_position. Наконец, поскольку мы хотим отображать только символы акций и их соответствующее процентное изменение цены за один день, мы скроем галочки для осей X и Y и удалим оси с графика.
Источник
Шаг 7: Создание тепловой карты
На последнем шаге мы будем использовать функцию тепловой карты из пакета Seaborn Python для создания тепловой карты. Функция тепловой карты пакета Seaborn Python принимает следующий набор аргументов:
Данные :
Это двумерный набор данных, который можно преобразовать в массив. Учитывая Pandas DataFrame, строки и столбцы будут помечены с использованием информации индекса/столбца.
Аннот :
Это массив той же формы, что и данные, и он аннотирует тепловую карту.
смап:
Это имя объекта matplotlib или цветовой карты, которое сопоставляет значения данных с цветовым пространством.
Фмт :
Это код форматирования строки, используемый при добавлении аннотаций.
Ширина линии:
Он устанавливает ширину линий, разделяющих каждую ячейку.
Источник
Окончательный результат тепловой карты Seaborn для выбранных фармкомпаний будет выглядеть следующим образом:
Источник
Путь вперед: изучайте Python с помощью программы профессионального сертификата upGrad в области науки о данных
Программа профессионального сертификата в области науки о данных для принятия бизнес-решений — это строгая 8-месячная онлайн-программа, посвященная науке о данных и концепциям машинного обучения с особым акцентом на их реальных бизнес-приложениях. Программа категорически предназначена для менеджеров и работающих специалистов, которые хотят развить практические знания и навыки в области науки о данных, которые помогут им принимать стратегические и основанные на данных бизнес-решения.
Вот некоторые основные моменты курса:
- Престижное признание от ИИМ Кожикоде
- 200+ часов контента
- 3 отраслевых проекта и замковый камень
- 20+ живых обучающих сессий
- 5+ экспертных коуч-сессий
- Покрытие Excel, Tableau, Python, R и Power BI
- Один на один с отраслевыми наставниками
- Карьерная поддержка на 360 градусов
- Помощь в трудоустройстве с ведущими фирмами
Зарегистрируйтесь в upGrad и отточите свои навыки работы с тепловыми картами Python для всех ваших потребностей в визуализации данных!
Заключение
Статистики и аналитики данных используют множество инструментов и методов для сортировки сопоставленных данных и представления их в понятном и удобном для пользователя виде. В связи с этим тепловые карты как метод визуализации данных помогли предприятиям во всех секторах лучше визуализировать и понимать данные.
Подводя итог, можно сказать, что тепловые карты широко использовались и до сих пор используются в качестве одного из предпочтительных статистических и аналитических инструментов. Это связано с тем, что они предлагают визуально привлекательный и доступный способ представления данных, легко понятны, универсальны, адаптируемы и устраняют утомительные этапы традиционных процессов анализа и интерпретации данных, представляя все значения в одном кадре.
Как построить тепловую карту?
Тепловая карта — это стандартный способ отображения сгруппированных данных в двумерном графическом формате. Основная идея построения тепловой карты заключается в том, что график делится на квадраты или прямоугольники, каждый из которых представляет одну ячейку в таблице данных, один набор данных и одну строку. Квадрат или прямоугольник имеют цветовую кодировку в соответствии со значением этой ячейки в таблице.
Показывает ли тепловая карта корреляцию?
Тепловая карта корреляции — это графическое представление корреляционной матрицы, отображающее корреляцию между различными переменными. Тепловые карты корреляции очень эффективны при правильном использовании, поскольку можно легко идентифицировать сильно коррелированные переменные.
Почему Seaborn используется в Python?
Seaborn — это библиотека Python с открытым исходным кодом, основанная на matplotlib. Он используется для исследовательского анализа и визуализации данных и легко работает с фреймами данных и библиотекой Pandas. Кроме того, графики, созданные с помощью Seaborn, легко настраиваются.