Бинарная логистическая регрессия: обзор, возможности и предположения
Опубликовано: 2021-10-05Одно из наиболее распространенных определений машинного обучения звучит примерно так:
«Говорят, что компьютерная программа учится на опыте E в отношении некоторого класса задач T и показателя производительности P, если ее производительность при выполнении задач в T, измеряемая P, улучшается с опытом E».
Теперь, чтобы улучшить производительность машины с течением времени при выполнении одного и того же класса задач, используются разные алгоритмы для оптимизации производительности машины и приближения ее к желаемым результатам. Регрессионный анализ является одним из основных и наиболее часто используемых методов повышения производительности машины.
Он состоит из набора методов машинного обучения для прогнозирования непрерывной выходной переменной на основе значений одной или нескольких переменных-предикторов. Регрессионный анализ направлен на разработку математического уравнения, которое может определить непрерывную переменную как функцию предикторной переменной.
В одной из наших предыдущих статей мы рассмотрели логистическую регрессию и то, как реализовать логистическую регрессию в Python. Мы также кратко рассказали о трех различных видах логистической регрессии в машинном обучении. В этой статье давайте подробно рассмотрим бинарную логистическую регрессию вместе с ее обзором, возможностями и предположениями.
Оглавление
Обзор бинарной логистической регрессии
Бинарную или биномиальную логистическую регрессию можно понимать как тип логистической регрессии, который имеет дело со сценариями, в которых наблюдаемые результаты для зависимых переменных могут быть только бинарными, т. е. могут иметь только два возможных типа. Эти два типа классов могут быть 0 или 1, пройти или не пройти, мертвый или живой, выиграть или проиграть и так далее.
Полиномиальная логистическая регрессия работает в сценариях, где результат может иметь более двух возможных типов — болезнь А, болезнь В и болезнь С — которые не расположены в каком-либо определенном порядке. Еще одним типом логистической регрессии является порядковая логистическая регрессия, которая имеет дело с зависимыми переменными в упорядоченном порядке.
В бинарной логистической регрессии возможные результаты обычно определяются как 0 или 1, поскольку это приводит к наиболее простой интерпретации и пониманию регрессионной модели. Если конкретный результат для любой зависимой переменной является успешным или заслуживающим внимания результатом, он кодируется как 0, а если он неуспешен или неудачен, он кодируется как 0.
Проще говоря, бинарную логистическую регрессию можно использовать для тщательного и точного прогнозирования шансов наличия случая на основе значений предикторов или независимых переменных.
Возможности бинарной логистической регрессии — типы вопросов, на которые она может ответить
Как упоминалось выше, бинарная логистическая регрессия идеально подходит для сценариев, в которых выходные данные могут принадлежать к одному из двух классов или групп. В результате бинарная логистическая регрессия лучше всего подходит для ответов на вопросы следующего характера:
- Изменяется ли вероятность заболеть раком на каждый дополнительный кг у человека с избыточным весом?
- Изменяется ли указанная вероятность для каждой выкуриваемой в день пачки сигарет?
- Влияют ли масса тела, потребление жира, потребление калорий и возраст на вероятность сердечного приступа?
Как видите, ответы на все три вопроса могут быть да или нет, 0 или 1. Таким образом, бинарная логистическая регрессия может быть использована для точного ответа на эти вопросы.
Основное предположение бинарной логистической регрессии
Как и любой другой алгоритм машинного обучения, бинарная логистическая регрессия также работает с некоторыми предположениями. Вот те:
- Зависимая переменная является дихотомической. То есть он либо присутствует, либо отсутствует, но никогда не то и другое одновременно.
- В данных не должно быть выбросов.
- Между различными предикторами не должно быть высокой корреляции или мультиколлинеарности. Это можно оценить с помощью матрицы корреляции между различными предикторами.
В заключение
Бинарная логистическая регрессия помогает во многих случаях использования машинного обучения. От выявления неплательщиков кредита до помощи предприятиям в удержании клиентов — бинарная логистическая регрессия может быть расширена для решения даже более сложных бизнес-задач. Однако вы должны помнить, что это всего лишь один из множества методов алгоритмов машинного обучения. Как только вы освоите регрессионный анализ, вы перейдете к более сложным и нюансированным темам.
Однако, если вы все еще пытаетесь разобраться в регрессионном анализе и начинаете свое путешествие по машинному обучению, мы рекомендуем вам наш список курсов по машинному обучению . В upGrad у нас есть база учащихся в более чем 85 странах, более 40 000 платных учащихся по всему миру, а наши программы затронули более 500 000 работающих специалистов.
Наш магистр наук в области машинного обучения и искусственного интеллекта , предлагаемый в сотрудничестве с Ливерпульским университетом Джона Мура, призван помочь учащимся начать с нуля и получить достаточно знаний для работы над реальными проектами. Наша комплексная карьерная поддержка на 360 градусов гарантирует, что вы полностью подготовлены к тому, чтобы занимать ведущие должности в отрасли. Так что свяжитесь с нами сегодня и испытайте силу взаимного обучения и глобальной сети!
Байесовские статистические модели основаны на математических процедурах и используют концепцию вероятности для решения статистических задач. Они предоставляют людям доказательства того, что они могут полагаться на новые данные и делать прогнозы на основе параметров модели. Это полезный метод в статистике, когда мы полагаемся на новые данные и информацию для обновления вероятности гипотезы с использованием теоремы Байеса. Байесовские модели уникальны тем, что всем параметрам в статистической модели, наблюдаемым или ненаблюдаемым, присваивается совместное распределение вероятностей.Для чего используется модель байесовской статистики?
Что такое байесовский вывод?
Уникальны ли байесовские модели?