Бинарная логистическая регрессия: обзор, возможности и предположения

Опубликовано: 2021-10-05

Одно из наиболее распространенных определений машинного обучения звучит примерно так:

«Говорят, что компьютерная программа учится на опыте E в отношении некоторого класса задач T и показателя производительности P, если ее производительность при выполнении задач в T, измеряемая P, улучшается с опытом E».

Теперь, чтобы улучшить производительность машины с течением времени при выполнении одного и того же класса задач, используются разные алгоритмы для оптимизации производительности машины и приближения ее к желаемым результатам. Регрессионный анализ является одним из основных и наиболее часто используемых методов повышения производительности машины.

Он состоит из набора методов машинного обучения для прогнозирования непрерывной выходной переменной на основе значений одной или нескольких переменных-предикторов. Регрессионный анализ направлен на разработку математического уравнения, которое может определить непрерывную переменную как функцию предикторной переменной.

В одной из наших предыдущих статей мы рассмотрели логистическую регрессию и то, как реализовать логистическую регрессию в Python. Мы также кратко рассказали о трех различных видах логистической регрессии в машинном обучении. В этой статье давайте подробно рассмотрим бинарную логистическую регрессию вместе с ее обзором, возможностями и предположениями.

Оглавление

Обзор бинарной логистической регрессии

Бинарную или биномиальную логистическую регрессию можно понимать как тип логистической регрессии, который имеет дело со сценариями, в которых наблюдаемые результаты для зависимых переменных могут быть только бинарными, т. е. могут иметь только два возможных типа. Эти два типа классов могут быть 0 или 1, пройти или не пройти, мертвый или живой, выиграть или проиграть и так далее.

Полиномиальная логистическая регрессия работает в сценариях, где результат может иметь более двух возможных типов — болезнь А, болезнь В и болезнь С — которые не расположены в каком-либо определенном порядке. Еще одним типом логистической регрессии является порядковая логистическая регрессия, которая имеет дело с зависимыми переменными в упорядоченном порядке.

В бинарной логистической регрессии возможные результаты обычно определяются как 0 или 1, поскольку это приводит к наиболее простой интерпретации и пониманию регрессионной модели. Если конкретный результат для любой зависимой переменной является успешным или заслуживающим внимания результатом, он кодируется как 0, а если он неуспешен или неудачен, он кодируется как 0.

Проще говоря, бинарную логистическую регрессию можно использовать для тщательного и точного прогнозирования шансов наличия случая на основе значений предикторов или независимых переменных.

Возможности бинарной логистической регрессии — типы вопросов, на которые она может ответить

Как упоминалось выше, бинарная логистическая регрессия идеально подходит для сценариев, в которых выходные данные могут принадлежать к одному из двух классов или групп. В результате бинарная логистическая регрессия лучше всего подходит для ответов на вопросы следующего характера:

  • Изменяется ли вероятность заболеть раком на каждый дополнительный кг у человека с избыточным весом?
  • Изменяется ли указанная вероятность для каждой выкуриваемой в день пачки сигарет?
  • Влияют ли масса тела, потребление жира, потребление калорий и возраст на вероятность сердечного приступа?

Как видите, ответы на все три вопроса могут быть да или нет, 0 или 1. Таким образом, бинарная логистическая регрессия может быть использована для точного ответа на эти вопросы.

Основное предположение бинарной логистической регрессии

Как и любой другой алгоритм машинного обучения, бинарная логистическая регрессия также работает с некоторыми предположениями. Вот те:

  • Зависимая переменная является дихотомической. То есть он либо присутствует, либо отсутствует, но никогда не то и другое одновременно.
  • В данных не должно быть выбросов.
  • Между различными предикторами не должно быть высокой корреляции или мультиколлинеарности. Это можно оценить с помощью матрицы корреляции между различными предикторами.

В заключение

Бинарная логистическая регрессия помогает во многих случаях использования машинного обучения. От выявления неплательщиков кредита до помощи предприятиям в удержании клиентов — бинарная логистическая регрессия может быть расширена для решения даже более сложных бизнес-задач. Однако вы должны помнить, что это всего лишь один из множества методов алгоритмов машинного обучения. Как только вы освоите регрессионный анализ, вы перейдете к более сложным и нюансированным темам.

Однако, если вы все еще пытаетесь разобраться в регрессионном анализе и начинаете свое путешествие по машинному обучению, мы рекомендуем вам наш список курсов по машинному обучению . В upGrad у нас есть база учащихся в более чем 85 странах, более 40 000 платных учащихся по всему миру, а наши программы затронули более 500 000 работающих специалистов.

Наш магистр наук в области машинного обучения и искусственного интеллекта , предлагаемый в сотрудничестве с Ливерпульским университетом Джона Мура, призван помочь учащимся начать с нуля и получить достаточно знаний для работы над реальными проектами. Наша комплексная карьерная поддержка на 360 градусов гарантирует, что вы полностью подготовлены к тому, чтобы занимать ведущие должности в отрасли. Так что свяжитесь с нами сегодня и испытайте силу взаимного обучения и глобальной сети!

Для чего используется модель байесовской статистики?

Байесовские статистические модели основаны на математических процедурах и используют концепцию вероятности для решения статистических задач. Они предоставляют людям доказательства того, что они могут полагаться на новые данные и делать прогнозы на основе параметров модели.

Что такое байесовский вывод?

Это полезный метод в статистике, когда мы полагаемся на новые данные и информацию для обновления вероятности гипотезы с использованием теоремы Байеса.

Уникальны ли байесовские модели?

Байесовские модели уникальны тем, что всем параметрам в статистической модели, наблюдаемым или ненаблюдаемым, присваивается совместное распределение вероятностей.