Regresión logística binaria: descripción general, capacidades y suposiciones

Publicado: 2021-10-05

Una de las definiciones más aceptadas de Machine Learning es algo así:

“Se dice que un programa de computadora aprende de la experiencia E con respecto a alguna clase de tareas T y mide el desempeño P, si su desempeño en las tareas en T, medido por P, mejora con la experiencia E”.

Ahora, para mejorar el rendimiento de la máquina con el tiempo en la misma clase de tareas, se utilizan diferentes algoritmos para optimizar la producción de la máquina y acercarla a los resultados deseados. El Análisis de Regresión es una de las técnicas básicas y más utilizadas para conseguir que la máquina mejore su rendimiento.

Consiste en una serie de técnicas de aprendizaje automático para predecir una variable de salida continua en función de los valores de una o más variables predictoras. El análisis de regresión tiene como objetivo desarrollar una ecuación matemática que pueda definir la variable continua como una función de la variable predictora.

En uno de nuestros artículos anteriores, analizamos la regresión logística y cómo implementar la regresión logística en Python. También hablamos brevemente sobre los tres tipos diferentes de regresiones logísticas en el aprendizaje automático. En este artículo, le daremos un recorrido ligeramente detallado de la regresión logística binaria junto con su descripción general, capacidades y suposiciones.

Tabla de contenido

Descripción general de la regresión logística binaria

La Regresión Logística Binaria o Binomial puede entenderse como el tipo de Regresión Logística que trata escenarios en los que los resultados observados para las variables dependientes pueden ser solo binarios, es decir, puede tener solo dos tipos posibles. Estos dos tipos de clases pueden ser 0 o 1, pasar o fallar, vivo o muerto, ganar o perder, etc.

La regresión logística multinomial funciona en escenarios en los que el resultado puede tener más de dos tipos posibles: enfermedad A, enfermedad B y enfermedad C, que no están en ningún orden en particular. Otro tipo más de regresión logística es la regresión logística ordinal que trata las variables dependientes de manera ordenada.

En la regresión logística binaria, las posibles salidas generalmente se definen como 0 o 1, ya que esto da como resultado la interpretación y comprensión más sencillas del modelo de regresión. Si un resultado particular para cualquier variable dependiente es exitoso o digno de mención, se codifica como 0, y si no tiene éxito o falla, se codifica como 0.

En términos simples, la regresión logística binaria se puede utilizar para predecir con cuidado y precisión las probabilidades de ser un caso en función de los valores de los predictores o variables independientes.

Capacidades de la regresión logística binaria: tipos de preguntas que puede responder

Como se mencionó anteriormente, la regresión logística binaria es ideal para escenarios en los que la salida puede pertenecer a cualquiera de las dos clases o grupos. Como resultado de eso, la regresión logística binaria es la más adecuada para responder preguntas de la siguiente naturaleza:

  • ¿Cambia la probabilidad de contraer cáncer por cada KG adicional que una persona tiene sobrepeso?
  • ¿Dicha probabilidad varía por cada paquete de cigarrillos fumados por día?
  • ¿El peso corporal, la ingesta de grasas, la ingesta de calorías y la edad influyen en la probabilidad de sufrir un infarto?

Como puede ver, las respuestas a las tres preguntas anteriores pueden ser sí o no, 0 o 1. Por lo tanto, la regresión logística binaria se puede utilizar para responder con precisión a estas preguntas.

Supuesto principal de regresión logística binaria

Al igual que con cualquier otro algoritmo de aprendizaje automático, la regresión logística binaria también funciona con algunas suposiciones. Aquí están esos:

  • La variable dependiente es dicotómica. Es decir, está presente o ausente, pero nunca las dos cosas a la vez.
  • No debe haber valores atípicos en los datos.
  • No debe haber una alta correlación o multicolinealidad entre los diferentes predictores. Esto se puede evaluar usando una matriz de correlación entre diferentes predictores.

En conclusión

La regresión logística binaria ayuda en muchos casos de uso de aprendizaje automático. Desde descubrir a los morosos hasta ayudar a las empresas a retener clientes, la regresión logística binaria se puede ampliar para resolver incluso los problemas comerciales más complejos. Sin embargo, debe recordar que este es solo uno de los océanos de técnicas de algoritmos de aprendizaje automático. Una vez que haya dominado el análisis de regresión, estará en camino de lidiar con temas más complejos y matizados.

Sin embargo, si aún tiene dificultades para entender el análisis de regresión y comenzar su viaje de aprendizaje automático, le recomendamos nuestra lista de cursos de aprendizaje automático . En upGrad, tenemos una base de estudiantes en más de 85 países, con más de 40 000 estudiantes pagos en todo el mundo, y nuestros programas han impactado a más de 500 000 profesionales en activo.

Nuestra Maestría en Ciencias en Aprendizaje Automático e Inteligencia Artificial , que se ofrece en colaboración con la Universidad John Moores de Liverpool, está diseñada para ayudar a los estudiantes a comenzar desde cero y adquirir suficiente aprendizaje para trabajar en proyectos de la vida real. Nuestra asistencia profesional de 360 ​​grados garantizará que esté completamente preparado para asumir los principales roles en la industria. ¡Comuníquese con nosotros hoy y experimente el poder del aprendizaje entre pares y la creación de redes globales!

¿Para qué se utiliza el modelo estadístico bayesiano?

Los modelos estadísticos bayesianos se basan en procedimientos matemáticos y emplean el concepto de probabilidad para resolver problemas estadísticos. Proporcionan evidencia para que las personas confíen en nuevos datos y hagan pronósticos basados ​​en parámetros del modelo.

¿Qué es la inferencia bayesiana?

Es una técnica útil en estadística en la que nos basamos en nuevos datos e información para actualizar la probabilidad de una hipótesis utilizando el teorema de Bayes.

¿Son únicos los modelos bayesianos?

Los modelos bayesianos son únicos en el sentido de que a todos los parámetros de un modelo estadístico, ya sean observados o no observados, se les asigna una distribución de probabilidad conjunta.