Aprenda la clasificación bayesiana en minería de datos [2022]

Publicado: 2021-03-10

Si ha estado estudiando minería de datos durante algún tiempo, debe haber oído hablar del término 'clasificación bayesiana'. ¿Te preguntas qué significa y qué importancia tiene como concepto en la minería de datos?

Este artículo responderá a estas preguntas a medida que explore qué es la clasificación bayesiana en la minería de datos. Vamos a empezar:

Tabla de contenido

¿Qué es la clasificación bayesiana?

Durante la extracción de datos, encontrará que la conexión entre la variable de clase y el conjunto de atributos no es determinista. Esto significa que no podemos asumir la etiqueta de clase de un registro de prueba con absoluta certeza incluso si el conjunto de atributos es el mismo que el de los ejemplos de entrenamiento.

Podría ocurrir debido a la presencia de factores de influencia particulares o datos ruidosos. Suponga que desea predecir si una persona tiene riesgo de sufrir una enfermedad cardíaca según sus hábitos alimenticios. Si bien los hábitos alimenticios de una persona son un factor importante para determinar si sufrirá problemas cardíacos o no, también puede haber otras razones para que ocurra lo mismo, como la genética o una infección.

Por lo tanto, su análisis para determinar si la persona estaría en riesgo de enfermedades cardíacas basándose únicamente en sus hábitos alimenticios sería erróneo y podría causar que surjan múltiples problemas.

Entonces surge la pregunta: "¿Cómo resuelves este problema en la minería de datos?" La respuesta es la clasificación bayesiana.

Puede utilizar la clasificación bayesiana en la minería de datos para abordar este problema y predecir la ocurrencia de cualquier evento. Los clasificadores bayesianos consisten en clasificadores estadísticos que utilizan la comprensión de la probabilidad bayesiana.

Para comprender el funcionamiento de la clasificación bayesiana en la minería de datos, deberá comenzar con el teorema de Bayes.

Teorema de Bayes

El crédito por el teorema de Bayes es para Thomas Bayes, quien usó la probabilidad condicional para crear un algoritmo que utiliza evidencia para calcular límites en parámetros desconocidos. Él fue la primera persona en llegar a esta solución.

Matemáticamente, el teorema de Bayes se ve así:

P(A/B) = P(B/A)P(A) P(B)

Aquí, A y B representan los eventos y P(B) no puede ser igual a cero.

P(B) 0

P(B/A) es una probabilidad condicional que explica la ocurrencia del evento B cuando A es verdadero. De manera similar, P(A/B) es una probabilidad condicional que explica la ocurrencia del evento A cuando B es verdadero.

P(B) y P(A) son las probabilidades de observar B y A de forma independiente y se denominan probabilidades marginales.

Interpretación bayesiana

En la interpretación bayesiana, la probabilidad calcula un grado de creencia. Según el teorema de Bayes, el grado de creencia en una hipótesis antes de considerar la evidencia está relacionado con el grado de creencia en una hipótesis después de considerarla.

Supongamos que tienes una moneda. Si lanza la moneda una vez, obtendrá cara o cruz y la probabilidad de que ambas ocurran es del 50 %. Sin embargo, si lanzas la moneda varias veces y observas los resultados, el grado de creencia puede aumentar, disminuir o permanecer estable según los resultados.

Si tienes la proposición A y la evidencia B entonces:

P(A) es el grado primario de creencia en A. P(A/B) es el grado posterior de creencia después de tener en cuenta B. El cociente P(B/A)/P(B) muestra el apoyo que B ofrece a A. .

Puede derivar el teorema de Bayes a partir de la probabilidad condicional:

P(A/B) = P(A B) P(B) , si P(B) 0

P(B/A) = P(B A) P(A) , si P(A) 0

Aquí P(A B) es la probabilidad conjunta de que A y B sean verdaderas porque:

PAG (BA ) = PAG ( AB)

O, P(A B) = P( A B )P(B) = P( B A )P(A)

O, P( A B ) = P( B A )P(A) P(B) , SI P(B) 0

Red bayesiana

Usamos redes bayesianas (también conocidas como redes de creencias) para mostrar incertidumbres a través de DAG (Gráficos acíclicos dirigidos). Un gráfico acíclico dirigido muestra una red bayesiana como cualquier otro gráfico estadístico. Contiene un grupo de nodos y enlaces donde los enlaces denotan la conexión entre los respectivos nodos.

Cada nodo en un gráfico acíclico dirigido representa una variable aleatoria. Las variables pueden ser valores continuos o discretos y pueden corresponder al atributo real dado a los datos.

Una red bayesiana permite definir independencias condicionales de clase entre subconjuntos de variables. Le brinda un modelo gráfico de la relación en la que realizaría implementaciones.

Además de DAG, una red bayesiana también tiene un conjunto de tablas de probabilidad condicional.

Conclusión

A estas alturas, debe estar familiarizado con los conceptos básicos de la clasificación bayesiana en la minería de datos. Comprender el teorema detrás de las aplicaciones de las implementaciones de minería de datos es vital para avanzar.

¿Qué opinas de la clasificación bayesiana en minería de datos? ¿Has probado a implementarlo? Comparte tus respuestas en los comentarios. Nos encantaría saber de usted.

Si tiene curiosidad por aprender sobre ciencia de datos, consulte el Diploma PG en ciencia de datos de IIIT-B y upGrad, creado para profesionales que trabajan y ofrece más de 10 estudios de casos y proyectos, talleres prácticos, tutoría con expertos de la industria, 1- on-1 con mentores de la industria, más de 400 horas de aprendizaje y asistencia laboral con las mejores empresas.

¿Qué es la clasificación y la regresión en el aprendizaje automático?

La clasificación y la regresión son tipos de algoritmos de aprendizaje supervisado que se utilizan en el aprendizaje automático. Pero hay diferencias claras específicas entre estos algoritmos. Se utiliza un algoritmo de regresión en el aprendizaje automático para estimar el valor continuo de una variable en función de variables de entrada particulares. Este algoritmo se usa para calcular variables continuas como altura, ingresos, peso, puntajes, clima, etc. Es decir, solo se puede usar para calcular valores discretos de formato entero. Se emplea un algoritmo de clasificación para calcular los valores de las variables discretas. Curiosamente, las técnicas de clasificación pueden tratar tanto con variables discretas como con valores reales, pero deben clasificarse en distintas categorías clasificadas o etiquetadas.

¿Son lo mismo la minería de datos y el aprendizaje automático?

¿Cuáles son los beneficios de la minería de datos?

La minería de datos ofrece efectivamente medios para resolver problemas relacionados con datos o información en este mundo centrado en datos. Ayuda a las empresas a recopilar información útil y confiable. Como resultado, las empresas pueden basar sus decisiones o modificar operaciones que, en última instancia, generan más ganancias. La minería de datos juega un papel crucial para ayudar a las empresas a tomar decisiones informadas, detectar y mitigar riesgos y minimizar los incidentes de fraude. Los científicos de datos pueden explorar rápidamente grandes volúmenes de datos diarios utilizando técnicas de minería de datos que son rentables y eficientes.