6 tipos de aprendizaje supervisado que debe conocer en 2022

Publicado: 2021-01-10

El aprendizaje automático es una de las aplicaciones más comunes de la Inteligencia Artificial. Una máquina aprende a ejecutar tareas a partir de los datos que se le suministran. Y con la experiencia, mejora su desempeño en una determinada tarea. El aprendizaje automático incluye técnicas de aprendizaje supervisado, no supervisado y reforzado. Obtenga más información sobre los tipos de aprendizaje automático.

En este artículo, veremos diferentes tipos de aprendizaje supervisado.

Tabla de contenido

¿Qué es el aprendizaje supervisado?

En el aprendizaje supervisado, una máquina se entrena utilizando datos 'etiquetados'. Se dice que los conjuntos de datos están etiquetados cuando contienen parámetros de entrada y salida. En otras palabras, los datos ya han sido etiquetados con la respuesta correcta.

Entonces, la técnica imita el ambiente de un salón de clases donde un estudiante aprende en presencia de un supervisor o maestro. Por otro lado, los algoritmos de aprendizaje no supervisados permiten que los modelos descubran información y aprendan por sí mismos.

El aprendizaje automático supervisado es inmensamente útil para resolver problemas computacionales del mundo real. El algoritmo predice los resultados de los datos imprevistos aprendiendo de los datos de entrenamiento etiquetados. Por lo tanto, se necesitan científicos de datos altamente calificados para construir e implementar dichos modelos. Con el tiempo, los científicos de datos también usan su experiencia técnica para reconstruir los modelos para mantener la integridad de los conocimientos proporcionados.

¿Como funciona?

Por ejemplo, desea entrenar una máquina para que prediga su tiempo de viaje entre su oficina y su hogar. Primero, crearía un conjunto de datos etiquetados, como el clima, la hora del día, la ruta elegida, etc., que comprendería sus datos de entrada. Y el resultado sería la duración estimada de su viaje de regreso a casa en un día específico.

Una vez que crea un conjunto de entrenamiento basado en los factores correspondientes, la máquina verá las relaciones entre los puntos de datos y lo usará para determinar la cantidad de tiempo que le llevará conducir de regreso a casa. Por ejemplo, una aplicación móvil puede decirle que su tiempo de viaje será más largo cuando llueva intensamente.

La máquina también puede ver otras conexiones en sus datos etiquetados, como la hora a la que sale del trabajo. Puede llegar a casa antes si comienza antes de que el tráfico de la hora pico llegue a las carreteras. Lea más si tiene curiosidad por saber cómo funciona el aprendizaje automático no supervisado.

Ahora, intentemos entender el aprendizaje supervisado con la ayuda de otro ejemplo de la vida real. Suponga que tiene una canasta de frutas y entrena la máquina con todos los diferentes tipos de frutas. Los datos de entrenamiento pueden incluir estos escenarios:

Si el objeto es de color rojo, tiene forma redonda y tiene una depresión en la parte superior, etiquételo como 'Apple'
Si el artículo tiene un color amarillo verdoso y tiene forma de cilindro curvo, márquelo como 'Banana'

Luego, le das un nuevo objeto (datos de prueba) y le pides a la máquina que identifique si es un plátano o una manzana. Aprenderá de los datos de entrenamiento y aplicará el conocimiento para clasificar la fruta de acuerdo con los colores y formas ingresados.

Diferentes tipos de aprendizaje supervisado

1. Regresión

En la regresión, se produce un único valor de salida utilizando datos de entrenamiento. Este valor es una interpretación probabilística, que se determina después de considerar la fuerza de correlación entre las variables de entrada. Por ejemplo, la regresión puede ayudar a predecir el precio de una casa en función de su localidad, tamaño, etc.

En la regresión logística, la salida tiene valores discretos basados en un conjunto de variables independientes. Este método puede fracasar cuando se trata de límites de decisión múltiples y no lineales. Además, no es lo suficientemente flexible para capturar relaciones complejas en conjuntos de datos.

2. Clasificación

Implica agrupar los datos en clases. Si está pensando en extender el crédito a una persona, puede usar la clasificación para determinar si una persona sería morosa o no. Cuando el algoritmo de aprendizaje supervisado etiqueta los datos de entrada en dos clases distintas, se denomina clasificación binaria. Las clasificaciones múltiples significan clasificar los datos en más de dos clases.

3. Modelo bayesiano ingenuo

El modelo bayesiano de clasificación se utiliza para grandes conjuntos de datos finitos. Es un método para asignar etiquetas de clase utilizando un gráfico acíclico directo. El gráfico consta de un nodo principal y varios nodos secundarios. Y se supone que cada nodo hijo es independiente y está separado del padre.

Árboles de decisión

Un árbol de decisiones es un modelo similar a un diagrama de flujo que contiene sentencias de control condicional, que comprenden decisiones y sus posibles consecuencias. El resultado se relaciona con el etiquetado de datos no previstos.

En la representación de árbol, los nodos de hoja corresponden a etiquetas de clase y los nodos internos representan los atributos. Un árbol de decisión se puede utilizar para resolver problemas con atributos discretos y funciones booleanas. Algunos de los algoritmos de árboles de decisión notables son ID3 y CART.

4. Modelo de bosque aleatorio

El modelo de bosque aleatorio es un método de conjunto. Opera mediante la construcción de una multitud de árboles de decisión y genera una clasificación de los árboles individuales. Suponga que desea predecir qué estudiantes universitarios tendrán un buen desempeño en GMAT, una prueba que se realiza para ingresar a los programas de administración de posgrado. Un modelo de bosque aleatorio cumpliría la tarea, dados los factores demográficos y educativos de un conjunto de estudiantes que previamente han tomado la prueba.

5. Redes Neuronales

Este algoritmo está diseñado para agrupar entradas sin procesar, reconocer patrones o interpretar datos sensoriales. A pesar de sus múltiples ventajas, las redes neuronales requieren importantes recursos computacionales. Puede resultar complicado ajustar una red neuronal cuando hay miles de observaciones. También se denomina algoritmo de "caja negra", ya que interpretar la lógica detrás de sus predicciones puede ser un desafío.

Leer : Las 10 mejores arquitecturas de redes neuronales en 2020

6. Máquinas de vectores de soporte

Support Vector Machine (SVM) es un algoritmo de aprendizaje supervisado desarrollado en el año 1990. Se basa en la teoría de aprendizaje estadístico desarrollada por Vap Nick.

SVM separa hiperplanos, lo que lo convierte en un clasificador discriminativo. La salida se produce en forma de un hiperplano óptimo que categoriza nuevos ejemplos. Las SVM están estrechamente conectadas con el marco del kernel y se utilizan en diversos campos. Algunos ejemplos incluyen bioinformática, reconocimiento de patrones y recuperación de información multimedia.

Pros y contras del aprendizaje supervisado

Varios tipos de aprendizaje supervisado le permiten recopilar y producir datos de experiencias previas. Desde la optimización de los criterios de rendimiento hasta el tratamiento de problemas del mundo real, el aprendizaje supervisado se ha convertido en una herramienta poderosa en el campo de la IA. También es un método más confiable en comparación con el aprendizaje no supervisado, que puede ser computacionalmente complejo y menos preciso en algunos casos.

Sin embargo, el aprendizaje supervisado no está exento de limitaciones. Se requieren ejemplos concretos para capacitar a los clasificadores, y los límites de decisión pueden sobreentrenarse en ausencia de los ejemplos correctos. También se pueden encontrar dificultades para clasificar los grandes datos.

Resumiendo

Lo largo y corto del aprendizaje supervisado es que utiliza datos etiquetados para entrenar una máquina. Las técnicas de regresión y los algoritmos de clasificación ayudan a desarrollar modelos predictivos que son altamente confiables y tienen múltiples aplicaciones.

El aprendizaje supervisado requiere expertos para construir, escalar y actualizar modelos. En ausencia de competencia técnica, se puede aplicar la fuerza bruta para determinar las variables de entrada. Y esto podría generar resultados inexactos. Por lo tanto, la selección de características de datos relevantes es esencial para que el aprendizaje supervisado funcione de manera efectiva.

Primero se debe decidir qué datos se requieren para el conjunto de entrenamiento, continuar estructurando la función y el algoritmo aprendidos, y también reunir los resultados de los expertos y las mediciones. Estas mejores prácticas pueden contribuir en gran medida a respaldar la precisión de un modelo.

A medida que la inteligencia artificial y el aprendizaje automático se aceleran en el mundo actual orientado a la tecnología, conocer los tipos de aprendizaje supervisado puede ser un diferenciador significativo en cualquier campo. ¡Las explicaciones anteriores te ayudarán a dar ese primer paso!

Si está interesado en obtener más información sobre el aprendizaje automático, consulte el Diploma PG en aprendizaje automático e IA de IIIT-B y upGrad, que está diseñado para profesionales que trabajan y ofrece más de 450 horas de capacitación rigurosa, más de 30 estudios de casos y asignaciones, IIIT- B Estado de exalumno, más de 5 proyectos prácticos finales prácticos y asistencia laboral con las mejores empresas.

Aprenda el curso ML de las mejores universidades del mundo. Obtenga programas de maestría, PGP ejecutivo o certificado avanzado para acelerar su carrera.

¿Cuál es el significado del aprendizaje supervisado?

Una máquina aprende usando datos 'etiquetados' en Aprendizaje Supervisado. Cuando un conjunto de datos tiene parámetros de entrada y salida, se considera que está etiquetado. Dicho de otro modo, la información ya ha sido etiquetada con la respuesta correcta. En los desafíos computacionales del mundo real, el aprendizaje automático supervisado es bastante útil. El sistema aprende de los datos de entrenamiento etiquetados para predecir los resultados de los datos no anticipados. Como resultado, construir e implementar dichos modelos requiere la experiencia de científicos de datos altamente calificados. Los científicos de datos utilizan su conocimiento técnico para construir modelos a lo largo del tiempo a fin de mantener la validez de los conocimientos proporcionados.

¿Cuál es la diferencia entre clasificación y regresión?

Usando datos de entrenamiento, la regresión produce un único valor de salida. Esta es una interpretación probabilística que se determina teniendo en cuenta la fuerza de correlación entre las variables de entrada. La regresión, por ejemplo, puede ayudar a pronosticar el precio de una casa según su ubicación, tamaño y otros factores. El acto de clasificar datos implica dividirlos en categorías. Puede usar la categorización para evaluar si una persona incumplirá o no un préstamo si está considerando ofrecerle un crédito. La clasificación binaria ocurre cuando un algoritmo de aprendizaje supervisado clasifica los datos de entrada en dos clases separadas. Las clasificaciones múltiples se refieren a la división de la información en más de dos grupos.

¿Qué es un bosque aleatorio?

Un método de conjunto es el modelo de bosque aleatorio. Funciona creando una gran cantidad de árboles de decisión y luego clasificando los árboles individuales. Supongamos que desea saber qué estudiantes universitarios obtendrán buenos resultados en el GMAT, un examen requerido para ingresar a los programas de posgrado en administración. Dadas las características demográficas y educativas de un grupo de alumnos que hayan realizado previamente la prueba, un modelo de bosque aleatorio podría completar la tarea.