¿Qué es el aprendizaje automático supervisado? Algoritmo, Ejemplo

Publicado: 2021-06-22

El aprendizaje automático está en todas partes, desde agencias gubernamentales, servicios minoristas e instituciones financieras hasta los sectores de salud, entretenimiento y transporte. Está intrínsecamente asociado con nuestra vida cotidiana, ya sea Netflix o Amazon dando recomendaciones en línea o el desbloqueo de su teléfono inteligente con tecnología de detección de rostros, el aprendizaje automático y la inteligencia artificial han ganado impulso como nunca antes.

Dado que el aprendizaje automático es una de las tendencias tecnológicas más populares ahora, se vuelve imperativo conocer uno de los enfoques clave para crear inteligencia artificial: el aprendizaje automático supervisado.

Tabla de contenido

¿Qué es el aprendizaje automático supervisado?

El aprendizaje automático supervisado es un tipo de aprendizaje automático en el que se entrena un algoritmo informático utilizando datos de entrada etiquetados y la computadora, a su vez, predice la salida de datos imprevistos. Aquí, "etiquetado" significa que algunos datos ya estarán etiquetados con las respuestas correctas para ayudar a la máquina a aprender. En el aprendizaje supervisado, los datos de entrada alimentados a la computadora funcionan como un supervisor o maestro para entrenar a la máquina para que produzca resultados precisos mediante la detección de patrones y correlaciones subyacentes entre los datos de entrada y las etiquetas de salida.

Tipos de algoritmos de aprendizaje supervisado

Existen diferentes tipos de algoritmos de aprendizaje supervisado para lograr resultados específicos. Echemos un vistazo a algunos de los tipos más comunes.

1. Clasificación

Los algoritmos de clasificación utilizan datos de entrenamiento etiquetados para clasificar las entradas en un número determinado de clases o categorías. Aquí, la variable de salida es una categoría como 'Sí' o 'No' y 'Verdadero' o 'Falso'. Categorizar informes médicos en positivos (enfermedad) o negativos (sin enfermedad), o clasificar películas en diferentes géneros son algunos casos en los que se aplican algoritmos de clasificación.

2. Regresión

Los modelos de regresión se utilizan cuando existe una relación numérica entre las variables de entrada y salida. Los algoritmos de regresión que caen dentro del ámbito del aprendizaje supervisado incluyen la regresión lineal, la regresión no lineal, los árboles de regresión, la regresión polinomial y la regresión lineal bayesiana. Dichos modelos se utilizan principalmente para predecir variables continuas, como la especulación de las tendencias del mercado, el pronóstico del tiempo o la predeterminación de las tasas de clics en los anuncios en línea en momentos específicos del día.

Únase al curso en línea de aprendizaje automático de las mejores universidades del mundo: maestrías, programas ejecutivos de posgrado y programa de certificado avanzado en ML e IA para acelerar su carrera.

3. Redes Neuronales

Los algoritmos de redes neuronales se utilizan para interpretar datos sensoriales, reconocer patrones o agrupar entradas sin procesar. Si bien este algoritmo tiene varias ventajas, puede ser bastante desafiante usar una red neuronal cuando hay demasiadas observaciones. Las aplicaciones populares de la vida real de las redes neuronales incluyen extracción de información, clasificación de texto, reconocimiento de voz y caracteres, resumen de múltiples documentos, generación de lenguaje y más.

4. Modelo bayesiano ingenuo

Naive Bayes Classifiers no es un solo algoritmo sino una colección de algoritmos basados en el teorema de Bayes. El principio estándar que subyace a estos algoritmos es que cada par de características clasificadas es independiente entre sí. Las etiquetas de clase se asignan mediante un gráfico acíclico directo que comprende varios nodos secundarios y un nodo principal. Cada nodo hijo se considera separado e independiente del padre. Las aplicaciones populares de la vida real del algoritmo Naive Bayesian incluyen el filtrado de spam y el análisis de sentimientos.

5. Árboles de decisión

Los árboles de decisión son modelos similares a diagramas de flujo que contienen declaraciones de control condicional para comparar decisiones y sus posibles consecuencias. Un árbol de decisiones implica un gráfico similar a un árbol en el que los nodos internos representan el punto donde elegimos un atributo y hacemos una pregunta, los nodos de hoja representan las etiquetas de clase o el resultado real, y los bordes representan las respuestas a las preguntas.

6. Máquina de vectores de soporte

Support Vector Machine (SVM) se basa en la teoría del aprendizaje estadístico propuesta por Vap Nick y se desarrolló en 1990. En los términos más simples, las máquinas de vectores de soporte son un conjunto de métodos de aprendizaje supervisado que se utilizan para la regresión, la clasificación y la detección de valores atípicos. Están estrechamente asociados con la red kernel y encuentran aplicaciones en diversos campos, como el reconocimiento de patrones, la bioinformática y la recuperación de información multimedia.

7. Modelo de bosque aleatorio

El modelo de bosque aleatorio consta de un conjunto de árboles de decisión individuales donde cada árbol individual da una predicción de clase, y la clase con el máximo de votos es la predicción del modelo. La idea detrás del concepto del modelo de bosque aleatorio es que una gran cantidad de árboles o modelos relativamente no correlacionados que operan en un conjunto producirán predicciones más precisas que cualquiera de las predicciones individuales. Esto se debe a que los árboles se protegen entre sí de errores independientes.

¿Como funciona?

El aprendizaje supervisado implica entrenar modelos usando conjuntos de datos etiquetados para que puedan aprender sobre cada tipo de datos. Una vez que se completa el entrenamiento, el modelo recibe datos de prueba para identificar y predecir la salida.

Veamos un ejemplo simple para aclarar aún más el concepto.

Digamos que le dan una caja que contiene diferentes tipos de vegetales. En el enfoque de aprendizaje automático supervisado, su primer paso será familiarizar a la máquina con todos los diferentes vegetales uno por uno de esta manera:

Si el objeto es como una bombilla y de color rosa púrpura, se etiquetará como – Cebolla.
Si el objeto tiene hojas y es de color verde, se etiquetará como: espinaca.

Una vez que haya entrenado la máquina, le da una verdura separada de la caja (por ejemplo, cebolla) y pide que la identifique. Ahora, dado que la máquina ya ha aprendido sobre las verduras a partir de datos anteriores, clasificará el nuevo objeto en función de su forma y color y confirmará el resultado como una cebolla. De esta forma, la máquina aprende o entrena a partir de datos de entrenamiento (caja que contiene verduras) y aplica el conocimiento a nuevos datos imprevistos (nueva verdura).

Al igual que el ejemplo vegetal que usamos anteriormente, veamos otro ejemplo de aprendizaje supervisado para entender cómo funciona.

Supongamos que tenemos un conjunto de datos que consta de varias formas, como triángulos, cuadrados y pentágonos. El primer paso es entrenar el modelo para cada figura de la siguiente manera:

Si la forma tiene tres lados, entonces se etiquetará como – Triángulo
Si la forma tiene cuatro lados iguales, se etiquetará como – Cuadrado
Si la forma tiene cinco lados, se etiquetará como: Pentágono

Una vez que se completa el entrenamiento, probamos el modelo mediante el uso de datos de prueba, y el trabajo del modelo sería identificar la forma en función del conocimiento del entrenamiento. Por lo tanto, cuando el modelo encuentra una nueva forma, la clasifica según el número de lados y da una salida.

Ventajas y Desafíos

No hace falta decir que el aprendizaje supervisado tiene varias ventajas en la implementación de modelos de aprendizaje automático. Algunos de sus beneficios se enumeran a continuación:

Los modelos de aprendizaje supervisado pueden predecir con precisión los resultados basados en experiencias previas.

El aprendizaje supervisado ayuda a optimizar el rendimiento utilizando la experiencia.
El aprendizaje supervisado nos da una idea clara y precisa sobre las clases de objetos.
Por último, pero no menos importante, los algoritmos de aprendizaje supervisado son increíblemente cruciales para resolver varios problemas del mundo real y encontrar aplicaciones en diversos sectores.

Sin duda, los algoritmos de aprendizaje supervisado son muy beneficiosos, especialmente en lo que respecta a su potencial para abordar desafíos en tiempo real. Sin embargo, construir un modelo de aprendizaje supervisado sostenible y eficiente conlleva su propio conjunto de desafíos. Así que echemos un vistazo:

Todo el proceso de entrenamiento de modelos de aprendizaje supervisado es un proceso que requiere mucho tiempo.
Los modelos de aprendizaje supervisado a menudo requieren un cierto nivel de experiencia y recursos para estructurarse y funcionar con precisión.
A diferencia de los modelos de aprendizaje no supervisado, los modelos de aprendizaje supervisado no pueden clasificar o agrupar datos por sí solos.
Las posibilidades de que los errores humanos se filtren en los conjuntos de datos son bastante altas, lo que puede llevar a que los algoritmos se entrenen incorrectamente.

Mejores prácticas con ejemplos

¿Cuáles son algunas de las mejores prácticas que debe tener en cuenta antes de aventurarse a comenzar un proyecto utilizando el aprendizaje automático supervisado? Echa un vistazo a continuación.

Asegúrese de tener claro el tipo de datos que utilizará como conjunto de datos de entrenamiento.
Recopile los resultados correspondientes, ya sea de mediciones estándar o de expertos humanos.
Decidir la estructura del algoritmo de aprendizaje.

Vale la pena hablar finalmente sobre algunos de los mejores y más populares ejemplos de la vida real de aprendizaje automático supervisado.

Análisis predictivo : un caso de uso generalizado del uso de modelos de aprendizaje supervisado para el análisis predictivo es proporcionar información significativa y procesable sobre varios puntos de datos comerciales. Como resultado, las empresas comerciales pueden prever ciertos resultados en función de una determinada variable de salida para justificar y respaldar las decisiones.
Reconocimiento de objetos e imágenes : los algoritmos de aprendizaje supervisado encuentran uso para ubicar y clasificar objetos en imágenes y videos, un requisito frecuente en el análisis de imágenes y diversas técnicas de visión por computadora.
Detección de correo no deseado: las técnicas de detección y filtrado de correo no deseado utilizan algoritmos de clasificación supervisados para capacitar a las bases de datos de modo que puedan reconocer patrones en nuevos datos para una segregación efectiva de correos electrónicos no deseados y no deseados.
Análisis de sentimientos : una excelente manera de impulsar los esfuerzos de participación de la marca es comprender las interacciones de los clientes. El aprendizaje automático supervisado puede ayudar en este sentido al extraer y clasificar información crítica de grandes conjuntos de datos, como las emociones, intenciones, preferencias, etc. de los clientes.

Aprenda aprendizaje automático con upGrad

¿Busca triunfar en el campo del aprendizaje automático y la IA? Comience su viaje con el programa Executive PG de upGrad en aprendizaje automático e inteligencia artificial . Es un curso integral de certificación en línea diseñado para profesionales que desean aprender habilidades en demanda como Deep Learning, Reinforcement Learning, NLP y modelos gráficos.

Aquí hay algunos aspectos destacados del curso que no puede perderse:

Certificado de finalización del curso de IIIT Bangalore.
Más de 450 horas de aprendizaje repletas de sesiones en vivo, asignaciones de codificación, estudios de casos y proyectos.
Cobertura integral de 20 herramientas, lenguajes de programación y bibliotecas.
Clases de codificación en vivo y talleres de creación de perfiles.

Conclusión

El último informe de investigación de mercado de Technavio titulado Machine Learning Market by End-user and Geography – Forecast and Analysis 2020-2024 predice que el tamaño del mercado global de aprendizaje automático será testigo de un crecimiento de US$ 11,16 mil millones durante el período de pronóstico 2020-2024. Además, el aumento constante del crecimiento año tras año impulsará el ímpetu de crecimiento del mercado.

Tanto las tendencias actuales como las predicciones futuras indican que el aprendizaje automático llegó para quedarse. Los algoritmos de aprendizaje supervisado son fundamentales para cualquier proyecto de aprendizaje automático que involucre principalmente problemas de clasificación y regresión. A pesar de sus desafíos, los algoritmos de aprendizaje supervisado son los más útiles para predecir resultados basados en experiencias.

Liderar la revolución tecnológica impulsada por la IA

Solicite la Maestría en Ciencias en Aprendizaje Automático e IA