Qu'est-ce que l'apprentissage automatique supervisé ? Algorithme, exemple

Publié: 2021-06-22

L'apprentissage automatique est partout - des agences gouvernementales, des services de vente au détail et des institutions financières aux secteurs de la santé, du divertissement et des transports. Il est intimement lié à notre vie quotidienne, que ce soit Netflix ou Amazon donnant des recommandations en ligne ou le déverrouillage de votre smartphone avec la technologie de détection de visage, l'apprentissage automatique et l'intelligence artificielle ont pris de l'ampleur comme jamais auparavant.

L'apprentissage automatique étant l'une des tendances technologiques les plus populaires à l'heure actuelle, il devient impératif de connaître l'une des approches clés de la création de l'intelligence artificielle : l'apprentissage automatique supervisé.

Table des matières

Qu'est-ce que l'apprentissage automatique supervisé ?

L'apprentissage automatique supervisé est un type d'apprentissage automatique dans lequel un algorithme informatique est formé à l'aide de données d'entrée étiquetées et l'ordinateur, à son tour, prédit la sortie pour des données imprévues. Ici, "étiqueté" signifie que certaines données seront déjà étiquetées avec les bonnes réponses pour aider la machine à apprendre. Dans l'apprentissage supervisé, les données d'entrée transmises à l'ordinateur fonctionnent comme un superviseur ou un enseignant pour entraîner la machine à produire des résultats précis en détectant les modèles sous-jacents et les corrélations entre les données d'entrée et les étiquettes de sortie.

Types d'algorithmes d'apprentissage supervisé

Il existe différents types d'algorithmes d'apprentissage supervisé pour obtenir des résultats spécifiques. Jetons un coup d'œil à certains des types les plus courants.

1. Classement

Les algorithmes de classification utilisent des données d'apprentissage étiquetées pour trier les entrées dans un nombre donné de classes ou de catégories. Ici, la variable de sortie est une catégorie telle que "Oui" ou "Non" et "Vrai" ou "Faux". La catégorisation des rapports médicaux en positif (maladie) ou négatif (pas de maladie), ou la classification des films en différents genres sont des exemples où les algorithmes de classification sont applicables.

2. Régression

Les modèles de régression sont utilisés lorsqu'il existe une relation numérique entre les variables d'entrée et de sortie. Les algorithmes de régression qui relèvent de l'apprentissage supervisé comprennent la régression linéaire, la régression non linéaire, les arbres de régression, la régression polynomiale et la régression linéaire bayésienne. Ces modèles sont principalement utilisés pour prédire des variables continues telles que la spéculation sur les tendances du marché, les prévisions météorologiques ou la prédétermination des taux de clics dans les publicités en ligne à des moments précis de la journée.

Rejoignez le cours en ligne d'apprentissage automatique des meilleures universités du monde - Masters, programmes de troisième cycle pour cadres et programme de certificat avancé en ML et IA pour accélérer votre carrière.

3. Réseaux de neurones

Les algorithmes de réseau neuronal sont utilisés pour interpréter les données sensorielles, reconnaître des modèles ou regrouper les entrées brutes. Bien que cet algorithme présente plusieurs avantages, il peut être assez difficile d'utiliser un réseau de neurones lorsqu'il y a trop d'observations. Les applications réelles populaires des réseaux de neurones incluent l'extraction d'informations, la classification de texte, la reconnaissance de la parole et des caractères, la synthèse de plusieurs documents, la génération de langage, etc.

4. Modèle bayésien naïf

Naive Bayes Classifiers n'est pas un algorithme unique mais un ensemble d'algorithmes basés sur le théorème de Bayes. Le principe standard qui sous-tend ces algorithmes est que chaque paire de caractéristiques classifiées est indépendante l'une de l'autre. Les étiquettes de classe sont attribuées à l'aide d'un graphe acyclique direct comprenant plusieurs nœuds enfants et un nœud parent. Chaque nœud enfant est considéré comme séparé et indépendant du parent. Les applications réelles populaires de l'algorithme Naive Bayesian incluent le filtrage du spam et l'analyse des sentiments.

5. Arbres de décision

Les arbres de décision sont des modèles de type organigramme contenant des instructions de contrôle conditionnel pour comparer les décisions et leurs conséquences possibles. Un arbre de décision implique un graphique arborescent où les nœuds internes représentent le point où nous choisissons un attribut et posons une question, les nœuds feuilles représentent les étiquettes de classe ou la sortie réelle, et les arêtes représentent les réponses aux questions.

6. Soutenez la machine de vecteur

La machine à vecteurs de support (SVM) est basée sur la théorie de l'apprentissage statistique donnée par Vap Nick et a été développée en 1990. En termes simples, les machines à vecteurs de support sont un ensemble de méthodes d'apprentissage supervisées utilisées pour la régression, la classification et la détection des valeurs aberrantes. Ils sont étroitement associés au réseau du noyau et trouvent des applications dans divers domaines tels que la reconnaissance de formes, la bioinformatique et la recherche d'informations multimédia.

7. Modèle de forêt aléatoire

Le modèle de forêt aléatoire consiste en un ensemble d'arbres de décision individuels où chaque arbre individuel donne une prédiction de classe, et la classe avec le maximum de votes est la prédiction du modèle. L'idée derrière le concept du modèle de forêt aléatoire est qu'un grand nombre d'arbres ou de modèles relativement non corrélés fonctionnant dans un ensemble produira des prédictions plus précises que n'importe laquelle des prédictions individuelles. En effet, les arbres se protègent mutuellement des erreurs indépendantes.

Comment ça marche?

L'apprentissage supervisé implique la formation de modèles à l'aide d'ensembles de données étiquetés afin qu'ils puissent en savoir plus sur chaque type de données. Une fois la formation terminée, le modèle reçoit des données de test pour identifier et prédire la sortie.

Prenons un exemple simple pour clarifier davantage le concept.

Supposons qu'on vous donne une caisse composée de différents types de légumes. Dans l'approche d'apprentissage automatique supervisé, votre première étape consistera à familiariser la machine avec tous les différents légumes un par un de cette manière :

  • Si l'objet est comme une ampoule et rose violacé, il sera étiqueté comme - Oignon.
  • Si l'objet est feuillu et de couleur verte, il sera étiqueté comme - Épinards.

Une fois que vous avez formé la machine, vous lui donnez un légume séparé de la caisse (par exemple, un oignon) et demandez à l'identifier. Maintenant, puisque la machine a déjà appris les légumes à partir des données précédentes, elle classera le nouvel objet en fonction de sa forme et de sa couleur et confirmera le résultat comme un oignon. De cette façon, la machine apprend ou s'entraîne à partir de données d'entraînement (caisse contenant des légumes) et applique les connaissances à de nouvelles données imprévues (nouveau légume).

Comme l'exemple végétal que nous avons utilisé ci-dessus, voyons un autre exemple d'apprentissage supervisé pour comprendre comment cela fonctionne.

Supposons que nous ayons un ensemble de données composé de diverses formes telles que des triangles, des carrés et des pentagones. La première étape consiste à entraîner le modèle pour chaque figure de la manière suivante :

  • Si la forme a trois côtés, elle sera étiquetée comme - Triangle
  • Si la forme a quatre côtés égaux, elle sera étiquetée comme - Carré
  • Si la forme a cinq côtés, elle sera étiquetée comme - Pentagone

Une fois la formation terminée, nous testons le modèle en utilisant des données de test, et le travail du modèle serait d'identifier la forme en fonction des connaissances de la formation. Ainsi, lorsque le modèle trouve une nouvelle forme, il la classe sur la base du nombre de côtés et donne une sortie.

Avantages et défis

Inutile de dire que l'apprentissage supervisé présente plusieurs avantages dans la mise en œuvre de modèles d'apprentissage automatique. Certains de ses avantages sont énumérés ci-dessous :

  • Les modèles d'apprentissage supervisé peuvent prédire avec précision les résultats en fonction des expériences antérieures.
  • L'apprentissage supervisé aide à optimiser les performances en utilisant l'expérience.
  • L'apprentissage supervisé nous donne une idée claire et précise sur les classes d'objets.
  • Enfin, les algorithmes d'apprentissage supervisé sont incroyablement cruciaux pour résoudre divers problèmes du monde réel et trouver des applications dans divers secteurs.

Il ne fait aucun doute que les algorithmes d'apprentissage supervisé sont très bénéfiques, notamment en ce qui concerne leur potentiel à relever les défis en temps réel. Cependant, la construction d'un modèle d'apprentissage supervisé durable et efficace comporte son propre ensemble de défis. Alors jetons un œil :

  • L'ensemble du processus de formation des modèles d'apprentissage supervisé est un processus qui prend du temps.
  • Les modèles d'apprentissage supervisé nécessitent souvent un certain niveau d'expertise et de ressources pour se structurer et fonctionner avec précision.
  • Contrairement aux modèles d'apprentissage non supervisé, les modèles d'apprentissage supervisé ne peuvent pas classer ou regrouper les données par eux-mêmes.
  • Les chances que des erreurs humaines se glissent dans les ensembles de données sont assez élevées, ce qui peut entraîner une formation incorrecte des algorithmes.

Meilleures pratiques avec exemples

Quelles sont certaines des meilleures pratiques que vous devriez garder à l'esprit avant de vous lancer dans un projet utilisant l'apprentissage automatique supervisé ? Jetez un oeil ci-dessous.

  • Assurez-vous d'être clair sur le type de données que vous utiliserez comme ensemble de données d'entraînement.
  • Collectez les résultats correspondants à partir de mesures standard ou d'experts humains.
  • Décidez de la structure de l'algorithme d'apprentissage.

Il vaut la peine de parler enfin de certains des meilleurs et des plus populaires exemples réels d'apprentissage automatique supervisé.

  • Analyse prédictive : Un cas d'utilisation répandu de l'utilisation de modèles d'apprentissage supervisé pour l'analyse prédictive fournit des informations significatives et exploitables sur divers points de données d'entreprise. En conséquence, les entreprises commerciales peuvent prévoir certains résultats en fonction d'une variable de sortie donnée pour justifier et étayer leurs décisions.
  • Reconnaissance d'objets et d'images : les algorithmes d'apprentissage supervisé trouvent une utilisation dans la localisation et la classification d'objets dans des images et des vidéos - une exigence fréquente dans l'analyse d'images et diverses techniques de vision par ordinateur.
  • Détection de spam : les techniques de détection et de filtrage de spam utilisent des algorithmes de classification supervisée pour former les bases de données afin qu'elles puissent reconnaître des modèles dans de nouvelles données pour une séparation efficace des spams et des e-mails non spam.
  • Analyse des sentiments : un excellent moyen de stimuler les efforts d'engagement de la marque consiste à comprendre les interactions avec les clients. L'apprentissage automatique supervisé peut aider à cet égard en extrayant et en classant les informations critiques à partir de grands ensembles de données telles que les émotions, les intentions, les préférences, etc. des clients.

Apprenez l'apprentissage automatique avec upGrad

Vous cherchez à vous démarquer dans le domaine de l'apprentissage automatique et de l'IA ? Commencez votre voyage avec le programme Executive PG d'upGrad en Machine Learning & AI . Il s'agit d'un cours de certification en ligne complet conçu pour les professionnels qui souhaitent acquérir des compétences recherchées telles que l'apprentissage en profondeur, l'apprentissage par renforcement, la PNL et les modèles graphiques.

Voici quelques faits saillants du cours à ne pas manquer :

  • Certificat d'achèvement de cours de l'IIIT Bangalore.
  • Plus de 450 heures d'apprentissage avec des sessions en direct, des devoirs de codage, des études de cas et des projets.
  • Couverture complète de 20 outils, langages de programmation et bibliothèques.
  • Cours de codage en direct et ateliers de création de profil.

Conclusion

Le dernier rapport d'étude de marché de Technavio intitulé Machine Learning Market by End-user and Geography - Forecast and Analysis 2020-2024 prévoit que la taille du marché mondial de l'apprentissage automatique connaîtra une croissance de 11,16 milliards de dollars au cours de la période de prévision 2020-2024. De plus, l'augmentation régulière de la croissance d'une année sur l'autre alimentera l'élan de croissance du marché.

Les tendances actuelles et les prévisions futures indiquent que l'apprentissage automatique est là pour rester. Les algorithmes d'apprentissage supervisé sont fondamentaux pour tout projet d'apprentissage automatique qui implique principalement des problèmes de classification et de régression. Malgré leurs défis, les algorithmes d'apprentissage supervisé sont les plus utiles pour prédire les résultats en fonction des expériences.

Menez la révolution technologique basée sur l'IA

Postuler pour une maîtrise ès sciences en apprentissage automatique et IA