Programme du cours d'apprentissage automatique : meilleur cours de ML et d'IA pour améliorer les compétences

Publié: 2021-01-21

Le cours de diplôme PG par upGrad est l'un des plus complets. Il couvre toutes les connaissances des compétences, des concepts et des outils nécessaires dans l'industrie actuellement.

Le programme est conçu pour vous préparer à l'industrie et réussir facilement les entretiens.

Passons en revue le programme complet pour des détails approfondis sur la couverture de notre "Programme PG exécutif en apprentissage automatique et IA".

Le cours est divisé en 8 grandes parties :

Trousse d'outils de science des données
Statistiques et analyses de données exploratoires
Apprentissage automatique-1
Apprentissage automatique-2
Traitement du langage naturel
L'apprentissage en profondeur
Apprentissage par renforcement
Déploiement et projet Capstone

Table des matières

Trousse d'outils de science des données

Cette partie est un cours pré-préparatoire qui est essentiel pour commencer le voyage de la science des données et de l'apprentissage automatique. Les principales exigences sont également Python, SQL et Excel dans une certaine mesure.

Cette partie est divisée en 6 modules ci-dessous :

Introduction à Python : ce module couvre les sujets de base de Python sans aucune connaissance préalable. Comprendre la structure de Python, les structures de données comme les listes, les tuples, les dictionnaires, etc. est couvert.

Python pour la science des données : Les 2 bibliothèques les plus importantes de Python - NumPy et Pandas sont couvertes en profondeur. NumPy et Pandas sont essentiels pour l'analyse des données, le nettoyage et la plupart des travaux de base de la science des données.

Mathématiques pour l'apprentissage automatique : l'algèbre linéaire, les matrices, le calcul multivariable et les vecteurs sont couverts dans ce module. Ces rubriques sont un prérequis pour comprendre le fonctionnement des algorithmes de ML.

Visualisation des données en Python : ce module couvre la dynamique du traçage des graphiques et des tendances à l'aide de Python.

Analyse de données à l'aide de SQL : SQL est au cœur de l'analyse et de l'ingénierie des données. Ce module couvre les bases de SQL comme les fonctions, les clauses, les requêtes et les jointures.

SQL avancé : ce module couvre des sujets plus avancés tels que la conception de bases de données, les fonctions de fenêtre, l'optimisation des requêtes, etc.

Statistiques et analyses de données exploratoires

Les statistiques et les données vont de pair. La plupart des analyses de données exécutent des analyses statistiques sous le capot qui peuvent ensuite être explorées plus avant pour obtenir des résultats significatifs.

Cette partie couvre ci-dessous 6 modules :

Résolution de problèmes d'analyse : ce module couvre le cadre CRISP-DM pour une vue d'ensemble d'un projet d'apprentissage automatique allant de la compréhension de l'entreprise au déploiement.
Mission d'investissement : une mission d'analyse de données en tant qu'employé d'une banque d'investissement.
Statistiques inférentielles : ce module couvre les concepts statistiques les plus importants tels que la probabilité, les distributions de probabilité et le théorème central limite.
Test d'hypothèse : le quoi, le pourquoi et le comment du test d'hypothèse sont abordés dans ce module. P-Value, différents types de tests et implémentation en Python.
Analyse exploratoire des données : EDA fait ressortir les informations des données. Ce module couvre le nettoyage des données, l'analyse univariée/bivariée et les métriques dérivées pour le ML.
Projet de groupe : Étude de cas sur les clubs de prêt pour déterminer quels clients sont à risque de défaut de paiement.

Apprenez la certification d'apprentissage automatique des meilleures universités du monde. Gagnez des programmes de maîtrise, Executive PGP ou Advanced Certificate pour accélérer votre carrière.

Apprentissage automatique-1

Cette partie couvre les bases du Machine Learning et certains algorithmes. Il est essentiel d'avoir une connaissance approfondie de ceux-ci avant de plonger dans des sujets plus avancés.

Il se compose de 5 modules :

Régression linéaire : ce module couvre les bases de la régression linéaire, ses hypothèses, ses limites et ses applications industrielles.
Évaluation de la régression linéaire : une mission de prédiction du prix des voitures.
Régression logistique : régression logistique univariée et multivariée pour la classification ML. La mise en œuvre en Python, les métriques d'évaluation et les applications de l'industrie sont couvertes.
Naive Bayes : L'un des algorithmes de classification les plus simples et les plus efficaces. Ce module couvre les bases du théorème de Bayes, du classificateur Naive Bayes et de l'implémentation dans un classificateur Spam-Ham.
Sélection du modèle : ce module couvre la sélection du modèle, le compromis biais-variance, le réglage des hyperparamètres et la validation croisée qui sont nécessaires pour finaliser le meilleur modèle ML.

Apprentissage automatique-2

Cette partie couvre des sujets plus avancés de Machine Learning. Il se compose de différents types d'algorithmes supervisés et non supervisés.

Les 8 modules couverts sont :

Régression avancée : ce module présente les techniques de régression linéaire généralisée et de régression régularisée telles que Ridge et Lasso.
Support Vector Machine (Optionnel): Ce module couvre l'algorithme SVM, son fonctionnement, les noyaux et l'implémentation.
Modèles d'arbres : les bases des modèles d'arbres, leur structure, les techniques de division, l'élagage et les ensembles pour former des forêts aléatoires sont abordés ici.
Sélection de modèle - Considérations pratiques : ce module donne une formation pratique sur l'utilisation des techniques de sélection de modèle pour sélectionner le meilleur modèle.
Boosting : Quels sont les apprenants faibles et les apprenants en chaîne, et comment peuvent-ils être réunis pour former un excellent modèle. Diverses techniques de Boosting sont abordées ici.
Apprentissage-Clustering non supervisé : ce module présente le clustering, ses types et sa mise en œuvre à partir de zéro.
Apprentissage non supervisé - Analyse des composants principaux : cela couvre les bases de l'ACP, son fonctionnement et sa mise en œuvre en Python.
Étude de cas sur le taux de désabonnement des télécommunications : étude de cas pour prédire le taux de désabonnement des clients pour un opérateur de télécommunications.

Traitement du langage naturel

Le traitement automatique du langage naturel (NLP) est en soi un vaste domaine. Dans cette partie NLP, tous les éléments constitutifs de la gestion des données textuelles sont couverts, ainsi que les chatbots.

Les 5 modules inclus sont :

Traitement lexical : ce module couvre les bases du TAL comme l'encodage de texte, les expressions régulières, les techniques de traitement de texte et les techniques lexicales avancées comme le hachage phonétique.
Traitement syntaxique : ce module couvre les bases du traitement syntaxique, différents types d'analyse de texte, l'extraction d'informations et les champs aléatoires conditionnels.
Traitement syntaxique-Affectation : Mise en œuvre du traitement syntaxique pour comprendre la structure grammaticale du texte.
Traitement sémantique : ce module présente le traitement sémantique, les vecteurs et les intégrations de mots, les techniques de modélisation de sujet, suivis d'une étude de cas.
Construire des chatbots avec Rasa : ce module couvre l'outil le plus en vogue pour le développement de chatbots ainsi que sa mise en œuvre.

L'apprentissage en profondeur

Le Deep Learning est largement utilisé dans l'industrie dans de nombreuses applications de pointe pour divers types de données. Dans cette partie, tous les types de réseaux de neurones sont couverts ainsi que leur mise en œuvre.

Les 5 modules couverts sont :

Introduction aux réseaux de neurones : ce module couvre les bases des réseaux de neurones, les fonctions d'activation et le réseau Feed Forward.
Convolutional Neural Network-Industry Applications : Ce module couvre en détail le CNN, sa structure, ses couches et son fonctionnement. Il couvre également divers modèles d'apprentissage par transfert, le transfert de style et le prétraitement des données d'image suivi d'une étude de cas.
Neural Networks-Assignment : une étude de cas basée sur CNN.
Réseaux de neurones récurrents : ce module couvre un autre type de réseaux de neurones spécialement utilisés pour les données basées sur des séquences : RNN et LSTM, ainsi que leurs implémentations.
Projet de réseaux de neurones : dans ce module, vous réaliserez un projet de reconnaissance de gestes à l'aide de piles de réseaux CNN et RNN.

Apprentissage par renforcement

Dans cette partie, nous vous présentons un autre type de Machine Learning : le Reinforcement Learning. Vous apprendrez les bases, y compris l'apprentissage par renforcement classique ainsi que l'apprentissage par renforcement approfondi.

Cette partie couvre ci-dessous 4 modules :

Apprentissage par renforcement classique : ce module couvre les bases de RL comme le processus de décision de Markov, les équations RL ainsi que les méthodes de Monte Carlo.
Devoir-Apprentissage par renforcement classique : Un devoir de tic-tac-toe utilisant RL.
Deep Reinforcement Learning : dans ce module, nous allons plonger dans les réseaux Deep Q, leur architecture et leur mise en œuvre. Il couvre également des sujets plus avancés tels que les méthodes de gradient de politique et les méthodes de critique d'acteur.
Projet d'apprentissage par renforcement : une tâche à effectuer à l'aide de l'architecture RL.

Projet Capstone

Dans cette partie, vous réaliserez votre projet de synthèse final en utilisant toutes les connaissances acquises jusqu'à présent.

Cette partie est divisée en 2 modules :

Déploiement : ce module couvre la dernière étape d'un projet d'apprentissage automatique où vous apprendrez les bases du déploiement sur le cloud et PaaS, ainsi que les pipelines CI/CD et les bases de Docker.
Capstone : Le projet final de Capstone pour faire monter en flèche votre CV et votre portfolio.

Avant que tu partes

Ce programme couvre toutes les bases et les outils et compétences avancés requis pour entrer dans l'industrie de la science des données et de l'apprentissage automatique. Vous passerez par une quantité suffisante de travaux pratiques et de projets pour vous assurer que vous avez bien appris.

Avec toutes les compétences acquises, vous pouvez également être actif sur d'autres plates-formes compétitives pour tester vos compétences et obtenir encore plus de pratique.

Qu'est-ce que l'apprentissage automatique ?

L'apprentissage automatique est un domaine de l'informatique qui donne aux ordinateurs la capacité d'apprendre sans être explicitement programmés. Donner aux ordinateurs la capacité d'apprendre sans être explicitement programmés. L'apprentissage automatique est la discipline scientifique qui étudie la construction et l'étude d'algorithmes capables d'apprendre et de faire des prédictions sur des données. À partir de l'énoncé du problème, l'apprentissage automatique se concentre sur la modélisation prédictive à partir des données/caractéristiques données et formule une hypothèse sur la probabilité d'un résultat en fonction des caractéristiques présentes dans les données.

Quelles sont les applications de l'apprentissage automatique ?

En général, l'apprentissage automatique est une sorte d'intelligence artificielle (IA) qui implique un ordinateur ou un programme pour apprendre et faire des prédictions basées sur des données. L'apprentissage automatique est déjà largement utilisé dans la reconnaissance d'images, le traitement du langage naturel et divers autres domaines, tandis que les récentes percées dans l'apprentissage en profondeur et le big data ont rapproché l'IA de la réalité. Actuellement, l'apprentissage automatique est utilisé dans presque tous les secteurs cruciaux, notamment la santé, le transport et la logistique, l'agriculture, le commerce électronique, etc.

Comment créer un modèle d'apprentissage automatique ?

Un modèle d'apprentissage automatique apprend à partir de données d'apprentissage étiquetées et effectue des prédictions ou des classifications sur de nouvelles données inédites. Il est basé sur la théorie de l'apprentissage statistique, mais avec beaucoup d'optimisation, de modélisation et de codage. Un modèle d'apprentissage automatique comporte donc deux parties, un modèle et un algorithme d'apprentissage. La partie modèle est représentée sous la forme d'un modèle mathématique, tel qu'un arbre ou un arbre décisionnel, et l'algorithme d'apprentissage est représenté par un ensemble de données historiques. L'algorithme d'apprentissage apprendra à partir de l'ensemble de données et optimisera le modèle pour équilibrer l'erreur et la complexité du modèle. Plus votre modèle est précis et plus le modèle est simple, meilleur il est.