Kursplan für maschinelles Lernen: Bester ML- und KI-Kurs für Upskill

Veröffentlicht: 2021-01-21

Der PG-Diploma-Kurs von upGrad ist einer der umfassendsten. Es deckt das gesamte Wissen über Fähigkeiten, Konzepte und Werkzeuge ab, die derzeit in der Branche erforderlich sind.

Der Lehrplan ist darauf ausgelegt, Sie für die Branche fit zu machen und die Vorstellungsgespräche mit Leichtigkeit zu meistern.

Lassen Sie uns den gesamten Lehrplan durchgehen, um detaillierte Informationen zur Abdeckung unseres „Executive PG Program in Machine Learning and AI“ zu erhalten.

Der Kurs ist in 8 Hauptteile gegliedert:

  1. Data-Science-Toolkit
  2. Statistik & Explorative Datenanalyse
  3. Maschinelles Lernen-1
  4. Maschinelles Lernen-2
  5. Verarbeitung natürlicher Sprache
  6. Tiefes Lernen
  7. Verstärkungslernen
  8. Bereitstellung und Capstone-Projekt

Inhaltsverzeichnis

Data-Science-Toolkit

Dieser Teil ist ein Vorbereitungskurs, der für den Beginn der Reise der Datenwissenschaft und des maschinellen Lernens unerlässlich ist. Die Hauptanforderungen sind Python, SQL und teilweise auch Excel.

Dieser Teil ist in die folgenden 6 Module unterteilt:

Einführung in Python: Dieses Modul behandelt die Kernthemen von Python, wobei keine Vorkenntnisse vorausgesetzt werden. Das Verständnis der Struktur von Python, Datenstrukturen wie Listen, Tupel, Wörterbücher usw. wird behandelt.

Python for Data Science: Die 2 wichtigsten Bibliotheken von Python – NumPy und Pandas – werden ausführlich behandelt. NumPy und Pandas sind für die Datenanalyse, Bereinigung und die meisten Kernaufgaben der Data Science unerlässlich.

Mathematik für maschinelles Lernen: Lineare Algebra, Matrizen, Kalkül mit mehreren Variablen und Vektoren werden in diesem Modul behandelt. Diese Themen sind eine Voraussetzung, um zu verstehen, wie ML-Algorithmen funktionieren.

Datenvisualisierung in Python: Dieses Modul behandelt die Dynamik des Zeichnens von Diagrammen und Trends mit Python.

  • Datenanalyse mit SQL: SQL ist das Herzstück von Datenanalyse und Engineering. Dieses Modul behandelt die Grundlagen von SQL wie Funktionen, Klauseln, Abfragen und Joins.
  1. Fortgeschrittenes SQL: Dieses Modul behandelt fortgeschrittenere Themen wie Datenbankdesign, Fensterfunktionen, Abfrageoptimierung usw.

Statistik & Explorative Datenanalyse

Statistiken und Daten gehen Hand in Hand. Der größte Teil der Datenanalyse führt statistische Analysen unter der Haube durch, die dann weiter untersucht werden können, um signifikante Ergebnisse zu erzielen.

Dieser Teil umfasst die folgenden 6 Module:

  1. Analytische Problemlösung: Dieses Modul deckt das CRISP-DM-Framework ab, um einen Überblick über ein maschinelles Lernprojekt zu erhalten, das vom Geschäftsverständnis bis zur Bereitstellung reicht.
  2. Investitionsauftrag: Ein Data Analytics-Auftrag als Mitarbeiter eines Investmentbanking-Unternehmens.
  3. Inferenzstatistik: Dieses Modul behandelt die wichtigsten statistischen Konzepte wie Wahrscheinlichkeit, Wahrscheinlichkeitsverteilungen und den zentralen Grenzwertsatz.
  4. Hypothesentest: Das Was, Warum und Wie des Hypothesentests wird in diesem Modul behandelt. P-Wert, verschiedene Arten von Tests und Implementierung in Python.
  5. Explorative Datenanalyse: EDA holt die Informationen aus den Daten heraus. Dieses Modul behandelt Datenbereinigung, univariate/bivariate Analyse und abgeleitete Metriken für ML.
  6. Gruppenprojekt: Lending Club Case Study, um herauszufinden, bei welchen Kunden das Risiko eines Kreditausfalls besteht.

Lernen Sie die Zertifizierung für maschinelles Lernen von den besten Universitäten der Welt. Erwerben Sie Master-, Executive PGP- oder Advanced Certificate-Programme, um Ihre Karriere zu beschleunigen.

Maschinelles Lernen-1

Dieser Teil behandelt die Grundlagen des maschinellen Lernens und einige Algorithmen. Es ist wichtig, ein umfassendes Wissen darüber zu haben, bevor Sie sich mit fortgeschritteneren Themen befassen.

Es besteht aus 5 Modulen:

  1. Lineare Regression: Dieses Modul behandelt die Grundlagen der linearen Regression, ihre Annahmen, Einschränkungen und Branchenanwendungen.
  2. Lineare Regressionsbewertung: Eine Aufgabe zur Vorhersage des Autopreises.
  3. Logistische Regression: Univariate und multivariate logistische Regression für die Klassifikation ML. Die Implementierung in Python, Bewertungsmetriken und Branchenanwendungen werden behandelt.
  4. Naive Bayes: Einer der einfachsten und effektivsten Klassifizierungsalgorithmen. Dieses Modul behandelt die Grundlagen des Bayes-Theorems, des Naive-Bayes-Klassifikators und der Implementierung in einem Spam-Ham-Klassifikator.
  5. Modellauswahl: Dieses Modul behandelt die Modellauswahl, Bias-Varianz-Kompromiss, Hyperparameter-Tuning und Kreuzvalidierung, die erforderlich sind, um das beste ML-Modell fertigzustellen.

Maschinelles Lernen-2

Dieser Teil behandelt fortgeschrittenere Themen des maschinellen Lernens. Es besteht aus verschiedenen Arten von überwachten und nicht überwachten Algorithmen.

Die 8 behandelten Module sind:

  1. Fortgeschrittene Regression: Dieses Modul führt in die Techniken der generalisierten linearen Regression und der regulären Regression wie Ridge und Lasso ein.
  2. Support Vector Machine (optional): Dieses Modul behandelt den SVM-Algorithmus, seine Funktionsweise, Kernel und Implementierung.
  3. Baummodelle: Hier werden die Grundlagen von Baummodellen, ihre Struktur, Teilungstechniken, Beschneidung und Ensembles zur Bildung von Random Forests behandelt.
  4. Modellauswahl – Praktische Überlegungen: Dieses Modul bietet praktische Übungen zur Verwendung von Modellauswahltechniken zur Auswahl des besten Modells.
  5. Boosting: Was sind schwache Lerner und String-Lerner und wie können sie zu einem großartigen Modell zusammengefügt werden? Hier werden verschiedene Boosting-Techniken behandelt.
  6. Unsupervised Learning-Clustering: Dieses Modul stellt Clustering, seine Arten und Implementierung von Grund auf vor.
  7. Unsupervised Learning-Principal Component Analysis: Dies behandelt die Grundlagen von PCA, seine Funktionsweise und Implementierung in Python.
  8. Telekommunikations-Churn-Fallstudie: Fallstudie zur Vorhersage der Kundenabwanderung für einen Telekommunikationsbetreiber.

Verarbeitung natürlicher Sprache

Natural Language Processing (NLP) ist an sich schon ein riesiges Feld. In diesem NLP-Teil werden alle Bausteine ​​der Textdatenverarbeitung zusammen mit Chatbots behandelt.

Die 5 enthaltenen Module sind:

  1. Lexikalische Verarbeitung: Dieses Modul behandelt die Grundlagen von NLP wie Textcodierung, reguläre Ausdrücke, Textverarbeitungstechniken und fortgeschrittene lexikalische Techniken wie Phonetic Hashing.
  2. Syntaktische Verarbeitung: Dieses Modul behandelt die Grundlagen der syntaktischen Verarbeitung, verschiedene Arten der Textanalyse, Informationsextraktion und bedingte Zufallsfelder.
  3. Syntaktische Verarbeitungsaufgabe: Implementieren der syntaktischen Verarbeitung, um die grammatikalische Struktur des Textes zu verstehen.
  4. Semantische Verarbeitung: Dieses Modul führt in semantische Verarbeitung, Wortvektoren und -einbettungen, Themenmodellierungstechniken ein, gefolgt von einer Fallstudie.
  5. Erstellen von Chatbots mit Rasa: Dieses Modul behandelt das heißeste Tool für die Entwicklung von Chatbots zusammen mit der Implementierung.

Tiefes Lernen

Deep Learning wird in der Industrie in vielen hochmodernen Anwendungen für verschiedene Arten von Daten eingesetzt. In diesem Teil werden alle Arten von neuronalen Netzen zusammen mit der Implementierung behandelt.

Die 5 abgedeckten Module sind:

  1. Einführung in neuronale Netze: Dieses Modul behandelt die Grundlagen von neuronalen Netzen, Aktivierungsfunktionen und das Feed-Forward-Netzwerk.
  2. Convolutional Neural Network-Industry Applications: Dieses Modul behandelt detailliert das CNN, seine Struktur, Schichten und Funktionsweise. Es behandelt auch verschiedene Transfer Learning-Modelle, Style Transfer und Datenvorverarbeitung von Bilddaten, gefolgt von einer Fallstudie.
  3. Neural Networks-Assignment: Eine CNN-basierte Fallstudie.
  4. Wiederkehrende neuronale Netze: Dieses Modul behandelt eine andere Art von neuronalen Netzen, die speziell für sequenzbasierte Daten verwendet werden – RNN und LSTM zusammen mit ihren Implementierungen.
  5. Neural Networks Project: In diesem Modul führen Sie ein Gestenerkennungsprojekt mit CNNs- und RNNs-Netzwerkstacks durch.

Verstärkungslernen

In diesem Teil stellen wir Ihnen eine andere Art des maschinellen Lernens vor – Reinforcement Learning. Sie lernen die Grundlagen, darunter das klassische Reinforcement Learning sowie Deep Reinforcement Learning.

Dieser Teil umfasst die folgenden 4 Module:

  1. Classical Reinforcement Learning: Dieses Modul behandelt die Grundlagen des RL wie Markov-Entscheidungsprozess, RL-Gleichungen sowie Monte-Carlo-Methoden.
  2. Aufgabe – Klassisches Verstärkungslernen: Eine Tic-Tac-Toe-Aufgabe mit RL.
  3. Deep Reinforcement Learning: In diesem Modul tauchen wir in Deep Q Networks, ihre Architektur und Implementierung ein. Es behandelt auch fortgeschrittenere Themen wie Policy Gradient Methods und Actor-Critic Methods.
  4. Reinforcement Learning Project: Eine Aufgabe, die mithilfe der RL-Architektur durchgeführt werden soll.

Capstone-Projekt

In diesem Teil erstellen Sie Ihr abschließendes Decksteinprojekt mit all dem bisher erworbenen Wissen.

Dieser Teil ist in 2 Module unterteilt:

  1. Bereitstellung: Dieses Modul deckt die spätere Phase eines Machine-Learning-Projekts ab, in dem Sie die Bereitstellungsgrundlagen in Cloud und PaaS sowie CI/CD-Pipelines und Docker-Grundlagen erlernen.
  2. Capstone: Das letzte Schlusssteinprojekt, um Ihren Lebenslauf und Ihr Portfolio in die Höhe zu treiben.

Bevor du gehst

Dieses Programm deckt alle erforderlichen Grundlagen und fortgeschrittenen Tools und Fähigkeiten ab, um in die Data Science- und Machine Learning-Branche einzusteigen. Sie werden eine ausreichende Anzahl von Praktika und Projekten durchlaufen, um sicherzustellen, dass Sie gut gelernt haben.

Mit all den erlernten Fähigkeiten können Sie auch auf anderen Wettbewerbsplattformen aktiv werden, um Ihre Fähigkeiten zu testen und noch mehr praktische Erfahrungen zu sammeln.

Was ist maschinelles Lernen?

Maschinelles Lernen ist ein Gebiet der Informatik, das Computern die Fähigkeit verleiht, zu lernen, ohne explizit programmiert zu werden. Computern die Fähigkeit zu geben, zu lernen, ohne explizit programmiert zu werden. Maschinelles Lernen ist die wissenschaftliche Disziplin, die die Konstruktion und Untersuchung von Algorithmen untersucht, die aus Daten lernen und Vorhersagen treffen können. Ausgehend von der Problemstellung konzentriert sich das maschinelle Lernen auf die Vorhersagemodellierung anhand der gegebenen Daten/Merkmale und bildet eine Hypothese über die Wahrscheinlichkeit eines Ergebnisses basierend auf den in den Daten vorhandenen Merkmalen.

Was sind die Anwendungen des maschinellen Lernens?

Im Allgemeinen ist maschinelles Lernen eine Art künstliche Intelligenz (KI), die einen Computer oder ein Programm zum Lernen und Treffen von Vorhersagen auf der Grundlage von Daten umfasst. Maschinelles Lernen wird bereits häufig in der Bilderkennung, der Verarbeitung natürlicher Sprache und verschiedenen anderen Bereichen eingesetzt, während die jüngsten Durchbrüche im Bereich Deep Learning und Big Data die KI der Realität näher gebracht haben. Derzeit wird maschinelles Lernen in fast allen wichtigen Sektoren eingesetzt, darunter Gesundheitswesen, Transport und Logistik, Landwirtschaft, E-Commerce usw.

Wie erstelle ich ein maschinelles Lernmodell?

Ein maschinelles Lernmodell lernt aus markierten Trainingsdaten und trifft Vorhersagen oder Klassifizierungen für neue, zuvor ungesehene Daten. Es basiert auf der statistischen Lerntheorie, aber mit viel Optimierung, Modellierung und Codierung. Ein maschinelles Lernmodell besteht daher aus zwei Teilen, einem Modell und einem Lernalgorithmus. Der Modellteil wird als mathematisches Modell dargestellt, beispielsweise als Baum oder Entscheidungsbaum, und der Lernalgorithmus wird durch einen historischen Datensatz dargestellt. Der Lernalgorithmus lernt aus dem Datensatz und optimiert das Modell, um den Fehler und die Komplexität des Modells auszugleichen. Je genauer Ihr Modell wird und je einfacher das Modell ist, desto besser ist es.