机器学习课程大纲：提升技能的最佳 ML 和 AI 课程

已发表: 2021-01-21

upGrad 的 PG 文凭课程是最全面的课程之一。它涵盖了当前行业所需的所有技能、概念和工具知识。

课程大纲旨在让您做好行业准备并轻松应对面试。

让我们仔细阅读完整的教学大纲，以深入了解我们的“机器学习和人工智能中的执行 PG 计划”的覆盖范围。

课程分为8个主要部分：

数据科学工具包
统计和探索性数据分析
机器学习-1
机器学习-2
自然语言处理
深度学习
强化学习
部署和顶点项目

数据科学工具包

这部分是一门预备课程，对于开始数据科学和机器学习的旅程至关重要。在某种程度上，主要要求是 Python、SQL 和 Excel。

这部分分为以下6个模块：

Python 简介：本模块涵盖了核心 Python 主题，假设没有先验知识。 了解 Python 的结构，涵盖了列表、元组、字典等数据结构。

用于数据科学的 Python：深入介绍了 Python 的两个最重要的库——NumPy 和 Pandas。 NumPy 和 Pandas 对于数据分析、清理和大多数核心数据科学工作至关重要。

机器学习数学：本模块涵盖线性代数、矩阵、多变量微积分和向量。 这些主题是了解 ML 算法如何工作的先决条件。

Python 中的数据可视化：该模块涵盖了使用 Python 绘制图形和趋势的动态。

使用 SQL 进行数据分析： SQL 是数据分析和工程的核心。 本模块涵盖 SQL 的基础知识，如函数、子句、查询和连接。

高级 SQL：此模块涵盖更高级的主题，如数据库设计、窗口函数、查询优化等。

统计和探索性数据分析

统计和数据齐头并进。大多数数据分析在后台运行统计分析，然后可以进一步探索以获得显着结果。

本部分涵盖以下 6 个模块：

分析问题解决：该模块涵盖了 CRISP-DM 框架，用于概述从业务理解到部署的机器学习项目。
投资任务：作为投资银行公司员工的数据分析任务。
推论统计：该模块涵盖了最重要的统计概念，例如概率、概率分布和中心极限定理。
假设检验：本模块介绍了假设检验的内容、原因和方法。 P 值，不同类型的测试和 Python 中的实现。
探索性数据分析： EDA 从数据中提取信息。 本模块涵盖 ML 的数据清理、单变量/双变量分析和派生指标。
小组项目： Lending Club 案例研究，找出哪些客户有拖欠贷款的风险。

从世界顶级大学学习机器学习认证。 获得硕士、Executive PGP 或高级证书课程以加快您的职业生涯。

机器学习-1

这部分涵盖了机器学习的基础知识和一些算法。在深入研究更高级的主题之前，必须全面了解这些知识。

它由5个模块组成：

线性回归：该模块涵盖线性回归的基础知识、假设、局限性和行业应用。
线性回归评估：汽车价格预测任务。
Logistic Regression：用于分类 ML 的单变量和多变量 Logistic 回归。 涵盖了 Python 中的实现、评估指标和行业应用。
朴素贝叶斯：最简单、最有效的分类算法之一。 本模块涵盖贝叶斯定理、朴素贝叶斯分类器和垃圾邮件-火腿分类器中的实现的基础知识。
模型选择：该模块涵盖模型选择、偏差-方差权衡、超参数调整和交叉验证，这些都是最终确定最佳 ML 模型所必需的。

机器学习-2

这部分涵盖了机器学习的更高级主题。它由不同类型的有监督和无监督算法组成。

涵盖的8个模块是：

高级回归：该模块介绍了广义线性回归和正则化回归技术，如 Ridge 和 Lasso。
支持向量机（可选）：该模块涵盖了 SVM 算法、其工作、内核和实现。
树模型：这里介绍了树模型的基础知识、它们的结构、分裂技术、修剪和集成以形成随机森林。
模型选择 - 实际注意事项：该模块提供了使用模型选择技术来选择最佳模型的实践。
Boosting：什么是弱学习器和字符串学习器，如何将它们连接在一起形成一个很好的模型。 这里介绍了各种 Boosting 技术。
无监督学习聚类：本模块从头开始介绍聚类、其类型和实现。
无监督学习-主成分分析：这涵盖了 PCA 的基础知识、它在 Python 中的工作和实现。
电信流失案例研究：预测电信运营商客户流失的案例研究。

自然语言处理

自然语言处理（NLP）本身就是一个巨大的领域。在这个 NLP 部分中，文本数据处理的所有构建块都与聊天机器人一起介绍。

包含的5个模块是：

词法处理：该模块涵盖了 NLP 的基础知识，如文本编码、正则表达式、文本处理技术和高级词法技术，如语音散列。
句法处理：该模块涵盖句法处理的基础知识、不同类型的文本解析、信息提取和条件随机字段。
句法处理-分配：实施句法处理以理解文本的语法结构。
语义处理：本模块介绍语义处理、词向量和嵌入、主题建模技术以及案例研究。
使用 Rasa 构建聊天机器人：该模块涵盖了最热门的聊天机器人开发工具以及实现。

深度学习

深度学习在业界广泛用于各种类型数据的许多前沿应用。在这一部分中，将介绍所有类型的神经网络以及实现。

涵盖的 5 个模块是：

神经网络简介：该模块涵盖了神经网络、激活函数和前馈网络的基础知识。
卷积神经网络行业应用：该模块详细介绍了 CNN、其结构、层和工作。它还涵盖了各种迁移学习模型、样式迁移和图像数据的数据预处理以及案例研究。
神经网络分配：基于 CNN 的案例研究。
循环神经网络：该模块涵盖了另一种专门用于基于序列的数据的神经网络——RNN 和 LSTM 及其实现。
神经网络项目：在本模块中，您将使用 CNN 和 RNN 网络堆栈进行手势识别项目。

强化学习

在这一部分中，我们将向您介绍另一种类型的机器学习——强化学习。您将学习基础知识，包括经典强化学习和深度强化学习。

本部分涵盖以下 4 个模块：

经典强化学习：该模块涵盖了 RL 的基础知识，如马尔可夫决策过程、RL 方程以及蒙特卡洛方法。
作业-经典强化学习：使用 RL 的井字游戏作业。
深度强化学习：在本模块中，我们将深入探讨深度 Q 网络、它们的架构和实现。它还涵盖了更高级的主题，例如 Policy Gradient Methods 和 Actor-Critic Methods。
强化学习项目：使用 RL 架构完成的任务。

顶峰项目

在这一部分中，您将使用迄今为止获得的所有知识来制作最终的顶点项目。

这部分分为2个模块：

部署：本模块涵盖机器学习项目的后期阶段，您将在其中学习云和 PaaS 上的部署基础知识，以及 CI/CD 管道和 Docker 基础知识。
Capstone：让你的简历和作品集一飞冲天的最后一个顶点项目。

在你走之前

该计划涵盖了进入数据科学和机器学习行业所需的所有基础知识和高级工具和技能。你将经历足够多的实践和项目，以确保你学得很好。

借助所有学到的技能，您还可以在其他竞争平台上活跃起来，以测试您的技能并获得更多动手能力。

什么是机器学习？

机器学习是计算机科学的一个领域，它使计算机能够在没有明确编程的情况下进行学习。赋予计算机无需明确编程即可学习的能力。机器学习是研究可以从数据中学习和预测的算法的构建和研究的科学学科。从问题陈述来看，机器学习侧重于根据给定数据/特征进行预测建模，并根据数据中存在的特征形成关于结果概率的假设。

机器学习有哪些应用？

一般来说，机器学习是一种人工智能（AI），它涉及计算机或程序来学习和根据数据进行预测。机器学习已经广泛应用于图像识别、自然语言处理等各个领域，而最近在深度学习和大数据方面的突破使人工智能更接近现实。目前，机器学习正被用于几乎所有关键领域，包括医疗保健、运输和物流、农业、电子商务等。

如何创建机器学习模型？

机器学习模型从标记的训练数据中学习，并对以前看不见的新数据进行预测或分类。它基于统计学习理论，但有很多优化、建模和编码。因此，机器学习模型有两个部分，一个模型和一个学习算法。模型部分表示为数学模型，例如树或决策树，而学习算法则表示为历史数据集。学习算法将从数据集中学习并优化模型以平衡模型的误差和复杂性。你的模型越准确，模型越简单，它就越好。