機器學習課程大綱：提陞技能的最佳 ML 和 AI 課程

已發表: 2021-01-21

upGrad 的 PG 文憑課程是最全面的課程之一。它涵蓋了當前行業所需的所有技能、概念和工具知識。

課程大綱旨在讓您做好行業準備並輕鬆應對面試。

讓我們仔細閱讀完整的教學大綱，以深入了解我們的“機器學習和人工智能中的執行 PG 計劃”的覆蓋範圍。

課程分為8個主要部分：

數據科學工具包
統計和探索性數據分析
機器學習-1
機器學習-2
自然語言處理
深度學習
強化學習
部署和頂點項目

數據科學工具包

這部分是一門預備課程，對於開始數據科學和機器學習的旅程至關重要。在某種程度上，主要要求是 Python、SQL 和 Excel。

這部分分為以下6個模塊：

Python 簡介：本模塊涵蓋了核心 Python 主題，假設沒有先驗知識。 了解 Python 的結構，涵蓋了列表、元組、字典等數據結構。

用於數據科學的 Python：深入介紹了 Python 的兩個最重要的庫——NumPy 和 Pandas。 NumPy 和 Pandas 對於數據分析、清理和大多數核心數據科學工作至關重要。

機器學習數學：本模塊涵蓋線性代數、矩陣、多變量微積分和向量。 這些主題是了解 ML 算法如何工作的先決條件。

Python 中的數據可視化：該模塊涵蓋了使用 Python 繪製圖形和趨勢的動態。

使用 SQL 進行數據分析： SQL 是數據分析和工程的核心。 本模塊涵蓋 SQL 的基礎知識，如函數、子句、查詢和連接。

高級 SQL：此模塊涵蓋更高級的主題，如數據庫設計、窗口函數、查詢優化等。

統計和探索性數據分析

統計和數據齊頭並進。大多數數據分析在後台運行統計分析，然後可以進一步探索以獲得顯著結果。

本部分涵蓋以下 6 個模塊：

分析問題解決：該模塊涵蓋了 CRISP-DM 框架，用於概述從業務理解到部署的機器學習項目。
投資任務：作為投資銀行公司員工的數據分析任務。
推論統計：該模塊涵蓋了最重要的統計概念，例如概率、概率分佈和中心極限定理。
假設檢驗：本模塊介紹了假設檢驗的內容、原因和方法。 P 值，不同類型的測試和 Python 中的實現。
探索性數據分析： EDA 從數據中提取信息。 本模塊涵蓋 ML 的數據清理、單變量/雙變量分析和派生指標。
小組項目： Lending Club 案例研究，找出哪些客戶有拖欠貸款的風險。

從世界頂級大學學習機器學習認證。 獲得碩士、Executive PGP 或高級證書課程以加快您的職業生涯。

機器學習-1

這部分涵蓋了機器學習的基礎知識和一些算法。在深入研究更高級的主題之前，必須全面了解這些知識。

它由5個模塊組成：

線性回歸：該模塊涵蓋線性回歸的基礎知識、假設、局限性和行業應用。
線性回歸評估：汽車價格預測任務。
Logistic Regression：用於分類 ML 的單變量和多變量 Logistic 回歸。 涵蓋了 Python 中的實現、評估指標和行業應用。
樸素貝葉斯：最簡單、最有效的分類算法之一。 本模塊涵蓋貝葉斯定理、樸素貝葉斯分類器和垃圾郵件-火腿分類器中的實現的基礎知識。
模型選擇：該模塊涵蓋模型選擇、偏差-方差權衡、超參數調整和交叉驗證，這些都是最終確定最佳 ML 模型所必需的。

機器學習-2

這部分涵蓋了機器學習的更高級主題。它由不同類型的有監督和無監督算法組成。

涵蓋的8個模塊是：

高級回歸：該模塊介紹了廣義線性回歸和正則化回歸技術，如 Ridge 和 Lasso。
支持向量機（可選）：該模塊涵蓋了 SVM 算法、其工作、內核和實現。
樹模型：這裡介紹了樹模型的基礎知識、它們的結構、分裂技術、修剪和集成以形成隨機森林。
模型選擇 - 實際注意事項：該模塊提供了使用模型選擇技術來選擇最佳模型的實踐。
Boosting：什麼是弱學習器和字符串學習器，如何將它們連接在一起形成一個很好的模型。 這裡介紹了各種 Boosting 技術。
無監督學習聚類：本模塊從頭開始介紹聚類、其類型和實現。
無監督學習-主成分分析：這涵蓋了 PCA 的基礎知識、它在 Python 中的工作和實現。
電信流失案例研究：預測電信運營商客戶流失的案例研究。

自然語言處理

自然語言處理（NLP）本身就是一個巨大的領域。在這個 NLP 部分中，文本數據處理的所有構建塊都與聊天機器人一起介紹。

包含的5個模塊是：

詞法處理：該模塊涵蓋了 NLP 的基礎知識，如文本編碼、正則表達式、文本處理技術和高級詞法技術，如語音散列。
句法處理：該模塊涵蓋句法處理的基礎知識、不同類型的文本解析、信息提取和條件隨機字段。
句法處理-分配：實施句法處理以理解文本的語法結構。
語義處理：本模塊介紹語義處理、詞向量和嵌入、主題建模技術以及案例研究。
使用 Rasa 構建聊天機器人：該模塊涵蓋了最熱門的聊天機器人開發工具以及實現。

深度學習

深度學習在業界廣泛用於各種類型數據的許多前沿應用。在這一部分中，將介紹所有類型的神經網絡以及實現。

涵蓋的 5 個模塊是：

神經網絡簡介：該模塊涵蓋了神經網絡、激活函數和前饋網絡的基礎知識。
卷積神經網絡行業應用：該模塊詳細介紹了 CNN、其結構、層和工作。它還涵蓋了各種遷移學習模型、樣式遷移和圖像數據的數據預處理以及案例研究。
神經網絡分配：基於 CNN 的案例研究。
循環神經網絡：該模塊涵蓋了另一種專門用於基於序列的數據的神經網絡——RNN 和 LSTM 及其實現。
神經網絡項目：在本模塊中，您將使用 CNN 和 RNN 網絡堆棧進行手勢識別項目。

強化學習

在這一部分中，我們將向您介紹另一種類型的機器學習——強化學習。您將學習基礎知識，包括經典強化學習和深度強化學習。

本部分涵蓋以下 4 個模塊：

經典強化學習：該模塊涵蓋了 RL 的基礎知識，如馬爾可夫決策過程、RL 方程以及蒙特卡洛方法。
作業-經典強化學習：使用 RL 的井字遊戲作業。
深度強化學習：在本模塊中，我們將深入探討深度 Q 網絡、它們的架構和實現。它還涵蓋了更高級的主題，例如 Policy Gradient Methods 和 Actor-Critic Methods。
強化學習項目：使用 RL 架構完成的任務。

頂峰項目

在這一部分中，您將使用迄今為止獲得的所有知識來製作最終的頂點項目。

這部分分為2個模塊：

部署：本模塊涵蓋機器學習項目的後期階段，您將在其中學習雲和 PaaS 上的部署基礎知識，以及 CI/CD 管道和 Docker 基礎知識。
Capstone：讓你的簡歷和作品集一飛沖天的最後一個頂點項目。

在你走之前

該計劃涵蓋了進入數據科學和機器學習行業所需的所有基礎知識和高級工具和技能。你將經歷足夠多的實踐和項目，以確保你學得很好。

借助所有學到的技能，您還可以在其他競爭平台上活躍起來，以測試您的技能並獲得更多動手能力。

什麼是機器學習？

機器學習是計算機科學的一個領域，它使計算機能夠在沒有明確編程的情況下進行學習。賦予計算機無需明確編程即可學習的能力。機器學習是研究可以從數據中學習和預測的算法的構建和研究的科學學科。從問題陳述來看，機器學習側重於根據給定數據/特徵進行預測建模，並根據數據中存在的特徵形成關於結果概率的假設。

機器學習有哪些應用？

一般來說，機器學習是一種人工智能（AI），它涉及計算機或程序來學習和根據數據進行預測。機器學習已經廣泛應用於圖像識別、自然語言處理等各個領域，而最近在深度學習和大數據方面的突破讓人工智能更接近現實。目前，機器學習正被用於幾乎所有關鍵領域，包括醫療保健、運輸和物流、農業、電子商務等。

如何創建機器學習模型？

機器學習模型從標記的訓練數據中學習，並對以前看不見的新數據進行預測或分類。它基於統計學習理論，但有很多優化、建模和編碼。因此，機器學習模型有兩個部分，一個模型和一個學習算法。模型部分錶示為數學模型，例如樹或決策樹，而學習算法則表示為歷史數據集。學習算法將從數據集中學習並優化模型以平衡模型的誤差和復雜性。你的模型越準確，模型越簡單，它就越好。