機械学習コースのシラバス:スキルアップに最適なML&AIコース

公開: 2021-01-21

upGradによるPGディプロマコースは、最も包括的なコースの1つです。 これは、現在業界で必要とされるスキル、概念、およびツールに関するすべての知識を網羅しています。

シラバスは、業界での準備が整い、面接に簡単に対応できるように設計されています。

「機械学習とAIのエグゼクティブPGプログラム」の対象範囲の詳細については、シラバス全体を確認してみましょう。

コースは8つの主要な部分に分かれています。

  1. データサイエンスツールキット
  2. 統計および探索的データ分析
  3. 機械学習-1
  4. 機械学習-2
  5. 自然言語処理
  6. ディープラーニング
  7. 強化学習
  8. 展開とキャップストーンプロジェクト

目次

データサイエンスツールキット

このパートは、データサイエンスと機械学習の旅を始めるために不可欠な準備コースです。 主な要件は、ある程度Python、SQL、Excelです。

この部分は、以下の6つのモジュールに分かれています。

Pythonの概要:このモジュールでは、事前の知識がないと仮定して、Pythonのコアトピックについて説明します。 Pythonの構造、リスト、タプル、辞書などのデータ構造を理解する方法について説明します。

Python for Data Science:Pythonの2つの最も重要なライブラリであるNumPyとPandasについて詳しく説明します。 NumPyとPandasは、データ分析、クリーニング、およびデータサイエンスのコア作業のほとんどに不可欠です。

機械学習のための数学:このモジュールでは、線形代数、行列、多変数微積分、およびベクトルについて説明します。 これらのトピックは、MLアルゴリズムがどのように機能するかを理解するための前提条件です。

Pythonでのデータの視覚化:このモジュールでは、Pythonを使用してグラフと傾向をプロットするダイナミクスについて説明します。

  • SQLを使用したデータ分析: SQLはデータ分析とエンジニアリングの中核です。 このモジュールでは、関数、句、クエリ、結合などのSQLの基本について説明します。
  1. 高度なSQL:このモジュールは、データベース設計、ウィンドウ関数、クエリ最適化などのより高度なトピックをカバーしています。

統計および探索的データ分析

統計とデータは密接に関連しています。 ほとんどのデータ分析は、内部で統計分析を実行します。その後、さらに調査して、重要な結果を得ることができます。

このパートでは、以下の6つのモジュールについて説明します。

  1. 分析の問題解決:このモジュールでは、ビジネスの理解から展開に至るまでの機械学習プロジェクトの概要について、CRISP-DMフレームワークについて説明します。
  2. 投資の割り当て:投資銀行会社の従業員としてのデータ分析の割り当て。
  3. 推測統計:このモジュールでは、確率、確率分布、中心極限定理などの最も重要な統計概念について説明します。
  4. 仮説検定:このモジュールでは、仮説検定の内容、理由、および方法について説明します。 P値、Pythonでのさまざまなタイプのテストと実装。
  5. 探索的データ分析: EDAはデータから情報を引き出します。 このモジュールでは、データクリーニング、単変量/二変量解析、およびMLの派生メトリックについて説明します。
  6. グループプロジェクト:どの顧客が債務不履行のリスクにさらされているかを調べるためのレンディングクラブのケーススタディ。

世界のトップ大学から機械学習認定学びましょう。 マスター、エグゼクティブPGP、または高度な証明書プログラムを取得して、キャリアを迅速に追跡します。

機械学習-1

このパートでは、機械学習の基本といくつかのアルゴリズムについて説明します。 より高度なトピックに飛び込む前に、これらの包括的な知識を持っていることが不可欠です。

5つのモジュールで構成されています。

  1. 線形回帰:このモジュールでは、線形回帰の基本、その仮定、制限、および業界アプリケーションについて説明します。
  2. 線形回帰評価:車の価格予測の割り当て。
  3. ロジスティック回帰:分類MLの単変量および多変量ロジスティック回帰。 Pythonでの実装、評価指標、業界アプリケーションについて説明します。
  4. ナイーブベイズ:最も簡単で効果的な分類アルゴリズムの1つ。 このモジュールでは、ベイズの定理、単純ベイズ分類器、およびスパムハム分類器での実装の基本について説明します。
  5. モデルの選択:このモジュールでは、最適なMLモデルを完成させるために必要なモデルの選択、バイアスと分散のトレードオフ、ハイパーパラメーターの調整、および相互検証について説明します。

機械学習-2

このパートでは、機械学習のより高度なトピックについて説明します。 これは、さまざまなタイプの教師ありアルゴリズムと教師なしアルゴリズムで構成されています。

対象となる8つのモジュールは次のとおりです。

  1. 高度な回帰:このモジュールでは、RidgeやLassoなどの一般化線形回帰と正則化回帰の手法を紹介します。
  2. サポートベクターマシン(オプション):このモジュールでは、SVMアルゴリズム、その動作、カーネル、および実装について説明します。
  3. ツリーモデル:ツリーモデルの基本、その構造、分割手法、剪定、およびランダムフォレストを形成するためのアンサンブルについて説明します。
  4. モデル選択-実用的な考慮事項:このモジュールでは、モデル選択手法を使用して最適なモデルを選択するための実践的な方法を提供します。
  5. 後押し:弱い学習者と文字列学習者とは何ですか。また、それらを結合して優れたモデルを形成するにはどうすればよいですか。 ここでは、さまざまなブースティング手法について説明します。
  6. 教師なし学習-クラスタリング:このモジュールでは、クラスタリング、そのタイプ、および実装を最初から紹介します。
  7. 教師なし学習-主成分分析:これは、PCAの基本、Pythonでの動作と実装について説明しています。
  8. 電気通信チャーンのケーススタディ:電気通信事業者の顧客チャーンを予測するためのケーススタディ。

自然言語処理

自然言語処理(NLP)は、それ自体が巨大な分野です。 このNLPパートでは、テキストデータ処理のすべての構成要素がチャットボットとともにカバーされています。

含まれている5つのモジュールは次のとおりです。

  1. 語彙処理:このモジュールでは、テキストエンコーディング、正規表現、テキスト処理技術、音声ハッシュなどの高度な語彙技術など、NLPの基本について説明します。
  2. 構文処理:このモジュールでは、構文処理の基本、さまざまなタイプのテキスト解析、情報抽出、および条件付き確率場について説明します。
  3. 構文処理-割り当て:テキストの文法構造を理解するための構文処理を実装します。
  4. セマンティック処理:このモジュールでは、セマンティック処理、単語のベクトルと埋め込み、トピックモデリング手法とそれに続くケーススタディを紹介します。
  5. Rasaを使用したチャットボットの構築:このモジュールでは、チャットボット開発と実装のための最もホットなツールについて説明します。

ディープラーニング

ディープラーニングは、さまざまなタイプのデータの多くの最先端アプリケーションで業界で広く使用されています。 このパートでは、すべてのタイプのニューラルネットワークを実装とともに説明します。

対象となる5つのモジュールは次のとおりです。

  1. ニューラルネットワークの概要:このモジュールでは、ニューラルネットワーク、アクティブ化関数、およびフィードフォワードネットワークの基本について説明します。
  2. 畳み込みニューラルネットワーク-業界アプリケーション:このモジュールでは、CNN、その構造、レイヤー、および動作について詳しく説明します。 また、さまざまな転送学習モデル、スタイル転送、画像データのデータ前処理とそれに続くケーススタディについても説明します。
  3. ニューラルネットワーク-割り当て: CNNベースのケーススタディ。
  4. リカレントニューラルネットワーク:このモジュールでは、シーケンスベースのデータに特別に使用される別のタイプのニューラルネットワーク(RNNとLSTM、およびそれらの実装)について説明します。
  5. ニューラルネットワークプロジェクト:このモジュールでは、CNNおよびRNNネットワークスタックを使用してジェスチャ認識プロジェクトを実行します。

強化学習

このパートでは、別のタイプの機械学習である強化学習を紹介します。 古典的な強化学習や深層強化学習などの基本を学びます。

このパートでは、以下の4つのモジュールについて説明します。

  1. 古典的な強化学習:このモジュールでは、マルコフ決定過程、RL方程式、モンテカルロ法などのRLの基本について説明します。
  2. 割り当て-古典的な強化学習: RLを使用した三目並べの割り当て。
  3. 深層強化学習:このモジュールでは、Deep Qネットワーク、そのアーキテクチャと実装について詳しく説明します。 また、ポリシー勾配法やアクタークリティカル法などのより高度なトピックについても説明します。
  4. 強化学習プロジェクト: RLアーキテクチャを使用して行われる割り当て。

キャップストーンプロジェクト

このパートでは、これまでに得たすべての知識を使用して、最終的なキャップストーンプロジェクトを作成します。

この部分は2つのモジュールに分かれています。

  1. デプロイ:このモジュールでは、機械学習プロジェクトの後の段階で、クラウドとPaaSのデプロイの基本、およびCI/CDパイプラインとDockerの基本を学習します。
  2. キャップストーン:履歴書とポートフォリオを急上昇させるための最後のキャップストーンプロジェクト。

行く前に

このプログラムは、データサイエンスと機械学習業界に参入するために必要なすべての基本と高度なツールとスキルをカバーしています。 あなたはあなたがよく学んだことを確認するために十分な量の実践とプロジェクトを経験するでしょう。

習得したすべてのスキルを使用して、他の競合するプラットフォームでもアクティブになり、スキルをテストして、さらに実践的になることができます。

機械学習とは何ですか?

機械学習は、明示的にプログラムされていなくてもコンピューターが学習できるようにするコンピューターサイエンスの分野です。 明示的にプログラムされていなくても、コンピューターが学習できるようにします。 機械学習は、データから学習して予測を行うことができるアルゴリズムの構築と研究を研究する科学分野です。 問題の説明から、機械学習は特定のデータ/機能からの予測モデリングに焦点を当て、データに存在する機能に基づいて結果の確率についての仮説を立てます。

機械学習の用途は何ですか?

一般に、機械学習は一種の人工知能(AI)であり、データに基づいて学習し、予測を行うためのコンピューターまたはプログラムが関与します。 機械学習は、画像認識、自然言語処理、その他のさまざまな分野ですでに広く使用されていますが、ディープラーニングとビッグデータの最近の進歩により、AIは現実に近づきました。 現在、機械学習は、ヘルスケア、輸送およびロジスティクス、農業、eコマースなどを含むほぼすべての重要なセクターで使用されています。

機械学習モデルを作成するにはどうすればよいですか?

機械学習モデルは、ラベル付けされたトレーニングデータから学習し、以前は表示されなかった新しいデータの予測または分類を行います。 これは統計的学習理論に基づいていますが、多くの最適化、モデリング、およびコーディングが含まれています。 したがって、機械学習モデルには、モデルと学習アルゴリズムの2つの部分があります。 モデル部分は、ツリーや決定木などの数学モデルとして表され、学習アルゴリズムは履歴データセットによって表されます。 学習アルゴリズムはデータセットから学習し、モデルを最適化してエラーとモデルの複雑さのバランスを取ります。 モデルの精度が高く、モデルが単純であるほど、モデルは優れています。