教師あり学習と教師なし学習の違い

公開: 2022-09-26

序章

機械学習、人工知能、データ分析などのテクノロジーは、データを活用して複雑なタスクを自動化します。データの使用は、競合他社の一歩先を行き、より良い顧客サービスを提供し、効果的なビジネス戦略を構築するための処理と解釈だけでなく、モデルのトレーニング、テスト、および評価にも限定されません。機械学習では、データはトレーニングデータ、検証データ、テストデータの 3 つのカテゴリに分類されます。名前が示すように、トレーニングデータは機械学習のモデルまたはアルゴリズムをトレーニングします。モデルは、入力および出力のトレーニングデータセットから学習し、分類を予測するか、特定のタスクを実行します。アルゴリズムの教師あり学習と教師なし学習の両方にトレーニングデータを使用します。

米国での AI & ML プログラム

LJMU と IIITB の機械学習と AI の理学修士号	IIITB の機械学習と人工知能のエグゼクティブ PG プログラム
すべてのコースを調べるには、以下のページにアクセスしてください。
機械学習コース

このブログでは、機械学習の 2 つの大きなカテゴリ (教師あり学習と教師なし学習) とその違いについて詳しく説明します。

世界のトップ大学から機械学習認定を取得します。マスター、エグゼクティブ PGP、または上級認定プログラムを取得して、キャリアを加速させましょう。

教師あり学習とは

機械学習と人工知能のサブセットである教師あり学習は、ラベル付きデータを使用してアルゴリズムをトレーニングするアルゴリズム教育手法です。データセットで分類や回帰などのタスクを実行する方法をアルゴリズムに教えます。教師あり学習では、アルゴリズムは入出力トレーニングサンプルを受け取り、これらのサンプルを使用してデータセット間の関係を確立します。教師の下でタスクを実行するために、ラベル付けされたトレーニングデータをアルゴリズムに提供するため、これを教師あり学習と呼びます。教師あり学習の主な目的は、アルゴリズムにデータをフィードして、入力と出力の関係を理解することです。アルゴリズムが入力と出力の間の接続を確立すると、新しい入力から最新の結果を正確に提供できます。

教師あり学習がどのように機能するかを理解しましょう。機械学習アルゴリズムに入力 X と出力 Y があるとします。入力 X をモデルの学習システムにフィードまたは提供します。この学習システムは出力 Y' を提供します。システム内のアービトレータが Y と Y' の違いをチェックし、エラー信号を生成します。この信号は、Y と Y' の違いを理解し、パラメータを調整して Y と Y' の違いを減らす学習システムに渡されます。ここで、Y はラベル付きデータです。

教師あり学習プロセスには、複数のステップが含まれます。

最初に、トレーニングデータセットのタイプを決定してから、ラベル付けされたトレーニングデータを収集する必要があります。また、分類または回帰のためにデータを別の方法で配置する必要があります。
次のステップは、サポートベクターマシンやデシジョンツリーなどの教師あり学習のアルゴリズムを使用して、学習モデルの入力機能を決定することです。
次に、学習プロセスを実行し、パラメータを調整または制御します。
最後のステップでは、モデルの精度をテストします。

教師あり学習プロセス全体で学習システムをトレーニングしてパラメーターを調整するため、アルゴリズムは出力の差を最小限に抑えます。教師あり学習は、データマイニングにおける 2 つの複雑なプロセス (分類と回帰) を容易にします。分類では、データは、スパムフィルターなどの同様の属性に基づいて、さまざまなクラスに分類またはラベル付けされます。回帰を使用して、株式市場や心拍数などの継続的な観測を予測します。回帰は実数値を与えます。

以下は、教師あり学習アルゴリズムのさまざまなタイプです。

Naive Bayes:- Naive Bayes Classifier は、ベイズの定理に基づいています。 このアルゴリズムは、クラスのすべての機能が互いに独立していることを前提としています。単純ベイズ分類器は、条件付き確率法を使用して分類を予測します。
サポートベクターマシン:-これは、分類および回帰タスク用の一般的な機械学習アルゴリズムです。
線形回帰:-線形回帰アルゴリズムは、教師あり学習を使用して将来の結果を予測します。 1 つの従属変数と 2 つ以上の独立変数の間の関係を確立します。
ロジスティック回帰:-はいまたはいいえ、真または偽などのさまざまなカテゴリの変数がある場合、ロジスティック回帰アルゴリズムを使用します。 主にロジスティック回帰アルゴリズムを使用して、バイナリ分類の問題を解決します。

要約すると、教師あり学習は、既知の入力データと出力データを使用してモデルをトレーニングし、新しい入力セットの予測を生成するために使用されます。

教師なし学習とは

教師あり学習とは異なり、教師なし学習ではラベル付きデータはありません。データセットまたは予測される結果の間に事前定義された関係はありません。教師あり学習とは対照的に、教師なし学習では人間の介入が最小限で済みます。したがって、これを教師なし学習と呼びます。モデルはデータセット観測のコレクションを使用し、特定のデータのプロパティを記述します。教師なし学習は、データセット内のさまざまなグループを識別するため、クラスタリングフレームワークに基づいています。

教師なし学習がどのように機能するかを理解しましょう。 X1、X2、X3…….Xt という名前の一連の入力があるが、ターゲット出力はないとします。この場合、マシンはその環境からフィードバックを受け取りません。ただし、正式なフレームワークを開発し、将来の成果を予測します。教師なし学習では、モデルは意思決定と表現の構築に入力を使用します。出力データがないため、教師なし学習を分類および回帰プロセスに使用することはできません。教師なし学習の主な用途は、入力データセットの根底にある構造を理解することです。機械は、構造を見つけた後、解釈に基づいてデータを異なるグループに配置します。最後のステップは、データセットを圧縮形式で表現することです。

エンジニアは主に、探索的分析と次元削減という 2 つの目的で教師なし学習を使用します。探索的分析は、データの初期調査を実行して、データをさまざまなグループに配置し、仮説を構築し、パターンを発見します。次元削減プロセスにより、特定のデータセットの入力数が削減されます。教師なし学習の最も重要な利点には、関連する洞察を見つけることが含まれます。教師なし学習は、人間の介入が最小限で済むため、主に AI アプリケーションの構築に使用されます。

教師あり学習と教師なし学習

教師あり学習と教師なし学習が何であるかがわかったので、それらの最も重要な違いを見てみましょう。

データ –教師あり学習はラベル付きデータを使用しますが、教師なし学習はラベル付きデータを使用しません。 また、教師あり学習のモデルに出力データを提供します。ただし、教師なし学習では、入力データは使用できません。
フィードバック- モデルはフィードバックを受け取り、教師あり学習のパラメーターを調整します。 教師なし学習では起こりません。
目標 –教師あり学習の主な目的は、トレーニングデータを使用してモデルをトレーニングすることです。 したがって、新しい入力が利用可能になると、マシンは正確な出力を予測できます。ただし、教師なし学習では出力を利用できないため、特定のデータに関連する洞察や隠れたパターンを収集するために使用されます。
分類と回帰 –教師あり学習を分類と回帰に分類できますが、これは教師なし学習では起こりません。
人工知能 –トレーニングデータをモデルにフィードする必要があるため、教師あり学習は人工知能には関係ありません。 ただし、教師なし学習は人間の介入が最小限で済むため、人工知能にとってより有益です。
アルゴリズム –教師あり学習アルゴリズムには、サポートベクターマシン、ナイーブベイズ、線形回帰、およびロジスティック回帰が含まれます。教師なし学習アルゴリズムには、クラスタリングと K 最近傍 (KNN) が含まれます。
結果の精度 –教師あり学習でモデルが所定の出力を取得すると、より正確な結果が得られます。 ただし、教師なし学習の結果は主観的であり、精度が低くなります。

IoT: 歴史、現在、未来	機械学習のチュートリアル: ML を学ぶ	アルゴリズムとは？シンプル＆イージー
インドのロボット工学エンジニアの給与：すべての役割	機械学習エンジニアの 1 日: 彼らは何をしているのか?	IoT（モノのインターネット）とは
順列と組み合わせ：順列と組み合わせの違い	人工知能と機械学習のトップ 7 トレンド	R による機械学習: 知っておくべきすべてのこと

結論

教師あり学習と教師なし学習は、機械学習の基本概念であり、複雑な概念を学習するための基礎を設定します。機械学習に強い関心があり、機械学習でキャリアを積みたい場合は、 upGrad で機械学習と AI の理学修士号を取得できます。

業界のリーダーがこのコースを教えることで、機械学習に関する深い理論的知識と、機械学習技術に関する実践的な洞察を得ることができます。さらに、機械学習に関するいくつかのケーススタディやプロジェクトに取り組む機会を得て、関連するスキルを習得するのに役立ちます。

教師なし学習はいつ使用できますか?

入力と出力が定義されたトレーニングデータセットを収集するのは困難です。そのような場合は、教師なし学習を使用することをお勧めします。教師なし学習では、出力データが提供されていない場合、またはラベルが指定されていない場合、モデルは入力データから推論を引き出します。したがって、入力はあっても出力が定義されていない場合は、教師なし学習を使用できます。教師なし学習の最適な用途の 1 つは、人工知能アプリケーションの開発です。

教師あり学習はいつ使用する必要がありますか?

教師あり学習アルゴリズムは、明確な入力データセットと出力データセットがある場合に使用されます。パラメータを調整することで、機械学習モデルのパフォーマンス基準を最適化できます。教師あり学習は、実際の計算問題を解決し、音声とテキストの認識、予測分析、スパム検出のためのアプリケーションを構築するのに役立ちます。

教師あり学習におけるラベル付きデータとは?

ラベル付きデータとは、特定のプロパティまたは特性に基づいてマークまたは分類されたデータセットを意味します。教師あり学習では、学習モデルをトレーニングするためのベンチマークとして使用するトレーニングデータをラベル付きデータと呼びます。