教師あり機械学習とは何ですか? アルゴリズム、例
公開: 2021-06-22機械学習は、政府機関、小売サービス、金融機関からヘルスケア、エンターテインメント、運輸部門まで、いたるところにあります。 NetflixやAmazonがオンラインでおすすめを提供したり、スマートフォンを顔検出テクノロジーでロック解除したり、機械学習や人工知能がかつてないほど勢いを増しているなど、私たちの日常生活と複雑に関連しています。
機械学習は現在最も人気のある技術トレンドの1つであるため、人工知能を作成するための重要なアプローチの1つである教師あり機械学習について知ることが不可欠になります。
目次
教師あり機械学習とは何ですか?
監視付き機械学習は、ラベル付けされた入力データを使用してコンピューターアルゴリズムがトレーニングされ、コンピューターが予期しないデータの出力を予測する機械学習の一種です。 ここで、「ラベル付き」とは、機械学習に役立つように、一部のデータに正解のタグが付けられていることを意味します。 教師あり学習では、コンピューターに入力された入力データは、スーパーバイザーまたは教師のように機能して、入力データと出力ラベルの間の基礎となるパターンと相関関係を検出することにより、正確な結果を生成するようにマシンをトレーニングします。
教師あり学習アルゴリズムの種類
特定の結果を達成するために、さまざまなタイプの教師あり学習アルゴリズムがあります。 最も一般的なタイプのいくつかを見てみましょう。
1.分類
分類アルゴリズムは、ラベル付けされたトレーニングデータを使用して、入力を特定の数のクラスまたはカテゴリに並べ替えます。 ここで、出力変数は「はい」または「いいえ」および「真」または「偽」などのカテゴリーです。 医療レポートをポジティブ(病気)またはネガティブ(病気なし)に分類したり、映画をさまざまなジャンルに分類したりすることは、分類アルゴリズムが適用できるいくつかの例です。
2.回帰
回帰モデルは、入力変数と出力変数の間に数値関係がある場合に使用されます。 教師あり学習の範囲内にある回帰アルゴリズムには、線形回帰、非線形回帰、回帰ツリー、多項式回帰、およびベイズ線形回帰が含まれます。 このようなモデルは主に、市場動向の推測、天気予報、1日の特定の時間におけるオンライン広告のクリック率の事前決定などの継続的な変数を予測するために使用されます。
世界のトップ大学である機械学習オンラインコースに参加して、修士号、エグゼクティブ大学院プログラム、ML&AIの高度な証明書プログラムに参加して、キャリアを早めましょう。
3.ニューラルネットワーク
ニューラルネットワークアルゴリズムは、感覚データの解釈、パターンの認識、または生の入力のクラスタリングに使用されます。 このアルゴリズムにはいくつかの利点がありますが、観測値が多すぎる場合にニューラルネットワークを使用するのはかなり難しい場合があります。 ニューラルネットワークの一般的な実際のアプリケーションには、情報抽出、テキスト分類、音声と文字の認識、マルチドキュメントの要約、言語生成などがあります。
4.単純ベイズモデル
単純ベイズ分類器は、単一のアルゴリズムではなく、ベイズの定理に基づくアルゴリズムのコレクションです。 これらのアルゴリズムの基礎となる標準的な原則は、分類された機能のすべてのペアが互いに独立しているということです。 クラスラベルは、複数の子ノードと1つの親ノードで構成される直接非巡回グラフを使用して割り当てられます。 各子ノードは、親から分離され、独立していると見なされます。 単純ベイズアルゴリズムの一般的な実際のアプリケーションには、スパムフィルタリングと感情分析が含まれます。
5.ディシジョンツリー
デシジョンツリーは、決定とその考えられる結果を比較するための条件付き制御ステートメントを含むフローチャートのようなモデルです。 決定木は、内部ノードが属性を選択して質問を行うポイントを表し、リーフノードがクラスラベルまたは実際の出力を表し、エッジが質問への回答を表すツリーのようなグラフを伴います。
6.サポートベクターマシン
サポートベクターマシン(SVM)は、Vap Nickによって提供された統計的学習理論に基づいており、1990年に開発されました。簡単に言えば、サポートベクターマシンは、回帰、分類、および異常検出に使用される教師あり学習方法のセットです。 それらはカーネルネットワークと密接に関連しており、パターン認識、バイオインフォマティクス、マルチメディア情報検索などのさまざまな分野でアプリケーションを見つけます。
7.ランダムフォレストモデル
ランダムフォレストモデルは、個々の決定木の集合で構成され、個々のツリーがクラスの予測を行い、投票数が最大のクラスがモデルの予測になります。 ランダムフォレストモデルの概念の背後にある考え方は、アンサンブルで動作する多数の比較的無相関のツリーまたはモデルが、個々の予測のいずれよりも正確な予測を生成するということです。 これは、ツリーが独立したエラーから相互に保護しているためです。
それはどのように機能しますか?
教師あり学習では、ラベル付けされたデータセットを使用してモデルをトレーニングし、各タイプのデータについて学習できるようにします。 トレーニングが完了すると、モデルにテストデータが与えられ、出力を識別して予測します。
概念をさらに明確にするために、簡単な例を見てみましょう。
さまざまな種類の野菜からなる木枠が与えられたとします。 教師あり機械学習アプローチでは、最初のステップは、次のように、さまざまな野菜を1つずつ機械に理解させることです。
- オブジェクトが球根と紫がかったピンクのようなものである場合、それは–オニオンとしてラベル付けされます。
- オブジェクトの色が緑豊かで緑色の場合は、–ほうれん草のラベルが付けられます。
機械を訓練したら、木枠とは別の野菜(たとえばタマネギ)を与え、それを特定するように依頼します。 さて、機械は以前のデータから野菜についてすでに学習しているので、新しいオブジェクトをその形状と色に基づいて分類し、結果をタマネギとして確認します。 このようにして、マシンはトレーニングデータ(野菜を含む木枠)から学習またはトレーニングし、その知識を新しい予期しないデータ(新しい野菜)に適用します。
上で使用した野菜の例のように、それがどのように機能するかを理解するために、別の教師あり学習の例を見てみましょう。
三角形、正方形、五角形などのさまざまな形状で構成されるデータセットがあるとします。 最初のステップは、次の方法で各図のモデルをトレーニングすることです。
- 形状に3つの側面がある場合、「三角形」というラベルが付けられます。
- 形状に4つの等しい辺がある場合、–Squareというラベルが付けられます。
- 形状に5つの側面がある場合、「五角形」というラベルが付けられます。
トレーニングが完了したら、テストデータを使用してモデルをテストします。モデルの仕事は、トレーニングの知識に基づいて形状を特定することです。 したがって、モデルが新しい形状を見つけると、辺の数に基づいてそれを分類し、出力を提供します。
利点と課題
言うまでもなく、教師あり学習には、機械学習モデルの実装にいくつかの利点があります。 その利点のいくつかを以下に示します。
- 教師あり学習モデルは、以前の経験に基づいて出力を正確に予測できます。
- 教師あり学習は、経験を使用してパフォーマンスを最適化するのに役立ちます。
- 教師あり学習により、オブジェクトのクラスに関する明確で正確なアイデアが得られます。
- 最後になりましたが、教師あり学習アルゴリズムは、さまざまな現実の問題を解決し、さまざまな分野でのアプリケーションを見つけるために非常に重要です。
間違いなく、教師あり学習アルゴリズムは、特にリアルタイムで課題に対処する可能性に関して、非常に有益です。 ただし、持続可能で効率的な教師あり学習モデルの構築には、独自の課題が伴います。 では、見てみましょう。
- 教師あり学習モデルをトレーニングするプロセス全体は、時間のかかるプロセスです。
- 教師あり学習モデルは、正確に構造化および機能するために、特定のレベルの専門知識とリソースを必要とすることがよくあります。
- 教師なし学習モデルとは対照的に、教師あり学習モデルは、それ自体でデータを分類またはクラスタリングすることはできません。
- ヒューマンエラーがデータセットに忍び寄る可能性は非常に高く、アルゴリズムのトレーニングが正しく行われない可能性があります。
例を使用したベストプラクティス
教師あり機械学習を使用してプロジェクトを開始する前に覚えておく必要のあるベストプラクティスは何ですか? 以下をご覧ください。
- トレーニングデータセットとして使用するデータの種類を明確にしてください。
- 標準的な測定値または人間の専門家から対応する出力を収集します。
- 学習アルゴリズムの構造を決定します。
最後に、教師あり機械学習の最も優れた、最も人気のある実際の例のいくつかについて話すことは価値があります。
- 予測分析:予測分析に教師あり学習モデルを使用する広範なユースケースは、さまざまなビジネスデータポイントに意味のある実用的な洞察を提供します。 その結果、企業は、特定の出力変数に基づいて特定の結果を予測し、決定を正当化してバックアップすることができます。
- オブジェクトと画像の認識:教師あり学習アルゴリズムは、画像やビデオ内のオブジェクトの検索と分類に使用されます。これは、画像分析やさまざまなコンピュータービジョン技術で頻繁に必要となるものです。
- スパム検出:スパム検出およびフィルタリング技術は、監視された分類アルゴリズムを使用してデータベースをトレーニングし、スパムと非スパムの電子メールを効果的に分離するために新しいデータのパターンを認識できるようにします。
- 感情分析:ブランドエンゲージメントの取り組みを促進するための優れた方法は、顧客とのやり取りを理解することです。 教師あり機械学習は、顧客の感情、意図、好みなどの大規模なデータセットから重要な情報を抽出して分類することにより、この点で役立ちます。
upGradで機械学習を学ぶ
機械学習とAIの分野でそれを大きくしたいとお考えですか? 機械学習とAIにおけるupGradのエグゼクティブPGプログラムから旅を始めましょう。 これは、ディープラーニング、強化学習、NLP、グラフィカルモデルなどの需要の高いスキルを学びたい専門家向けに設計された包括的なオンライン認定コースです。
見逃せないコースのハイライトは次のとおりです。
- IIITバンガロアからのコース修了証明書。
- ライブセッション、コーディングの割り当て、ケーススタディ、プロジェクトが満載の450時間以上の学習。
- 20のツール、プログラミング言語、およびライブラリを包括的にカバーします。
- ライブコーディングクラスとプロファイル作成ワークショップ。
結論
Technavioによる最新の市場調査レポート「エンドユーザーと地理による機械学習市場–予測と分析2020-2024」では、2020年から2024年の予測期間中に、世界の機械学習市場の規模が111.6億米ドルの成長を遂げると予測しています。 さらに、成長の着実な前年比の増加は、市場の成長の推進力を煽るでしょう。
現在の傾向と将来の予測の両方が、機械学習が定着していることを示しています。 教師あり学習アルゴリズムは、主に分類と回帰の問題を含む機械学習プロジェクトの基本です。 その課題にもかかわらず、教師あり学習アルゴリズムは、経験に基づいて結果を予測するのに最も役立ちます。