単純ベイズ分類器の説明

公開: 2022-09-28

目次

序章

機械学習、人工知能、またはデータ サイエンスに興味がある場合は、仮定の重要性を知っている必要があります。 機械学習やその他のリスクベースのモデルは、特定の仮定と定義済みの規則に基づいて開発され、開発者は目的の結果を得ることができます。 開発者がモデルの構築時に仮定を考慮しないと、データに干渉し、不正確な結果につながる可能性があります。 Naive Bayes Classifier は、統計モデルにおける数学的仮定の典型的な例の 1 つです。

米国での AI & ML プログラム

LJMU と IIITB の機械学習と AI の理学修士号 IIITB の機械学習と人工知能のエグゼクティブ PG プログラム
すべてのコースを調べるには、以下のページにアクセスしてください。
機械学習コース

このブログでは、ベイズの定理、単純ベイズ分類器、およびそのさまざまなモデルについて説明します。

単純ベイズ分類器とは

Naive Bayes Classifier は、英国の数学者である Thomas Bayes によって提唱された Bayes の定理に基づいています。 したがって、単純ベイズ分類器を理解する前に、ベイズの定理を理解することが適切です。 ベイズの法則またはベイズの規則としても知られるベイズの定理は、イベントの発生または非発生の可能性を決定します。 簡単に言えば、イベントが発生する確率を示します。

ベイズの定理は、機械学習でクラスを正確に予測するために広く使用されています。 機械学習における分類タスクの条件付き確率を計算します。 分類タスクは、問題を解決するために機械学習アルゴリズムによって実行されるアクティビティを指します。 スパムメールの例でこれをよりよく理解できます。 機械学習アルゴリズムは、電子メールをスパムまたは非スパムとして分類することを学習します。 したがって、機械学習モデルでは、ベイズの定理を使用して分類または分離アクティビティを予測します。

単純ベイズの定理は、ベイズの定理のサブセットです。 その主な機能はタスクの分類であるため、単純ベイズ分類器とも呼ばれます。 この定理は、すべてのクラスの特徴が互いに依存していないという単純な仮定も行います。そのため、ナイーブ ベイズの定理という用語が付けられます。 機械学習について説明する場合、単純ベイズ分類器は、特定のクラスの属性が互いに独立していると仮定しながら、ベイズの定理を適用してイベントを予測するアルゴリズムです。 これらの属性も同等と見なされ、別の機能に依存せずに存在できます。

Naive Bayes Classifier は、一連の症状、天気予報、湿度、温度、およびその他の要因が利用可能な場合の特定の病気の診断など、多くの機能に使用できます。 簡単に言えば、単純なベイズ アルゴリズムは、バイナリまたはマルチユースのマルチクラス分類を必要とするあらゆるデータ プロセスに使用できます。 Naive Bayes Classifier は、条件付き確率の概念に基づいて機能します。 これは、あるイベントが発生する確率は、他のイベントの発生に依存することを意味します。 たとえば、イベント A が発生する条件付き確率は、イベント B の発生に依存します。

世界のトップ大学から機械学習認定を取得します。 マスター、エグゼクティブ PGP、または上級認定プログラムを取得して、キャリアを加速させましょう。

単純ベイズ分類器の働き

Naive Bayes Classifier は、入力が利用可能な場合に出力確率を見つけるために使用されます。 Naive Bayes Classifier は、異なるラベルを使用してクラスを分類することにより、予測モデリングの問題を解決します。 確率モデルに基づく機械学習アルゴリズムは、このような複雑な課題を解決できます。

たとえば、分類問題には y1、y2、y3…….yn クラス ラベルと x1、x2、x3……xk 個の入力変数があります。 まず、x 入力の場合の異なる y クラス ラベルの条件付き確率を計算する必要があります。 次に、条件付き確率が最も高い機能を最も適切な分類と見なします。

単純ベイズ分類器のさまざまなモデル

これらは、単純ベイズ分類器の 3 つのタイプです。

  • Gaussian Naive Bayes – Gaussian Naive Bayes は、正規分布またはガウス分布を使用して連続データをサポートします。 正規分布定理は、連続データが平均の上または下に均等に分布する確率がある場合にデータを分析します。
  • 多項単純ベイズ –テキスト分類の単語数など、個別の特徴の分類が必要な場合は、多項単純ベイズ分類器を使用します。 ドキュメントの内容を統計的に分析し、クラスに割り当てます。
  • ベルヌーイ ナイーブ ベイズ –ベルヌーイ ナイーブ ベイズは多項式ナイーブ ベイズに似ています。 また、離散データにも使用されます。 ただし、0 と 1 のバイナリ機能のみを受け入れます。そのため、データセット内のバイナリ機能の場合、Bernoulli Naive Bayes を使用する必要があります。

単純ベイズ分類器の長所と短所

Naive Bayes Classifier の最も重要な機能は、連続データと離散データの両方を管理できることです。 大規模なデータセットを使用すると、より正確な結果が得られるため、単純ベイズ分類器の精度はデータ量に応じて向上します。 単純ベイズ分類器の長所と短所を次に示します。

単純ベイズ分類器の利点

  • 高度なスケーラビリティ – Naive Bayes Classifier の最も重要な利点の 1 つは、単純な仮定のため、高度にスケーラブルであることです。
  • トレーニング期間の短縮 – Naive Bayes Classifier をトレーニングするには、少量のトレーニング データが必要です。 そのため、トレーニング期間は他のアルゴリズムに比べて比較的短いです。
  • シンプル – Naive Bayes Classifier のもう 1 つの重要な利点は、構築が簡単なことです。 また、大規模なデータセットの分類にも簡単に使用できます。

単純ベイズ分類器の欠点

  • 実世界での使用における制限 – Naive Bayes Classifier は、クラスのさまざまな機能が互いに独立しているという単純な仮定を行います。 この現象は現実世界ではめったに起こらないため、アルゴリズムの使用目的は限定されます。
  • ゼロ度数の問題 –後でトレーニング データ セットに欠損値が追加された場合、単純ベイズ分類器は度数がないため、その値をゼロとしてマークします。 そのため、異なる値の確率が乗算されると、頻度ベースの確率はゼロになります。これは、アルゴリズムが欠損データにゼロの値を割り当てたため、不正確な結果につながる可能性があるためです。

機械学習と人工知能における単純ベイズ分類器の使用

Naive Bayes アルゴリズムは、クラスのすべての属性が相互に依存していないという前提があるため、機械学習と人工知能に役立ちます。 機械学習と人工知能における単純ベイズ分類器の実用的な使用例を次に示します。

  • 結腸がんの予測 –研究者は、ナイーブ ベイズ分類子モデルを使用して結腸がんを予測することを提案しています。 これは、単純ベイズ分類子の最も注目すべき用途の 1 つです。 これは、ヘモグロビン範囲などの結腸がんデータと、結腸患者の体内の赤血球と白血球数をモデルのトレーニング データとして使用することで可能になります。 このアルゴリズムは、患者のヘモグロビンと血球が同じ範囲内にある場合、結腸がんを予測できます。
  • トラフィック リスク管理 – Naive Bayes Classifier は、トラフィック リスク管理にも使用できます。 Naive Bayes Classifier は、トレーニング データに基づいてドライバーの運転リスクと交通量を予測できます。

人気の機械学習と人工知能のブログ

IoT: 歴史、現在、未来 機械学習のチュートリアル: ML を学ぶ アルゴリズムとは? シンプル&イージー
インドのロボット工学エンジニアの給与:すべての役割 機械学習エンジニアの 1 日: 彼らは何をしているのか? IoT(モノのインターネット)とは
順列と組み合わせ:順列と組み合わせの違い 人工知能と機械学習のトップ 7 トレンド R による機械学習: 知っておくべきすべてのこと

結論

Naive Bayes Classifier は、機械学習と人工知能の分類を簡素化する初心者向けのアルゴリズムです。 Naive Bayes アルゴリズムは、スパム対策、天気予報、ML と Ai を使用した医療診断など、さまざまな実用的なアプリケーションに使用されます。 したがって、機械学習に強い関心があり、この分野でのキャリアを追求したい場合は、単純ベイズ分類器やその他の基本的なアルゴリズムについて知っておく必要があります。 upGradから機械学習と人工知能の理学修士号を取得して、アルゴリズムやその他の ML および AI スキルを詳細に学習できます。 このコースでは、実際の機械学習プロジェクトに取り組む機会も提供されるため、スキルを習得し、履歴書を強化し、AI と ML のいくつかの仕事の機会をつかむことができます。

単純ベイズの定理を回帰に使用できますか?

はい、回帰には Naive Bayes Classifier を使用できます。 以前は、そのアプリケーションは分類タスクに限定されていました。 ただし、段階的な変更により、回帰に使用できるようになりました。つまり、単純ベイズ分類器を生成分類と識別分類の両方に適用できます。

Naive Bayes Classifier はロジスティック回帰より優れていますか?

ロジスティック回帰と Naive Bayes Classifier はどちらも、連続データを使用する線形分類アルゴリズムです。 ただし、クラスに偏りや明確な特徴がある場合、ナイーブ ベイズ分類子は単純な仮定のため、ロジスティック回帰よりも精度が高くなります。

Naive Bayes Classifier はどのような機械学習タスクを実行できますか?

Naive Bayes Classifier は、機械学習における教師あり学習タスクを容易にします。 アルゴリズムは、前に与えられたトレーニング データに従ってデータを分類します。 Naive Bayes アルゴリズムは、以前の入出力または経験に基づいて形成された分類を予測します。