共分散と相関:[知っておくべきことすべて]
公開: 2021-11-05機械学習や人工知能などのテクノロジーを利用してデータを解釈する際には、多くの順列と組み合わせが必要です。 さまざまな状況でさまざまな結果を予測するのに役立ちます。 これらの順列と組み合わせは、変数の助けを借りて広く行われます。
変数は、データセットで測定できるアイテム、数量、または数値です。 このアイテムまたは数量は固定されておらず、内部または外部の要因によってさまざまな状況で変化する可能性があります。 要素の正確な値が不明な場合は常に、それを変数と呼びます。 したがって、変数は未知の量のプレースホルダーと呼ばれることがよくあります。 変数は、コンピュータープログラムのコマンドまたはコンピューターおよびプログラミング言語での入力に依存する変更可能な値として定義されます。
たとえば、顧客の購入を含むeコマースデータセットでは、顧客の好みや将来特定の製品を注文する可能性は変数です。 それは、顧客のニーズ、収入、年齢、およびその他の要因によって異なります。 変数がどのように機能し、2つの変数間の関係がどのように決定されるかについて詳しく学びましょう。
目次
共分散とは何ですか?
共分散は、2つの変数間の関係または相互依存性を測定します。 他の変数が同じデータセットを変更した場合に、変数がどの方向に移動するかを決定します。
共分散には、正と負の2つのタイプがあります。 1つの変数が変更され、2番目の変数が同じ方向に移動する場合、それは正の共分散と呼ばれます。 2番目の変数が反対方向に移動する場合、それは負の共分散と呼ばれます。
共分散の値が高いほど、2つの変数の依存関係を示します。 正の共分散は、変数が直接比例し、同じ方向に移動することを意味します。 負の共分散値は、2つの確率変数が間接的に関連しており、反対方向に移動することを示しています。 これは、ある変数の量が増えると、別の変数の量が減ることを意味します。
相関とは何ですか?
特定の状況またはデータセットには、複数の変数が存在する可能性があります。 これらの変数は、互いに完全に関連している場合と関連していない場合があります。 良好な結果を把握しながら精度を維持するには、2つの変数間の関係を導き出すことが重要です。 これは相関と呼ばれ、2つの変数間の関係を示す統計的尺度です。
相関関係は、2つの変数間の線形関係を説明し、一方の変数が変化したときの一方の変数の動きを示します。
2つの変数XとYがあり、Xに変化がある場合、相関はXの変化によるYの変化を測定します。YがXの変化に伴って正の変化を示すか負の変化を示すかを計算します。 。
共分散と同様に、相関には正、負、ゼロの3つのタイプがあります。 正の相関では、一方の変数がグラフ上で上がると、もう一方の変数も上がります。 負の相関では、一方の変数が上がると、もう一方の変数は下がります。 正と負の相関では、変数は比例的または線形に上下します。 相関がゼロの場合、変数は無関係であり、線形グラフはありません。
相関は、ピアソン係数を使用して測定されます。 相関係数の値は-1から1の範囲です。
共分散と相関の違いは何ですか?
共分散と相関という用語は、しばしば同じ意味で使用されます。 ただし、それらは同じではありません。 両者の違いを理解するのは難しい。 共分散と相関について詳しく理解しましょう。
1.測定内容
共分散と相関は非常に似ており、混乱を招きます。 どちらも変数の測定値です。 ただし、この2つの顕著な違いは、共分散が変数間の変化を測定することです。 これは、2つの変数が互いにどのように関連しているか、およびそれらが同じ方向に移動するか反対方向に移動するかを示します。 共分散は、変数がどのように変化するかを定義しません。 変数が相互に関連しているかどうかを確認するだけです。
一方、変数の変化の程度または程度は、相関関係の助けを借りて決定されます。 これは共分散の関数です。
2.値
相関の値の範囲は-1から1です。一方、共分散の値は任意の数にすることができます。 その値は、負の累乗と正の無限大の累乗の間にあります。 相関は標準化された値ですが、共分散の重要性は明確ではありません。 共分散係数がわかれば、相関の値を導き出すことができます。
3.スケールの変更
これは、変数に定数値を掛けたときの出力の変化を意味します。 スケールのシフトは、相関の値に影響を与えません。 変数に定数を掛けても、相関は同じままです。 ただし、これは共分散の場合ではありません。 スケールの変更の影響を受けます。 変数が定数に乗算されると、それに応じて共分散が変化します。
機械学習での共分散と相関の使用とは何ですか?
機械学習にはさまざまな変数があります–ターゲット、独立、中程度、交絡、および制御変数。 これらの変数はさまざまな機能を実行し、MLアルゴリズムと手法で重要な役割を果たします。 変数の主な仕事は、アルゴリズムに欠落している値を追加することです。 データは常に構造化された形式で利用できるとは限らないため、要素が欠落している可能性があります。 アルゴリズムは、不完全な情報では機能できません。 したがって、ソフトウェアエンジニアまたは開発者は、機械学習で変数を使用して不足している値を埋めます。
機械学習におけるキャリアの機会は何ですか?
機械学習とAIテクノロジーの重要なコンポーネントの1つは、変数の依存関係または2つの確率変数間の関係です。 MLおよびAIアルゴリズムは、2つの変数間の関係を特定することで結果を提供します。 したがって、機械学習でキャリアを築きたい場合は、共分散と相関の概念を知っている必要があります。
機械学習とAIについて詳しく知るには、 upGradによる機械学習とAIの科学のマスタープログラムに登録してください。
これは、エンジニア、IT、データの専門家向けのオンラインコースで、機械学習とAIのノウハウを習得するのに役立ちます。 このプログラムはまた、リバプールジョンムーア大学とバンガロアの国際情報技術研究所の卒業生のステータスを学習者に提供します。
このコースでは、FlipkartおよびZee5の業界専門家とつながることができます。 また、ディープラーニングや予測分析、統計などの関連スキルを習得するために、多くの業界プロジェクトを実行する機会も得られます。
機械学習とAIでの2つの最高のキャリアの機会は次のとおりです。
1.データサイエンティスト
2012年、ハーバードビジネスレビューは、データサイエンティストの必要性が非常に高まっているため、データサイエンティストは21世紀で最もセクシーな仕事であると述べました。 今日でも、多くの分野でデータサイエンティストが不足しています。 データに興味をそそられる場合は、理想的な高給の仕事があなたを待っています。 インドのデータサイエンティストの平均給与は、年間約7万ルピーです。 数年の専門知識を持つデータ専門家は、年間最大17万ルピーを稼ぐことができます。
2.AIアーキテクト
業界で話題を呼んでいるもう1つの仕事は、AIアーキテクトです。 アーキテクトがクライアントにソリューションを提供するように、AIアーキテクトもクライアントにAIソリューションを提供します。 彼らはクライアントの要件を理解し、適切なテクノロジーを提案します。 AIアーキテクトの平均給与は年間6万ルピーです。
世界のトップ大学からデータサイエンスのオンラインコースを学びましょう。 エグゼクティブPGプログラム、高度な証明書プログラム、または修士プログラムを取得して、キャリアを早急に進めましょう。
結論
変数は、機械学習と人工知能のデータ分析と意思決定において重要な役割を果たします。 相関と共分散は、2つの変数の間に関係が存在するかどうかを判断するのに役立ちます。 その後、企業は望ましい結果を予測し、それに応じて意思決定を行うことができます。 これは、機械学習の最も複雑でありながら重要な概念の1つです。 機械学習とAIに関する専門知識を習得するために、MLとAIに関するupGradのプログラムを追求することができます。
共分散と相関は同じものですか?
いいえ、共分散と相関は同じ概念ではありませんが、密接に関連しています。 共分散は2つの確率変数間の線形関係を決定し、相関は2つの変数間の関係の程度を測定します。
共分散と相関は機械学習に関連していますか?
はい。MLアルゴリズムは変数間の関係を解釈し、それに応じて出力を提供するため、機械学習では共分散と相関が不可欠です。 したがって、共分散と相関について学ぶ必要があります。
機械学習とAIでのキャリアにはどのようなスキルが必要ですか?
MLまたはAI業界で仕事を確保するには、データ分析、確率と統計、コンピュータープログラミング、ソフトウェア開発、線形回帰、信号処理、自然言語処理などに精通している必要があります。