공분산 대 상관: [당신이 알아야 할 모든 것]

게시 됨: 2021-11-05

머신러닝, 인공지능 등의 기술을 활용해 데이터를 해석하려면 많은 순열과 조합이 필요하다. 다양한 상황에서 다양한 결과를 예측하는 데 도움이 됩니다. 이러한 순열 및 조합은 변수의 도움으로 광범위하게 수행됩니다.

변수는 데이터 세트에서 측정할 수 있는 항목, 수량 또는 숫자입니다. 이 품목이나 수량은 고정되어 있지 않으며 내부 또는 외부 요인에 따라 상황에 따라 변경될 수 있습니다. 요소의 정확한 값을 알 수 없을 때마다 이를 변수라고 합니다. 따라서 변수는 종종 알 수 없는 수량의 자리 표시자라고 합니다. 변수는 컴퓨터 프로그램의 명령이나 컴퓨터 및 프로그래밍 언어의 입력에 따라 달라지는 변경 가능한 값으로 정의됩니다.

예를 들어, 고객 구매로 구성된 전자 상거래 데이터 세트에서 고객 선호도 또는 미래에 특정 제품을 주문할 가능성은 변수입니다. 고객의 요구 사항, 소득, 연령 및 기타 요인에 따라 다릅니다. 변수의 기능과 두 변수 간의 관계가 결정되는 방식에 대해 자세히 알아보겠습니다.

목차

공분산이란 무엇입니까?

공분산은 두 변수 간의 관계 또는 상호 종속성을 측정합니다. 다른 변수가 동일한 데이터 세트를 변경하는 경우 변수가 이동하는 방향을 결정합니다.

공분산에는 양수와 음수 두 가지 유형이 있습니다. 한 변수가 변경되고 두 번째 변수가 같은 방향으로 이동할 때 이를 양의 공분산이라고 합니다. 두 번째 변수가 반대 방향으로 이동하면 음의 공분산이라고 합니다.

공분산 값이 높을수록 두 변수의 종속성을 나타냅니다. 양의 공분산은 변수가 정비례하고 같은 방향으로 이동할 것임을 의미합니다. 음의 공분산 값은 두 확률 변수가 간접적으로 관련되어 있고 반대 방향으로 움직인다는 것을 알려줍니다. 한 변수의 양이 증가하면 다른 변수의 양이 감소한다는 의미입니다.

상관관계란 무엇입니까?

주어진 상황이나 데이터 세트에는 둘 이상의 변수가 있을 수 있습니다. 이러한 변수는 서로 완전히 관련되거나 관련이 없을 수 있습니다. 정확도를 유지하면서 유리한 결과를 도출하기 위해서는 두 변수 간의 관계를 도출하는 것이 중요합니다. 이것은 두 변수 간의 관계를 나타내는 통계적 척도인 상관관계로 알려져 있습니다.

상관 관계는 두 변수 간의 선형 관계를 설명하고 다른 변수가 변경될 때 한 변수의 움직임을 보여줍니다.

두 개의 변수 X와 Y가 있고 X에 변화가 있는 경우 상관 관계는 X의 변화로 인한 Y의 변화를 측정합니다. X의 변화에 ​​따라 Y가 양의 변화를 나타낼지 음의 변화를 나타낼지 계산합니다. .

공분산과 마찬가지로 양수, 음수 및 0의 세 가지 유형의 상관 관계가 있습니다. 양의 상관관계에서는 그래프에서 한 변수가 올라가면 다른 변수도 올라갑니다. 음의 상관관계에서는 한 변수가 올라가면 다른 변수는 내려갑니다. 양의 상관관계와 음의 상관관계에서 변수는 비례적으로 또는 선형적으로 위아래로 움직입니다. 상관 관계가 0이면 변수는 관련이 없고 선형 그래프가 없습니다.

상관 관계는 피어슨 계수의 도움으로 측정됩니다. 상관 계수 값의 범위는 -1에서 1 사이입니다.

공분산과 상관 관계의 차이점은 무엇입니까?

공분산과 상관이라는 용어는 종종 같은 의미로 사용됩니다. 그러나 그것들은 동일하지 않습니다. 사람들이 이 둘의 차이점을 파악하는 것은 어렵습니다. 공분산 대 상관에 대해 자세히 알아보자.

1. 측정 대상

공분산과 상관은 매우 유사하고 혼란스럽습니다. 둘 다 변수의 측정입니다. 그러나 둘 사이의 현저한 차이점은 공분산이 변수 간의 변화를 측정한다는 것입니다. 두 변수가 서로 어떻게 관련되어 있는지, 같은 방향으로 움직이는지 반대 방향으로 움직이는지 알려줍니다. 공분산은 변수가 변경되는 방식을 정의하지 않습니다. 변수가 서로 관련이 있는지 여부만 확인합니다.

반면에 변수의 변화 정도나 정도는 상관관계를 통해 결정된다. 공분산의 함수입니다.

2. 가치

상관 값의 범위는 -1에서 1 사이입니다. 반면에 공분산 값은 임의의 숫자일 수 있습니다. 그 값은 무한대의 음의 힘과 양의 힘 사이에 있습니다. 상관 관계는 표준화된 값을 갖지만 공분산의 중요성은 명확하지 않습니다. 공분산 계수를 알면 상관 값을 도출할 수 있습니다.

3. 규모 변경

변수에 일정한 값을 곱했을 때의 출력 변화를 의미합니다. 척도의 이동은 상관 값에 영향을 미치지 않습니다. 변수에 상수를 곱하더라도 상관 관계는 동일하게 유지됩니다. 그러나 공분산의 경우에는 그렇지 않습니다. 스케일 변경의 영향을 받습니다. 변수에 상수를 곱하면 그에 따라 공분산이 변경됩니다.

기계 학습에서 공분산 및 상관 관계의 사용은 무엇입니까?

머신 러닝에는 목표 변수, 독립 변수, 보통 변수, 교란 변수, 제어 변수 등 다양한 변수가 있습니다. 이러한 변수는 다양한 기능을 수행하며 ML 알고리즘 및 기술에서 중요한 역할을 합니다. 변수의 주요 작업은 알고리즘에 누락된 값을 추가하는 것입니다. 데이터가 항상 구조화된 형식으로 제공되는 것은 아니므로 누락된 요소가 있을 수 있습니다. 알고리즘은 불완전한 정보로 작동할 수 없습니다. 따라서 소프트웨어 엔지니어나 개발자는 기계 학습에서 변수를 사용하여 누락된 값을 채웁니다.

기계 학습의 직업 기회는 무엇입니까?

머신 러닝과 AI 기술의 중요한 구성 요소 중 하나는 변수의 종속성 또는 두 랜덤 변수 간의 관계입니다. ML 및 AI 알고리즘은 두 변수 간의 관계를 식별하여 결과를 제공합니다. 따라서 머신 러닝 분야에서 경력을 쌓고 싶다면 공분산 및 상관 관계 개념을 알아야 합니다.

기계 학습 및 AI에 대해 자세히 알아보려면 upGrad 의 기계 학습 및 AI 과학 석사 프로그램 에 등록하세요.

엔지니어, IT, 데이터 전문가를 대상으로 머신러닝과 AI 노하우를 습득할 수 있는 온라인 과정입니다. 이 프로그램은 또한 학습자들에게 리버풀 존 무어스 대학교(Liverpool John Moores University)와 방갈로르에 있는 국제 정보 기술 연구소(International Institute of Information Technology)의 동문 자격을 제공합니다.

이 과정을 통해 Flipkart 및 Zee5의 업계 전문가와 연결할 수 있습니다. 또한 많은 산업 프로젝트를 수행하여 딥 러닝 및 예측 분석, 통계와 같은 관련 기술을 습득할 수 있는 기회를 얻습니다.

머신 러닝과 AI 분야에서 가장 좋은 두 가지 직업 기회는 다음과 같습니다.

1. 데이터 과학자

2012년 하버드 비즈니스 리뷰(Harvard Business Review )는 데이터 과학자에 대한 수요가 엄청나게 증가함에 따라 데이터 과학자가 21세기의 가장 섹시한 직업이라고 말했습니다. 오늘날에도 많은 분야에서 데이터 과학자가 부족합니다. 흥미로운 데이터를 찾으면 이상적인 고임금 직업이 기다리고 있는 것입니다. 인도 데이터 과학자 평균 연봉 은 거의 700만 루피입니다. 수년간의 전문 지식을 갖춘 데이터 전문가는 연간 최대 1700만 루피를 벌 수 있습니다.

2. AI 아키텍트

업계에서 화제를 모으고 있는 또 다른 직업은 AI 아키텍트다. 건축가가 클라이언트에게 솔루션을 제공하는 것처럼 AI 건축가도 클라이언트에게 AI 솔루션을 제공합니다. 그들은 고객의 요구 사항을 이해하고 올바른 기술을 제안합니다. AI 아키텍트 평균 연봉 은 600만 루피입니다.

세계 최고의 대학에서 데이터 과학 온라인 과정배우십시오 . 이그 제 큐 티브 PG 프로그램, 고급 인증 프로그램 또는 석사 프로그램을 획득하여 경력을 빠르게 추적하십시오.

결론

변수는 기계 학습 및 인공 지능에서 데이터 분석 및 의사 결정에 중요한 역할을 합니다. 상관 및 공분산은 두 변수 사이에 관계가 존재하는지 여부를 결정하는 데 도움이 됩니다. 기업은 원하는 결과를 예측하고 그에 따라 결정을 내릴 수 있습니다. 머신 러닝의 가장 복잡하면서도 중요한 개념 중 하나입니다. 머신 러닝 및 AI에 대한 전문 지식을 얻으려면 ML 및 AI에 대한 upGrad의 프로그램을 이수할 수 있습니다.

공분산과 상관은 같은 것입니까?

아니요, 공분산과 상관은 밀접하게 관련되어 있지만 동일한 개념이 아닙니다. 공분산은 두 확률 변수 간의 선형 관계를 결정하고 상관 관계는 두 변수 간의 관계 정도를 측정합니다.

공분산과 상관 관계가 기계 학습과 관련이 있습니까?

예, ML 알고리즘이 변수 간의 관계를 해석하고 그에 따라 출력을 제공하기 때문에 공분산 및 상관 관계는 기계 학습에 필수적입니다. 따라서 공분산과 상관에 대해 배워야 합니다.

기계 학습 및 AI 분야에서 경력을 쌓기 위해 필요한 기술은 무엇입니까?

ML 또는 AI 산업에서 취업하려면 데이터 분석, 확률 및 통계, 컴퓨터 프로그래밍, 소프트웨어 개발, 선형 회귀, 신호 처리, 자연어 처리 등에 능숙해야 합니다.