지도 학습과 비지도 학습의 차이점 - 2020 - 다른 사람

게시 됨: 2022-09-26

목차

소개

머신 러닝, 인공 지능 및 데이터 분석과 같은 기술은 복잡한 작업을 자동화하기 위해 데이터를 기반으로 합니다. 데이터 사용은 경쟁자보다 앞서고, 더 나은 고객 서비스를 제공하고, 효과적인 비즈니스 전략을 구축하기 위한 처리 및 해석에 국한되지 않고 모델을 교육, 테스트 및 평가하는 데에도 사용됩니다. 머신 러닝에서 데이터는 훈련 데이터, 검증 데이터, 테스트 데이터의 세 가지 범주로 분류됩니다. 이름에서 알 수 있듯이 학습 데이터는 기계 학습에서 모델 또는 알고리즘을 학습시킵니다. 이 모델은 입력 및 출력 교육 데이터 세트에서 학습하고 분류를 예측하거나 특정 작업을 수행합니다. 우리는 알고리즘의 지도 학습과 비지도 학습 모두에 훈련 데이터를 사용합니다.

미국의 AI 및 ML 프로그램

LJMU 및 IIITB의 기계 학습 및 AI 과학 석사 IIITB의 기계 학습 및 인공 지능 분야 이그 제 큐 티브 PG 프로그램
모든 과정을 살펴보려면 아래 페이지를 방문하십시오.
기계 학습 과정

이 블로그에서는 지도 학습과 비지도 학습이라는 두 가지 광범위한 머신 러닝 범주와 그 차이점에 대해 자세히 설명합니다.

세계 최고의 대학에서 기계 학습 인증을 받으십시오. 석사, 이그 제 큐 티브 PGP 또는 고급 인증 프로그램을 획득하여 경력을 빠르게 추적하십시오.

지도 학습이란 무엇입니까?

기계 학습과 인공 지능의 하위 집합인 지도 학습은 레이블이 지정된 데이터를 사용하여 알고리즘을 훈련하는 알고리즘 교육 기술입니다. 데이터 세트에서 분류 및 회귀와 같은 작업을 수행하는 방법을 알고리즘에 가르칩니다. 지도 학습에서 알고리즘은 입력-출력 훈련 샘플을 수신하고 이 샘플을 사용하여 데이터 세트 간의 관계를 설정합니다. 감독하에 작업을 수행하기 위해 레이블이 지정된 훈련 데이터를 알고리즘에 제공하므로 감독 학습이라고 합니다. 지도 학습의 주요 목표는 입력과 출력 간의 관계를 이해하기 위해 알고리즘에 데이터를 공급하는 것입니다. 알고리즘이 입력과 출력 사이의 연결을 설정하면 새로운 입력에서 새로운 결과를 정확하게 전달할 수 있습니다.

지도 학습이 어떻게 작동하는지 이해합시다. 기계 학습 알고리즘에서 입력 X와 출력 Y가 있다고 가정합니다. 모델의 학습 시스템에 입력 X를 제공하거나 제공합니다. 이 학습 시스템은 출력 Y'를 제공합니다. 시스템의 중재자는 Y와 Y'의 차이를 확인하고 오류 신호를 생성합니다. 이 신호는 Y와 Y'의 차이를 이해하고 Y와 Y'의 차이를 줄이기 위해 매개변수를 조정하는 학습 시스템으로 전달됩니다. 여기서 Y는 레이블이 지정된 데이터입니다.

지도 학습 프로세스에는 여러 단계가 포함됩니다.

  • 처음에는 훈련 데이터 세트 유형을 결정한 다음 레이블이 지정된 훈련 데이터를 수집해야 합니다. 또한 분류 또는 회귀를 위해 데이터를 다르게 정렬해야 합니다.
  • 다음 단계는 지원 벡터 머신이나 의사 결정 트리와 같은 지도 학습을 위한 알고리즘을 사용한 다음 학습 모델에 대한 입력 기능을 결정하는 것입니다.
  • 이제 학습 프로세스를 실행하고 매개변수를 조정하거나 제어합니다.
  • 마지막 단계는 모델의 정확도를 테스트하는 것입니다.

전체 지도 학습 프로세스는 매개변수를 조정하도록 학습 시스템을 훈련하므로 알고리즘은 최소 출력 차이를 제공합니다. 지도 학습은 데이터 마이닝에서 분류 및 회귀라는 두 가지 복잡한 프로세스를 용이하게 합니다. 분류에서 데이터는 스팸 필터와 같은 유사한 속성을 기반으로 다른 클래스로 분류되거나 레이블이 지정됩니다. 우리는 회귀를 사용하여 주식 시장이나 심박수와 같은 지속적인 관찰을 예측합니다. 회귀는 실수 값을 제공합니다.

다음은 지도 학습 알고리즘의 다양한 유형입니다.

  • 나이브 베이즈: 나이브 베이즈 분류기는 베이즈 정리를 기반으로 합니다. 이 알고리즘은 클래스의 모든 기능이 서로 독립적이라고 가정합니다. 나이브 베이즈 분류기는 조건부 확률 방법을 사용하여 분류를 예측합니다.
  • Support Vector Machine:- 분류 및 회귀 작업에 널리 사용되는 기계 학습 알고리즘입니다.
  • 선형 회귀: 선형 회귀 알고리즘은 지도 학습을 사용하여 미래 결과를 예측합니다. 하나의 종속 변수와 둘 이상의 독립 변수 사이의 관계를 설정합니다.
  • 로지스틱 회귀: 예 또는 아니오, 참 또는 거짓과 같은 다양한 범주의 변수가 있을 때 로지스틱 회귀 알고리즘을 사용합니다. 우리는 주로 로지스틱 회귀 알고리즘을 사용하여 이진 분류 문제를 해결합니다.

요약하자면 지도 학습은 알려진 입력 및 출력 데이터를 사용하여 모델을 훈련하여 새로운 입력 세트에 대한 예측을 생성하는 데 사용됩니다.

비지도 학습이란 무엇입니까?

지도 학습과 달리 비지도 학습에는 레이블이 지정된 데이터가 없습니다. 데이터 세트 또는 예측된 결과 간에 사전 정의된 관계가 없습니다. 지도 학습과 달리 비지도 학습은 최소한의 인간 개입이 필요합니다. 따라서 우리는 그것을 비지도 학습이라고 부릅니다. 모델은 데이터 세트 관찰의 컬렉션을 사용하고 주어진 데이터의 속성을 설명합니다. 비지도 학습은 데이터 세트의 다양한 그룹을 식별하기 때문에 클러스터링 프레임워크를 기반으로 합니다.

비지도 학습이 어떻게 작동하는지 이해합시다. X1, X2, X3…….Xt라는 이름의 일련의 입력이 있지만 목표 출력이 없다고 가정합니다. 이 경우 기계는 환경에서 피드백을 받지 않습니다. 그러나 공식적인 프레임워크를 개발하고 미래의 결과를 예측합니다. 비지도 학습에서 모델은 의사 결정 및 건물 표현을 위한 입력을 사용합니다. 출력 데이터가 없기 때문에 분류 및 회귀 프로세스에 비지도 학습을 사용할 수 없습니다. 비지도 학습의 주요 용도는 입력 데이터 세트의 기본 구조를 파악하는 것입니다. 기계는 구조를 찾은 후 해석에 따라 여러 그룹으로 데이터를 정렬합니다. 마지막 단계는 데이터세트를 압축된 형식으로 표현하는 것입니다.

엔지니어는 주로 탐색적 분석과 차원 축소라는 두 가지 목적으로 비지도 학습을 사용합니다. 탐색적 분석은 데이터에 대한 초기 조사를 수행하여 데이터를 서로 다른 그룹으로 배열하고 가설을 세우고 패턴을 발견합니다. 차원 축소 프로세스는 주어진 데이터 세트의 입력 수를 줄입니다. 비지도 학습의 가장 중요한 이점은 관련 통찰력을 찾는 것입니다. 비지도 학습은 최소한의 인간 개입이 필요하기 때문에 주로 AI 애플리케이션을 구축하는 데 사용됩니다.

지도 학습 vs. 비지도 학습

지도 학습과 비지도 학습이 무엇인지 알았으니 이제 가장 중요한 차이점을 살펴보겠습니다.

  • 데이터 – 지도 학습은 레이블이 지정된 데이터를 사용하는 반면 비지도 학습은 레이블이 지정된 데이터를 사용하지 않습니다. 또한 지도 학습에서 모델에 출력 데이터를 제공합니다. 그러나 비지도 학습에서는 입력 데이터를 사용할 수 없습니다.
  • 피드백 - 모델은 피드백을 받고 지도 학습에서 매개변수를 조정합니다. 비지도 학습에서는 발생하지 않습니다.
  • 목표 – 지도 학습의 주요 목표는 교육 데이터를 사용하여 모델을 교육하는 것입니다. 따라서 새로운 입력을 사용할 수 있을 때 기계는 정확한 출력을 예측할 수 있습니다. 그러나 비지도 학습에서는 출력을 사용할 수 없으므로 주어진 데이터에서 관련 통찰력이나 숨겨진 패턴을 수집하는 데 사용됩니다.
  • 분류 및 회귀 – 지도 학습을 비지도 학습에서는 발생하지 않는 분류 및 회귀로 분류할 수 있습니다.
  • 인공 지능 – 지도 학습은 학습 데이터를 모델에 제공해야 하기 때문에 인공 지능과 관련이 없습니다. 그러나 비지도 학습은 최소한의 인간 개입이 필요하기 때문에 인공 지능에 더 유리합니다.
  • 알고리즘 – 지도 학습 알고리즘에는 Support Vector Machine, Naive Bayes, 선형 회귀 및 로지스틱 회귀가 포함됩니다. 비지도 학습 알고리즘에는 클러스터링 및 KNN(K-Nearest Neighbor)이 포함됩니다.
  • 결과의 정확성 – 지도 학습에서 모델이 미리 결정된 출력을 얻으면 더 정확한 결과를 제공합니다. 그러나 비지도 학습의 결과는 주관적이며 덜 정확한 결과를 제공합니다.

인기 있는 기계 학습 및 인공 지능 블로그

IoT: 역사, 현재 및 미래 기계 학습 자습서: ML 배우기 알고리즘이란 무엇입니까? 간단하고 쉬운
인도 로봇 공학 엔지니어 급여 : 모든 역할 기계 학습 엔지니어의 하루: 그들은 무엇을 하나요? 사물인터넷(IoT)이란
순열 대 조합: 순열과 조합의 차이점 인공 지능 및 기계 학습의 상위 7가지 트렌드 R을 사용한 기계 학습: 알아야 할 모든 것

결론

지도 학습과 비지도 학습은 머신 러닝의 기본 개념으로 복잡한 개념을 학습할 수 있는 기반을 마련합니다. 머신 러닝에 관심이 많고 그 안에서 경력 을 쌓고 싶다면 upGrad 에서 머신 러닝 및 AI 분야 석사 과정을 밟을 수 있습니다.

업계 리더는 이 과정을 통해 머신 러닝에 대한 심층적인 이론 지식과 머신 러닝 기술에 대한 실용적인 통찰력을 얻을 수 있습니다. 또한 관련 기술을 습득하는 데 도움이 되는 머신 러닝에 대한 여러 사례 연구 및 프로젝트에 참여할 기회를 얻습니다.

언제 비지도 학습을 사용할 수 있습니까?

정의된 입력 및 출력으로 훈련 데이터 세트를 수집하는 것은 어렵습니다. 이러한 경우에는 비지도 학습을 사용하는 것이 좋습니다. 비지도 학습에서 모델은 출력 데이터가 제공되지 않거나 레이블이 제공되지 않은 경우 입력 데이터에서 추론을 도출합니다. 따라서 입력은 있지만 정의된 출력이 없는 경우 비지도 학습을 사용할 수 있습니다. 비지도 학습의 가장 좋은 용도 중 하나는 인공 지능 응용 프로그램을 개발하는 것입니다.

지도 학습은 언제 사용해야 합니까?

지도 학습 알고리즘은 명확한 입력 및 출력 데이터 세트가 있을 때 사용됩니다. 매개변수를 조정하여 기계 학습 모델의 성능 기준을 최적화할 수 있습니다. 지도 학습은 실제 계산 문제를 해결하고 음성 및 텍스트 인식, 예측 분석 및 스팸 감지를 위한 애플리케이션을 구축하는 데 도움이 됩니다.

지도 학습에서 레이블이 지정된 데이터는 무엇입니까?

레이블이 지정된 데이터는 특정 속성 또는 특성을 기반으로 표시되거나 분류된 데이터 세트를 의미합니다. 지도 학습에서 학습 모델을 훈련하기 위한 벤치마크로 사용하는 훈련 데이터를 레이블이 지정된 데이터라고 합니다.