지도 머신 러닝이란 무엇입니까? 알고리즘, 예

게시 됨: 2021-06-22

기계 학습은 정부 기관, 소매 서비스, 금융 기관에서 의료, 엔터테인먼트 및 운송 부문에 이르기까지 모든 곳에 있습니다. Netflix 또는 Amazon이 온라인 추천을 제공하거나 얼굴 감지 기술, 기계 학습 및 인공 지능을 통한 스마트폰 잠금 해제 등 우리의 일상 생활과 복잡하게 연관되어 있습니다.

머신 러닝이 현재 가장 인기 있는 기술 트렌드 중 하나가 되면서 인공 지능을 만드는 핵심 접근 방식 중 하나인 감독 머신 러닝에 대해 알아야 합니다.

목차

지도 머신 러닝이란 무엇입니까?

지도 머신 러닝은 레이블이 지정된 입력 데이터를 사용하여 컴퓨터 알고리즘을 훈련하고 컴퓨터가 예측하지 못한 데이터의 출력을 예측하는 일종의 머신 러닝입니다. 여기에서 "레이블이 지정됨"은 머신 러닝을 돕기 위해 일부 데이터에 이미 정답으로 태그가 지정되어 있음을 의미합니다. 지도 학습에서 컴퓨터에 제공되는 입력 데이터는 감독자나 교사처럼 작동하여 입력 데이터와 출력 레이블 간의 기본 패턴과 상관 관계를 감지하여 정확한 결과를 산출하도록 기계를 훈련시킵니다.

지도 학습 알고리즘의 유형

특정 결과를 달성하기 위한 다양한 유형의 지도 학습 알고리즘이 있습니다. 가장 일반적인 몇 가지 유형을 살펴보겠습니다.

1. 분류

분류 알고리즘은 레이블이 지정된 훈련 데이터를 사용하여 입력을 주어진 수의 클래스 또는 범주로 정렬합니다. 여기서 출력 변수는 '예' 또는 '아니오'와 '참' 또는 '거짓'과 같은 범주입니다. 의료 보고서를 양성(질병) 또는 음성(질병 없음)으로 분류하거나 영화를 다른 장르로 분류하는 것은 분류 알고리즘을 적용할 수 있는 몇 가지 예입니다.

2. 회귀

회귀 모델은 입력 변수와 출력 변수 사이에 수치적 관계가 있을 때 사용됩니다. 지도 학습 영역에 속하는 회귀 알고리즘에는 선형 회귀, 비선형 회귀, 회귀 트리, 다항식 회귀 및 베이지안 선형 회귀가 포함됩니다. 이러한 모델은 주로 시장 동향 추측, 일기 예보 또는 하루 중 특정 시간에 온라인 광고의 클릭률 미리 결정과 같은 연속 변수를 예측하는 데 사용됩니다.

세계 최고의 대학에서 머신 러닝 온라인 과정 (ML 및 AI의 석사, 대학원 과정 및 고급 인증 프로그램)에 참여하여 경력을 빠르게 추적하십시오 .

3. 신경망

신경망 알고리즘은 감각 데이터 해석, 패턴 인식 또는 원시 입력 클러스터링에 사용됩니다. 이 알고리즘에는 몇 가지 장점이 있지만 관찰이 너무 많을 때 신경망을 사용하는 것은 꽤 어려울 수 있습니다. 신경망의 인기 있는 실제 응용 프로그램에는 정보 추출, 텍스트 분류, 음성 및 문자 인식, 다중 문서 요약, 언어 생성 등이 포함됩니다.

4. 나이브 베이지안 모델

Naive Bayes Classifiers는 단일 알고리즘이 아니라 Bayes' Theorem을 기반으로 하는 알고리즘 모음입니다. 이러한 알고리즘의 기본 원칙은 분류된 기능의 모든 쌍이 서로 독립적이라는 것입니다. 클래스 레이블은 여러 자식 노드와 하나의 부모 노드로 구성된 직접 비순환 그래프를 사용하여 할당됩니다. 각 자식 노드는 부모와 분리되고 독립적인 것으로 간주됩니다. Naive Bayesian 알고리즘의 인기 있는 실제 응용 프로그램에는 스팸 필터링 및 감정 분석이 포함됩니다.

5. 의사결정 트리

의사결정 트리는 의사결정과 가능한 결과를 비교하기 위한 조건부 제어문이 포함된 순서도와 같은 모델입니다. 의사 결정 트리는 내부 노드가 속성을 선택하고 질문하는 지점을 나타내고, 리프 노드가 클래스 레이블 또는 실제 출력을 나타내고, 모서리가 질문에 대한 답변을 나타내는 트리와 같은 그래프를 수반합니다.

6. 서포트 벡터 머신

SVM(Support Vector Machine)은 Vap Nick이 제공한 통계적 학습 이론을 기반으로 하며 1990년에 개발되었습니다. 가장 간단한 용어로 지원 벡터 머신은 회귀, 분류 및 이상값 감지에 사용되는 감독 학습 방법 세트입니다. 이들은 커널 네트워크와 밀접하게 연관되어 있으며 패턴 인식, 생물 정보학, 멀티미디어 정보 검색과 같은 다양한 분야에서 응용 프로그램을 찾습니다.

7. 랜덤 포레스트 모델

랜덤 포레스트 모델은 각 개별 트리가 클래스 예측을 제공하는 개별 결정 트리의 앙상블로 구성되며 최대 득표를 가진 클래스가 모델의 예측입니다. 랜덤 포레스트 모델의 개념 이면에 있는 아이디어는 앙상블에서 작동하는 많은 수의 상대적으로 상관되지 않은 트리 또는 모델이 개별 예측보다 더 정확한 예측을 생성한다는 것입니다. 이는 트리가 독립적인 오류로부터 서로를 보호하기 때문입니다.

어떻게 작동합니까?

지도 학습에는 레이블이 지정된 데이터 세트를 사용하여 모델을 훈련하여 각 데이터 유형에 대해 학습할 수 있습니다. 훈련이 완료되면 모델에 출력을 식별하고 예측하기 위한 테스트 데이터가 제공됩니다.

개념을 더 명확히 하기 위해 간단한 예를 살펴보겠습니다.

다양한 종류의 야채로 구성된 상자가 주어졌다고 가정해 보겠습니다. 지도 머신 러닝 접근 방식에서 첫 번째 단계는 다음과 같은 방식으로 모든 다양한 야채를 머신에 익히는 것입니다.

  • 개체가 전구와 자줏빛을 띤 분홍색인 경우 - Onion으로 레이블이 지정됩니다.
  • 물체가 잎이 많고 녹색이면 – 시금치로 레이블이 지정됩니다.

기계를 훈련시킨 후에는 상자에서 별도의 야채(예: 양파)를 주고 식별하도록 요청합니다. 이제 기계는 이전 데이터에서 야채에 대해 이미 학습했으므로 모양과 색상을 기반으로 새 개체를 분류하고 결과를 양파로 확인합니다. 이런 식으로 기계는 훈련 데이터(채소가 들어 있는 상자)에서 학습하거나 훈련하고 새로운 예측하지 못한 데이터(새로운 채소)에 지식을 적용합니다.

위에서 사용한 야채 예제와 마찬가지로 작동 방식을 이해하기 위해 또 다른 지도 학습 예제를 살펴보겠습니다.

삼각형, 정사각형, 오각형과 같은 다양한 모양으로 구성된 데이터 세트가 있다고 가정합니다. 첫 번째 단계는 다음과 같은 방식으로 각 그림에 대한 모델을 훈련시키는 것입니다.

  • 모양에 3개의 면이 있는 경우 - 삼각형으로 레이블이 지정됩니다.
  • 모양에 4개의 동일한 면이 있는 경우 - 정사각형으로 레이블이 지정됩니다.
  • 모양이 5면이면 - Pentagon으로 레이블이 지정됩니다.

훈련이 완료되면 테스트 데이터를 사용하여 모델을 테스트하고 모델의 역할은 훈련 지식을 기반으로 모양을 식별하는 것입니다. 따라서 모델은 새로운 형태를 찾으면 변의 개수에 따라 분류하여 출력합니다.

장점 및 과제

말할 필요도 없이 지도 학습은 기계 학습 모델을 구현하는 데 몇 가지 장점이 있습니다. 일부 이점은 다음과 같습니다.

  • 지도 학습 모델은 이전 경험을 기반으로 출력을 정확하게 예측할 수 있습니다.
  • 지도 학습은 경험을 사용하여 성능을 최적화하는 데 도움이 됩니다.
  • 지도 학습은 객체 클래스에 대한 명확하고 정확한 아이디어를 제공합니다.
  • 마지막으로 지도 학습 알고리즘은 다양한 실제 문제를 해결하고 다양한 분야에서 응용 프로그램을 찾는 데 매우 중요합니다.

의심할 여지 없이 지도 학습 알고리즘은 특히 실시간으로 문제를 해결할 수 있는 잠재력과 관련하여 매우 유용합니다. 그러나 지속 가능하고 효율적인 지도 학습 모델을 구축하는 데는 여러 가지 어려움이 따릅니다. 살펴보겠습니다.

  • 지도 학습 모델을 훈련하는 전체 프로세스는 시간이 많이 소요되는 프로세스입니다.
  • 지도 학습 모델은 정확하게 구성하고 기능하기 위해 특정 수준의 전문 지식과 리소스가 필요한 경우가 많습니다.
  • 비지도 학습 모델과 달리 지도 학습 모델은 자체적으로 데이터를 분류하거나 클러스터링할 수 없습니다.
  • 사람의 실수가 데이터 세트에 들어갈 가능성이 상당히 높기 때문에 알고리즘 교육이 잘못될 수 있습니다.

예제가 있는 모범 사례

지도 머신 러닝을 사용하여 프로젝트를 시작하기 전에 명심해야 할 모범 사례는 무엇입니까? 아래를 살펴보세요.

  • 훈련 데이터 세트로 사용할 데이터의 종류를 명확히 해야 합니다.
  • 표준 측정 또는 인간 전문가로부터 해당 출력을 수집합니다.
  • 학습 알고리즘의 구조를 결정합니다.

마지막으로 지도 머신 러닝의 가장 훌륭하고 인기 있는 실제 사례에 대해 이야기할 가치가 있습니다.

  • 예측 분석 : 예측 분석을 위해 지도 학습 모델을 사용하는 광범위한 사용 사례는 다양한 비즈니스 데이터 포인트에 의미 있고 실행 가능한 통찰력을 제공하는 것입니다. 결과적으로 기업은 결정을 정당화하고 뒷받침하기 위해 주어진 출력 변수를 기반으로 특정 결과를 예측할 수 있습니다.
  • 객체 및 이미지 인식 : 지도 학습 알고리즘은 이미지 분석 및 다양한 컴퓨터 비전 기술에서 자주 요구되는 이미지 및 비디오에서 객체를 찾고 분류하는 데 사용됩니다.
  • 스팸 감지 : 스팸 감지 및 필터링 기술은 감독된 분류 알고리즘을 사용하여 데이터베이스를 훈련하여 스팸 및 비스팸 이메일을 효과적으로 분리하기 위해 새 데이터의 패턴을 인식할 수 있도록 합니다.
  • 감정 분석 : 브랜드 참여 노력을 높이는 가장 좋은 방법은 고객 상호 작용을 이해하는 것입니다. 지도 머신 러닝은 고객의 감정, 의도, 선호도 등과 같은 대규모 데이터 세트에서 중요한 정보를 추출하고 분류함으로써 이와 관련하여 도움이 될 수 있습니다.

upGrad로 머신 러닝 배우기

머신 러닝 및 AI 분야에서 큰 성공을 거두고 싶으십니까? 기계 학습 및 AI 분야에서 upGrad의 Executive PG 프로그램으로 여정을 시작하십시오 . 딥 러닝, 강화 학습, NLP 및 그래픽 모델과 같은 수요가 많은 기술을 배우고자 하는 전문가를 위해 설계된 종합 온라인 인증 과정입니다.

놓칠 수 없는 코스 하이라이트는 다음과 같습니다.

  • IIT 방갈로르의 과정 수료 증명서.
  • 라이브 세션, 코딩 과제, 사례 연구 및 프로젝트로 가득 찬 450시간 이상의 학습.
  • 20가지 도구, 프로그래밍 언어 및 라이브러리에 대한 포괄적인 범위.
  • 라이브 코딩 수업 및 프로필 구축 워크샵.

결론

Technavio의 최종 사용자 및 지역별 기계 학습 시장 – 예측 및 분석 2020-2024 라는 최신 시장 조사 보고서에 따르면 2020-2024년 예측 기간 동안 전 세계 기계 학습 시장 규모가 111억 6000만 달러의 성장을 목격할 것으로 예측합니다. 또한 매년 꾸준한 성장이 시장의 성장 동력이 될 것입니다.

현재 추세와 미래 예측은 모두 기계 학습이 여기에 있음을 나타냅니다. 지도 학습 알고리즘은 주로 분류 및 회귀 문제와 관련된 모든 기계 학습 프로젝트의 기본입니다. 어려움에도 불구하고 지도 학습 알고리즘은 경험을 기반으로 결과를 예측하는 데 가장 유용합니다.

AI 주도 기술 혁명 주도

기계 학습 및 AI 과학 석사 지원