알아야 할 다양한 유형의 기계 학습
게시 됨: 2022-12-27목차
소개
기계 학습(ML)은 프로그래머에게 가장 인기 있는 기술 중 하나입니다. 2019 년 인디드가 발표한 보고서에 따르면 기계 학습 엔지니어링은 미국에서 가장 수요가 많은 AI 직업이었습니다. 기계 학습 기술을 널리 사용하는 일부 분야는 금융, 은행, 의료, 투자, 마케팅, 제조, 사이버 보안 및 운송입니다. 이 블로그는 기계 학습의 개념과 다양한 유형을 이해하는 데 도움이 됩니다.
기계 학습이란 무엇입니까?
기계 학습은 데이터를 사용하여 정확한 결과를 예측하고 장치의 성능을 향상시키는 최신 기술입니다. 간단히 말해서 머신 러닝 기술을 통해 컴퓨터는 명시적으로 프로그래밍하지 않고도 과거 데이터를 사용하고 유사한 상황에서 결과를 예측할 수 있습니다. 이 기술은 인간의 뇌와 유사하게 작동합니다. 알고리즘은 제공된 데이터를 관찰하고 분석하며 데이터 패턴을 기록합니다. 알고리즘은 새로운 데이터 세트가 제공될 때 이전 패턴을 기반으로 결과를 예측합니다. 이 개념은 기계가 정보에서 학습하고 결과를 제공하기 때문에 기계 학습이라고 합니다.
세계 최고의 대학에서 기계 학습 인증을 받으십시오. 석사, 고급 PGP 또는 고급 인증 프로그램을 획득하여 경력을 빠르게 쌓으십시오.
다양한 유형의 기계 학습
장치에 제공되는 훈련 데이터의 유형과 알고리즘에서 데이터를 활용하는 방법에 따라 14가지 유형의 기계 학습 기술이 있습니다. 기계 학습의 다양한 유형에 대해 논의해 보겠습니다.
1. 감독 학습
지도 학습은 분류를 위해 레이블이 지정된 데이터를 사용 하는 가장 인기 있는 기계 학습 유형입니다 . 지도 학습에서 알고리즘을 가르치기 위해 입력과 출력이 다른 훈련 데이터 세트를 사용합니다. 그런 다음 알고리즘은 이미 제공된 입력 및 출력 데이터를 기반으로 유리한 결과를 예측합니다.
우리는 감독 학습에서 세 가지 목적으로 데이터를 사용합니다. 교육, 검증 및 테스트. 먼저 레이블이 지정된 데이터를 수집하여 ML 알고리즘을 교육합니다. 두 번째 단계에서는 다양한 데이터 세트를 사용하여 알고리즘의 올바른 성능을 검증합니다. 마지막으로 알고리즘은 실제 세계에서 테스트됩니다.
2. 비지도 학습
지도 학습과 달리 비지도 학습에서는 태그가 없거나 레이블이 지정되지 않은 데이터를 사용합니다. 이러한 유형의 기계 학습 알고리즘에서는 입력 및 출력 데이터 세트를 제공하여 알고리즘을 감독할 필요가 없습니다. 알고리즘 자체가 데이터 세트에서 숨겨진 패턴을 발견합니다.
비지도 학습 기술에는 네 가지 유형이 있습니다. 클러스터링, 이상 감지, 연관 마이닝 및 잠재 변수 모델. 클러스터링에서 알고리즘은 몇 가지 유사한 속성을 기반으로 데이터 세트를 다른 그룹으로 분할합니다. 이상 탐지를 사용하여 데이터 세트에서 비정상적인 활동을 찾습니다. 연관 마이닝 기법은 자주 발생하는 데이터 항목을 함께 그룹화합니다.
미국의 AI 및 ML 프로그램
LJMU 및 IIITB의 기계 학습 및 AI 과학 석사 | IIITB의 기계 학습 및 인공 지능 부문 임원 PG 프로그램 |
모든 과정을 살펴보려면 아래 페이지를 방문하십시오. | |
기계 학습 과정 |
3. 준지도 학습
준지도 학습은 지도 및 비지도 머신 러닝 기술을 혼합한 것입니다. 레이블이 지정된 데이터와 레이블이 지정되지 않은 데이터를 모두 사용하여 알고리즘을 훈련합니다. 레이블이 있는 데이터는 소량 사용되며 레이블이 지정되지 않은 데이터는 대량으로 사용됩니다. 반지도 학습 기법은 지도 학습이나 비지도 학습만으로 수행하기 어려운 집중적인 작업을 수행하는 데 사용됩니다. 먼저 비지도 학습 알고리즘을 사용하여 유사한 데이터를 클러스터링합니다. 다음으로 레이블이 지정되지 않은 데이터는 기존 레이블이 지정된 데이터를 사용하여 분류됩니다.
준지도 학습의 일부 실용적인 응용 프로그램에는 인터넷에서 사용할 수 있는 콘텐츠 분류, 음성 인식 및 DNA 분류가 포함됩니다.
4. 강화 학습
강화 학습은 보상과 처벌의 개념을 사용합니다. 알고리즘은 호의적이거나 유쾌한 사건을 보상으로 연관시키고 불쾌한 사건을 처벌로 해석합니다. 보상 및 처벌 개념은 알고리즘을 강화하고 시간이 지남에 따라 가능한 최상의 행동을 사용하는 방법을 배웁니다. 정보를 입력하면 알고리즘이 보상을 극대화하기 위해 적절한 조치를 취합니다.
5. 자기 지도 학습
비지도 학습의 하위 집합입니다. 이름에서 알 수 있듯이 자기 지도 학습은 알고리즘이 자체적으로 레이블이 지정되지 않은 데이터에서 입력을 찾고 결과를 제공하는 기계 학습의 한 유형입니다 . 레이블이 지정된 데이터를 얻기가 어렵기 때문에 프로그래머는 레이블이 지정되지 않은 쉽게 사용할 수 있는 데이터를 사용하는 경우가 많습니다. 자기 지도 학습에서 데이터는 알고리즘에 감독을 제공합니다. 기계는 데이터 자체에서 레이블을 얻고 입력을 예측합니다. 자기 지도 학습은 가장 데이터 효율적인 기계 학습 기술 중 하나입니다.
6. 다중 인스턴스 학습
약간의 변형이 있는 지도 학습 기법의 한 유형입니다. 다중 인스턴스 학습 기술은 약하게 레이블이 지정된 데이터를 사용합니다. 이는 데이터에 불완전한 태그가 있고 백에 있는 인스턴스에만 레이블이 지정됨을 의미합니다. 이 알고리즘은 이진 개념을 사용합니다. 양성 인스턴스가 하나 있으면 백에 양성 레이블을 지정하고 적어도 하나의 인스턴스가 음성이면 음성 레이블을 지정합니다.
다중 인스턴스 유형의 기계 학습 은 샘플에서 악성 세포를 빠르게 판별할 수 있기 때문에 병리학에서 주로 사용됩니다. 알고리즘은 악성 세포 음성 사례를 고려합니다.
인기 기계 학습 및 인공 지능 블로그
IoT: 역사, 현재 및 미래 | 기계 학습 자습서: ML 알아보기 | 알고리즘이란 무엇입니까? 간단하고 쉬운 |
인도의 로봇 공학 엔지니어 급여 : 모든 역할 | 기계 학습 엔지니어의 하루: 그들은 무엇을 합니까? | IoT(사물인터넷)란? |
순열 대 조합 : 순열과 조합의 차이점 | 인공 지능 및 머신 러닝의 7대 트렌드 | R을 사용한 기계 학습: 알아야 할 모든 것 |
7. 온라인 학습
온라인 학습에서 알고리즘은 관찰이 이루어지면 사용 가능한 데이터를 사용하여 모델을 업데이트합니다. 온라인 학습 기법은 짧은 기간에 여러 관찰이 존재할 때 사용됩니다.
8. 적극적인 학습
능동 학습은 관련 데이터 포인트만 포함된 작은 데이터 세트를 사용하는 일종의 감독 기계 학습입니다. 우리는 이러한 유형의 기계 학습에서 데이터의 우선 순위를 지정합니다. 먼저 작은 데이터 샘플에 수동으로 레이블을 지정해야 합니다. 다음 단계는 레이블이 지정된 데이터에 따라 알고리즘을 교육하는 것입니다. 모델이 훈련되면 이를 사용하여 레이블이 지정되지 않은 데이터 포인트의 클래스를 결정할 수 있습니다.
9. 앙상블 학습
앙상블은 사물을 결합하여 전체적으로 함께 보는 것을 의미합니다. 따라서 앙상블 학습은 알고리즘이 더 나은 결과를 위해 서로 다른 모델의 예측을 결합 하는 일종의 기계 학습입니다 . 앙상블 학습에는 세 가지 모델이 있습니다.
- 배깅 - 샘플 트리에 다른 예측을 추가하고 모든 예측의 평균을 빼는 작업이 포함됩니다. 동일한 데이터 세트의 샘플을 사용합니다.
- 스태킹- 스태킹에서는 동일한 데이터 세트의 다른 모델을 사용합니다. 그러나 예측을 결합할 수 있는 방법을 결정하기 위해 다른 모델도 사용합니다.
- 부스팅 - 이 기술에서는 예측을 시퀀스로 정렬하고 모든 예측의 가중 평균을 계산합니다.
9. 전이 학습
전이 학습 기법에서는 사전 훈련된 모델의 요소를 새 모델로 전이합니다. 이 기술은 유사한 작업을 수행하기 위해 두 개의 모델을 생성할 때 사용됩니다. 전이 학습은 가장 비용 및 시간 효율적인 기계 학습 유형 중 하나입니다.
10. 멀티태스킹 학습
다중 작업 학습은 기계가 동시에 여러 작업을 학습하는 일종의 기계 학습 입니다. 다양한 모델을 사용하여 다양한 작업을 수행하는 대신 하나의 모델을 다중 작업으로 훈련하고 동시에 여러 테이크를 수행할 수 있습니다.
11. 귀납적 학습
귀납적 학습에서 데이터 세트에 대해 IF-THEN 형식으로 일반화된 규칙을 만듭니다. 이 기술은 '이벤트가 발생하면 이것이 발생합니다'라는 형식으로 작동합니다. 귀납적 학습은 주어진 데이터에서 함수를 도출하는 데 사용됩니다. 귀납적 학습의 일부 실제 적용은 다음과 같습니다.
- 신용 승인(고객에게 A 자산이 있는 경우 B는 신용 승인 여부입니다).
- 질병 진단(환자에게 A 증상이 있으면 B 질병이 있음).
12. 변환 학습
변환은 요소를 한 형식에서 다른 형식으로 변환하는 프로세스입니다. 변환 학습에서는 훈련 데이터를 모델링할 필요가 없습니다. 알고리즘은 데이터를 직접 사용하여 주어진 데이터 세트에서 알 수 없는 함수 값을 도출하여 정보를 예측합니다.
13. 연역적 학습
연역적 학습은 데이터를 분석하고 데이터로부터 추론을 생성하는 데 사용되는 기계 학습 기술입니다. 연역적 학습에서는 증명할 수 있는 올바른 지식을 사용하도록 알고리즘을 훈련합니다. 이는 프로그래머가 특정 정보가 정확하고 이전에 파생되었음을 깨닫는 데 도움이 됩니다.
결론
많은 회사에서 ML을 사용하여 개인화된 챗봇을 만들어 고객 만족도를 높이고 고객 유지율을 높이고 있습니다. 이 기술은 또한 공급망 프로세스를 최적화하고 조직의 자금 조달 프로세스를 자동화하는 데 도움이 됩니다. Meta, Netflix, Google, Twitter, Pinterest 및 기타 조직과 같은 미국 최고의 기업은 기계 학습을 사용하여 작업 프로세스를 자동화하고 최소 시간 내에 복잡한 작업을 수행하고 있습니다. 이것이 미국에서 기계 학습 엔지니어에 대한 수요가 큰 이유입니다.
ML은 더 나은 급여와 성장 기회로 인해 오늘날 가장 수익성이 좋은 직업 옵션 중 하나가 되었습니다. 기계 학습 에 대한 고급 지식을 습득하고 관련 기술을 습득하기 위해 upGrad 에서 기계 학습 및 인공 지능 과학 석사를 추구할 수 있습니다 .
기계 학습의 응용 프로그램은 무엇입니까?
기계 학습의 가장 중요한 응용 프로그램은 트래픽을 분석하고 대체 경로를 제안하는 Google 지도에 있습니다. 기계 학습 애플리케이션의 다른 일반적인 예로는 가상 개인 비서, 음성 인식 장치, Netflix 및 Amazon Prime과 같은 OTT 플랫폼, 사기 탐지 등이 있습니다. 기계 학습의 가장 중요한 응용 프로그램은 트래픽을 분석하고 대체 경로를 제안하는 Google 지도에 있습니다. 기계 학습 애플리케이션의 다른 일반적인 예로는 가상 개인 비서, 음성 인식 장치, Netflix 및 Amazon Prime과 같은 OTT 플랫폼, 사기 탐지 등이 있습니다.
지도 학습과 비지도 학습의 차이점은 무엇인가요?
지도 학습과 비지도 학습의 주요 차이점 중 하나는 사용되는 데이터 유형입니다. 지도 학습 알고리즘은 레이블이 지정된 데이터를 사용하는 반면 비지도 학습 알고리즘은 레이블이 지정되지 않은 데이터를 사용합니다. 지도 학습 알고리즘에 입력과 출력을 모두 공급해야 합니다. 그러나 비지도 학습 알고리즘에서는 출력을 사용할 수 없습니다. 지도 학습 기술을 사용하여 알고리즘을 훈련하고 비지도 학습 기술을 사용하여 데이터 통찰력을 수집합니다.
딥 러닝이란 무엇이며 딥 러닝의 다른 유형은 무엇입니까?
딥 러닝은 인공 지능과 기계 학습의 기능을 결합한 기술입니다. 기계 학습의 이 하위 집합은 인간의 두뇌가 지식을 이해하는 방식에 대한 개념을 기반으로 합니다. 딥 러닝 알고리즘은 더 나은 정확도를 제공하기 위해 여러 계층이 있는 인공 신경 프레임워크에서 영감을 받았습니다. 기계 학습은 단 하나의 계층만 있고 정형 데이터를 사용하여 결과를 예측하는 반면 딥 러닝은 비정형 데이터를 사용하여 더 정확한 정보를 제공할 수 있습니다. 다양한 유형의 딥 러닝 네트워크는 Feedforward 신경망, 다층 퍼셉트론, CNN(컨볼루션 신경망), 순환 신경망 및 모듈식 신경망입니다.