반 지도 학습 소개 [오늘날 세계에서 가장 많이 사용되는 응용 프로그램]

게시 됨: 2021-01-29

머신 러닝은 지난 10년의 화두였습니다. 기계 학습의 마법이 분명하지 않은 영역은 이제 거의 없습니다. 특히 수익성이 높은 광고 비즈니스에서 머신 러닝은 그 어느 때보다 널리 사용되고 있습니다.

웹사이트를 방문할 때마다, 인터넷에서 특정 용어를 검색할 때마다 생성하는 데이터는 '학습'됩니다. 그런 다음 이 데이터는 타겟 광고를 제공하여 사용자가 방문하는 웹페이지에 관계없이 모든 사용자가 서로 다른 광고를 받도록 하는 데 사용됩니다.

기계 학습 작동 방식

그렇다면 기계 학습은 어떻게 작동합니까? 작업에서 기계 학습은 인간의 두뇌와 매우 유사합니다. 데이터는 지속적으로 업데이트되며 항상 수신하는 새로운 정보에서 학습합니다. 머신 러닝에는 테스트 세트와 훈련 세트라는 두 가지 유형의 세트가 포함됩니다. 훈련 세트는 기본적으로 기계 학습 모델이 예측할 모든 데이터를 나타내는 데이터 세트입니다.

중요한 것은 전체 데이터를 예측하기 위한 훈련 및 테스트 세트에 대한 정보가 있다는 것입니다. 구축한 기계 학습 모델이 훈련 세트에서 패턴을 인식하면 테스트 세트에서 효율성을 테스트합니다. 이 앞뒤는 모델이 특정 수준의 효능에 도달할 때까지 계속됩니다.

머신 러닝의 유형

기계 학습에는 고유한 유형이 있습니다. 머신 러닝의 두 가지 주요 유형은 다음과 같습니다.

지도 학습
비지도 학습

초기 형태와 이전 섹션에서 설명한 형태로 머신 러닝은 지도 학습에서 얼마 전까지만 해도 일반적으로 지도 학습과 동의어였습니다. 훈련 세트와 테스트 세트에는 모두 레이블이 지정된 데이터가 있습니다.

레이블이 지정된 데이터는 모델이 예측할 필드를 포함하여 모든 중요한 데이터 필드에 모델이 효과적으로 학습할 수 있도록 레이블이 지정된 데이터 유형입니다. 지도 학습은 완전히 경험 기반 학습이며 모델의 성능을 최적화하려는 경우에 좋습니다.

비지도 학습은 모든 데이터에 레이블이 지정되지 않은 기계 학습 유형입니다. 오히려, 머신 러닝 모델은 제공된 데이터 사이에서 패턴을 구별하기 위해 자유롭게 고삐를 받습니다. 비지도 학습은 종종 예측할 수 없는 결과를 초래할 수 있으며 대규모 데이터 세트에서 새로운 패턴을 발견하는 데 도움이 될 수도 있습니다. 일반적으로 수신하는 데이터에는 레이블이 거의 지정되지 않으며 비지도 학습 모델은 레이블이 지정되지 않은 데이터를 위한 것입니다.

반 지도 학습

지도 학습과 비지도 학습에는 몇 가지 단점이 있습니다. 지도 학습의 가장 크고 명백한 단점은 대부분의 데이터에 레이블이 지정되지 않는다는 사실입니다. 데이터 세트에서 지도 학습이 작동하도록 하려면 모든 데이터를 추출하고 수동으로 레이블을 지정해야 하는 경우가 많습니다. 이는 까다로운 프로세스이며 데이터에 대한 기계 학습 사용의 모든 이점을 무효화할 수 있습니다.

비지도 학습에는 레이블이 지정된 데이터가 필요하지 않지만, 불행히도 순전히 비지도 학습에 대한 잠재적 응용 프로그램의 기반은 다소 제한적입니다.

반 지도 학습은 지도 학습과 비지도 학습 사이의 훌륭한 중간 경로를 제공하는 일종의 기계 학습입니다. 분명히 반 지도 학습은 기계 학습 스펙트럼의 지도 끝쪽으로 약간 방향을 틀었습니다. 반 지도 학습 모델의 전제 조건은 레이블이 지정되지 않은 데이터 세트이며, 이 중 소량의 데이터가 추출되고 수동으로 레이블이 지정됩니다.

이는 모든 데이터에 레이블을 지정해야 하는 순수 지도 모델에 비해 상당한 이점입니다. 따라서 semi-supervised learning은 비용 및 시간 절약과 관련이 있습니다. 감독되지 않은 모델과 비교하여 감독된 모델은 레이블이 지정된 데이터의 양이 적은 경우에도 계산 리소스를 줄이고 모델의 정확도를 향상시킬 수 있습니다.

비지도 학습의 가정

레이블이 지정되지 않은 데이터의 사용이 관련된 경우 어떤 방식으로든 기본 데이터와 연결되어야 합니다. 반 지도 머신 러닝 모델을 사용할 때 데이터에 대한 특정 가정이 이루어집니다. 이러한 가정은 다음과 같습니다.

연속성 가정: 이것은 서로 더 가까운 모든 데이터를 나타내는 산점도의 점이 동일한 레이블을 가질 가능성이 더 높다는 가정입니다. 이것은 지도 학습 모델에 일반적으로 사용되는 주요 가정이기도 합니다. 이 가정은 준지도 모델이 읽기 쉬운 결정 경계를 형성하는 것을 용이하게 합니다.

클러스터 가정: 이것은 데이터가 클러스터를 형성하는 자연스러운 성향을 갖고 있으며 동일한 클러스터의 일부인 데이터 포인트가 동일한 레이블을 갖는다고 가정합니다. 그러나 이 가정에 대한 주의 사항은 둘 이상의 클러스터에도 동일한 레이블에 속하는 데이터가 있을 수 있다는 것입니다. 이 가정은 클러스터링 알고리즘에서 매우 유용합니다. 이는 앞의 가정과 매우 유사하며 연속성 가정의 특수한 경우로 취급될 수 있다. 클러스터 가정은 연속성 가정과 유사하게 결정 경계의 결정이 필요할 때 매우 유용합니다.

다양체 가정: 이것은 입력 공간의 다양체의 차원이 데이터가 있는 것보다 훨씬 더 높다고 가정합니다. 이 가정이 이루어지면 레이블이 지정되고 레이블이 지정되지 않은 데이터는 공통 매니폴드에 따라 학습될 수 있습니다. 매니폴드가 설정되면 데이터 포인트 간의 밀도와 거리를 측정할 수 있습니다. 이는 데이터의 차원 수가 매우 많고 데이터를 다른 레이블로 분류하는 데 사용되는 차원의 수가 상대적으로 더 적을 것임을 반복할 때 유용한 가정입니다.

더 읽어보기: 기계 학습 모델

준지도 학습의 응용

비지도 학습에 대한 주요 불만은 잠재적 응용 프로그램의 수가 다소 적다는 것입니다. 감독되지 않은 모델을 통해 얻은 결과는 종종 중복되거나 사용할 수 없습니다. 이에 비해 반 지도 학습에는 활용할 수 있는 강력한 응용 프로그램 세트가 있습니다.

인터넷의 콘텐츠 분류: 인터넷은 방대한 웹 페이지의 보고이며 모든 페이지에 레이블이 지정되고 원하는 분야에 대한 모든 데이터가 있을 것이라고 기대할 수 없습니다. 그러나 동시에 수년에 걸쳐 일부 소수의 웹 페이지에 한 차원 또는 다른 차원에 대해 레이블이 지정되어 있는 것이 사실입니다.

이것은 웹 페이지의 분류에 사용할 수 있습니다. 레이블이 지정된 웹 페이지 세트를 사용하여 필요한 다른 모든 웹 페이지의 레이블을 예측할 수 있습니다. 여러 검색 엔진은 Google을 포함하여 검색 결과에서 웹 페이지에 레이블을 지정하고 순위를 지정하기 위해 반 지도 학습 모델을 사용합니다.

이미지 및 오디오 분석: 이미지 및 오디오 분석 은 반 지도 학습 모델의 가장 일반적인 용도 중 하나입니다. 이 유형의 데이터는 일반적으로 레이블이 지정되지 않습니다. 인간의 전문 지식은 며칠 또는 몇 달 동안 특정 필드에 대한 각 이미지 또는 오디오 조각을 분류하는 대신 데이터의 작은 부분에 레이블을 지정할 수 있습니다. 이 작은 비율의 데이터가 분류되면 훈련된 알고리즘을 활용하여 가지고 있는 다른 모든 데이터를 분류할 수 있습니다.

단백질 서열 분류: 이것은 반 지도 학습의 비교적 새로운 응용 프로그램입니다. 단백질 서열에는 많은 아미노산이 포함되어 있으며, 모든 단백질 서열을 분석하고 이를 한 유형 또는 다른 유형으로 분류하는 것은 비실용적입니다. 이 작업은 semi-supervised learning을 사용하여 쉽게 완료할 수 있습니다. 당신이 필요로 하는 것은 이미 스팽글 단백질의 데이터베이스이며, 모델 자체가 나머지를 시퀀싱할 수 있습니다.

결론

준지도 학습은 지도 학습과 비지도 학습의 장점과 단점 중에서 큰 조정을 제공합니다. 또한 생성되거나 사용 가능한 많은 양의 데이터를 한 모델에서 사용하여 의미 있는 통찰력을 얻을 수 있습니다. 이러한 유형의 모델의 사용은 앞으로 몇 년 동안만 증가할 것입니다.

머신 러닝은 세계에서 가장 영향력 있는 기술 중 하나입니다. 그것이 요즘 인기있는 큰 이유입니다.

많은 산업에서 다양한 목적으로 머신 러닝을 사용하므로 수요가 나날이 증가하고 있습니다. 기계 학습 및 인공 지능 분야의 경력에 대해 더 알고 싶다면 IIIT-B 및 upGrad의 기계 학습 및 AI 프로그램 PG 디플로마를 확인하십시오.

세계 최고의 대학에서 ML 과정 을 배우십시오 . 석사, 이그 제 큐 티브 PGP 또는 고급 인증 프로그램을 획득하여 경력을 빠르게 추적하십시오.

AI 주도 기술 혁명 주도

머신 러닝 및 딥 러닝의 고급 인증 프로그램 배우기