초보자를 위한 기계 학습 소개: 정의, 역사, 기능 및 분류

게시 됨: 2022-07-13

목차

머신러닝 소개

기계 학습은 오늘날의 기술 중심 시장에서 수요가 많습니다. 전 세계를 강타하고 컴퓨터 과학의 세계에 혁명을 일으킨 최신 트렌드입니다. 또한 응용 프로그램에서 생성되는 많은 양의 데이터로 인해 계산 능력이 크게 향상되어 학생과 후보자 사이에서 기계 학습 기술에 대한 인기와 수요가 증가했습니다.

머신 러닝은 다양한 분야에서 사용됩니다. 기본 작업 자동화에서 가치 있는 통찰력 제공에 이르기까지 업계와 기업에 엄청난 이점을 제공했습니다. 머신 러닝은 피트니스 트래커, 지능형 홈 어시스턴트, 의료 시스템, 자동화된 자동차 등과 같은 일상적인 장치에 구현되었습니다. 기계 학습이 구현되는 다른 필수 예는 다음과 같습니다.

  • 예측 : 머신러닝은 대출 전 통근 결함 확률에 유용한 예측 시스템에 주로 사용되었습니다.
  • 이미지 인식 : 얼굴 인식 및 이미지 인식은 현재 대세이며 머신 러닝이 이를 가능하게 했습니다.
  • 음성 인식 : 이미지 인식과 유사하게 음성 인식이 있습니다. 기계 학습에서 널리 구현되었습니다.
  • 의료 진단 : 암 조직을 감지하는 의료 기술에 머신 러닝이 구현되었습니다.
  • 금융 산업 및 거래 : 머신 러닝은 신용 확인 및 사기 탐지를 위해 기업에서 널리 사용되었습니다.

머신 러닝 또는 ML은 데이터 분석의 필수적인 부분입니다. 연구원, 엔지니어, 데이터 과학자 및 분석가가 신뢰할 수 있는 정보를 예측하고 제공하는 데 도움이 되는 복잡한 알고리즘 및 모델을 만드는 데 사용됩니다.

세계 최고의 대학에서 온라인으로 머신 러닝배우십시오 . 석사, 대학원 대학원 과정, ML 및 AI 고급 인증 프로그램을 통해 빠르게 경력을 쌓을 수 있습니다.

기계 학습 및 인공 지능에 대한 과정 살펴보기

IITM의 기계 학습 및 클라우드 고급 인증 LJMU의 기계 학습 및 AI 과학 석사 IITB의 기계 학습 및 AI 대학원 대학원 프로그램
IIITB의 기계 학습 및 NLP 고급 인증 프로그램 IIITB의 머신 러닝 및 딥 러닝 고급 인증 프로그램 IITR의 관리자를 위한 AI 고급 인증 프로그램

기계 학습의 역사

'머신 러닝'은 인공 지능과 컴퓨터 게임 분야의 선구자이자 전문가인 아서 사무엘이 1959년에 만든 용어입니다. 그는 컴퓨터가 프로그래밍되지 않고 학습할 수 있도록 하는 프로세스로 정의했습니다.

1940년대에 ENIAC(Electronic Numerical Integrator and Computer)라고 알려진 수동으로 작동할 수 있는 최초의 컴퓨터 시스템이 발명되었습니다. 인간의 학습과 사고를 시뮬레이션할 수 있는 기계를 만드는 아이디어의 시작이었습니다.

통계 덕분에 머신 러닝은 1990년대에 대중화되었고 AI에서 확률론적 접근 방식이 생겨났고, 이는 데이터 중심 접근 방식으로 더욱 이동했습니다. 이는 과학자들이 방대한 데이터 세트에서 학습할 수 있는 분석 기능을 갖춘 지능형 시스템에 대해 생각하고, 설계하고, 구축할 수 있는 길을 열었습니다.

기계 학습의 분류

머신 러닝 구현은 학습 시스템에서 사용할 수 있는 학습 "신호" 또는 "응답"에 따라 세 가지 범주로 나눌 수 있습니다. 그것들은 다음과 같습니다:-

1. 지도 학습

알고리즘이 클래스 또는 태그와 같은 문자열 레이블 또는 숫자 값으로 구성된 예제 데이터와 상관 대상 응답을 사용하고 나중에 새로운 예제가 제공될 때 올바른 응답을 예측하는 방법을 학습하는 경우 이를 지도 학습이라고 합니다. 이는 학생이 교사가 제공한 좋은 예를 암기하는 교사의 감독 하에 인간 학습과 유사한 접근 방식입니다. 그런 다음 학생은 이러한 대상 예제에서 일반적인 규칙을 만듭니다.

2. 비지도 학습

비지도 학습은 알고리즘이 상관된 응답 없이 간단한 예제에서 학습하여 데이터 패턴의 결정을 알고리즘에만 남겨두는 경우입니다. 이 알고리즘은 일반적으로 클래스를 나타내는 새로운 기능이나 연결되지 않은 값의 컬렉션과 같이 데이터를 완전히 다른 것으로 재구성합니다.

이는 데이터 분석가에게 데이터의 의미에 대한 통찰력을 제공하고 지도 머신 러닝 알고리즘을 개선하기 위한 귀중한 팁을 제공하는 데 매우 유용합니다. 그것은 인간이 두 대상 사이의 유사성을 관찰하여 특정 사물이나 사례가 동일한 범주에 속하는지 확인하는 방법을 배우는 것과 거의 비슷합니다. 웹을 탐색하는 동안 접하게 되는 추천 시스템과 광고는 마케팅 자동화이며 이러한 종류의 감독되지 않은 자동 학습을 기반으로 합니다.

3. 강화 학습

레이블이 없는 예제가 있는 알고리즘을 제시하면 일종의 비지도 학습으로 분류할 수 있습니다. 그러나 알고리즘이 제안한 솔루션에 따라 예제에 긍정적이거나 부정적인 피드백이 수반되면 강화 학습입니다. 이 학습 범주는 결정을 내리고 결과를 부담하는 데 알고리즘이 필요한 응용 프로그램과 연결됩니다.

인간의 학습 방법은 시행 착오와 유사합니다. 시행 착오 방법을 통해 알고리즘은 특정 행동 과정이 다른 사람만큼 성공할 가능성이 없다는 것을 배웁니다. 강화 학습과 관련하여 인용할 수 있는 가장 좋은 예 중 하나는 컴퓨터가 비디오 게임을 독립적으로 하는 방법을 배울 때입니다. 이 응용 프로그램은 플레이어가 미로에 갇힌 동시에 적을 피하는 것과 같은 특정 인스턴스 또는 상황의 알고리즘 예제를 제공합니다.

4. 반 지도 학습

반 지도 학습은 일부 누락된 목표 출력과 함께 완료되지 않은 교육 신호가 제공되는 경우입니다. 이 원칙의 예외적인 경우 중 하나는 목표가 누락된 부분을 제외하고 전체 문제 인스턴스 세트가 학습 시간에 결정되는 변환이라고 합니다.

소프트웨어 개발과 관련된 인기 기사 읽기

Java에서 데이터 추상화를 구현하는 방법은 무엇입니까? Java에서 내부 클래스란 무엇입니까? Java 식별자: 정의, 구문 및 예
예제와 함께 OOPS의 캡슐화 이해하기 C의 명령줄 인수 설명 2022년 클라우드 컴퓨팅의 상위 10가지 기능 및 특성
Java의 다형성: 개념, 유형, 특성 및 예 Java 패키지 및 사용 방법 초보자를 위한 Git 튜토리얼: 처음부터 Git 배우기

기계 학습은 어떻게 작동합니까?

머신 러닝이 어떻게 작동하는지 이해하는 단계는 다음과 같습니다.

  • 데이터 수집: 먼저 처리에 적합한 모든 형식의 과거 데이터를 수집합니다. 데이터의 품질이 높을수록 모델링에 더 적합합니다.
  • 데이터 처리: 대부분의 경우 데이터는 원시 형식으로 수집되며 사전 처리되어야 합니다. 집의 가격이 속성의 평균 값으로 대체될 수 있는 것과 같이 숫자 속성에는 여러 가지 누락된 값이 있을 수 있습니다. 그러나 범주형 특성에 대한 누락된 값은 가장 높은 모드를 갖는 특성으로 대체될 수 있습니다. 이것은 사용되는 필터의 종류에 따라 다릅니다.
  • 입력 데이터 분할: 입력 데이터는 훈련, 교차 검증 및 테스트 세트로 분할되어야 합니다. 세트 간의 비율은 6:2:2여야 합니다.
  • 모델 구축 : 모델은 훈련 세트에 적합한 기술과 알고리즘으로 구축되어야 합니다.
  • 개념화된 모델 테스트: 개념화된 모델은 F1 점수, 재현율 및 정밀도와 같은 메트릭을 사용하여 교육 및 성능 평가 중에 모델에 제공되지 않은 데이터로 테스트됩니다.

결론

머신 러닝 기술은 현재 우리 삶의 일부가 된 AI의 대중화와 발전으로 인해 직업 시장에서 현재 가장 많이 요구되는 기술 중 하나입니다.

머신 러닝의 프리미엄 과정에 등록하면 의심할 여지 없이 경력 향상에 큰 도움이 될 것입니다. 수익성 있는 옵션을 찾고 있다면 upGrad 를 선택할 수 있습니다 . 선택할 수 있는 수많은 수익성 있는 과정 외에도 기계 학습 및 딥 러닝의 고급 인증 프로그램은 기계 학습 분야의 심층 교육을 지원하는 완벽한 과정입니다.

이 과정의 주요 하이라이트는 다음과 같습니다.

  • 일하는 전문가를 위한 설계
  • 여러 산업 프로젝트, 과제 및 사례 연구
  • IIT 방갈로르의 고급 인증서
  • 맞춤형 진로 멘토링 세션
  • 독점 채용 기회 포털

ML과 기존 프로그래밍의 기본적인 차이점은 무엇입니까?

전통적인 프로그래밍에서 DATA(입력) + PROGRAM(논리)은 프로그램을 실행하고 출력을 달성하기 위해 기계에 공급됩니다. 반면, Machine Learning에서는 DATA(Input) + Output이 기계에 공급되어 학습 중에 실행되고 기계가 프로그램(논리)을 생성하여 테스트 중에 평가 대상이 됩니다.

ML을 배우기 위한 전제 조건은 무엇입니까?

기계 학습을 배우기 위한 전제 조건은 선형 대수, 통계 및 확률, 미적분, 그래프 이론 및 Python, R, MATLAB, C++ 또는 Octave와 같은 언어의 프로그래밍 기술입니다.

머신 러닝에서 데이터 분할은 어떻게 되나요?

머신 러닝에서 데이터는 세 부분으로 나뉩니다. 모델을 학습시키려면 학습 데이터가 필요합니다. 이것은 실제로 학습하는 모델에서 볼 수 있는 데이터입니다. 검증 데이터는 모델을 빠르게 평가하는 데 사용되며 관련 하이퍼파라미터를 개선했습니다. 테스트 데이터는 철저하게 훈련되었으며 편견 없는 평가를 제공합니다.