기계 학습 과정 계획표: 기술 향상을 위한 최고의 ML 및 AI 과정

게시 됨: 2021-01-21

upGrad의 PG 디플로마 과정은 가장 포괄적인 과정 중 하나입니다. 현재 업계에서 요구되는 기술, 개념 및 도구에 대한 모든 지식을 다룹니다.

강의 계획은 여러분이 업계에서 준비하고 면접을 쉽게 통과할 수 있도록 설계되었습니다.

"기계 학습 및 AI의 경영진 PG 프로그램"의 적용 범위에 대한 심층 세부 정보를 위해 전체 강의 계획을 살펴보겠습니다.

이 과정은 8개의 주요 부분으로 나뉩니다:

  1. 데이터 과학 도구 키트
  2. 통계 및 탐색적 데이터 분석
  3. 기계 학습-1
  4. 기계 학습-2
  5. 자연어 처리
  6. 딥러닝
  7. 강화 학습
  8. 배포 및 캡스톤 프로젝트

목차

데이터 과학 도구 키트

이 부분은 데이터 과학 및 기계 학습의 여정을 시작하는 데 필수적인 사전 준비 과정입니다. 주요 요구 사항은 Python, SQL 및 Excel도 어느 정도 있습니다.

이 부분은 아래의 6개 모듈로 나뉩니다.

Python 소개: 이 모듈은 사전 지식이 없다고 가정하고 핵심 Python 주제를 다룹니다. Python의 구조를 이해하고 목록, 튜플, 사전 등과 같은 데이터 구조를 다룹니다.

데이터 과학을 위한 Python: Python 의 가장 중요한 2가지 라이브러리인 NumPy와 Pandas가 심층적으로 다룹니다. NumPy와 Pandas는 데이터 분석, 정리 및 대부분의 핵심 데이터 과학 작업에 필수적입니다.

기계 학습을 위한 수학: 이 모듈에서는 선형 대수, 행렬, 다변수 미적분 및 벡터를 다룹니다. 이러한 주제는 ML 알고리즘의 작동 방식을 이해하기 위한 전제 조건입니다.

Python의 데이터 시각화: 이 모듈은 Python을 사용하여 그래프와 추세를 그리는 역학을 다룹니다.

  • SQL을 사용한 데이터 분석: SQL은 데이터 분석 및 엔지니어링의 핵심입니다. 이 모듈은 함수, 절, 쿼리 및 조인과 같은 SQL의 기본 사항을 다룹니다.
  1. 고급 SQL: 이 모듈은 데이터베이스 디자인, 창 기능, 쿼리 최적화 등과 같은 고급 주제를 다룹니다.

통계 및 탐색적 데이터 분석

통계와 데이터는 함께 가야 합니다. 대부분의 데이터 분석은 내부에서 통계 분석을 실행한 다음 추가로 탐색하여 중요한 결과를 얻을 수 있습니다.

이 부분은 아래의 6개 모듈을 다룹니다.

  1. 분석 문제 해결: 이 모듈은 비즈니스 이해에서 배포에 이르는 기계 학습 프로젝트의 개요를 위한 CRISP-DM 프레임워크를 다룹니다.
  2. 투자 할당: 투자 은행 직원으로서 데이터 분석 할당.
  3. 추론 통계: 이 모듈은 확률, 확률 분포 및 중심 극한 정리와 같은 가장 중요한 통계 개념을 다룹니다.
  4. 가설 테스트: 이 모듈에서는 가설 테스트의 대상, 이유 및 방법을 다룹니다. P-Value, 다양한 유형의 테스트 및 Python 구현.
  5. 탐색적 데이터 분석: EDA는 데이터에서 정보를 가져옵니다. 이 모듈은 ML에 대한 데이터 정리, 일변량/이변량 분석 및 파생 메트릭을 다룹니다.
  6. 그룹 프로젝트: 대출을 불이행할 위험이 있는 고객을 찾기 위한 대출 클럽 사례 연구.

세계 최고의 대학에서 머신 러닝 인증배우십시오 . 석사, 이그 제 큐 티브 PGP 또는 고급 인증 프로그램을 획득하여 경력을 빠르게 추적하십시오.

기계 학습-1

이 부분에서는 머신 러닝의 기초와 일부 알고리즘을 다룹니다. 고급 주제로 뛰어 들기 전에 이에 대한 포괄적인 지식을 갖는 것이 중요합니다.

5개의 모듈로 구성되어 있습니다.

  1. 선형 회귀: 이 모듈은 선형 회귀의 기본, 가정, 제한 및 산업 응용 프로그램을 다룹니다.
  2. 선형 회귀 평가: 자동차 가격 예측 할당.
  3. 로지스틱 회귀: ML 분류를 위한 단변수 및 다변수 로지스틱 회귀. Python 구현, 평가 지표 및 산업 응용 프로그램을 다룹니다.
  4. Naive Bayes: 가장 쉽고 효과적인 분류 알고리즘 중 하나입니다. 이 모듈은 Bayes Theorem, Naive Bayes 분류기 및 Spam-Ham 분류기 구현의 기본 사항을 다룹니다.
  5. 모델 선택: 이 모듈은 최상의 ML 모델을 완성하는 데 필요한 모델 선택, 편향-분산 트레이드오프, 초매개변수 조정 및 교차 검증을 다룹니다.

기계 학습-2

이 부분에서는 기계 학습의 고급 주제를 다룹니다. 다양한 유형의 감독 및 비감독 알고리즘으로 구성됩니다.

다루는 8개의 모듈은 다음과 같습니다.

  1. 고급 회귀: 이 모듈에서는 Ridge 및 Lasso와 같은 일반화 선형 회귀 및 정규화 회귀 기술을 소개합니다.
  2. 지원 벡터 머신(선택 사항): 이 모듈은 SVM 알고리즘, 작동, 커널 및 구현을 다룹니다.
  3. 트리 모델: 트리 모델 의 기본, 구조, 분할 기술, 가지치기 및 랜덤 포레스트를 형성하는 앙상블이 여기에서 다룹니다.
  4. 모델 선택 - 실제 고려 사항: 이 모듈은 모델 선택 기술을 사용하여 최상의 모델을 선택하는 실습을 제공합니다.
  5. 부스팅: 약한 학습자와 문자열 학습자는 무엇이며 어떻게 함께 결합하여 훌륭한 모델을 형성할 수 있습니까? 여기에서는 다양한 부스팅 기술을 다룹니다.
  6. Unsupervised Learning-Clustering: 이 모듈은 클러스터링, 클러스터링의 유형 및 구현을 처음부터 소개합니다.
  7. Unsupervised Learning-Principal Component Analysis: 이것은 PCA의 기본, Python에서의 작동 및 구현을 다룹니다.
  8. 통신 이탈 사례 연구: 통신 사업자의 고객 이탈을 예측하기 위한 사례 연구.

자연어 처리

자연어 처리(NLP)는 그 자체로 거대한 분야입니다. 이 NLP 부분에서는 챗봇과 함께 텍스트 데이터 처리의 모든 구성 요소를 다룹니다.

포함된 5개의 모듈은 다음과 같습니다.

  1. 어휘 처리: 이 모듈은 텍스트 인코딩, 정규식, 텍스트 처리 기술 및 음성 해싱과 같은 고급 어휘 기술과 같은 NLP의 기본 사항을 다룹니다.
  2. 구문 처리: 이 모듈은 구문 처리의 기본, 다양한 유형의 텍스트 구문 분석, 정보 추출 및 조건부 랜덤 필드를 다룹니다.
  3. 구문 처리-할당: 텍스트의 문법 구조를 이해하기 위해 구문 처리를 구현합니다.
  4. 의미론적 처리: 이 모듈은 의미론적 처리, 워드 벡터 및 임베딩, 토픽 모델링 기법에 이어 사례 연구를 소개합니다.
  5. Rasa로 챗봇 구축: 이 모듈은 구현과 함께 챗봇 개발을 위한 가장 인기 있는 도구를 다룹니다.

딥러닝

딥 러닝은 다양한 유형의 데이터에 대한 많은 첨단 애플리케이션에서 업계에서 널리 사용됩니다. 이 부분에서는 구현과 함께 모든 유형의 신경망을 다룹니다.

다루는 5개의 모듈은 다음과 같습니다.

  1. 신경망 소개: 이 모듈은 신경망, 활성화 기능 및 피드 포워드 네트워크의 기본 사항을 다룹니다.
  2. Convolutional Neural Network-Industry Applications: 이 모듈은 CNN, 그 구조, 레이어 및 작업에 대해 자세히 다룹니다. 또한 다양한 Transfer Learning 모델, Style Transfer 및 이미지 데이터의 데이터 사전 처리에 이어 사례 연구를 다룹니다.
  3. 신경망 할당: CNN 기반 사례 연구.
  4. 순환 신경망: 이 모듈은 시퀀스 기반 데이터에 특별히 사용되는 또 다른 유형의 신경망인 RNN 및 LSTM과 그 구현을 다룹니다.
  5. 신경망 프로젝트: 이 모듈에서는 CNN 및 RNN 네트워크 스택을 사용하여 제스처 인식 프로젝트를 수행합니다.

강화 학습

이 부분에서는 또 다른 유형의 기계 학습인 강화 학습을 소개합니다. 고전 강화 학습과 심층 강화 학습을 포함한 기본 사항을 배우게 됩니다.

이 부분은 아래의 4개 모듈을 다룹니다.

  1. Classical Reinforcement Learning: 이 모듈은 Markov Decision Process, RL Equations 및 Monte Carlo Methods와 같은 RL의 기본 사항을 다룹니다.
  2. 과제-고전적 강화 학습: RL을 사용한 tic-tac-toe 할당.
  3. 심층 강화 학습: 이 모듈에서는 Deep Q Networks, 아키텍처 및 구현에 대해 자세히 알아보겠습니다. 또한 Policy Gradient Methods 및 Actor-Critic Methods와 같은 고급 주제를 다룹니다.
  4. 강화 학습 프로젝트: RL 아키텍처를 사용하여 수행해야 하는 과제.

캡스톤 프로젝트

이 부분에서는 지금까지 얻은 모든 지식을 사용하여 최종 캡스톤 프로젝트를 만듭니다.

이 부분은 2개의 모듈로 나뉩니다.

  1. 배포: 이 모듈에서는 CI/CD 파이프라인 및 Docker 기본 사항은 물론 클라우드 및 PaaS에 대한 배포 기본 사항을 배울 기계 학습 프로젝트의 후반 단계를 다룹니다.
  2. 캡스톤: 이력서와 포트폴리오를 하늘로 치솟게 하는 최종 캡스톤 프로젝트.

가기 전에

이 프로그램은 데이터 과학 및 기계 학습 산업에 진입하는 데 필요한 모든 기본 및 고급 도구 및 기술을 다룹니다. 당신은 당신이 잘 배웠는지 확인하기 위해 충분한 양의 실습과 프로젝트를 겪을 것입니다.

배운 모든 기술을 사용하여 다른 경쟁 플랫폼에서 활동할 수 있을 뿐만 아니라 기술을 테스트하고 더 많은 실습을 할 수 있습니다.

머신 러닝이란 무엇입니까?

머신 러닝은 컴퓨터에 명시적으로 프로그래밍하지 않고도 학습할 수 있는 능력을 부여하는 컴퓨터 과학의 한 분야입니다. 컴퓨터에 명시적으로 프로그래밍하지 않고도 학습할 수 있는 기능을 제공합니다. 머신 러닝은 데이터로부터 학습하고 예측할 수 있는 알고리즘의 구성 및 연구를 연구하는 과학 분야입니다. 문제 설명에서 머신 러닝은 주어진 데이터/특성의 예측 모델링에 초점을 맞추고 데이터에 있는 특성을 기반으로 결과의 확률에 대한 가설을 형성합니다.

기계 학습의 응용 프로그램은 무엇입니까?

일반적으로 머신 러닝은 데이터를 기반으로 학습하고 예측하는 컴퓨터 또는 프로그램을 포함하는 일종의 인공 지능(AI)입니다. 머신 러닝은 이미 이미지 인식, 자연어 처리 및 기타 다양한 분야에서 널리 사용되고 있으며, 최근 딥 러닝 및 빅 데이터의 획기적인 발전으로 AI가 현실에 가까워졌습니다. 현재 기계 학습은 의료, 운송 및 물류, 농업, 전자 상거래 등 거의 모든 중요 분야에서 사용되고 있습니다.

기계 학습 모델을 만드는 방법은 무엇입니까?

기계 학습 모델은 레이블이 지정된 훈련 데이터에서 학습하고 이전에 본 적이 없는 새로운 데이터에 대해 예측 또는 분류를 수행합니다. 통계 학습 이론을 기반으로 하지만 최적화, 모델링 및 코딩이 많이 포함됩니다. 따라서 기계 학습 모델은 모델과 학습 알고리즘의 두 부분으로 구성됩니다. 모델 부분은 트리 또는 의사 결정 트리와 같은 수학적 모델로 표현되고 학습 알고리즘은 히스토리 데이터셋으로 표현된다. 학습 알고리즘은 데이터 세트에서 학습하고 모델을 최적화하여 모델의 오류와 복잡성의 균형을 맞춥니다. 모델이 더 정확하고 단순할수록 더 좋습니다.