기계 학습의 연쇄 규칙 파생물 : 설명

게시 됨: 2021-06-30

머신 러닝은 최근 몇 년 동안 가장 많이 논의되고 연구된 분야 중 하나로 발전했습니다. 머신 러닝의 새로운 모델과 응용 프로그램이 매일 발견되고 있으며 전 세계의 연구원들은 차세대를 위해 노력하고 있습니다.

결과적으로 다양한 배경을 가진 전문가들이 머신 러닝으로 전환하고 이 진행 중인 혁명의 일부가 되기 위한 관심이 높아졌습니다. 머신 러닝의 첫 단계를 시작하려는 열광적인 사람이라면 무엇보다 먼저 수학 및 통계의 기초를 이해하는 것부터 시작한다는 점을 알려 드리겠습니다.

머신 러닝과 매우 관련성이 높은 수학에서 그러한 중요한 주제 중 하나는 파생 상품입니다. 미적분학에 대한 기본 이해에서 함수의 도함수는 해당 함수의 즉각적인 변화율이라는 것을 기억할 것입니다. 이 블로그에서 우리는 파생 상품에 대해 더 깊이 파고들고 연쇄 법칙을 탐구할 것입니다. 방정식에서 일부 독립 변수를 변경할 때 특정 함수의 출력이 어떻게 변경되는지 살펴보겠습니다. 연쇄 규칙 파생어에 대한 지식이 있으면 기계 학습에서 마주하게 되는 보다 복잡한 기능을 구별하는 작업을 할 수 있습니다.

세계 최고의 대학에서 온라인으로 머신 러닝 인증받으십시오 . 석사, 중역 대학원 프로그램, ML 및 AI 고급 인증 프로그램을 통해 경력을 빠르게 추적할 수 있습니다.

목차

연쇄 법칙 도함수의 이해

연쇄 법칙은 본질적으로 합성 함수의 도함수를 계산하는 데 도움이 되는 수학 공식입니다. 복합 함수는 두 개 이상의 함수로 구성된 함수입니다. 따라서 f g 가 두 개의 함수인 경우 연쇄 규칙은 fog 또는 go f 와 같은 복합 함수의 도함수를 찾는 데 도움이 됩니다.

복합 함수 포그를 고려할 때 연쇄 규칙 파생물은 다음과 같습니다.

위의 규칙은 다음과 같이 작성할 수도 있습니다.

여기서 함수 F f와 g 의 합성이며 f(g(x)) 형식입니다.

이제 세 번째 변수(z)가 두 번째 변수(y)에 종속되고 이 변수가 첫 번째 변수(x)에 종속되도록 세 개의 변수가 있다고 가정합니다. 이 경우 연쇄 법칙 도함수는 다음과 같이 보일 것입니다.

딥 러닝의 관점에서 이것은 역전파 문제를 해결하기 위해 정기적으로 사용되는 공식이기도 합니다. 이제 z는 y에 의존하고 y는 x에 의존한다고 언급했기 때문에 z = f(y) 및 y = g(x)라고 쓸 수 있습니다. 이 대체는 다음과 같은 방식으로 미분 방정식을 수정합니다.

이제 그 뒤에 있는 수학을 더 잘 이해하기 위해 연쇄 규칙 파생물의 몇 가지 예를 살펴보겠습니다.

연쇄 규칙 도함수의 예와 응용

연쇄 규칙 파생물을 더 나은 방식으로 이해하기 위해 Wikipedia에서 잘 알려진 예를 들어 보겠습니다. 하늘에서 자유낙하를 한다고 가정합니다. 가을 동안 만나는 대기압은 계속해서 변할 것입니다. 다음은 고도에 따른 대기압의 변화를 나타낸 그래프입니다.

당신의 추락이 해발 4000미터에서 시작되었다고 가정해 봅시다. 처음에는 속도가 0이었고 가속도 값은 중력으로 인해 초당 9.8미터였습니다.

이제 이 상황을 이전의 연쇄법칙과 비교해보자. 이 예에서는 x 대신 시간에 변수 't'를 사용합니다.

그러면 낙하 시작 이후 이동한 거리를 나타내는 변수 y = g(t)는 다음과 같이 주어질 수 있습니다.

g(t) = 0.5*9.8t^2

그리고 해수면으로부터의 높이는 변수 'h'로 주어질 수 있으며, 이는 400-g(t)와 같습니다.

모델을 기반으로 높이 h 에서 대기압의 함수를 다음과 같이 쓸 수도 있다고 가정합니다 .

f(h) = 101325 e−0.0001h

이제 종속 변수를 기반으로 두 방정식을 구별하여 다음 결과를 얻을 수 있습니다.

g′(t) = -9.8t,

여기서 g'(t)는 시간 t 에서의 속도 값을 알려줍니다 .

f′(h) = −10.1325e−0.0001h

여기서 f′(h)는 높이 h에 대한 기압의 변화율이다. 이제 문제는 이 두 방정식을 결합하여 시간에 따른 기압 변화율을 도출할 수 있습니까? 연쇄 법칙을 사용하는 것을 봅시다:

우리가 얻은 최종 방정식은 낙하 이후 경과된 시간과 관련하여 대기압의 변화율을 제공합니다. 기계 학습의 관점에서 신경망은 예측에서 뉴런의 오류와 관련된 가중치 업데이트가 지속적으로 필요합니다. 연쇄 규칙은 이러한 가중치를 조정하고 기계 학습 모델을 올바른 출력에 더 가깝게 만드는 데 도움이 됩니다.

결론

보시다시피, 연쇄 법칙은 많은 목적에 유용합니다. 특히 머신 러닝이나 딥 러닝과 관련하여 체인 규칙은 뉴런의 가중치를 업데이트하고 모델의 전반적인 효율성을 개선하는 데 많이 사용됩니다.

이제 연쇄 법칙의 기본 사항을 알았으므로 스스로 몇 가지 문제를 해결해 보십시오. 몇 가지 복합 함수를 찾아 그 파생물을 찾으십시오. 더 많이 연습할수록 개념이 더 명확해지고 기계 학습 모델을 더 쉽게 훈련할 수 있습니다! 머신 러닝을 좋아하지만 이 분야에서 첫 걸음을 내딛는 데 어려움을 겪고 있다면 upGrad가 도와드립니다!

기계 학습 및 AI 경영진 PG 프로그램은 IIIT-Bangalore와 협력하여 제공되며 6개의 산업 관련 전문 분야를 선택할 수 있습니다. 이 과정은 기초 수준에서 시작하여 업계 전문가, 강력한 동료 학생 그룹 및 360도 경력 지원의 1:1 지원을 제공하면서 정점으로 안내합니다.

기계 학습에서 기울기는 어떻게 사용됩니까?

기울기 벡터는 분류 및 회귀 문제에서 자주 사용됩니다. 경사하강법은 일종의 최적화 알고리즘입니다. 기울기 하강법은 미분 함수의 로컬 최소값을 찾기 위해 개발되었기 때문에 모델의 비용 함수를 최소화하는 최적의 매개변수를 식별하기 위해 기계 학습 모델에 광범위하게 사용됩니다.

신경망에서 활성화 함수를 사용하는 목적은 무엇입니까?

활성화 함수의 목표는 비선형 기능을 가진 신경망에 함수를 제공하는 것입니다. 활성화 기능이 있는 인공 신경망은 데이터의 복잡한 패턴을 이해하는 네트워크를 지원하는 데 사용됩니다. 신경망은 활성화 함수 없이 입력에서 출력으로의 선형 매핑만 수행할 수 있으며 입력 벡터와 가중치 행렬 간의 내적은 순방향 전파 동안 수학적 연산으로 작용합니다. 활성화 함수를 사용하여 모델이 생성할 수 있는 것에 대한 신뢰할 수 있는 예측을 얻을 수 있습니다.

머신 러닝을 위해 미적분학에 대한 좋은 지식을 갖는 것이 중요합니까?

미적분은 변화율 계산을 기반으로 오류 함수를 최소화하는 경사하강법과 같은 기계 학습 알고리즘의 내부 역학을 이해하는 데 필수적입니다. 초보자인 경우 머신 러닝을 잘하기 위해 미적분학의 이면에 있는 모든 아이디어를 이해할 필요는 없습니다. 대수와 미적분학의 원리만 알면 해결할 수 있지만 데이터 과학자이고 기계 학습 프로젝트의 배후에서 무슨 일이 일어나고 있는지 알고 싶다면 미적분학의 원리를 깊이 알아야 합니다. .