CNN 딥러닝 가이드

게시 됨: 2022-10-14

인간과 기계의 기술 사이의 격차를 줄이는 인공 지능의 능력이 비약적으로 향상되었습니다. 전문가와 아마추어 모두 훌륭한 결과를 얻기 위해 현장의 여러 측면에 집중합니다. 컴퓨터 비전 분야는 이러한 여러 분야 중 하나입니다.

목차

미국의 AI 및 ML 프로그램

LJMU 및 IIITB의 기계 학습 및 AI 과학 석사 IIITB의 기계 학습 및 인공 지능 분야 이그 제 큐 티브 PG 프로그램
모든 과정을 살펴보려면 아래 페이지를 방문하십시오.
기계 학습 과정

이 분야는 컴퓨터가 인간처럼 세상을 보고 이해할 수 있는 능력을 부여하고 이 이해를 이미지 및 비디오 인식, 이미지 분석 및 분류, 미디어 레크리에이션, 추천 시스템, 자연어 처리 등을 포함한 다양한 작업에 사용하는 것을 목표로 합니다. 컨볼루션 신경망 시간이 지남에 따라 컴퓨터 비전의 딥 러닝 개선 사항을 개발하고 개선하는 데 사용되는 기본 알고리즘입니다. 딥러닝 알고리즘에 대해 자세히 알아보자!

세계 최고의 대학에서 기계 학습 인증을 받으십시오. 석사, 이그 제 큐 티브 PGP 또는 고급 인증 프로그램을 획득하여 경력을 빠르게 추적하십시오.

컨볼루션 신경망이란 무엇입니까?

Convolutional Neural Network 또는 CNN은 입력 이미지를 가져와 학습 가능한 가중치 및 편향과 같은 이미지의 다양한 요소 및 객체 중요도를 부여하고 이들을 구별할 수 있는 딥 러닝 방법입니다. 상대적으로 말해서 CNN은 다른 분류 기술보다 훨씬 적은 사전 처리가 필요합니다. CNN은 이러한 필터와 속성을 학습할 수 있는 능력이 있는 반면, 원시 기술에서는 필터가 손으로 엔지니어링됩니다.

CNN의 아키텍처는 Visual Cortex가 어떻게 구성되어 있고 인간 두뇌에 있는 뉴런의 연결 네트워크와 유사한지에 의해 영향을 받습니다. 개별 뉴런은 수용장으로 알려진 이 제한된 시야 영역에서만 자극에 반응합니다. 이러한 일련의 중첩이 전체 시야를 덮습니다.

컨볼루션 신경망의 아키텍처

컨볼루션 신경망의 아키텍처는 기존 신경망의 아키텍처와 다릅니다. 일반 신경망은 입력을 변환하여 여러 은닉층을 통과합니다. 각 레이어는 그 아래 레이어의 모든 뉴런에 연결된 일련의 뉴런으로 구성됩니다. 최종 완전 연결 출력 레이어는 예측이 표현되는 곳입니다.

컨볼루션 신경망은 구조가 약간 다릅니다. 레이어는 먼저 너비, 높이 및 깊이의 3차원으로 배열됩니다. 또한 다음 레이어의 뉴런 중 일부만 아래 레이어의 뉴런과 연결됩니다. 그런 다음 출력은 단일 확률 점수 벡터로 압축되고 컨볼루션 레이어와 함께 그룹화됩니다.

CNN은 두 부분으로 구성됩니다.

은닉층에서 특징 추출

네트워크는 이 섹션에서 기능을 감지하기 위해 일련의 컨볼루션 및 풀링 작업을 수행합니다. 여기에서 네트워크는 호랑이의 줄무늬, 두 개의 귀, 하나의 이미지가 있는 경우 네 개의 다리를 식별합니다.

섹션 분류

이러한 검색된 기능의 상단에 컨볼루션 레이어가 이 경우 분류기로 작동합니다. 그것들은 이미지의 객체가 알고리즘의 예측과 일치할 가능성을 줄 것입니다.

특징 추출

CNN의 핵심 구성 요소 중 하나는 컨볼루션입니다. 세 번째 함수를 생성하기 위해 두 함수의 수학적 결합을 컨볼루션이라고 합니다. 두 세트의 데이터를 결합합니다. 필터 또는 커널을 사용하여 CNN의 경우 입력 데이터에 대해 컨볼루션을 수행하여 피쳐 맵을 생성합니다. 컨볼루션은 필터를 입력 위로 이동하여 수행됩니다. 각 위치는 행렬 곱셈을 수행하고 출력을 기능 맵에 합산합니다.

각 작업에 대해 다른 필터를 사용하여 입력에 대해 여러 컨볼루션을 수행합니다. 그 결과 다양한 기능 맵이 생성됩니다. 컨볼루션 레이어의 출력은 궁극적으로 이러한 모든 기능 맵을 사용하여 조합됩니다.

다른 모든 신경망과 마찬가지로 우리는 출력을 비선형으로 만들기 위해 활성화 프로세스를 사용합니다. 여기서 활성화 함수는 컨볼루션의 출력을 컨볼루션 신경망으로 보내는 데 사용됩니다.

컨볼루션 신경망의 유형

컨볼루션 레이어:

CNN의 기본 구성 요소는 컨볼루션 레이어입니다. 네트워크에서 계산 부하의 대부분을 수행합니다. 이 계층은 두 행렬 사이에 내적을 만듭니다. 그 중 하나는 학습 가능한 매개변수의 모음인 커널이고 다른 하나는 수용 필드의 제한된 영역입니다. 사진과 비교하면 커널은 공간적으로는 작지만 깊이는 더 깊습니다. 이것은 이미지가 세 개의 채널로 구성된 경우 커널의 너비와 높이가 공간적으로 작음을 나타냅니다. 그러나 깊이는 세 채널 모두로 올라갑니다.

커널은 포워드 패스 동안 그림의 높이와 너비를 가로질러 이동하여 해당 수용 영역의 이미지 표현을 만듭니다. 결과적으로 활성화 맵이라고 하는 이미지의 2차원 표현이 생성되어 이미지의 각 위치에서 커널의 응답을 나타냅니다. stride는 커널의 슬라이딩 가능한 크기의 이름입니다.

풀링 레이어:

이 계층은 데이터를 처리하는 데 필요한 컴퓨팅 성능만 줄입니다. 강조 표시된 매트릭스의 차원을 더 줄여서 수행됩니다. 우리는 이 레이어에서 이웃의 작은 부분에서 지배적인 특징을 추출하려고 시도합니다.

Average-pooling과 Max-pooling은 두 가지 다른 유형의 풀링 전략입니다.

단순히 풀링 영역 내부의 모든 값 중에서 가장 높은 값을 취하는 Max-pooling과 달리 Average-pooling은 pooling 영역 내의 모든 값을 평균화합니다.

이제 레이어를 풀링한 후 이미지의 핵심 요소가 포함된 행렬이 생겼고 이 행렬은 차원이 훨씬 작아 다음 단계에서 매우 유용합니다.

완전 연결 계층:

합성곱 계층의 출력이 제공하는 고수준 특성의 비선형 순열을 학습하는 저렴한 방법은 완전 연결 계층을 추가하는 것입니다. 그 영역에서 완전 연결 계층은 이제 선형이 아닐 수 있는 함수를 학습하고 있습니다.

다단계 퍼셉트론에 적합한 형식으로 변환한 후 입력 이미지를 열 벡터로 병합합니다. 피드포워드 신경망은 평평한 출력을 수신하고 각 훈련 반복에 역전파가 사용됩니다. 이 모델은 여러 시대에 걸쳐 지배적인 특정 하위 수준 기능을 식별하여 Softmax 분류 방법을 사용하여 이미지를 분류할 수 있습니다.

비선형성 레이어:

컨볼루션은 선형 연산이고 이미지는 선형이 아니기 때문에 활성화 맵에 비선형성을 추가하기 위해 비선형성 레이어가 컨볼루션 레이어 바로 뒤에 포함되는 경우가 많습니다.

비선형 연산은 다양한 형태로 제공되며 가장 일반적인 것은 다음과 같습니다.

시그모이드

시그모이드 비선형성에 대한 수학 공식은 () = 1/(1+e )입니다. 실수 값을 0과 1 사이의 범위로 파괴합니다. 활성화가 꼬리에 있을 때 시그모이드의 기울기는 거의 0이 되는데, 이는 매우 불리한 시그모이드 기능입니다. 역전파는 로컬 그라디언트가 너무 작아지면 그라디언트를 효과적으로 종료합니다. 또한 뉴런에 대한 입력이 독점적으로 양수라고 가정합니다. 이 경우 시그모이드 출력은 독점적으로 양수이거나 전적으로 음수이며 가중치에 대한 그래디언트 업데이트의 지그재그 역학으로 이어집니다.

Tanh는 실수 값을 [-1, 1] 범위로 압축합니다. 시그모이드 뉴런과 마찬가지로 활성화는 포화되지만 출력은 0 중심입니다.

릴루

ReLU(Rectified Linear Unit)는 최근 많은 인기를 얻었습니다. 함수 ()=max(0,) 연산을 수행합니다. 다시 말해서 활성화는 임계값이 0일 때만 존재합니다. ReLU는 수렴 속도를 6배 높이고 Sigmoid 및 tanh보다 더 안정적입니다.

불행히도 ReLU는 훈련 중에 부서지기 쉬우며 이는 단점입니다. 강한 기울기는 뉴런이 더 이상 업데이트되지 않도록 하여 업데이트할 수 있습니다. 그러나 적절한 학습률을 선택하여 이 작업을 수행할 수 있습니다.

인기 있는 기계 학습 및 인공 지능 블로그

IoT: 역사, 현재 및 미래 기계 학습 자습서: ML 배우기 알고리즘이란 무엇입니까? 간단하고 쉬운
인도 로봇 공학 엔지니어 급여 : 모든 역할 기계 학습 엔지니어의 하루: 그들은 무엇을 하나요? 사물인터넷(IoT)이란
순열 대 조합: 순열과 조합의 차이점 인공 지능 및 기계 학습의 상위 7가지 트렌드 R을 사용한 기계 학습: 알아야 할 모든 것

UpGrad로 CNN 딥 러닝 가이드 시작하기

LJMU와 협력하여 UpGrad에서 기계 학습 및 인공 지능 과학 석사에 등록하십시오.

인증서 프로그램은 업계 관련 주제를 제공하여 현재 및 장래의 기술 역할에 대해 학생들을 준비시킵니다. 실제 프로젝트, 여러 사례 연구 및 주제 전문가가 제공하는 국제 학자도 프로그램에서 크게 강조됩니다.

가입하면 네트워크 모니터링, 학습 세션 및 360도 학습 지원과 같은 UpGrad의 독점적인 기능을 활용할 수 있습니다.

CNN의 딥러닝 알고리즘은 무엇입니까?

CNN이 작동하는 방식은 이미지를 얻고 이미지의 다양한 항목에 따라 가중치를 할당한 다음 서로 분리하는 것입니다. CNN은 다른 딥 러닝 알고리즘에 비해 데이터의 전처리가 거의 필요하지 않습니다.

CNN과 딥 러닝의 차이점은 무엇입니까?

딥 러닝은 실제보다 더 전문적으로 들리도록 마케팅에서 더 자주 사용됩니다. CNN을 포함하여 다양한 종류의 심층 신경망이 있습니다. CNN은 이미지 식별에서 여러 가지 유리한 용도로 인해 많은 사랑을 받고 있습니다.

CNN이 완전 연결형보다 우수한 이유는 무엇입니까?

컨볼루션에는 조밀한 연결이 없으며 모든 입력 노드가 모든 출력 노드에 영향을 미치는 것은 아닙니다. 덕분에 컨볼루션 레이어는 이제 더 유연하게 학습할 수 있습니다. 또한 레이어당 가중치가 더 적기 때문에 이미지 데이터와 같은 고차원 입력에 이점이 있습니다.

CNN은 사진에만 사용됩니까?

예. 모든 2D 및 3D 데이터 배열은 CNN을 사용하여 처리할 수 있습니다.