이진 로지스틱 회귀: 개요, 기능 및 가정

게시 됨: 2021-10-05

머신 러닝에 대해 가장 많이 받아들여지는 정의 중 하나는 다음과 같습니다.

"컴퓨터 프로그램은 P로 측정되는 T의 작업 성능이 경험 E와 함께 향상되는 경우 작업 T 및 성능 측정 P의 일부 클래스와 관련하여 경험 E로부터 학습한다고 합니다."

이제 동일한 클래스의 작업에서 시간이 지남에 따라 기계의 성능을 개선하기 위해 다양한 알고리즘을 사용하여 기계의 출력을 최적화하고 원하는 결과에 더 가깝게 만듭니다. 회귀 분석은 기계의 성능을 향상시키기 위해 가장 기본적이고 가장 많이 사용되는 기술 중 하나입니다.

하나 이상의 예측 변수 값을 기반으로 연속 출력 변수를 예측하는 일련의 기계 학습 기술로 구성됩니다. 회귀 분석은 연속 변수를 예측 변수의 함수로 정의할 수 있는 수학 방정식을 개발하는 것을 목표로 합니다.

이전 기사 중 하나에서 로지스틱 회귀와 Python에서 로지스틱 회귀를 구현하는 방법을 살펴보았습니다. 우리는 또한 기계 학습에서 세 가지 다른 종류의 로지스틱 회귀에 대해 간략하게 이야기했습니다. 이 기사에서는 개요, 기능 및 가정과 함께 이진 로지스틱 회귀에 대해 약간 자세히 살펴보겠습니다.

이진 로지스틱 회귀 분석 개요

이항 또는 이항 로지스틱 회귀는 종속 변수에 대해 관찰된 결과가 이진으로만 있을 수 있는 시나리오를 처리하는 로지스틱 회귀의 유형으로 이해될 수 있습니다. 즉, 두 가지 가능한 유형만 가질 수 있습니다. 이 두 가지 유형의 클래스는 0 또는 1, 합격 또는 불합격, 사망 또는 생존, 승 또는 패 등이 될 수 있습니다.

다항 로지스틱 회귀 분석은 결과가 특정 순서가 아닌 두 가지 이상의 가능한 유형(질병 A 대 질병 B 및 질병 C)을 가질 수 있는 시나리오에서 작동합니다. 로지스틱 회귀의 또 다른 유형은 순서가 있는 방식으로 종속 변수를 처리하는 순서 로지스틱 회귀입니다.

이진 로지스틱 회귀 분석에서 가능한 출력은 일반적으로 0 또는 1로 정의됩니다. 그 결과 회귀 모델을 가장 직관적으로 해석하고 이해할 수 있기 때문입니다. 종속변수에 대한 특정 결과가 성공 또는 주목할 만한 결과이면 0으로 코딩하고, 실패하거나 실패하면 0으로 코딩합니다.

간단히 말해서 이진 로지스틱 회귀를 사용하여 예측 변수 또는 독립 변수의 값을 기반으로 케이스가 될 확률을 신중하고 정확하게 예측할 수 있습니다.

이진 로지스틱 회귀 분석의 기능 - 답변할 수 있는 질문 유형

위에서 언급했듯이 이진 로지스틱 회귀는 출력이 두 클래스 또는 그룹 중 하나에 속할 수 있는 시나리오에 이상적으로 적합합니다. 결과적으로 이진 로지스틱 회귀는 다음과 같은 성격의 질문에 답하는 데 가장 적합합니다.

KG가 추가될 때마다 암에 걸릴 확률이 달라지나요? 과체중인가요?
하루에 피우는 담배 한 갑마다 해당 확률이 달라지나요?
체중, 지방 섭취, 칼로리 섭취, 나이가 심장마비 발병 확률에 영향을 줍니까?

보시다시피 위의 세 가지 질문 모두에 대한 대답은 예 또는 아니오, 0 또는 1일 수 있습니다. 따라서 이진 로지스틱 회귀를 사용하여 이러한 질문에 정확하게 답할 수 있습니다.

이진 로지스틱 회귀의 주요 가정

다른 기계 학습 알고리즘과 마찬가지로 이진 로지스틱 회귀도 몇 가지 가정에서 작동합니다. 다음은 다음과 같습니다.

종속 변수는 이분법적입니다. 즉, 존재하거나 부재하지만 결코 동시에 두 가지가 아닙니다.
데이터에 이상치가 없어야 합니다.
서로 다른 예측 변수 간에 높은 상관 관계나 다중 공선성이 없어야 합니다. 이것은 서로 다른 예측 변수 간의 상관 행렬을 사용하여 평가할 수 있습니다.

결론적으로

이진 로지스틱 회귀는 많은 기계 학습 사용 사례에서 도움이 됩니다. 대출 불이행자를 파악하는 것부터 기업이 고객을 유지하도록 지원하는 것까지 - 이진 로지스틱 회귀 분석은 더 복잡한 비즈니스 문제를 해결하기 위해 확장될 수 있습니다. 그러나 이것은 기계 학습 알고리즘 기술의 바다 중 하나일 뿐입니다. 회귀 분석을 마스터하면 더 복잡하고 미묘한 주제를 다룰 수 있습니다.

그러나 여전히 회귀 분석을 이해하고 기계 학습 여정을 시작하는 데 어려움을 겪고 있다면 기계 학습 과정 목록을 추천합니다 . upGrad에는 전 세계적으로 40,000명 이상의 유료 학습자가 있는 85개 이상의 국가에 학습자 기반이 있으며 우리 프로그램은 500,000명 이상의 실무 전문가에게 영향을 미쳤습니다.

리버풀 존 무어스 대학교(Liverpool John Moores University)와 공동으로 제공 하는 기계 학습 및 인공 지능 과학 석사는 학습자가 처음부터 시작하여 실제 프로젝트에서 작업하기에 충분한 학습을 습득할 수 있도록 설계되었습니다. 우리의 360도 직업 지원은 당신이 업계 최고의 역할을 맡을 수 있도록 완벽하게 준비되도록 보장합니다. 그러니 지금 저희에게 연락하여 동료 학습 및 글로벌 네트워킹의 힘을 경험하십시오!

베이지안 통계 모델은 무엇에 사용됩니까?

베이지안 통계 모델은 수학적 절차를 기반으로 하며 통계 문제를 해결하기 위해 확률 개념을 사용합니다. 사람들이 새로운 데이터에 의존하고 모델 매개변수를 기반으로 예측할 수 있는 증거를 제공합니다.

베이지안 추론이란 무엇입니까?

베이즈 정리를 사용하여 가설에 대한 확률을 업데이트하기 위해 새로운 데이터와 정보에 의존하는 통계에서 유용한 기술입니다.

베이지안 모델은 고유합니까?

베이지안 모델은 관찰 여부에 관계없이 통계 모델의 모든 매개변수에 공동 확률 분포가 할당된다는 점에서 고유합니다.