푸아송 분포 및 푸아송 과정 설명 [예제 포함]

게시 됨: 2021-01-08

포아송 분포는 비즈니스 및 무역 시장에서 널리 사용되는 확률 이론 및 통계의 주제입니다. 시간 프레임 내에서 주어진 평균 발생률의 변동량을 예측하는 데 사용됩니다. 이에 대해서는 다음 섹션에서 자세히 설명합니다.

목차

포아송 프로세스

푸아송 프로세스는 이벤트의 평균을 알고 있지만 이벤트가 무작위로 발생할 때 발생하는 일련의 이산 이벤트를 모델링하는 데 널리 사용되는 확률론적 프로세스입니다. 이벤트는 무작위로 발생하기 때문에 차례로 발생할 수도 있고 두 이벤트 사이에 오랜 시간이 걸릴 수도 있습니다.

이벤트의 평균 시간은 일정합니다. 예를 들어, 특정 도시에서 지진이 1년에 평균 4번 발생하는 것으로 알려진 경우; 이것은 1년에 4일 연속으로 4개의 지진이 발생할 수 있음을 의미하거나 두 지진 사이의 시간이 7개월이 될 수 있음을 의미할 수 있습니다.

이것이 푸아송 과정이며 각 사건의 확률을 계산할 수 있습니다.

푸아송 프로세스가 다음 기준을 충족하는 것이 중요합니다.

  • 이벤트는 서로 독립적이어야 합니다. 따라서 한 사건의 발생은 다른 사건이 발생할 확률에 영향을 미치지 않아야 합니다.
  • 이벤트의 평균 비율, 즉 기간당 이벤트는 일정합니다.
  • 두 개의 이벤트가 동시에 발생해서는 안됩니다.

읽기: 확률 분포

포아송 분포

프랑스 수학자 Simeon Denis Poisson의 이름을 따서 명명된 Poisson 분포는 이벤트의 평균 비율이 알려진 경우 특정 이벤트가 발생할 확률을 예측하는 데 사용되는 이산 확률 분포입니다. 위의 예에서 포아송 분포는 연중 주어진 시간에 지진이 발생할 확률을 예측하는 데 사용할 수 있습니다.

또한 면적, 부피 또는 거리와 같은 다양한 기타 지정된 간격에서 이벤트 발생을 예측하는 데 사용할 수도 있습니다.

포아송 분포 확률 질량 함수는 주어진 기간의 길이와 시간당 평균 사건이 주어진 경우 해당 기간에 k개의 사건을 관찰할 확률을 제공합니다. 공식은 다음과 같습니다.

P(구간 내 k 이벤트) = e-λ * λk/k!

여기서 λ, 람다는 비율 매개변수이고, k는 해당 기간 동안 이벤트가 발생한 횟수, e는 오일러 수, k! k의 계승입니다.

간단한 예를 사용하여 확률을 계산하는 방법을 볼 수 있습니다. 도시를 강타하는 평균 지진 횟수가 1년에 2번이라면 내년에 3번의 지진이 도시를 강타할 확률을 계산해 봅시다.

여기서 k는 3, λ는 2, e는 오일러수, 즉 2.71828이다. 위의 방정식에 이 값을 대입하면 P는 0.180과 같습니다. 즉, 확률은 18%입니다. 내년에 3번의 지진이 발생할 확률은 18%라는 결론을 내릴 수 있습니다.

포아송 분포의 속성

  • 푸아송 분포 확률 변수의 평균은 λ입니다. 이것은 또한 예상 값입니다.
  • 푸아송 분포 확률 변수의 분산도 평균 λ와 동일합니다.
  • 포아송 분포 의 시행 횟수는 매우 클 수 있습니다. 따라서 무한에 가까울 수 있습니다.
  • 각 시도에서 일정한 성공 확률은 최소입니다. 따라서 0에 가깝습니다.
  • 푸아송 분포 는 하나의 매개변수 λ로 특징지어지기 때문에 단모수 분포라고도 합니다.
  • 이항 분포와 유사하게 포아송 분포 는 비율 매개변수 λ에 따라 단봉 또는 이봉이 될 수 있습니다. 정수가 아니면 분포가 단봉이 되고 정수이면 양봉이 됩니다.

포아송 분포의 예

이벤트의 확률을 예측하는 데 푸아송 분포를 사용할 수 있는 섹터가 많이 있습니다. 그것은 많은 과학 분야에서 사용되며 비즈니스 분야에서도 인기가 있습니다. 몇 가지 예가 아래에 나와 있습니다.

1. 1년 동안 필요한 제품의 양을 확인합니다. 비즈니스/슈퍼마켓/상점이 고객이 1년 동안 사용한 제품의 평균 양을 알고 있는 경우 푸아송 분포 모델을 사용하여 제품이 더 많이 팔리는 달을 예측할 수 있습니다. 이렇게 하면 필요한 양의 제품을 저장하고 손실을 방지할 수 있습니다.

2. 고객 서비스 직원을 확인합니다. 회사에서 처리하는 데 15분 이상이 필요한 하루 평균 통화 수를 계산할 수 있는 경우 모델을 사용하여 15분 이상이 필요한 시간당 최대 통화 수를 예측할 수 있습니다. 이를 계산하여 더 많은 직원이 필요한지 평가할 수 있습니다.

3. 홍수, 폭풍 및 기타 자연 재해가 발생할 확률을 예측하는 데 사용할 수 있습니다. 이러한 재해의 연간 평균 횟수를 알면 가능합니다. 이러한 예측과 다른 기술 적용을 통해 많은 국가 또는 지역에서 인적 및 재산 손실을 피할 수 있습니다.

4. 금융 부문에서도 사용할 수 있지만 항상 정확하지는 않습니다. 이는 특정 시간에 주식 시장이 어떻게 상승하거나 하락할 확률을 추정하는 데 도움이 될 수 있습니다.

5. 푸아송 분포 모델은 물리학, 생물학, 천문학 등에서 운석이 지구의 대기에 진입하여 세계의 특정 지역에서 보일 확률을 예측하는 데에도 사용할 수 있습니다.

결론

통계에서 인기 있는 주제인 푸아송 분포는 이 기사의 여러 섹션을 통해 자세히 설명되었습니다. 통계와 확률에 대한 학습에 관심이 있는 학생과 전문가가 이해해야 하는 중요한 주제입니다.

이 모델은 실생활과 물리학, 생물학, 천문학, 비즈니스, 금융 등과 같은 다양한 주제에서 예제에서 언급한 것과 같이 이벤트가 발생할 확률을 추정하는 데 사용할 수 있습니다. 통계, 데이터 과학, 기계 학습 등의 유사한 주제는 upGrad에서 찾을 수 있으며 학습을 확장하고 이러한 개념을 다양한 문제에 적용하는 데 도움이 됩니다.

기계 학습에 대해 자세히 알아보려면 IIIT-B 및 upGrad의 기계 학습 및 AI PG 디플로마를 확인하세요. 이 PG 디플로마는 일하는 전문가를 위해 설계되었으며 450시간 이상의 엄격한 교육, 30개 이상의 사례 연구 및 과제, IIIT- B 동문 자격, 5개 이상의 실용적인 실습 캡스톤 프로젝트 및 최고의 기업과의 취업 지원.

푸아송 과정은 푸아송 분포와 어떻게 다릅니까?

푸아송 프로세스는 발생 사이의 평균 시간은 알려져 있지만 정확한 타이밍은 알 수 없는 일련의 이산 이벤트에 대한 모델입니다. 반면에 포아송 분포는 주어진 기간에 포아송 프로세스가 발생하는 이벤트의 가능성을 설명하는 이산 확률 분포입니다. 푸아송 과정을 논의할 때 시간의 순서로 발생하는 요소가 있지만 푸아송 분포에서 확률 변수와 그 분포를 논의할 때 그런 요소가 없으며 관련 분포가 있는 확률 변수만 있습니다.

푸아송 회귀 모델은 무엇을 의미합니까?

푸아송 회귀 모델은 일반화된 선형 모델의 한 예일 뿐입니다. 푸아송 회귀 모델은 개수 데이터 및 분할표를 모델링하는 데 사용됩니다. 개수 모델의 경우 유용한 다양한 푸아송 회귀 조정이 있습니다. 하나 이상의 독립 요인이 주어지면 푸아송 회귀가 카운트 데이터로 구성된 종속 변수를 예측하는 데 사용됩니다. 우리가 예측하고자 하는 변수를 종속변수라고 합니다.

푸아송 분포는 이항 분포와 어떻게 다릅니까?

두 분포 모두 확률의 우산 아래에 있습니다. 이항 분포는 주어진 데이터 세트에서 특정 횟수의 시행을 반복할 확률을 나타냅니다. 반면에 푸아송 분포는 무한 표본의 이진 데이터 분포를 설명하고 특정 기간 동안 무작위로 발생하는 독립 이벤트의 수를 지정합니다.