Объяснение распределения Пуассона и процесса Пуассона [с примерами]

Опубликовано: 2021-01-08

Распределение Пуассона - это тема теории вероятностей и статистики, широко используемая предприятиями и на торговом рынке. Он используется для прогнозирования количества отклонений от заданной средней частоты возникновения в течение определенного периода времени. Это подробно объясняется в следующих разделах.

Оглавление

Пуассоновский процесс

Процесс Пуассона — это широко используемый стохастический процесс для моделирования серии дискретных событий, которые происходят, когда известно среднее значение событий, но события происходят случайным образом. Поскольку события происходят случайным образом, они могут происходить одно за другим или между двумя событиями может пройти много времени.

Среднее время событий только постоянно. Так, например, если известно, что в том или ином городе землетрясение происходит в среднем четыре раза в год; это может означать, что четыре землетрясения могут произойти четыре дня подряд в течение одного года, или время между двумя землетрясениями может составлять семь месяцев.

Это процесс Пуассона, и вероятность каждого события можно рассчитать.

Важно, чтобы пуассоновский процесс удовлетворял следующим критериям:

  • События должны быть независимы друг от друга. Таким образом, возникновение одного события не должно влиять на вероятность возникновения другого события.
  • Средняя частота событий, т. е. количество событий за период времени, постоянна.
  • Два события не должны происходить одновременно.

Читайте: Распределение вероятностей

Распределение Пуассона

Распределение Пуассона, названное в честь французского математика Симеона Дени Пуассона, представляет собой дискретное распределение вероятностей, используемое для прогнозирования вероятности конкретных событий, когда известна средняя скорость события. В приведенном выше примере распределение Пуассона можно использовать для прогнозирования вероятности землетрясения, происходящего в данное время года.

Его также можно использовать для прогнозирования возникновения события в различных других заданных интервалах, таких как площадь, объем или расстояние.

Функция массы вероятности распределения Пуассона обеспечивает вероятность наблюдения k событий за период времени, когда заданы заданная длина периода и среднее количество событий за время. Формула выглядит следующим образом:

P (k событий в интервале) = e-λ * λk/k!

Здесь λ, лямбда, — параметр скорости, k — количество раз, когда событие происходит за период времени, e — число Эйлера, а k! является факториалом k.

На простом примере мы можем увидеть, как можно рассчитать вероятность. Если среднее количество землетрясений, поражающих город, равно 2 в год, рассчитаем вероятность того, что в следующем году в городе произойдет 3 землетрясения.

Здесь k равно 3, λ равно 2, а e — число Эйлера, т. е. 2,71828. Подставляя эти значения в приведенное выше уравнение, мы получаем P, равное 0,180. Это означает, что вероятность составляет 18%. Можно сделать вывод, что вероятность того, что в следующем году город поразит 3 землетрясения, составляет 18%.

Свойства распределения Пуассона

  • Среднее значение случайной величины с распределением Пуассона равно λ. Это также ожидаемое значение.
  • Дисперсия случайной величины с распределением Пуассона также совпадает со средним значением λ.
  • Количество испытаний в распределении Пуассона может быть очень большим. Таким образом, он может быть близок к бесконечности.
  • Постоянная вероятность успеха в каждом испытании минимальна. Таким образом, он близок к нулю.
  • Поскольку распределение Пуассона характеризуется только одним параметром λ, оно также известно как однопараметрическое распределение.
  • Подобно биномиальному распределению, распределение Пуассона может быть унимодальным или бимодальным, в зависимости от параметра скорости λ. Если оно нецелое, то распределение будет унимодальным, а если целое, то бимодальным.

Примеры распределения Пуассона

Есть много секторов, где распределение Пуассона можно использовать для прогнозирования вероятностей события. Он используется во многих научных областях, а также популярен в бизнес-секторе. Несколько примеров приведены ниже.

1. Проверка количества продукта, необходимого в течение года. Если предприятию/супермаркету/магазину известно среднее количество продуктов, потребляемых их клиентами за год, они могут использовать модель распределения Пуассона, чтобы предсказать, в каком месяце продукт продается больше. Это может помочь им сохранить необходимое количество продукта и предотвратить их потери.

2. Проверка штатного расписания службы поддержки клиентов. Если фирма может рассчитать среднее количество звонков в день, на обработку которых требуется более пятнадцати минут, она может использовать модель для прогнозирования максимального количества звонков в час, на обработку которых требуется более пятнадцати минут. Рассчитав это, они могут оценить, нужно ли им больше персонала.

3. Его можно использовать для прогнозирования вероятности возникновения наводнений, штормов и других стихийных бедствий. Это возможно, если известно среднее количество таких бедствий в год. С помощью этих прогнозов, наряду с другими технологическими приложениями, можно избежать человеческих и материальных потерь для многих стран или регионов.

4. Его также можно использовать в финансовых секторах, но они не обязательно всегда точны. Это может помочь в оценке вероятности того, как фондовые рынки будут расти или падать в определенное время.

5. Модель распределения Пуассона также может быть использована в физике, биологии, астрономии и т. д. для прогнозирования вероятности попадания метеоритов в атмосферу Земли и их видимости в определенных регионах мира.

Заключение

Распределение Пуассона, популярная тема в статистике, было подробно объяснено в различных разделах этой статьи. Это важная тема для понимания студентами и специалистами, интересующимися статистикой и вероятностью.

Модель можно использовать в реальной жизни и в различных предметах, таких как физика, биология, астрономия, бизнес, финансы и т. д., для оценки вероятности наступления события, как указано в примерах. Похожие темы по статистике, науке о данных, машинному обучению и т. д. можно найти на upGrad, что поможет расширить знания и применить эти концепции к различным проблемам.

Если вам интересно узнать больше о машинном обучении, ознакомьтесь с дипломом PG IIIT-B и upGrad в области машинного обучения и искусственного интеллекта, который предназначен для работающих профессионалов и предлагает более 450 часов тщательного обучения, более 30 тематических исследований и заданий, IIIT- Статус B Alumni, более 5 практических практических проектов и помощь в трудоустройстве в ведущих фирмах.

Чем процесс Пуассона отличается от распределения Пуассона?

Процесс Пуассона — это модель серии дискретных событий, в которой среднее время между событиями известно, но точное время неизвестно. Распределение Пуассона, с другой стороны, представляет собой дискретное распределение вероятностей, которое описывает вероятность событий, имеющих процесс Пуассона, происходящих в данный период времени. При обсуждении пуассоновского процесса присутствует элемент вхождений как последовательность во времени, но при обсуждении случайных величин и их распределения в пуассоновском распределении такого элемента нет, и мы имеем просто случайную величину с ассоциированным с ней распределением.

Что понимают под регрессионной моделью Пуассона?

Модель регрессии Пуассона — это всего лишь пример обобщенной линейной модели. Модель регрессии Пуассона используется для моделирования данных подсчета и таблиц непредвиденных обстоятельств. В случае моделей подсчета полезны различные корректировки регрессии Пуассона. При наличии одного или нескольких независимых факторов регрессия Пуассона используется для прогнозирования зависимой переменной, состоящей из данных подсчета. Переменная, которую мы стремимся предсказать, известна как зависимая переменная.

Чем распределение Пуассона отличается от биномиального распределения?

Оба распределения подпадают под определение вероятности. Биномиальное распределение относится к вероятности повторения определенного количества испытаний в заданном наборе данных. Распределение Пуассона, с другой стороны, объясняет распределение двоичных данных из бесконечной выборки и указывает количество независимых событий, которые происходят случайным образом в течение определенного периода времени.