Руководство для начинающих по байесовскому выводу: полное руководство
Опубликовано: 2021-11-26Растет число приложений машинного обучения, которые широко применяются в исследованиях, социальных сетях, рекламе и т. д. Однако приложения в основном связаны с прогнозированием, которое включает в себя огромное количество данных. Статистические данные часто используются для количественной оценки измерения значений неопределенности. Если у нас есть разные события, то три подхода могут определить вероятность события.
Вот эти три метода:
- Классический
- байесовский
- частост
Давайте рассмотрим пример бросания игральной кости, чтобы найти вероятность того, выпадет ли на ней цифра «четыре». Это поможет в понимании трех типов методов определения вероятности. Предположим, вы рассматриваете классический метод оценки вероятности. В этом случае будет считаться, что всего будет шесть исходов, и вероятность возникновения любого исхода будет одинаковой. В таком предположении вероятность того, что будет четыре исхода, будет равна 1/6. Классический метод обычно хорошо работает, когда исходы имеют равновероятные результаты. Но когда результаты становятся более субъективными, этот метод использовать нельзя.
Если рассматривать метод Frequentist, то требуется, чтобы существовала бесконечная последовательность событий, являющихся гипотетическими. Затем требуется поиск соответствующей частоты в бесконечной гипотетической последовательности. Рассматривая приведенный выше пример с игральными костями, если кости бросают бесконечное число раз, результат, то есть 1/6, мы можем получить результат как четыре. Следовательно, вероятность того, что в шестигранной кости выпадет четыре, будет равна 1/6 согласно определению частотного метода.
Переходя к байесовскому подходу, он дает вам некоторые преимущества. С точки зрения этого метода вы можете включить личное убеждение в процесс принятия решений. Это означает, что он будет учитывать такие вещи, как известная информация о проблеме. В этом подходе также учитывается тот факт, что разные люди могут иметь разные убеждения. Например, предположим, что если кто-то упоминает, что вероятность дождя завтра будет 90 %, то для другого человека вероятность дождя может составлять 60 %. Поэтому метод байесовского подхода субъективен. Однако результаты более интуитивны по сравнению с методом Frequentist.
Оглавление
Байесовский вывод
Байесовский вывод используется в основном для задачи статистического вывода. В этих случаях всегда имеется неизвестная величина (данные), которую необходимо оценить. И затем, исходя из данных, нужно оценить желаемую сумму. Неизвестная величина обозначается как θ. Существует предположение, что θ является случайной величиной, и есть некоторые начальные предположения о значениях θ. Этот тип распределения называется предварительным распределением. Обновление значения обычно выполняется с помощью правила Байеса. Поэтому этот подход называется байесовским.
Теорема Байеса
Применение байесовского вывода зависит от понимания теоремы Байеса.
Учтите, что есть два набора результатов, такие как набор A и набор B. Эти наборы также называются событиями. Обозначим вероятность события А как P(A), а вероятности события B как P(B). Это были вероятности событий по отдельности. Однако совместная вероятность может быть определена через термин P (A, B). Условные вероятности можно разложить следующим образом:
Р(А,В) = Р(А|В)Р(В),
Это означает, что, хотя B задано, условная вероятность A и B дает совместную вероятность двух событий.
Р(А,В) = Р(В|А)Р(А)
В обоих приведенных выше уравнениях левые части уравнений одинаковы, поэтому правые части уравнений должны быть равны.
Р(А|В)Р(В) = Р(В|А)Р(А)
Р(А|В) = Р(В|А)Р(А)/Р(В)
Это уравнение известно как теорема Байеса.
В области науки о данных теорему Байеса можно записать так:
P(гипотеза|данные) = P(данные|гипотеза) P(гипотеза)/p(данные)
Знаменатель, который является свидетельством, гарантирует, что апостериорное распределение в левой части уравнения является действительной плотностью вероятности. Это также называется нормализующей константой.
В уравнении теоремы Байеса есть три компонента.
- Прежний
- Вероятность
- Задний
Предварительное распространение
Одним из ключевых факторов в методе байесовского вывода является априорное распределение. Благодаря этому вы можете включить личные убеждения в процесс принятия решений. Кроме того, вы можете включить в исследование суждения, основанные на мнениях разных людей. Это делается с помощью математического выражения. Неизвестный параметр, представленный θ, используется для выражения убеждения. Для выражения этих убеждений используется функция распределения, которая является априорным распределением. Поэтому перед запуском любого эксперимента выбирается распределение.
Руководство для начинающих по байесовскому выводу
1. Выбор приора
Кумулятивное распределение обычно определяется для параметра θ. Те события со значением априорной вероятности, равным нулю, будут иметь значение апостериорной вероятности, равное нулю. А для тех событий, которые имеют значение априорной вероятности, значение апостериорной вероятности будет равно единице. Следовательно, хорошая структура байесовского подхода не будет определять точечные оценки тех событий, которые уже произошли, или отсутствует информация о его возникновении. Существуют определенные приемы выбора априора. Один из методов, который широко используется для выбора априора, заключается в использовании функций распределения. Используется семейство всех функций. Эти функции должны быть гибкими и должны отражать убеждения людей.
2. Вероятность
Рассмотрим θ как неизвестный параметр, подлежащий оценке. Честность монеты можно выразить через θ, рассматривая пример байесовского вывода . Монета подбрасывается бесконечно, чтобы проверить ее честность. Таким образом, каждый раз при переворачивании будет либо голова, либо хвост. Событиям присваиваются значения 0 и 1. Это также называется испытанием Бернулли. Все исходы считаются независимыми. Это можно выразить с помощью уравнения, определяющего понятие вероятности. Вероятность — это функция плотности, которая является функцией θ. Для максимизации правдоподобия значение θ должно давать наибольшее значение правдоподобия. Метод оценки также известен как оценка максимального правдоподобия.
3. Апостериорное распределение
Результат теоремы Байеса известен как апостериорное распределение. Это обновленная вероятность любого события, которое происходит после рассмотрения новой информации.
4. Байесовский механизм вывода
Как мы видели выше, метод байесовского вывода трактует понятие вероятности как некоторую степень уверенности. Эти убеждения связаны с тем, что событие может произойти при таких доказательствах. Поэтому параметр тета «θ» считается случайной величиной.
5. Применение байесовского вывода в финансовых рисках
Существует множество алгоритмов, к которым можно применить байесовский вывод. Некоторыми из алгоритмов являются нейронные сети, случайный лес, регрессия и т. д. Метод также нашел популярность в финансовой сфере. Его можно использовать для моделирования операционных рисков нескольких банков. Данные банков, которые показывают потери операций, показывают некоторые события, которые были потеряны. Эти потерянные события имели низкую частоту, но имели высокую серьезность. Поэтому в таких случаях байесовский вывод оказывается весьма полезным. Это связано с тем, что в этом методе также не требуется много данных для анализа.
Другие методы статистического анализа, такие как частотные методы, также применялись ранее для моделирования операционных рисков. Но возникла проблема с оценкой параметра неопределенности. Поэтому байесовский вывод считается наиболее эффективным методом. Это связано с тем, что мнения экспертов и данные могут быть использованы для получения апостериорных распределений. В этом типе задачи данные о внутренних потерях банков разбиваются на несколько более мелких фрагментов, а затем с помощью экспертной оценки оценивается частота каждого из фрагментов. Затем это вписывается в распределения вероятности.
Присоединяйтесь к онлайн- курсу по машинному обучению в ведущих университетах мира — магистерским программам, программам последипломного образования для руководителей и программам повышения квалификации в области машинного обучения и искусственного интеллекта, чтобы ускорить свою карьеру.
Заключение
В статистике и машинном обучении можно применять два основных подхода — методы частотного анализа и байесовского вывода. В статье мы обсуждали метод байесовского вывода, где вероятности рассчитываются как субъективные убеждения. Наряду с данными при оценке вероятностей также учитываются личные убеждения людей. Это делает модель гораздо более широко используемой во многих оценочных исследованиях. Таким образом, методы байесовского вывода определяют методы или способы применения ваших убеждений к наблюдению за данными. Более того, во многих типах приложений с большим количеством зашумленных данных можно использовать метод байесовского вывода. Следовательно, сила, заключенная в правиле Байеса, может относиться к величине, которую можно вычислить, к той, которую можно использовать для ответа на вопросы произвольного характера.