Prawdopodobieństwo warunkowe wyjaśnione w rzeczywistych aplikacjach
Opublikowany: 2021-09-28Spis treści
Co to jest prawdopodobieństwo warunkowe?
Prawdopodobieństwo warunkowe w teorii prawdopodobieństwa jest definiowane jako miara prawdopodobieństwa wystąpienia zdarzenia, przy założeniu, że wcześniej miało miejsce inne zdarzenie lub skutek. Wyraża się jako pomnożenie prawdopodobieństwa poprzednio zaistniałego zdarzenia przez prawdopodobieństwo zdarzenia warunkowego, które nastąpiło kolejno.
Tak więc, jeśli mamy zdarzenia A i B, gdzie P(B)>0, obliczamy prawdopodobieństwo warunkowe A, gdy B już wystąpiło, P(A | B) jako
P(A | B)=P(A∩B)P(B)
- | jest używany do oznaczenia „podany” w „przypadkach, w których ma miejsce inne zdarzenie”
- ∩ jest używany do oznaczenia przecięcia
Przy obliczaniu prawdopodobieństwa warunkowego zakłada się, że jesteśmy świadomi wyniku zdarzenia B. Jest to szczególnie przydatne, ponieważ informacja o wyniku eksperymentu jest często nieznana.
Zrozummy to na przykładzie:
- Mamy wydarzenie A, w którym zakładamy, że osoba, która zgłosiła się na uniwersytet, zostanie przyjęta. Prawdopodobieństwo ich akceptacji wynosi 70%.
- Mamy kolejne wydarzenie B, w którym istnieje 50% szans, że zaakceptowani studenci otrzymają zakwaterowanie w akademikach.
Stąd obliczamy prawdopodobieństwo warunkowe jako,
Prawdopodobieństwo (przyjęci studenci i przydzieleni studenci) = P (przydzieleni studenci | przyjęci studenci) × P (przyjęci studenci)
= (0,50)*(0,70) = 0,35
Z prawdopodobieństwem warunkowym przyglądamy się obu wydarzeniom A i B, ich wzajemnym relacjom, w których student jest zarówno przyjmowany na uniwersytet, jak i otrzymuje zakwaterowanie w akademiku.
Z kolei prawdopodobieństwo bezwarunkowe definiuje się jako miarę prawdopodobieństwa wystąpienia zdarzenia niezależnie od tego, czy jest poprzedzone innym zdarzeniem, czy też ma inne warunki.
Rzeczywiste zastosowania prawdopodobieństwa warunkowego
Prawdopodobieństwo warunkowe znajduje szerokie zastosowanie w różnych dziedzinach, takich jak ubezpieczenia i rachunek różniczkowy. Ma to również zastosowanie w polityce. Załóżmy, że spodziewany jest ponowny wybór prezydenta. Wyniki będą zależeć od preferencji uprawnionych do głosowania oraz prawdopodobieństwa wyniku telewizyjnych kampanii reklamowych.
W innym przykładzie załóżmy, że prawdopodobieństwo deszczu w Twojej okolicy wynosi 40%, zgodnie z warunkami pogodowymi. Jednak ten wynik jest w dużej mierze zależny od:
- Czy w Twojej okolicy tworzą się chmury?
- Czy istnieje możliwość pojawienia się zimnego frontu w Twojej okolicy?
- Czy chmury są odpychane przez inny front
Prawdopodobieństwo warunkowe będzie zależeć od każdego z powyższych zdarzeń.
Twierdzenie Bayesa
Wprowadzone przez matematyka Thomasa Bayesa twierdzenie Bayesa lub reguła Bayesa lub prawo Bayesa to równanie matematyczne, które pomaga obliczyć prawdopodobieństwo warunkowe. Korzystając z twierdzenia Bayesa, możemy zrewidować (zaktualizować) istniejące miary prawdopodobieństwa, gdy pojawią się nowe dowody lub dodatkowe informacje.
Twierdzenie Bayesa znajduje zastosowanie w finansach, gdzie księgowi używają go do określenia ryzyka pożyczenia pieniędzy pożyczkobiorcy. Oprócz tego jest również przydatny w statystyce i logice indukcyjnej.
Statystyka bayesowska opiera się na twierdzeniu Bayesa, w którym możliwe jest przewidywanie zdarzeń na podstawie nowych dowodów, co prowadzi do bardziej dynamicznych i dokładnych szacunków.
Dołącz do kursu uczenia maszynowego online z najlepszych uniwersytetów na świecie — studiów magisterskich, programów podyplomowych dla kadry kierowniczej i zaawansowanego programu certyfikacji w zakresie uczenia maszynowego i sztucznej inteligencji, aby przyspieszyć swoją karierę.
Przykład prawdopodobieństwa warunkowego w Pythonie
W tym przykładzie użyjemy prawdopodobieństwa warunkowego do określenia prawdopodobieństwa uzyskania przez ucznia oceny A (80%+) z fizyki, pod warunkiem, że pominie minimum 10 zajęć.
Na początek sprawdź zestaw danych pobrany z kaggle :
importuj pandy jako PD
df = pd.read_csv('zużycie-alkoholu-studenta/mata-studenta.csv')
df.głowa(3)
Przejrzyj liczbę rekordów:
df(df)
#=> 395
Pod uwagę weźmiemy tylko następujące kolumny: liczbę nieobecności i oceny końcowe.
Teraz utwórz nową kolumnę logiczną grade_A, aby pokazać, czy końcowy wynik ucznia wynosi 80% lub więcej.
Pomnóż przez 5:
df['klasa_A'] = np. gdzie (df['G3']*5 >= 80, 1, 0)
Utwórz nową kolumnę logiczną high_absenses o wartości 1, oznaczającą uczniów, którzy opuścili co najmniej 10 zajęć.
df['high_absenses'] = np.where(df['absences']>= 10, 1, 0)
Utwórz kolejną kolumnę, abyśmy mogli łatwo zbudować tabelę przestawną:
df['liczba'] = 1
Usuń wszystkie pozostałe kolumny:
df = df[['ocena_A','duża_brak','liczba']]
df.głowa()
Tworzenie tabeli przestawnej:
pd.tabela_przestawna(
df,
wartości='liczba',
index=['ocena_A'],
kolumny=['high_absenses'],
aggfunc=np.rozmiar,
fill_value=0
)
Teraz możemy przejść do naszych obliczeń:
- P(A) oznacza prawdopodobieństwo uzyskania przez ucznia oceny A (80% lub więcej).
- P(B) to prawdopodobieństwo, że uczeń opuścił co najmniej 10 zajęć.
- P(A|B) to prawdopodobieństwo, że uczeń uzyskał ocenę 80%+, biorąc pod uwagę, że opuścił co najmniej 10 zajęć.
P(A) = (35 + 5) / (35 + 5 + 277 + 78) = 0,10126…
P(B) = (78 + 5) / (35 + 5 + 277 + 78) = 0,21012…
P(A ∩ B) = 5 / (35 + 5 + 277 + 78) = 0,0126582…
P(A|B) = P(A ∩ B) / P(B) = 0,06
Zgodnie z naszymi obliczeniami prawdopodobieństwo, że uczeń uzyskał ocenę 80%+, biorąc pod uwagę, że opuścił co najmniej 10 zajęć, wynosi co najmniej 6%.
Warunkowe prawdopodobieństwo niezależnych zdarzeń
Mamy też zdarzenia, powiedzmy A i B, gdzie oba są zdarzeniami niezależnymi, co oznacza, że wystąpienie zdarzenia A nie ma związku z wystąpieniem zdarzenia B.
W takim przypadku prawdopodobieństwo warunkowe P(B|A) wynosi zasadniczo P(B).
P(B|A)= P(B)
Podobnie prawdopodobieństwo warunkowe P(A|B) jest zasadniczo P(A).
P(A|B)= P(A)
Warunkowe prawdopodobieństwo wzajemnie wykluczających się zdarzeń
Zgodnie z teorią prawdopodobieństwa, kiedy mówimy o zdarzeniach, które nie mogą wystąpić w tym samym czasie, mówimy o wzajemnie wykluczających się. Mówiąc prościej, jeśli zdarzenie A miało miejsce, to zdarzenie B nie może zajść jednocześnie. Dlatego w takich przypadkach prawdopodobieństwo jest zawsze zerowe.
P(B|A)= 0 i P(A|B)= 0
Prawo całkowitego prawdopodobieństwa
Używamy zasady mnożenia, aby określić prawdopodobieństwo złożonych przypadków.
Zgodnie z regułą mnożenia obliczamy prawdopodobieństwo zdarzeń E i F, z których oba obserwują zdarzenia, mnożąc prawdopodobieństwo obserwowania zdarzenia F i obserwowania zdarzenia E, biorąc pod uwagę, że zdarzenie F zostało już zaobserwowane.
P( E1 ⋂ E2 ⋂….. ⋂En)=P( E1) P(E2 | E1)………P(En | E1……En-1)
Załóżmy teraz, że mamy przestrzeń próbną S zawierającą trzy rozłączne zdarzenia X, Y, Z. Zatem ,
P(A)=P(A X) +P(A ⋂ Y) +P(A ⋂ Z)
Teraz, zgodnie z regułą mnożenia, prawo całkowitego prawdopodobieństwa można wyrazić jako
P(A)= P(A|X) P(X) +P(A|Y) P(Y) +P(A|Z) P(Z)
Wniosek
Zrozumienie prawdopodobieństwa warunkowego jest niezbędne do opanowania złożonych estymacji prawdopodobieństwa, które są przeprowadzane przy użyciu twierdzenia Bayesa. Jeśli chcesz dowiedzieć się więcej o prawdopodobieństwie warunkowym i twierdzeniu Bayesa, zalecamy dołączenie do naszego zaawansowanego programu certyfikacji IIT w uczeniu maszynowym .
Platforma upGrad z ponad 40 000 daje możliwości współpracy peer-to-peer i 360° pomocy w pracy w najlepszych firmach. Dzięki rygorystycznemu szkoleniu poprzez praktyczne projekty, studia przypadków, wykłady na żywo, studenci mogą opanować skomplikowane koncepcje prawdopodobieństwa i wykorzystać je do wdrożenia modeli uczenia maszynowego.
Poprowadź rewolucję technologiczną opartą na sztucznej inteligencji. Aplikuj teraz!
Co to jest wspólne prawdopodobieństwo?
Jest to miara prawdopodobieństwa wystąpienia dwóch zdarzeń jednocześnie w tym samym momencie. W prostych słowach, wspólne prawdopodobieństwo prawdopodobieństwo wystąpienia zdarzenia B w tym samym momencie co zdarzenie A.
Czy prawdopodobieństwo warunkowe jest przemienne, czy nie?
Nie jest przemienny.
Jaka jest potrzeba warunkowego prawdopodobieństwa?
Prawdopodobieństwo warunkowe ułatwia oszacowanie prawdopodobieństwa zdarzenia na podstawie uwarunkowanych dowodów, które zależą od pierwszych zasad.