Probabilidade condicional explicada com aplicativos da vida real
Publicados: 2021-09-28Índice
O que é probabilidade condicional?
A probabilidade condicional, na teoria da probabilidade, é definida como a medida da probabilidade de um evento ocorrer, assumindo que outro evento ou resultado tenha ocorrido anteriormente. É expresso como a multiplicação da probabilidade do evento ocorrido anteriormente pela probabilidade do evento condicional que ocorreu em sucessão.
Então, se temos eventos A e B onde P(B)>0, calculamos a probabilidade condicional de A quando B já ocorreu, P(A | B) como
P(A | B)=P(A∩B)P(B)
- | é usado para denotar “dado” em “casos onde outro evento ocorre”
- ∩ é usado para denotar interseção
Ao calcular a probabilidade condicional, assume-se que estamos cientes do resultado do evento B. Isso é especialmente útil, pois a informação do resultado de um experimento geralmente é desconhecida.
Vamos entender isso com um exemplo:
- Temos um evento A em que assumimos que um indivíduo que se inscreveu em uma universidade será aceito. A probabilidade de eles serem aceitos é de 70%.
- Temos outro evento B onde há 50% de chance de que os alunos aceitos recebam alojamento em dormitório.
Assim, calculamos a probabilidade condicional como,
Probabilidade (estudantes aceitos e dormitório atribuído) = P (dormitório atribuído | Alunos aceitos) × P (alunos aceitos)
= (0,50)*(0,70) = 0,35
Com probabilidade condicional, estamos olhando para ambos os eventos A e B, sua relação entre si, onde um estudante é aceito na universidade e recebe alojamento em dormitório.
Em contraste, a probabilidade incondicional é definida como a medida da probabilidade de um evento ocorrer independentemente de ser precedido por outro evento ou ter outras condições dadas.
Aplicações da Probabilidade Condicional na Vida Real
A probabilidade condicional encontra amplo uso em diferentes campos, como seguros e cálculo. Também é aplicável na política. Vamos supor que há uma expectativa de reeleição de um presidente. Os resultados dependerão das preferências dos votantes e da probabilidade do resultado das campanhas publicitárias na televisão.
Em outro exemplo, vamos supor que a probabilidade de chuva em sua área seja de 40% conforme especificado pelo clima. No entanto, este resultado depende em grande parte de:
- Se há nuvens se formando em sua área
- Se existe a possibilidade de uma frente fria chegar à sua área
- Se as nuvens estão sendo afastadas por outra frente
A probabilidade condicional dependerá de cada um dos eventos acima.
Teorema de Bayes
Introduzido pelo matemático Thomas Bayes, o teorema de Bayes ou Regra de Bayes ou Lei de Bayes é uma equação matemática que ajuda a calcular a probabilidade condicional. Usando o teorema de Bayes, podemos revisar (atualizar) medidas de probabilidade existentes quando novas evidências ou informações adicionais vierem à tona.
O teorema de Bayes encontra uso em finanças onde os contadores o usam para determinar o risco de emprestar dinheiro a um mutuário. Além disso, também é útil em estatística e lógica indutiva.
A estatística bayesiana é baseada no teorema de Bayes onde é possível prever eventos com base em novas evidências, levando a estimativas mais dinâmicas e precisas.
Participe do Curso de Aprendizado de Máquina on-line das principais universidades do mundo - Mestrados, Programas de Pós-Graduação Executiva e Programa de Certificado Avançado em ML e IA para acelerar sua carreira.
Exemplo de probabilidade condicional com Python
Neste exemplo, usaremos a probabilidade condicional para determinar a probabilidade de um aluno obter uma nota A (80%+) em Física, desde que falte no mínimo 10 aulas.
Para começar, inspecione o conjunto de dados que você baixou do kaggle :
importar pandas como pd
df = pd.read_csv('aluno-consumo de álcool/aluno-mat.csv')
df.head(3)
Percorra o número de registros:
len(df)
#=> 395
Levaremos em consideração apenas as seguintes colunas: número de faltas e notas finais.
Agora, crie uma nova coluna booleana grade_A para mostrar se a pontuação final de um aluno é 80% ou superior.
Multiplique por 5:
df['grade_A'] = np.where(df['G3']*5 >= 80, 1, 0)
Crie uma nova coluna booleana high_absenses com valor 1 denotando alunos que perderam no mínimo 10 aulas.
df['high_absenses'] = np.where(df['absences'] >= 10, 1, 0)
Crie outra coluna para que possamos construir facilmente uma tabela dinâmica:
df['contagem'] = 1
Remova todas as outras colunas:
df = df[['grade_A','high_absenses','count']]
df.head()
Construindo uma tabela dinâmica:
pd.pivot_table(
df,
valores='contagem',
index=['nota_A'],
colunas=['high_absenses'],
aggfunc=np.size,
valor_preencher=0
)
Agora, podemos prosseguir para o nosso cálculo:
- P(A) denota a probabilidade de um aluno obter uma nota A (80% ou mais).
- P(B) é a probabilidade de um aluno ter perdido no mínimo 10 aulas.
- P(A|B) é a probabilidade de um aluno ter obtido uma nota de 80%+, dado que ele/ela perdeu um mínimo de 10 aulas.
P(A) = (35 + 5) / (35 + 5 + 277 + 78) = 0,10126…
P(B) = (78 + 5) / (35 + 5 + 277 + 78) = 0,21012…
P(A ∩ B) = 5 / (35 + 5 + 277 + 78) = 0,0126582…
P(A|B) = P(A ∩ B) / P(B) = 0,06
De acordo com nossos cálculos, a probabilidade de um aluno ter uma nota de 80%+, dado que ele/ela perdeu um mínimo de 10 aulas é de pelo menos 6%.
Probabilidade Condicional de Eventos Independentes
Também temos eventos, digamos A e B, onde ambos são eventos independentes, o que significa que a ocorrência do evento A não tem relação com a ocorrência do evento B.
Nesse caso, a probabilidade condicional P(B|A) é essencialmente P(B).
P(B|A)=P(B)
Da mesma forma, a probabilidade condicional P(A|B) é essencialmente P(A).
P(A|B)=P(A)
Probabilidade condicional de eventos mutuamente exclusivos
De acordo com a teoria da probabilidade, quando falamos de eventos que não podem ocorrer ao mesmo tempo, estamos falando de eventos mutuamente exclusivos. Simplificando, se o evento A ocorreu, o evento B não pode ocorrer simultaneamente. Portanto, nesses casos, a probabilidade é sempre zero.
P(B|A)= 0 e P(A|B)= 0
Lei da Probabilidade Total
Usamos a regra da multiplicação para determinar a probabilidade de casos complexos.
De acordo com a regra de multiplicação, calculamos a probabilidade dos eventos E e F, que são eventos de observação, multiplicando a probabilidade do evento de observação F e evento de observação E, dado que o evento F já foi observado.
P(E1 ⋂ E2 ⋂….. ⋂En)=P(E1) P(E2 | E1)………P(En | E1…………En-1)
Agora, vamos supor que temos um espaço amostral S compreendendo três eventos disjuntos X, Y, Z. Portanto ,
P(A)=P(A ⋂ X) +P(A ⋂ Y) +P(A ⋂ Z)
Agora, de acordo com a regra da multiplicação, a lei da probabilidade total pode ser expressa como
P(A)= P(A|X) P(X) +P(A|Y) P(Y) +P(A|Z) P(Z)
Conclusão
Compreender a probabilidade condicional é necessário para dominar as estimativas de probabilidade complexas que são realizadas usando o teorema de Bayes. Se você quiser aprender a fundo sobre probabilidade condicional e o teorema de Bayes, recomendamos ingressar em nosso Programa de Certificação Avançado IIT em Aprendizado de Máquina .
A plataforma de mais de 40.000 do upGrad oferece oportunidades de colaboração ponto a ponto e assistência de trabalho 360° nas principais empresas. Com treinamento rigoroso por meio de projetos práticos, estudos de caso, palestras ao vivo, os alunos podem dominar os complicados conceitos de probabilidade e aproveitá-los para implantar modelos de Machine Learning.
Lidere a revolução tecnológica orientada por IA. Aplique agora!
O que é probabilidade conjunta?
É a medida da probabilidade de dois eventos ocorrerem simultaneamente no mesmo ponto no tempo. Em palavras simples, probabilidade conjunta é a probabilidade do evento B ocorrer no mesmo ponto no tempo que o evento A.
A probabilidade condicional é comutativa ou não?
Não é comutativo.
Qual é a necessidade de probabilidade condicional?
A probabilidade condicional torna mais fácil estimar a probabilidade de um evento com base na evidência condicionada que depende dos primeiros princípios.