Probabilidade condicional explicada com aplicativos da vida real

Publicados: 2021-09-28

Índice

O que é probabilidade condicional?

A probabilidade condicional, na teoria da probabilidade, é definida como a medida da probabilidade de um evento ocorrer, assumindo que outro evento ou resultado tenha ocorrido anteriormente. É expresso como a multiplicação da probabilidade do evento ocorrido anteriormente pela probabilidade do evento condicional que ocorreu em sucessão.

Então, se temos eventos A e B onde P(B)>0, calculamos a probabilidade condicional de A quando B já ocorreu, P(A | B) como

P(A | B)=P(A∩B)P(B)

  • | é usado para denotar “dado” em “casos onde outro evento ocorre”
  • ∩ é usado para denotar interseção

Ao calcular a probabilidade condicional, assume-se que estamos cientes do resultado do evento B. Isso é especialmente útil, pois a informação do resultado de um experimento geralmente é desconhecida.

Vamos entender isso com um exemplo:

  • Temos um evento A em que assumimos que um indivíduo que se inscreveu em uma universidade será aceito. A probabilidade de eles serem aceitos é de 70%.
  • Temos outro evento B onde há 50% de chance de que os alunos aceitos recebam alojamento em dormitório.

Assim, calculamos a probabilidade condicional como,

Probabilidade (estudantes aceitos e dormitório atribuído) = P (dormitório atribuído | Alunos aceitos) × P (alunos aceitos)

= (0,50)*(0,70) = 0,35

Com probabilidade condicional, estamos olhando para ambos os eventos A e B, sua relação entre si, onde um estudante é aceito na universidade e recebe alojamento em dormitório.

Em contraste, a probabilidade incondicional é definida como a medida da probabilidade de um evento ocorrer independentemente de ser precedido por outro evento ou ter outras condições dadas.

Aplicações da Probabilidade Condicional na Vida Real

A probabilidade condicional encontra amplo uso em diferentes campos, como seguros e cálculo. Também é aplicável na política. Vamos supor que há uma expectativa de reeleição de um presidente. Os resultados dependerão das preferências dos votantes e da probabilidade do resultado das campanhas publicitárias na televisão.

Em outro exemplo, vamos supor que a probabilidade de chuva em sua área seja de 40% conforme especificado pelo clima. No entanto, este resultado depende em grande parte de:

  • Se há nuvens se formando em sua área
  • Se existe a possibilidade de uma frente fria chegar à sua área
  • Se as nuvens estão sendo afastadas por outra frente

A probabilidade condicional dependerá de cada um dos eventos acima.

Teorema de Bayes

Introduzido pelo matemático Thomas Bayes, o teorema de Bayes ou Regra de Bayes ou Lei de Bayes é uma equação matemática que ajuda a calcular a probabilidade condicional. Usando o teorema de Bayes, podemos revisar (atualizar) medidas de probabilidade existentes quando novas evidências ou informações adicionais vierem à tona.

O teorema de Bayes encontra uso em finanças onde os contadores o usam para determinar o risco de emprestar dinheiro a um mutuário. Além disso, também é útil em estatística e lógica indutiva.

A estatística bayesiana é baseada no teorema de Bayes onde é possível prever eventos com base em novas evidências, levando a estimativas mais dinâmicas e precisas.

Participe do Curso de Aprendizado de Máquina on-line das principais universidades do mundo - Mestrados, Programas de Pós-Graduação Executiva e Programa de Certificado Avançado em ML e IA para acelerar sua carreira.

Exemplo de probabilidade condicional com Python

Neste exemplo, usaremos a probabilidade condicional para determinar a probabilidade de um aluno obter uma nota A (80%+) em Física, desde que falte no mínimo 10 aulas.

Para começar, inspecione o conjunto de dados que você baixou do kaggle :

importar pandas como pd

df = pd.read_csv('aluno-consumo de álcool/aluno-mat.csv')

df.head(3)

Percorra o número de registros:

len(df)

#=> 395

Levaremos em consideração apenas as seguintes colunas: número de faltas e notas finais.

Agora, crie uma nova coluna booleana grade_A para mostrar se a pontuação final de um aluno é 80% ou superior.

Multiplique por 5:

df['grade_A'] = np.where(df['G3']*5 >= 80, 1, 0)

Crie uma nova coluna booleana high_absenses com valor 1 denotando alunos que perderam no mínimo 10 aulas.

df['high_absenses'] = np.where(df['absences'] >= 10, 1, 0)

Crie outra coluna para que possamos construir facilmente uma tabela dinâmica:

df['contagem'] = 1

Remova todas as outras colunas:

df = df[['grade_A','high_absenses','count']]

df.head()

Construindo uma tabela dinâmica:

pd.pivot_table(

df,

valores='contagem',

index=['nota_A'],

colunas=['high_absenses'],

aggfunc=np.size,

valor_preencher=0

)

Agora, podemos prosseguir para o nosso cálculo:

  • P(A) denota a probabilidade de um aluno obter uma nota A (80% ou mais).
  • P(B) é a probabilidade de um aluno ter perdido no mínimo 10 aulas.
  • P(A|B) é a probabilidade de um aluno ter obtido uma nota de 80%+, dado que ele/ela perdeu um mínimo de 10 aulas.

P(A) = (35 + 5) / (35 + 5 + 277 + 78) = 0,10126…

P(B) = (78 + 5) / (35 + 5 + 277 + 78) = 0,21012…

P(A ∩ B) = 5 / (35 + 5 + 277 + 78) = 0,0126582…

P(A|B) = P(A ∩ B) / P(B) = 0,06

De acordo com nossos cálculos, a probabilidade de um aluno ter uma nota de 80%+, dado que ele/ela perdeu um mínimo de 10 aulas é de pelo menos 6%.

Probabilidade Condicional de Eventos Independentes

Também temos eventos, digamos A e B, onde ambos são eventos independentes, o que significa que a ocorrência do evento A não tem relação com a ocorrência do evento B.

Nesse caso, a probabilidade condicional P(B|A) é essencialmente P(B).

P(B|A)=P(B)

Da mesma forma, a probabilidade condicional P(A|B) é essencialmente P(A).

P(A|B)=P(A)

Probabilidade condicional de eventos mutuamente exclusivos

De acordo com a teoria da probabilidade, quando falamos de eventos que não podem ocorrer ao mesmo tempo, estamos falando de eventos mutuamente exclusivos. Simplificando, se o evento A ocorreu, o evento B não pode ocorrer simultaneamente. Portanto, nesses casos, a probabilidade é sempre zero.

P(B|A)= 0 e P(A|B)= 0

Lei da Probabilidade Total

Usamos a regra da multiplicação para determinar a probabilidade de casos complexos.

De acordo com a regra de multiplicação, calculamos a probabilidade dos eventos E e F, que são eventos de observação, multiplicando a probabilidade do evento de observação F e evento de observação E, dado que o evento F já foi observado.

P(E1 ⋂ E2 ⋂….. ⋂En)=P(E1) P(E2 | E1)………P(En | E1…………En-1)

Agora, vamos supor que temos um espaço amostral S compreendendo três eventos disjuntos X, Y, Z. Portanto ,

P(A)=P(A ⋂ X) +P(A ⋂ Y) +P(A ⋂ Z)

Agora, de acordo com a regra da multiplicação, a lei da probabilidade total pode ser expressa como

P(A)= P(A|X) P(X) +P(A|Y) P(Y) +P(A|Z) P(Z)

Conclusão

Compreender a probabilidade condicional é necessário para dominar as estimativas de probabilidade complexas que são realizadas usando o teorema de Bayes. Se você quiser aprender a fundo sobre probabilidade condicional e o teorema de Bayes, recomendamos ingressar em nosso Programa de Certificação Avançado IIT em Aprendizado de Máquina .

A plataforma de mais de 40.000 do upGrad oferece oportunidades de colaboração ponto a ponto e assistência de trabalho 360° nas principais empresas. Com treinamento rigoroso por meio de projetos práticos, estudos de caso, palestras ao vivo, os alunos podem dominar os complicados conceitos de probabilidade e aproveitá-los para implantar modelos de Machine Learning.

Lidere a revolução tecnológica orientada por IA. Aplique agora!

O que é probabilidade conjunta?

É a medida da probabilidade de dois eventos ocorrerem simultaneamente no mesmo ponto no tempo. Em palavras simples, probabilidade conjunta é a probabilidade do evento B ocorrer no mesmo ponto no tempo que o evento A.

A probabilidade condicional é comutativa ou não?

Não é comutativo.

Qual é a necessidade de probabilidade condicional?

A probabilidade condicional torna mais fácil estimar a probabilidade de um evento com base na evidência condicionada que depende dos primeiros princípios.