Em probabilidade, qual é a diferença entre p (a e b) e p (a dado b)?

Com P (A e B), você está procurando a probabilidade de que ambos os eventos A e B ocorram. Em P (A dado B), você realmente só precisa encontrar a probabilidade de que A ocorra ou seja verdadeiro. B é um dado; já ocorreu.

É como jogar 2 moedas. Qual é a probabilidade de aparecer cara na 1ª moeda e coroa no 2º? É (1/2) (1/2) ou 1/4. Mas se você inverter os flips e já aparecer com coroa no lançamento da 2ª moeda? Então as chances de ganhar cara ao jogar a 1ª moeda são 1/2. Você pode pensar nisso como (1/2) (1) = 1/2

Matematicamente, a única diferença é que P (A dado B) é dividido por P (B).

Conceitualmente, P (A e B) é a probabilidade de ocorrerem A e B (a probabilidade conjunta ou a probabilidade da interseção de A e B). P (A dado B) é a probabilidade de que A ocorra se B também ocorrer (probabilidade condicional). A fórmula para P (A dado B) é [P (A e B) / P (B)].

Ilustrando com um exemplo: suponha que tenhamos 10 coelhos. 4 são do sexo masculino, 6 são do sexo feminino, 2 estão grávidas.

P (masculino) = 0,4

P (mulher) = 0,6

P (grávida) = 0,2 (dividindo o número de coelhos prenhes pelo número total de coelhos); essa é a probabilidade de pegar aleatoriamente um coelho dentre os 10 e descobrir que está grávida.

P (gestante e fêmea) também é 0,2 (dividindo o número de coelhos grávidas pelo número total de coelhos); essa é a probabilidade de pegar um coelho entre os 10 e descobrir que é uma mulher grávida.

P (grávido e masculino) é zero (dividindo o número de coelhos grávidas pelo número total de coelhos)

P (mulher grávida grávida) = 2/6 (dividindo o número de coelhos grávidas pelo número de coelhos OU OU dividindo a probabilidade de ser mulher e grávida pela probabilidade de ser mulher)

P (homem grávido) = 0 (divisão do número de homens grávidas por número de homens ou P (homem e mulher) por P (homem)).

P (mulher grávida) = 1 (dividindo o número de fêmeas grávidas pelo número de coelhos grávidas ou dividindo P (mulheres e grávidas) por P (grávidas)

Bem, por definição

[math]P(A | B) = \frac{P(A \cap B)}{P(B)}[/math]

então a diferença é:

[math] P(A \cap B) - P(A | B) = P(A \cap B) \frac{P(B) - 1}{P(B)} [/math]

ou, de uma forma diferente,

[math] P(A \cap B) - P(A | B) = (P(B) - 1) P (A | B) [/math]

Pode parecer uma piada, mas é realmente perspicaz. Isto é porque

[math]\frac{P(B) - 1}{P(B)} [/math]

se aproxima de 0 quando P (B) se aproxima de 1. Isso significa que P (A | B) se aproxima de

[math]P(A \cap B)[/math]

quando P (B) se aproximar de 1.

Intuitivamente, isso faz sentido. Se B é (próximo) de todo o universo, então ambos

[math]P(A \cap B)[/math]

e P (A | B) são aproximadamente P (A) e, portanto, são aproximadamente iguais um ao outro.

Suponha que exista uma cidade com mil habitantes onde todos sejam democratas ou republicanos, e os dados demográficos se dividam assim:

  • 300 homens republicanos
  • 200 mulheres republicanas
  • 200 democratas
  • 300 mulheres democratas

Estes são os números que acabei de inventar e não devem ser considerados como tendo qualquer relação com a realidade.

Deixei

[math]A[/math]

ser o caso de uma pessoa ser democrata e deixar

[math]B[/math]

ser o caso em que uma pessoa é uma mulher.

[math]\mathbb{P}(A \cap B)[/math]

é a probabilidade de uma pessoa escolhida aleatoriamente ser uma mulher democrata e igual a 30%.

[math]\mathbb{P}(A|B)[/math]

é a probabilidade de uma mulher escolhida aleatoriamente ser democrata e igual a 60%.

Em vez de perguntar qual é a diferença, pergunte qual é a diferença.

Razão

desses dois.

Resposta simples: P (B).

P (A e B) é a probabilidade de

ambos

eventos acontecendo simultaneamente.

P (A dado B) é a probabilidade do subconjunto dos eventos acima nos quais B tem

ocorreu.

Para colocar alguma intuição:

Se A e B são eventos mutuamente exclusivos, fica claro que P (A dado B) = 0, independentemente de P (B).

Para eventos independentes, P (A dado B) = P (A).

Essa relação é o núcleo do teorema de Bayes e é central para a filtragem, previsão, etc.

Apenas para adicionar a

é um bom exemplo ...

Quando você faz

[math]P(A\cap B),[/math]

você está considerando o

população inteira

e encontrando a probabilidade de um elemento ser ambos

UMA

e

B

.

Quando você faz

[math]P(A|B),[/math]

você está considerando o

subconjunto da população

para qual

B

é verdade

e encontrando a probabilidade de que um elemento desse grupo também seja

UMA

.

Acho que uma imagem é realmente útil para entender um conceito como este. No diagrama abaixo, existem dois resultados possíveis, A e B, que não são mutuamente exclusivos (uma vez que se sobrepõem). Eu imagino uma pessoa em pé em uma das três regiões.

P (A e B) é a probabilidade de a pessoa estar simultaneamente em A e B, claramente a área de sobreposição, que neste exemplo = 1/10 [10% / (40% + 10% + 50%)] .

P (A dado B) significa que você é informado de que a pessoa está em algum lugar de B e responde à pergunta 'qual é a chance de ela também estar em A'? Isso é 1/6 [10% / (10% + 50%)].

Até agora você vê a semelhança, o numerador é o mesmo, mas o denominador é reduzido para P (A dado B) porque você recebe informações adicionais sobre onde a pessoa está.