Domingo de manhã, você acorda com ressaca… amnésia… Resultado de tudo que o sábado lhe deu direito. Saiu, encheu a cara, se soltou e conheceu alguém (high five!). Claro que sempre com responsabilidade, um cara prevenido, que segue todas as regras básicas de prevenção, não corre nenhum risco. Será?
Não é que a mulher se sentiu mal no dia seguinte? Resolveu fazer um exame de gravidez e o resultado foi positivo. Ela leu a embalagem do teste e teve certeza de que estava grávida, segundo ela, a chance de não estar grávida era só de 0,1% (run Forest run!). Ela concluiu isso com base no seguinte fato: o teste gera um resultado positivo para pessoas não grávidas em 0,1% das vezes. E foi aí que você viu que suas chances de não lidar com essa gravidez inesperada eram maiores que 0,1%, graças às aulas sobre o Teorema de Bayes!
O problema no 0,1% é que essa era a probabilidade de o resultado do exame ser positivo, dado que a pessoa não está grávida. Mas isso pode ser (e provavelmente é) bem diferente da probabilidade de ela estar grávida, dado que o resultado do exame é positivo. Ora, são duas coisas bem diferentes – e se você não entendeu, leia e releia as duas frases anteriores mais algumas vezes.
Para entender o motivo, primeiro precisamos entender estatística.
Probabilidade condicional é a probabilidade de um evento ocorrer, condicionado ao fato de que outro evento ocorreu. E essa probabilidade vai mudar muito dependendo de qual evento ocorreu e qual se quer analisar a probabilidade de ocorrência.
Vamos a um exemplo bem tosco, mas muito prático e intuitivo para entender probabilidade condicional. É o seguinte: qual a probabilidade de seu vizinho ser um alienígena?
A princípio, você vai imaginar que é pequena – a não ser que você seja muito viciado em ficção e teorias da conspiração. Mas, e se você ouvisse vozes de dentro do apartamento dele falando em línguas desconhecidas e diferentes de tudo que você já ouviu? E se você visse pela janela que algo brilhante e luminoso, de formato oval, estava flutuando bem de frente para a janela dele? E se de repente você o visse com dois homens de terno preto e óculos escuros?
Parece que agora a probabilidade de ele ser um alienígena é bem maior, não?
Vamos além, tente inverter as condições. Uma coisa é a probabilidade de se ouvir línguas desconhecidas condicionado ao fato de que ele é um alienígena. Essa probabilidade deve ser alta. Outra coisa é a probabilidade de ele ser alienígena, dado que você ouviu línguas desconhecidas. Essa talvez não seja tão alta, ele pode ser um nerd que aprendeu klingon ou ser nativo de algum país que você pouco conhece.
Parece maluquice essa explicação, mas isso é probabilidade condicional. É entender que a probabilidade de um evento ocorrer, dado que algum outro evento aconteceu, é diferente do que o acontecimento isolado do evento em questão.
Agora, voltando para o exemplo da gravidez, ainda sem usar nenhuma fórmula matemática. Vamos considerar 100 mil mulheres na mesma situação que sua namorada/peguete/rolo que fizeram um teste de gravidez após a relação. Considerando estatísticas hipotéticas aqui, suponha que dessas 100 mil, aproximadamente 200 realmente estão grávidas (0,2%). Vamos supor que não tenhamos nenhum falso negativo no teste (i.e., nenhum resultado negativo para quem estiver grávida), logo, as 200 mulheres grávidas terão resultado positivo. Como temos a taxa de 0,1% de falsos positivos, i.e. dentre as 99.800 não grávidas, aproximadamente 100 terão resultado positivo. Ou seja, 300 (200+100) mulheres possuem resultado positivo e 99.700 negativo.
Como sua namorada/peguete/rolo teve resultado positivo, ela pertence ao primeiro grupo, de 300 pessoas. Qual a probabilidade de ela não estar grávida?
Bem, se temos 300 resultados positivos, sendo que 100 são falsos positivos, ficou simples: 100/300 = 33,33333%.
Essa é a real probabilidade de que ela não esteja grávida dado que o resultado do teste foi positivo. Pulamos de 1 em 1.000 para 1 em 3.
Pois é, muito diferente.
Graças ao nosso amigo Bayes, um matemático do século XVIII, já temos inclusive uma fórmula para calcular as probabilidades condicionais aqui mencionadas – contanto que saibamos algumas informações dos eventos. O teorema de Bayes diz que a probabilidade de um evento A ocorrer dado a ocorrência de um evento B, será a probabilidade do evento B ocorrer multiplicada pela probabilidade do evento A ocorrer, dividido pela probabilidade do evento B ocorrer. Em outras palavras, fazemos uso da fórmula:
P(A|B)=P(B|A)*P(A)/P(B)
Para concluir, note que não foi só falta de conhecimento estatístico que levou a conclusão equivocada, mas também a elaboração incorreta da pergunta. E se você nem partiu da pergunta correta, seria muito esperar chegar na resposta correta. Já dizia o ditado: garbage in, garbage out.
………………………………………………………………………………………………………………………………………….
André Yukio
É Matemático mestre em Economia. Xbox One player. Viciado em séries. Gosta de cookies e jelly beans.