Tuesday, September 15, 2015

Teorema de Bayes: a falácia da taxa de base

Vamos apresentar aqui o significado de falácia da taxa de base” usando como exemplo o resultado de um teste para detectar o uso de heroína.  Imagine que o teste para a droga em questão é altamente sensível e bastante específico.
·         A sensibilidade é 0,95 ou 95%, ou seja, a probabilidade de o teste dar resultado positivo (+) em usuários (U) é 0,95.
·        A especificidade é 0,90 ou 90%, ou seja, a probabilidade de o teste dar resultado negativo (-) em não usuários (não) é 0,95.
Escrevemos:
                              S = P (+|U) =0,95
                      E = P (-|não) =0,90
            Estima-se, com base em vários estudos que, em determinada região, 3% dos moradores são usuários de heroína. Pedro é morador dessa região e foi escolhido aleatoriamente para fazer o teste que detecta o uso de heroína. O resultado é positivo. Qual é a probabilidade de Pedro ser usuário?
Aplicando o teorema de Bayes:
 

                            Fórmula do teorema de Bayes

 A probabilidade de Pedro ser usuário de heroína dado que o teste deu resultado positivo é




     Os cálculos mostram que a probabilidade de Pedro ser usuário de heroína é 0,227 ou, em porcentagem, 22,7%. Esse valor é praticamente sete vezes maior do que 3%, que é a probabilidade de ser encontrado um usuário de heroína na população estudada.

     Entretanto, o fato de Pedro, uma pessoa tomada ao acaso dessa população, ter obtido resultado positivo em um teste bastante sensível (sensibilidade de 95%) é evidência parcial. Embora nos faça pensar que Pedro é usuário da droga, a evidência total dessa conclusão é pequena simplesmente porque a probabilidade de encontrar um usuário de heroína na população estudada é baixa.

      É importante notar: a evidência adicional trazida pelo teste é alta, mas para julgar um fato é preciso olhar o total da evidência. É preciso atenção com as probabilidades a priori. No caso de Pedro, a probabilidade a priori praticamente anula o resultado do teste: nessa população, é raro encontrar um usuário de heroína. Então parece razoável considerar que o resultado do teste pode estar errado.

As pessoas tendem a tomar a evidência parcial como evidência total. É a falácia da taxa de base”. Elas tratam o resultado de um teste bastante confiável, porém não totalmente confiável, como o resultado final e conclusivo para uma hipótese que, afinal de contas, não é provável e deveria, portanto, esbarrar em dúvidas sobre sua veracidade.

Em termos gerais, qualquer pessoa que ainda não tenha pensado sobre determinado assunto acha relevante resultados de experimentos que confirmem a hipótese em teste. No entanto, o grau de confirmação que os dados trazem a uma pessoa que entende do assunto depende, em boa parte, do nível de confiança na hipótese. Mas todos irão concordar que dados ajudam a confirmar uma hipótese.

Quando a evidência mostrada pelos dados é relativizada por probabilidade a priori, nossa aceitação do resultado final depende da veracidade e da qualidade das estimativas, tanto da probabilidade a priori como da probabilidade a posteriori. Conclusão:

·         Resultado positivo para um teste de alta sensibilidade pode ser pouco provável, se a probabilidade a priori da ocorrência do evento for muito pequena.

·         Resultado positivo para um teste de alta sensibilidade pode ser altamente provável, se a probabilidade a priori da ocorrência do evento for muito grande.


Então os resultados dos testes (todo tipo de teste, seja teste diagnóstico, teste estatístico, teste para vestibular) são apenas indicações da realidade – não são “provas” definitivas.

Este texto está totalmente baseado em
Bayes' Theorem (Stanford Encyclopedia of Philosophy) plato.stanford.edu/entries/bayes-theorem

Veja também:
Howson, C.; Urach, P. Scientific reasoning: the Bayesian approach. Open Court. 2006.
Maher, P. Howson 2: Bayes theorem. patrick.maher1.net/471/lectures/howson2.pdf

A discussão sobre falácia da taxa de base você encontra em:
Kahneman, D. Thinking, fast and slow.Nova York, Farrar, Straus, Giroux, 2013.







No comments: