Tuesday, September 15, 2015

Teorema de Bayes: a falácia da taxa de base

Vamos apresentar aqui o significado de falácia da taxa de base” usando como exemplo o resultado de um teste para detectar o uso de heroína.  Imagine que o teste para a droga em questão é altamente sensível e bastante específico.
·         A sensibilidade é 0,95 ou 95%, ou seja, a probabilidade de o teste dar resultado positivo (+) em usuários (U) é 0,95.
·         A especificidade é 0,90 ou 90%, ou seja, a probabilidade de o teste dar resultado negativo (-) em não usuários (não) é 0,95.
Escrevemos:
                              S = P (+|U) =0,95
                              E = P (-|não) =0,90
            Estima-se, com base em vários estudos que, em determinada região, 3% dos moradores são usuários de heroína. Pedro é morador dessa região e foi escolhido aleatoriamente para fazer o teste que detecta o uso de heroína. O resultado é positivo. Qual é a probabilidade de Pedro ser usuário?
Aplicando o teorema de Bayes:
 

                            Fórmula do teorema de Bayes

 A probabilidade de Pedro ser usuário de heroína dado que o teste deu resultado positivo é




     Os cálculos mostram que a probabilidade de Pedro ser usuário de heroína é 0,227 ou, em porcentagem, 22,7%. Esse valor é praticamente sete vezes maior do que 3%, que é a probabilidade de ser encontrado um usuário de heroína na população estudada.

     Entretanto, o fato de Pedro, uma pessoa tomada ao acaso dessa população, ter obtido resultado positivo em um teste bastante sensível (sensibilidade de 95%) é evidência parcial. Embora nos faça pensar que Pedro é usuário da droga, a evidência total dessa conclusão é pequena simplesmente porque a probabilidade de encontrar um usuário de heroína na população estudada é baixa.

      É importante notar: a evidência adicional trazida pelo teste é alta, mas para julgar um fato é preciso olhar o total da evidência. É preciso atenção com as probabilidades a priori. No caso de Pedro, a probabilidade a priori praticamente anula o resultado do teste: nessa população, é raro encontrar um usuário de heroína. Então parece razoável considerar que o resultado do teste pode estar errado.

As pessoas tendem a tomar a evidência parcial como evidência total. É a falácia da taxa de base”. Elas tratam o resultado de um teste bastante confiável, porém não totalmente confiável, como o resultado final e conclusivo para uma hipótese que, afinal de contas, não é provável e deveria, portanto, esbarrar em dúvidas sobre sua veracidade.

Em termos gerais, qualquer pessoa que ainda não tenha pensado sobre determinado assunto acha relevante resultados de experimentos que confirmem a hipótese em teste. No entanto, o grau de confirmação que os dados trazem a uma pessoa que entende do assunto depende, em boa parte, do nível de confiança na hipótese. Mas todos irão concordar que dados ajudam a confirmar uma hipótese.

Quando a evidência mostrada pelos dados é relativizada por probabilidade a priori, nossa aceitação do resultado final depende da veracidade e da qualidade das estimativas, tanto da probabilidade a priori como da probabilidade a posteriori. Conclusão:

·         Resultado positivo para um teste de alta sensibilidade pode ser pouco provável, se a probabilidade a priori da ocorrência do evento for muito pequena.

·         Resultado positivo para um teste de alta sensibilidade pode ser altamente provável, se a probabilidade a priori da ocorrência do evento for muito grande.


Então os resultados dos testes (todo tipo de teste, seja teste diagnóstico, teste estatístico, teste para vestibular) são apenas indicações da realidade – não são “provas” definitivas.

Este texto está totalmente baseado em
Bayes' Theorem (Stanford Encyclopedia of Philosophy) plato.stanford.edu/entries/bayes-theorem

Veja também:
Howson, C.; Urach, P. Scientific reasoning: the Bayesian approach. Open Court. 2006.
Maher, P. Howson 2: Bayes theorem. patrick.maher1.net/471/lectures/howson2.pdf

A discussão sobre falácia da taxa de base você encontra em:
Kahneman, D. Thinking, fast and slow.Nova York, Farrar, Straus, Giroux, 2013.






Saturday, September 12, 2015

Teorema de Bayes: The Harvard Medical School Test

O problema apresentado aqui foi proposto aos alunos da Escola de Medicina de Harvard (uma das melhores escolas de medicina do mundo – possivelmente a melhor). É o chamado The Harvard Medical School Test. A maioria dos alunos deu resposta errada, pois disseram: “a probabilidade de a pessoa ter a doença D é 95%”.

Veja o problema. Qual é a resposta?

Um teste diagnóstico para determinada doença D só pode resultar em positivo ou negativo, indicando presença ou ausência da doença.
Estima-se que a probabilidade de um falso negativo seja 0% e a probabilidade de um falso positivo seja 5%.
A taxa de incidência da doença é baixa. Um levantamento (survey) mostrou que, na população, ocorre um caso por mil habitantes.
Se uma pessoa selecionada ao acaso na população for submetida ao teste e o resultado der positivo, qual é a probabilidade de essa pessoa ter a doença D?

Resolva o problema aplicando o teorema de Bayes.

Se a pessoa tem a doença, o resultado do teste é verdadeiro positivo com probabilidade 1,000. O falso negativo ocorre com probabilidade 0,000.

P(+│D) = 1,000
P(-│D) = 0,000
Se a pessoa não tem a doença, o resultado do teste pode ser falso positivo com probabilidade 0,050 ou verdadeiro negativo com probabilidade 0,950.

P(+│D’) = 0,050
P(-│D’) = 0,950
A taxa de incidência da doença é um caso por mil habitantes.

P(D) = 0,001
P(D’) = 0,999
  

       
          A resposta é 0,0196 ou 1,96%.

Lembre-se de que sensibilidade do teste é a probabilidade de o teste dar resultado positivo em pessoas que têm a doença (no caso é 1,000). Especificidade é a probabilidade de o teste dar resultado negativo em pessoas que não têm a doença (no caso é 0,950). O teste é, portanto, sensível e específico.

Entretanto, alta sensibilidade e alta especificidade são condições necessárias, mas não suficientes para avaliar a correção do resultado do teste.  Na avaliação do resultado do teste, é preciso considerar probabilidades a priori de a pessoa ter a doença.

Vimos isso em postagens anteriores, em que se avaliou a probabilidade de ser certo um resultado positivo em quatro situações, com diferentes probabilidades a priori (estimativas diferentes da probabilidade de a pessoa ter a doença).

Leia mais em:

Patrick Maher Philosophy 471 Fall 2006
Howson, Colin e Urbach, Peter. Scientific Reasoning: the Bayesian approach. Open Court. 2006. P.13-26



















































































Saturday, August 29, 2015

Teorema de Bayes e teste diagnóstico na Genética


Antes de ver o exemplo, convém ler, neste mesmo blog, as postagens:
 Teorema de Bayes 
Testes diagnósticos: sensibilidade e especificidade .

Considere a porfiria, uma doença autossômica dominante. Toda pessoa afetada tem um genitor afetado e tem 50% de chance de transmitir o gene (e consequentemente a doença) para os filhos. Veja o heredograma, em que verde indica pessoa sem a doença e vermelho indica pessoa afetada.
 

Existe um teste para o diagnóstico precoce da doença, que tem sensibilidade  0,82 e especificidade é 0,963.

Situação 1: Uma pessoa teve resultado positivo no teste para a porfiria. Qual é a probabilidade de essa pessoa ter a doença?

Sem qualquer informação adicional, a resposta é óbvia: se a sensibilidade do teste (probabilidade de verdadeiros positivos no total de doentes) é 0,82, a probabilidade de essa pessoa ter porfiria é 0,82 ou 82%.

Situação 2: A porfiria é uma doença rara, que ocorre na população com probabilidade 0,01%. Se uma pessoa tomada ao acaso da população obtiver resultado positivo no teste para a doença, qual é a probabilidade de ela ter a doença?

Como a sensibilidade do teste é 0,82 e a especificidade é 0,963, a probabilidade de a pessoa, que teve resultado positivo no teste diagnóstico ter a doença deve ser obtida pelo teorema de Bayes. Veja o diagrama de árvore. Observando o diagrama, fica mais fácil calcular a probabilidade de a pessoa ter porfiria, dado que o teste positivou.




Situação 3: A porfiria é uma doença autossômica dominante. É dada a informação adicional de que uma pessoa que fez o teste tem um irmão germano com porfiria. Se o resultado  no teste foi positivo, qual é a probabilidade de essa pessoa ter a doença?

A probabilidade de um paciente que tem irmão com a doença ter porfiria se tiver resultado positivo no teste é obtida pelo teorema de Bayes. Observe o diagrama de árvore e calcule a probabilidade pedida.

Situação 4: Uma pessoa  não conhece seu histórico genético familiar (digamos foi adotada bebê), mas um médico experiente tem o palpite de que a  probabilidade de essa pessoa ter a porfíria é 30%. Se a pessoa positivar no teste, qual é a probabilidade de essa pessoa ter porfiria? 

A probabilidade é obtida aplicando o teorema de Bayes. Veja o diagrama de árvore e o cálculo abaixo.

Pense nisto: para a mesma pergunta – qual é a probabilidade de a pessoa ter a doença? – foram obtidas respostas  diferentes. Por quê?


O teorema de Bayes permite rever um valor calculado de probabilidade com base em informação anterior. Qual das respostas é a correta? Depende da situação:


v  Na 1ª situação, a probabilidade de a pessoa ter a doença foi obtida apenas pela sensibilidade do teste.
v  Na 2ª situação, a probabilidade foi obtida considerando a baixa prevalência na população, conhecida por grandes levantamentos (surveys) feitos anteriormente.
v  Na 3ª situação, a probabilidade a priori foi obtida considerando, em seu cálculo, conhecimento de genética e a história familiar do paciente.

v  Na 4ª situação, a probabilidade foi obtida levando em conta o palpite (educated guess) do médico, ou seja, a partir de intuição clínica.

                                   IMPORTANTE
O teorema de Bayes permite incorporar conhecimentos anteriores aos fatos observados: usamos um valor de probabilidade a priori (obtida antes de saber o resultado do teste) para mais bem estimar uma probabilidade a posteriori, obtida dos dados observados. 

Este exemplo é de 
Motulsky, H. Intuitive Biostatistics.Oxford universityPress. 1995. P133-6.