Saturday, September 12, 2015

Teorema de Bayes: The Harvard Medical School Test

O problema apresentado aqui foi proposto aos alunos da Escola de Medicina de Harvard (uma das melhores escolas de medicina do mundo – possivelmente a melhor). É o chamado The Harvard Medical School Test. A maioria dos alunos deu resposta errada, pois disseram: “a probabilidade de a pessoa ter a doença D é 95%”.

Veja o problema. Qual é a resposta?

Um teste diagnóstico para determinada doença D só pode resultar em positivo ou negativo, indicando presença ou ausência da doença.
Estima-se que a probabilidade de um falso negativo seja 0% e a probabilidade de um falso positivo seja 5%.
A taxa de incidência da doença é baixa. Um levantamento (survey) mostrou que, na população, ocorre um caso por mil habitantes.
Se uma pessoa selecionada ao acaso na população for submetida ao teste e o resultado der positivo, qual é a probabilidade de essa pessoa ter a doença D?

Resolva o problema aplicando o teorema de Bayes.

Se a pessoa tem a doença, o resultado do teste é verdadeiro positivo com probabilidade 1,000. O falso negativo ocorre com probabilidade 0,000.

P(+│D) = 1,000
P(-│D) = 0,000
Se a pessoa não tem a doença, o resultado do teste pode ser falso positivo com probabilidade 0,050 ou verdadeiro negativo com probabilidade 0,950.

P(+│D’) = 0,050
P(-│D’) = 0,950
A taxa de incidência da doença é um caso por mil habitantes.

P(D) = 0,001
P(D’) = 0,999
  

       
          A resposta é 0,0196 ou 1,96%.

Lembre-se de que sensibilidade do teste é a probabilidade de o teste dar resultado positivo em pessoas que têm a doença (no caso é 1,000). Especificidade é a probabilidade de o teste dar resultado negativo em pessoas que não têm a doença (no caso é 0,950). O teste é, portanto, sensível e específico.

Entretanto, alta sensibilidade e alta especificidade são condições necessárias, mas não suficientes para avaliar a correção do resultado do teste.  Na avaliação do resultado do teste, é preciso considerar probabilidades a priori de a pessoa ter a doença.

Vimos isso em postagens anteriores, em que se avaliou a probabilidade de ser certo um resultado positivo em quatro situações, com diferentes probabilidades a priori (estimativas diferentes da probabilidade de a pessoa ter a doença).

Leia mais em:

Patrick Maher Philosophy 471 Fall 2006
Howson, Colin e Urbach, Peter. Scientific Reasoning: the Bayesian approach. Open Court. 2006. P.13-26



















































































Saturday, August 29, 2015

Teorema de Bayes e teste diagnóstico na Genética


Antes de ver o exemplo, convém ler, neste mesmo blog, as postagens:
 Teorema de Bayes 
Testes diagnósticos: sensibilidade e especificidade .

Considere a porfiria, uma doença autossômica dominante. Toda pessoa afetada tem um genitor afetado e tem 50% de chance de transmitir o gene (e consequentemente a doença) para os filhos. Veja o heredograma, em que verde indica pessoa sem a doença e vermelho indica pessoa afetada.
 

Existe um teste para o diagnóstico precoce da doença, que tem sensibilidade  0,82 e especificidade é 0,963.

Situação 1: Uma pessoa teve resultado positivo no teste para a porfiria. Qual é a probabilidade de essa pessoa ter a doença?

Sem qualquer informação adicional, a resposta é óbvia: se a sensibilidade do teste (probabilidade de verdadeiros positivos no total de doentes) é 0,82, a probabilidade de essa pessoa ter porfiria é 0,82 ou 82%.

Situação 2: A porfiria é uma doença rara, que ocorre na população com probabilidade 0,01%. Se uma pessoa tomada ao acaso da população obtiver resultado positivo no teste para a doença, qual é a probabilidade de ela ter a doença?

Como a sensibilidade do teste é 0,82 e a especificidade é 0,963, a probabilidade de a pessoa, que teve resultado positivo no teste diagnóstico ter a doença deve ser obtida pelo teorema de Bayes. Veja o diagrama de árvore. Observando o diagrama, fica mais fácil calcular a probabilidade de a pessoa ter porfiria, dado que o teste positivou.




Situação 3: A porfiria é uma doença autossômica dominante. É dada a informação adicional de que uma pessoa que fez o teste tem um irmão germano com porfiria. Se o resultado  no teste foi positivo, qual é a probabilidade de essa pessoa ter a doença?

A probabilidade de um paciente que tem irmão com a doença ter porfiria se tiver resultado positivo no teste é obtida pelo teorema de Bayes. Observe o diagrama de árvore e calcule a probabilidade pedida.

Situação 4: Uma pessoa  não conhece seu histórico genético familiar (digamos foi adotada bebê), mas um médico experiente tem o palpite de que a  probabilidade de essa pessoa ter a porfíria é 30%. Se a pessoa positivar no teste, qual é a probabilidade de essa pessoa ter porfiria? 

A probabilidade é obtida aplicando o teorema de Bayes. Veja o diagrama de árvore e o cálculo abaixo.

Pense nisto: para a mesma pergunta – qual é a probabilidade de a pessoa ter a doença? – foram obtidas respostas  diferentes. Por quê?


O teorema de Bayes permite rever um valor calculado de probabilidade com base em informação anterior. Qual das respostas é a correta? Depende da situação:


v  Na 1ª situação, a probabilidade de a pessoa ter a doença foi obtida apenas pela sensibilidade do teste.
v  Na 2ª situação, a probabilidade foi obtida considerando a baixa prevalência na população, conhecida por grandes levantamentos (surveys) feitos anteriormente.
v  Na 3ª situação, a probabilidade a priori foi obtida considerando, em seu cálculo, conhecimento de genética e a história familiar do paciente.

v  Na 4ª situação, a probabilidade foi obtida levando em conta o palpite (educated guess) do médico, ou seja, a partir de intuição clínica.

                                   IMPORTANTE
O teorema de Bayes permite incorporar conhecimentos anteriores aos fatos observados: usamos um valor de probabilidade a priori (obtida antes de saber o resultado do teste) para mais bem estimar uma probabilidade a posteriori, obtida dos dados observados. 

Este exemplo é de 
Motulsky, H. Intuitive Biostatistics.Oxford universityPress. 1995. P133-6.















Saturday, August 15, 2015

Teorema de Bayes

Antes de apresentar o teorema de Bayes, convém lembrar a definição de probabilidade condicional, para registrar a diferença entre probabilidade condicional e o teorema de Bayes.
                                     Definição

Probabilidade condicional de B dado A é a probabilidade de ocorrer o evento B sob a condição de ocorrer o evento A. Indica-se por P(B|A), que se lê “probabilidade de B dado A”.
É importante notar: A e B são dois eventos dependentes que ocorrem em sequência.  O evento A antecede o evento B.
                               Exemplo
Uma urna contém cinco bolas diferentes apenas quanto à cor: duas são vermelhas, três são azuis. Retiram-se duas bolas da urna ao acaso, uma em seguida da outra, sem recolocar na urna a primeira bola retirada. 

Pergunta-se: Qual é a probabilidade de segunda bola  ser vermelha  sob a condição de primeira bola retirada ser a azul?

O diagrama de árvore ajuda entender o que pode acontecer quando se retiram duas bolas de uma urna, na situação descrita. Estão calculadas todas as probabilidades condicionais e assinalada em amarelo a probabilidade pedida.






A probabilidade de segunda bola  ser vermelha  sob a condição de primeira bola retirada ser a azul é dada pelo teorema da multiplicação de probabilidades, eventos dependentes:

       TEOREMA DE BAYES
 Os símbolos P(B ǀ A) e P(A ǀ B) podem ter aparência similar, mas há grande diferença no que eles representam. Por exemplo, faça A representar ter treinamento técnico e faça B representar executar um bom serviço. Veja:
   ·   P(ǀ A) = probabilidade de “bom serviço” dado o “treinamento técnico”.
   ·  P(ǀ B) = probabilidade de “ter treinamento técnico” dado o “bom serviço”.
 Outro exemplo: faça A representar ser bom aluno e faça B representar ser aprovado no vestibular. Veja:
  · P(ǀ A) = probabilidade de “ aprovado no vestibular” dado “ser bom aluno”.
   · P(ǀ B) = probabilidade de “ser bom aluno” dado “aprovado no vestibular”.
Muitos problemas envolvem um par de probabilidades condicionais. Vamos buscar a fórmula para obter P(A ǀ B). Para isso, veja a 2ª regra da multiplicação em postagem anterior (teorema da multiplicação de probabilidades ou a regra do e para eventos dependentes) e lembre-se de que A e B são dois eventos que ocorrem em sequência, A antecede B. Temos, pela "regra do e":
Donde:
Portanto:
Exemplo
Vamos voltar às bolas na urna, para entender que o teorema de Bayes responde pergunta diferente da que foi respondida pelo cálculo da probabilidade condicional.

Uma urna contém cinco bolas diferentes apenas quanto à cor: duas são vermelhas, três são azuis. Retiram-se duas bolas da urna ao acaso, uma em seguida da outra, sem recolocar na urna a primeira bola retirada. 

Pergunta: qual é a probabilidade de a primeira bola retirada ser azul, sob a condição de a segunda bola retirada ter sido a vermelha?

Veja o diagrama de árvore: bola vermelha na segunda retirada acontece de duas maneiras, isto é, azul e vermelha ou vermelha e vermelha:
evento de interesse é sair bola azul na primeira retirada dado ter saído bola vermelha na segunda retirada, ou seja: 


Então a probabilidade de a primeira bola retirada ser azul sob a condição de a segunda bola retirada ser vermelha é dada por:


                                 
Aplicamos o teorema de Bayes. Mas vamos formalizar.

Teorema de Bayes: Sejam A e B dois eventos dependentes que ocorrem em sequência, A antes de B. A probabilidade de ocorrer A sob a condição de ocorrer B é dada por:

Observe o esquema abaixo: está marcado o evento de interesse, que é a probabilidade de ocorrer A dado ter ocorrido B. Mas B pode ocorrer de duas maneiras: depois de A e depois de A-traço.





Lembrando: o teorema de Bayes é o “reverso” de probabilidade condicional:
·         A probabilidade condicional trata a probabilidade de ocorrer um evento B sob a condição de ocorrer seu antecedente A.
·         O teorema de Bayes trata a probabilidade de ocorrer o evento A sob a condição de ocorrer o evento B que sucede A.
Exemplo
Em uma cidade em que o teste do bafômetro é obrigatório, 25% dos motoristas têm o hábito de dirigir depois de beber. Quando testados, 99% dos motoristas que beberam positivam para álcool.  No entanto, 17% dos motoristas que não bebem também positivam no bafômetro.  Você é um agente da lei. Qual é a probabilidade de uma pessoa que positiva no bafômetro realmente ter feito uso de bebida alcoólica?

Os eventos “bebe” e “não bebe” serão indicados pelas letras BB e NB e o fato de positivar no bafômetro por + e - respectivamente. Veja o diagrama de árvore.



Exemplo
Você vai a uma corrida de cavalos. Dois cavalos estão no páreo: o Branco e o Negro. Branco venceu 5 das 12 vezes que correu com o Negro. E qual cavalo você apostaria? É razoável apostar no Negro porque, da informação que você tem, a probabilidade de o Branco ganhar é 5/12 e de o Negro ganhar é 7/12. Mas você recebe outra informação: chovia, em 3 das 5 corridas que Branco venceu e chovia, em 1 das 7 corridas que Negro venceu. Como está chovendo, você aposta em Branco. Qual a probabilidade de ele (e você!) ganhar? Veja o diagrama de árvore e ache a probabilidade pedida, que é ¾.

Notas: 1. Thomas Bayes (1702-1761) foi um pastor presbiteriano e matemático inglês, conhecido por ter formulado o caso especial do teorema de Bayes. 
           2. Estudar probabilidade pensando em dados, moedas, bolas em urnas é ótimo. Mas na prática não use esse artifício para resolver um  problema. 



Thursday, August 13, 2015

O que é pesquisa?


Pesquisa é uma forma de investigação. Não é possível fazer pesquisa sem que haja um problema para resolver ou uma pergunta para responder. Toda pesquisa é feita para ampliar o conhecimento, qualquer que seja a área de trabalho do pesquisador. Mas existem riscos e incertezas. O pesquisador precisa buscar evidências que apoiem sua argumentação para a solução do problema ou para a resposta à pergunta. Para chegar à evidência, um pesquisador precisa de dados. 

Método de pesquisa é a técnica usada para a coleta de dados, ou seja, é a estratégia usada pelo pesquisador para coletar as informações que precisa para resolver seu problema ou para responder a sua pergunta. Mas quais são os métodos de pesquisa?
Em linhas gerais, uma pesquisa pode ser feita segundo dois métodos, sendo então identificadas como:
        a)      Pesquisa qualitativa
        b)     Pesquisa quantitativa.
A pesquisa qualitativa tem o objetivo de entender o comportamento das pessoas, suas opiniões, seus conhecimentos, suas atitudes, suas crenças, seus medos. Está, portanto, relacionada ao significado que as pessoas atribuem às suas experiências do mundo e ao modo como entendem o mundo em que vivemos.  O pesquisador da área qualitativa levanta dados por meio de entrevistas, grupos de discussão, observação direta, análise de documentos e de discursos – ou seja, por meio de texto.
A pesquisa quantitativa tem o objetivo de contar, ordenar e medir para estabelecer a frequência e a distribuição dos fenômenos, para buscar padrões de relação entre variáveis, testar hipóteses existentes, estabelecer intervalos de confiança para parâmetros e margens de erro para as estimativas. O pesquisador da área quantitativa levanta, portanto, dados numéricos.
Em algumas áreas, os pesquisadores se envolvem em verdadeiras guerras para tentar determinar o “melhor” método de pesquisa. Mas o certo seria estudar as estratégias de pesquisa lado a lado. Por exemplo, um pesquisador que queira estudar a experiência subjetiva com uma doença mental deve entrevistar alguns pacientes e depois proceder á análise detalhada dos dados. Já o pesquisador que pretenda estudar a frequência e a distribuição dessas doenças na população, deve proceder a uma pesquisa quantitativa, levantando dados de grande número de pessoas 1.
Os dois métodos de pesquisa não são, portanto, nem opostos nem oponentes; ao contrário, são complementares. Quando se está diante de realidades pouco conhecidas, deve ser feita uma pesquisa qualitativa, que é menos estruturada. Nas áreas em que existem conhecimentos consagrados, é indicada a pesquisa quantitativa. A pesquisa qualitativa deve anteceder a quantitativa. De maneira simples, pode ser feita uma pesquisa qualitativa com poucas pessoas para levantar as palavras ou expressões mais comumente usadas para descrever sentimentos diante de uma situação vivida – como um grande incêndio, por exemplo. Depois, pode ser feita uma pesquisa quantitativa, organizando um questionário com as palavras ou expressões levantadas na pesquisa qualitativa, que será aplicado a um grande número de respondentes para comparar a distribuição estatística dos sentimentos expressos por diferentes grupos.
Historicamente, as pesquisas qualitativas são rejeitadas nas áreas de saúde por conta da grande possibilidade de viés e de as amostras serem muito pequenas para permitir generalizações. Não têm reprodutibilidade e, por isso, são consideradas, por alguns, como soft science. Mas – como colocam dois pesquisadores da área qualitativa – os críticos do método dizem que a pesquisa qualitativa traz muita informação sobre poucas unidades. E eles então rebatem: a pesquisa quantitativa também tem limitações, isto é, nenhuma pesquisa traz a “verdade” sobre o todo. Importantes são a competência do pesquisador e a propriedade dos dados, da análise, das conclusões. Não há dúvida de que esses pesquisadores têm razão: discutir qual é o método mais adequado de pesquisa não faz sentido. O pesquisador escolhe o método em função da pergunta que pretende responder. E deve usar as técnicas que tornaram o método científico, lembrando sempre que um estudo quantitativo pode gerar questões que precisam ser tratadas por método qualitativo, e vice-versa 3.
As pesquisas de intenção de votos são quantitativas. O pesquisador pergunta para grande número de pessoas: “Se a eleição fosse hoje, em quem o senhor votaria?” Calcula, então, os percentuais de votos para cada candidato, com as devidas margens de erro. Depois, pode escrever com bastante confiança: “Se a eleição fosse hoje, o candidato X muito provavelmente venceria.” A pesquisa é quantitativa.
Por ocasião das prévias eleitorais, muito se fala sobre a importância da pesquisa qualitativa. Nesse tipo de pesquisa, o entrevistador perguntaria, por exemplo, às pessoas: ”Que qualidades um Presidente da República deve ter?” ou “Quais são os principais problemas do país?” e depois analisaria o conteúdo das respostas dos respondentes. 
A questão4 “Que proporção de fumantes, considerando sexo e faixa de idade, já tentou parar de fumar?” necessita respostas por meio de pesquisa quantitativa. O pesquisador pergunta ou pede às pessoas que respondam um questionário. Depois, apura os dados, calcula os percentuais por sexo e faixa etária e faz generalizações, dentro de certa margem de erro. A pesquisa é quantitativa.
Para saber o que impede as pessoas de deixar o hábito de fumar, deve ser feita uma pesquisa qualitativa. O pesquisador perguntaria “Por que o senhor não para de fumar?” conversaria longamente com cada pessoa de um pequeno grupo, ouviria razões e opiniões e depois faria uma análise do conteúdo das respostas. A pesquisa é qualitativa.
Para saber o que as pessoas entendem quando se fala em descriminalizar as drogas, o pesquisador faria uma pesquisa qualitativa entrevistando poucas (cerca de 20) pessoas. Para saber o percentual de pessoas favoráveis à descriminalização das drogas, a distribuição desse porcentual por sexo, grupo de idade, nível de escolaridade, nível socioeconômico, região do país, o pesquisador faria uma pesquisa quantitativa entrevistando muitas (cerca de 2000) pessoas.
 REFERÊNCIAS
1.              FLICK, U. Uma introdução à pesquisa qualitativa. Tradução de Samira Netz. 2ed. Porto Alegre. Bookman 2004. p 272.
2.              Mays, N and Pope, C. (1995) Riguer and qualitative research. British Medical Journal 311: 109-12.
3.              MINAYO, Maria Cecilia S.; SANCHES, Odécio. Quantitativo-qualitativo: oposição ou complementaridade? Caderno de Saúde Pública, Rio de Janeiro, v. 9, n. 3, p. 239-262, jul/set, 1993. Disponível em: <http://www.scielo.br/pdf/csp/v9n3/02.pdf>. Acesso em: 10 de outubro de 2013.
4.               Greenhalgh, T. Como ler artigos científicos. Porto Alegre: Artmed, 2005. p. 176.

Saturday, July 25, 2015

Valor preditivo em um teste diagnóstico

            Um teste sensível ou um teste específico?

·  Teste sensível, se a suspeita for doença fatal, porém curável.
·  Teste específico, se a suspeita for doença fatal e incurável.

           As razões dessas recomendações são:

·  Se a doença for fatal, porém curável, melhor diagnosticar logo. Então, use um teste altamente sensível. Se o teste resultar positivo – considerando que o número de falsos positivos pode ser alto – faça outro teste, mais caro, porém mais específico.

·  Se a doença for fatal e incurável, melhor não dizer a uma pessoa que ela tem uma doença que na realidade não tem (os falsos positivos são comuns). No entanto, os falsos negativos não seriam tão ruins, uma vez que não existe tratamento para a doença. Mantenha a vigilância.

Agora, talvez você se pergunte:


·  Se o teste resultou positivo, qual é a probabilidade de o paciente ter a doença?
·  Se o teste resultou negativo, qual é a probabilidade de o paciente não ter a doença?

Valor preditivo


Valor preditivo positivo (VPP): é a probabilidade de resultado positivo correto no total de positivos obtidos.
em que VP é o número de verdadeiros positivos e FP é o número de falsos positivos.Evidentemente VP+FP é o total de resultados positivos na pesquisa sobre testes diagnósticos.

Valor preditivo negativo (VPN): é a probabilidade de resultado negativo correto no total de negativos obtidos.
em que VN é o número de verdadeiros negativos e FN é o número de falsos negativos.Evidentemente FP+VN é o total de resultados negativos na pesquisa sobre testes diagnósticos.
                                  Exemplo

    Pesquisadores testaram a presença de fator reumatóide (FR) no soro de uma amostra de 450 pacientes, 176 com artrite reumatóide e 274 sem a doença. Os dados apresentados na Tabela 1 permitem calcular o valor preditivo positivo (VPP) e o valor preditivo negativo (VPN) para o teste.

Tabela 1
Exame para fator reumatóide (FR) no soro de pacientes com e sem artrite reumatóide


É importante não confundir.

  Você deve se preocupar com a sensibilidade e a especificidade do teste quando precisa fazer o diagnóstico para o paciente que está a sua frente.

  Você deve se preocupar com valores preditivos quando tem em mãos o resultado do teste que pediu. Mas, para emitir um diagnóstico, você precisa saber a prevalência da doença.


Prevalência

     Prevalência de uma doença é a proporção de pessoas com essa doença na população.
     Para estimar a prevalência das doenças, são feitos grandes levantamentos de dados (surveys). É preciso saber (ou pelo menos ter ideia) das doenças, porque valores preditivos dependem da prevalência da doença. Veja os exemplos: como os valores preditivos mudam em função da prevalência da doença.

Exemplo: Valor preditivo de teste diagnóstico para doença com prevalência de 0,75


Tabela 2
:Distribuição dos dados segundo a doença e o resultado do teste

Prevalência = 0,75



Tabela 3
 Distribuição dos dados conforme a doença e o resultado do teste

Prevalência =0,25


      Literatura


Todo este texto tem como base:
Motulsky, H. Intuitive Biostatistics. New York. Oxford University Press. 1995. P: 129-135.
Vieira, S. Bioestatística: tópicos avançados. Rio de Janeiro. Elsevier. 4 ed. 2018.