Saturday, August 29, 2015

Teorema de Bayes e teste diagnóstico na Genética


Antes de ver o exemplo, convém ler, neste mesmo blog, as postagens:
 Teorema de Bayes 
Testes diagnósticos: sensibilidade e especificidade .

Considere a porfiria, uma doença autossômica dominante. Toda pessoa afetada tem um genitor afetado e tem 50% de chance de transmitir o gene (e consequentemente a doença) para os filhos. Veja o heredograma, em que verde indica pessoa sem a doença e vermelho indica pessoa afetada.
 

Existe um teste para o diagnóstico precoce da doença, que tem sensibilidade  0,82 e especificidade é 0,963.

Situação 1: Uma pessoa teve resultado positivo no teste para a porfiria. Qual é a probabilidade de essa pessoa ter a doença?

Sem qualquer informação adicional, a resposta é óbvia: se a sensibilidade do teste (probabilidade de verdadeiros positivos no total de doentes) é 0,82, a probabilidade de essa pessoa ter porfiria é 0,82 ou 82%.

Situação 2: A porfiria é uma doença rara, que ocorre na população com probabilidade 0,01%. Se uma pessoa tomada ao acaso da população obtiver resultado positivo no teste para a doença, qual é a probabilidade de ela ter a doença?

Como a sensibilidade do teste é 0,82 e a especificidade é 0,963, a probabilidade de a pessoa, que teve resultado positivo no teste diagnóstico ter a doença deve ser obtida pelo teorema de Bayes. Veja o diagrama de árvore. Observando o diagrama, fica mais fácil calcular a probabilidade de a pessoa ter porfiria, dado que o teste positivou.




Situação 3: A porfiria é uma doença autossômica dominante. É dada a informação adicional de que uma pessoa que fez o teste tem um irmão germano com porfiria. Se o resultado  no teste foi positivo, qual é a probabilidade de essa pessoa ter a doença?

A probabilidade de um paciente que tem irmão com a doença ter porfiria se tiver resultado positivo no teste é obtida pelo teorema de Bayes. Observe o diagrama de árvore e calcule a probabilidade pedida.


Situação 4: Uma pessoa  não conhece seu histórico genético familiar (digamos foi adotada bebê), mas um médico experiente tem o palpite de que a  probabilidade de essa pessoa ter a porfíria é 30%. Se a pessoa positivar no teste, qual é a probabilidade de essa pessoa ter porfiria? 

A probabilidade é obtida aplicando o teorema de Bayes. Veja o diagrama de árvore e o cálculo abaixo.


Pense nisto: para a mesma pergunta – qual é a probabilidade de a pessoa ter a doença? – foram obtidas respostas  diferentes. Por quê?

O teorema de Bayes permite rever um valor calculado de probabilidade com base em informação anterior. Qual das respostas é a correta? Depende da situação:

v  Na 1ª situação, a probabilidade de a pessoa ter a doença foi obtida apenas pela sensibilidade do teste.
v  Na 2ª situação, a probabilidade foi obtida considerando a baixa prevalência na população, conhecida por grandes levantamentos (surveys) feitos anteriormente.
v  Na 3ª situação, a probabilidade a priori foi obtida considerando, em seu cálculo, conhecimento de genética e a história familiar do paciente.

v  Na 4ª situação, a probabilidade foi obtida levando em conta o palpite (educated guess) do médico, ou seja, a partir de intuição clínica.

                                   IMPORTANTE
O teorema de Bayes permite incorporar conhecimentos anteriores aos fatos observados: usamos um valor de probabilidade a priori (obtida antes de saber o resultado do teste) para mais bem estimar uma probabilidade a posteriori, obtida dos dados observados. 

Este exemplo é de 
Motulsky, H. Intuitive Biostatistics.Oxford universityPress. 1995. P133-6.















Saturday, August 15, 2015

Teorema de Bayes

Antes de apresentar o teorema de Bayes, convém lembrar a definição de probabilidade condicional, para registrar a diferença entre probabilidade condicional e o teorema de Bayes.
                                               Definição
Probabilidade condicional de B dado A é a probabilidade de ocorrer o evento B sob a condição de ocorrer o evento A. Indica-se por P(B|A), que se lê “probabilidade de B dado A”.
É importante notar: A e B são dois eventos dependentes que ocorrem em sequência.  O evento A antecede o evento B.
                                                  Exemplo
Uma urna contém cinco bolas diferentes apenas quanto à cor: duas são vermelhas, três são azuis. Retiram-se duas bolas da urna ao acaso, uma em seguida da outra, sem recolocar na urna a primeira bola retirada. 

Pergunta-se: Qual é a probabilidade de segunda bola  ser vermelha  sob a condição de primeira bola retirada ser a azul?

O diagrama de árvore ajuda entender o que pode acontecer quando se retiram duas bolas de uma urna, na situação descrita. Estão calculadas todas as probabilidades condicionais e assinalada em amarelo a probabilidade pedida.





A probabilidade de segunda bola  ser vermelha  sob a condição de primeira bola retirada ser a azul é dada pelo teorema da multiplicação de probabilidades, eventos dependentes:

       TEOREMA DE BAYES
 Os símbolos P(B ǀ A) e P(A ǀ B) podem ter aparência similar, mas há grande diferença no que eles representam. Por exemplo, faça A representar ter treinamento técnico e faça B representar executar um bom serviço. Veja:
   ·   P(ǀ A) = probabilidade de “bom serviço” dado o “treinamento técnico”.
   ·  P(ǀ B) = probabilidade de “ter treinamento técnico” dado o “bom serviço”.
 Outro exemplo: faça A representar ser bom aluno e faça B representar ser aprovado no vestibular. Veja:
  · P(ǀ A) = probabilidade de “ aprovado no vestibular” dado “ser bom aluno”.
   · P(ǀ B) = probabilidade de “ser bom aluno” dado “aprovado no vestibular”.
Muitos problemas envolvem um par de probabilidades condicionais. Vamos buscar a fórmula para obter P(A ǀ B). Para isso, veja a 2ª regra da multiplicação em postagem anterior (teorema da multiplicação de probabilidades ou a regra do e para eventos dependentes) e lembre-se de que A e B são dois eventos que ocorrem em sequência, A antecede B. Temos, pela "regra do e":
Donde:
Portanto:
Exemplo
Vamos voltar às bolas na urna, para entender que o teorema de Bayes responde pergunta diferente da que foi respondida pelo cálculo da probabilidade condicional.

Uma urna contém cinco bolas diferentes apenas quanto à cor: duas são vermelhas, três são azuis. Retiram-se duas bolas da urna ao acaso, uma em seguida da outra, sem recolocar na urna a primeira bola retirada. 

Pergunta: qual é a probabilidade de a primeira bola retirada ser azul, sob a condição de a segunda bola retirada ter sido a vermelha?

Veja o diagrama de árvore: bola vermelha na segunda retirada acontece de duas maneiras, isto é, azul e vermelha ou vermelha e vermelha:
evento de interesse é sair bola azul na primeira retirada dado ter saído bola vermelha na segunda retirada, ou seja: 


Então a probabilidade de a primeira bola retirada ser azul sob a condição de a segunda bola retirada ser vermelha é dada por:


                                 
Aplicamos o teorema de Bayes. Mas vamos formalizar.

Teorema de Bayes: Sejam A e B dois eventos dependentes que ocorrem em sequência, A antes de B. A probabilidade de ocorrer A sob a condição de ocorrer B é dada por:

Observe o esquema abaixo: está marcado o evento de interesse, que é a probabilidade de ocorrer A dado ter ocorrido B. Mas B pode ocorrer de duas maneiras: depois de A e depois de A-traço.



Lembrando: o teorema de Bayes é o “reverso” de probabilidade condicional:
·         A probabilidade condicional trata a probabilidade de ocorrer um evento B sob a condição de ocorrer seu antecedente A.
·         O teorema de Bayes trata a probabilidade de ocorrer o evento A sob a condição de ocorrer o evento B que sucede A.
Exemplo
Em uma cidade em que o teste do bafômetro é obrigatório, 25% dos motoristas têm o hábito de dirigir depois de beber. Quando testados, 99% dos motoristas que beberam positivam para álcool.  No entanto, 17% dos motoristas que não bebem também positivam no bafômetro.  Você é um agente da lei. Qual é a probabilidade de uma pessoa que positiva no bafômetro realmente ter feito uso de bebida alcoólica?

Os eventos “bebe” e “não bebe” serão indicados pelas letras BB e NB e o fato de positivar no bafômetro por + e - respectivamente. Veja o diagrama de árvore.



Exemplo
Você vai a uma corrida de cavalos. Dois cavalos estão no páreo: o Branco e o Negro. Branco venceu 5 das 12 vezes que correu com o Negro. E qual cavalo você apostaria? É razoável apostar no Negro porque, da informação que você tem, a probabilidade de o Branco ganhar é 5/12 e de o Negro ganhar é 7/12. Mas você recebe outra informação: chovia, em 3 das 5 corridas que Branco venceu e chovia, em 1 das 7 corridas que Negro venceu. Como está chovendo, você aposta em Branco. Qual a probabilidade de ele (e você!) ganhar? Veja o diagrama de árvore e ache a probabilidade pedida, que é ¾.

Notas: 1. Thomas Bayes (1702-1761) foi um pastor presbiteriano e matemático inglês, conhecido por ter formulado o caso especial do teorema de Bayes. 
           2. Estudar probabilidade pensando em dados, moedas, bolas em urnas é ótimo. Mas na prática não use esse artifício para resolver um  problema. 



Thursday, August 13, 2015

O que é pesquisa?


Pesquisa é uma forma de investigação. Não é possível fazer pesquisa sem que haja um problema para resolver ou uma pergunta para responder. Toda pesquisa é feita para ampliar o conhecimento, qualquer que seja a área de trabalho do pesquisador. Mas existem riscos e incertezas. O pesquisador precisa buscar evidências que apoiem sua argumentação para a solução do problema ou para a resposta à pergunta. Para chegar à evidência, um pesquisador precisa de dados. 

Método de pesquisa é a técnica usada para a coleta de dados, ou seja, é a estratégia usada pelo pesquisador para coletar as informações que precisa para resolver seu problema ou para responder a sua pergunta. Mas quais são os métodos de pesquisa?
Em linhas gerais, uma pesquisa pode ser feita segundo dois métodos, sendo então identificadas como:
        a)      Pesquisa qualitativa
        b)     Pesquisa quantitativa.
A pesquisa qualitativa tem o objetivo de entender o comportamento das pessoas, suas opiniões, seus conhecimentos, suas atitudes, suas crenças, seus medos. Está, portanto, relacionada ao significado que as pessoas atribuem às suas experiências do mundo e ao modo como entendem o mundo em que vivemos.  O pesquisador da área qualitativa levanta dados por meio de entrevistas, grupos de discussão, observação direta, análise de documentos e de discursos – ou seja, por meio de texto.
A pesquisa quantitativa tem o objetivo de contar, ordenar e medir para estabelecer a frequência e a distribuição dos fenômenos, para buscar padrões de relação entre variáveis, testar hipóteses existentes, estabelecer intervalos de confiança para parâmetros e margens de erro para as estimativas. O pesquisador da área quantitativa levanta, portanto, dados numéricos.
Em algumas áreas, os pesquisadores se envolvem em verdadeiras guerras para tentar determinar o “melhor” método de pesquisa. Mas o certo seria estudar as estratégias de pesquisa lado a lado. Por exemplo, um pesquisador que queira estudar a experiência subjetiva com uma doença mental deve entrevistar alguns pacientes e depois proceder á análise detalhada dos dados. Já o pesquisador que pretenda estudar a frequência e a distribuição dessas doenças na população, deve proceder a uma pesquisa quantitativa, levantando dados de grande número de pessoas 1.
Os dois métodos de pesquisa não são, portanto, nem opostos nem oponentes; ao contrário, são complementares. Quando se está diante de realidades pouco conhecidas, deve ser feita uma pesquisa qualitativa, que é menos estruturada. Nas áreas em que existem conhecimentos consagrados, é indicada a pesquisa quantitativa. A pesquisa qualitativa deve anteceder a quantitativa. De maneira simples, pode ser feita uma pesquisa qualitativa com poucas pessoas para levantar as palavras ou expressões mais comumente usadas para descrever sentimentos diante de uma situação vivida – como um grande incêndio, por exemplo. Depois, pode ser feita uma pesquisa quantitativa, organizando um questionário com as palavras ou expressões levantadas na pesquisa qualitativa, que será aplicado a um grande número de respondentes para comparar a distribuição estatística dos sentimentos expressos por diferentes grupos.
Historicamente, as pesquisas qualitativas são rejeitadas nas áreas de saúde por conta da grande possibilidade de viés e de as amostras serem muito pequenas para permitir generalizações. Não têm reprodutibilidade e, por isso, são consideradas, por alguns, como soft science. Mas – como colocam dois pesquisadores da área qualitativa – os críticos do método dizem que a pesquisa qualitativa traz muita informação sobre poucas unidades. E eles então rebatem: a pesquisa quantitativa também tem limitações, isto é, nenhuma pesquisa traz a “verdade” sobre o todo. Importantes são a competência do pesquisador e a propriedade dos dados, da análise, das conclusões. Não há dúvida de que esses pesquisadores têm razão: discutir qual é o método mais adequado de pesquisa não faz sentido. O pesquisador escolhe o método em função da pergunta que pretende responder. E deve usar as técnicas que tornaram o método científico, lembrando sempre que um estudo quantitativo pode gerar questões que precisam ser tratadas por método qualitativo, e vice-versa 3.
As pesquisas de intenção de votos são quantitativas. O pesquisador pergunta para grande número de pessoas: “Se a eleição fosse hoje, em quem o senhor votaria?” Calcula, então, os percentuais de votos para cada candidato, com as devidas margens de erro. Depois, pode escrever com bastante confiança: “Se a eleição fosse hoje, o candidato X muito provavelmente venceria.” A pesquisa é quantitativa.
Por ocasião das prévias eleitorais, muito se fala sobre a importância da pesquisa qualitativa. Nesse tipo de pesquisa, o entrevistador perguntaria, por exemplo, às pessoas: ”Que qualidades um Presidente da República deve ter?” ou “Quais são os principais problemas do país?” e depois analisaria o conteúdo das respostas dos respondentes. 
A questão4 “Que proporção de fumantes, considerando sexo e faixa de idade, já tentou parar de fumar?” necessita respostas por meio de pesquisa quantitativa. O pesquisador pergunta ou pede às pessoas que respondam um questionário. Depois, apura os dados, calcula os percentuais por sexo e faixa etária e faz generalizações, dentro de certa margem de erro. A pesquisa é quantitativa.
Para saber o que impede as pessoas de deixar o hábito de fumar, deve ser feita uma pesquisa qualitativa. O pesquisador perguntaria “Por que o senhor não para de fumar?” conversaria longamente com cada pessoa de um pequeno grupo, ouviria razões e opiniões e depois faria uma análise do conteúdo das respostas. A pesquisa é qualitativa.
Para saber o que as pessoas entendem quando se fala em descriminalizar as drogas, o pesquisador faria uma pesquisa qualitativa entrevistando poucas (cerca de 20) pessoas. Para saber o percentual de pessoas favoráveis à descriminalização das drogas, a distribuição desse porcentual por sexo, grupo de idade, nível de escolaridade, nível socioeconômico, região do país, o pesquisador faria uma pesquisa quantitativa entrevistando muitas (cerca de 2000) pessoas.
 REFERÊNCIAS
1.              FLICK, U. Uma introdução à pesquisa qualitativa. Tradução de Samira Netz. 2ed. Porto Alegre. Bookman 2004. p 272.
2.              Mays, N and Pope, C. (1995) Riguer and qualitative research. British Medical Journal 311: 109-12.
3.              MINAYO, Maria Cecilia S.; SANCHES, Odécio. Quantitativo-qualitativo: oposição ou complementaridade? Caderno de Saúde Pública, Rio de Janeiro, v. 9, n. 3, p. 239-262, jul/set, 1993. Disponível em: <http://www.scielo.br/pdf/csp/v9n3/02.pdf>. Acesso em: 10 de outubro de 2013.
4.               Greenhalgh, T. Como ler artigos científicos. Porto Alegre: Artmed, 2005. p. 176.