Sonia Vieira: August 2015

Saturday, August 29, 2015

Teorema de Bayes e teste diagnóstico na Genética

Antes de ver o exemplo, convém ler, neste mesmo blog, as postagens:
Teorema de Bayes
Testes diagnósticos: sensibilidade e especificidade .

Considere a porfiria, uma doença autossômica dominante. Toda pessoa afetada tem um genitor afetado e tem 50% de chance de transmitir o gene (e consequentemente a doença) para os filhos. Veja o heredograma, em que verde indica pessoa sem a doença e vermelho indica pessoa afetada.

Existe um teste para o diagnóstico precoce da doença, que tem sensibilidade 0,82 e especificidade é 0,963.

Situação 1: Uma pessoa teve resultado positivo no teste para a porfiria. Qual é a probabilidade de essa pessoa ter a doença?

Sem qualquer informação adicional, a resposta é óbvia: se a sensibilidade do teste (probabilidade de verdadeiros positivos no total de doentes) é 0,82, a probabilidade de essa pessoa ter porfiria é 0,82 ou 82%.

Situação 2: A porfiria é uma doença rara, que ocorre na população com probabilidade 0,01%. Se uma pessoa tomada ao acaso da população obtiver resultado positivo no teste para a doença, qual é a probabilidade de ela ter a doença?

Como a sensibilidade do teste é 0,82 e a especificidade é 0,963, a probabilidade de a pessoa, que teve resultado positivo no teste diagnóstico ter a doença deve ser obtida pelo teorema de Bayes. Veja o diagrama de árvore. Observando o diagrama, fica mais fácil calcular a probabilidade de a pessoa ter porfiria, dado que o teste positivou.

Situação 3: A porfiria é uma doença autossômica dominante. É dada a informação adicional de que uma pessoa que fez o teste tem um irmão germano com porfiria. Se o resultado no teste foi positivo, qual é a probabilidade de essa pessoa ter a doença?

A probabilidade de um paciente que tem irmão com a doença ter porfiria se tiver resultado positivo no teste é obtida pelo teorema de Bayes. Observe o diagrama de árvore e calcule a probabilidade pedida.

Situação 4: Uma pessoa não conhece seu histórico genético familiar (digamos foi adotada bebê), mas um médico experiente tem o palpite de que a probabilidade de essa pessoa ter a porfíria é 30%. Se a pessoa positivar no teste, qual é a probabilidade de essa pessoa ter porfiria?

A probabilidade é obtida aplicando o teorema de Bayes. Veja o diagrama de árvore e o cálculo abaixo.

Pense nisto: para a mesma pergunta – qual é a probabilidade de a pessoa ter a doença? – foram obtidas respostas diferentes. Por quê?

O teorema de Bayes permite rever um valor calculado de probabilidade com base em informação anterior. Qual das respostas é a correta? Depende da situação:

v Na 1ª situação, a probabilidade de a pessoa ter a doença foi obtida apenas pela sensibilidade do teste.

v Na 2ª situação, a probabilidade foi obtida considerando a baixa prevalência na população, conhecida por grandes levantamentos (surveys) feitos anteriormente.

v Na 3ª situação, a probabilidade a priori foi obtida considerando, em seu cálculo, conhecimento de genética e a história familiar do paciente.

v Na 4ª situação, a probabilidade foi obtida levando em conta o palpite (educated guess) do médico, ou seja, a partir de intuição clínica.

IMPORTANTE

O teorema de Bayes permite incorporar conhecimentos anteriores aos fatos observados: usamos um valor de probabilidade a priori (obtida antes de saber o resultado do teste) para mais bem estimar uma probabilidade a posteriori, obtida dos dados observados.

Este exemplo é de
Motulsky, H. Intuitive Biostatistics.Oxford universityPress. 1995. P133-6.

Saturday, August 15, 2015

Teorema de Bayes

Antes de apresentar o teorema de Bayes, convém lembrar a definição de probabilidade condicional, para registrar a diferença entre probabilidade condicional e o teorema de Bayes.

Definição

Probabilidade condicional de B dado A é a probabilidade de ocorrer o evento B sob a condição de ocorrer o evento A. Indica-se por P(B|A), que se lê “probabilidade de B dado A”.

É importante notar: A e B são dois eventos dependentes que ocorrem em sequência. O evento A antecede o evento B.

Exemplo

Uma urna contém cinco bolas diferentes apenas quanto à cor: duas são vermelhas, três são azuis. Retiram-se duas bolas da urna ao acaso, uma em seguida da outra, sem recolocar na urna a primeira bola retirada.

Pergunta-se: Qual é a probabilidade de a segunda bola ser vermelha sob a condição de a primeira bola retirada ser a azul?

O diagrama de árvore ajuda entender o que pode acontecer quando se retiram duas bolas de uma urna, na situação descrita. Estão calculadas todas as probabilidades condicionais e assinalada em amarelo a probabilidade pedida.

A probabilidade de a segunda bola ser vermelha sob a condição de a primeira bola retirada ser a azul é dada pelo teorema da multiplicação de probabilidades, eventos dependentes:

TEOREMA DE BAYES

Os símbolos P(B ǀ A) e P(A ǀ B) podem ter aparência similar, mas há grande diferença no que eles representam. Por exemplo, faça A representar ter treinamento técnico e faça B representar executar um bom serviço. Veja:

· P(B ǀ A) = probabilidade de “bom serviço” dado o “treinamento técnico”.

· P(A ǀ B) = probabilidade de “ter treinamento técnico” dado o “bom serviço”.

Outro exemplo: faça A representar ser bom aluno e faça B representar ser aprovado no vestibular. Veja:

· P(B ǀ A) = probabilidade de “ aprovado no vestibular” dado “ser bom aluno”.

· P(A ǀ B) = probabilidade de “ser bom aluno” dado “aprovado no vestibular”.

Muitos problemas envolvem um par de probabilidades condicionais. Vamos buscar a fórmula para obter P(A ǀ B). Para isso, veja a 2ª regra da multiplicação em postagem anterior (teorema da multiplicação de probabilidades ou a regra do e para eventos dependentes) e lembre-se de que A e B são dois eventos que ocorrem em sequência, A antecede B. Temos, pela "regra do e":

Donde:

Portanto:

Exemplo

Vamos voltar às bolas na urna, para entender que o teorema de Bayes responde pergunta diferente da que foi respondida pelo cálculo da probabilidade condicional.

Pergunta: qual é a probabilidade de a primeira bola retirada ser azul, sob a condição de a segunda bola retirada ter sido a vermelha?

Veja o diagrama de árvore: bola vermelha na segunda retirada acontece de duas maneiras, isto é, azul e vermelha ou vermelha e vermelha:

O evento de interesse é sair bola azul na primeira retirada dado ter saído bola vermelha na segunda retirada, ou seja:

Então a probabilidade de a primeira bola retirada ser azul sob a condição de a segunda bola retirada ser vermelha é dada por:

Aplicamos o teorema de Bayes. Mas vamos formalizar.

Teorema de Bayes: Sejam A e B dois eventos dependentes que ocorrem em sequência, A antes de B. A probabilidade de ocorrer A sob a condição de ocorrer B é dada por:

Observe o esquema abaixo: está marcado o evento de interesse, que é a probabilidade de ocorrer A dado ter ocorrido B. Mas B pode ocorrer de duas maneiras: depois de A e depois de A-traço.

Lembrando: o teorema de Bayes é o “reverso” de probabilidade condicional:

· A probabilidade condicional trata a probabilidade de ocorrer um evento B sob a condição de ocorrer seu antecedente A.

· O teorema de Bayes trata a probabilidade de ocorrer o evento A sob a condição de ocorrer o evento B que sucede A.

Exemplo

Em uma cidade em que o teste do bafômetro é obrigatório, 25% dos motoristas têm o hábito de dirigir depois de beber. Quando testados, 99% dos motoristas que beberam positivam para álcool. No entanto, 17% dos motoristas que não bebem também positivam no bafômetro. Você é um agente da lei. Qual é a probabilidade de uma pessoa que positiva no bafômetro realmente ter feito uso de bebida alcoólica?

Os eventos “bebe” e “não bebe” serão indicados pelas letras BB e NB e o fato de positivar no bafômetro por + e - respectivamente. Veja o diagrama de árvore.

Exemplo

Você vai a uma corrida de cavalos. Dois cavalos estão no páreo: o Branco e o Negro. Branco venceu 5 das 12 vezes que correu com o Negro. E qual cavalo você apostaria? É razoável apostar no Negro porque, da informação que você tem, a probabilidade de o Branco ganhar é 5/12 e de o Negro ganhar é 7/12. Mas você recebe outra informação: chovia, em 3 das 5 corridas que Branco venceu e chovia, em 1 das 7 corridas que Negro venceu. Como está chovendo, você aposta em Branco. Qual a probabilidade de ele (e você!) ganhar? Veja o diagrama de árvore e ache a probabilidade pedida, que é ¾.

Notas: 1. Thomas Bayes (1702-1761) foi um pastor presbiteriano e matemático inglês, conhecido por ter formulado o caso especial do teorema de Bayes.

2. Estudar probabilidade pensando em dados, moedas, bolas em urnas é ótimo. Mas na prática não use esse artifício para resolver um problema.

Thursday, August 13, 2015

O que é pesquisa?

Pesquisa é uma forma de investigação. Não é possível fazer pesquisa sem que haja um problema para resolver ou uma pergunta para responder. Toda pesquisa é feita para ampliar o conhecimento, qualquer que seja a área de trabalho do pesquisador. Mas existem riscos e incertezas. O pesquisador precisa buscar evidências que apoiem sua argumentação para a solução do problema ou para a resposta à pergunta. Para chegar à evidência, um pesquisador precisa de dados.

Método de pesquisa é a técnica usada para a coleta de dados, ou seja, é a estratégia usada pelo pesquisador para coletar as informações que precisa para resolver seu problema ou para responder a sua pergunta. Mas quais são os métodos de pesquisa?

Em linhas gerais, uma pesquisa pode ser feita segundo dois métodos, sendo então identificadas como:

a) Pesquisa qualitativa

b) Pesquisa quantitativa.

A pesquisa qualitativa tem o objetivo de entender o comportamento das pessoas, suas opiniões, seus conhecimentos, suas atitudes, suas crenças, seus medos. Está, portanto, relacionada ao significado que as pessoas atribuem às suas experiências do mundo e ao modo como entendem o mundo em que vivemos. O pesquisador da área qualitativa levanta dados por meio de entrevistas, grupos de discussão, observação direta, análise de documentos e de discursos – ou seja, por meio de texto.

A pesquisa quantitativa tem o objetivo de contar, ordenar e medir para estabelecer a frequência e a distribuição dos fenômenos, para buscar padrões de relação entre variáveis, testar hipóteses existentes, estabelecer intervalos de confiança para parâmetros e margens de erro para as estimativas. O pesquisador da área quantitativa levanta, portanto, dados numéricos.

Em algumas áreas, os pesquisadores se envolvem em verdadeiras guerras para tentar determinar o “melhor” método de pesquisa. Mas o certo seria estudar as estratégias de pesquisa lado a lado. Por exemplo, um pesquisador que queira estudar a experiência subjetiva com uma doença mental deve entrevistar alguns pacientes e depois proceder á análise detalhada dos dados. Já o pesquisador que pretenda estudar a frequência e a distribuição dessas doenças na população, deve proceder a uma pesquisa quantitativa, levantando dados de grande número de pessoas ¹.

Os dois métodos de pesquisa não são, portanto, nem opostos nem oponentes; ao contrário, são complementares. Quando se está diante de realidades pouco conhecidas, deve ser feita uma pesquisa qualitativa, que é menos estruturada. Nas áreas em que existem conhecimentos consagrados, é indicada a pesquisa quantitativa. A pesquisa qualitativa deve anteceder a quantitativa. De maneira simples, pode ser feita uma pesquisa qualitativa com poucas pessoas para levantar as palavras ou expressões mais comumente usadas para descrever sentimentos diante de uma situação vivida – como um grande incêndio, por exemplo. Depois, pode ser feita uma pesquisa quantitativa, organizando um questionário com as palavras ou expressões levantadas na pesquisa qualitativa, que será aplicado a um grande número de respondentes para comparar a distribuição estatística dos sentimentos expressos por diferentes grupos.

Historicamente, as pesquisas qualitativas são rejeitadas nas áreas de saúde por conta da grande possibilidade de viés e de as amostras serem muito pequenas para permitir generalizações. Não têm reprodutibilidade e, por isso, são consideradas, por alguns, como soft science. Mas – como colocam dois pesquisadores da área qualitativa ²– os críticos do método dizem que a pesquisa qualitativa traz muita informação sobre poucas unidades. E eles então rebatem: a pesquisa quantitativa também tem limitações, isto é, nenhuma pesquisa traz a “verdade” sobre o todo. Importantes são a competência do pesquisador e a propriedade dos dados, da análise, das conclusões. Não há dúvida de que esses pesquisadores têm razão: discutir qual é o método mais adequado de pesquisa não faz sentido. O pesquisador escolhe o método em função da pergunta que pretende responder. E deve usar as técnicas que tornaram o método científico, lembrando sempre que um estudo quantitativo pode gerar questões que precisam ser tratadas por método qualitativo, e vice-versa ³.

As pesquisas de intenção de votos são quantitativas. O pesquisador pergunta para grande número de pessoas: “Se a eleição fosse hoje, em quem o senhor votaria?” Calcula, então, os percentuais de votos para cada candidato, com as devidas margens de erro. Depois, pode escrever com bastante confiança: “Se a eleição fosse hoje, o candidato X muito provavelmente venceria.” A pesquisa é quantitativa.

Por ocasião das prévias eleitorais, muito se fala sobre a importância da pesquisa qualitativa. Nesse tipo de pesquisa, o entrevistador perguntaria, por exemplo, às pessoas: ”Que qualidades um Presidente da República deve ter?” ou “Quais são os principais problemas do país?” e depois analisaria o conteúdo das respostas dos respondentes.

A questão⁴ “Que proporção de fumantes, considerando sexo e faixa de idade, já tentou parar de fumar?” necessita respostas por meio de pesquisa quantitativa. O pesquisador pergunta ou pede às pessoas que respondam um questionário. Depois, apura os dados, calcula os percentuais por sexo e faixa etária e faz generalizações, dentro de certa margem de erro. A pesquisa é quantitativa.

Para saber o que impede as pessoas de deixar o hábito de fumar, deve ser feita uma pesquisa qualitativa. O pesquisador perguntaria “Por que o senhor não para de fumar?” conversaria longamente com cada pessoa de um pequeno grupo, ouviria razões e opiniões e depois faria uma análise do conteúdo das respostas. A pesquisa é qualitativa.

Para saber o que as pessoas entendem quando se fala em descriminalizar as drogas, o pesquisador faria uma pesquisa qualitativa entrevistando poucas (cerca de 20) pessoas. Para saber o percentual de pessoas favoráveis à descriminalização das drogas, a distribuição desse porcentual por sexo, grupo de idade, nível de escolaridade, nível socioeconômico, região do país, o pesquisador faria uma pesquisa quantitativa entrevistando muitas (cerca de 2000) pessoas.

REFERÊNCIAS

1. FLICK, U. Uma introdução à pesquisa qualitativa. Tradução de Samira Netz. 2ed. Porto Alegre. Bookman 2004. p 272.

2. Mays, N and Pope, C. (1995) Riguer and qualitative research. British Medical Journal 311: 109-12.

3. MINAYO, Maria Cecilia S.; SANCHES, Odécio. Quantitativo-qualitativo: oposição ou complementaridade? Caderno de Saúde Pública, Rio de Janeiro, v. 9, n. 3, p. 239-262, jul/set, 1993. Disponível em: <http://www.scielo.br/pdf/csp/v9n3/02.pdf>. Acesso em: 10 de outubro de 2013.

4. Greenhalgh, T. Como ler artigos científicos. Porto Alegre: Artmed, 2005. p. 176.

Doutora em Estatística pela USP

Livre Docente em Estatística pela Unicamp

Pós doctor na Universidade da California, Berkeley e Universidade Yale.

Além de diversos artigos em revistas nacionais e estrangeiras, publicou os livros:

1. Pela Editora Elsevier: Introdução à Bioestatística (5ed), Bioestatística: tópicos avançados (3ed), Estatística para a Qualidade 3ed), Metodologia Científica para a Área de Saúde (3ed), este último em co-autoria com William Saad Hossne.

2. Pela Editora Atlas: Elementos de Estatística (6ed), Como elaborar um questionário.

3. Pela Editora Cencage Learning: Estatística Básica.

4. Pela Editora Brasiliense: O que é Estatística (3ed).

Estão esgotados: Experimentação com seres humanos (Moderna), Como escrever uma tese (Atlas), Análise de variância (Atlas), Primeiro a gente chora (Cultura).

Possui um domínio online, no qual estão disponibilizadas algumas aulas de estatística elementar: https://profasoniavieira.wixsite.com/estatistica