Saturday, August 15, 2015

Teorema de Bayes

Antes de apresentar o teorema de Bayes, convém lembrar a definição de probabilidade condicional, para registrar a diferença entre probabilidade condicional e o teorema de Bayes.
                                     Definição

Probabilidade condicional de B dado A é a probabilidade de ocorrer o evento B sob a condição de ocorrer o evento A. Indica-se por P(B|A), que se lê “probabilidade de B dado A”.
É importante notar: A e B são dois eventos dependentes que ocorrem em sequência.  O evento A antecede o evento B.
                               Exemplo
Uma urna contém cinco bolas diferentes apenas quanto à cor: duas são vermelhas, três são azuis. Retiram-se duas bolas da urna ao acaso, uma em seguida da outra, sem recolocar na urna a primeira bola retirada. 

Pergunta-se: Qual é a probabilidade de segunda bola  ser vermelha  sob a condição de primeira bola retirada ser a azul?

O diagrama de árvore ajuda entender o que pode acontecer quando se retiram duas bolas de uma urna, na situação descrita. Estão calculadas todas as probabilidades condicionais e assinalada em amarelo a probabilidade pedida.






A probabilidade de segunda bola  ser vermelha  sob a condição de primeira bola retirada ser a azul é dada pelo teorema da multiplicação de probabilidades, eventos dependentes:

       TEOREMA DE BAYES
 Os símbolos P(B ǀ A) e P(A ǀ B) podem ter aparência similar, mas há grande diferença no que eles representam. Por exemplo, faça A representar ter treinamento técnico e faça B representar executar um bom serviço. Veja:
   ·   P(ǀ A) = probabilidade de “bom serviço” dado o “treinamento técnico”.
   ·  P(ǀ B) = probabilidade de “ter treinamento técnico” dado o “bom serviço”.
 Outro exemplo: faça A representar ser bom aluno e faça B representar ser aprovado no vestibular. Veja:
  · P(ǀ A) = probabilidade de “ aprovado no vestibular” dado “ser bom aluno”.
   · P(ǀ B) = probabilidade de “ser bom aluno” dado “aprovado no vestibular”.
Muitos problemas envolvem um par de probabilidades condicionais. Vamos buscar a fórmula para obter P(A ǀ B). Para isso, veja a 2ª regra da multiplicação em postagem anterior (teorema da multiplicação de probabilidades ou a regra do e para eventos dependentes) e lembre-se de que A e B são dois eventos que ocorrem em sequência, A antecede B. Temos, pela "regra do e":
Donde:
Portanto:
Exemplo
Vamos voltar às bolas na urna, para entender que o teorema de Bayes responde pergunta diferente da que foi respondida pelo cálculo da probabilidade condicional.

Uma urna contém cinco bolas diferentes apenas quanto à cor: duas são vermelhas, três são azuis. Retiram-se duas bolas da urna ao acaso, uma em seguida da outra, sem recolocar na urna a primeira bola retirada. 

Pergunta: qual é a probabilidade de a primeira bola retirada ser azul, sob a condição de a segunda bola retirada ter sido a vermelha?

Veja o diagrama de árvore: bola vermelha na segunda retirada acontece de duas maneiras, isto é, azul e vermelha ou vermelha e vermelha:
evento de interesse é sair bola azul na primeira retirada dado ter saído bola vermelha na segunda retirada, ou seja: 


Então a probabilidade de a primeira bola retirada ser azul sob a condição de a segunda bola retirada ser vermelha é dada por:


                                 
Aplicamos o teorema de Bayes. Mas vamos formalizar.

Teorema de Bayes: Sejam A e B dois eventos dependentes que ocorrem em sequência, A antes de B. A probabilidade de ocorrer A sob a condição de ocorrer B é dada por:

Observe o esquema abaixo: está marcado o evento de interesse, que é a probabilidade de ocorrer A dado ter ocorrido B. Mas B pode ocorrer de duas maneiras: depois de A e depois de A-traço.





Lembrando: o teorema de Bayes é o “reverso” de probabilidade condicional:
·         A probabilidade condicional trata a probabilidade de ocorrer um evento B sob a condição de ocorrer seu antecedente A.
·         O teorema de Bayes trata a probabilidade de ocorrer o evento A sob a condição de ocorrer o evento B que sucede A.
Exemplo
Em uma cidade em que o teste do bafômetro é obrigatório, 25% dos motoristas têm o hábito de dirigir depois de beber. Quando testados, 99% dos motoristas que beberam positivam para álcool.  No entanto, 17% dos motoristas que não bebem também positivam no bafômetro.  Você é um agente da lei. Qual é a probabilidade de uma pessoa que positiva no bafômetro realmente ter feito uso de bebida alcoólica?

Os eventos “bebe” e “não bebe” serão indicados pelas letras BB e NB e o fato de positivar no bafômetro por + e - respectivamente. Veja o diagrama de árvore.



Exemplo
Você vai a uma corrida de cavalos. Dois cavalos estão no páreo: o Branco e o Negro. Branco venceu 5 das 12 vezes que correu com o Negro. E qual cavalo você apostaria? É razoável apostar no Negro porque, da informação que você tem, a probabilidade de o Branco ganhar é 5/12 e de o Negro ganhar é 7/12. Mas você recebe outra informação: chovia, em 3 das 5 corridas que Branco venceu e chovia, em 1 das 7 corridas que Negro venceu. Como está chovendo, você aposta em Branco. Qual a probabilidade de ele (e você!) ganhar? Veja o diagrama de árvore e ache a probabilidade pedida, que é ¾.

Notas: 1. Thomas Bayes (1702-1761) foi um pastor presbiteriano e matemático inglês, conhecido por ter formulado o caso especial do teorema de Bayes. 
           2. Estudar probabilidade pensando em dados, moedas, bolas em urnas é ótimo. Mas na prática não use esse artifício para resolver um  problema. 



Thursday, August 13, 2015

O que é pesquisa?


Pesquisa é uma forma de investigação. Não é possível fazer pesquisa sem que haja um problema para resolver ou uma pergunta para responder. Toda pesquisa é feita para ampliar o conhecimento, qualquer que seja a área de trabalho do pesquisador. Mas existem riscos e incertezas. O pesquisador precisa buscar evidências que apoiem sua argumentação para a solução do problema ou para a resposta à pergunta. Para chegar à evidência, um pesquisador precisa de dados. 

Método de pesquisa é a técnica usada para a coleta de dados, ou seja, é a estratégia usada pelo pesquisador para coletar as informações que precisa para resolver seu problema ou para responder a sua pergunta. Mas quais são os métodos de pesquisa?
Em linhas gerais, uma pesquisa pode ser feita segundo dois métodos, sendo então identificadas como:
        a)      Pesquisa qualitativa
        b)     Pesquisa quantitativa.
A pesquisa qualitativa tem o objetivo de entender o comportamento das pessoas, suas opiniões, seus conhecimentos, suas atitudes, suas crenças, seus medos. Está, portanto, relacionada ao significado que as pessoas atribuem às suas experiências do mundo e ao modo como entendem o mundo em que vivemos.  O pesquisador da área qualitativa levanta dados por meio de entrevistas, grupos de discussão, observação direta, análise de documentos e de discursos – ou seja, por meio de texto.
A pesquisa quantitativa tem o objetivo de contar, ordenar e medir para estabelecer a frequência e a distribuição dos fenômenos, para buscar padrões de relação entre variáveis, testar hipóteses existentes, estabelecer intervalos de confiança para parâmetros e margens de erro para as estimativas. O pesquisador da área quantitativa levanta, portanto, dados numéricos.
Em algumas áreas, os pesquisadores se envolvem em verdadeiras guerras para tentar determinar o “melhor” método de pesquisa. Mas o certo seria estudar as estratégias de pesquisa lado a lado. Por exemplo, um pesquisador que queira estudar a experiência subjetiva com uma doença mental deve entrevistar alguns pacientes e depois proceder á análise detalhada dos dados. Já o pesquisador que pretenda estudar a frequência e a distribuição dessas doenças na população, deve proceder a uma pesquisa quantitativa, levantando dados de grande número de pessoas 1.
Os dois métodos de pesquisa não são, portanto, nem opostos nem oponentes; ao contrário, são complementares. Quando se está diante de realidades pouco conhecidas, deve ser feita uma pesquisa qualitativa, que é menos estruturada. Nas áreas em que existem conhecimentos consagrados, é indicada a pesquisa quantitativa. A pesquisa qualitativa deve anteceder a quantitativa. De maneira simples, pode ser feita uma pesquisa qualitativa com poucas pessoas para levantar as palavras ou expressões mais comumente usadas para descrever sentimentos diante de uma situação vivida – como um grande incêndio, por exemplo. Depois, pode ser feita uma pesquisa quantitativa, organizando um questionário com as palavras ou expressões levantadas na pesquisa qualitativa, que será aplicado a um grande número de respondentes para comparar a distribuição estatística dos sentimentos expressos por diferentes grupos.
Historicamente, as pesquisas qualitativas são rejeitadas nas áreas de saúde por conta da grande possibilidade de viés e de as amostras serem muito pequenas para permitir generalizações. Não têm reprodutibilidade e, por isso, são consideradas, por alguns, como soft science. Mas – como colocam dois pesquisadores da área qualitativa – os críticos do método dizem que a pesquisa qualitativa traz muita informação sobre poucas unidades. E eles então rebatem: a pesquisa quantitativa também tem limitações, isto é, nenhuma pesquisa traz a “verdade” sobre o todo. Importantes são a competência do pesquisador e a propriedade dos dados, da análise, das conclusões. Não há dúvida de que esses pesquisadores têm razão: discutir qual é o método mais adequado de pesquisa não faz sentido. O pesquisador escolhe o método em função da pergunta que pretende responder. E deve usar as técnicas que tornaram o método científico, lembrando sempre que um estudo quantitativo pode gerar questões que precisam ser tratadas por método qualitativo, e vice-versa 3.
As pesquisas de intenção de votos são quantitativas. O pesquisador pergunta para grande número de pessoas: “Se a eleição fosse hoje, em quem o senhor votaria?” Calcula, então, os percentuais de votos para cada candidato, com as devidas margens de erro. Depois, pode escrever com bastante confiança: “Se a eleição fosse hoje, o candidato X muito provavelmente venceria.” A pesquisa é quantitativa.
Por ocasião das prévias eleitorais, muito se fala sobre a importância da pesquisa qualitativa. Nesse tipo de pesquisa, o entrevistador perguntaria, por exemplo, às pessoas: ”Que qualidades um Presidente da República deve ter?” ou “Quais são os principais problemas do país?” e depois analisaria o conteúdo das respostas dos respondentes. 
A questão4 “Que proporção de fumantes, considerando sexo e faixa de idade, já tentou parar de fumar?” necessita respostas por meio de pesquisa quantitativa. O pesquisador pergunta ou pede às pessoas que respondam um questionário. Depois, apura os dados, calcula os percentuais por sexo e faixa etária e faz generalizações, dentro de certa margem de erro. A pesquisa é quantitativa.
Para saber o que impede as pessoas de deixar o hábito de fumar, deve ser feita uma pesquisa qualitativa. O pesquisador perguntaria “Por que o senhor não para de fumar?” conversaria longamente com cada pessoa de um pequeno grupo, ouviria razões e opiniões e depois faria uma análise do conteúdo das respostas. A pesquisa é qualitativa.
Para saber o que as pessoas entendem quando se fala em descriminalizar as drogas, o pesquisador faria uma pesquisa qualitativa entrevistando poucas (cerca de 20) pessoas. Para saber o percentual de pessoas favoráveis à descriminalização das drogas, a distribuição desse porcentual por sexo, grupo de idade, nível de escolaridade, nível socioeconômico, região do país, o pesquisador faria uma pesquisa quantitativa entrevistando muitas (cerca de 2000) pessoas.
 REFERÊNCIAS
1.              FLICK, U. Uma introdução à pesquisa qualitativa. Tradução de Samira Netz. 2ed. Porto Alegre. Bookman 2004. p 272.
2.              Mays, N and Pope, C. (1995) Riguer and qualitative research. British Medical Journal 311: 109-12.
3.              MINAYO, Maria Cecilia S.; SANCHES, Odécio. Quantitativo-qualitativo: oposição ou complementaridade? Caderno de Saúde Pública, Rio de Janeiro, v. 9, n. 3, p. 239-262, jul/set, 1993. Disponível em: <http://www.scielo.br/pdf/csp/v9n3/02.pdf>. Acesso em: 10 de outubro de 2013.
4.               Greenhalgh, T. Como ler artigos científicos. Porto Alegre: Artmed, 2005. p. 176.

Saturday, July 25, 2015

Valor preditivo em um teste diagnóstico

            Um teste sensível ou um teste específico?

·  Teste sensível, se a suspeita for doença fatal, porém curável.
·  Teste específico, se a suspeita for doença fatal e incurável.

           As razões dessas recomendações são:

·  Se a doença for fatal, porém curável, melhor diagnosticar logo. Então, use um teste altamente sensível. Se o teste resultar positivo – considerando que o número de falsos positivos pode ser alto – faça outro teste, mais caro, porém mais específico.

·  Se a doença for fatal e incurável, melhor não dizer a uma pessoa que ela tem uma doença que na realidade não tem (os falsos positivos são comuns). No entanto, os falsos negativos não seriam tão ruins, uma vez que não existe tratamento para a doença. Mantenha a vigilância.

Agora, talvez você se pergunte:


·  Se o teste resultou positivo, qual é a probabilidade de o paciente ter a doença?
·  Se o teste resultou negativo, qual é a probabilidade de o paciente não ter a doença?

Valor preditivo


Valor preditivo positivo (VPP): é a probabilidade de resultado positivo correto no total de positivos obtidos.
em que VP é o número de verdadeiros positivos e FP é o número de falsos positivos.Evidentemente VP+FP é o total de resultados positivos na pesquisa sobre testes diagnósticos.

Valor preditivo negativo (VPN): é a probabilidade de resultado negativo correto no total de negativos obtidos.
em que VN é o número de verdadeiros negativos e FN é o número de falsos negativos.Evidentemente FP+VN é o total de resultados negativos na pesquisa sobre testes diagnósticos.
                                  Exemplo

    Pesquisadores testaram a presença de fator reumatóide (FR) no soro de uma amostra de 450 pacientes, 176 com artrite reumatóide e 274 sem a doença. Os dados apresentados na Tabela 1 permitem calcular o valor preditivo positivo (VPP) e o valor preditivo negativo (VPN) para o teste.

Tabela 1
Exame para fator reumatóide (FR) no soro de pacientes com e sem artrite reumatóide


É importante não confundir.

  Você deve se preocupar com a sensibilidade e a especificidade do teste quando precisa fazer o diagnóstico para o paciente que está a sua frente.

  Você deve se preocupar com valores preditivos quando tem em mãos o resultado do teste que pediu. Mas, para emitir um diagnóstico, você precisa saber a prevalência da doença.


Prevalência

     Prevalência de uma doença é a proporção de pessoas com essa doença na população.
     Para estimar a prevalência das doenças, são feitos grandes levantamentos de dados (surveys). É preciso saber (ou pelo menos ter ideia) das doenças, porque valores preditivos dependem da prevalência da doença. Veja os exemplos: como os valores preditivos mudam em função da prevalência da doença.

Exemplo: Valor preditivo de teste diagnóstico para doença com prevalência de 0,75


Tabela 2
:Distribuição dos dados segundo a doença e o resultado do teste

Prevalência = 0,75



Tabela 3
 Distribuição dos dados conforme a doença e o resultado do teste

Prevalência =0,25


      Literatura


Todo este texto tem como base:
Motulsky, H. Intuitive Biostatistics. New York. Oxford University Press. 1995. P: 129-135.
Vieira, S. Bioestatística: tópicos avançados. Rio de Janeiro. Elsevier. 4 ed. 2018.













Friday, July 17, 2015

Testes diagnósticos: sensibilidade e especificidade

      
São feitos diagnósticos na área de saúde para estabelecer se o paciente tem ou não determinada doença. Também são feitos diagnósticos na área de engenharia para determinar, por exemplo, se os itens produzidos estão conformes ou não conformes.
Para se chegar a um diagnóstico, é usual proceder a um teste. Esses testes são seguros, o que não significa dizer que nunca chegam a resultado errado. Vamos mostrar aqui como são calculadas as probabilidades  de testes diagnósticos chegarem a resultados certos e a resultados errados.

  Se um médico suspeita que seu paciente esteja infectado por HIV, pede um exame de laboratório. O resultado pode ser “positivo” ou “negativo”. Qualquer que seja o resultado, é preciso considerar a possibilidade de o teste ter dado resultado errado. Veja o esquema abaixo, onde acertos estão em verde e erros estão em laranja:

        O resultado de um teste diagnóstico pode ser:

             Verdadeiro positivo se detectou a doença em quem tem a doença.
             Falso negativo se não detectou a doença em quem tem a doença.
             Verdadeiro negativo se não detectou doença em quem não tem.
             Falso positivo se detectou a doença em quem não tem a doença.

            Para estimar a probabilidade de ocorrer falsos positivos ou falsos negativos em testes diagnósticos, são feitos grandes levantamentos de dados. Os resultados para um teste diagnóstico dicotômico (que só pode resultar em positivo ou negativo) são apresentados em uma tabela de contingência:

·    Colocamos nas linhas resultado do teste (positivo ou negativo). 
·    Colocamos nas colunas o fato de a doença estar ou não presente .

     Se n1 doentes forem voluntariamente submetidos ao teste, teremos:

  •       VP verdadeiros positivos
  •      FN falsos negativos.
        Se n2 voluntários sadios forem submetidos ao teste, teremos:
  •      VN verdadeiros negativos 
  •      FP falsos positivos.
                                                  Tabela 1
 Resultados do teste diagnóstico


                  O teste tem sensibilidade (S) se detecta a doença em doentes:

                                        
        O teste tem especificidade (E) se resulta negativo em quem não tem a doença:

***********************************************
                                                  
                                                Exemplo 1
Considere que um teste diagnóstico X para detectar a doença Y foi aplicado em 1000 pessoas: 400 tinham a doença Y e 600 não tinham a doença Y. Os resultados do teste estão apresentados na Tabela 2.
                                                 Tabela 2
Resultados do teste diagnóstico 


O teste é sensívelporque detectou a doença em 95% dos casos. Então, a probabilidade de resultado positivo quando a pessoa tem a doença é alta.


O teste não é específico, porque acertou que a pessoa não tem a doença em apenas 60% dos casos. Então, a probabilidade de dar negativo em pessoas que não tem a doença é relativamente baixa.

                            **********************************************
                                              Exemplo 2

Foi feito um teste diagnóstico Z em 1200 pessoas: 500 tinham a doença para a qual o teste foi proposto e 700 não tinham a doença. Os resultados do teste estão na Tabela 3.
                                              Tabela 3
 Resultados do teste diagnóstico 


O teste não é sensível porque detectou a doença em apenas 64% dos doentes, ou seja, a probabilidade de resultado positivo em pessoa que tem a doença é baixa.

O teste é específico porque acertou que a pessoa não tem a doença 90% vezes, ou seja, a probabilidade de resultado negativo em pessoas que não têm a doença é alta.

                     **********************************************

Qual é o problema com os testes sensíveis?
   O número de falsos positivos é alto. Então muitas pessoas que não têm a doença são diagnosticadas como tendo a doença. Mas se a doença não pode ser negligenciada, escolha um teste sensível. 
Qual é o problema com os testes específicos?

   O número de falsos negativos é alto. Então muitas pessoas que têm a doença são diagnosticadas como não tendo a doença. Se o diagnóstico da doença pode ser traumático, escolha um teste específico porque, se a pessoa não tem a doença, o teste indica isso com alta probabilidade. 

Sinais e sintomas

   As definições de sensibilidade e especificidade também se aplicam aos sintomas e sinais. Assim:

·      Se o sintoma ou sinal é altamente sensível, aparece em quase todos os doentes.
·     Se o sintoma ou sinal é altamente específico, a ausência dele exclui a possibilidade de o indivíduo ter a doença.

                                        Acurácia
   Acurácia é a probabilidade de o teste dar resultado correto (positivo ou negativo).

                                   

    A acurácia pode parecer uma propriedade adequada para julgar um exame para diagnóstico, mas não é.  Como é a proporção dos resultados corretos na amostra, tanto positivos como negativos, se o valor da acurácia for alto não se sabe se o exame tem maior probabilidade de detectar verdadeiros positivos ou de detectar verdadeiros negativos.

                                            Literatura
      
     Todo este texto tem como base:
                   Motulsky, H. Intuitive Biostatistics. Nova York. Oxford University Press, 1995, p: 129-135.
                  Vieira, S. Bioestatística: tópicos avançados. Rio de Janeiro. Elsevier. 4 ed. 2018.