Tuesday, September 22, 2015

Teorema de Bayes: exemplos

EXEMPLO 1

    1. Uma caixa contém duas bolas vermelhas e três bolas azuis. Duas bolas são retiradas ao acaso, uma em seguida da outra e sem que a primeira tenha sido recolocada.

 

a) Qual é a probabilidade de a segunda (evento B) bola retirada ser vermelha sob a condição de a primeira (evento A) bola retirada ser azul?

b) Qual é a probabilidade de a primeira (evento A) bola retirada ser a azul sob a condição de a segunda (evento B) ser vermelha?

 


A primeira questão pede uma probabilidade condicional:

            A segunda questão deve ser tratada pelo teorema de                      Bayes



EXEMPLO 2

Qual é a probabilidade de um motorista estar alcoolizado e causar um acidente de trânsito?

Qual é a probabilidade de um motorista causar acidente de trânsito dado que está alcoolizado?

Para resolver problemas que envolvem eventos dependentes que ocorrem em sequência, é importante saber a sequência. No exemplo, estão propositalmente postas as duas sequências possíveis. Então: motorista estar alcoolizado (evento A) e motorista causar acidente de trânsito (evento B).

 
         A primeira questão pede uma probabilidade condicional:
           A segunda questão deve ser tratada pelo teorema de                      Bayes


 EXERCÍCIOS

EXERCÍCIO 1: Uma urna contém cinco dados: quatro são balanceados, mas em um deles a probabilidade de ocorrer face “seis” é o triplo da probabilidade de ocorrer face “um”. As demais faces têm igual probabilidade de ocorrer. Um dado retirado da urna ao acaso é lançado. Qual é a probabilidade de esse dado ser balanceado se sair “seis”?

Dica: aplique o teorema de Bayes.

 

EXERCÍCIO 2: Uma urna contém cinco bolas: duas são vermelhas, três são azuis. Uma segunda urna contém sete bolas: três são vermelhas, quatro são azuis. Retira-se uma bola ao acaso de uma das urnas. Qual é a probabilidade de que essa bola, se for da cor azul, ter sido retirada da primeira urna?

 

EXERCÍCIO 3: Em uma cidade em que os carros são testados para emissão de poluentes, 25% deles emitem quantidade considerada excessiva. O teste falha para 99% dos carros que emitem excesso de poluentes, mas resulta positivo para 17% dos carros que não emitem quantidade excessiva. Qual é a probabilidade de um carro que falha no teste realmente emitir quantidade excessiva de poluentes?

EXERCÍCIO 4: A probabilidade de diagnosticar corretamente determinada doença rara é 0,70. Quando diagnosticada corretamente, a probabilidade de cura é 0,90. Se não for diagnosticada corretamente, a probabilidade de cura é 0,40.Se o paciente com a doença é curado, qual é a probabilidade de que tenha sido diagnosticado corretamente?

 

                                        RESPOSTAS

 

EXERCÍCIO 1

Vamos indicar por B dado balanceado e por V dado viciado. Vamos indicar face “seis” por 6 e as outras faces por n6. Então:

  


                                           EXERCÍCIO 2:

                            Fica mais claro assim?




                                 EXERCÍCIO 3:




                                     EXERCÍCIO 4:


   
Veja

2.    Freund JE & Smith, RM Statistics: a first course.Englewood Cliffs, Prentice Hall, 4ed. 1986. P 177.

Sunday, September 20, 2015

Teorema de Bayes na Genética

A distrofia muscular de Duchenne (DMD) progride rapidamente. Causa degeneração dos músculos e morte prematura. A causa principal da doença é uma mutação (alteração) em um gene chamado DMD, recessivo, localizado no cromossomo X. É, portanto, uma doença ligada ao sexo.
Se uma pessoa de sexo masculino tem o gene DMD, provavelmente manifestará a doença, mas para que uma mulher manifeste a doença é necessário que seja homozigota para esse gene recessivo.
No entanto, mulheres portadoras de mutação no gene DMD têm 50% de chance de transmitir esta alteração para seus filhos em cada gestação. Veja o heredograma, em que X’ representa o gene com mutação. Então:
·      portadoras estão indicadas por X’X,
·      não portadoras por XX,
·      homens sem a mutação no gene por XY,
·      homens com a mutação por X’Y.


                                 Exemplo
Uma mulher (vamos chamá-la de Maria) pergunta a probabilidade de ser portadora do gene para a distrofia muscular de Duchenne. Como um seu irmão e um tio, por parte da mãe, têm a doença, existe o gene na família e, muito provavelmente, a mãe de Maria é portadora do gene. Logo Maria tem 50% de probabilidade de ter herdado esse gene.
Maria tem dois filhos sem a doença. Veja abaixo o heredograma de Maria. Você saberia aplicar o teorema de Bayes? Vamos usar este exemplo para ilustrar o uso do teorema de Bayes em Genética.

1.      A probabilidade de Maria ser portadora do gene para a distrofia muscular de Duchenne é ½.
2.    A probabilidade de uma portadora do gene ter dois filhos (homens) sem a doença é
3.    A probabilidade de uma não portadora do gene ter dois filhos (homens) sem a doença é 1.
4.    A probabilidade de Maria ser portadora e ter dois filhos homens sem a doença é
5.   A probabilidade Maria ser não portadora e ter dois filhos homens sem a doença é
  6.   A probabilidade de a mulher ser portadora dado que tem dois filhos (homens) sem a doença é, aplicando o teorema de Bayes:
      Veja o esquema abaixo. Maria tem 20% de probabilidade de ser portadora do gene em questão.

NOTA:
 A doença pode ocorrer em famílias sem histórias conhecida. Veja, por exemplo, sobre distrofia muscular do tipo Duchenne:

1. Learning About Duchenne Muscular Dystrophyhttps://www.genome.gov/19518854
2.   Distrofias Musculares tipo Duchenne (DMD) e tipo Becker genoma.ib.usp.br/.../distrofias-musculares-tipo-duchenne-dmd-e-tipo-be...
3. .    Sex Linkage - Learn Genetics - University of Utahhttp://learn.genetics.utah.edu/content/pigeons/sexlinkage/

    O exemplo citado é de
  Motulsky, H. Intuitive Biostatistics. New York. Oxford University                     Press. 1995, p: 149-150.




Tuesday, September 15, 2015

Teorema de Bayes: a falácia da taxa de base

Vamos apresentar aqui o significado de falácia da taxa de base” usando como exemplo o resultado de um teste para detectar o uso de heroína.  Imagine que o teste para a droga em questão é altamente sensível e bastante específico.
·         A sensibilidade é 0,95 ou 95%, ou seja, a probabilidade de o teste dar resultado positivo (+) em usuários (U) é 0,95.
·        A especificidade é 0,90 ou 90%, ou seja, a probabilidade de o teste dar resultado negativo (-) em não usuários (não) é 0,95.

Escrevemos:
                              S = P (+|U) =0,95
                              E = P (-|não) =0,90
            Estima-se, com base em vários estudos que, em determinada região, 3% dos moradores são usuários de heroína. Pedro é morador dessa região e foi escolhido aleatoriamente para fazer o teste que detecta o uso de heroína. O resultado é positivo. Qual é a probabilidade de Pedro ser usuário?
Aplicando o teorema de Bayes:
                            Fórmula do teorema de Bayes

            A probabilidade de Pedro ser usuário de heroína dado que 

      o teste deu resultado positivo é




     Os cálculos mostram que a probabilidade de Pedro ser usuário de heroína é 0,227 ou, em porcentagem, 22,7%. Esse valor é praticamente sete vezes maior do que 3%, que é a probabilidade de ser encontrado um usuário de heroína na população estudada.
     Entretanto, o fato de Pedro, uma pessoa tomada ao acaso dessa população, ter obtido resultado positivo em um teste bastante sensível (sensibilidade de 95%) é evidência parcial. Embora nos faça pensar que Pedro é usuário da droga, a evidência total dessa conclusão é pequena simplesmente porque a probabilidade de encontrar um usuário de heroína na população estudada é baixa.
      É importante notar: a evidência adicional trazida pelo teste é alta, mas para julgar um fato é preciso olhar o total da evidência. É preciso atenção com as probabilidades a priori. No caso de Pedro, a probabilidade a priori praticamente anula o resultado do teste: nessa população, é raro encontrar um usuário de heroína. Então parece razoável considerar que o resultado do teste pode estar errado.
As pessoas tendem a tomar a evidência parcial como evidência total. É a falácia da taxa de base”. Elas tratam o resultado de um teste bastante confiável, porém não totalmente confiável, como o resultado final e conclusivo para uma hipótese que, afinal de contas, não é provável e deveria, portanto, esbarrar em dúvidas sobre sua veracidade.
Em termos gerais, qualquer pessoa que ainda não tenha pensado sobre determinado assunto acha relevante resultados de experimentos que confirmem a hipótese em teste. No entanto, o grau de confirmação que os dados trazem a uma pessoa que entende do assunto depende, em boa parte, do nível de confiança na hipótese. Mas todos irão concordar que dados ajudam a confirmar uma hipótese.
Quando a evidência mostrada pelos dados é relativizada por probabilidade a priori, nossa aceitação do resultado final depende da veracidade e da qualidade das estimativas, tanto da probabilidade a priori como da probabilidade a posteriori. Conclusão:
·         Resultado positivo para um teste de alta sensibilidade pode ser pouco provável, se a probabilidade a priori da ocorrência do evento for muito pequena  
·      Resultado positivo para um teste de alta sensibilidade pode ser altamente provável, se a probabilidade a priori da ocorrência do evento for muito grande.
  Então os resultados dos testes (todo tipo de teste, seja teste diagnóstico, teste estatístico, teste para vestibular) são apenas indicações da realidade – não são “provas” definitivas.

                       Este texto está totalmente baseado em
                Bayes' Theorem (Stanford Encyclopedia of Philosophy)                                                    plato.stanford.edu/entries/bayes-theorem

            Veja também:
                 Howson, C.; Urach, P. Scientific reasoning: the Bayesian approach.
                      Open Court. 2006.
          Maher, P. Howson 2: Bayes theorem.                                                                                                                                        patrick.maher1.net/471/lectures/howson2.pdf

          A discussão sobre falácia da taxa de base você encontra em:
                 Kahneman, D. Thinking, fast and slow.Nova York, Farrar, Straus, Giroux, 2013.