Tuesday, February 21, 2023

Inferência bayesiana

 

Considere o seguinte cenário e pense na sua resposta intuitiva à questão formulada.

Um taxi que causou um acidente de trânsito se evadiu. Para julgar o caso, são fornecidos os seguintes dados: 85% dos taxis da cidade são da empresa Verde e 15% da empresa Azul. Uma testemunha que presenciou o acidente disse que o taxi era da empresa Azul. Essa testemunha foi colocada em teste e se verificou que nas condições do acidente, acertava a cor dos taxis 80% das vezes. Qual é a probabilidade de o taxi que causou o acidente ser da empresa Azul?

Este é um problema clássico de inferência bayesiana. Há duas fontes de informação: uma estatística populacional e o relato de uma testemunha não perfeitamente confiável. Essas duas informações devem ser combinadas usando o teorema de Bayes. Mas se quem julga nunca ouviu falar de Bayes, o que responderia?

Essa pessoa provavelmente optaria pelo relato da testemunha ali presente e diria 80%. As estatísticas populacionais, quando não são aberrações, são pouco consideradas quando a pessoa tem em mãos um relato pessoal, específico para o caso – principalmente se for recheado de detalhes.

Vamos agora ficar com o mesmo problema, mas mudar a história. Um taxi que causou um acidente de trânsito se evadiu. Para julgar o caso, são fornecidos os seguintes dados: há duas empresas de taxis na cidade, que têm o mesmo número de carros. Os taxis da empresa Verde são responsáveis por 85% dos acidentes de trânsito, e os da empresa Azul por 15% deles. Uma testemunha que presenciou o acidente disse que o taxi era da empresa Azul. Essa testemunha foi colocada em teste e se verificou que nas condições do acidente, acertava a cor dos taxis 80% das vezes. Qual é a probabilidade de o taxi que causou o acidente ser da empresa Azul? Se quem julga nunca ouviu falar de Bayes, provavelmente optará pela resposta 15%.

Isto porque essa pessoa provavelmente argumentará que, não sendo a testemunha plenamente confiável e já sabendo que taxistas da empresa Verde são maus motoristas, é razoável acreditar nas estatísticas populacionais, isto é, que a probabilidade de um motorista da empresa Azul causar um acidente é pequena, ou seja, 15%. Acontece que a pessoa criou um estereótipo: taxistas da empresa Verde são irresponsáveis. E é com base em estereótipos que julgamos verdadeiros fatos não-verdadeiros sobre qualquer membro de determinado grupo.

Mas qual é a probabilidade de o taxi que causou o acidente ser da empresa Azul? É 41,4%, segundo Kahneman. 

 

IMPORTANTE:  toda essa discussão está em

            Kahneman, D. Thinking...fast and slow. Farrar, Straus and Giroux.  2011 p.167-168.



3 comments:

Fernanda F. Alberti said...

Professora, poderia fazer um post explicando como se mede instrumentos de avaliação da qualidade de vida? Por exemplo, o DQOL-BRASIL para medição da qualidade de vida de pacientes diabéticos... e o Questionário Self-Care Inventory para medicação do autocuidado em Diabetes.. Estou com dificuldades de encontrar como faz para interpretar os resultados destes questionários na literatura e preciso para uma pesquisa que meu grupo está realizando.

Agradeço desde já!

Abraços

Sonia Vieira said...

Olá, Fernanda:Não sei se captei o problema, mas entendi que você utilizou esses questionários para levantar dados sobre pacientes diabéticos, tanto para avaliar a qualidade de vida como para avaliar a questão de autocuidados. Portanto, já tem os dados. Provavelmente, só avaliou cada paciente uma única vez, o que não dá a possibilidade de estudar a estabilidade (confiabilidade) através do teste re-teste. Também só utilizou os questionários, o que não dá para comparar com outros instrumentos de medida (que talvez não existam). É possível estabelecer algum tipo de correlação entre os resultados dos dois questionários, uma vez que parece plausível que tenha mais qualidade de vida quem tem mais cuidados consigo mesmo. De qualquer modo, é razoável fazer uma análise descritiva. Veja O impacto da doença degenerativa na família, neste meu blog. Você facilmente fará a mesma análise, para os dados obtidos nos dois questionários.

Fernanda F. Alberti said...

De fato, fiz as avaliações por meio dos dois questionários em dois tempos distintos com as mesmas pessoas: tempo zero e após três meses. Essa seria minha principal dúvida, qual teste faço para verificar a diferença de um tempo para outro, considerando que os dados são qualitativos. Irei ler seu blog com mais tempo. Obrigada professora! Abração