Tuesday, February 21, 2023

Inferência bayesiana

 




Considere o seguinte cenário e pense na sua resposta intuitiva à questão formulada.

Um taxi que causou um acidente de trânsito se evadiu. Para julgar o caso, são fornecidos os seguintes dados: 85% dos taxis da cidade são da empresa Verde e 15% da empresa Azul. Uma testemunha que presenciou o acidente disse que o taxi era da empresa Azul. Essa testemunha foi colocada em teste e se verificou que nas condições do acidente, acertava a cor dos taxis 80% das vezes. Qual é a probabilidade de o taxi que causou o acidente ser da empresa Azul?

Este é um problema clássico de inferência bayesiana. Há duas fontes de informação: uma estatística populacional e o relato de uma testemunha não perfeitamente confiável. Essas duas informações devem ser combinadas usando o teorema de Bayes. Mas se quem julga nunca ouviu falar de Bayes, o que responderia?

Essa pessoa provavelmente optaria pelo relato da testemunha ali presente e diria 80%. As estatísticas populacionais, quando não são aberrações, são pouco consideradas quando a pessoa tem em mãos um relato pessoal, específico para o caso – principalmente se for recheado de detalhes.

Vamos agora ficar com o mesmo problema, mas mudar a história. Um taxi que causou um acidente de trânsito se evadiu. Para julgar o caso, são fornecidos os seguintes dados: há duas empresas de taxis na cidade, que têm o mesmo número de carros. Os taxis da empresa Verde são responsáveis por 85% dos acidentes de trânsito, e os da empresa Azul por 15% deles. Uma testemunha que presenciou o acidente disse que o taxi era da empresa Azul. Essa testemunha foi colocada em teste e se verificou que nas condições do acidente, acertava a cor dos taxis 80% das vezes. Qual é a probabilidade de o taxi que causou o acidente ser da empresa Azul? Se quem julga nunca ouviu falar de Bayes, provavelmente optará pela resposta 15%.

Isto porque essa pessoa provavelmente argumentará que, não sendo a testemunha plenamente confiável e já sabendo que taxistas da empresa Verde são maus motoristas, é razoável acreditar nas estatísticas populacionais, isto é, que a probabilidade de um motorista da empresa Azul causar um acidente é pequena, ou seja, 15%. Acontece que a pessoa criou um estereótipo: taxistas da empresa Verde são irresponsáveis. E é com base em estereótipos que julgamos verdadeiros fatos não-verdadeiros sobre qualquer membro de determinado grupo.

Mas qual é a probabilidade de o taxi que causou o acidente ser da empresa Azul? É 41,4%, segundo Kahneman. 

 

IMPORTANTE:  toda essa discussão está em

            Kahneman, D. Thinking...fast and slow. Farrar, Straus and Giroux.  2011 p.167-168.