Friday, September 14, 2012

O que é p-valor?

     A grande maioria das pesquisas é feita com base em amostras, mas os pesquisadores querem generalizar seus achados para a população de onde as amostras foram retiradas. Isto pode ser feito, desde que a generalização esteja fundamentada em teste de hipóteses. 
     Para fazer o teste, é preciso transformar a pergunta que motivou a pesquisa em duas hipóteses que se contradizem. A idéia fica bem entendida com um exemplo. Imagine que um réu está sendo chamado a juízo para responder por ação cível ou por crime. Quais são as hipóteses possíveis? 

  • O réu é inocente.
  • O réu é culpado.

     A primeira hipótese é referida na literatura de Estatística com hipótese da nulidade e a segunda como hipótese alternativa.
     Para tomar decisão por uma das hipóteses, é preciso fazer uma análise dos dados disponíveis que são apenas parte dos fatos, ou seja, uma amostra. No caso do exemplo, quais são as decisões possíveis?

  • Considerar o réu culpado.
  • Considerar o réu inocente.

     A decisão tomada - qualquer que seja - pode estar errada porque quem julga conhece apenas parte dos fatos. Quais são os erros possíveis?

  • Dizer que o réu é culpado, quando é inocente.
  • Dizer que o réu é inocente, quando é culpado.

     É importante ter em mente que toda inferência está sujeita a erro.  A conclusão se baseia em apenas uma amostra do universo e – por puro azar – podem ter sido observada uma amostra pouco representativa desse universo. Definem-se, para a Inferência Estatística, dois tipos de erro. 

  • Erro tipo I: rejeitar a hipótese da nulidade quando essa hipótese é verdadeira
  • Erro tipo II: não rejeitar a hipótese da nulidade quando essa hipótese é falsa.

     No caso do exemplo, considera-se mais grave o erro de punir um inocente do que deixar impune um culpado. Na pesquisa científica também se considera mais grave o erro de rejeitar a hipótese da nulidade quando ela é verdadeira. Por quê? Porque isso significa mudar padrões e comportamentos sem necessidade (só porque um centro de pesquisas, apressadamente, apontou como verdadeira uma diferença que não existe). Veja alguns exemplos de erro tipo I, que podem ocorrer na pesquisa científica:

  • Dizer que uma nova droga é melhor que a tradicional, quando isso não for verdade.
  • Dizer que uma dieta aumenta a longevidade, quando isso não for verdade.
  • Dizer que um produto é cancerígeno, quando isso não for verdade.
  • Dizer que uma vitamina faz atletas, quando isso não for verdade.

     O teste de hipóteses não elimina a probabilidade de erro, mas fornece o p-valor (valor de probabilidade) que permite decidir se existe evidência suficiente para rejeitar a hipótese da nulidade. O p-valor diz quão provável seria obter uma amostra tal qual a que foi obtida, quando a hipótese da nulidade é verdadeira.
     Os pesquisadores se sentem seguros para rejeitar a hipótese da nulidade (assumir que existe a diferença procurada) quando o p-valor é pequeno. Isto porque seria muito pouco provável chegar ao resultado obtido, se a diferença não existisse. Mas quem rejeita a hipótese da nulidade não tem certeza absoluta (não tem 100% de confiança) de que a decisão tomada está correta – sabe, apenas, que existe a probabilidade de erro. 
     Por convenção, se o p-valor for menor do que 0,05 (p < 0,05), concluí-se que a hipótese da nulidade deve ser rejeitada. É comum dizer, nos casos em que p < 0,05, que os resultados são estatisticamente significantes. Calcular o p-valor é extremamente difícil e isso só é feito, hoje em dia, usando programas de computador.