A grande maioria das pesquisas é
feita com base em amostras, mas os pesquisadores querem generalizar seus
achados para a população de onde as amostras foram retiradas. Isto pode ser
feito, desde que a generalização esteja fundamentada em teste de hipóteses.
Para fazer o
teste, é preciso transformar a pergunta que motivou a pesquisa em duas
hipóteses que se contradizem. A ideia fica bem entendida com um exemplo
clássico na literatura de estatística. Imagine que um réu está sendo chamado a
juízo para responder por ação cível ou por crime. Quais são as hipóteses
possíveis?
·
O
réu é inocente.
·
O
réu é culpado.
A primeira
hipótese é referida na literatura de Estatística com hipótese da nulidade e a
segunda como hipótese alternativa.
Para tomar
decisão por uma das hipóteses, é preciso fazer uma análise dos dados
disponíveis que são apenas parte dos fatos, ou seja, uma amostra. No caso do
exemplo, quais são as decisões possíveis?
·
Considerar
o réu culpado.
·
Considerar
o réu inocente.
A decisão
tomada - qualquer que seja - pode estar errada porque quem julga conhece apenas
parte dos fatos. Quais são os erros possíveis?
·
Dizer
que o réu é culpado, quando é inocente.
·
Dizer
que o réu é inocente, quando é culpado.
É importante
ter em mente que toda inferência está sujeita a erro. A conclusão se
baseia em apenas uma amostra do universo e – por puro azar – podem ter sido
observada uma amostra pouco representativa desse universo. Definem-se, para a
Inferência Estatística, dois tipos de erro.
·
Erro
tipo I: rejeitar a hipótese da nulidade quando essa hipótese é verdadeira
·
Erro
tipo II: não rejeitar a hipótese da nulidade quando essa hipótese é falsa.
No caso do
exemplo, considera-se mais grave o erro de punir um inocente do que deixar
impune um culpado. Na pesquisa científica também se considera mais grave o erro
de rejeitar a hipótese da nulidade quando ela é verdadeira. Por quê? Porque
isso significa mudar padrões e comportamentos sem necessidade (só porque um
centro de pesquisas, apressadamente, apontou como verdadeira uma diferença que
não existe). Veja alguns exemplos de erro tipo I, que podem ocorrer na pesquisa
científica:
·
Dizer
que uma nova droga é melhor que a tradicional, quando isso não for verdade.
·
Dizer
que uma dieta aumenta a longevidade, quando isso não for verdade.
·
Dizer
que um produto é cancerígeno, quando isso não for verdade.
·
Dizer
que uma vitamina faz atletas, quando isso não for verdade.
O teste de
hipóteses não elimina a probabilidade de erro, mas fornece o p-valor
(valor de probabilidade) que permite decidir se existe evidência suficiente
para rejeitar a hipótese da nulidade. O p-valor diz quão provável seria
obter uma amostra tal qual a que foi obtida, quando a hipótese da nulidade é
verdadeira.
Os
pesquisadores se sentem seguros para rejeitar a hipótese da nulidade (assumir
que existe a diferença procurada) quando o p-valor é pequeno. Isto
porque seria muito pouco provável chegar ao resultado obtido, se a diferença
não existisse. Mas quem rejeita a hipótese da nulidade não tem certeza absoluta
(não tem 100% de confiança) de que a decisão tomada está correta – sabe, apenas,
que existe a probabilidade de erro.
Por
convenção, se o p-valor for menor do que 0,05 (p < 0,05), conclui-se
que a hipótese da nulidade deve ser rejeitada. É comum dizer, nos casos em que p
< 0,05, que os resultados são estatisticamente significantes. Calcular o p-valor
é extremamente difícil e isso só é feito, hoje em dia, usando programas de
computador.