A grande maioria das pesquisas é feita com base em amostras, mas os
pesquisadores querem generalizar seus achados para a população de onde as
amostras foram retiradas. Isto pode ser feito, desde que a generalização esteja
fundamentada em teste de hipóteses.
Para fazer o teste, é
preciso transformar a pergunta que motivou a pesquisa em duas hipóteses que se
contradizem. A ideia fica bem entendida com um exemplo clássico na literatura
de estatística. Imagine que um réu está sendo chamado a juízo para responder
por ação cível ou por crime. Quais são as hipóteses possíveis?
·
O réu é inocente.
·
O réu é culpado.
A primeira hipótese é
referida na literatura de Estatística com hipótese da nulidade e a segunda como
hipótese alternativa.
Para tomar decisão por uma
das hipóteses, é preciso fazer uma análise dos dados disponíveis que são apenas
parte dos fatos, ou seja, uma amostra. No caso do exemplo, quais são as
decisões possíveis?
·
Considerar o réu culpado.
·
Considerar o réu inocente.
A decisão tomada -
qualquer que seja - pode estar errada porque quem julga conhece apenas parte
dos fatos. Quais são os erros possíveis?
·
Dizer que o réu é culpado, quando é inocente.
·
Dizer que o réu é inocente, quando é culpado.
É importante ter em mente que toda inferência está sujeita a erro. A conclusão se baseia em apenas uma amostra do universo e – por puro azar – podem ter sido observada uma amostra pouco representativa desse universo. Definem-se, para a Inferência Estatística, dois tipos de erro.
·
Erro tipo I: rejeitar a hipótese da
nulidade quando essa hipótese é verdadeira
· Erro tipo II: não rejeitar a hipótese da nulidade quando essa hipótese é falsa.
No caso do exemplo,
considera-se mais grave o erro de punir um inocente do que deixar impune um
culpado. Na pesquisa científica também se considera mais grave o erro de
rejeitar a hipótese da nulidade quando ela é verdadeira. Por quê? Porque isso
significa mudar padrões e comportamentos sem necessidade (só porque um centro
de pesquisas, apressadamente, apontou como verdadeira uma diferença que não
existe). Veja alguns exemplos de erro tipo I, que podem ocorrer na pesquisa
científica:
·
Dizer que uma nova droga é melhor que a
tradicional, quando isso não for verdade.
·
Dizer que uma dieta aumenta a longevidade,
quando isso não for verdade.
·
Dizer que um produto é cancerígeno, quando isso
não for verdade.
·
Dizer que uma vitamina faz atletas, quando isso
não for verdade.
O teste de hipóteses
não elimina a probabilidade de erro, mas fornece o p-valor (valor
de probabilidade) que permite decidir se existe evidência suficiente para
rejeitar a hipótese da nulidade. O p-valor diz quão provável seria
obter uma amostra tal qual a que foi obtida, quando a hipótese da nulidade é
verdadeira.
Os pesquisadores se sentem
seguros para rejeitar a hipótese da nulidade (assumir que existe a diferença
procurada) quando o p-valor é pequeno. Isto porque seria muito
pouco provável chegar ao resultado obtido, se a diferença não existisse. Mas
quem rejeita a hipótese da nulidade não tem certeza absoluta (não tem 100% de
confiança) de que a decisão tomada está correta – sabe, apenas, que existe a
probabilidade de erro.
Por convenção, se o p-valor
for menor do que 0,05 (p < 0,05), conclui-se que a hipótese da
nulidade deve ser rejeitada. É comum dizer, nos casos em que p <
0,05, que os resultados são estatisticamente significantes. Calcular o p-valor
é extremamente difícil e isso só é feito, hoje em dia, usando programas de
computador.