Feita a análise de
variância para testar a hipótese de igualdade de médias populacionais, o
pesquisador busca um teste para comparar essas médias. São os testes post hoc ou a posteriori. Diversos testes estão disponíveis na literatura de
estatística ou nos programas para computadores. Qual deles o pesquisador deve
selecionar?
Testes liberais revelam significância mais
facilmente do que testes conservadores.
Winner (1962) listou os testes de comparação de médias, do mais liberal ao mais
conservador, como segue: MRT de Duncan,
Student-Newman-Keuls, LSD de Fisher, HSD de Tukey, S de Scheffé. Isto significa que, se você aplicar o teste de
Duncan, muito provavelmente apontará mais diferenças significantes de médias do
que se aplicar o teste de Scheffé. É adequado usar o teste mais liberal?
Veja bem: o pesquisador
deve escolher o teste que seja experimentalmente defensável. Por exemplo, se um
pesquisador da área da saúde comparar o efeito de uma nova droga contra drogas
convencionais para doença séria, deveria ter o bom senso de não proclamar uma
descoberta, a menos que esteja razoavelmente seguro. Então, teste de Scheffé.
Por outro lado, se um pesquisador da área agrícola compara, por exemplo, 12
linhagens de soja em fase de avaliação, o teste de Duncan poderia, muito
provavelmente, reduzir o número de linhagens a serem comparadas em uma nova
avaliação.
A verdade é que os
pesquisadores raramente são questionados sobre a racional para a escolha de um
teste a posteriori. De qualquer forma, a possibilidade de diferença nas
conclusões é pequena, embora o teste de Duncan possa “ajudar” o pesquisador que
tem o objetivo de “provar” uma diferença.
É
muito provável achar diferença significante em testes que controlam o nível de
significância para comparações? Para que isso fique mais claro, suponha que
você tem um ensaio com k grupos e pretende, feita a análise de variância, testar a igualdade de médias populacionais, duas a duas. São possíveis
comparações de médias, ao nível de significância a.
Se as hipóteses de nulidade são verdadeiras, o
risco de, em um teste, rejeitar essa hipótese é a. Então
a probabilidade de que não ocorra erro tipo I nesse teste é 1 - a.
Como
exemplo, imagine que você deve fazer três comparações de médias, ao nível de
significância de 0,05:
H0:
mA = mB
H0:
mA = mC
H0:
mB = mC
As
médias populacionais são iguais. Você faz os testes e pode não rejeitar ou
aceitar H0 (A) ou rejeitar H0 (R). Veja as probabilidades,
usando a distribuição binomial:
A soma das probabilidades em vermelho, que é
0,142625, é a probabilidade de ter pelo menos um resultado errado. Então a
probabilidade de rejeitar H0 em pelo menos uma das comparações é aproximadamente
14,3%.
VEJA:
Winner (1962) Apud Kris E. Berg e Richard W. Latin Research Methods in Health, Physical Education, Exercise Sciences and Recreation. 3ed. Lippincott. 2008. p 155.
VEJA:
Winner (1962) Apud Kris E. Berg e Richard W. Latin Research Methods in Health, Physical Education, Exercise Sciences and Recreation. 3ed. Lippincott. 2008. p 155.
Megan Goldman. disponível em http://www.stat.berkeley.edu/users/mgoldman. Acesso em 29 de outubro de 2016.