Após
realizar uma análise de variância (ANOVA) para testar a hipótese de igualdade
entre médias populacionais, e constatada a significância do teste F, o
pesquisador busca uma forma de comparar as médias entre si. Para isso, são
aplicados os chamados testes post hoc ou a posteriori.
Diversos
testes estão disponíveis na literatura e nos softwares estatísticos. Mas surge
a dúvida: qual deles escolher?
Segundo
Winner (1962), os testes de comparação de médias podem ser ordenados do mais
liberal ao mais conservador da seguinte forma:
🔹 MRT de Duncan
🔹 Student-Newman-Keuls
🔹 LSD de Fisher
🔹 HSD de Tukey
🔹 S de Scheffé
Testes mais
liberais apontam mais facilmente diferenças significantes entre médias. Assim,
espera-se que o teste de Duncan identifique mais diferenças do que o teste de
Scheffé. Mas... seria adequado escolher sempre o teste que acusa mais
diferenças?
🔔 A ESCOLHA DEVE SER DEFENSÁVEL
O critério
fundamental para a escolha do teste é a sua adequação ao contexto
experimental. Por exemplo:
Se um
pesquisador da área da saúde compara o efeito de uma nova droga com
medicamentos convencionais no tratamento de uma doença grave, deve aplicar um
teste mais conservador, como o de Tukey ou o de Scheffé. Nesses casos,
não se deve proclamar uma descoberta sem um grau razoável de certeza.
Já em
experimentos da área agrícola, como a comparação entre 12 linhagens de soja em
fase preliminar de avaliação, a aplicação de um teste mais liberal, como
o de Duncan, pode ser vantajosa. Ele permite reduzir o número de linhagens a
serem mantidas para testes futuros, economizando tempo e recursos.
🔔 A IMPORTÂNCIA DO NÚMERO DE COMPARAÇÕES
Na prática,
pesquisadores raramente são questionados sobre os critérios que adotaram para
escolher um teste de médias. No entanto, quanto maior for o número de
comparações realizadas, maior será a probabilidade de obter conclusões
diferentes, dependendo do teste aplicado.
Se apenas
dois grupos forem comparados, todos os testes listados anteriormente levarão à
mesma conclusão. Mas com vários grupos, as diferenças aparecem.
Considere
um experimento com k grupos. Suponha que você decida comparar todas as
médias duas a duas após uma ANOVA. Haverá
comparações, cada uma realizada
com nível de significância α.
Se a hipótese nula de igualdade das médias for verdadeira, o risco de rejeição incorreta (erro tipo I) em uma comparação é α. A probabilidade de não cometer erro tipo I em uma comparação é 1−α. Em m comparações, a probabilidade de nenhum erro tipo I ocorrer é (1−α)m. Assim, a probabilidade de pelo menos um erro tipo I ocorrer (ou seja, de rejeitar H₀ em pelo menos uma comparação) é:
Após uma
ANOVA com três grupos — A, B e C — você decide aplicar comparações duas a duas,
com nível de significância de 5%. As médias populacionais são, na verdade,
iguais.
Se você
optar por um teste liberal, pode esperar mais rejeições da hipótese
nula. Utilizando a distribuição binomial, você pode calcular as probabilidades
de aceitar (A) ou rejeitar (R) H₀ nas três comparações:
A x B
A x C
B x C
A tabela abaixo ilustra os possíveis desfechos (A = aceitar H₀, R = rejeitar H₀) e suas respectivas probabilidades.
Comparações |
Probabilidade |
A, A, A |
0,857375 |
R, A, A |
0,045125 |
A, R, A |
0,045125 |
A, A, R |
0,045125 |
R, R, A |
0,002375 |
R, A, R |
0,002375 |
A, R, R |
0,002375 |
R, R, R |
0,000125 |
A soma
das probabilidades em que ao menos uma hipótese é rejeitada (ou seja,
ocorre erro tipo I) é:
0,045125 × 3 + 0,002375 × 3 + 0,000125= 0,142625
Assim,
mesmo tendo adotado α=0,05, a probabilidade real de cometer pelo menos
um erro tipo I nas três comparações é de aproximadamente 14,3%.
📝 CONSIDERAÇÕES FINAIS
A escolha
do teste post hoc não deve ser feita de forma automática, nem baseada apenas no
número de diferenças que ele aponta. O contexto do experimento, as possíveis
consequências da decisão e o objetivo da pesquisa devem guiar essa escolha.
Em ciência,
a estatística é essencial — mas deve ser usada com uma boa dose de ética e bom
senso.
VEJA:
1. Winner (1962) Apud Kris E. Berg e Richard W. Latin Research Methods in Health, Physical Education, Exercise Sciences and Recreation. 3ed. Lippincott. 2008. p 155.
No comments:
Post a Comment