Resumo
Quando a ANOVA indica diferenças significativas entre grupos, o passo seguinte é descobrir quais grupos realmente diferem entre si. Se os grupos têm tamanhos desiguais, o teste de Tukey-Kramer é uma escolha confiável e robusta. Neste post, explicamos como aplicar esse teste passo a passo, com exemplo real e interpretação dos resultados.
Quando o
pesquisador obtém um resultado significativo na ANOVA (Análise de Variância) e
seu experimento envolve três ou mais grupos, surge a necessidade de realizar
testes pós-hoc para comparar médias e identificar quais grupos diferem, em
média, entre si.
Há diversos
testes disponíveis para esse fim, alguns dos quais já discutimos em postagens
anteriores. Neste texto, vamos abordar o teste de Tukey-Kramer, recomendado para
as situações em que os grupos têm tamanhos desiguais. Nesses casos, é
necessário ajustar o procedimento, substituindo o tamanho comum dos grupos (r)
pelos tamanhos individuais ri e rj dos grupos em comparação.
Para
aplicar o teste de Tukey-Kramer, é preciso pressupor que as populações possuem variâncias
homogêneas. Assim, o quadrado médio do resíduo (QMR), obtido na
ANOVA, serve como estimativa da variância comum da variável.
A diferença
mínima significativa entre as médias de dois grupos de tamanhos ri
e rj, denotada por
di, é
calculada pela fórmula:
Onde:
· q(k,gl,α) é o valor
da amplitude estudentizada, obtido na tabela de valores críticos da
distribuição q;
· k é o número
de grupos;
· gl é o número
de graus de liberdade do resíduo na ANOVA;
· QMR é o
quadrado médio do resíduo;
· α é o nível
de significância (por exemplo, 5%).
Exemplo
A Tabela 1
apresenta os dados de um experimento com quatro grupos (quatro marcas de chá
verde). As médias de cada grupo estão indicadas ao final da tabela. O objetivo
é comparar essas médias utilizando o teste de Tukey-Kramer. Para isso, é
necessário realizar, primeiramente, uma ANOVA, que está apresentada na Tabela 2.
Em seguida,
realizam-se as comparações par a par das médias das marcas. Para aplicar o
teste, utilizou-se o valor de q para nível de significância de 5%, com k=4
grupos e n−k=24−4=20 graus de liberdade do resíduo.
Tabela 1
Conteúdo de ácido fólico (vitamina B) em folhas de chá verde selecionadas aleatoriamente de quatro marcas (1)
Tabela 2
Análise de variância dos dados da Tabela 1
Por
exemplo:
· Para
comparar a média da marca 1 com a da marca 2, com α=5%,
é preciso calcular:
· Para
comparar a média da marca 1 com a média da marca 3, com α=5%, procede-se de maneira
análoga.
O mesmo
procedimento é repetido para as demais combinações de marcas. A Tabela 3
apresenta as diferenças observadas entre as médias, bem como os respectivos
valores de dij. Quando a diferença absoluta entre duas médias
for maior que dij,
rejeita-se a hipótese de igualdade entre essas médias.
Tabela 3
Comparação de médias pelo teste de Tukey-Kramer
Interpretação
A
interpretação dos resultados da Tabela 3 indica, por exemplo, que a marca 1
apresenta, em média, maior teor de ácido fólico do que a marca 4, com diferença
estatisticamente significante.
Aproximação com média harmônica
O cálculo de todas as diferenças mínimas significantes pelo teste de Tukey-Kramer pode ser trabalhoso, especialmente quando feito manualmente. Com o auxílio de softwares estatísticos, esse processo é automatizado, mas nem sempre foi assim. Em situações em que os tamanhos dos grupos são aproximadamente iguais, é possível adotar uma simplificação: utilizar a fórmula tradicional do teste de Tukey substituindo r pela média harmônica dos tamanhos amostrais, denotada por H. A fórmula fica:
Essa abordagem é uma aproximação, e o controle do nível de significância pode não ser exato. Mas você pode encontrar esse procedimento em trabalhos mais antigos.
Com os dados da Tabela 1, onde os tamanhos dos grupos são 7, 5, 6 e 6, a média harmônica H é calculada por:
Então
Substituindo
esse valor na fórmula, obtém-se o valor de d a ser usado para todas as
comparações. Neste exemplo, a interpretação dos resultados permanece coerente
com a análise completa.
Veja a Tabela de amplitude estudentizada em
ANOVA & Tukey-Kramer test. https://www.youtube.com/watch?