Existem muitos métodos para comparações
múltiplas de médias, depois de uma análise de variância (ANOVA). A maioria
deles faz comparações pareadas, para determinar quais médias são
significativamente diferentes entre si. Dentre eles, o mais conhecido e mais
usado é o teste de Tukey que se baseia na distribuição de q, a
'amplitude estudentizada'.
Esse método é visto como o melhor quando os
tamanhos das amostras não são iguais ou quando é preciso obter intervalos de
confiança. No entanto, quando os tamanhos das amostras são iguais e não é
preciso calcular intervalos de confiança, o teste de Tukey é ligeiramente menos
poderoso do que o teste de Student-Newman-Keuls, que veremos aqui. É
interessante registrar que a diferença honestamente significante calculada pelo
teste de Tukey é adequada para comparar a maior média com a menor média do
conjunto de médias em comparação. No entanto, o teste usa a mesma diferença
para comparar qualquer par de médias, o que torna o procedimento conservador.
Mas o teste de Tukey tem uma grande vantagem:
está disponível em todos os softwares estatísticos (até mesmo em calculadoras
on line), o que nem sempre acontece com o teste de Student-Newman-Keuls.
O teste de Student-Newman-Keuls baseia-se, como
o teste de Tukey, na amplitude estudentizada q. É um procedimento de
natureza sequencial (stepwise), mas que pode ser visto como uma modificação do
teste de Tukey. Para entender o passo a passo, imagine que estão sendo
comparados m = 4 grupos. As médias de grupos foram calculadas e, por
facilidade, imagine que a média do primeiro grupo é menor que a do segundo, a
do segundo menor que a do terceiro e a do terceiro menor que a do quarto, isto
é:
x̄₁ < x̄₂ <
x̄₃ < x̄₄
Veja o esquema do procedimento: primeiro você
compara a maior média com a menor (m = 4); depois, faz duas comparações
com m = 3: a maior média com a segunda menor e a segunda maior com a
menor; depois, só restam comparações duas a duas.
Para cada comparação, calcule a diferença
honestamente significativa:
Nessa fórmula:
·
q (α, m, GL) é a amplitude estudentizada, no
nível de significância α, para comparar as duas médias que abrangem m
médias ordenadas, com os graus de liberdade do resíduo da ANOVA (GL).
·
QMR é o
quadrado médio do resíduo da análise de variância;
· r é o número de observações por grupo (estamos
pressupondo grupos de mesmo tamanho).
No caso do exemplo que vimos, em que há quatro
médias em comparação, procure na distribuição de q o valor para m =
4. Você então calcula dₘ para comparar a maior média com a menor. O
teste consiste em declarar – toda vez que o valor absoluto da diferença entre
duas médias que abrangem m médias ordenadas for igual ou maior do que a
diferença crítica – como significante no nível α. Se essa comparação não for significativa, não
faça mais comparações; caso contrário, continue.
Compare o próximo par de médias mais diferente
(a maior e a segunda menor ou a segunda maior e a menor) com a distribuição q
para comparar m - 1 médias. Se essa comparação não for significativa,
pare as comparações de médias. No entanto, se essa comparação for
significativa, continue comparando pares de médias sucessivamente, até que uma
comparação não seja significativa ou todas as comparações tenham sido feitas.
Exemplo
Considere os dados (fictícios) de diminuição da
pressão arterial apresentados na Tabela 1. Esses dados foram submetidos à
análise de variância, que está apresentada na Tabela 2. Como o valor de F
é significante no nível de 5%, existe pelo menos uma média diferente das
demais. As médias amostrais calculadas estão na Tabela 3.
Tabela
1 - Diminuição da pressão arterial, em milímetros de mercúrio, segundo o
grupo
Tabela 2 - Análise de
variância
Tabela
3 - Médias de diminuição da pressão arterial, em milímetros
de
mercúrio, segundo o grupo
A lista ordenada de m = 6 médias do
nosso exemplo está na Tabela 4. A maior média amostral é 29, do grupo D e a
menor é 2, do controle. Vamos calcular a diferença crítica dₘ para
comparar essas médias. Temos m = 6 e já sabemos, da Tabela 2, que o
resíduo da ANOVA tem 24 graus de liberdade e o quadrado médio é QMR = 36,00. Na
Tabela 1, temos r = 5. No nível de 5%, o valor de q α,m,24 é 4,3727.
A diferença entre o tratamento D e o controle
(29-2=27) é maior do que a diferença crítica 11,733. Então, em média, o
tratamento D determina maior diminuição da pressão arterial que o controle.
As diferenças das médias dos grupos D e B
(29-8=21) e A e controle (21-2=19) são significantes no nível de 5%. Então, em
média, o tratamento D determina maior diminuição da pressão arterial que B e A
determina maior diminuição da pressão arterial que o controle. Continue com as
comparações. A análise não termina por aqui.
Comparação
com o Teste de Tukey
De qualquer forma, fizemos, usando um software
estatístico, as comparações de médias usando tanto o teste de Tukey como o de
Student-Newman-Keuls. Os resultados estão na Tabela 4. Em colunas, estão os
grupos de médias que não diferem entre si. Note que o teste de
Student-Newman-Keuls tem mais poder, ou seja, acha mais valores significativos.
Por exemplo, esse teste mostrou que o tratamento D diminui a pressão arterial
mais que A, o que o teste de Tukey não mostrou.
Tabela
4- Grupos de tratamentos que diferem entre si,
segundo o teste estatístico
De
qualquer modo, é importante considerar que a escolha entre o teste de Tukey ou
Student-Newman-Keuls depende da necessidade racional – e bem explicada – de
detectar diferenças significantes entre as médias.
Vantagens e Desvantagens
Ao realizar todas as comparações pareadas, o
teste de Student-Newman-Keuls é a opção com mais poder e, em certas situações,
a melhor opção disponível quando não são necessários intervalos de confiança e
os tamanhos de amostras são iguais.
Leituras adicionais
- Seaman, M.A., Levin, J.R.,
Serlin, R.C. (1991). Psychological Bulletin 110: 577–586.
- Day, R.W., Quinn, G.P. (1989). Ecological Monographs 59: 433–463.
- Zar, J.H. Biostatistical Analysis.
- Dean, A., Voss, D. Design and Analysis of Experiments.
- Montgomery, D.C. Design and Analysis of Experiments.
No comments:
Post a Comment