Uma
análise de variância (ANOVA) pode mostrar se existe diferença significante
entre grupos, mas não diz quais grupos diferem entre si. É, portanto, um teste
global. Então, logo após a ANOVA, é preciso comparar as médias.
Métodos usados para achar diferenças entre grupos, depois de um teste
global, são chamados a posteriori ou post
hoc (post hoc comparisons). Existem
diversos testes para a comparação de médias. Muito conhecidos dos pesquisadores
e usuais nos pacotes de estatística são o teste
de Tukey, já tratado em postagem anterior e o teste de Duncan, tratado aqui.
O teste
de Duncan, referido na literatura em língua inglesa como teste de amplitudes múltiplas de Duncan (Duncan’s multiple range test) e – por conta disso – indicado por
MRT, é um teste que se aplica após a análise de variância (ANOVA) para
identificar os pares de médias (de pelo menos três) que difiram estatisticamente. É um teste trabalhoso porque exige o cálculo de diversas amplitudes
(diferenças) mínimas significantes.
Vamos mostrar como se faz o
teste de Duncan usando um exemplo. Considere os dados (fictícios) de diminuição da pressão
arterial apresentados na Tabela 1. Esses dados foram submetidos à análise de
variância apresentada na Tabela 2. Como o valor de F é significante ao
nível de 5%, existe pelo menos uma média diferente das demais. As médias amostrais
calculadas estão na Tabela 3.
Tabela 1 - Diminuição
da pressão arterial,
em milímetros de mercúrio, segundo o grupo
Tabela 2 - Análise de variância
Tabelas 3 -
Médias de diminuição da pressão arterial, em milímetros
de mercúrio, segundo o grupo
Quais são as médias
estatisticamente diferentes? A pergunta
pode ser respondida com a aplicação do teste de Duncan. Vamos entender, então,
a racional do teste que, diferentemente do teste de Tukey, não compara médias
duas a duas.
O teste de Duncan compara a
amplitude de um conjunto de médias amostrais com uma amplitude mínima significante calculada. Se a amplitude das médias do conjunto
exceder a amplitude mínima
significante calculada, as médias da população são declaradas significantemente
diferentes.
É importante notar que o teste de Duncan é sequencial porque procura, primeiramente, a significância do conjunto de médias amostrais com maior
amplitude e, sequencialmente, a significância dos conjuntos de menor amplitude.
Quando uma amplitude encontrada não for significante, não são feitos mais testes.
Vamos entender isso por meio do exemplo.
Para proceder ao teste de Duncan, é preciso escrever as
médias de grupos em ordem decrescente (ou crescente), como mostra a Tabela 4.
Tabelas 4 - Médias de diminuição da pressão arterial, em milímetros de mercúrio, na ordem decrescente, segundo o grupo
A amplitude mínima significante, Rm, para comparar médias que abrangem m medias da lista ordenada das k médias em comparação é dada por
Nessa fórmula:
rm é o valor da amplitude mínima estudentizada significante (least
significant studentized range) ao nível de significância a, encontrado em tabelas; depende do número m de médias abrangidas na amplitude em comparação e do número de graus de liberdade do
quadrado médio do resíduo da ANOVA;
QMR é o quadrado médio do resíduo da ANOVA;
r é o número de repetições em cada grupo.
QMR é o quadrado médio do resíduo da ANOVA;
r é o número de repetições em cada grupo.
A lista ordenada de k
= 6 médias do nosso exemplo está na Tabela 4. Vamos calcular Rm para comparar a maior
média amostral, que é a média do grupo D, com a menor, ou seja, a do controle.
Já sabemos, da Tabela 2, que QMR = 36,00 e, da Tabela 1, que r = 5.
O valor de rm é
obtido em uma tabela de valores críticos para o teste de Duncan, ou amplitude
estudentizada significante mínima (least significant studentized range). O número de médias abrangidas no intervalo de médias, nessa primeira comparação, é m=6. o número de graus de liberdade do quadrado médio do resíduo da ANOVA (veja Tabela 2) é 24. Ao nível de significância de 5%, rm =3,276, como mostrado na Tabela 5.
Talvez você se pergunte: onde acho essa tabela? A
indicação é Harter, H. L. Critical values
for Duncan´s new multiple range test. Biometrics (16):671-685,1960. Você encontra
em Least
Signficant Studentized Ranges For Duncan's Test - Springer
link.springer.com/chapter/10.1007%2F978-1-4613-9629-1_13.
Tabela 5 - Amplitude
estudentizada mínima significante
(nível de significância de 5%)
Voltemos ao exemplo dado na Tabela 1. A amplitude estudentizada mínima significante para um intervalo que abrange 6 médias é dada por:
Reveja as médias amostrais dadas na Tabela 4. A amplitude das médias amostrais dos grupos D e controle, isto é, 29-2=27, é maior do que a amplitude
estudentizada mínima significante (27 > 8,79). Conclui-se que a o grupo D está associado a
valores significantemente maiores do que o controle (a=0,05).
Para conjuntos
com 5 médias, a amplitude estudentizada mínima significante é dada por:
Podem ser
comparados os grupos D e B, A e controle.As amplitudes observadas são
D e B: 29-8=21
A e controle: 21-2=19.
Como as
amplitudes observadas são maiores que R5, concluímos pela
significância ao nível de 5%.
Para conjuntos com 4 médias, a amplitude
estudentizada mínima significante é dada por:
Podem ser comparados os grupos D e C, A e B, E e controle.
D e C: 29-10=19
A e B: 21-8=13
E e controle: 13-2=11.
Todas as comparações revelaram-se significantes ao nível
de 5%. Podemos então continuar o teste.
A amplitude estudentizada mínima significante para conjuntos com 3 médias é:
Temos as comparações:
D e E:
29-13=16
A e C:
21-10=11
E e B:
13-8=5
C e controle: 10-2=8.
Note que D é
significantemente maior que E; A é significantemente maior que C, mas E e B e C
e controle não diferem estatisticamente. Então, podemos ainda comparar D com A
e A com E.
Para conjuntos com 2 médias:
Temos, então, duas comparações, ambas significantes ao
nível de 5%.
D e A:
29-21=8
A e E:
21-13=8
Podemos agora apresentar ois resultados na forma da saída
de programas de computador.
Tabela 6 – Comparação de médias pelo teste de Duncan
É
importante notar que não podem ser testadas diferenças de médias que estão
dentro de um intervalo de médias que não
são estatisticamente diferentes.É comum apresentar as médias de grupos em ordem
decrescente ou crescente. As médias são sublinhadas. Médias sublinhadas por uma
mesma linha não têm diferença significante. Veja o exemplo.
Finalmente, quando os
grupos são de tamanhos diferentes, substitua r é pela média harmônica dos tamanhos dos grupos.
VEJA :
1.
Montgomery DC. Design and Analysis of
Experiments. 4ed. New York: Wiley; 1997.
3.
http://www.ncbi.nlm.nih.gov/pmc/articles/PMC420045/
2 comments:
Olá Sônia, tenho aprendido bastante com suas explicações, entretanto, surgem algumas dúvidas referente ao tipos de testes.
Quando meus dados não apresentam distribuição normal e quero comparar a diferença de apenas dois conjuntos de amostras, posso utilizar o teste Wilcoxon. Entretanto ele não me diz qual conjunto de amostras é a melhor. Dando continuidade aos estudos desse conjunto de dados, gostaria de saber qual teste substituiria o teste de Tukey, quando meus dados são não-paramétricos e possua apenas dois conjuntos de dados.
Obrigado e parabéns pelas publicações.
Anderson.
Olá, Anderson. Para comparar dois grupos, quando a variável em análise não tem distribuição normal, aplique o teste de Mann-Whitney, se os grupos são independentes e o teste de Wilcoxon, se os grupos são dependentes. Se o teste resultar significante, compare as médias dos postos. Atenção, dos postos, não dos dados.Veja a postagem sobre Kruskal Wallis.
Post a Comment