Monday, June 06, 2016

Teste de Tukey para comparação de médias

Uma análise de variância (ANOVA) rejeita ou não a hipótese de igualdade de médias populacionais de diversos grupos, mas não determina quais grupos têm médias estatisticamente diferentes. Por essa razão, o teste F feito na análise de variância é considerado um teste global (omnibus test). Terminada a análise de variância, o pesquisador busca um novo teste para  comparar as médias de grupos.
Vamos tratar aqui o teste de Tukey, muito conhecido dos pesquisadores brasileiros. Você aplica o teste de Tukey para comparar médias duas a duas (pairwise comparison). Veja isso como uma vantagem do teste: você compara todos os pares de médias que tiver.
O teste de Tukey é, portanto, um teste a posteriori ou post-hoc. Faz comparações não planejadas (unplanned comparisons), ou seja, o pesquisador não precisa estabelecer as comparações de médias que irá fazer sem ter visto os dados. Veja isto como vantagem do teste.
Para proceder ao teste de Tukey, é preciso calcular a diferença mínima que deve haver entre duas médias para que elas possam ser consideradas diferentes ao nível de significância a. No Brasil, essa diferença é conhecida como diferença mínima significante e, em geral, indicada pela letra grega ∆ (lê-se delta), mas, na língua inglesa, Least Significant Difference (LSD), ou seja, diferença mínima significante é terminologia usada no teste de Fisher. John W. Tukey, autor do teste de Tukey, chamou a diferença mínima que deve haver entre duas médias para que elas possam ser consideradas diferentes ao nível de significância a de honestly significant difference (HSD), ou seja, diferença honestamente significante.

De qualquer forma, para obter o valor da diferença honestamente significante (∆ ou HSD) pelo teste de Tukey é preciso calcular:
Nessa fórmula:
  • q(k,gl,a) é denominado amplitude estudentizada e é encontrado na tabela de amplitude estudentizada q, ao nível de significância a, para k tratamentos e gl graus de liberdade do resíduo da ANOVA.
  • QMR é o quadrado médio do resíduo da análise de variância;
  • r é o número de repetições de cada um dos grupos.

Para entender como se usa a tabela de amplitude estudentizada q, observe uma parte dela, dada abaixo. O valor em negrito deve ser utilizado para comparar as médias de um experimento com seis tratamentos e 24 graus de liberdade no resíduo, ao nível de significância de 5%.
Valor de q para o nível de significância de 5% 

Graus de liberdade
Nº de médias em comparação
2
3
4
5
6
7
8
9
10
20
2,9500
3,5779
3,9583
4,2319
4,4452
4,6199
4,7676
4,8954
5,0079
21
2,9410
3,5646
3,9419
4,2130
4,4244
4,5973
4,7435
4,8699
4,9813
22
2,9329
3,5526
3,9270
4,1959
4,4055
4,5769
4,7217
4,8469
4,9572
23
2,9255
3,5417
3,9136
4,1805
4,3883
4,5583
4,7019
4,8260
4,9353
24
2,9188
3,5317
3,9013
4,1663
4,3727
4,5413
4,6838
4,8069
4,9153
25
2,9126
3,5226
3,8900
4,1534
4,3583
4,5258
4,6672
4,7894
4,8969
26
2,9070
3,5142
3,8796
4,1415
4,3451
4,5115
4,6519
4,7733
4,8800
27
2,9017
3,5064
3,8701
4,1305
4,3329
4,4983
4,6378
4,7584
4,8645
28
2,8969
3,4992
3,8612
4,1203
4,3217
4,4861
4,6248
4,7446
4,8500
29
2,8924
3,4926
3,8530
4,1109
4,3112
4,4747
4,6127
4,7319
4,8366
30
2,8882
3,4865
3,8454
4,1021
4,3015
4,4642
4,6014
4,7199
4,8241
Fonte: http://davidmlane.com/hyperstat/sr_table.html

De acordo com o teste, duas médias são estatisticamente diferentes ao nível de significância a toda vez que o valor absoluto da diferença entre elas for igual ou maior do que a diferença honestamente significante, ou seja, igual ou maior do que o valor HSD.

                                                   EXEMPLO
Considere os dados de diminuição da pressão arterial segundo o grupo, apresentados na Tabela 1. Esses dados foram submetidos à análise de variância apresentada na Tabela 2. Como o valor de F é significante ao nível de 5%, existe pelo menos uma média diferente das demais. As médias de grupos estão apresentadas na Tabela 3.

Tabela 1 - Diminuição da pressão arterial, em milímetros de mercúrio, segundo o grupo

Tabela 2 - Análise de variância 

Tabela 3 - Médias da diminuição de pressão arterial, em milímetros de mercúrio, segundo o grupo

Quais são as médias estatisticamente diferentes? A pergunta pode ser respondida com a aplicação do teste de Tukey. Considerando um nível de significância de 5%, tem-se que:
q = 4,3727 é o valor dado na tabela de amplitude estudentizada q ao nível de significância de 5%, associado a k = 6 grupos e gl =24 graus de liberdade de resíduo; QMR = 36,00 é o quadrado médio de  resíduo da ANOVA; r = 5 é o número de repetições.

É preciso calcular as diferenças de médias, duas a duas e compará-las com a diferença honestamente significante. Veja a Tabela 4: os tratamentos e as médias estão nas duas primeiras linhas e nas duas primeiras colunas, em negrito. As diferenças significantes ao nível de 5% estão assinaladas com um asterisco. 

Tabela 4 - Diferenças de médias de diminuição da pressão arterial
 

Pode ser mais fácil ver as comparações como mostra a tabela dada em seguida.

Tabela 5 - Diferenças de médias de diminuição da pressão arterial 
 

De acordo com o teste de Tukey, ao nível de 5%:
  • a média do tratamento A é maior do que a de B e a do controle;
  • a média do tratamento D é maior do que as médias de B, C, E e controle. 

Estes resultados também podem ser indicados por letras, como é dado em seguida e é usual nas “saídas” de programas de computador: 
  • quando letras diferentes aparecem em frente a duas médias, a diferença entre essas médias é estatisticamente significante; 
  • quando a mesma letra aparece em frente a duas médias, a diferença entre essas médias não é estatisticamente significante.

Tabela 6 - Comparação das médias de diminuição da pressão arterial


"Saída" do Minitab
Tukey Pairwise Comparisons 
 Grouping Information Using the Tukey Method and 95% Confidence

Treatment  N   Mean  Grouping
D               5   29,00     A
A               5   21,00     A  B
E               5   13,00         B  C
C               5   10,00         B  C
B               5     8,00            C
Control       5     2,00            C

Means that do not share a letter are significantly different.


Saída do SAS
                          Error Mean Square                         36
                          Critical Value of Studentized Range  4.37265
                          Minimum Significant Difference        11.733

                  Means with the same letter are not significantly different.

                      Tukey Grouping          Mean      N    trat

                                     A                29.000      5    4
                                     A 
                              B    A               21.000      5    1
                              B
                              B    C               13.000      5    5
                              B    C
                              B    C               10.000      5    3
                                     C
                                     C                 8.000      5    2                                  

                                     C                 2.000      5    6

**************************************************************
NOTA: Também se pode calcular estatística q para cada comparação de médias.Veja o exemplo de 

              ZAR, J. H. BIOSTATISTICAL ANALYSIS, 4th. ed. P. 210



Calcule: 





15 comments:

Miguel Petrere said...

Boa tarde professora Sônia
Por que há dois procedimentos para executar o teste de Tukey. Por exemplo o R não calcula o HSD; ele apenas compara a diferença entre as médias diretamente com o valor de q. Ele naõ calcula delta = q. RQ(QMR/r). Esse mesmo procedimento é seguido no livro do Zar, J.H. no livro do Zar, JH.2010. Biostatistical Analysis. 5a. edição. Prentice Hall. E daí as conclusões de cada procedimento são diferentes, o calculo com delta é mais conservador. Estranho!
A senhora poderia me explicar?

Miguel Petrere said...

Boa tarde professora Sônia
Por que há dois procedimentos para executar o teste de Tukey? Por exemplo o R não calcula o HSD; ele apenas compara a diferença entre duas médias diretamente com o valor de q. Ele não calcula delta = q. RQ(QMR/r). Esse mesmo procedimento é seguido no livro no livro do Zar, JH.2010. Biostatistical Analysis. 5a. edição. Prentice Hall. E daí as conclusões de cada procedimento são diferentes, o calculo com delta é mais conservador. Estranho!
A senhora poderia me explicar?

Sonia Vieira said...
This comment has been removed by the author.
Sonia Vieira said...

Só agora entendi a dúvida. Veja Teste de Tukey: procedimentos. Obrigada pela excelente dica.

Unknown said...

Boa tarde Professora Sônia,
Obrigado pela excelente explicação.

Patty said...

Bom dia Sonia. Parabéns pela página.
A explicação esta muito boa de se entender. Estou conseguindo fazer vários exercícios por causa das suas explicações. Página muito agregadora.
Parabéns por dividir com tanta habilidade seus conhecimentos estatísticos.

Unknown said...

Vc pode me dá uma resposta, é possível haver 3feito significativo sabendo q 2 experimentos possuem o mesmo numero de tratamentos e a mesma variável de resposta?

Sonia Vieira said...

Desculpe, mas não entendi a pergunta. Pode refazer?

incrivson said...

Ótimo post. Auxiliou bastante meu processo de aprendizagem.

Abs

Anonymous said...

Boa tarde professora Sônia, gosto muito mesmo do seu blog e é de grande utilidade. Gostaria de saber por que o teste de Tukey tem que ser feito só depois do ANOVA ser significativo.

Muito obrigada!
Ivanna

Sonia Vieira said...

Como os testes post hoc são executados para confirmar as diferenças que ocorreram entre os grupos, eles só devem ser executados quando houver diferença estatisticamente significante global das médias dos grupos (ou seja, um resultado de ANOVA estatisticamente significante).É um teste conservador.

Anonymous said...

Muito obrigada Sônia! Professores como você fazem toda a diferença.

Unknown said...

Boa noite! Gostaria de saber para comparação de medias qual eh o tamanho mínimo...ou qual deve ser a diferença entre os grupos a comparar...

Unknown said...
This comment has been removed by the author.
Sonia Vieira said...

O cálculo do tamanho da amostra exige várias informações como, por exemplo, a variância da variável de interesse.