Sonia Vieira: Teste de Tukey: o teste das diferenças honestas

Monday, June 06, 2016

Teste de Tukey: o teste das diferenças honestas

O primeiro passo na análise estatística de dados obtidos experimentalmente é uma análise de variância (ANOVA), desde que estejam satisfeitas as pressuposições para a aplicação dessa análise. É feito o teste da hipótese de igualdade entre as médias populacionais de vários grupos

H₀: m₁=m₂=…=m_k

contra a hipótese de que existem pelo menos duas médias diferentes entre si. No entanto, essa análise não identifica quais grupos possuem médias estatisticamente diferentes.

De qualquer forma, se a análise de variância resulta significante, o pesquisador procura um teste para comparar médias duas a duas (pairwise comparisons) e assim identificar os grupos que diferem entre si. Neste post, trataremos um desses testes - o teste de Tukey – provavelmente o mais utilizado nessas situações.

Esse teste pode fazer todas as comparações de médias duas a duas que o pesquisador quiser fazer (unplanned comparisons). Isto significa que não é preciso definir, já no projeto de pesquisa, as comparações que devem ser feitas. Por essa razão, o teste de Tukey é considerado um teste a posteriori (post-hoc).

🧩 Procedimento para o teste de Tukey

Para aplicar o teste de Tukey, é preciso calcular a diferença honestamente significante que deve existir entre duas médias para que elas possam ser consideradas significantemente diferentes, a um dado nível α.

Essa diferença, indicada por HSD, é dada pela fórmula:

Onde:

· q_(k,gl,_α₎ é a amplitude estudentizada, valor que se obtém em tabela e está associado ao número de grupos (k), aos graus de liberdade do resíduo (gl) e ao nível de significância (α);

· QMR é o quadrado médio do resíduo da ANOVA;

· r é o número de repetições por grupo.

Duas médias são consideradas estatisticamente diferentes no nível de significância estabelecido sempre que o valor absoluto da diferença entre elas for maior ou igual à HSD.

Como usar a tabela de amplitude estudentizada q

Veja o trecho da tabela apresentado a seguir. O valor em negrito corresponde à comparação de médias em um experimento com seis tratamentos (k=6) e 24 graus de liberdade no Resíduo da ANOVA (gl=24), com nível de significância de 5%.

Tabela

Valores de q para α=5%

💡 Uma observação importante: Nos softwares e na literatura em inglês, é comum usar a sigla HSD (Honestly Significant Difference) para identificar a diferença honestamente significante calculada pelo teste de Tukey. No Brasil, essa diferença costuma ser chamada de diferença mínima significante e é representada pela letra grega Δ(delta). Na língua inglesa, o termo Least Significant Difference (LSD) refere-se especificamente ao teste de Fisher. No caso do teste de Tukey, a diferença mínima entre médias é chamada de Honestly Significant Difference (HSD), denominação dada por seu autor, John W. Tukey.

🔍 EXEMPLO

Considere os dados de diminuição da pressão arterial, apresentados na Tabela 1. Esses dados foram submetidos a uma análise de variância (Tabela 2). Como o valor de F é significante no nível de 5%, concluímos que existe pelo menos uma média diferente das demais. As médias dos grupos são apresentadas na Tabela 2.

Tabela 1

Diminuição da pressão arterial (mmHg) segundo o grupo

Tabela 2

Médias da diminuição da pressão arterial por grupo

Tabela 3

Análise de variância (ANOVA)

Queremos saber quais médias são significativamente diferentes entre si. Para isso, vamos aplicar o teste de Tukey.

Cálculo da HSD

· q = 4,3727: valor da tabela de q para k=6, gl=24, α=5%;

· QMR =36,00: quadrado médio do resíduo da ANOVA;

· r = 5: número de repetições por grupo.

Comparações de Médias

Agora, comparamos as médias duas a duas. As diferenças significantes no nível de 5% estão indicadas com um asterisco.

Tabela 4

Diferenças de médias da diminuição da pressão arterial

✅ Conclusão De acordo com o teste de Tukey, no nível de 5% de significância:

· a média do tratamento A é maior do que a de B e a do controle;

· a média do tratamento D é maior do que as médias de B, C, E e controle.

🧩 Outputs

1. MINITAB

Tukey Pairwise Comparisons

Grouping Information Using the Tukey Method and 95% Confidence

Treatment N Mean Grouping

D 5 29,00 A

A 5 21,00 A B

E 5 13,00 B C

C 5 10,00 B C

B 5 8,00 C

Control 5 2,00 C

Means that do not share a letter are significantly different.

2. SAS

Error Mean Square 36

Critical Value of Studentized Range 4.37265

Minimum Significant Difference 11.733

Means with the same letter are not significantly different.

Tukey Grouping Mean N trat

A 29.000 5 4

B A 21.000 5 1

B C 13.000 5 5

B C

B C 10.000 5 3

C 8.000 5 2

C 2.000 5 6

· a média do tratamento A é maior do que a de B e a do controle;

· a média do tratamento D é maior do que as médias de B, C, E e controle.

🧩 NOTA

Entenda resultados indicados por letras, usuais em outputs de softwares:

· quando letras diferentes aparecem em frente a duas médias, a diferença entre essas médias é estatisticamente significante;

· quando a mesma letra aparece em frente a duas médias, a diferença entre essas médias não é estatisticamente significante.

Tabela 5

Comparação das médias de diminuição da pressão arterial

15 comments:

Miguel Petrere said...: Boa tarde professora Sônia
Por que há dois procedimentos para executar o teste de Tukey. Por exemplo o R não calcula o HSD; ele apenas compara a diferença entre as médias diretamente com o valor de q. Ele naõ calcula delta = q. RQ(QMR/r). Esse mesmo procedimento é seguido no livro do Zar, J.H. no livro do Zar, JH.2010. Biostatistical Analysis. 5a. edição. Prentice Hall. E daí as conclusões de cada procedimento são diferentes, o calculo com delta é mais conservador. Estranho!
A senhora poderia me explicar?; 11:20 AM
Miguel Petrere said...: Boa tarde professora Sônia
Por que há dois procedimentos para executar o teste de Tukey? Por exemplo o R não calcula o HSD; ele apenas compara a diferença entre duas médias diretamente com o valor de q. Ele não calcula delta = q. RQ(QMR/r). Esse mesmo procedimento é seguido no livro no livro do Zar, JH.2010. Biostatistical Analysis. 5a. edição. Prentice Hall. E daí as conclusões de cada procedimento são diferentes, o calculo com delta é mais conservador. Estranho!
A senhora poderia me explicar?; 11:21 AM
Sonia Vieira said...: This comment has been removed by the author.; 8:22 AM
Sonia Vieira said...: Só agora entendi a dúvida. Veja Teste de Tukey: procedimentos. Obrigada pela excelente dica.; 6:12 AM
Unknown said...: Boa tarde Professora Sônia,
Obrigado pela excelente explicação.; 2:33 PM
Patty said...: Bom dia Sonia. Parabéns pela página.
A explicação esta muito boa de se entender. Estou conseguindo fazer vários exercícios por causa das suas explicações. Página muito agregadora.
Parabéns por dividir com tanta habilidade seus conhecimentos estatísticos.; 3:31 AM
Unknown said...: Vc pode me dá uma resposta, é possível haver 3feito significativo sabendo q 2 experimentos possuem o mesmo numero de tratamentos e a mesma variável de resposta?; 7:14 AM
Sonia Vieira said...: Desculpe, mas não entendi a pergunta. Pode refazer?; 2:38 PM
incrivson said...: Ótimo post. Auxiliou bastante meu processo de aprendizagem.

Abs; 7:39 PM
Anonymous said...: Boa tarde professora Sônia, gosto muito mesmo do seu blog e é de grande utilidade. Gostaria de saber por que o teste de Tukey tem que ser feito só depois do ANOVA ser significativo.

Muito obrigada!
Ivanna; 11:21 AM
Sonia Vieira said...: Como os testes post hoc são executados para confirmar as diferenças que ocorreram entre os grupos, eles só devem ser executados quando houver diferença estatisticamente significante global das médias dos grupos (ou seja, um resultado de ANOVA estatisticamente significante).É um teste conservador.; 10:11 AM
Anonymous said...: Muito obrigada Sônia! Professores como você fazem toda a diferença.; 5:14 AM
Unknown said...: Boa noite! Gostaria de saber para comparação de medias qual eh o tamanho mínimo...ou qual deve ser a diferença entre os grupos a comparar...; 2:32 PM
Unknown said...: This comment has been removed by the author.; 2:34 PM
Sonia Vieira said...: O cálculo do tamanho da amostra exige várias informações como, por exemplo, a variância da variável de interesse.; 7:45 AM