Monday, June 06, 2016

Teste de Tukey: o teste das diferenças honestas

Uma análise de variância (ANOVA) testa a hipótese de igualdade entre as médias populacionais de vários grupos. No entanto, essa análise não identifica quais grupos possuem médias estatisticamente diferentes entre siO teste realizado na ANOVA testa a hipótese

                                        H0: m1=m2= =mk

contra a hipótese de que existe pelo menos uma diferença de médias diferente de zero. Pelo fato de não identificar onde estão as diferenças, o teste F realizado na ANOVA é conhecido como teste global ou omnibus test.

De qualquer forma, se a análise de variância resulta significante, o pesquisador procura um teste para comparar as médias duas a duas (pairwise comparisons) e assim identificar os grupos que diferem entre si. Neste post, trataremos um desses testes - o teste de Tukey -provavelmente o mais utilizado nessas situações.                              

Na prática, é bastante conveniente o fato de o pesquisador não precisar definir, já no projeto de pesquisa,  quais comparações fará. E isto o teste de Tukey faz: realiza comparações não planejadas (unplanned comparisons). Por essa razão, é considerado um teste a posteriori (post-hoc). 

🧩 Procedimento para o teste de Tukey

Para aplicar o teste de Tukey, é preciso calcular a diferença honestamente significante que deve existir entre duas médias para que elas possam ser consideradas significantemente diferentes, a um dado nível  α

Essa diferença, indicada por HSD,  é dada pela fórmula:

Onde:

·  q(k,gl,α) é a amplitude estudentizada, valor que se obtém em tabela e está associado ao número de grupos (k), aos graus de liberdade do resíduo (gl) e ao nível de significância (α);

·  QMR é o quadrado médio do resíduo da ANOVA;

·  r é o número de repetições por grupo.

Duas médias são consideradas estatisticamente diferentes no nível de significância estabelecido (α) sempre que o valor absoluto da diferença entre elas for maior ou igual à HSD.

                🛑  Como usar a tabela de amplitude estudentizada q

Veja o trecho da tabela apresentado a seguir. O valor em negrito corresponde à comparação de médias em um experimento com seis tratamentos (k=6) e 24 graus de liberdade no Resíduo da ANOVA (gl=24), com nível de significância de 5%.

Tabela

Valores de q para α=5%

💡 Observe: Nos softwares e na literatura em inglês, é comum usar a sigla HSD (Honestly Significant Difference)  para identificar a diferença honestamente significante calculada no teste de Tukey. No Brasil, essa diferença costuma ser chamada de diferença mínima significante e é  representada pela letra grega Δ(delta).

Contudo, vale uma observação importante: em língua inglesa, o termo Least Significant Difference (LSD) refere-se especificamente ao teste de Fisher. No caso do teste de Tukey, a diferença mínima entre médias é chamada de Honestly Significant Difference (HSD),  denominação dada por seu autor, John W. Tukey.

                                         🔍 EXEMPLO

Considere os dados de diminuição da pressão arterial, apresentados na Tabela 1. Esses dados foram submetidos a uma análise de variância (Tabela 2). Como o valor de F é significante no nível de 5%, concluímos que existe pelo menos uma média diferente das demais. As médias dos grupos são apresentadas na Tabela 2.

Tabela 1

Diminuição da pressão arterial (mmHg) segundo o grupo

 

Tabela 2

Médias da diminuição da pressão arterial por grupo


Tabela 3

Análise de variância (ANOVA)

Queremos saber quais médias são significativamente diferentes entre si. Para isso, vamos aplicar o teste de Tukey.

Cálculo da HSD

·     = 4,3727: valor da tabela de q para k=6, gl=24, α=5%;

·     QMR =36,00: quadrado médio do resíduo da ANOVA;

·     = 5: número de repetições por grupo.

Comparações de Médias

Agora, comparamos as médias duas a duas. As diferenças significantes no nível de 5% estão indicadas com um asterisco.

Tabela 4

Diferenças de médias da diminuição da pressão arterial

 

✅ Conclusão De acordo com o teste de Tukey, no nível de 5% de significância:

              ·  a média do tratamento A é maior do que a de B e a do controle;

              · a média do tratamento D é maior do que as médias de B, C, E e controle. 

                                          🧩 Outputs

1. MINITAB


Tukey Pairwise Comparisons 


 Grouping Information Using the Tukey Method and 95% Confidence

 

  Treatment   N   Mean  Grouping

  D                5   29,00     A

  A                5   21,00     A  B

  E                5   13,00         B  C

  C                5   10,00         B  C

  B                5     8,00              C

  Control       5     2,00              C

 Means that do not share a letter are significantly different.


2. SAS

 

                          Error Mean Square              36

              Critical Value of Studentized Range  4.37265

                   Minimum Significant Difference    11.733

 

 Means with the same letter are not significantly different.

 

                      Tukey Grouping          Mean      N    trat

 

                                      A                29.000        5     4

                                      

                              B      A               21.000         5     1

                              B

                              B      C               13.000         5    5

                              B      C

                              B      C               10.000         5    3

                                      C

                                     C                 8.000        5    2        

                                     C                 2.000        5    6


              ·  a média do tratamento A é maior do que a de B e a do controle;

              · a média do tratamento D é maior do que as médias de B, C, E e controle. 

                                          🧩 NOTA


Entenda  resultados  indicados por letras, usuais em outputs de softwares: 

· quando letras diferentes aparecem em frente a duas médias, a diferença entre essas médias é estatisticamente significante; 

· quando a mesma letra aparece em frente a duas médias, a diferença entre essas médias não é estatisticamente significante.

Tabela 5

  Comparação das médias de diminuição da pressão arterial

       

                           















15 comments:

  1. Boa tarde professora Sônia
    Por que há dois procedimentos para executar o teste de Tukey. Por exemplo o R não calcula o HSD; ele apenas compara a diferença entre as médias diretamente com o valor de q. Ele naõ calcula delta = q. RQ(QMR/r). Esse mesmo procedimento é seguido no livro do Zar, J.H. no livro do Zar, JH.2010. Biostatistical Analysis. 5a. edição. Prentice Hall. E daí as conclusões de cada procedimento são diferentes, o calculo com delta é mais conservador. Estranho!
    A senhora poderia me explicar?

    ReplyDelete
  2. Boa tarde professora Sônia
    Por que há dois procedimentos para executar o teste de Tukey? Por exemplo o R não calcula o HSD; ele apenas compara a diferença entre duas médias diretamente com o valor de q. Ele não calcula delta = q. RQ(QMR/r). Esse mesmo procedimento é seguido no livro no livro do Zar, JH.2010. Biostatistical Analysis. 5a. edição. Prentice Hall. E daí as conclusões de cada procedimento são diferentes, o calculo com delta é mais conservador. Estranho!
    A senhora poderia me explicar?

    ReplyDelete
  3. This comment has been removed by the author.

    ReplyDelete
  4. Só agora entendi a dúvida. Veja Teste de Tukey: procedimentos. Obrigada pela excelente dica.

    ReplyDelete
  5. Boa tarde Professora Sônia,
    Obrigado pela excelente explicação.

    ReplyDelete
  6. Bom dia Sonia. Parabéns pela página.
    A explicação esta muito boa de se entender. Estou conseguindo fazer vários exercícios por causa das suas explicações. Página muito agregadora.
    Parabéns por dividir com tanta habilidade seus conhecimentos estatísticos.

    ReplyDelete
  7. Vc pode me dá uma resposta, é possível haver 3feito significativo sabendo q 2 experimentos possuem o mesmo numero de tratamentos e a mesma variável de resposta?

    ReplyDelete
  8. Desculpe, mas não entendi a pergunta. Pode refazer?

    ReplyDelete
  9. Ótimo post. Auxiliou bastante meu processo de aprendizagem.

    Abs

    ReplyDelete
  10. Anonymous11:21 AM

    Boa tarde professora Sônia, gosto muito mesmo do seu blog e é de grande utilidade. Gostaria de saber por que o teste de Tukey tem que ser feito só depois do ANOVA ser significativo.

    Muito obrigada!
    Ivanna

    ReplyDelete
  11. Como os testes post hoc são executados para confirmar as diferenças que ocorreram entre os grupos, eles só devem ser executados quando houver diferença estatisticamente significante global das médias dos grupos (ou seja, um resultado de ANOVA estatisticamente significante).É um teste conservador.

    ReplyDelete
  12. Anonymous5:14 AM

    Muito obrigada Sônia! Professores como você fazem toda a diferença.

    ReplyDelete
  13. Boa noite! Gostaria de saber para comparação de medias qual eh o tamanho mínimo...ou qual deve ser a diferença entre os grupos a comparar...

    ReplyDelete
  14. This comment has been removed by the author.

    ReplyDelete
  15. O cálculo do tamanho da amostra exige várias informações como, por exemplo, a variância da variável de interesse.

    ReplyDelete