Sunday, January 22, 2017

Como Comparar Médias de Grupos de Tamanhos Diferentes? Use Tukey-Kramer!"

    

Resumo

Quando a ANOVA indica diferenças significativas entre grupos, o passo seguinte é descobrir quais grupos realmente diferem entre si. Se os grupos têm tamanhos desiguais, o teste de Tukey-Kramer é uma escolha confiável e robusta. Neste post, explicamos como aplicar esse teste passo a passo, com exemplo real e interpretação dos resultados.

Quando o pesquisador obtém um resultado significativo na ANOVA (Análise de Variância) e seu experimento envolve três ou mais grupos, surge a necessidade de realizar testes pós-hoc para comparar médias e identificar quais grupos diferem, em média, entre si.

Há diversos testes disponíveis para esse fim, alguns dos quais já discutimos em postagens anteriores. Neste texto, vamos abordar o teste de Tukey-Kramer, recomendado para as situações em que os grupos têm tamanhos desiguais. Nesses casos, é necessário ajustar o procedimento, substituindo o tamanho comum dos grupos (r) pelos tamanhos individuais ri e rj dos grupos em comparação.

Para aplicar o teste de Tukey-Kramer, é preciso pressupor que as populações possuem variâncias homogêneas. Assim, o quadrado médio do resíduo (QMR), obtido na ANOVA, serve como estimativa da variância comum da variável.

A diferença mínima significativa entre as médias de dois grupos de tamanhos ri e rj, denotada por di, é calculada pela fórmula:

                   

Onde:

·    q(k,gl,α) é o valor da amplitude estudentizada, obtido na tabela de valores críticos da distribuição q;

·  k é o número de grupos;

·  gl é o número de graus de liberdade do resíduo na ANOVA;

·  QMR é o quadrado médio do resíduo;

·  α é o nível de significância (por exemplo, 5%).

                                           Exemplo

A Tabela 1 apresenta os dados de um experimento com quatro grupos (quatro marcas de chá verde). As médias de cada grupo estão indicadas ao final da tabela. O objetivo é comparar essas médias utilizando o teste de Tukey-Kramer. Para isso, é necessário realizar, primeiramente, uma ANOVA, que está apresentada na Tabela 2.

Em seguida, realizam-se as comparações par a par das médias das marcas. Para aplicar o teste, utilizou-se o valor de q para nível de significância de 5%, com k=4 grupos e n−k=24−4=20 graus de liberdade do resíduo.

Tabela 1

Conteúdo de ácido fólico (vitamina B) em folhas de chá verde selecionadas aleatoriamente de quatro marcas (1)



Tabela 2

Análise de variância dos dados da Tabela 1


Por exemplo:

·  Para comparar a média da marca 1 com a da marca 2, com α=5%, é preciso calcular:

                  

·  Para comparar a média da marca 1 com a média da marca 3, com α=5%, procede-se de maneira análoga.

O mesmo procedimento é repetido para as demais combinações de marcas. A Tabela 3 apresenta as diferenças observadas entre as médias, bem como os respectivos valores de dij. Quando a diferença absoluta entre duas médias for maior que dij, rejeita-se a hipótese de igualdade entre essas médias.

Tabela 3

Comparação de médias pelo teste de Tukey-Kramer

Interpretação

A interpretação dos resultados da Tabela 3 indica, por exemplo, que a marca 1 apresenta, em média, maior teor de ácido fólico do que a marca 4, com diferença estatisticamente significante.

Aproximação com média harmônica

O cálculo de todas as diferenças mínimas significantes pelo teste de Tukey-Kramer pode ser trabalhoso, especialmente quando feito manualmente. Com o auxílio de softwares estatísticos, esse processo é automatizado, mas nem sempre foi assim. Em situações em que os tamanhos dos grupos são aproximadamente iguais, é possível adotar uma simplificação: utilizar a fórmula tradicional do teste de Tukey substituindo r pela média harmônica dos tamanhos amostrais, denotada por H. A fórmula fica:     

                            

Essa abordagem é uma aproximação, e o controle do nível de significância pode não ser exato. Mas você pode encontrar esse procedimento em trabalhos mais antigos.

Com os dados da Tabela 1, onde os tamanhos dos grupos são 7, 5, 6 e 6, a média harmônica H é calculada por:

                 

Então

                              

Substituindo esse valor na fórmula, obtém-se o valor de d a ser usado para todas as comparações. Neste exemplo, a interpretação dos resultados permanece coerente com a análise completa.

Veja a Tabela de amplitude estudentizada em

        table of the studentized range - David Lane                                                                    http://davidmlane.com/hyperstat/sr_table.html
         Veja também
         Multiple Comparisons With Unequal Sample Sizes                                                    https://www.uvm.edu/~dhowell/gradstat/.../labs/.../Multcomp.html
         ANOVA & Tukey-Kramer test. https://www.youtube.com/watch?   

     Chen, TS; Lui, CK; Smith, CH. Journal of the American Dietetic Association [1983,82(6):627-632]                  Apud Devore, JL. Probability and Statistics for engineering and the sciences. Brooks Cole                           2015.On line books.               

No comments: