Existem muitos métodos para comparações múltiplas de médias, depois de uma análise de variância (ANOVA). A maioria deles faz comparações pareadas, para determinar quais médias são significativamente diferentes entre si. Dentre eles, o mais conhecido e mais usado é o teste de Tukey que se baseia na distribuição de q, a 'amplitude estudentizada'.

Esse método é visto como o melhor quando os tamanhos das amostras não são iguais ou quando é preciso obter intervalos de confiança. No entanto, quando os tamanhos das amostras são iguais e não é preciso calcular intervalos de confiança, o teste de Tukey é ligeiramente menos poderoso do que o teste de Student-Newman-Keuls, que veremos aqui. É interessante registrar que a diferença honestamente significante calculada pelo teste de Tukey é adequada para comparar a maior média com a menor média do conjunto de médias em comparação. No entanto, o teste usa a mesma diferença para comparar qualquer par de médias, o que torna o procedimento conservador.

Mas o teste de Tukey tem uma grande vantagem: está disponível em todos os softwares estatísticos (até mesmo em calculadoras on line), o que nem sempre acontece com o teste de Student-Newman-Keuls.

O teste de Student-Newman-Keuls baseia-se, como o teste de Tukey, na amplitude estudentizada q. É um procedimento de natureza sequencial (stepwise), mas que pode ser visto como uma modificação do teste de Tukey. Para entender o passo a passo, imagine que estão sendo comparados m = 4 grupos. As médias de grupos foram calculadas e, por facilidade, imagine que a média do primeiro grupo é menor que a do segundo, a do segundo menor que a do terceiro e a do terceiro menor que a do quarto, isto é:

x̄₁ < x̄₂ < x̄₃ < x̄₄

Veja o esquema do procedimento: primeiro você compara a maior média com a menor (m = 4); depois, faz duas comparações com m = 3: a maior média com a segunda menor e a segunda maior com a menor; depois, só restam comparações duas a duas.

Para cada comparação, calcule a diferença honestamente significativa:

Nessa fórmula:

· q (α, m, GL) é a amplitude estudentizada, no nível de significância α, para comparar as duas médias que abrangem m médias ordenadas, com os graus de liberdade do resíduo da ANOVA (GL).

· QMR é o quadrado médio do resíduo da análise de variância;

· r é o número de observações por grupo (estamos pressupondo grupos de mesmo tamanho).

No caso do exemplo que vimos, em que há quatro médias em comparação, procure na distribuição de q o valor para m = 4. Você então calcula dₘ para comparar a maior média com a menor. O teste consiste em declarar – toda vez que o valor absoluto da diferença entre duas médias que abrangem m médias ordenadas for igual ou maior do que a diferença crítica – como significante no nível α. Se essa comparação não for significativa, não faça mais comparações; caso contrário, continue.

Compare o próximo par de médias mais diferente (a maior e a segunda menor ou a segunda maior e a menor) com a distribuição q para comparar m - 1 médias. Se essa comparação não for significativa, pare as comparações de médias. No entanto, se essa comparação for significativa, continue comparando pares de médias sucessivamente, até que uma comparação não seja significativa ou todas as comparações tenham sido feitas.

Exemplo

Considere os dados (fictícios) de diminuição da pressão arterial apresentados na Tabela 1. Esses dados foram submetidos à análise de variância, que está apresentada na Tabela 2. Como o valor de F é significante no nível de 5%, existe pelo menos uma média diferente das demais. As médias amostrais calculadas estão na Tabela 3.

Tabela 1 - Diminuição da pressão arterial, em milímetros de mercúrio, segundo o grupo

Tabela 2 - Análise de variância

Tabela 3 - Médias de diminuição da pressão arterial, em milímetros

de mercúrio, segundo o grupo

A lista ordenada de m = 6 médias do nosso exemplo está na Tabela 4. A maior média amostral é 29, do grupo D e a menor é 2, do controle. Vamos calcular a diferença crítica dₘ para comparar essas médias. Temos m = 6 e já sabemos, da Tabela 2, que o resíduo da ANOVA tem 24 graus de liberdade e o quadrado médio é QMR = 36,00. Na Tabela 1, temos r = 5. No nível de 5%, o valor de q _α_,m,₂₄ é 4,3727.

A diferença entre o tratamento D e o controle (29-2=27) é maior do que a diferença crítica 11,733. Então, em média, o tratamento D determina maior diminuição da pressão arterial que o controle.

As diferenças das médias dos grupos D e B (29-8=21) e A e controle (21-2=19) são significantes no nível de 5%. Então, em média, o tratamento D determina maior diminuição da pressão arterial que B e A determina maior diminuição da pressão arterial que o controle. Continue com as comparações. A análise não termina por aqui.

Comparação com o Teste de Tukey

De qualquer forma, fizemos, usando um software estatístico, as comparações de médias usando tanto o teste de Tukey como o de Student-Newman-Keuls. Os resultados estão na Tabela 4. Em colunas, estão os grupos de médias que não diferem entre si. Note que o teste de Student-Newman-Keuls tem mais poder, ou seja, acha mais valores significativos. Por exemplo, esse teste mostrou que o tratamento D diminui a pressão arterial mais que A, o que o teste de Tukey não mostrou.

Tabela 4- Grupos de tratamentos que diferem entre si,

segundo o teste estatístico

De qualquer modo, é importante considerar que a escolha entre o teste de Tukey ou Student-Newman-Keuls depende da necessidade racional – e bem explicada – de detectar diferenças significantes entre as médias.

Vantagens e Desvantagens

Ao realizar todas as comparações pareadas, o teste de Student-Newman-Keuls é a opção com mais poder e, em certas situações, a melhor opção disponível quando não são necessários intervalos de confiança e os tamanhos de amostras são iguais.

Leituras adicionais

- Seaman, M.A., Levin, J.R., Serlin, R.C. (1991). Psychological Bulletin 110: 577–586.
- Day, R.W., Quinn, G.P. (1989). Ecological Monographs 59: 433–463.
- Zar, J.H. Biostatistical Analysis.
- Dean, A., Voss, D. Design and Analysis of Experiments.
- Montgomery, D.C. Design and Analysis of Experiments.

Sonia Vieira

Monday, August 18, 2025

Teste de Student-Newman-Keuls para Comparação de Médias

Exemplo

Comparação com o Teste de Tukey

Vantagens e Desvantagens

Leituras adicionais

No comments: