Uma análise de variância (ANOVA) rejeita ou não a hipótese
de igualdade de médias populacionais de diversos grupos, mas não determina quais grupos têm médias estatisticamente
diferentes. Por essa razão, o teste F feito na análise de
variância é considerado um teste global (omnibus test). Terminada a
análise de variância, o pesquisador busca um novo teste para comparar as
médias de grupos.
Vamos tratar aqui o teste de Tukey. Você aplica o teste de Tukey para comparar
médias duas a duas (pairwise comparison). Veja isso como uma vantagem do
teste: você compara todos os pares de médias que tiver.
No Brasil, para proceder ao teste de Tukey, o mais comum é calcular
a diferença mínima que deve haver entre duas médias para que
elas possam ser consideradas diferentes ao nível de significância a. Essa diferença é conhecida como diferença
mínima significante e, em geral, indicada pela letra grega ∆
(lê-se delta).
Nessa fórmula:
- q(k,gl,a) é denominado amplitude estudentizada e é encontrado na tabela de amplitude estudentizada q, ao nível de significância a, para k tratamentos e gl graus de liberdade do resíduo da ANOVA.
- QMR é o quadrado médio do resíduo da análise de variância;
- r é o número de repetições de cada um dos grupos.
Na língua inglesa, porém, Least Significant
Difference (LSD), ou seja, diferença mínima
significante é terminologia usada no teste de Fisher (Fisher’s LSD).
John W. Tukey, autor do teste de Tukey, chamou a diferença
mínima que deve haver entre duas médias para que elas possam ser
consideradas diferentes ao nível de significância a de honestly
significant difference (HSD), ou seja, diferença
honestamente significante. De
qualquer forma, o valor da diferença honestamente significante (HSD) pelo
teste de Tukey é indicado, em língua inglesa, como segue:
Mas vamos a mais um detalhe: na busca da
“significância”, os pesquisadores querem comparar todos os pares de médias de
grupos que possam ser calculados. São possíveis ½t(t-1) comparações de
pares de médias de grupos, mas só há t-1
graus de liberdade para grupos. Obviamente, nem todas as comparações são
independentes e ortogonais. Ainda, um dos pares a serem comparados é o da maior
média com a menor. Então, mesmo que o F
da ANOVA para todos os grupos tenha sido não-significante, uma diferença
extrema pode atingir o nível de significância. Mas não é valido comparar somente
as médias com valores extremos.
Vamos, então, um pouco mais fundo. Seja X uma variável aleatória com
distribuição normal de média m e desvio padrão s. Seja s a estimativa do desvio padrão de uma
amostra de tamanho n dessa variável.
Sabemos que, em qualquer amostra, há sempre um valor mais alto e um valor
menor. A diferença entre eles é a amplitude, que é medida na mesma unidade dos
dados. Dividindo a amplitude por s, expressamos a amplitude em unidades de s:
Temos então q,
a amplitude estudentizada (homenagem adequada a Student, que “estudentizou” a
diferença de médias), que não tem unidade de medida. A distribuição amostral de
q é conhecida há muito tempo. Varia
com o tamanho da amostra e os graus de liberdade de s.
Mas voltemos ao problema de comparar diferenças de
duas médias de grupos: o problema está relacionado com a distribuição de q, a amplitude estudentizada. Para comparações
do tipo
A tabela publicada de amplitude estudentizada que
hoje achamos em livros e na internet está “convertida” em uma tabela de Tukey.
No que consiste essa conversão? O antigo valor de q está, quase sempre, multiplicado por raiz de 2, ou seja:
Veja bem: uma ANOVA com dois grupos para comparação,
seis repetições em cada grupo, fica assim:
Causas
de variação
|
GL
|
Grupos
|
1
|
Resíduo
|
10
|
Total
|
11
|
Os valores críticos, para decidir rejeitar H0 são,
para o teste de Student, ANOVA e Tukey: t
=2,23, F = 4,96, q = 3,15.
Qualquer dos testes leva ao mesmo resultado. Os cálculos são feitos, cada um no
seu jeito, mas t2 = F, t =q/√2. Verifique, fazendo os três
testes para qualquer exemplo seu (dois grupos).
Agora, a explicação para o título: cuidado com a
tabela de q que você usa. Verifique
sempre e verifique o programa que você usa.
3 comments:
Bom dia, Sonia.
Trabalho com plantas e possuo dois grupos que verifico a influência na variável resposta.
Conduzi experimentos em casa de vegetação com mudas em vasos, sendo que o fator 1, é a presença ou não de bactérias em associação com as plantas (fator inoculação), e o fator 2, é a condição de hidratação ou déficit hídrico (fator hídrico).
Para testar se há diferenças eu conduzo uma Anova de dois fatores, seguida pelo Teste de Tukey HSD. Faço tudo utilizando a plataforma R.
Estou comentando aqui pq surgiu uma dúvida em uma das análises. Uma variável resposta apresentou diferença, segundo a Anova, nos dois fatores, mas não na interação.
Quando conduzi o Tukey, surgiram diferenças na interação. Li este texto sobre diferentes resultados, mas ainda estou confusa.
Devo ignorar as diferenças encontradas na interação?
Desculpe pela extensão do comentário e obrigada.
Pelo que entendi, é um experimento completamente ao acaso com tratamentos em esquema fatorial 2x2. As causas de variação na anova são:
Inoculação
Hidratação
Inoculação x Hidratação
Tratamentos
Resíduo
Total
Tratamentos têm três graus de liberdade, a soma das três causas anteriores, que tem um grau de liberdade cada uma. Teste F e teste Tukey dão o mesmo resultado, quando se comparam dois tratamentos. Claro, se você optar por comparar quatro tratamentos em lugar do desdobramento pode haver diferença. Eu optaria pelo esquema fatorial desdobrando a interação, se for o caso. As causas de variação na anova são:
Inoculação
Hidratação dentro de inoculados
Hidratação dentro de não- inoculados
Tratamentos
Ou
Hidratação
Inoculação dentro de hidratados
Inoculação dentro de não-hidratados
Se estiverem sendo analisadas diversas variáveis, eu optaria por um único modelo de análise, obedecendo ao objetivo do trabalho. Mas é só uma opinião.
Oi Professora Sonia.
Obrigada pela resposta.
Mas, acabei explicando de maneira errada meu experimento.
O fator hídrico realmente tem dois tratamentos, mas o fator inoculação tem 6.
Por isso segui com o Tukey.
Achei muito interessante a análise fatorial desdobrando a interação e acredito que assim encontrarei o que estou perguntando.
Gostei muito do seu blog, está me ajudando muito!
Post a Comment