Seja Y uma
variável aleatória com distribuição normal de média m e desvio padrão s. Uma
amostra de tamanho r dessa variável fornece uma estimativa
s do desvio padrão s. Se os dados dessa amostra forem organizados em
ordem crescente, você acha facilmente o valor
mínimo e o valor máximo. A
diferença entre esses dois valores é a amplitude,
que tem a mesma unidade de medida dos dados. Dividindo a amplitude pelo desvio
padrão s, você obtém a amplitude estudentizada,
que se indica pela letra q e é adimensional porque as unidades de medida da amplitude e do desvio
padrão são as mesmas. Então:
Imagine agora que você tem k amostras
de tamanho r da variável aleatória Y que tem distribuição normal de média m e variância s2. Cada amostra fornece uma estimativa da média m e uma estimativa da variância s2. Haverá uma média maior e uma média menor. A amplitude das médias das k amostras é
Como estamos considerando apenas o caso de amostras
de mesmo tamanho, a variância ponderada
das estimativas
(i =
1, 2, ..., k) da variância s2 é a média das
estimativas fornecidas por cada uma das k
amostras.
Então, a estimativa da variância da amplitude estudentizada das k médias
independentes, é
John W. Tukey, um dos grandes
estatísticos do século XX, considerava "cientificamente desonesto" fazer
uma análise de variância e depois aplicar o teste t de Fisher para comparar médias duas a duas, porque o erro tipo I
aumenta com o número de médias em comparação. Ele propôs então a HSD, ou diferença honestamente
significante (Honestly Significant
Differences).
Para achar a diferença honestamente significante (honestly significant difference), ou
seja, a diferença que deve haver entre duas médias para que elas possam ser
consideradas estatisticamente diferentes a determinado nível de significância a, calcule:
Nessa fórmula, a variância ponderada das k amostras é estimada pelo quadrado médio do resíduo QMR da ANOVA, que está associado a n-k graus de liberdade. Mas na HDS, o valor de qa,k,n-k incorpora a √2. É a amplitude estudentizada q de Tukey.
Nessa fórmula, a variância ponderada das k amostras é estimada pelo quadrado médio do resíduo QMR da ANOVA, que está associado a n-k graus de liberdade. Mas na HDS, o valor de qa,k,n-k incorpora a √2. É a amplitude estudentizada q de Tukey.
As tabelas que exibem a distribuição da
amplitude estudentizada q de Tukey
são mais comuns, mas também há tabelas que
exibem a distribuição da amplitude estudentizada q sem estar
multiplicado por √2. Ocorrem as duas formas em tabelas. Então preste atenção,
porque ambas usam o mesmo símbolo.
Exemplo de procedimento para o
teste de Tukey
São dadas as concentrações de
estrôncio (mg/ml) na água de cinco locais diferentes[1].
Vamos fazer a análise de variância e comparar as médias pelo teste de Tukey,
usando o programa SAS.
Concentrações
de estrôncio (mg/ml) na água de cinco locais diferentes
Análise de
variância
Como o quadrado médio do resíduo obtido na análise de variância é QMR = 9,765, a variância da média é:
Logo, o erro padrão da média
é:
Para comparar as médias obtidas no exemplo duas a duas, no
nível de significância de 5%, como k =
5 e n-k = 25, temos:
Mas para
comparar duas médias usando a amplitude total estudentizada, é possível
proceder de outra forma. Dado contraste de médias:
A
variância do contraste, desde que as médias sejam independentes, é
Para o exemplo:
e o erro padrão do contrate de médias é
Então para comparar a
média do Local 1 com o Local 2, calcule:
O valor de q aqui calculado não
pode ser comparado com o valor de q da tabela de amplitude estudentizada de
Tukey. Para isso, precisa ser multiplicado por √2. Você tem
então
4,517 x √2 = 6,388
maior
que o valor crítico da amplitude estudentizada de Tukey. Logo, há mais
estrôncio no Local 2 que no Local 1.
Veja
agora a saída do SPSS. Note que está indicado como erro padrão é o erro padrão de um contraste
de duas médias. Compare com a saída do SAS, em que o que se identifica como erro padrão é o erro padrão de uma média.
Saída do SPSS
1.O exemplo apresentado é de
Zar,
J.J.H. Biostatistical Analysis. New
Jersey, Prentice Hall. 4ª ed. 1999, p.210.
2.Você encontra a Tabela de amplitude estudentizada de Tukey, por exemplo, em
3. Amplitude estudentizada: amplitude é a diferença entre valor máximo e valor mínimo de um conjunto de dados. Estudentizada, porque está dividida por s. O adjetivo é uma homenagem a Student, pseudônimo de William S. Gosset, que propôs o teste t.
No comments:
Post a Comment