Seja
Y uma variável aleatória com
distribuição normal, média μ e desvio
padrão σ. Ao coletar uma amostra de
tamanho n, obtemos uma estimativa s para o desvio padrão populacional. Ordenando
os dados, identificamos facilmente o valor mínimo e o valor máximo da amostra.
A diferença entre esses dois valores é chamada amplitude.
Dividindo
a amplitude pelo desvio padrão amostral s,
obtemos a amplitude
estudentizada, uma estatística adimensional:
Esse
nome – amplitude estudentizada – é uma
homenagem a Student,
pseudônimo usado por William Sealy Gosset, um dos fundadores da estatística
moderna.
A
distribuição da
estatística q — a
amplitude estudentizada — é conhecida há bastante tempo. Depende de dois fatores:
· do nível de significância adotado (α).
· dos graus de liberdade associados à variância amostral
Várias amostras
Considere
agora que dispomos de k amostras independentes,
todas de tamanho r, da variável aleatória Y, normalmente
distribuída. Cada amostra é submetida a um tratamento e gera uma
estimativa de média μi, i=1, 2, …, k. Vamos
supor variâncias iguais (homocedasticidade). Para
testar a hipótese
H0: m1 = m2= … mk
contra a hipótese de que pelo menos uma amostra tem média diferente das demais, é feita uma análise de variância. A variância ponderada das k estimativas da variância σ2 é dada pelo quadrado médio do resíduo da ANOVA (QMR).
Quando
a ANOVA rejeita H0, queremos saber quais
pares de médias diferem significativamente. Para isso,
precisamos de um teste.
E o teste de Tukey?
Tukey
criticou o uso indiscriminado do teste t após uma ANOVA, pois o erro
tipo I se acumula com o número de comparações. Propôs então o teste da Diferença Honestamente Significante
(HSD – Honestly Significant
Difference) para comparar médias duas a duas, sem aumentar o nível
de significância.
A
estatística usada no teste de Tukey é:
onde:
QMR é o quadrado médio do resíduo da ANOVA,
r é o número de observações
por grupo.
A
estatística q segue uma distribuição de amplitude
estudentizada. A distribuição dessa estatística depende
·
do nível de significância adotado (α).
·
do número de médias em comparação.
·
dos graus de liberdade associados ao quadrado
médio do resíduo da ANOVA.
Atenção: as tabelas mudaram!
As
tabelas antigas de q
(como as publicadas em Pearson & Hartley) traziam o valor original da
amplitude estudentizada.
Muitas
das tabelas modernas estão “convertidas”
para uso direto no teste de Tukey, ou seja, o valor original de q foi multiplicado por √2:
Ambas
usam o símbolo q, mas representam valores
diferentes! Confira sempre a legenda da tabela.
Exemplo de procedimento para o teste de Tukey
Para apresentar os resultados em um trabalho, é razoável escrever:
Comparação das médias pelo teste de Tukey
Local |
Repetições |
Média |
Agrupamento |
||
5 |
6 |
58,3 |
A |
|
|
3 |
6 |
44,08 |
|
B |
|
4 |
6 |
41,1 |
|
B |
|
2 |
6 |
40,23 |
|
B |
|
1 |
6 |
32,08 |
|
|
C |
Nota:
Médias que não compartilham a mesma letra são
significantemente diferentes entre si
Conclusão: A concentração de
estrôncio (mg/ml) na água do Local 5 é significantemente maior do que em todos
os outros. Nos locais 3, 4 e 2 A concentração de estrôncio (mg/ml) na água não
tem diferença estatística. No local 1 A concentração de estrôncio (mg/ml) na
água é significantemente menor do que em todos os outros.
No comments:
Post a Comment