Antes de tratar intervalo de confiança, convém
lembrar o significado de estimativa por
ponto e estimativa por intervalo.
Você sabe que toda estatística pode ser vista como uma estimativa por ponto
porque sempre estima um parâmetro da população.
Por exemplo, uma amostra de
1000 homens adultos de determinada região em determinada época pode fornecer a
média de estatura em 1,70 m. Esta é uma estimativa por ponto da estatura média da
população de homens adultos nas mesmas condições dos amostrados, isto é, do
parâmetro, que se indica por m.
Com base na mesma amostra você também pode
fazer inferência estatística e obter uma estimativa por intervalo. Após alguns
cálculos poderá dizer, por exemplo, que tem 95% de confiança que a estatura média
de um homem adulto dessa região e dessa época está entre 1,51 m e 1,89 m. Veja
bem: a inferência permite ampliar a informação porque fornece não apenas um
valor como estimativa, mas um intervalo que tem a probabilidade de conter o
parâmetro.
Não vamos tratar aqui como se constroem intervalos de confiança individuais, mas intervalos simultâneos de confiança para diferenças entre médias de grupos. Veja um exemplo. A Tabela 3.1 apresenta os dados para comparar quatro grupos (A, B, C, D), com cinco repetições em cada um.
Tabela 1-Dados (fictícios) para
comparação de grupos
A pergunta que se coloca é: até que
ponto as diferenças observadas entre as médias das respostas dos grupos,
apresentadas no rodapé da Tabela 3.1, são
suficientemente grandes para serem tomadas como evidência de que há diferença
significante entre eles? A resposta para essa pergunta é dada por uma ANOVA (análise de variância).
Tabela 2- Análise de variância
A estatística F calculada na
ANOVA é um teste global (omnibus test).
Testa a hipótese de que todas as médias populacionais são iguais contra a
hipótese de que existe pelo menos uma média diferente das demais. Então, quando a ANOVA produz
estatística F significante, como é o
caso deste exemplo, o certo é continuar a análise porque, de imediato, se faz a pergunta: qual é média, ou quais são as
médias estatisticamente diferentes das demais?
É usual, nessa
situação, proceder ao teste de Tukey ou teste das diferenças honestamente
significantes (HSD - honestly significant
difference), que permite
fazer todas as comparações de médias,
duas a duas (pairwise comparison). Ainda, como o teste de Tukey é a
posteriori ou post-hoc, o pesquisador não precisa planejar, quando começa seu
trabalho, as comparações que quer fazer. O teste de Tukey é conservador, isto
é, mantém o nível de significância para experimentos (familywise Type I error rate) no valor a estabelecido
pelo pesquisador.
Você encontra o
procedimento para o teste de Tukey em outra postagem deste mesmo blog. Vamos
ver aqui como se constroem intervalos de confiança simultâneos para as diferenças de médias duas a duas. Estão na Tabela 3 os resultados da comparação de médias feita procedendo ao teste de Tukey. É fácil ver que
os valores do grupo D são, em média, maiores que os valores dos grupos A e C.
Tabela 3-Comparação
de médias pelo teste de Tukey, a = 0,05
Considere uma ANOVA com um
critério de classificação para testar a hipótese de que as médias de k grupos são iguais, em modelo de
efeitos fixos. Então:
Nesse modelo, i= 1, 2, ..., k; j=1,2, ... , r; ei,j são variáveis aleatórias independentes com distribuição
normal de média zero e variância s2.
No caso de grupos de mesmo tamanho,
as estimativas de intervalos simultâneos de confiança (1-a) para duas médias são dadas por:
🔺 q(a,k,gl) é denominado amplitude estudentizada de Tukey, que você
encontra na tabela de amplitude estudentizada q de Tukey, no
nível de significância a estabelecido,
para k tratamentos e gl graus de liberdade do
resíduo da ANOVA
🔺 QMR é o quadrado médio do resíduo da ANOVA🔺 r é o número de repetições em cada um dos grupos.
No caso do exemplo apresentado, para calcular
os intervalos de confiança para diferenças de médias calcule:
Na Tabela 4 estão indicados os grupos
em comparação, as diferenças de médias e os limites inferior (LIC) e superior (LSC)
dos respectivos intervalos de confiança. A Figura 1 apresenta os intervalos em
gráfico. Note que a conclusão é a mesma, quer se proceda ao teste de Tukey ou se
calcule os intervalos simultâneos de confiança.
(LIC) e superior (LSC) dos respectivos intervalos de
95%
de confiança
Figura 4- Grupos em comparação, diferenças de
médias e limites inferior (LIC) e superior (LSC) dos respectivos intervalos de 95%
de confiança.
VEJA:
Cheung, S. H.e Chan, W. S. Simultaneous confidence intervals
Cheung, S. H.e Chan, W. S. Simultaneous confidence intervals
for pairwise multiple comparisons in a two-way unbalanced design. Biometrics 52 (2)pp.463-472. 1996.
No comments:
Post a Comment