Wednesday, June 26, 2019

Intervalos de confiança simultâneos (ANOVA)


Antes de tratar intervalo de confiança, convém lembrar o significado de estimativa por ponto e estimativa por intervalo. Você sabe que toda estatística pode ser vista como uma estimativa por ponto porque sempre estima um parâmetro da população.

 Por exemplo, uma amostra de 1000 homens adultos de determinada região em determinada época pode fornecer a média de estatura em 1,70 m. Esta é uma estimativa por ponto da estatura média da população de homens adultos nas mesmas condições dos amostrados, isto é, do parâmetro, que se indica por  m.

Com base na mesma amostra você também pode fazer inferência estatística e obter uma estimativa por intervalo. Após alguns cálculos poderá dizer, por exemplo, que tem 95% de confiança que a estatura média de um homem adulto dessa região e dessa época está entre 1,51 m e 1,89 m. Veja bem: a inferência permite ampliar a informação porque fornece não apenas um valor como estimativa, mas um intervalo que tem a probabilidade de conter o parâmetro.

       Não vamos tratar aqui como se constroem intervalos de confiança individuais, mas intervalos simultâneos de confiança para diferenças entre médias de grupos. Veja um exemplo. Tabela 3.1 apresenta os dados para comparar quatro grupos (A, B, C, D), com cinco repetições em cada um.

Tabela 1-Dados (fictícios) para comparação de grupos



         A pergunta que se coloca é: até que ponto as diferenças observadas entre as médias das respostas dos grupos, apresentadas no rodapé da Tabela 3.1, são suficientemente grandes para serem tomadas como evidência de que há diferença significante entre eles? A resposta para essa pergunta é dada por uma ANOVA (análise de variância).

                  Tabela 2- Análise de variância


A estatística F calculada na ANOVA é um teste global (omnibus test). Testa a hipótese de que todas as médias populacionais são iguais contra a hipótese de que existe pelo menos uma média diferente das demais. Então, quando a ANOVA produz estatística F significante, como é o caso deste exemplo, o certo é continuar a análise porque, de imediato, se faz a pergunta: qual é média, ou quais são as médias estatisticamente diferentes das demais?

É usual, nessa situação, proceder ao teste de Tukey ou teste das diferenças honestamente significantes (HSD - honestly significant difference), que permite fazer todas as comparações de médias, duas a duas (pairwise comparison). Ainda, como o teste de Tukey é a posteriori ou post-hoc, o pesquisador não precisa planejar, quando começa seu trabalho, as comparações que quer fazer. O teste de Tukey é conservador, isto é, mantém o nível de significância para experimentos (familywise Type I error rate) no valor a estabelecido pelo pesquisador.

Você encontra o procedimento para o teste de Tukey em outra postagem deste mesmo blog. Vamos ver aqui como se constroem intervalos de confiança simultâneos para as diferenças de médias duas a duas. Estão na Tabela 3 os resultados da comparação de médias feita procedendo ao teste de Tukey. É fácil ver que os valores do grupo D são, em média, maiores que os valores dos grupos A e C.

Tabela 3-Comparação de médias pelo teste de Tukey, a  = 0,05

Considere uma ANOVA com um critério de classificação para testar a hipótese de que as médias de k grupos são iguais, em modelo de efeitos fixos. Então: 


Nesse modelo, i= 1, 2, ..., k; j=1,2, ... , r; ei,j são variáveis aleatórias independentes com distribuição normal de média zero e variância s2.

No caso de grupos de mesmo tamanho, as estimativas de intervalos simultâneos de confiança (1-a) para duas médias são dadas por:
🔺 q(a,k,gl) é denominado amplitude estudentizada de Tukey, que você encontra na tabela de amplitude estudentizada q de Tukey, no nível de significância a estabelecido, para k tratamentos e gl graus de liberdade do resíduo da ANOVA
               🔺 QMR é o quadrado médio do resíduo da ANOVA
               🔺 r é o número de repetições em cada um dos grupos.

No caso do exemplo apresentado, para calcular os intervalos de confiança para diferenças de médias calcule:

Na Tabela 4 estão indicados os grupos em comparação, as diferenças de médias e os limites inferior (LIC) e superior (LSC) dos respectivos intervalos de confiança. A Figura 1 apresenta os intervalos em gráfico. Note que a conclusão é a mesma, quer se proceda ao teste de Tukey ou se calcule os intervalos simultâneos de confiança.

Tabela 4- Grupos em comparação, diferenças de médias e limites inferior
 (LIC) e superior (LSC) dos respectivos intervalos de
 95% de confiança 

Figura 4- Grupos em comparação, diferenças de médias e limites inferior (LIC) e superior (LSC) dos respectivos intervalos de 95% de confiança.

VEJA: 
Cheung, S. H.e Chan, W. S. Simultaneous confidence intervals
 for pairwise multiple comparisons in a two-way unbalanced             design. Biometrics 52 (2)pp.463-472. 1996.