Wednesday, June 26, 2019

Intervalos de confiança simultâneos (Tukey)

Antes de tratar intervalo de confiança, é importante lembrar dois conceitos básicos:  estimativa por ponto e estimativa por intervalo. Toda estatística amostral é, por definição, uma estimativa por ponto de algum parâmetro populacional.  Por exemplo, imagine que você mediu a altura de 10 homens adultos de uma região e encontrou média de 170 cm. Esse valor é uma estimativa por ponto da altura média dos homens adultos daquela região.

        Uma estimativa por intervalo busca fornecer um intervalo de valores dentro do qual está, com certa confiança, o verdadeiro valor do parâmetro. Continuando o exemplo, após cálculos com a mesma amostra, você poderia afirmar que tem 95% de confiança que a média populacional de altura está entre 165 cm e 175 cm. Isso amplia a informação, pois em vez de um único número, você oferece uma faixa com chance de conter o verdadeiro valor.

Exemplo

Comparação de grupos com ANOVA e intervalos de confiança

Agora, vamos aplicar o conceito em uma situação real de análise estatística, onde são comparadas as médias de quatro grupos, cada um com cinco repetições. Suponha os seguintes dados fictícios, fáceis de digitar, apresentados na Tabela 1. As médias estão no rodapé da tabela.

Tabela 1

Dados (fictícios) para comparação de grupos


⚠️Pergunta: As diferenças entre as médias dos grupos são grandes o suficiente para concluir que os grupos são estatisticamente diferentes?Para responder, utilizamos a análise de variância (ANOVA), que testa a hipótese:

·  H₀: todas as médias populacionais são iguais.

·  H₁: pelo menos uma média de grupo é diferente das demais.

A análise de variância (ANOVA) produz uma estatística F que indica se há diferença global entre os grupos. Se F for significante, é comum seguir com comparações duas a duas (pairwise comparisons), em geral usando o teste de Tukey.

                                                                 Tabela 2

                                                   Análise de variância    


      

No caso do exemplo, o valor calculado de F é altamente significante (comparado com o valor crítico de F, para 3 e 16 graus de liberdade, no nível de significância 0,05, que é 3,24). Portanto, há pelo menos uma média de grupo é diferente das demais. Mas em lugar de comparar médias duas a duas usando o teste de Tukey, vamos calcular os intervalos de confiança das diferenças entre médias que também indicam quais grupos realmente se diferenciam.

  Intervalos simultâneos de confiança com o teste de Tukey

O teste de Tukey permite calcular intervalos de confiança simultâneos para todas as diferenças entre as médias. Esse método é conservador, mantendo o controle sobre o erro tipo I quando se fazem múltiplas comparações.

Para grupos de mesmo tamanho (como no exemplo), os intervalos para diferenças de médias são dados por:

                                 

Onde:

·  qα,k,gl  é o valor da tabela de Tukey, dado o número de grupos (k), graus de liberdade do erro (gl) e nível de significância (α, por exemplo, 0,05);

·  QMR: quadrado médio do resíduo da ANOVA;

·  r: número de repetições por grupo.

No caso do exemplo:

                🔺 Valor de q de Tukey

                         Para α=0,05, k=4 , gl = 16, da tabela de Tukey:

                                             q=4,05

                   🔺 Cálculo do erro padrão conjunto (EP)

                                              

                🔺 Cálculo da margem

                                         

              🔺 Cálculo das diferenças de médias

                                                           Tabela 3

                                             Diferenças de médias       

             🔺 Intervalos de confiança (95%) para as diferenças

                                                                   Tabela 5

                                     Intervalos de confiança simultâneos  95% (Tukey)



Um gráfico com médias e desvios padrão pode ilustrar a comparação entre grupos.


   Gráfico 1  
Intervalos de confiança simultâneos  95% (Tukey)  

       
Se um intervalo não contiver o zero, as médias correspondentes serão significantemente diferentes.

VEJA: 
Cheung, S. H.e Chan, W. S. Simultaneous confidence intervals
 for pairwise multiple comparisons in a two-way unbalanced             design. Biometrics 52 (2)pp.463-472. 1996.