Tuesday, December 13, 2016

Pressuposições para fazer uma ANOVA - um critério

       
         Yij = mi + eij           i=1, 2,… ,k;  j= 1, 2, …, r

  A análise de variância (ANOVA) tem a finalidade de testar se existem diferenças significantes entre as médias de três ou mais grupos, desde que a variável em análise seja quantitativa. Logo, testa a hipótese:

             H0: m1m2m3=...=mk             (i=1, 2,… ,k)

contra a hipótese de que existe pelo menos uma média de grupos  diferente das demais.

        Vamos considerar aqui apenas as análises de variância com um critério de classificação (one way layout anova), quando todos os grupos têm o mesmo número de repetições.

         O valor observado na j-ésima (j = 1, 2,…,r) unidade do i-ésimo (= 1, 2,… ,k) grupo é indicado por Yij. Esta é  a variável dependente, porque seu valor depende do   grupo ao qual a unidade pertence. Grupos são a variável independente.

         Então, o modelo de uma análise de variância (ANOVA) com um critério de classificação é escrito como segue:

              Yijmieij           i=1, 2,… ,k;  j= 1, 2, …, r

  A resposta de uma unidade (Yijé dada pela média verdadeira de todas as respostas possíveis do grupo ao qual pertence (mi), acrescida da quantidade eij, que é um erro aleatório (random error).
 
Ninguém conhece os parâmetros que ,neste caso, são as médias verdadeiras mi dos grupos. O pesquisador faz um experimento exatamente para obter as estimativas  dessas médias. E é com essas estimativas que o pesquisador procede à análise de variância, para testar a hipótese de igualdade das médias mi dos grupos.

EXEMPLO

Veja os dados apresentados na Tabela 1. As médias verdadeiras m1m2m3m4 dos grupos A, B, C e D são desconhecidas. No entanto, os dados obtidos pelo pesquisador permitem obter as respectivas estimativas, que estão no rodapé da tabela.

 A Tabela 2 apresenta a análise de variância dos dados da Tabela 1. As fórmulas necessárias para proceder a essa análise são  encontradas em livros de estatística, mas use um programa de computador.

Tabela 1 – Dados obtidos em quatro grupos

Tabela 2 – Análise de variância dos dados da Tabela 1

Os erros aleatórios eij também são desconhecidos porque são definidos em função das médias verdadeiras m1m2m3m4. Mas erros aleatórios podem ser estimados fazendo a diferença entre cada valor observado e a média do grupo ao qual o dado pertence:

       As estimativas dos erros recebem o nome de resíduos (residuals). Veja a Tabela 3, que mostra os resíduos dos dados da Tabela 1. É a análise de resíduos que permite determinar se a análise de variância é aceitável. 
    Isto porque a análise de variância exige  pressuposições sobre os erros. A partir dos resíduos, o pesquisador pode testar hipóteses sobre os erros. 

Tabela 3 – Resíduos de dados apresentados na Tabela 1


Pressuposições sobre os erros para a análise de variância 

1. Os erros devem ser independentes, ou seja, o erro de uma observação não pode estar correlacionado com o erro em outra observação. Isto significa que as unidades dentro de um mesmo grupo devem ser totalmente independentes uma das outras e nenhuma unidade deve estar em mais de um grupo. 

2. Os erros devem ser de mesma grandeza, ou seja, não deve haver dados discrepantes (outliers). Dados discrepantes são aqueles que não seguem o padrão da grande maioria dos dados coletados (por exemplo, em um estudo com 100 pessoas com idade entre 23 a 28 anos, uma pessoa com 52 anos seria discrepante). 

3. Os erros devem ter distribuição normal ou aproximadamente normal. Pequenas violações da normalidade são aceitáveis, desde que  a distribuição não seja assimétrica.

4. É necessário haver homocedasticia, ou seja, erros dentro de cada grupo devem ter grandezas similares (mesma variância). 

             Veja também:       http://www.itl.nist.gov/div898/handbook/ppc/section2/ppc231.htm




No comments: