Thursday, January 12, 2017

ANOVA: erros são variáveis aleatórias independentes

    
Para fazer uma análise de variância, é preciso pressupor que os erros são variáveis aleatórias independentes. Em geral,  a independência é determinada apenas pela maneira como os dados são coletados 1.

    Por exemplo, se você observa cobaias da mesma gaiola ou  pessoas residentes na mesma casa, não pode considerar que os erros das observações são independentes. Outro exemplo: se você obtém durante diversas semanas medidas na mesma pessoa para estudar o efeito de uma droga terapêutica ao longo do tempo – também não pode considerar que os erros das medidas são independentes. 

   Qualquer medida obtida em uma unidade em determinado instante (yi+1) está, necessariamente, correlacionada com a medida feita anteriormente nessa mesma unidade (yi). Medidas feitas em unidades agrupadas também estão, muito frequentemente, correlacionadas. É o que se chama  correlação serial.

  Quando os erros são dependentes porque foram tomadas observações na mesma unidade ou em unidades agrupadas, o resultado da análise de variância fica comprometido 2

 Portanto, diante de qualquer suspeita de não independência dos erros – é essencial proceder à análise dos resíduos.  Desenha-se um gráfico dos resíduos padronizados contra a ordem (no tempo ou no espaço) em que as observações foram coletadas.  Se a pressuposição de independência estiver satisfeita, os resíduos padronizados devem ficar dispersos em torno de zero (sem um padrão definido).

EXEMPLO

     Veja a Tabela 1 onde, além dos dados, está a ordem em que eles foram tomados. As médias de grupos estão no rodapé da tabela e a análise de variância está na Tabela 2. O quadrado médio do resíduo é 7,00. Os resíduos padronizados são obtidos pela fórmula: 

Tabela 1 - Exemplo de independência

        

                   Tabela 2 - Análise de variância (ANOVA)


   Os resíduos padronizados dos dados apresentados na Tabela 1 estão na Tabela 3. Verifique que são os valores apresentados no diagrama de dispersão da Figura 1. 

             Tabela 3 - Resíduos padronizados

             Figura 1 - Exemplo de independência dos erros 




                                                EXEMPLO


Se os resíduos tiverem clara correlação com a ordem de tomada dos dados como é o caso do exemplo apresentado na Figura 2, não se pode pressupor independência.

Figura 2 - Exemplo de não-independência

    A análise de resíduos é extremamente útil, mas é gráfica. Isto significa que não se pode associar um nível de probabilidade à conclusão de que os erros não são independentes. Mas a pressuposição de independência pode ser transformada em hipótese e essa hipótese pode ser colocada em teste. Quando existe forte suspeita de não independência (de que, por exemplo, um aumento dos valores está correlacionado com a ordem em as observações foram feitas), pode-se aplicar um teste estatístico como, por exemplo, o teste de Durbin Watson.

                         
            Referências:

             1.    SCHEFFÉ, H. The analysis of variance. New York :
                   Wiley, 1959.
              2.  Does your data violate one –way ANOVA assumptions?

                          https://quality-control-plan.com/StatGuide/oneway_anova_ass_viol.htm



     












No comments: