Thursday, January 12, 2017

Resíduos Dependentes: Sinal de Alerta na ANOVA

   

    Introdução

Uma das pressuposições essenciais da análise de variância (ANOVA) em um ensaio inteiramente ao acaso (one-way trial) é a independência dos resíduos — ou seja, espera-se que os erros sejam variáveis aleatórias independentes.

 O que são resíduos?

Resíduos (ou erros) são as diferenças entre os valores observados e as médias dos grupos. Eles representam a variação não explicada pelo fator em estudo.

Fórmula do resíduo   

onde                                     


   Como a independência pode ser violada?

Em geral, a independência é determinada apenas pela maneira como os dados são coletados [1]. A dependência ocorre quando:

 

   🔹Medições repetidas em uma mesma unidade experimental

Qualquer medida obtida em determinado instante (yi+1) em uma unidade está, necessariamente, correlacionada com a medida (yi) obtida anteriormente nessa mesma unidade. Portanto, se durante diversas semanas você obtiver amostras de sangue na mesma pessoa para estudar o efeito de uma droga terapêutica ao longo do tempo – não pode considerar que os erros das medidas são independentes. 

  

   🔹 Medidas feitas em unidades agrupadas

 

Quando são feitas observações em unidades agrupadas, os resíduos se tornam dependentes. Assim, se você observar pesar cobaias que estão na mesma gaiola, não pode considerar que as medidas obtidas são independentes.


Por que a independência é importante?


Sem independência dos erros, a variabilidade aleatória do resíduo desaparece e a validade da ANOVA fica comprometida.

Como verificar a independência?

Diante de qualquer suspeita de não independência dos erros – é essencial proceder à análise dos resíduos.  Construa um gráfico dos resíduos padronizados em função da ordem de coleta dos dados. Se forem independentes, os pontos devem se espalhar aleatoriamente em torno de zero.

Resíduo padronizado

    Fórmula do resíduo padronizado   

  Onde
               

Exemplo prático
Tabela 1
 Dados com ordem de coleta
Tabela 2
Análise de variância (ANOVA)


O Quadrado Médio do Resíduo da ANOVA é 7,00. Os resíduos padronizado dos dados apresentados na Tabela 1 estão na Tabela 3 e na Figura 1. Veja que os pontos se distribuem em torno de zero.

Tabela 3
Resíduos padronizados
Figura 1
Resíduos padronizados

 Veja agora a Figura 2, que apresenta uma distribuição de resíduos         padronizados que não se distribuem em torno de zero. Os dado desse exemplo são dependentes.

Figura 2
Resíduos padronizados :dependência
    Veja agora a Figura 2, que apresenta uma distribuição de resíduos         padronizados que não se distribuem em torno de zero. Se os                resíduos tiverem clara correlação com a ordem de tomada dos dados      como é o caso do exemplo apresentado na Figura 2, não se pode            pressupor independência.

      Consequências de dependência dos erros

Se os dados são coletados sequencialmente (ex.: medições ao longo do tempo) e há auto correlação (um resíduo alto tende a ser seguido por outro), a ANOVA pode superestimar a significância dos resultados.

Em experimentos com repetições não aleatórias (ex.: amostras de uma mesma planta em vez de plantas diferentes), os erros são correlacionados, invalidando as conclusões.


Como garantir a independência dos erros?

A análise de resíduos é extremamente útil, mas é gráfica. Isto significa que não se pode associar um nível de probabilidade à conclusão de que os erros não são independentes. Mas a pressuposição de independência pode ser transformada em hipótese e essa hipótese pode ser colocada em teste. Quando existe forte suspeita de não independência (de que, por exemplo, um aumento dos valores está correlacionado com a ordem em as observações foram feitas), pode-se aplicar um teste estatístico como o teste de Durbin Watson.

 Como Garantir a Independência dos Erros?

🔄Delineamento correto do ensaio: As unidades devem ser designadas aos grupos por processo aleatório.

🔄Medidas repetidas exigem modelos específicos: Se houver repetições no tempo ou espaço, use modelos específicos.

🔄Verificação estatística: Gráficos de resíduos vs. ordem de coleta dos dados ajudam a detectar dependência. Existem testes para auto correlação dos resíduos, como o de Durbin-Watson. 


 
            Referências

         1.  SCHEFFÉ, H. The analysis of variance. New York : Wiley, 1959.
                 2.  Does your data violate one –way ANOVA assumptions?  https://quality-control-                                              plan.com/StatGuide/oneway_anova_ass_viol.htm



     












No comments: