Introdução
A Análise de Variância (ANOVA) é uma técnica
estatística utilizada para verificar se há diferenças significativas entre as
médias de dois ou mais grupos. A ANOVA testa a hipótese:
H₀: μ₁ = μ₂ = μ₃ = ... = μₖ
contra a hipótese alternativa de que pelo menos uma média difere das demais.
Neste texto, vamos tratar exclusivamente da ANOVA com um critério de classificação (one-way
layout ANOVA).
Seja Yᵢⱼ o valor
observado na j-ésima unidade (j = 1, 2, ..., r) do i-ésimo
grupo (i = 1, 2, ..., k). Esta é a variável dependente, pois seu valor
depende do grupo ao qual a unidade pertence. Já os grupos constituem a variável
independente.
O modelo da ANOVA com um critério de classificação é:
Yᵢⱼ = μᵢ + eᵢⱼ
onde
- μᵢ é a média
verdadeira do grupo i,
- eᵢⱼ é o erro
aleatório associado à unidade j do grupo i.
Como os valores reais das médias μᵢ são
desconhecidos, o pesquisador realiza um experimento para obter estimativas
dessas médias. É com base nessas estimativas que se realiza a análise de
variância.
Exemplo
Considere os dados da Tabela 1. As médias verdadeiras dos grupos A, B, C e D (μ₁, μ₂, μ₃, μ₄) são desconhecidas, mas podemos estimá-las com os valores obtidos em um experimento.
Tabela 1
Dados obtidos em quatro grupos
Na Tabela 2 está apresentada a ANOVA desses dados.
Tabela 2
Análise de variância (ANOVA)
Os erros aleatórios eᵢⱼ também são desconhecidos, pois são definidos com base nas médias verdadeiras. No entanto, podemos obter estimativas desses erros: basta subtrair a média do grupo de cada valor observado. Essas estimativas são chamadas de resíduos.
Resíduos dos dados da Tabela 1
Pressupostos
da ANOVA
🔹.
Independência dos erros
Os erros devem ser independentes, ou seja, o erro de
uma observação não deve estar correlacionado com o erro de outra. Isso exige
que: as unidades dentro de um mesmo grupo sejam independentes entre si; nenhuma
unidade pertença a mais de um grupo; os dados tenham sido coletados de forma
independente.
🔹.
Normalidade dos erros
Os erros devem seguir, aproximadamente, uma
distribuição normal. Pequenas violações são aceitáveis, principalmente em
amostras grandes, desde que não haja forte assimetria. Atenção: a exigência de
normalidade vale para os erros (resíduos), não para os dados brutos.
🔹.
Homogeneidade das variâncias (homocedasticidade)
As variâncias dos erros devem ser semelhantes entre os
grupos. Isso significa que a variabilidade interna de cada grupo deve ter
magnitude comparável.
🔹.
Ausência de outliers
A presença de dados extremos pode distorcer os
resultados da ANOVA. Por isso, deve-se verificar se há outliers (valores muito
discrepantes) e, se necessário, tratá-los antes da análise.
🔹.
Variável dependente contínua
A variável analisada deve ser medida em escala
intervalar ou de razão, como tempo, peso, altura etc.
🔹.
Variável independente categórica
O fator de classificação (grupos, tratamentos,
regiões, etc.) deve ser uma variável categórica.
O que fazer se os pressupostos forem violados?
Violação |
Alternativas |
Normalidade |
Transformar os dados ou utilizar testes não
paramétricos (ex.: teste de Kruskal-Wallis) |
Homogeneidade
das variâncias |
Aplicar transformações (como logaritmo) ou usar
testes não paramétricos |
Independência |
Utilizar modelos mistos ou ANOVA para medidas
repetidas |
No comments:
Post a Comment