A análise de variância (ANOVA) tem a finalidade de testar
se existem diferenças significantes entre as médias de três ou mais grupos, desde que a variável em análise seja quantitativa. Logo,
testa a hipótese:
H0: m1= m2= m3=...=mk (i=1, 2,… ,k)
contra a hipótese de que existe pelo menos uma média
de grupos diferente das demais.
Vamos
considerar aqui apenas as análises de variância com um critério de classificação (one way layout anova), quando todos os grupos têm o mesmo número de repetições.
O
valor observado na j-ésima (j = 1, 2,…,r) unidade do i-ésimo (i = 1, 2,… ,k) grupo é indicado por Yij.
Esta é a variável dependente,
porque seu valor depende do grupo ao qual a unidade pertence. Grupos são a variável independente.
Então, o modelo de uma
análise de variância (ANOVA) com um critério de classificação é escrito como segue:
Yij = mi + eij. i=1, 2,… ,k; j=
1, 2, …, r
A resposta
de uma unidade (Yij)é dada pela média verdadeira de todas as respostas
possíveis do grupo ao qual pertence (mi), acrescida da quantidade eij, que é um erro
aleatório (random error).
Ninguém conhece os parâmetros que ,neste caso, são as médias verdadeiras mi
dos grupos. O pesquisador faz um experimento exatamente para obter as
estimativas
dessas médias. E é com essas estimativas que o
pesquisador procede à análise de variância, para testar a hipótese de igualdade
das médias mi
dos grupos.
EXEMPLO
Veja os dados apresentados na Tabela 1. As médias verdadeiras m1, m2, m3 e m4 dos grupos A, B, C e D são desconhecidas. No entanto, os dados obtidos pelo pesquisador permitem obter as respectivas estimativas, que estão no rodapé da
tabela.
A Tabela 2 apresenta a análise de variância dos dados da Tabela 1. As fórmulas necessárias para proceder a essa análise são encontradas em livros de estatística, mas use um programa de computador.
Tabela
1 – Dados obtidos em quatro grupos
Tabela
2 – Análise de variância dos dados da Tabela 1
Os erros aleatórios eij também são desconhecidos porque são definidos em função das médias verdadeiras m1, m2, m3 e m4. Mas erros aleatórios podem ser estimados fazendo a diferença entre cada valor observado e a média do grupo
ao qual o dado pertence:
As estimativas dos erros recebem o nome de resíduos
(residuals). Veja a Tabela 3, que mostra os resíduos dos dados da Tabela 1. É a análise de resíduos que permite determinar se a análise de variância é aceitável.
Isto porque a análise de variância exige pressuposições sobre os erros. A partir dos resíduos, o
pesquisador pode testar hipóteses sobre os erros.
Tabela 3 – Resíduos de dados apresentados na Tabela 1
1. Os erros devem ser independentes, ou seja, o erro de uma observação não pode estar correlacionado com o erro em outra observação. Isto significa que as unidades
dentro de um mesmo grupo devem ser totalmente independentes uma das outras e nenhuma unidade deve estar em
mais de um grupo.
2. Os erros devem ser de mesma grandeza, ou seja, não deve haver dados
discrepantes (outliers). Dados discrepantes são aqueles que não seguem o
padrão da grande maioria dos dados coletados (por exemplo, em um estudo com 100 pessoas com idade entre 23 a 28 anos, uma pessoa com 52 anos seria discrepante).
3. Os erros devem ter distribuição normal ou aproximadamente normal. Pequenas violações da
normalidade são aceitáveis, desde que a distribuição não seja
assimétrica.
4. É necessário haver homocedasticia, ou seja, erros dentro de cada grupo devem ter grandezas similares (mesma variância).
No comments:
Post a Comment