Uma análise de variância só deve ser conduzida se
estiverem satisfeitas algumas exigências.
1.
Os
grupos devem ser formados por unidades que proveem de populações com igual
variância.
2.
As unidades
devem ser independentes, tanto dentro do mesmo grupo como entre os diferentes grupos.
3. As
populações amostradas devem ter distribuição normal.
Vamos tratar aqui a questão de variâncias homogêneas ou, como preferem os
estatísticos – da homocedasticia. Se
os grupos tiverem o mesmo
número de repetições, isto é,
se r1 = r1 =…= rk, o analista pode pressupor variâncias iguais, a menos que uma
das variâncias seja muito maior que as demais. Aliás, o uso de número igual2 de repetições e, de preferência, maior
do que 10 por grupo1 é
a melhor proteção contra os efeitos de variâncias desiguais ou, ou seja, da
heterocedasticia. Se os grupos são similares, esta atitude será ainda mais
defensável. E – em sendo
uma pressuposição – o pesquisador não faz testes.
De qualquer forma, cumpre
lembrar que transgressões à pressuposição de variâncias iguais têm importância em
duas situações: 1) assimetria; 2) curtose positiva (maior do que 2). Se a
distribuição for assimétrica, a variância tende a ser função da média, ou
melhor, em geral a variância cresce quando a variável cresce. Se a curtose
for positiva, o teste F não tem poder, ou seja, não rejeita a hipótese
da nulidade, mesmo que essa hipótese seja incorreta. Esta é a situação mais
grave de heterocedasticia.
Mas hoje, graças à facilidade de uso programas de
estatística, é comum que o analista teste a igualdade de variâncias, isto é, teste a hipótese:
H0: s21= s22= s23=...= s2k
(i=1, 2,… ,k)
contra a hipótese de que existe pelo menos uma
variância diferente das demais.
Foram propostos diversos testes, embora nenhum deles
tenha ampla recomendação. Provavelmente, hoje seja mais aplicado o teste de
Levene, disponível em diversos programas de estatística para computador. Tambémsão
conhecidos são os testes de Cochran, o teste de Hartley e o teste de Bartlett O
teste de Bartlet, que também é bastante usado, tende a mascarar diferenças
que existem quando a curtose é negativa e achar diferenças que não
existem quando a curtose é positiva2.
Mas veja aqui como se faz o teste de Levene. De posse
dos dados, calcule os resíduos:
Depois, faça uma análise de variância com um critério
de classificação (one way layout) dos quadrados desses resíduos.
A lógica do teste de Levene é simples: quanto maiores
são os quadrados dos resíduos, maiores são as variâncias. Então, se as
variâncias são homogêneas, o resultado do teste F para comparar as
médias dos quadrados dos resíduos será não significante.
Para entender o procedimento, veja os
dados da Tabela 1. No rodapé dessa tabela, estão as médias dos grupos. Os quadrados
dos resíduos estão na Tabela 2.
Tabela 1 - Dados segundo o grupo
Tabela 2 - Quadrados dos resíduos segundo o grupo
A análise de variância dos quadrados dos
resíduos que estão na Tabela 2 resíduos está apresentada na Tabela 3 (saída do
SAS). Como o valor de F é não significante, não se rejeita a hipótese de
que as variâncias são homogêneas.
Tabela 3. Teste de Levene
(saída do SAS)
Existe outra forma de proceder
ao teste de Levene. Calculam-se, como anteriormente, os resíduos da análise de
variância. Depois se faz uma análise de variância com um critério de
classificação dos valores absolutos dos resíduos. Veja o resultado dessa
análise na Tabela 4. Este resultado é dado pelo SPSS.
Tabela
4. Teste de Levene (saída do SPSS)
É importante notar que os resultados são
diferentes, mas a conclusão é a mesma: o valor de F é não significante.
Não se rejeita a hipótese de homogeneidade de variâncias.
Também é preciso considerar que
há outras maneiras de proceder ao teste de Levene. Aqui se partiu dos resíduos,
considerando a média aritmética, mas também é possível fazer o teste usando,
por exemplo, a média aparada (trimmed mean)3.
De qualquer forma,
transgressões moderadas da pressuposição de variâncias iguais têm pouca, ou
nenhuma importância prática, a não ser que haja 1) assimetria ou 2) curtose
positiva.
Se a distribuição
for assimétrica, a variância tende
a ser função da média, ou melhor, em geral a variância cresce quando a variável
cresce. Para verificar se isto está acontecendo, desenhe um diagrama de
dispersão das médias contra os desvios padrões e estude a correlação. Se a
pressuposição de igualdade de variâncias for razoável, não deve existir
correlação entre essas estatísticas.
Se a curtose for
positiva, o teste F não tem
poder, ou seja, não rejeita a hipótese da nulidade, mesmo que essa hipótese
seja incorreta[1].
Esta é a situação mais grave de heterocedasticia.
Referências
1.
Dean, A. e Voss, D.
Design and analysis of experiments. Springer, 1999.
2. Scheffé, H. The analysis of variance. New York : Wiley,
1959.
3. Zaiontz, C. Levene´s
test http://www.real-statistics.com/one-way-analysis-of-variance-anova/homogeneity-variances/levenes-test/
1.
1 comment:
Excelente explicação!
Post a Comment