Friday, July 11, 2025

Comparando a ANOVA clássica com a ANOVA de Welch

 

 Boxplot dos grupos - Exemplo de Zaiontz

Antes de aplicar um teste estatístico a um conjunto de dados, é preciso saber se as pressuposições exigidas pelo teste estão satisfeitas. Como em grande parte dos trabalhos os pesquisadores buscam um teste para comparar médias – a análise de variância (ANOVA) surge como solução natural. No entanto, os pesquisadores nem sempre informam se as pressuposições para a aplicação do teste F foram atendidas.

A análise de variância com um critério de classificação – clássica em trabalhos de pesquisa – exige que os grupos em comparação tenham a mesma variância. Se a amostra for pequena e os grupos tiverem tamanhos diferentes, variâncias desiguais podem levar a conclusões incorretas.

É comum sugerir, em tais situações, o uso de transformação da variável (em geral logaritmo ou raiz quadrada), que deve estabilizar as variâncias e as tornar mais iguais. Isto em geral acontece. De qualquer forma, a análise de variância (ANOVA) é robusta mesmo quando as pressuposições exigidas para sua aplicação não são plenamente atendidas – desde que o delineamento seja balanceado e a amostra seja grande. Por outro lado, a análise de variância com um critério da classificação pode ser substituída por um teste não-paramétrico. Isso deve ser feito porque, nessa situação, as variâncias desiguais não importam. O problema, aqui, é o fato de os pesquisadores, muitas vezes, insistirem na ideia de comparar médias, ou seja, estimar parâmetros após a aplicação de um teste não-paramétrico.

Outra solução, menos usada, para a análise de um delineamento com um critério de classificação é a aplicação da ANOVA de Welch, ou teste W, disponível em praticamente todos os softwares estatísticos. Esse tipo de análise é uma modificação da ANOVA tradicional, porém mais robusta quando a pressuposição de igualdade de variâncias é violada e, especialmente quando, nesses casos, os grupos têm tamanhos diferentes. Mas como se procede à ANOVA de Welch?

 

        Diferenças Matemáticas entre o Teste F e o Teste W

 

1. ANOVA TRADICIONAL DE UM ENSAIO INTEIRAMENTE AO ACASO (TESTE F)

Vamos começar lembrando as fórmulas para calcular o valor de F em uma análise de variância (ANOVA) de um delineamento inteiramente ao acaso, com k grupos e rj repetições, ou seja, com grupos de tamanhos diferentes. Seja yij a variável em análise.

 

A soma de quadrados entre grupos SSB (sum of squares between), que mede a variação entre médias de grupos, é dada por:


 

onde



A soma de quadrados dentro de grupos SSW (sum of squares within), que mede a variação dentro de grupos, é dada por:

 

           

onde

Note que grupos maiores contribuem mais para as somas de quadrados.

A soma de quadrados total (Total sum of squares), que dá a variação total dos dados, é dada por:

 

O valor de F é calculado como segue:

 


EXEMPLO

 

Apenas para ver como são feitos os cálculos, imagine que um ensaio com três grupos, A, B e C, forneceu os dados que se seguem. Vamos calcular as somas de quadrados e o valor de F.



Soma de quadrados entre grupos (SSB):

  

 

Soma de quadrados dentro de grupos (SSW):


         

2. ANOVA DE WELCH DE UM ENSAIO INTEIRAMENTE AO ACASO (TESTE W)


Onde

O fator de ponderação, wj = nj/sj2, dá maior peso aos grupos maiores (nj >>>) e menor peso aos grupos de maior variância (sj2 >>>).

EXEMPLO

O exemplo que se segue é de Charles Zaiontz (https://real-statistics.com/one-way-analysis-of-variance-anova/welchs-procedure/)

 Vamos aplicar a ANOVA de Welch, fazendo os cálculos por partes. Primeiro, vamos calcular FWELCH. Depois, os graus de liberdade associados ao FWELCH calculado.

            1.      Fatores de ponderação



2.      Média global ponderada

3.      Numerador do teste W ou F de Welch

 

4.      Denominador do teste W ou F de Welch (por partes)

 

 

5.      Valor do teste W ou F de Welch

6.      Graus de liberdade

                       Numerador = k -1

                          EXEMPLO
 

Os dados apresentados acima levaram a um F = 4,32, com 2 e 11,7 graus de liberdade, significante no nível de 5%. A análise de variância (ANOVA) tradicional leva a um F = 2,11, com 2 e 24 graus de liberdade, não significante no nível de 5%. Reveja os dados apresentados. Note a grande diferença das variâncias. Quando as variâncias são tão heterogêneas, o resultado obtido pela ANOVA de Welch é mais confiável.

 

IMPORTANTE: A maior parte dos softwares fornecem as duas respostas.


Veja:

Zaiontz, C. Welch´s Anova test Real Statistics using Excel.

https://real-statistics.com

https://support.minitab.com/pt-br/minitab/help-and-how-to/statistical-modeling/

anova/how-to/one-way-anova/methods-and-formulas/

multiple-comparisons


Delacre,M.; Leys,C.;Mora, Y. L.;Lakens,
D. Taking Parametric Assumptions Seriously: Arguments

for the Use of Welch’s F-test instead of the Classical F-test in One-Way ANOVA. International

Review of Social Psychology. International Review of Social Psychology

 


No comments: