Thursday, October 12, 2017

Médias iguais, distribuições diferentes? experimente o Kruskal-Wallis

O teste de Kruskal-Wallis também é conhecido por nomes como análise de variância de Kruskal-Wallis, ANOVA de Kruskal-Wallis ou mesmo ANOVA não paramétrica. Essa associação com a ANOVA tradicional — e com o teste F de Snedecor — pode levar a um mal-entendido comum: o de que o teste de Kruskal-Wallis compara médias. Mas isso está errado.

O teste de Kruskal-Wallis não testa hipóteses sobre parâmetros populacionais, como médias. Ele também não verifica se as medianas são iguais. O que o teste avalia, na verdade, é se três ou mais populações têm distribuições iguais.

Por esse motivo, ao aplicar o teste de Kruskal-Wallis, não se deve apresentar médias ou medianas dos grupos, nem construir gráficos com base nessas estatísticas. O teste trabalha com postos, ou seja, com os ranks dos dados — e não com os valores brutos coletados.

Para ilustrar essa ideia, considere um exemplo engenhoso [1] com três grupos. Os dados estão apresentados na Tabela 1. Todos eles têm a mesma média (43,5) e a mesma mediana (27,5). Olhando apenas para essas estatísticas, não percebemos que as distribuições são diferentes. Mas os postos são diferentes: Grupo 1: 20,4; Grupo 2:27,5; Grupo 3: 34,6.

Tabela 1

       Dados segundo o grupo               

💡 O teste de Kruskal-Wallis pode captar diferenças na distribuição. Se aplicarmos o teste formalmente, a estatística H pode até indicar uma diferença significativa — dependendo do nível de significância e da variabilidade.

                           Resultados do teste de Kruskal-Wallis

              🔸 Estatística H = 7,36

              🔸 p-valor = 0,025

📌 Interpretação

Apesar de as médias serem iguais nos três grupos (43,5), o teste de Kruskal-Wallis rejeita a hipótese de que as três populações têm a mesma distribuição (p = 0,025). Ou seja, foi detectada diferença nas distribuições — e isso aparece nos postos dos dados, não nas médias.

Veja a Figura 1, que apresenta um gráfico de barras para os postos médios do exemplo. Ele reforça o que já se mostrou, que embora as médias aritméticas sejam iguais, os ranks (postos) dos grupos são diferentes, o que motivou o resultado significativo no teste de Kruskal-Wallis.

                                                Figura 1

 

Veja também o boxplot para os três grupos apresentado na Figura 2. Ele mostra claramente:

Figura 2 


 🔸A presença de valores extremos (outliers) nos Grupos 1 (valor 342) e 2 (valor 193),  não afetam o teste de Kruskal-Wallis, pois ele usa postos, e não os valores brutos (mas afetam a ANOVA).

🔸Diferenças nas distribuições internas dos grupos, reforçando que eles não são equivalentes, mesmo com médias aritméticas iguais.

💡Este exemplo mostra o ponto central do Kruskal-Wallis: ele não testa igualdade de médias, mas sim igualdade de distribuições. Mas veja a fórmula para calcular a estatística H. Se for fazer o teste para um trabalho, melhor buscar uma calculadora on line ou  um software estatístico. Faça exercícios (por que não do livro citado?) 






[1] MCDONALD, JH. Handbook of Biological Statistics. Baltimore. Sparky House Publishing, 2nd ed. p. 165-172, 2009.

1 comment:

Jean Limongi said...

Professora Sônia. Sua didática para ensinar estatística é fascinante.