Thursday, October 12, 2017

Médias iguais, distribuições diferentes? experimente o Kruskal-Wallis

O teste de Kruskal-Wallis também é conhecido por nomes como análise de variância de Kruskal-Wallis, ANOVA de Kruskal-Wallis ou mesmo ANOVA não paramétrica. Essa associação com a ANOVA tradicional — e com o teste F de Snedecor — pode levar a um mal-entendido comum: o de que o teste de Kruskal-Wallis compara médias. Mas isso está errado.

O teste de Kruskal-Wallis não testa hipóteses sobre parâmetros populacionais, como médias. Ele também não verifica se as medianas são iguais. O que o teste avalia, na verdade, é se três ou mais populações têm distribuições iguais.

Por esse motivo, ao aplicar o teste de Kruskal-Wallis, não se deve apresentar médias ou medianas dos grupos, nem construir gráficos com base nessas estatísticas. O teste trabalha com postos, ou seja, com os ranks dos dados — e não com os valores brutos coletados.

Para ilustrar essa ideia, considere um exemplo engenhoso [1] com três grupos. Os dados estão apresentados na Tabela 1. Todos eles têm a mesma média (43,5) e a mesma mediana (27,5). Olhando apenas para essas estatísticas, não percebemos que as distribuições são diferentes. Mas os postos são diferentes: Grupo 1: 20,4; Grupo 2:27,5; Grupo 3: 34,6.

Tabela 1

       Dados segundo o grupo               

💡 O teste de Kruskal-Wallis pode captar diferenças na distribuição. Se aplicarmos o teste formalmente, a estatística H pode até indicar uma diferença significativa — dependendo do nível de significância e da variabilidade.

                           Resultados do teste de Kruskal-Wallis

              🔸 Estatística H = 7,36

              🔸 p-valor = 0,025

📌 Interpretação

Apesar de as médias serem iguais nos três grupos (43,5), o teste de Kruskal-Wallis rejeita a hipótese de que as três populações têm a mesma distribuição (p = 0,025). Ou seja, foi detectada diferença nas distribuições — e isso aparece nos postos dos dados, não nas médias.

Veja a Figura 1, que apresenta um gráfico de barras para os postos médios do exemplo. Ele reforça o que já se mostrou, que embora as médias aritméticas sejam iguais, os ranks (postos) dos grupos são diferentes, o que motivou o resultado significativo no teste de Kruskal-Wallis.

                                                Figura 1

 

Veja também o boxplot para os três grupos apresentado na Figura 2. Ele mostra claramente:

Figura 2 


 🔸A presença de valores extremos (outliers) nos Grupos 1 (valor 342) e 2 (valor 193),  não afetam o teste de Kruskal-Wallis, pois ele usa postos, e não os valores brutos (mas afetam a ANOVA).

🔸Diferenças nas distribuições internas dos grupos, reforçando que eles não são equivalentes, mesmo com médias aritméticas iguais.

💡Este exemplo mostra o ponto central do Kruskal-Wallis: ele não testa igualdade de médias, mas sim igualdade de distribuições. Mas veja a fórmula para calcular a estatística H. Se for fazer o teste para um trabalho, melhor buscar uma calculadora on line ou  um software estatístico. Faça exercícios (por que não do livro citado?) 






[1] MCDONALD, JH. Handbook of Biological Statistics. Baltimore. Sparky House Publishing, 2nd ed. p. 165-172, 2009.

Wednesday, October 11, 2017

Odds Ratio em linguagem clara: entenda sem medo!

🎯 Não confunda probabilidade com chance!

Embora as palavras probabilidade e chance estejam associadas à ideia de medir o que é possível, elas não representam a mesma coisa.

Exemplo: probabilidade vs chance

Você lança um dado e ganha se sair o número 6.

🔸Qual é a probabilidade de você ganhar?
A probabilidade de ganhar é 1/6.

🔸E quais são as suas chances nesse jogo?

As chances são de 1:5, 1 (evento favorável) para 5 (eventos desfavoráveis).

🔸 Probabilidade representa a fração de tentativas em que se espera que um evento ocorra.
🔸 Chance (ou odds) expressa a razão entre o número de vezes que se espera que o evento ocorra e o número de vezes que ele não ocorra.

🎯Cuidado ao comparar valores de probabilidade

com valores de chance!

🔸  Uma probabilidade de 9/10 é alta: espera-se acertar 9 a cada 10 vezes.

🔸Uma chance de 9:10 é baixa: para 9 acertos, são esperados 10 erros.

Probabilidade de 9/10 corresponde a uma chance de 9:1, não 9:10.

🎯    Cálculo da chance

Por definição, a chance (w) é a razão entre a probabilidade de o evento ocorrer (p) e a probabilidade de ele não ocorrer (q):

                             

E, evidentemente:

p + q = 1

Exemplo da Genética: chance

Lembre-se dos experimentos de Mendel: no cruzamento de ervilhas amarelas heterozigotas, a proporção esperada é 3 amarelas para cada verde.

        🔸 Probabilidade de nascer ervilha amarela: ¾.

        🔸 Probabilidade de nascer ervilha verde: ¼.

        🔸 Chance de nascer ervilha amarela:

🎯 Razão de chances

A pesquisa científica frequentemente se baseia em comparações. A forma comum de comparar chances entre dois grupos é por meio da razão de chances. Esta estatística é mais conhecida no Brasil pelo termo em inglês, odds ratio, que se abrevia por OR.

Razão de chances, que se indica pela letra o (de odds) é dada pela fórmula:

                        

A razão de chances tornou-se uma ferramenta essencial na pesquisa clínica, pois fornece aos profissionais de saúde uma medida clara sobre qual tratamento tem maior chance de beneficiar o paciente.

                                         Exemplo

Vinte amigos vão a uma lanchonete.

·  7 pedem sanduíche de peixe; 5 passam mal.

·  13 pedem sanduíche de carne; 3 passam mal.


Chance de passar mal com o sanduíche de peixe:

Chance de passar mal com o sanduíche de carne:


Razão de chances (peixe vs. carne):

                           O que isso significa?

Quem comeu sanduíche de peixe teve cerca de 8,33 vezes mais chance de passar mal, comparado a quem comeu carne.

🛑 Associação não significa causa!

 1. Probability vs. Odds Ratio - Math Forum - Ask Dr.Math    mathforum.org/library/drmath/view/71943.html
  2.  https://beanaroundtheworld.wordpress.com/2011/10/07/epidemiology-odds-ratio-or/ 
Veja mais em: