Thursday, May 10, 2018

O que é assimetria (ou distorção) e como se mede?

1. O que é assimetria em uma distribuição de dados?

    ·      Se a cauda esquerda é mais pronunciada, temos assimetria negativa.

    ·      Se a cauda direita é mais pronunciada, a assimetria é positiva.

     ·      Caso contrário, a distribuição é simétrica.

Os livros costumam apresentar histogramas para ilustrar caudas longas e o efeito dos valores extremos sobre a média.

                                                      Figura 1

                Histogramas com diferentes formas de assimetria

Fonte: David P. Doane & Lori E. Seward (2011) Measuring Skewness:

A Forgotten Statistic?, Journal of Statistics Education, 19:2, ,

DOI: 10.1080/10691898.2011.11889611 To link to this article: https://doi.org/10.1080/10691898.2011.11889611


2. Ferramentas visuais para avaliar a assimetria

 Além do histograma, considere:

·     Boxplot (diagrama de caixa) útil para ver dispersão e valores extremos.

·    Dotplot (diagrama de pontos): mostra o tamanho da amostra.

·     Diagrama de ramo e folhas: revela dados individuais e simetria.

 Figura 2  

 Blogspot e dotplot 

3. Média, mediana e moda: qual é o centro?


Regra clássica:

         ·      - Média > mediana → assimetria à direita.

         ·      - Média < mediana → assimetria à esquerda.

Essa regra pode falhar, especialmente em distribuições discretas ou multimodais.

Figura 3  

Assimetria à direita (média maior que a mediana)

Fonte: von Hippel, P.T. Mean, Median, and Skew: Correcting a Textbook Rule. 

Journal of Statistics Education, 13 (2). 2005. ww2.amstat.org/publications/jse/v13n2/vonhippel.html

Figura 4

 Assimetria à direita (média menor que a mediana)

Fonte: von Hippel, P.T. Mean, Median, and Skew:Correcting a Textbook Rule. 

Journal of Statistics Education, 13 (2). 2005. ww2.amstat.org/publications/jse/v13n2/vonhippel.htmlFonte: 

4. Como medir a assimetria? Os coeficientes de Pearson


        ·      Primeiro coeficiente de Pearson:

       ·      Segundo coeficiente de Pearson: 

    em que x-barra = média, md = mediana, s = desvio padrão da amostra.

Exemplo

   Calcule o primeiro e o segundo coeficientes de Pearson para encontrar a assimetria de         dados com as seguintes estatísticas: média = 70,5; mediana = 80; moda = 85; desvio            padrão = 19,33.

5. Cuidado com a moda!

        ·      Se a moda for baseada em poucas observações, ela não representa bem a tendência central.

Exemplo comparativo com dois conjuntos pequenos de dados 

          No conjunto de dados 1; 2; 3; 4; 5; 5, a moda não expressa bem a tendência central.             Já no conjunto1; 2; 3; 3; 3; 3; 3; 3; 4, a moda expressa a tendência central.  

6. Como interpretar os coeficientes de Pearson?

          ·     Sinal negativo: assimetria à esquerda.

          ·    Sinal positivo: assimetria à direita.

          ·   Valor próximo de zero: distribuição aproximadamente simétrica.

7. Momentos estatísticos e o coeficiente clássico de Fisher-Pearson

         ·      O segundo momento (m) é a variância.

         ·      O terceiro momento (m) mede a assimetria.

         ·      Coeficiente tradicional: m₃ / m₂^(3/2).

  Na maioria dos softwares não se encontra mais essa fórmula, embora ela esteja presente na literatura. Mas essa fórmula trabalha com parâmetros populacionais. 

8. O coeficiente padronizado de Fisher-Pearson (usado no Excel)

·      Fórmula ajustada para o tamanho da amostra:

 Exemplo

  Calcule o  coeficiente de Pearson para os dados : 3, 4, 5, 2, 3, 4, 5, 6, 4, 7.

                Coeficiente = 0,359543 (diminui com o aumento da amostra).

9. Uma observação importante

 Ao usar essas medidas, normalmente se assume como referência uma população simétrica específica — muitas vezes, a distribuição normal.

Recomendações:
(1) Veja explicações para histogramas com aparências incomuns em:
           Vieira, S. Estatística para Qualidade. 3 ed. Rio de Janeiro. Elsevier.
(2) Veja a questão de assimetria, exigida para uma análise de variância, em
            Scheffé, H. Analysis of variance. Nova York, Wiley.