Sonia Vieira: A curva do sino e os erros das medições: conhecendo a distribuição normal

O conhecimento do mundo em que vivemos é obtido por meio de experimentos e medições. Mas já sabemos que não é possível obter resultados exatos quando medimos. Também sabemos que é preciso minimizar erros e indicar o grau de incerteza dos resultados das medições. Para que as medidas tenham significado, devemos escrever:

X ± ΔX,

em que X é nossa melhor estimativa da medida e ΔX é a incerteza associada ao resultado.

Ficamos assim conscientes de que, se fizermos novas medições, é bastante provável que os novos valores caiam no intervalo X ± ΔX.

Não há como zerar os erros das medições. No entanto, a distribuição dos erros tem uma aparência típica. Conta a história que os assistentes de Gauss, o grande matemático e astrônomo do século XIX, estavam tomando algumas medidas, mas não eram capazes de obter o mesmo esultado, em medições repetidas. Gauss ficou muito zangado e começou a gritar, dizendo que iria mostrar àquela gente que quem sabe medir obtém repetidamente o mesmo valor, todas as vezes. Só que ele não conseguiu fazer isso.

Mas Gauss era gênio. Desenhou um histograma e percebeu que o desenho tinha o aspecto de uma curva muito conhecida, a “curva do sino”, que depois passou a ser conhecida como a lei gaussiana dos erros. Os estatísticos em geral se referem à “curva do sino” como distribuição normal, mas os físicos preferem a denominação distribuição de Gauss. Vamos então entender a distribuição normal, por meio de um exemplo.

EXEMPLO

Com um cronômetro na mão para medir o período de oscilação de um pêndulo, você faz n = 20 medições. Os resultados estão na tabela dada em seguida.

Leituras do período de oscilação de um pêndulo, em segundos

A média aritmética das 20 medidas é:

A média aritmética das n = 20 medidas é a melhor estimativa para o período de oscilação. Os desvios da média, apresentados na tabela abaixo, estimam os erros de medida.

Desvios da média das leituras do período de oscilação de um pêndulo, em segundos

Os desvios da média estão organizados em uma tabela de frequências.

Tabela de distribuição de frequências

Histograma para os desvios da média das leituras

O que mostra o exemplo? Que desvios ocorrem ao acaso, às vezes maiores, às vezes menores, às vezes positivos, às vezes negativos, mas distribuídos em torno da média aritmética. O grau de dispersão dos desvios em torno da média é dado pelo desvio padrão amostral.

Toda distribuição de frequências é construída com os dados de uma amostra. À medida que aumentamos a amostra, os histogramas que exibem os resultados de erros aleatórios nas medições começam a se assemelhar à distribuição normal, uma distribuição teórica cuja configuração é dada na figura que segue.

Apresentação gráfica da distribuição normal

Vamos estudar um pouco mais a distribuição normal, que tem características bem conhecidas:

· Graficamente, é uma curva em forma de sino.

· A média, a mediana e a moda coincidem e estão no centro da distribuição.

· A curva é simétrica em torno da média. Logo, 50% dos valores são iguais ou maiores que a média e 50% iguais ou menores.

· A curva abriga 100% da população, ou seja, a área total sob a curva é 1.

A distribuição normal é definida por dois parâmetros:

· μ (mi): média

· σ (sigma): desvio padrão

Quando mudamos μ e/ou σ, a configuração da curva muda. Veja a figura abaixo com distribuições normais de mesma média e diferentes desvios padrões.

Apresentação gráfica de distribuições normais:

mesma média, diferentes desvios padrão

Embora nenhuma distribuição real seja perfeitamente normal, muitas se aproximam. Reveja o histograma que desenhamos. Não parece razoável considerar que se as medições fossem repetidas muitas e muitas vezes, teríamos um histograma com aspecto muito similar ao da “curva do sino”? Observe a figura que é dada em seguida.

Histograma (com normal) para os desvios da média das leituras

Na prática: se você tem muitas medições de um mesmo mensurando, é bem provável que a média aritmética esteja perto da medida real e os erros distribuam-se normalmente.

Notas:

1. O uso da distribuição normal para avaliar incerteza é comum, mas há críticas. Veja por exemplo: Hulme e Symms, The Law of Error and the Combination of Observations. Royal Astronomical Society.

2. Veja a avaliação tipo A de incerteza em outra postagem deste mesmo blog.

Referências:

1. ISO International Organization for Standardization

2. Physics Laboratory Tutorial: Error Analysis - Columbia

3. http://reference.wolfram.com/applications/eda/ExperimentalErrorsAndErrorAnalysis.html

4. http://physics.wustl.edu/introphys/Phys117_118/Lab_Manual/Tutorials/ErrorAnalysisTutorial.pdf

5. http://teacher.nsrl.rochester.edu/phylabs/AppendixB/AppendixB.html