Saturday, May 07, 2016

A distribuição gaussiana dos erros de medida

O conhecimento do mundo em que vivemos é obtido por meio de experimentos e medições. Mas já sabemos que não é possível obter resultados exatos quando medimos. Também sabemos que é preciso minimizar erros e indicar o grau de incerteza dos resultados das medições, ou seja, para que as medidas tenham significado, devemos escrever:
                                       X + DX,
em que X é nossa melhor estimativa da medida e DX é a incerteza associada ao resultado. Ficamos assim conscientes de que, se fizermos novas medições, é bastante provável que os novos valores caiam no intervalo X + DX.
Não há como zerar os erros das medições. No entanto, a distribuição dos erros tem uma aparência típica. Conta a lenda que os assistentes de Gauss, o grande matemático e astrônomo do século XIX, estavam tomando algumas medidas, mas não eram capazes de obter o mesmo resultado, em medições repetidas. Gauss ficou muito zangado e começou a gritar, dizendo que iria mostrar àquela gente que quem sabe medir obtém repetidamente o mesmo valor, todas as vezes. Só que ele não conseguiu fazer isso.  
Mas Gauss era gênio. Desenhou um histograma e percebeu que o desenho tinha o aspecto de uma curva muito conhecida, a “curva do sino”, que depois passou a ser conhecida como a lei gaussiana dos erros. Os estatísticos em geral se referem à “curva do sino” como distribuição normal, mas os físicos preferem a denominação distribuição de Gauss. Vamos então entender a distribuição normal, por meio de um exemplo.   
EXEMPLO
Com um cronômetro na mão para medir o período de oscilação de um pêndulo, você faz n=20 medições. Os resultados estão na tabela dada em seguida.

Leituras do período de oscilação de um pêndulo, em segundos


A média aritmética das n=20 medidas é a melhor estimativa para o período de oscilação:
Então os desvios da média, apresentados na tabela abaixo, estimam os erros de medida. 

Desvios da média das leituras do período
 de oscilação de um pêndulo, em segundos

Vamos contar quantas vezes ocorreu cada valor de desvio da média, isto é, organizar os dados em uma tabela de distribuição de frequências e depois desenhar um histograma.
Tabela de distribuição de frequências

Histograma para os desvios da média das leituras do período
 de oscilação de um pêndulo, em segundos

O que mostra o exemplo? Que desvios ocorrem ao acaso, às vezes maiores, às vezes menores, às vezes positivos, às vezes negativos, mas distribuídos em torno da média aritmética. O grau de dispersão dos desvios em torno da média é dado pelo desvio padrão. No caso do exemplo:

Toda distribuição de frequências é construída com os dados de uma amostra. À medida que aumentamos a amostra, os histogramas começam a se assemelhar à distribuição normal, uma distribuição teórica, dada em gráfico na figura abaixo.


Distribuição normal

Mas reveja o histograma que desenhamos. Não parece razoável considerar que se as medições fossem repetidas muitas e muitas vezes, teríamos um histograma com aspecto muito similar ao da “curva do sino”?

Vamos estudar um pouco mais a distribuição normal, que tem características bem conhecidas:

·                  Graficamente, é uma curva em forma de sino.
·                A média, a mediana e a moda coincidem e estão no centro da distribuição.
·          A curva é simétrica em torno da média. Logo, 50% dos valores são iguais ou maiores do que a média e 50% dos valores são iguais ou menores do que a média.
·                 A curva abriga 100% da população. Isto equivale dizer que a área total sob a curva é 1. 


Simetria da distribuição normal

A distribuição normal é definida quando são dados dois parâmetros: a média, que se representa pela letra grega m (lê-se mi) e o desvio padrão, que se representa pela letra grega s (lê-se sigma). Quando muda a média e/ou o desvio padrão, muda a configuração da curva. Veja a figura abaixo, que mostra distribuições normais com a mesma média e diferentes desvios padrões.

Distribuições normais: média zero, desvios padrões diferentes

Nenhuma distribuição de dados reais tem características idênticas às da distribuição normal. No entanto, se você puder pressupor que a variável que estuda tem distribuição aproximadamente normal, pode considerar que os dados obedecem à chamada “regra empírica”. Veja a figura: de acordo com essa “regra empírica”, cerca de

·     68% (pouco mais de ) dos resultados das medições  estarão a menos de um desvio padrão de distância da média, para mais ou para menos.
·       95% dos resultados das medições estarão a menos de dois desvios padrões de distância da média, para mais ou para menos.
·        99,7% dos resultados das medições estarão a menos de três desvios padrões de distância da média, para mais ou para menos.

Na prática, o que isso significa? Se você tiver muitas e muitas medições de um mesmo mensurando, é bastante provável que a média aritmética esteja perto da medida real e que os resultados das medições tenham distribuição aproximadamente normal. 


Nota: 1.o uso da distribuição normal para avaliar incerteza da medição, é comum na prática. Mas há críticas. Veja, por exemplo,Hulme e Symms, The law of error and the combinationof observations. Royal Astronomic Society.
           2. Veja a avaliação tipo A de incerteza em outra postagem
VEJA
1.          ISO International Organization for Standardization
2.          O exemplo do cronômetro é de Physics Laboratory Tutorial : Error Analysis - Columbia ...
3.          http://reference.wolfram.com/applications/eda/ExperimentalErrorsAndErrorAnalysis.html
4.          Uncertainties & Error Analysis Tutorialhttp://physics.wustl.edu/introphys/Phys117_118/Lab_Manual/Tutorials /ErrorAnalysisTutorial.pdf 
6.          





No comments: