Saturday, May 07, 2016

A distribuição gaussiana dos erros de medida

O conhecimento do mundo em que vivemos é obtido por meio de experimentos e medições. Mas já sabemos que não é possível obter resultados exatos quando medimos. Também sabemos que é preciso minimizar erros e indicar o grau de incerteza dos resultados das medições, ou seja, para que as medidas tenham significado, devemos escrever:
                                       X + DX,
em que X é nossa melhor estimativa da medida e DX é a incerteza associada ao resultado. Ficamos assim conscientes de que, se fizermos novas medições, é bastante provável que os novos valores caiam no intervalo X + DX.
Não há como zerar os erros das medições. No entanto, a distribuição dos erros tem uma aparência típica. Conta a lenda que os assistentes de Gauss, o grande matemático e astrônomo do século XIX, estavam tomando algumas medidas, mas não eram capazes de obter o mesmo resultado, em medições repetidas. Gauss ficou muito zangado e começou a gritar, dizendo que iria mostrar àquela gente que quem sabe medir obtém repetidamente o mesmo valor, todas as vezes. Só que ele não conseguiu fazer isso.  
Mas Gauss era gênio. Desenhou um histograma e percebeu que o desenho tinha o aspecto de uma curva muito conhecida, a “curva do sino”, que depois passou a ser conhecida como a lei gaussiana dos erros. Os estatísticos em geral se referem à “curva do sino” como distribuição normal, mas os físicos preferem a denominação distribuição de Gauss. Vamos então entender a distribuição normal, por meio de um exemplo.   
EXEMPLO
Com um cronômetro na mão para medir o período de oscilação de um pêndulo, você faz n=20 medições. Os resultados estão na tabela dada em seguida.

Leituras do período de oscilação de um pêndulo, em segundos


A média aritmética das n=20 medidas é a melhor estimativa para o período de oscilação:
Então os desvios da média, apresentados na tabela abaixo, estimam os erros de medida. 

Desvios da média das leituras do período
 de oscilação de um pêndulo, em segundos

Vamos contar quantas vezes ocorreu cada valor de desvio da média, isto é, organizar os dados em uma tabela de distribuição de frequências e depois desenhar um histograma.
Tabela de distribuição de frequências

Histograma para os desvios da média das leituras do período
 de oscilação de um pêndulo, em segundos

O que mostra o exemplo? Que desvios ocorrem ao acaso, às vezes maiores, às vezes menores, às vezes positivos, às vezes negativos, mas distribuídos em torno da média aritmética. O grau de dispersão dos desvios em torno da média é dado pelo desvio padrão. No caso do exemplo:

Toda distribuição de frequências é construída com os dados de uma amostra. À medida que aumentamos a amostra, os histogramas começam a se assemelhar à distribuição normal, uma distribuição teórica, dada em gráfico na figura abaixo.


Distribuição normal

Mas reveja o histograma que desenhamos. Não parece razoável considerar que se as medições fossem repetidas muitas e muitas vezes, teríamos um histograma com aspecto muito similar ao da “curva do sino”?

Vamos estudar um pouco mais a distribuição normal, que tem características bem conhecidas:

·                  Graficamente, é uma curva em forma de sino.
·                A média, a mediana e a moda coincidem e estão no centro da distribuição.
·          A curva é simétrica em torno da média. Logo, 50% dos valores são iguais ou maiores do que a média e 50% dos valores são iguais ou menores do que a média.
·                 A curva abriga 100% da população. Isto equivale dizer que a área total sob a curva é 1. 


Simetria da distribuição normal

A distribuição normal é definida quando são dados dois parâmetros: a média, que se representa pela letra grega m (lê-se mi) e o desvio padrão, que se representa pela letra grega s (lê-se sigma). Quando muda a média e/ou o desvio padrão, muda a configuração da curva. Veja a figura abaixo, que mostra distribuições normais com a mesma média e diferentes desvios padrões.

Distribuições normais: média zero, desvios padrões diferentes

Nenhuma distribuição de dados reais tem características idênticas às da distribuição normal. No entanto, se você puder pressupor que a variável que estuda tem distribuição aproximadamente normal, pode considerar que os dados obedecem à chamada “regra empírica”. Veja a figura: de acordo com essa “regra empírica”, cerca de

·     68% (pouco mais de ) dos resultados das medições  estarão a menos de um desvio padrão de distância da média, para mais ou para menos.
·       95% dos resultados das medições estarão a menos de dois desvios padrões de distância da média, para mais ou para menos.
·        99,7% dos resultados das medições estarão a menos de três desvios padrões de distância da média, para mais ou para menos.

Na prática, o que isso significa? Se você tiver muitas e muitas medições de um mesmo mensurando, é bastante provável que a média aritmética esteja perto da medida real e que os resultados das medições tenham distribuição aproximadamente normal. 


Nota: 1.o uso da distribuição normal para avaliar incerteza da medição, é comum na prática. Mas há críticas. Veja, por exemplo,Hulme e Symms, The law of error and the combinationof observations. Royal Astronomic Society.
           2. Veja a avaliação tipo A de incerteza em outra postagem
VEJA
1.          ISO International Organization for Standardization
2.          O exemplo do cronômetro é de Physics Laboratory Tutorial : Error Analysis - Columbia ...
3.          http://reference.wolfram.com/applications/eda/ExperimentalErrorsAndErrorAnalysis.html
4.          Uncertainties & Error Analysis Tutorialhttp://physics.wustl.edu/introphys/Phys117_118/Lab_Manual/Tutorials /ErrorAnalysisTutorial.pdf 
6.          





Saturday, April 30, 2016

Desvio padrão: medida de dispersão dos resultados das medições

Repetir a medição é a melhor maneira de avaliar a incerteza do resultado, desde que estejamos confiantes de que os erros sistemáticos foram minimizados. Se possível, repetimos as medições no mesmo mensurando em iguais condições n vezes. Aplicamos depois técnicas estatísticas para avaliar a incerteza.

Para entender a lógica dessa avaliação, vamos usar um exemplo clássico: a medição de tempo com um cronômetro. Isto porque o tempo de reação da pessoa que liga e desliga um cronômetro é aleatório e é, de longe, o fator que mais afeta o erro da medição do tempo.

Imagine que você tomou nas mãos um cronômetro para medir o período de oscilação de um pêndulo 1. Você fez n=5 medições. Os resultados, em segundos, foram: 

3,9; 3,5; 3,7; 3,4; 3,5.

A melhor estimativa para o período de oscilação do pêndulo é a média aritmética dos n = 5 resultados que você obteve: 


Como temos repetições, podemos estimar também os erros aleatórios. Observe os desvios de cada medida em relação à média, que estão apresentados na tabela abaixo. São estimativas dos erros aleatórios.

Medidas do período de oscilação do pêndulo e desvios em relação à média, segundo a ordem da medição

Os resultados das medições estão dispersos em torno da média, de maneira aleatória. Mas precisamos julgar o grau de dispersão desses valores, para avaliar a incerteza da medição. Alguém poderia sugerir usar a média dos desvios em relação à média como medida de dispersão. Mas veja:  

A média dos desvios é igual a zero porque desvios com sinal negativo cancelam desvios com sinal positivo.  Você pode se livrar dos sinais negativos? Claro: é só elevar os desvios ao quadrado. Todos os números ficarão positivos. Você então calcula a média e extrai a raiz quadrada do resultado. Chega, assim, a muito famosa fórmula do desvio padrão:
                              

Essa fórmula é, porém, indicada para calcular o desvio padrão quando se tem medições de toda "população". População, aqui, significa  que precisaríamos fazer um número infinito de medições do mesmo mensurando, nas mesmas condições, para poder calcular s.

Mas você só tem cinco medições do período de oscilação do pêndulo. Então a fórmula tem uma correção e é indicada por s. O desvio padrão de uma amostra é
                                    
Você calcula facilmente o desvio padrão de qualquer amostra no Excel usando a função desvpad. Mas vamos às contas: veja os cálculos intermediários na tabela dada em seguida.

Cálculos intermediários para obtenção do desvio padrão

Sistematizando os cálculos para obter o desvio padrão de uma amostra de 5 (ou, mais genericamente, n) medições: 

1.    Some todos os resultados e divida por 5, para obter a média aritmética.
2.    Subtraia a média de todos os resultados, para obter os 5 desvios em relação à média.
3.    Eleve os 5 desvios ao quadrado e some.
4.    Divida essa soma por 5-1=4.
5.    Extraia a raiz quadrada

É comum escrever a formula do desvio padrão como segue:


A fórmula (3) parece mais difícil do que a fórmula (2), mas é mais fácil de aplicar para quem usa uma calculadora. Veja os cálculos intermediários na tabela abaixo.

Cálculos intermediários para obtenção do desvio padrão

Quando se apresenta a fórmula do desvio padrão para uma amostra, sempre surge a pergunta: por que dividir a soma dos quadrados dos desvios por n-1 e não por n? Há demonstrações teóricas de que a correção é necessária, mas há uma explicação intuitiva.

Se a natureza do experimento permitir uma só medição - por exemplo, imagine que você tomou nas mãos um cronômetro para medir o tempo de queima de uma vela - o resultado obtido é melhor estimativa para o tempo de queima da vela. E esse valor único é a média. Não há, porém, possibilidade de estimar a dispersão dos desvios da média. Reveja novamente a fórmula para calcular o desvio padrão: se n=1, n-1=0. O divisor zero torna impossível estimar a dispersão dos desvios. O valor n-1 é chamado graus de liberdade.


O desvio padrão é uma medida da dispersão dos resultados das medições. Para visualizar que o desvio padrão mede a dispersão, é melhor ver um exemplo. Imagine então que dois amigos seus resolveram medir, também, o tempo de oscilação do mesmo pêndulo. O Amigo Nº 1 obteve 
3,7; 3,6; 3,9; 3,5; 3,3

O Amigo Nº 2 obteve 
4,0; 3,5; 3,7; 3,2; 3,6
As médias e os desvios padrões, para os três, você e seus amigos 1 e 2, estão na tabela dada em seguida. Os resultados das medições estão apresentados em gráfico, logo abaixo e permitem melhor visualização da dispersão. Note que quanto maior é a dispersão, maior é o desvio padrão. 

Médias e desvios padrões para as três séries de medições

                   
Distribuição das três séries de medições

A avaliação tipo A da incerteza da medição, que usa o desvio padrão em seu cálculo, será tratada em outra postagem.

NOTA

1        O exemplo do cronômetro é de Physics Laboratory Tutorial : Error Analysis - Columbia ...

EXERCÍCIOS

1.               Calcule a média e o desvio padrão do resultado de cinco medições de uma peça, que forneceu os seguintes valores, em milímetros:
200,1; 200,5; 200,3; 200,2; 200,4.

2.                Foram enviadas oito amostras de um mesmo produto que continha 10,5% de K2O para oito laboratórios diferentes. Cada laboratório fez uma determinação da porcentagem de K2O no produto. Calcule a média e a desvio padrão. As determinações são dadas em seguida.
10,8; 11,2; 10,5; 11,0; 10,9; 11,1; 10,8; 10,7.

3.           Para estabelecer a capacidade de perfuração de uma perfuradora hidráulica em estruturas rochosas, foi feito um experimento. Tomaram-se medidas da profundidade (em polegadas) da perfuração feita em 10 locais. Os dados estão na tabela dada abaixo.  Calcule a média e a desvio padrão.

                                Resultados do experimento para medir a capacidade de perfuração
 de uma perfuradora hidráulica


RESPOSTAS



Sunday, April 24, 2016

Propagação de erros: somas e diferenças

Vamos supor que você mora a uma distância confortável da escola. São 825 metros ± 5 metros, em linha reta. Você toma o caminho da escola, mas pára na frente da casa de um colega para chamá-lo e dali caminharem juntos. Sua parada é a 260 metros ± 10 metros de sua casa. Quantos metros você ainda deve caminhar para chegar à escola, depois de encontrar o colega?
O cálculo do valor central é fácil: depois da casa do colega, você caminha (825-260) metros = 565 metros.
Mas e os erros? Você precisa admitir duas possibilidades:
Você comete erros que dariam um tamanho maior a sua caminhada. Seria errar
5 metros a mais na distância de sua casa a escola e
10 metros a menos da sua casa à parada na casa do colega.




                                Isso daria a distância máxima (825+5) – (260-10)= 580 metros. 
Você comete erros que dariam um tamanho menor a sua caminhada. Seria errar
5 metros a menos na distância de sua casa a escola e
10 metros a mais da sua casa à parada na casa do colega.


        Isso daria distância mínima (825-5) – (260+10)= 550 metros.

Qual seria o erro? Qualquer coisa entre 550 e 580 metros. Portanto
                              580-550=15 metros.

Talvez você tenha notado que o erro final foi de 15 metros, ou seja, a soma dos dois erros envolvidos no cálculo. Não é coincidência. Observe como você somou os erros. E então temos a regra geral:

O erro absoluto do resultado de uma soma ou de uma diferença é dado pela soma dos erros absolutos das quantidades originais.

            VEJA: Error Propagation  HTTPS://phys.columbia.edu/~tutorial/propagation/

                   


Thursday, April 21, 2016

Erros sistemáticos e aleatórios nas medições

Antes de tratar erros em medições, vamos deixar claro que não estamos falando do resultado incorreto por desleixo ou incompetência ou de fraude. Resultados de medições de variáveis contínuas (como comprimento, peso, velocidade, pressão) estão associados a erro. Mas é melhor ver antes algumas definições.

Grandeza é o atributo de um fenômeno, corpo ou substância que pode ser distinguido qualitativamente e determinado quantitativamente.
               Exemplos:1- grandeza em sentido geral: pressão, altura, vazão, volume; 2-grandeza específica:altura da cerca, volume do reservatório.

Valor de uma grandeza é a expressão quantitativa de uma grandeza específica, geralmente na forma de um número seguido da unidade de medida. Exemplo: a água está à temperatura de 28 º C.

Valor verdadeiro (de uma quantidade) é o valor que seria obtido por uma medição perfeita2. Como isso é impossível, o valor verdadeiro é, em geral, desconhecido

Valor verdadeiro convencional ou valor convencional é valor atribuído a uma grandeza específica para uma dada finalidade e aceito pela comunidade científica em lugar do verdadeiro, dado ser impossível descobrir o valor verdadeiro dessa grandeza.
Medir é determinar o valor de uma grandeza em termos do valor de uma unidade, tomada como padrão.
Mensurando é a grandeza que queremos medir. Pode ser, por exemplo, o volume de uma caixa d’água, a altura de um armário, o comprimento de um termômetro.
Resultado de uma medição é o valor atribuído a uma grandeza por  medição1. Por exemplo, a altura do armário é 1,20 m. 
Erro de medição é a diferença entre o resultado da medição e o valor verdadeiro do mensurando1

ERRO DE MEDIÇÃO

O valor verdadeiro de um mensurando é, em geral, desconhecido porque o resultado de uma medição depende de diversos fatores,  como o sistema de medição, o operador, o procedimento utilizado, o ambiente. Vamos definir aqui dois tipos de erro de medição: o erro sistemático e o erro aleatório.

Erro sistemático é a diferença entre o resultado de um número infinito de medições do mensurando, feitas nas mesmas condições e seu valor verdadeiro 1.  

O erro sistemático aparece devido às limitações humanas, físicas ou dos instrumentos. É difícil, ou mesmo impossível,  detectar erros sistemáticos que apareçam devido ao equipamento defeituoso, à falta de calibração, ao procedimento incorreto. De nada adianta repetir as medições nas mesmas condições, pois erros sistemáticos ocorrem sempre no mesmo sentido.

EXEMPLOS

1.    Se a balança não estiver calibrada, não há como você saber, olhando apenas os resultados das medições, que eles estão errados.

2.    Imagine que você vai medir o período de oscilação de um pêndulo com um cronômetro. Se o ritmo do cronômetro estiver lento, sucessivas repetições das medidas produzirão sempre medidas abaixo do valor real. 

Embora o erro sistemático não possa ser eliminado, pode ser reduzido pela calibração cuidadosa dos instrumentos ou pela mudança de procedimento, por exemplo. Por essa razão, os instrumentos e sistemas de medição devem ser calibrados ou ajustados por meio de materiais de referência e de padronizações. No entanto, as incertezas associadas a esses padrões e materiais precisam ser sempre levadas em conta.

EXEMPLO

Para medir a cor de diversas substâncias em pó, pode ser usado um colorímetro 2. Uma amostra de cor branca, que tem valor 100, pode ser usada como material de referência.


Como o valor verdadeiro é, no mais das vezes, desconhecido, trabalhamos com estimativas de erro sistemático. Denominamos tendência ou viés (em inglês, bias) à diferença entre a média dos resultados da medição e o valor convencional.

EXEMPLO

Um colorímetro será usado para medir a cor de diversas substâncias em pó. Uma amostra de cor branca, que tem valor 100 foi usada como valor de referência (VR). Um técnico de laboratório mediu 10 vezes a cor da amostra branca e obteve os resultados apresentados na tabela abaixo. 

Leituras da cor de uma amostra branca


A média é 


A tendência ou “bias”, dada pela diferença entre a média e o valor de referência é:


De qualquer modo, o erro sistemático é uma indicação de que o resultado da medição de uma grandeza está associado a um desvio. Se esse desvio se originar de um fator conhecido, que sabidamente afeta o resultado da medição, isto é, que tem efeito sistemático quantificável sobre o resultado da medição, deve ser proposto um fator de correção. Supõe-se que, após a correção, o valor esperado do erro provocado por esse efeito sistemático seja zero.


Erro aleatório é a diferença entre o resultado da medição e a média que resultaria de um número infinito de medições do mesmo mensurando, repetidas em iguais condições 2.

Evidentemente, é impossível fazer um número infinito de medições. Então trabalhamos com estimativas de erros aleatórios. Tomamos amostras, isto é, um número n de medições e obtemos os desvios da média da amostra.

Dizemos que os erros são aleatórios porque, numa série de medições repetidas nas mesmas condições, não é possível prever o resultado de uma nova medição com base nos valores obtidos anteriormente.

EXEMPLO

Com um cronômetro na mão para medir o período de oscilação de um pêndulo, você fez n=5 medições. Os resultados, em segundos, foram: 3,9; 3,5; 3,7; 3,4; 3,5. A média das n=5 medidas é 
Resultados das medições do período de oscilação de um pêndulo 
e desvios em relação à média

Veja a tabela acima: há valores acima e abaixo da média, mas a variabilidade ocorre ao acaso. Se você estiver fazendo muitas medições, não há como saber se o próximo resultado que irá obter estará abaixo ou acima da média que ainda vai calcular. Isto acontece porque os erros aleatórios são causados por flutuações desconhecidas ou imprevisíveis.

Estimativas de erros aleatórios são obtidas da distribuição aleatória dos resultados das medições em torno da sua média.  

Ainda como exemplo, a tensão em uma rede de energia elétrica é  função da variação do consumo durante o dia. Há horários conhecidos de picos de consumo, mas também ocorrem, aleatoriamente, momentos de alta e baixa tensão.  

Finalmente, não se pode deixar de falar aqui nos chamados erros grosseiros (é a tradução possível para mistake ou blunder, palavras da língua inglesa). Esses são erros ilegítimos e precisam ser corrigidos, repetindo as operações.  



VEJA:

1.     International Vocabulary of Basic and General Terms in Metrology (VIM)
2.     International Organization for Standardization (ISO)
4.     Automotive Industry Action Group. http://www.aiag.org/scriptcontent/index.cfm
6.     https://phys.columbia.edu/~tutorial/rand_v_sys/

7.     Mello, G. Erro de medição. http://www.exactusmetrologia.com.br/content/erro-de-medicao

8.     Avaliação de dados de medição — Guia para a expressão de incerteza de medição. http://www.inmetro.gov.br/noticias/conteudo/iso_gum_versao_site.pdf
10.  Definitions of Measurement Uncertainty Terms.http://www.spcforexcel.com/variable-measurement-systems-part-2-bias
12.  Avaliação de dados de medição — Uma introdução ao “Guia para a expressão de incerteza em medição” e a documentos correlatos - INTROGUM - 2009 -