Monday, June 06, 2016

Teste de Tukey para comparação de médias

Uma análise de variância (ANOVA) rejeita ou não a hipótese de igualdade de médias populacionais de diversos grupos, mas não determina quais grupos têm médias estatisticamente diferentes. Por essa razão, o teste F feito na análise de variância é considerado um teste global (omnibus test). Terminada a análise de variância, o pesquisador busca um novo teste para  comparar as médias de grupos.
Vamos tratar aqui o teste de Tukey, muito conhecido dos pesquisadores brasileiros. Você aplica o teste de Tukey para comparar médias duas a duas (pairwise comparison). Veja isso como uma vantagem do teste: você compara todos os pares de médias que tiver.
O teste de Tukey é, portanto, um teste a posteriori ou post-hoc. Faz comparações não planejadas (unplanned comparisons), ou seja, o pesquisador não precisa estabelecer as comparações de médias que irá fazer sem ter visto os dados. Veja isto como vantagem do teste.
Para proceder ao teste de Tukey, é preciso calcular a diferença mínima que deve haver entre duas médias para que elas possam ser consideradas diferentes ao nível de significância a. No Brasil, essa diferença é conhecida como diferença mínima significante e, em geral, indicada pela letra grega ∆ (lê-se delta), mas, na língua inglesa, Least Significant Difference (LSD), ou seja, diferença mínima significante é terminologia usada no teste de Fisher. John W. Tukey, autor do teste de Tukey, chamou a diferença mínima que deve haver entre duas médias para que elas possam ser consideradas diferentes ao nível de significância a de honestly significant difference (HSD), ou seja, diferença honestamente significante.

De qualquer forma, para obter o valor da diferença honestamente significante (∆ ou HSD) pelo teste de Tukey é preciso calcular:
Nessa fórmula:
  • q(k,gl,a) é denominado amplitude estudentizada e é encontrado na tabela de amplitude estudentizada q, ao nível de significância a, para k tratamentos e gl graus de liberdade do resíduo da ANOVA.
  • QMR é o quadrado médio do resíduo da análise de variância;
  • r é o número de repetições de cada um dos grupos.

Para entender como se usa a tabela de amplitude estudentizada q, observe uma parte dela, dada abaixo. O valor em negrito deve ser utilizado para comparar as médias de um experimento com seis tratamentos e 24 graus de liberdade no resíduo, ao nível de significância de 5%.
Valor de q para o nível de significância de 5% 

Graus de liberdade
Nº de médias em comparação
2
3
4
5
6
7
8
9
10
20
2,9500
3,5779
3,9583
4,2319
4,4452
4,6199
4,7676
4,8954
5,0079
21
2,9410
3,5646
3,9419
4,2130
4,4244
4,5973
4,7435
4,8699
4,9813
22
2,9329
3,5526
3,9270
4,1959
4,4055
4,5769
4,7217
4,8469
4,9572
23
2,9255
3,5417
3,9136
4,1805
4,3883
4,5583
4,7019
4,8260
4,9353
24
2,9188
3,5317
3,9013
4,1663
4,3727
4,5413
4,6838
4,8069
4,9153
25
2,9126
3,5226
3,8900
4,1534
4,3583
4,5258
4,6672
4,7894
4,8969
26
2,9070
3,5142
3,8796
4,1415
4,3451
4,5115
4,6519
4,7733
4,8800
27
2,9017
3,5064
3,8701
4,1305
4,3329
4,4983
4,6378
4,7584
4,8645
28
2,8969
3,4992
3,8612
4,1203
4,3217
4,4861
4,6248
4,7446
4,8500
29
2,8924
3,4926
3,8530
4,1109
4,3112
4,4747
4,6127
4,7319
4,8366
30
2,8882
3,4865
3,8454
4,1021
4,3015
4,4642
4,6014
4,7199
4,8241
Fonte: http://davidmlane.com/hyperstat/sr_table.html

De acordo com o teste, duas médias são estatisticamente diferentes ao nível de significância a toda vez que o valor absoluto da diferença entre elas for igual ou maior do que a diferença honestamente significante, ou seja, igual ou maior do que o valor HSD.

                                                   EXEMPLO
Considere os dados de diminuição da pressão arterial segundo o grupo, apresentados na Tabela 1. Esses dados foram submetidos à análise de variância apresentada na Tabela 2. Como o valor de F é significante ao nível de 5%, existe pelo menos uma média diferente das demais. As médias de grupos estão apresentadas na Tabela 3.

Tabela 1 - Diminuição da pressão arterial, em milímetros de mercúrio, segundo o grupo

Tabela 2 - Análise de variância 

Tabela 3 - Médias da diminuição de pressão arterial, em milímetros de mercúrio, segundo o grupo

Quais são as médias estatisticamente diferentes? A pergunta pode ser respondida com a aplicação do teste de Tukey. Considerando um nível de significância de 5%, tem-se que:
q = 4,3727 é o valor dado na tabela de amplitude estudentizada q ao nível de significância de 5%, associado a k = 6 grupos e gl =24 graus de liberdade de resíduo; QMR = 36,00 é o quadrado médio de  resíduo da ANOVA; r = 5 é o número de repetições.

É preciso calcular as diferenças de médias, duas a duas e compará-las com a diferença honestamente significante. Veja a Tabela 4: os tratamentos e as médias estão nas duas primeiras linhas e nas duas primeiras colunas, em negrito. As diferenças significantes ao nível de 5% estão assinaladas com um asterisco. 

Tabela 4 - Diferenças de médias de diminuição da pressão arterial
 

Pode ser mais fácil ver as comparações como mostra a tabela dada em seguida.

Tabela 5 - Diferenças de médias de diminuição da pressão arterial 
 

De acordo com o teste de Tukey, ao nível de 5%:
  • a média do tratamento A é maior do que a de B e a do controle;
  • a média do tratamento D é maior do que as médias de B, C, E e controle. 

Estes resultados também podem ser indicados por letras, como é dado em seguida e é usual nas “saídas” de programas de computador: 
  • quando letras diferentes aparecem em frente a duas médias, a diferença entre essas médias é estatisticamente significante; 
  • quando a mesma letra aparece em frente a duas médias, a diferença entre essas médias não é estatisticamente significante.

Tabela 6 - Comparação das médias de diminuição da pressão arterial


"Saída" do Minitab
Tukey Pairwise Comparisons 
 Grouping Information Using the Tukey Method and 95% Confidence

Treatment  N   Mean  Grouping
D               5   29,00     A
A               5   21,00     A  B
E               5   13,00         B  C
C               5   10,00         B  C
B               5     8,00            C
Control       5     2,00            C

Means that do not share a letter are significantly different.


Saída do SAS
                          Error Mean Square                         36
                          Critical Value of Studentized Range  4.37265
                          Minimum Significant Difference        11.733

                  Means with the same letter are not significantly different.

                      Tukey Grouping          Mean      N    trat

                                     A                29.000      5    4
                                     A 
                              B    A               21.000      5    1
                              B
                              B    C               13.000      5    5
                              B    C
                              B    C               10.000      5    3
                                     C
                                     C                 8.000      5    2                                  

                                     C                 2.000      5    6

**************************************************************
NOTA: Também se pode calcular estatística q para cada comparação de médias.Veja o exemplo de 

              ZAR, J. H. BIOSTATISTICAL ANALYSIS, 4th. ed. P. 210



Calcule: 





Sunday, May 29, 2016

Avaliação tipo A da incerteza da medição

Incerteza da medição significa dúvida acerca da validade do resultado de uma medição. Na verdade, todo resultado de medição está associado a um grau de incerteza  explicada por diversos fatores: a limitação da precisão do instrumento, o procedimento utilizado, o próprio operador. Quando você relata o resultado da medição de um mensurando deve, portanto, escrever

 (X + X) unidade de medida

em que X é a melhor estimativa do valor do mensurando e DX é a incerteza  do resultado da medição. É razoável inferir que os resultados obtidos de outras medições do mesmo mensurando em iguais condições estarão, provavelmente, no intervalo (X - X) a (X + X).

Para obter a incerteza da medição, uma das práticas mais comuns é medir o mesmo mensurando repetidas vezes, nas mesmas condições e usar métodos estatísticos para a análise dos resultados.

Avaliação tipo A da incerteza-padrão 

A avaliação Tipo A da incerteza é qualquer método de avaliar a incerteza do resultado de uma medição em que se use análise estatística de uma série de observações. 

Vamos entender o procedimento para avaliação tipo A da incerteza-padrão, também conhecida como incerteza ao nível do desvio padrão. Se você obtiver resultados de n medições do mesmo mensurando em iguais condições, isto é

x1, x2, x3, . . . .xi, . . .xn

Você calcula a média aritmética dos resultados, que é a melhor estimativa do valor do mensurando:

O desvio padrão experimental é


Nota: Veja a postagem Desvio padrão: medida da dispersão dos resultados de medições, neste blog.

A avaliação tipo A da incerteza-padrão  é a dada pelo desvio padrão experimental. Expressa, portanto, a incerteza do resultado de uma medição em termos do desvio padrão. É indicada, principalmente na literatura em língua inglesa, pela letra u(X)( u de uncertainty). 

Se a média aritmética e o desvio padrão experimental foram obtidos a partir de um número grande de medições (15 ou 20 são suficientes), a probabilidade de uma nova medição cair no intervalo indicado na figura abaixo é aproximadamente 68,3% (perto de ).

desvio padrão 

Vamos imaginar agora outra situação: se o procedimento descrito for repetido várias vezes e produzir vários conjuntos de resultados de n medições, cada conjunto de resultados terá estimativas diferentes de média e desvio padrão. 

Apenas como exemplo, imagine que, por quatro vezes, você fez cinco medições do tempo de oscilação de um pêndulo. Os resultados (fictícios) estão na tabela dada em seguida. Você terá quatro médias aritméticas e quatro desvios padrões experimentais. A média dessas médias é a melhor estimativa do valor do mensurando.
Resultados das medições do tempo de oscilação de um pêndulo em quatro conjuntos, com as médias e desvios padrões


Então, se você obtiver k vezes n resultados individuais de medições do mesmo mensurando em iguais condições, você poderá calcular k médias. Como essas médias foram obtidas de vários resultados, devem variar menos entre si do que os resultados individuais de medições do mesmo mensurando.

Mas para medir a dispersão das médias de n medições do mesmo mensurando, nas mesmas condições, você precisaria fazer n medições do mensurando, um número infinito de vezes, o que é impossível. Os estatísticos teóricos, porém, já demonstraram: o desvio padrão experimental da média é calculado pela expressão:
Você pode, então, obter o desvio padrão experimental da média, mesmo que só tenha feito uma medição. Se você só tivesse feito a primeira medição, teria média 3,6 s e desvio padrão experimental igual a 0,2 s. O desvio padrão da média seria:
Para indicar avaliação Tipo A da incerteza da média, podemos escrever
Se a média e o desvio padrão experimental da média foram obtidos a partir de um número n de medições, é aproximadamente 68,3% a probabilidade de uma nova media cair no intervalo 
                                        
EXEMPLO

   1.               São dados os resultados de cinco medições do comprimento de uma folha                    
31,33 cm
31,15 cm
31,26 cm
31,02 cm
31,20 cm

                  A média é:
                         

          Para calcular o desvio padrão experimental
Literatura

1.               Uncertainties and Error Analysis Tutorial (http://physics.wustl.edu)
2.               Essentials of expressing measurement uncertainty http://physics.nist.gov/,
3.             Avaliação de dados de medição — Guia para a expressão de incerteza de medição
http://www.inmetro.gov.br/noticias/conteudo/iso_gum_versao_site.
4.               Mean, standard deviation and standard uncertainty. https://sisu.ut.ee/measurement/32

Monday, May 16, 2016

Incerteza absoluta e incerteza relativa


A precisão da medição de uma variável continua depende da resolução do instrumento de medida. Essa resolução é definida pela menor distância que pode fazer um valor mudar. Se a graduação for muito baixa, pode dar medidas iguais para o mesmo objeto.

Por exemplo, os resultados da medição do diâmetro de um lápis com uma régua graduada em centímetros, provavelmente terão precisão zero, porque as medidas serão todas iguais entre si. No entanto, se o instrumento de medida for um paquímetro graduado em décimos de milímetros, a precisão será maior.

Quando nos deparamos com o resultado de uma única medição, para avaliar a precisão da medida devemos considerar a resolução do instrumento de medida. Se para medir comprimento for usada uma régua, podem ser visualizados valores com resolução de até metade do valor da escala.

Veja o caso do bebê, que tem 50 cm de comprimento. Se formos informados que a enfermagem usa um instrumento de medida graduado em centímetros, o comprimento do ebê está entre 49,5 cm e 50,5 cm. Escrevemos: (50,0 ± 0,5) cm. Está assim explícita a incerteza sobre o resultado da medição: essa incerteza é de 0,5 cm, para mais ou para menos. Talvez o operador tenha visto o que está na figura abaixo.

No exemplo, a incerteza é explicada apenas pela limitação do instrumento de medição, que se entende esteja calibrado. Escreve-se X + DX, em que DX é a incerteza. Nos casos em que se faz uma única medição, a incerteza não é avaliada por estatística (desvio padrão). É a chamada incerteza tipo B.

Veja agora a massa do bebê: a menor divisão da escala da balança em que o bebê foi medido é 10 g = 0,01 kg. Para explicitar que 3,54 kg está associada a certo grau de incerteza, considere que o valor medido está entre 3,535 kg e 3,545 kg. Escreva: (3,54 ± 0,005) kg. O operador poderia ter visto o que está na figura abaixo.

Você vai achar, na literatura, o termo erro, para expressar incerteza. Prefere-se o termo incerteza em lugar do termo erro, porque o valor verdadeiro da medida não é conhecido (ISO, 34). De qualquer forma, quando escrevemos X + DX, o incremento DX é a incerteza absoluta (ou erro absoluto, em desuso).

Vamos definir agora incerteza relativa  como segue:


A incerteza relativa ou erro relativo mostra quão grande é a incerteza absoluta, em relação ao tamanho do que foi medido. A incerteza relativa é expressa como uma fração ou, mais convenientemente, como uma porcentagem. Para obter a incerteza relativa em porcentagem, multiplique o resultado da divisão por 100. Em porcentagem, a incerteza relativa é


EXEMPLO

No velocímetro do carro, a menor divisão da escala é 2 km/h. Se você ler no velocímetro 60 km/h, qual é a incerteza relativa? A incerteza absoluta é 1 km/h e a incerteza relativa é 1/100 =0,01 ou 1%. 


Tudo bem até aqui. De qualquer forma, as definições de incerteza absoluta e incerteza relativa, tratadas aqui, foram aplicadas para incerteza avaliação tipo B, mas são igualmente válidas para avaliação tipo A.

No entanto, você ainda pode perguntar: que medida foi feita com maior precisão, a massa ou o comprimento? Não se comparam grandezas físicas diferentes, mas podemos comparar incertezas relativas.

A incerteza relativa é adimensional, isto é, não tem unidade de medida. Isto acontece porque a incerteza absoluta e o resultado da medição são dados na mesma unidade – que então se cancelam. Por ser adimensional, a incerteza relativa é útil para comparar a precisão de grandezas físicas diferentes.

EXEMPLO

Vamos mostrar isso com o exemplo do bebê. Para comprimento, a incerteza relativa é

Para massa, a incerteza relativa é


Podemos então fazer a comparação: a precisão da medida de massa é maior. 

     Para resolver os exercícios, lembre-se de que:

Se o instrumento mede em 1’s, qualquer medida entre 6,5 e 7,5 é lido como 7.

Se o instrumento mede em 2’s, qualquer medida entre 7 e 9 é lido como 8.
EXERCÍCIOS

1.  Você mediu a altura de uma criança com um instrumento graduado em centímetros. Leu 80 cm. Pode dizer a incerteza?
2.  Você mediu a temperatura de uma criança com um termômetro graduado em graus Celsius. A menor divisão da escala é 2ºC. Leu 38ºC. Pode dizer a incerteza?

Respostas
1 Altura H=(80±0,5)cm; incerteza absoluta=0,5 cm; incerteza relativa em porcentagem=(0,5/80)x 100=0,625%.
2 Temperatura t=(38±1)ºC; incerteza absoluta=1ºC; incerteza relativa em porcentagem=(1/38) x 100=2,63%.



VEJA:

2.    ISO. Guide to the Expression of Uncertainty in Measurement.  International Organization for Standardization (ISO) and the International Committee on Weights and Measures (CIPM): Switzerland, 1993.

3.    chemistry.about.com/od/workedchemistryproblems/fl/Absolute-Error-and-Relative-Error-Calculation.htm Absolute Error and Relative Error Calculation

4.    http://www.mathsisfun.com/measure/error-measurement.html
5.    http://mathforum.org/library/drmath/view/65797.html