Monday, June 06, 2016

Teste de Tukey para comparação de médias

Uma análise de variância (ANOVA) rejeita ou não a hipótese de igualdade de médias populacionais de diversos grupos, mas não determina quais grupos têm médias estatisticamente diferentes. Por essa razão, o teste F feito na análise de variância é considerado um teste global (omnibus test). Terminada a análise de variância, o pesquisador busca um novo teste para  comparar as médias de grupos.
Vamos tratar aqui o teste de Tukey, muito conhecido dos pesquisadores brasileiros. Você aplica o teste de Tukey para comparar médias duas a duas (pairwise comparison). Veja isso como uma vantagem do teste: você compara todos os pares de médias que tiver.
O teste de Tukey é, portanto, um teste a posteriori ou post-hoc. Faz comparações não planejadas (unplanned comparisons), ou seja, o pesquisador não precisa estabelecer as comparações de médias que irá fazer sem ter visto os dados. Veja isto como vantagem do teste.
Para proceder ao teste de Tukey, é preciso calcular a diferença mínima que deve haver entre duas médias para que elas possam ser consideradas diferentes ao nível de significância a. No Brasil, essa diferença é conhecida como diferença mínima significante e, em geral, indicada pela letra grega ∆ (lê-se delta), mas, na língua inglesa, Least Significant Difference (LSD), ou seja, diferença mínima significante é terminologia usada no teste de Fisher. John W. Tukey, autor do teste de Tukey, chamou a diferença mínima que deve haver entre duas médias para que elas possam ser consideradas diferentes ao nível de significância a de honestly significant difference (HSD), ou seja, diferença honestamente significante.

De qualquer forma, para obter o valor da diferença honestamente significante (∆ ou HSD) pelo teste de Tukey é preciso calcular:
Nessa fórmula:
  • q(k,gl,a) é denominado amplitude estudentizada e é encontrado na tabela de amplitude estudentizada q, ao nível de significância a, para k tratamentos e gl graus de liberdade do resíduo da ANOVA.
  • QMR é o quadrado médio do resíduo da análise de variância;
  • r é o número de repetições de cada um dos grupos.

Para entender como se usa a tabela de amplitude estudentizada q, observe uma parte dela, dada abaixo. O valor em negrito deve ser utilizado para comparar as médias de um experimento com seis tratamentos e 24 graus de liberdade no resíduo, ao nível de significância de 5%.
Valor de q para o nível de significância de 5% 

Graus de liberdade
Nº de médias em comparação
2
3
4
5
6
7
8
9
10
20
2,9500
3,5779
3,9583
4,2319
4,4452
4,6199
4,7676
4,8954
5,0079
21
2,9410
3,5646
3,9419
4,2130
4,4244
4,5973
4,7435
4,8699
4,9813
22
2,9329
3,5526
3,9270
4,1959
4,4055
4,5769
4,7217
4,8469
4,9572
23
2,9255
3,5417
3,9136
4,1805
4,3883
4,5583
4,7019
4,8260
4,9353
24
2,9188
3,5317
3,9013
4,1663
4,3727
4,5413
4,6838
4,8069
4,9153
25
2,9126
3,5226
3,8900
4,1534
4,3583
4,5258
4,6672
4,7894
4,8969
26
2,9070
3,5142
3,8796
4,1415
4,3451
4,5115
4,6519
4,7733
4,8800
27
2,9017
3,5064
3,8701
4,1305
4,3329
4,4983
4,6378
4,7584
4,8645
28
2,8969
3,4992
3,8612
4,1203
4,3217
4,4861
4,6248
4,7446
4,8500
29
2,8924
3,4926
3,8530
4,1109
4,3112
4,4747
4,6127
4,7319
4,8366
30
2,8882
3,4865
3,8454
4,1021
4,3015
4,4642
4,6014
4,7199
4,8241
Fonte: http://davidmlane.com/hyperstat/sr_table.html

De acordo com o teste, duas médias são estatisticamente diferentes ao nível de significância a toda vez que o valor absoluto da diferença entre elas for igual ou maior do que a diferença honestamente significante, ou seja, igual ou maior do que o valor HSD.

                                                   EXEMPLO
Considere os dados de diminuição da pressão arterial segundo o grupo, apresentados na Tabela 1. Esses dados foram submetidos à análise de variância apresentada na Tabela 2. Como o valor de F é significante ao nível de 5%, existe pelo menos uma média diferente das demais. As médias de grupos estão apresentadas na Tabela 3.

Tabela 1 - Diminuição da pressão arterial, em milímetros de mercúrio, segundo o grupo

Tabela 2 - Análise de variância 

Tabela 3 - Médias da diminuição de pressão arterial, em milímetros de mercúrio, segundo o grupo

Quais são as médias estatisticamente diferentes? A pergunta pode ser respondida com a aplicação do teste de Tukey. Considerando um nível de significância de 5%, tem-se que:
q = 4,3727 é o valor dado na tabela de amplitude estudentizada q ao nível de significância de 5%, associado a k = 6 grupos e gl =24 graus de liberdade de resíduo; QMR = 36,00 é o quadrado médio de  resíduo da ANOVA; r = 5 é o número de repetições.

É preciso calcular as diferenças de médias, duas a duas e compará-las com a diferença honestamente significante. Veja a Tabela 4: os tratamentos e as médias estão nas duas primeiras linhas e nas duas primeiras colunas, em negrito. As diferenças significantes ao nível de 5% estão assinaladas com um asterisco. 

Tabela 4 - Diferenças de médias de diminuição da pressão arterial
 

Pode ser mais fácil ver as comparações como mostra a tabela dada em seguida.

Tabela 5 - Diferenças de médias de diminuição da pressão arterial 
 

De acordo com o teste de Tukey, ao nível de 5%:
  • a média do tratamento A é maior do que a de B e a do controle;
  • a média do tratamento D é maior do que as médias de B, C, E e controle. 

Estes resultados também podem ser indicados por letras, como é dado em seguida e é usual nas “saídas” de programas de computador: 
  • quando letras diferentes aparecem em frente a duas médias, a diferença entre essas médias é estatisticamente significante; 
  • quando a mesma letra aparece em frente a duas médias, a diferença entre essas médias não é estatisticamente significante.

Tabela 6 - Comparação das médias de diminuição da pressão arterial


"Saída" do Minitab
Tukey Pairwise Comparisons 
 Grouping Information Using the Tukey Method and 95% Confidence

Treatment  N   Mean  Grouping
D               5   29,00     A
A               5   21,00     A  B
E               5   13,00         B  C
C               5   10,00         B  C
B               5     8,00            C
Control       5     2,00            C

Means that do not share a letter are significantly different.


Saída do SAS
                          Error Mean Square                         36
                          Critical Value of Studentized Range  4.37265
                          Minimum Significant Difference        11.733

                  Means with the same letter are not significantly different.

                      Tukey Grouping          Mean      N    trat

                                     A                29.000      5    4
                                     A 
                              B    A               21.000      5    1
                              B
                              B    C               13.000      5    5
                              B    C
                              B    C               10.000      5    3
                                     C
                                     C                 8.000      5    2                                  

                                     C                 2.000      5    6

**************************************************************
NOTA: Também se pode calcular estatística q para cada comparação de médias.Veja o exemplo de 

              ZAR, J. H. BIOSTATISTICAL ANALYSIS, 4th. ed. P. 210



Calcule: 





Sunday, May 29, 2016

Avaliação tipo A da incerteza da medição

Incerteza da medição significa dúvida acerca da validade do resultado de uma medição. Na verdade, todo resultado de medição está associado a um grau de incerteza  explicada por diversos fatores: a limitação da precisão do instrumento, o procedimento utilizado, o próprio operador. Quando você relata o resultado da medição de um mensurando deve, portanto, escrever

 (X + X) unidade de medida

em que X é a melhor estimativa do valor do mensurando e DX é a incerteza  do resultado da medição. É razoável inferir que os resultados obtidos de outras medições do mesmo mensurando em iguais condições estarão, provavelmente, no intervalo (X - X) a (X + X).

Para obter a incerteza da medição, uma das práticas mais comuns é medir o mesmo mensurando repetidas vezes, nas mesmas condições e usar métodos estatísticos para a análise dos resultados.

Avaliação tipo A da incerteza-padrão 

A avaliação Tipo A da incerteza é qualquer método de avaliar a incerteza do resultado de uma medição em que se use análise estatística de uma série de observações. 

Vamos entender o procedimento para avaliação tipo A da incerteza-padrão, também conhecida como incerteza ao nível do desvio padrão. Se você obtiver resultados de n medições do mesmo mensurando em iguais condições, isto é

x1, x2, x3, . . . .xi, . . .xn

Você calcula a média aritmética dos resultados, que é a melhor estimativa do valor do mensurando:

O desvio padrão experimental é


Nota: Veja a postagem Desvio padrão: medida da dispersão dos resultados de medições, neste blog.

A avaliação tipo A da incerteza-padrão  é a dada pelo desvio padrão experimental. Expressa, portanto, a incerteza do resultado de uma medição em termos do desvio padrão. É indicada, principalmente na literatura em língua inglesa, pela letra u(X)( u de uncertainty). 

Se a média aritmética e o desvio padrão experimental foram obtidos a partir de um número grande de medições (15 ou 20 são suficientes), a probabilidade de uma nova medição cair no intervalo indicado na figura abaixo é aproximadamente 68,3% (perto de ).

desvio padrão 

Vamos imaginar agora outra situação: se o procedimento descrito for repetido várias vezes e produzir vários conjuntos de resultados de n medições, cada conjunto de resultados terá estimativas diferentes de média e desvio padrão. 

Apenas como exemplo, imagine que, por quatro vezes, você fez cinco medições do tempo de oscilação de um pêndulo. Os resultados (fictícios) estão na tabela dada em seguida. Você terá quatro médias aritméticas e quatro desvios padrões experimentais. A média dessas médias é a melhor estimativa do valor do mensurando.
Resultados das medições do tempo de oscilação de um pêndulo em quatro conjuntos, com as médias e desvios padrões


Então, se você obtiver k vezes n resultados individuais de medições do mesmo mensurando em iguais condições, você poderá calcular k médias. Como essas médias foram obtidas de vários resultados, devem variar menos entre si do que os resultados individuais de medições do mesmo mensurando.

Mas para medir a dispersão das médias de n medições do mesmo mensurando, nas mesmas condições, você precisaria fazer n medições do mensurando, um número infinito de vezes, o que é impossível. Os estatísticos teóricos, porém, já demonstraram: o desvio padrão experimental da média é calculado pela expressão:
Você pode, então, obter o desvio padrão experimental da média, mesmo que só tenha feito uma medição. Se você só tivesse feito a primeira medição, teria média 3,6 s e desvio padrão experimental igual a 0,2 s. O desvio padrão da média seria:
Para indicar avaliação Tipo A da incerteza da média, podemos escrever
Se a média e o desvio padrão experimental da média foram obtidos a partir de um número n de medições, é aproximadamente 68,3% a probabilidade de uma nova media cair no intervalo 
                                        
EXEMPLO

   1.               São dados os resultados de cinco medições do comprimento de uma folha                    
31,33 cm
31,15 cm
31,26 cm
31,02 cm
31,20 cm

                  A média é:
                         

          Para calcular o desvio padrão experimental
Literatura

1.               Uncertainties and Error Analysis Tutorial (http://physics.wustl.edu)
2.               Essentials of expressing measurement uncertainty http://physics.nist.gov/,
3.             Avaliação de dados de medição — Guia para a expressão de incerteza de medição
http://www.inmetro.gov.br/noticias/conteudo/iso_gum_versao_site.
4.               Mean, standard deviation and standard uncertainty. https://sisu.ut.ee/measurement/32