Friday, September 01, 2017

Amplitude estudentizada (studentized range)

   Seja Y uma variável aleatória com distribuição normal de média m e desvio padrão s.  Uma amostra de tamanho r dessa variável fornece uma estimativa s do desvio padrão s. Se os dados dessa amostra forem organizados em ordem crescente, você acha facilmente o valor mínimo e o valor máximo. A diferença entre esses dois valores é a amplitude, que tem a mesma unidade de medida dos dados. Dividindo a amplitude pelo desvio padrão s, você obtém a amplitude estudentizada, que se indica pela letra q e é adimensional porque as unidades de medida da amplitude e do desvio padrão são as mesmas. Então:
 
Imagine agora que você tem k amostras de tamanho r da variável aleatória Y que tem distribuição normal de média m  e variância s2. Cada amostra fornece uma estimativa da média m  e uma estimativa da variância s2. Haverá uma média maior e uma média menor. A amplitude das médias das k amostras é
 Como estamos considerando apenas o caso de amostras de mesmo tamanho, a variância ponderada  das estimativas  (i = 1, 2, ..., k) da variância s2 é a média das estimativas fornecidas por cada uma das k amostras.

Então, a estimativa da variância da amplitude estudentizada das k médias independentes, é

                       
             
A distribuição da estatística

                    
depende do nível de significância a, do número k de amostras e do número n – k  de graus de liberdade associados à estimativa da variância ponderada, em que n = kr

John W. Tukey, um dos grandes estatísticos do século XX, considerava "cientificamente desonesto" fazer uma análise de variância e depois aplicar o teste t de Fisher para comparar médias duas a duas, porque o erro tipo I aumenta com o número de médias em comparação. Ele propôs então a HSD, ou diferença honestamente significante (Honestly Significant Differences).

Para achar a diferença honestamente significante (honestly significant difference), ou seja, a diferença que deve haver entre duas médias para que elas possam ser consideradas estatisticamente diferentes a determinado nível de significância a, calcule:
    Nessa fórmula, a variância ponderada das k amostras é estimada pelo quadrado médio do resíduo QMR da ANOVA, que está associado a n-k graus de liberdade. Mas na HDS, o valor de qa,k,n-k incorpora a √2. É a amplitude estudentizada q de Tukey.

As tabelas que exibem a distribuição da amplitude estudentizada q de Tukey são mais comuns, mas também há tabelas que exibem a distribuição da amplitude estudentizada q sem estar multiplicado por √2. Ocorrem as duas formas em tabelas. Então preste atenção, porque ambas usam o mesmo símbolo.

  Exemplo de procedimento para o teste de Tukey

 São dadas as concentrações de estrôncio (mg/ml) na água de cinco locais diferentes[1]. Vamos fazer a análise de variância e comparar as médias pelo teste de Tukey, usando o programa SAS.  

Concentrações de estrôncio (mg/ml) na água de cinco locais diferentes


Análise de variância

Como o quadrado médio do resíduo obtido na análise de variância é QMR = 9,765, a variância da média é:
                                           

           Logo, o erro padrão da média é:

         

          Para comparar as médias obtidas no exemplo duas a duas, no nível de significância de 5%, como k = 5 e n-k = 25, temos:

                            Saída do SAS



Mas para comparar duas médias usando a amplitude total estudentizada, é possível proceder de outra forma. Dado contraste de médias:


A variância do contraste, desde que as médias sejam independentes, é
  
                
        Para o exemplo:
        


e o  erro padrão do contrate de médias é
  


Então para comparar a média do Local 1 com o Local 2, calcule:



       O valor de q aqui calculado não pode ser comparado com o valor de q da tabela de amplitude estudentizada de Tukey. Para isso, precisa ser multiplicado por  √2. Você tem então

                           4,517 x √2 = 6,388


maior que o valor crítico da amplitude estudentizada de Tukey. Logo, há mais estrôncio no Local 2 que no Local 1.   

Veja agora a saída do SPSS. Note que está indicado como erro padrão é o erro padrão de um contraste de duas médias. Compare com a saída do SAS, em que o que se identifica como erro padrão é o erro padrão de uma média.                

Saída do SPSS

NOTAS
1.O exemplo apresentado é de
Zar, J.J.H. Biostatistical Analysis. New Jersey, Prentice Hall. 4ª ed. 1999, p.210.

2.Você encontra a Tabela de amplitude estudentizada de Tukey, por exemplo, em


3. Amplitude estudentizada: amplitude é a diferença entre valor máximo e valor mínimo de um conjunto de dados. Estudentizada, porque está dividida por s. O adjetivo é uma homenagem a Student, pseudônimo de William S. Gosset, que propôs o teste t.

No comments: