Sunday, October 30, 2016

Comparisonwise Type I error rate

Feita a análise de variância para testar a hipótese de igualdade de médias populacionais, o pesquisador busca um teste para comparar essas médias. São os testes post hoc ou a posteriori. Diversos testes estão disponíveis na literatura de estatística ou nos programas para computadores. Qual deles o pesquisador deve selecionar?

Testes liberais revelam significância mais facilmente do que testes conservadores. Winner (1962) listou os testes de comparação de médias, do mais liberal ao mais conservador, como segue: MRT de Duncan, Student-Newman-Keuls, LSD de Fisher, HSD de Tukey, S de Scheffé. Isto significa que, se você aplicar o teste de Duncan, muito provavelmente apontará mais diferenças significantes de médias do que se aplicar o teste de Scheffé. É adequado usar o teste mais liberal?

Veja bem: o pesquisador deve escolher o teste que seja experimentalmente defensável. Por exemplo, se um pesquisador da área da saúde comparar o efeito de uma nova droga contra drogas convencionais para doença séria, deveria ter o bom senso de não proclamar uma descoberta, a menos que esteja razoavelmente seguro. Então, teste de Scheffé. Por outro lado, se um pesquisador da área agrícola compara, por exemplo, 12 linhagens de soja em fase de avaliação, o teste de Duncan poderia, muito provavelmente, reduzir o número de linhagens a serem comparadas em uma nova avaliação.

A verdade é que os pesquisadores raramente são questionados sobre a racional para a escolha de um teste a posteriori. De qualquer forma, a possibilidade de diferença nas conclusões é pequena, embora o teste de Duncan possa “ajudar” o pesquisador que tem o objetivo de “provar” uma diferença.

É muito provável achar diferença significante em testes que controlam o nível de significância para comparações? Para que isso fique mais claro, suponha que você tem um ensaio com k grupos e pretende, feita a análise de variância, testar a igualdade de médias populacionais, duas a duas. São possíveis

comparações de médias, ao nível de significância a.

 Se as hipóteses de nulidade são verdadeiras, o risco de, em um teste, rejeitar essa hipótese é a. Então a probabilidade de que não ocorra erro tipo I nesse teste é 1 - a.

Em m testes, a probabilidade de que o erro tipo I não ocorra em nenhuma das comparações é (1 – a)m. Então a probabilidade de ocorrer pelo menos um erro tipo I em m testes é


Como exemplo, imagine que você deve fazer três comparações de médias, ao nível de significância de 0,05:
                                 H0: mA = mB
                                 H0: mA = mC
                                 H0: mB = mC
As médias populacionais são iguais. Você faz os testes e pode não rejeitar ou aceitar H0 (A) ou rejeitar H0 (R). Veja as probabilidades, usando a distribuição binomial:
  
 A soma das probabilidades em vermelho, que é 0,142625, é a probabilidade de ter pelo menos um resultado errado. Então a probabilidade de rejeitar H0 em pelo menos uma das comparações é aproximadamente 14,3%.

 



VEJA:

Winner (1962) Apud Kris E. Berg e Richard W. Latin Research Methods in Health, Physical Education, Exercise Sciences and Recreation. 3ed. Lippincott. 2008. p 155.


Megan Goldman. disponível em http://www.stat.berkeley.edu/users/mgoldman. Acesso em 29 de outubro de 2016.

No comments: