Sunday, September 25, 2016

Teste de Scheffé para comparação de médias

Feita a análise de variância, se o valor do teste F resultou significante (isto é, se você rejeitou a hipótese de que as médias são iguais) pode aplicar o teste de Scheffé para comparar contrastes de médias. Então, antes de aprender como se faz o teste de Scheffé, é preciso saber o que é contraste de médias.

De maneira simples, um contraste de médias é uma função linear de médias em que a soma algébrica de seus coeficientes é igual a zero. Por exemplo, sejam três as médias de grupos que o pesquisador quer comparar. A função

é um contraste de médias porque é uma função linear de médias e a soma dos coeficientes das médias 1 + 1 - 2 = 0. Se substituirmos os parâmetros pelas estimativas, temos a estimativa do contraste
com variância 

Em uma análise de variância, a estimativa da variância é dada pelo quadrado médio do resíduo. Se os grupos em comparação (no exemplo são três) tiverem o mesmo número de repetições, isto é, se

a estimativa de variância da estimativa do contrate do exemplo é:
Generalizando, qualquer combinação linear de estimativas de médias

é um contraste se
Para fazer uma análise de variância, é preciso pressupor que as variâncias são constantes e estimadas pelo quadrado médio do resíduo. Se o número de repetições por grupo for o mesmo, a variância do contraste de médias L é estimada por

Para verificar se um contraste de médias é estatisticamente significante em determinado nível, usando o teste de Scheffé, é preciso calcular:
em que k é o número de grupos em comparação, V(Lé a estimativa da variância do contraste de interesse do pesquisador e F é o valor dado na Tabela de F, com (k-1) graus de liberdade no numerador e o número de graus de liberdade do resíduo no denominador. Toda vez que um contraste L de médias for maior do que o respectivo valor de S, declaramos o contraste significante.
Considere os dados apresentados na Tabela 1. Esses dados foram submetidos à análise de variância apresentada na Tabela 2. O valor de F é significante ao nível de 5%. Logo, há pelo uma média de grupo diferente das demais. As médias estão apresentadas na Tabela 3.

Tabela 1. Dados observados, segundo o grupo


Tabela 2. Análise de variância



Tabela 3. Médias segundo o grupo

Vamos testar a hipótese de que as respostas dos grupos tratados são, em média, maiores do que as respostas do grupo controle, aplicando o teste de Scheffé.

Primeiramente, calculamos o contraste de médias:


Depois, calculamos a variância do contraste:


Considerando o nível de significância de 5%, tem-se que o valor crítico de F, com 5 graus de liberdade para grupos e 24 graus de liberdade no resíduo é 2,62. Então:


Como o valor do contraste de interesse calculado com as médias obtidas no experimento é maior que o valor calculado pelo teste de Scheffé, conclui-se que as respostas obtidas dos grupos tratados são, em média, maiores que as respostas do grupo controle.  


Sunday, September 18, 2016

Teste da DMS de Fisher para comparação de médias

Se a análise de variância resultou em um valor de F significante, o pesquisador busca um teste post hoc com a finalidade de saber quais são as médias que diferem entre si. Foram propostos diversos desses testes que, em geral, levam o nome de seus autores. O mais antigo é o LSD (least square difference) de Fisher que, em português, se chama DMS (diferença mínima significante) de Fisher.
Para fazer esse teste, é preciso obter, primeiramente, as médias de grupos. Depois, é preciso estabelecer o nível de significância e calcular a LSD (ou DMS) de Fisher:
em que t é um valor associado ao nível de significância estabelecido e aos graus de liberdade do quadrado médio do resíduo da análise de variância, QMR é o quadrado médio do resíduo da análise de variância e r é o número de repetições de grupos.
EXEMPLO
Para entender como se faz o teste LSD de Fisher, imagine um ensaio clínico para comparar o efeito de cinco drogas na diminuição da pressão arterial. Para fazer esse ensaio, um médico convidou 30 pacientes, que decidiram participar. Dividiu então os participantes em seis grupos de cinco e designou, ao acaso, placebo para um dos grupos  e as  drogas em teste para os outros cinco grupos. 
A Tabela 1 apresenta a diminuição da pressão arterial no período do ensaio, isto é, a diferença entre a pressão arterial do início e do final. Esses dados foram submetidos à análise de variância e os resultados da análise estão na Tabela 2.


Tabela 1. Diminuição da pressão arterial, em milímetros de mercúrio, segundo o tratamento

Tabela 2. Análise de variância


Como o teste F resultou significante, as médias dos dados da Tabela 1 podem ser comparadas usando o teste LSD de Fisher. Ao nível de significância de 5% e com 24 graus de liberdade, t=2,064.  O quadrado médio do resíduo da análise de variância é QMR=36,00 e número de repetições de grupos é r=5. Agora, é fácil calcular a LSD, que em português fica sendo diferença mínima significante:
Para que a diferença entre duas médias possa ser considerada significante, deve ser no mínimo igual à dms=7,83. Podemos então organizar as médias como mostra a Tabela 3. Alguns programas de computador adotam esse tipo de saída.
Comparamos todas as médias, duas a duas (pairwise comparisons), como mostra a Tabela 3. Assinalamos, com um asterisco, todas as diferenças significantes de médias, aplicando o teste LSD de Fisher. Agora você pode escrever as conclusões.                        

Tabela 3-Comparação de médias, duas a duas (pairwise comparisons), pelo teste LSD de Fisher



Sunday, September 04, 2016

Teste das amplitudes múltiplas de Duncan (Duncan's multiple range test)

Uma análise de variância (ANOVA) pode mostrar se existe diferença significante entre grupos, mas não diz quais grupos diferem entre si. É, portanto, um teste global. Então, logo após a ANOVA, é preciso comparar as médias.
Métodos usados para achar diferenças entre grupos, depois de um teste global, são chamados  a posteriori ou post hoc (post hoc comparisons). Existem diversos testes para a comparação de médias. Muito conhecidos dos pesquisadores e usuais nos pacotes de estatística são o teste de Tukey, já tratado em postagem anterior e o teste de Duncan, tratado aqui.
O teste de Duncan, referido na literatura em língua inglesa como teste de amplitudes múltiplas de Duncan (Duncan’s multiple range test) e – por conta disso – indicado por MRT, é um teste que se aplica após a análise de variância (ANOVA) para identificar os pares de médias (de pelo menos três) que difiram estatisticamente. É um teste trabalhoso porque exige o cálculo de diversas amplitudes (diferenças) mínimas significantes.
Vamos mostrar como se faz o teste de Duncan usando um exemplo. Considere os dados (fictícios) de diminuição da pressão arterial apresentados na Tabela 1. Esses dados foram submetidos à análise de variância apresentada na Tabela 2. Como o valor de F é significante ao nível de 5%, existe pelo menos uma média diferente das demais. As médias amostrais calculadas estão na Tabela 3.

                      Tabela 1 - Diminuição da pressão arterial,
                    em milímetros de mercúrio, segundo o grupo

 Tabela 2 - Análise de variância

Tabelas 3 - Médias de diminuição da pressão arterial, em milímetros
de mercúrio, segundo o grupo

Quais são as médias estatisticamente diferentes?  A pergunta pode ser respondida com a aplicação do teste de Duncan. Vamos entender, então, a racional do teste que, diferentemente do teste de Tukey, não compara médias duas a duas.

O teste de Duncan compara a amplitude de um conjunto de médias amostrais com uma amplitude mínima significante calculada. Se a amplitude das médias do conjunto exceder a amplitude mínima significante calculada, as médias da população são declaradas significantemente diferentes.

É importante notar que o teste de Duncan é sequencial porque procura, primeiramente, a significância do conjunto de médias amostrais com maior amplitude e, sequencialmente, a significância dos conjuntos de menor amplitude. Quando uma amplitude encontrada não for significante, não são feitos mais testes. Vamos entender isso por meio do exemplo.

Para proceder ao teste de Duncan, é preciso escrever as médias de grupos em ordem decrescente (ou crescente), como mostra a Tabela 4. 

 Tabelas 4 - Médias de diminuição da pressão arterial, em milímetros de mercúrio, na ordem decrescente, segundo o grupo

A amplitude mínima significante, Rm, para comparar médias que abrangem m medias da lista ordenada das  k médias em comparação é dada por

Nessa fórmula:
rm  é o valor da amplitude mínima estudentizada significante (least significant studentized range) ao  nível de significância a, encontrado em tabelas;  depende do número m de médias abrangidas na amplitude em comparação e do número de graus de liberdade do quadrado médio do resíduo da ANOVA;
QMR é o quadrado médio do resíduo da ANOVA;
r é o número de repetições em cada grupo.

A lista ordenada de k = 6 médias do nosso exemplo está na Tabela 4. Vamos calcular Rm para comparar a maior média amostral, que é a média do grupo D, com a menor, ou seja, a do controle. Já sabemos, da Tabela 2, que QMR = 36,00 e, da Tabela 1, que r = 5.

O valor de rm é obtido em uma tabela de valores críticos para o teste de Duncan, ou amplitude estudentizada significante mínima (least significant studentized range). O número de médias abrangidas no intervalo de médias, nessa primeira comparação, é m=6. o número de graus de liberdade do quadrado médio do resíduo da ANOVA (veja Tabela 2) é 24. Ao nível de significância de 5%, rm =3,276, como mostrado na Tabela 5

Talvez você se pergunte: onde acho essa tabela? A indicação é Harter, H. L. Critical values for Duncan´s new multiple range test. Biometrics (16):671-685,1960. Você encontra em Least Signficant Studentized Ranges For Duncan's Test - Springer
link.springer.com/chapter/10.1007%2F978-1-4613-9629-1_13.

Tabela 5 - Amplitude estudentizada mínima significante
 (nível de significância de 5%)

Voltemos ao exemplo dado na Tabela 1. A amplitude estudentizada mínima significante para um intervalo que abrange 6 médias é dada por:

Reveja as médias amostrais dadas na Tabela 4. A amplitude das médias amostrais dos grupos D e controle, isto é, 29-2=27, é maior do que a amplitude estudentizada mínima significante (27 > 8,79). Conclui-se que a o grupo D está associado a valores significantemente maiores do que o controle (a=0,05).

Para conjuntos com 5 médias, a amplitude estudentizada mínima significante é dada por:
Podem ser comparados os grupos D e B, A e controle.As amplitudes observadas são
                                      D e B:  29-8=21
                                      A e controle: 21-2=19.
Como as amplitudes observadas são maiores que R5, concluímos pela significância ao nível de 5%.

Para conjuntos com 4 médias, a amplitude estudentizada mínima significante é dada por:
Podem ser comparados os grupos D e C, A e B, E e controle.

                                   D e C: 29-10=19
                                   A e B: 21-8=13
                                   E e controle: 13-2=11.

Todas as comparações revelaram-se significantes ao nível de 5%. Podemos então continuar o teste.

A amplitude estudentizada mínima significante para conjuntos com 3 médias é:

Temos as comparações:
                                D e E: 29-13=16
                                A e C: 21-10=11
                                E e B: 13-8=5
                                C e controle: 10-2=8.
Note que D é significantemente maior que E; A é significantemente maior que C, mas E e B e C e controle não diferem estatisticamente. Então, podemos ainda comparar D com A e A com E.

Para conjuntos com 2 médias:
 
Temos, então, duas comparações, ambas significantes ao nível de 5%.

               D e A: 29-21=8
               A e E: 21-13=8

Podemos agora apresentar ois resultados na forma da saída de programas de computador.

                Tabela 6 – Comparação de médias pelo teste de Duncan 
                           Means that do not share a letter are significantly different.

É importante notar que não podem ser testadas diferenças de médias que estão dentro de um intervalo de médias  que não são estatisticamente diferentes.É comum apresentar as médias de grupos em ordem decrescente ou crescente. As médias são sublinhadas. Médias sublinhadas por uma mesma linha não têm diferença significante. Veja o exemplo.


       
Finalmente, quando os grupos são de tamanhos diferentes, substitua r é pela média harmônica dos tamanhos dos grupos.

VEJA :
1.            Montgomery DC. Design and Analysis of Experiments. 4ed. New York: Wiley; 1997.
3.            http://www.ncbi.nlm.nih.gov/pmc/articles/PMC420045/