Monday, August 06, 2018

ANOVA: o modelo mais simples


A finalidade da experimentação é comparar os efeitos de diferentes tratamentos. Nas ciências agrárias, é usual comparar diversos tratamentos ou situações e utilizar, para a avaliação estatística, uma análise de variância. No entanto, para que os resultados da análise de variância sejam válidos, é preciso que os erros sejam variáveis aleatórias independentes com distribuição normal de média zero e variância constante. Mas o que são erros? Antes de definir erro, convém entender como se avaliam os efeitos de tratamentos.

Os efeitos dos tratamentos podem ser estimados fazendo a diferença entre suas médias e a média geral. Representando os efeitos de tratamentos por ti podemos escrever:
Há tratamentos com efeitos positivos (acima da média) e tratamentos com efeitos negativos (abaixo da média). A soma dos efeitos dos tratamentos é, evidentemente, zero. 
 Exemplo: para comparar os efeitos de quatro tratamentos (A, B, C, D) sobre a produtividade de milho, um pesquisador sorteou os tratamentos para 20 parcelas. Terminado o experimento e colhidos os resultados, o pesquisador obteve os dados apresentados na Tabela 1. As médias dos tratamentos estão no rodapé dessa tabela.

Tabela 1: Produtividade de milho em kg/100 m2 segundo o tratamento

A média geral é dada pela soma de todos os valores dividida por 20:


Para os dados da Tabela 1, as estimativas dos efeitos dos tratamentos são:


Essas estimativas estão apresentadas na Figura 1. Fica então fácil ver que, em média, o tratamento D teve o maior efeito.

    Figura 1. Estimativas dos efeitos de tratamento


Unidades experimentais que recebem o mesmo tratamento não têm, exatamente, a mesma resposta. No exemplo que estamos desenvolvendo, as parcelas de milho que receberam o mesmo tratamento apresentam produtividade diferente. Essas diferenças são explicadas pela variação, mesmo que pequena, da fertilidade do solo e da umidade entre uma parcela e outra, da variação da profundidade da semeadura, da variação da capacidade germinativa das sementes, da variação na aplicação do tratamento às parcelas, de erros de pesagem do milho colhido e outros fatores, que não foram não considerados pelo pesquisador. Há sempre variabilidade.

Então a produtividade de determinada parcela Yij é dada pela média obtida no experimento, mais o efeito do i-ésimo tratamento, acrescida de um desvio ou resíduo eij. Podemos então escrever:
Esta equação representa o que o pesquisador coletou, ou seja, os resultados do experimento que temos em mãos. Mas poderiam ser feitos outros experimentos nas mesmas condições. Se imaginarmos “infinitos” experimentos conduzidos nas mesmas condições, teríamos os valores verdadeiros – que o estatístico chama de parâmetros – da média de produtividade de milho (m) e dos efeitos de tratamentos (ti). Teríamos, também, os erros (eij) e não simplesmente os desvios, isto é, teríamos a diferença verdadeira entre um dado medido em uma parcela e a média do tratamento que essa parcela recebeu.

 Você pode até estar pensando que tudo isso são teorias e que, na verdade, todo pesquisador tem uma boa ideia da produtividade média de milho na região em que trabalha devido a sua experiência e seu conhecimento da literatura. Mas nenhum pesquisador sabe o valor exato de m. E todo pesquisador que faz um experimento para estudar o efeito de diferentes tratamentos sobre a produtividade de milho, sabe que está apenas estimando esses efeitos.

   Então, imagine um experimento inteiramente ao acaso. Os valores obtidos, ou seja, as respostas das unidades aos tratamentos seguem um modelo. São dadas pela soma de:
  • Média de todos os valores possíveis para a variável em análise, representada por  m (lê-se mi),
  • Efeito do i-ésimo tratamento sobre as unidades que receberam esse tratamento, representado por ti (lê-se tau índice i)
  • Erro” aleatório eij (lê-se épsilon índice ij).

Escrevemos:


Para que os resultados da análise de variância sejam válidos, é preciso que os erros eij sejam variáveis aleatórias independentes com distribuição normal de média zero e variância constante. Mas acabamos de ver: não conhecemos os erros. Temos apenas suas estimativas, os desvios eij.  obtidos experimentalmente.
Mas podemos usar os valores dos desvios para testar a hipótese de que os erros são variáveis aleatórias independentes com distribuição normal de média zero e variância constante. Vamos por partes. Consideraremos esses achados nossas pressuposições para proceder a uma análise de variância se pudermos aceitar – com base na nossa amostra de desvios – que os erros são


As estimativas dos erros, ou seja, os desvios, mais conhecidos como resíduos são obtidos fazendo as diferenças entre os valores observados e as médias dos tratamentos que receberam. Para os dados da Tabela 1, foram calculados os resíduos apresentados na Tabela 2.

Tabela 2- Cálculo dos resíduos dos dados apresentados na Tabela 1


  A análise de resíduos permite estabelecer se uma análise de variância dos dados apresentado na Tabela 1 é aceitável. Logo, é preciso ver como se faz a análise dos resíduos, pois é essa análise que diz se as pressuposições feitas para proceder à análise de variância são razoáveis.

8 comments:

mari hertel said...

Bom dia, professora Sonia.
Tenho visitado seu blog diariamente (tendo já deixado comentários) e, inclusive, estou lendo seu livro sobre Análise de Variância. Entretanto, não estou conseguindo definir a seguinte situação:
Conduzi experimento em casa de vegetação com mudas em vasos em delineamento inteiramente ao acaso e apliquei 3 tratamentos a estas mudas. Um deles foi o déficit hídrico, outro foi a associação com bactérias promotoras do crescimento, e o terceiro aplicação de nanopartículas contendo doador de óxido nítrico.
Eu gostaria de saber o seguinte, devido à natureza diferente dos tratamentos, eu posso conduzir uma Anova fator único seguida de teste de Tukey HSD (ou outro a posteriori)?
Gostaria de fazê-lo, pois, eu quero comparar as mudas sem nenhum tratamento (hidratadas, sem bactérias e sem nanopartículas) com as demais tratadas. E, ao conduzir a Anova de 3 fatores, eu não posso fazer essa comparação, já que havendo interação entre os fatores devo comparar dentro dos níveis de cada um.
Espero que tenha sido clara e agradeço muito se a senhora puder me ajudar.

Sonia Vieira said...

Será que entendi? Veja:
Três fatores em dois níveis (2 ao cubo) em delineamento inteiramente ao acaso.
1. Testemunha
2. A = DH
3. B = Bact
4. C = Nitr
5. AxB = DH + Bact
6. AxC = DH +Nitr
7. BxC = Bact+Nitr
8. AxBxC =DH + Bact+ Nitr

Causa de variação
A
B
C
A x B
A x C
B x C
A x B x C
Se os valores de F para A, B e C forem significantes no nível de 5% e os valores das interações duplas também forem significantes no nível de 5%, não compare médias de A, B e C. Mas é razoável comparar, por exemplo, os níveis de C dentro de cada combinação dos níveis de B e de A. Isto pode ser feito por meio do teste de Tukey.


mari hertel said...

Oi professora!
É isso mesmo, a única diferença é que o tratamento B tem 3 níveis.
Para o Tukey eu devo então especificar as médias dentro de cada nível, e não comparar todas de uma só vez, né?
Considerando que a interação AxB tenha sido significante, por exemplo, posso comparar os 3 níveis de B: não inoculado (B1), bactéria 1 (B2) e bactéria 2 (B3) na condição A1, e também entre B1, B2, B3 na condição A2; mas não B1, B2 e B3 tanto em A1 quanto em A2.
É isto?
Obrigada!

Unknown said...

Olá Profª Sônia! Em virtude de seu livro "Estatística experimental" estar esgotado, poderias fazer um post sobre delineamentos hierarquizados (nested ANOVA)? Obrigado!

Sonia Vieira said...

Olá: estou com o aceite de uma editora. Vamos ver se sai, e logo. Obrigada pelo interesse.

Unknown said...

Professora, bom dia! Há alguma previsão para nova edição do livro Análise de Variância (ANOVA)? Tenho tentado comprar mas, não acho em nenhuma editora. Tentei até comprar usado mas, tb sem sucesso.
Obrigado

Sonia Vieira said...

Nenhuma previsão. A Editora Atlas foi vendida à Editora GEN, que não ficou com o contrato desse livro. Estou sem editora, procurando, mas sem sucesso até agora.

milenirodrigues said...

Esclareceu muitas dúvidas professora, obrigada. Aprendo muito com seus livros, sua didática é excelente!