Sonia Vieira: ANOVA: o modelo mais simples

Monday, August 06, 2018

ANOVA: o modelo mais simples

A finalidade da experimentação é comparar os efeitos de diferentes tratamentos. Nas ciências agrárias, é usual comparar diversos tratamentos ou situações e utilizar, para a avaliação estatística, uma análise de variância (ANOVA). No entanto, para que os resultados dessa análise sejam válidos, é preciso que os erros sejam variáveis aleatórias independentes com distribuição normal de média zero e variância constante. Mas o que são erros? Antes de definir erro, convém entender como se avaliam os efeitos de tratamentos.

Os efeitos dos tratamentos podem ser estimados pela diferença entre suas médias e a média geral. Representando os efeitos de tratamentos por t_i podemos escrever:

Há tratamentos com efeitos positivos (acima da média) e tratamentos com efeitos negativos (abaixo da média). A soma dos efeitos dos tratamentos é, evidentemente, zero.

Exemplo

Para comparar os efeitos de quatro tratamentos (A, B, C, D) sobre a produtividade de determinada cultura, um pesquisador sorteou os tratamentos para 20 parcelas de 20metros de linha. Depois de terminado o experimento e coletados os resultados, o pesquisador obteve os dados apresentados na Tabela 1. As médias dos tratamentos estão no rodapé dessa tabela.

Tabela 1

Produção de milho (kg/ha) em parcelas de 20 metros de linha conforme o tratamento aplicado

A média geral é dada pela soma de todos os valores dividida por 20:

Para os dados da Tabela 1, as estimativas dos efeitos dos tratamentos são:

Essas estimativas estão apresentadas na Figura 1. É fácil ver que, em média, o tratamento D teve o maior efeito.

Figura 1

Estimativas dos efeitos de tratamento

Unidades experimentais que recebem o mesmo tratamento não apresentam exatamente a mesma resposta. No exemplo em questão, as parcelas de milho submetidas ao mesmo tratamento apresentam produtividades diferentes. Essas diferenças podem ser explicadas por diversos fatores, como a variação, mesmo que pequena, da fertilidade do solo e da umidade dentro das parcelas, diferenças na profundidade da semeadura, da variação da capacidade germinativa das sementes, na aplicação do tratamento, de erros na pesagem do milho colhido e outros fatores que não foram considerados pelo pesquisador. Sempre há variabilidade.

Logo, a produtividade de uma determinada parcela Y_ijpode ser expressa como a soma da média geral do experimento, do efeito do i-ésimo tratamento e de um desvio ou resíduo e_ij. Podemos então escrever:

Esta equação representa os resultados observados no experimento. No entanto, se fossem conduzidos outros experimentos nas mesmas condições, seriam obtidos outros resultados. Se imaginarmos que seria possível conduzir “infinitos” experimentos nas mesmas condições, obteríamos os valores verdadeiros – chamados de parâmetros – para a média da produtividade do milho (m) e os efeitos de tratamentos (t_i). Teríamos, também, os erros verdadeiros (e_ij) e não apenas os desvios. Isto significa que teríamos a diferença real entre cada valor medido e a média do tratamento correspondente.

Você pode até estar pensando que tudo isso é teoria e que, na prática, os pesquisadores já possuem boa noção da produtividade média de milho na região onde trabalham, com base na experiência e na literatura. Mas nenhum pesquisador sabe o valor exato de m. E todo pesquisador que faz um experimento para estudar o efeito de diferentes tratamentos sobre a produtividade de milho, sabe que está apenas estimando esses efeitos.

Imagine agora um experimento inteiramente ao acaso. Os valores obtidos - ou seja, as respostas das unidades aos tratamentos seguem - um modelo, que pode ser descrito como a soma de:

⚠️ Média de todos os valores possíveis para a variável em análise, representada por m (lê-se mi),

⚠️ Efeito do i-ésimo tratamento sobre as unidades que receberam esse tratamento, representado por t_i(lê-se tau índice i)

⚠️ “Erro” aleatório e_ij (lê-se épsilon índice ij).

Podemos escrever:

Para que os resultados da análise de variância (ANOVA) aplicada aos dados experimentais sejam válidos, é preciso que os erros e_ij sejam variáveis aleatórias independentes com distribuição normal de média zero e variância constante. No entanto, como vimos, os erros não são conhecidos. Temos apenas suas estimativas, que são os desvios e_ij. obtidos experimentalmente.

O que se faz, então, é utilizar esses desvios para testar a hipótese de que os erros são variáveis aleatórias independentes com distribuição normal de média zero e variância constante. Vamos por partes. Isso nos permite decidir se as pressuposições necessárias para a análise de variância são razoáveis.

As estimativas dos erros, conhecidas como resíduos, são obtidas subtraindo as médias dos tratamentos dos valores observados. Para os dados da Tabela 1, foram calculados os resíduos calculados estão apresentados na Tabela 2.

Tabela 2

Cálculo dos resíduos dos dados apresentados na Tabela 1

📢A análise de resíduos permite estabelecer se uma análise de variância (ANOVA) dos dados apresentado na Tabela 1 é aceitável. Logo, é preciso fazer a análise dos resíduos, pois é essa análise que diz se as pressuposições feitas para proceder à análise de variância são razoáveis.

Leia como se faz a análise dos resíduos em:

FEALQ ESALQ USP

8 comments:

mari hertel said...: Bom dia, professora Sonia.
Tenho visitado seu blog diariamente (tendo já deixado comentários) e, inclusive, estou lendo seu livro sobre Análise de Variância. Entretanto, não estou conseguindo definir a seguinte situação:
Conduzi experimento em casa de vegetação com mudas em vasos em delineamento inteiramente ao acaso e apliquei 3 tratamentos a estas mudas. Um deles foi o déficit hídrico, outro foi a associação com bactérias promotoras do crescimento, e o terceiro aplicação de nanopartículas contendo doador de óxido nítrico.
Eu gostaria de saber o seguinte, devido à natureza diferente dos tratamentos, eu posso conduzir uma Anova fator único seguida de teste de Tukey HSD (ou outro a posteriori)?
Gostaria de fazê-lo, pois, eu quero comparar as mudas sem nenhum tratamento (hidratadas, sem bactérias e sem nanopartículas) com as demais tratadas. E, ao conduzir a Anova de 3 fatores, eu não posso fazer essa comparação, já que havendo interação entre os fatores devo comparar dentro dos níveis de cada um.
Espero que tenha sido clara e agradeço muito se a senhora puder me ajudar.; 4:39 AM
Sonia Vieira said...: Será que entendi? Veja:
Três fatores em dois níveis (2 ao cubo) em delineamento inteiramente ao acaso.
1. Testemunha
2. A = DH
3. B = Bact
4. C = Nitr
5. AxB = DH + Bact
6. AxC = DH +Nitr
7. BxC = Bact+Nitr
8. AxBxC =DH + Bact+ Nitr

Causa de variação
A
B
C
A x B
A x C
B x C
A x B x C
Se os valores de F para A, B e C forem significantes no nível de 5% e os valores das interações duplas também forem significantes no nível de 5%, não compare médias de A, B e C. Mas é razoável comparar, por exemplo, os níveis de C dentro de cada combinação dos níveis de B e de A. Isto pode ser feito por meio do teste de Tukey.; 1:48 PM
mari hertel said...: Oi professora!
É isso mesmo, a única diferença é que o tratamento B tem 3 níveis.
Para o Tukey eu devo então especificar as médias dentro de cada nível, e não comparar todas de uma só vez, né?
Considerando que a interação AxB tenha sido significante, por exemplo, posso comparar os 3 níveis de B: não inoculado (B1), bactéria 1 (B2) e bactéria 2 (B3) na condição A1, e também entre B1, B2, B3 na condição A2; mas não B1, B2 e B3 tanto em A1 quanto em A2.
É isto?
Obrigada!; 5:09 AM
Unknown said...: Olá Profª Sônia! Em virtude de seu livro "Estatística experimental" estar esgotado, poderias fazer um post sobre delineamentos hierarquizados (nested ANOVA)? Obrigado!; 8:46 PM
Sonia Vieira said...: Olá: estou com o aceite de uma editora. Vamos ver se sai, e logo. Obrigada pelo interesse.; 6:39 AM
Unknown said...: Professora, bom dia! Há alguma previsão para nova edição do livro Análise de Variância (ANOVA)? Tenho tentado comprar mas, não acho em nenhuma editora. Tentei até comprar usado mas, tb sem sucesso.
Obrigado; 8:01 AM
Sonia Vieira said...: Nenhuma previsão. A Editora Atlas foi vendida à Editora GEN, que não ficou com o contrato desse livro. Estou sem editora, procurando, mas sem sucesso até agora.; 11:00 AM
milenirodrigues said...: Esclareceu muitas dúvidas professora, obrigada. Aprendo muito com seus livros, sua didática é excelente!; 5:25 PM