A
finalidade da experimentação é comparar os efeitos de diferentes tratamentos.
Nas ciências agrárias, é usual comparar diversos tratamentos ou situações e
utilizar, para a avaliação estatística, uma análise de variância. No entanto, para que os
resultados da análise de variância sejam válidos, é preciso que os erros sejam variáveis aleatórias independentes com distribuição normal de média
zero e variância constante. Mas o que são erros? Antes de definir erro, convém entender como se avaliam os
efeitos de tratamentos.
Os efeitos dos tratamentos podem ser estimados fazendo a diferença entre suas
médias e a média geral. Representando os efeitos de tratamentos por ti podemos escrever:
Há
tratamentos com efeitos positivos (acima da média) e tratamentos com efeitos
negativos (abaixo da média). A soma dos efeitos dos tratamentos é,
evidentemente, zero.
Exemplo:
para comparar os efeitos de quatro tratamentos (A, B, C, D) sobre a
produtividade de milho, um pesquisador sorteou os tratamentos para 20 parcelas.
Terminado o experimento e colhidos os resultados, o pesquisador obteve os dados
apresentados na Tabela 1. As médias dos tratamentos estão no rodapé dessa
tabela.
Tabela 1: Produtividade de milho em kg/100 m2
segundo o tratamento
A
média geral é dada pela soma de todos os valores dividida por 20:
Para
os dados da Tabela 1, as estimativas dos efeitos dos tratamentos são:
Essas estimativas estão apresentadas
na Figura 1. Fica então fácil ver que, em média, o tratamento D teve o maior
efeito.
Figura 1. Estimativas dos efeitos de tratamento
Unidades
experimentais que recebem o mesmo tratamento não têm, exatamente, a mesma resposta.
No exemplo que estamos desenvolvendo, as parcelas de milho que receberam o
mesmo tratamento apresentam produtividade diferente. Essas diferenças são
explicadas pela variação, mesmo que pequena, da fertilidade do solo e da
umidade entre uma parcela e outra, da variação da profundidade da semeadura, da
variação da capacidade germinativa das sementes, da variação na aplicação do
tratamento às parcelas, de erros de pesagem do milho colhido e outros fatores,
que não foram não considerados pelo pesquisador. Há sempre variabilidade.
Então a produtividade de determinada parcela Yij é dada pela média obtida
no experimento, mais o efeito do i-ésimo
tratamento, acrescida de um desvio ou resíduo eij. Podemos então escrever:
Esta equação representa o
que o pesquisador coletou, ou seja, os resultados do experimento que temos em
mãos. Mas poderiam ser feitos outros experimentos nas mesmas condições. Se
imaginarmos “infinitos” experimentos conduzidos nas mesmas condições, teríamos
os valores verdadeiros – que o estatístico chama de parâmetros – da média de produtividade de milho (m) e
dos efeitos de tratamentos (ti). Teríamos, também, os
erros (eij) e não simplesmente os
desvios, isto é, teríamos a diferença verdadeira entre um dado medido em uma
parcela e a média do tratamento que essa parcela recebeu.
Então, imagine um experimento inteiramente ao acaso. Os
valores obtidos, ou seja, as respostas das unidades aos tratamentos seguem
um modelo. São dadas pela soma de:
- Média de todos os valores possíveis para a variável em análise, representada por m (lê-se mi),
- Efeito do i-ésimo tratamento sobre as unidades que receberam esse tratamento, representado por ti (lê-se tau índice i)
- “Erro” aleatório eij (lê-se épsilon índice ij).
Escrevemos:
Para
que os resultados da análise de variância sejam válidos, é preciso que os erros eij sejam variáveis aleatórias independentes com
distribuição normal de média zero e variância constante. Mas acabamos de
ver: não conhecemos os erros. Temos apenas suas estimativas, os desvios eij. obtidos experimentalmente.
Mas
podemos usar os valores dos desvios para testar a hipótese de que os erros são variáveis aleatórias independentes com
distribuição normal de média zero e variância constante. Vamos por partes. Consideraremos esses achados nossas pressuposições para proceder a uma análise de variância se pudermos aceitar – com base na nossa amostra de desvios – que os erros são
As
estimativas dos erros, ou seja, os desvios, mais conhecidos como resíduos são obtidos fazendo as
diferenças entre os valores observados e as médias dos tratamentos que receberam.
Para os dados
da Tabela 1, foram calculados os resíduos apresentados na Tabela 2.
Tabela 2- Cálculo dos resíduos dos dados apresentados na Tabela 1
A
análise de resíduos permite estabelecer se uma análise de variância dos dados apresentado na Tabela 1 é aceitável. Logo, é preciso ver como se faz a análise dos resíduos, pois é
essa análise que diz se as pressuposições feitas para proceder à análise de
variância são razoáveis.
8 comments:
Bom dia, professora Sonia.
Tenho visitado seu blog diariamente (tendo já deixado comentários) e, inclusive, estou lendo seu livro sobre Análise de Variância. Entretanto, não estou conseguindo definir a seguinte situação:
Conduzi experimento em casa de vegetação com mudas em vasos em delineamento inteiramente ao acaso e apliquei 3 tratamentos a estas mudas. Um deles foi o déficit hídrico, outro foi a associação com bactérias promotoras do crescimento, e o terceiro aplicação de nanopartículas contendo doador de óxido nítrico.
Eu gostaria de saber o seguinte, devido à natureza diferente dos tratamentos, eu posso conduzir uma Anova fator único seguida de teste de Tukey HSD (ou outro a posteriori)?
Gostaria de fazê-lo, pois, eu quero comparar as mudas sem nenhum tratamento (hidratadas, sem bactérias e sem nanopartículas) com as demais tratadas. E, ao conduzir a Anova de 3 fatores, eu não posso fazer essa comparação, já que havendo interação entre os fatores devo comparar dentro dos níveis de cada um.
Espero que tenha sido clara e agradeço muito se a senhora puder me ajudar.
Será que entendi? Veja:
Três fatores em dois níveis (2 ao cubo) em delineamento inteiramente ao acaso.
1. Testemunha
2. A = DH
3. B = Bact
4. C = Nitr
5. AxB = DH + Bact
6. AxC = DH +Nitr
7. BxC = Bact+Nitr
8. AxBxC =DH + Bact+ Nitr
Causa de variação
A
B
C
A x B
A x C
B x C
A x B x C
Se os valores de F para A, B e C forem significantes no nível de 5% e os valores das interações duplas também forem significantes no nível de 5%, não compare médias de A, B e C. Mas é razoável comparar, por exemplo, os níveis de C dentro de cada combinação dos níveis de B e de A. Isto pode ser feito por meio do teste de Tukey.
Oi professora!
É isso mesmo, a única diferença é que o tratamento B tem 3 níveis.
Para o Tukey eu devo então especificar as médias dentro de cada nível, e não comparar todas de uma só vez, né?
Considerando que a interação AxB tenha sido significante, por exemplo, posso comparar os 3 níveis de B: não inoculado (B1), bactéria 1 (B2) e bactéria 2 (B3) na condição A1, e também entre B1, B2, B3 na condição A2; mas não B1, B2 e B3 tanto em A1 quanto em A2.
É isto?
Obrigada!
Olá Profª Sônia! Em virtude de seu livro "Estatística experimental" estar esgotado, poderias fazer um post sobre delineamentos hierarquizados (nested ANOVA)? Obrigado!
Olá: estou com o aceite de uma editora. Vamos ver se sai, e logo. Obrigada pelo interesse.
Professora, bom dia! Há alguma previsão para nova edição do livro Análise de Variância (ANOVA)? Tenho tentado comprar mas, não acho em nenhuma editora. Tentei até comprar usado mas, tb sem sucesso.
Obrigado
Nenhuma previsão. A Editora Atlas foi vendida à Editora GEN, que não ficou com o contrato desse livro. Estou sem editora, procurando, mas sem sucesso até agora.
Esclareceu muitas dúvidas professora, obrigada. Aprendo muito com seus livros, sua didática é excelente!
Post a Comment