A
finalidade da experimentação é comparar os efeitos de diferentes tratamentos.
Nas ciências agrárias, é usual comparar diversos tratamentos ou situações e
utilizar, para a avaliação estatística, uma análise de variância (ANOVA). No entanto, para que os
resultados dessa análise sejam válidos, é preciso que os erros sejam variáveis aleatórias independentes com distribuição normal de média
zero e variância constante. Mas o que são erros? Antes de definir erro, convém entender como se avaliam os
efeitos de tratamentos.
Os efeitos dos tratamentos podem ser estimados pela diferença entre suas
médias e a média geral. Representando os efeitos de tratamentos por ti podemos escrever:
Há
tratamentos com efeitos positivos (acima da média) e tratamentos com efeitos
negativos (abaixo da média). A soma dos efeitos dos tratamentos é,
evidentemente, zero.
Exemplo
Para comparar os efeitos de quatro tratamentos (A, B, C, D) sobre a
produtividade de determinada cultura, um pesquisador sorteou os tratamentos para 20 parcelas de 20metros de linha. Depois de terminado o experimento e coletados os resultados, o pesquisador obteve os dados
apresentados na Tabela 1. As médias dos tratamentos estão no rodapé dessa
tabela.
Tabela 1
Produção de milho (kg/ha) em parcelas de 20 metros de linha conforme o tratamento aplicado
A
média geral é dada pela soma de todos os valores dividida por 20:
Para
os dados da Tabela 1, as estimativas dos efeitos dos tratamentos são:
Essas estimativas estão apresentadas
na Figura 1. É fácil ver que, em média, o tratamento D teve o maior
efeito.
Figura 1
Estimativas dos efeitos de tratamento
Unidades
experimentais que recebem o mesmo tratamento não apresentam exatamente a mesma resposta.
No exemplo em questão, as parcelas de milho submetidas ao
mesmo tratamento apresentam produtividades diferentes. Essas diferenças podem ser explicadas por diversos fatores, como a variação, mesmo que pequena, da fertilidade do solo e da
umidade dentro das parcelas, diferenças na profundidade da semeadura, da
variação da capacidade germinativa das sementes, na aplicação do
tratamento, de erros na pesagem do milho colhido e outros fatores que não foram considerados pelo pesquisador. Sempre há variabilidade.
Logo, a produtividade de uma determinada parcela Yij pode ser expressa como a soma da média geral do experimento, do efeito do i-ésimo tratamento e de um desvio ou resíduo eij. Podemos então escrever:
Esta equação representa os resultados observados no experimento. No entanto, se fossem conduzidos outros experimentos nas mesmas condições, seriam obtidos outros resultados. Se
imaginarmos que seria possível conduzir “infinitos” experimentos nas mesmas condições, obteríamos
os valores verdadeiros – chamados de parâmetros – para a média da produtividade do milho (m) e os efeitos de tratamentos (ti). Teríamos, também, os
erros verdadeiros (eij) e não apenas os
desvios. Isto significa que teríamos a diferença real entre cada valor medido e a média do tratamento correspondente.
Imagine agora um experimento inteiramente ao acaso. Os
valores obtidos - ou seja, as respostas das unidades aos tratamentos seguem - um modelo, que pode ser descrito como a soma de:
⚠️ Média de todos os valores
possíveis para a variável em análise, representada por m (lê-se mi),
⚠️ Efeito do i-ésimo tratamento sobre as unidades que
receberam esse tratamento, representado por ti (lê-se tau índice i)
⚠️ “Erro” aleatório eij (lê-se épsilon índice ij).
Podemos escrever:
Para
que os resultados da análise de variância (ANOVA) aplicada aos dados experimentais sejam válidos, é preciso que os erros eij sejam variáveis aleatórias independentes com
distribuição normal de média zero e variância constante. No entanto, como vimos, os erros não são conhecidos. Temos apenas suas estimativas, que são os desvios eij. obtidos experimentalmente.
O que se faz, então, é utilizar esses desvios para testar a hipótese de que os erros são variáveis aleatórias independentes com
distribuição normal de média zero e variância constante. Vamos por partes. Isso
nos permite decidir se as pressuposições necessárias para a análise de
variância são razoáveis.
As
estimativas dos erros, conhecidas como resíduos, são obtidas subtraindo as médias dos tratamentos dos valores observados.
Para os dados
da Tabela 1, foram calculados os resíduos calculados estão apresentados na Tabela 2.
Tabela 2
Cálculo dos resíduos dos dados apresentados na Tabela 1
📢A
análise de resíduos permite estabelecer se uma análise de variância (ANOVA) dos dados apresentado na Tabela 1 é aceitável. Logo, é preciso fazer a análise dos resíduos, pois é
essa análise que diz se as pressuposições feitas para proceder à análise de
variância são razoáveis.
Leia como se faz a análise dos resíduos em:
FEALQ ESALQ USP
8 comments:
Bom dia, professora Sonia.
Tenho visitado seu blog diariamente (tendo já deixado comentários) e, inclusive, estou lendo seu livro sobre Análise de Variância. Entretanto, não estou conseguindo definir a seguinte situação:
Conduzi experimento em casa de vegetação com mudas em vasos em delineamento inteiramente ao acaso e apliquei 3 tratamentos a estas mudas. Um deles foi o déficit hídrico, outro foi a associação com bactérias promotoras do crescimento, e o terceiro aplicação de nanopartículas contendo doador de óxido nítrico.
Eu gostaria de saber o seguinte, devido à natureza diferente dos tratamentos, eu posso conduzir uma Anova fator único seguida de teste de Tukey HSD (ou outro a posteriori)?
Gostaria de fazê-lo, pois, eu quero comparar as mudas sem nenhum tratamento (hidratadas, sem bactérias e sem nanopartículas) com as demais tratadas. E, ao conduzir a Anova de 3 fatores, eu não posso fazer essa comparação, já que havendo interação entre os fatores devo comparar dentro dos níveis de cada um.
Espero que tenha sido clara e agradeço muito se a senhora puder me ajudar.
Será que entendi? Veja:
Três fatores em dois níveis (2 ao cubo) em delineamento inteiramente ao acaso.
1. Testemunha
2. A = DH
3. B = Bact
4. C = Nitr
5. AxB = DH + Bact
6. AxC = DH +Nitr
7. BxC = Bact+Nitr
8. AxBxC =DH + Bact+ Nitr
Causa de variação
A
B
C
A x B
A x C
B x C
A x B x C
Se os valores de F para A, B e C forem significantes no nível de 5% e os valores das interações duplas também forem significantes no nível de 5%, não compare médias de A, B e C. Mas é razoável comparar, por exemplo, os níveis de C dentro de cada combinação dos níveis de B e de A. Isto pode ser feito por meio do teste de Tukey.
Oi professora!
É isso mesmo, a única diferença é que o tratamento B tem 3 níveis.
Para o Tukey eu devo então especificar as médias dentro de cada nível, e não comparar todas de uma só vez, né?
Considerando que a interação AxB tenha sido significante, por exemplo, posso comparar os 3 níveis de B: não inoculado (B1), bactéria 1 (B2) e bactéria 2 (B3) na condição A1, e também entre B1, B2, B3 na condição A2; mas não B1, B2 e B3 tanto em A1 quanto em A2.
É isto?
Obrigada!
Olá Profª Sônia! Em virtude de seu livro "Estatística experimental" estar esgotado, poderias fazer um post sobre delineamentos hierarquizados (nested ANOVA)? Obrigado!
Olá: estou com o aceite de uma editora. Vamos ver se sai, e logo. Obrigada pelo interesse.
Professora, bom dia! Há alguma previsão para nova edição do livro Análise de Variância (ANOVA)? Tenho tentado comprar mas, não acho em nenhuma editora. Tentei até comprar usado mas, tb sem sucesso.
Obrigado
Nenhuma previsão. A Editora Atlas foi vendida à Editora GEN, que não ficou com o contrato desse livro. Estou sem editora, procurando, mas sem sucesso até agora.
Esclareceu muitas dúvidas professora, obrigada. Aprendo muito com seus livros, sua didática é excelente!
Post a Comment