Sunday, March 27, 2016

Soma de desvios padrões????

Uma doutoranda da Unicamp que não conheço me apontou gentilmente, por e-mail, o que ela considerou um “pequeno erro de cálculo” em meu livro, Análise de variância: o resultado do coeficiente de variação (CV), que consta na página 47, estaria errado. Claro, busquei rapidamente o texto e me pus na frente do computador.

Mas vamos ao que está no livro: é dado um exemplo fictício de experimento com dois tratamentos, A e B, e cinco repetições por tratamento. Os dados são poucos porque têm a finalidade única de mostrar como se fazem os cálculos. Veja a tabela de dados e a tabela de análise de variância.


Em qualidade, não é usual proceder a uma análise de variância. Calculam-se médias, desvios padrões, gráficos de controle. Então a doutoranda, que é da área de qualidade, calculou como sempre fez as médias e os desvios padrões do exemplo dado. Obteve:



Está tudo bem até aqui. Mas depois, estudando no meu livro Análise de variância, a doutoranda leu: Pode existir interesse em relacionar o desvio padrão com a média, para se ter ideia da grandeza da dispersão em relação à grandeza da média. Por definição, coeficiente de variação, que se indica por CV, é a razão entre o desvio padrão e a média dos dados, isto é
Havia, também, esta informação: na análise de variância, o desvio padrão é dado pela raiz quadrada do quadrado médio do resíduo. Reconheço que o que está escrito no livro não é suficiente para esclarecer um aluno. De qualquer forma, ali está apresentado o valor correto para do coeficiente de variação para o exemplo dado acima:


Mas vamos aos fatos. A análise de variância não é técnica comum entre pesquisadores da área de qualidade. Então a doutoranda NÃO tinha o cálculo do quadrado médio do resíduo (QMR). O coeficiente de variação foi calculado fazendo a média das médias e a média dos desvios padrões, com base nos resultados apresentados na tabela de médias e desvios padrões. Está errado:



 Para explicar isso, resolvi recorrer ao Dr. Math (Doctor Schwa, The Math Forum http://mathforum.org/dr.math/) e apresentar um pouco de matemática.


       Vamos voltar ao coeficiente de variação. Na tabela de médias e desvios padrões apresentada acima, deveriam ter sido apresentadas as variâncias de cada grupo, além de médias e os desvios padrões.

















 




Demorei muito para entender que a fórmula, como está na definição dada em meu livro, Análise de variância, e é a comumente apresentada nos livros didáticos de estatística, pode levar a erro. No livro está escrito:

Por definição, coeficiente de variação, que se indica por CV, é a razão entre o desvio padrão e a média dos dados, isto é
A fórmula está correta desde que em análise haja uma única variável em um só grupo. Nos experimentos ou ensaios completamente randômicos, uma variável é observada em k grupos. Se for calculada a média e o desvio padrão de cada grupo, o coeficiente de variação (geral) será dado pela divisão da raiz quadrada do quadrado médio do resíduo da análise de variância pela média geral. O quadrado médio do resíduo (QMR), desde que todos os grupos tenham r repetições, é
      em que SQR é a soma de quadrados do resíduo, dada por


        Verifique que
  

          é a variância do i-ésimo tratamento e o QMR é a média das variâncias de cada grupo.



 Procure o livro em http://www.saraiva.com.br/analise-de-variancia-anova-1100479.html





1 comment:

g.briatore said...

Olá Sonia, parabéns pelo blog e livros! Seu material tem sido de grande ajuda para meu aprendizado.
Desculpe-me por tomar seu tempo, mas estou lhe escrevendo por que estou com dificuldade de encontrar material detalhado sobre o Teste POST-HOC de Tukey HSD que faça a análise com base nas letras a,b,c etc. Estou tentando entender a lógica para identificar as significâncias no formato da tabela abaixo, mas não encontrei nenhum livro ou material que explique. Você tem algum livro ou material para indicar que explique como analisar os dados neste método de letras?

9,800 15,400 17,600
15 a b b
20 a b↓ b
25 a bc c

Obrigado,
Geucimar