Em alguns casos, a regressão linear simples deve passar,
obrigatoriamente, pela origem do sistema de eixos cartesianos, seja por razões
teóricas ou por experiências prévias. Um exemplo clássico é o movimento
retilíneo uniforme, no qual um corpo, no instante inicial (tempo zero),
percorreu distância zero.
Outro exemplo ocorre na determinação do módulo de Young (ou módulo
de elasticidade), que mede a rigidez de um material sólido. Esse módulo é
representado pela inclinação da reta que relaciona a tensão (força por unidade
de área) com a deformação de um material dentro do regime de elasticidade
linear, conforme ilustrado na Figura 1.
Figura 1
Embora
a regressão linear simples sem intercepto tenha utilidade em estatística
aplicada, é recomendável compará-la com um modelo que inclua o termo de
interceptação. A decisão sobre qual modelo utilizar pode ser controversa e
depende do contexto da análise.
Um
exemplo dessa controvérsia está na inconsistência dos resultados obtidos ao
ajustar uma regressão linear simples sem intercepto em diferentes softwares
estatísticos, que frequentemente produzem estimativas divergentes.
Quando se impõe que a regressão linear
simples passe pela origem, o modelo matemático assume a seguinte forma:
Nesse modelo:
X é a variável
independente ou explicativa;
Y é a variável dependente ou
resposta;
e são erros aleatórios;
b
é
o parâmetro.
A estimativa de b é dada por:
A reta de regressão ajustada é:
Os desvios ou resíduos
são dados por
Diferentemente
do modelo convencional com intercepto, neste caso a soma dos resíduos não é
necessariamente zero. Isso ocorre porque forçar a reta a passar pela origem
pode comprometer o melhor ajuste aos dados.
Para
avaliar a qualidade do ajuste, procede-se à análise de variância (ANOVA). Nesse
caso, os graus de liberdade para as somas de quadrados são:
· SQ Total: n graus de liberdade;
· SQ
Regressão: k graus de liberdade, onde k=1 ;
· SQ Resíduo:
n−k graus de liberdade.
Para
proceder à análise de variância, calcule:
Sem a constante, os graus de liberdade para SQ Total, SQ Regressão e SQ
Resíduo são n, k e n-k respectivamente,
sendo n o número de pares de observações das variáveis X e Y e k o
número de variáveis independentes (no caso, k=1). Podemos, então,
construir a tabela de ANOVA (análise de variância) apresentada na Tabela 1.
Veja os
dados, X e Y, na Tabela 2, com os cálculos
necessários para ajustar uma regressão linear simples passando pela
origem.
Logo, a equação da reta de regressão é:
Também podem
ser calculados os valores do desvio padrão (s), do coeficiente de determinação (R2) e o valor do teste t para o coeficiente angular b. Veja as fórmulas:
Veja a Figura 2, que apresenta os valores observados, os valores obtidos pela reta de regressão e a reta ajustada.
O “output” do
Minitab está apresentada em seguida.
No comments:
Post a Comment