Thursday, September 19, 2019

Regressão linear passando pela origem: a linha que começa do zero


Em alguns casos, a regressão linear simples deve passar, obrigatoriamente, pela origem do sistema de eixos cartesianos, seja por razões teóricas ou por experiências prévias. Um exemplo clássico é o movimento retilíneo uniforme, no qual um corpo, no instante inicial (tempo zero), percorreu distância zero.

 

Outro exemplo ocorre na determinação do módulo de Young (ou módulo de elasticidade), que mede a rigidez de um material sólido. Esse módulo é representado pela inclinação da reta que relaciona a tensão (força por unidade de área) com a deformação de um material dentro do regime de elasticidade linear, conforme ilustrado na Figura 1.


                                                     Figura 1


Embora a regressão linear simples sem intercepto tenha utilidade em estatística aplicada, é recomendável compará-la com um modelo que inclua o termo de interceptação. A decisão sobre qual modelo utilizar pode ser controversa e depende do contexto da análise.

Um exemplo dessa controvérsia está na inconsistência dos resultados obtidos ao ajustar uma regressão linear simples sem intercepto em diferentes softwares estatísticos, que frequentemente produzem estimativas divergentes.

Quando se impõe que a regressão linear simples passe pela origem, o modelo matemático assume a seguinte forma:

Nesse modelo:

 X é a variável independente ou explicativa;

 Y é a variável dependente ou resposta;

 e são erros aleatórios;

 b é o parâmetro. 

      A estimativa de b  é dada por:

 

A reta de regressão ajustada é:

                                       

Os desvios ou resíduos são dados por

 

Diferentemente do modelo convencional com intercepto, neste caso a soma dos resíduos não é necessariamente zero. Isso ocorre porque forçar a reta a passar pela origem pode comprometer o melhor ajuste aos dados.

Para avaliar a qualidade do ajuste, procede-se à análise de variância (ANOVA). Nesse caso, os graus de liberdade para as somas de quadrados são:

·      SQ Total: n graus de liberdade;

·      SQ Regressão: k graus de liberdade, onde k=1 ;

·      SQ Resíduo: n−k  graus de liberdade.

Para proceder à análise de variância, calcule:



Sem a constante, os graus de liberdade para SQ Total, SQ Regressão e SQ Resíduo são n, k e n-k respectivamente, sendo n o número de pares de observações das variáveis X e Y e k o número de variáveis independentes (no caso, k=1). Podemos, então, construir a tabela de ANOVA (análise de variância) apresentada na Tabela 1.Com base nesses cálculos, podemos construir a Tabela de ANOVA, conforme apresentado na Tabela 1.


Veja os dados, X e Y, na Tabela 2, com os cálculos necessários para ajustar uma regressão linear simples passando pela origem. 


Logo, a equação da reta de regressão é:


Também podem ser calculados os valores do desvio padrão (s), do coeficiente de determinação (R2) e o valor do teste t para o coeficiente angular b. Veja as fórmulas:


Para os dados do exemplo:


Veja a Figura 2, que apresenta os valores observados, os valores obtidos pela reta de regressão e a reta ajustada.

O “output” do Minitab está apresentada em seguida.








No comments: