Thursday, September 19, 2019

Regressão linear pela origem: quando forçar o intercepto ao valor zero


 Em análises de regressão, o modelo mais comum inclui um termo de intercepto (constante). No entanto, em situações específicas, somos obrigados a forçar a reta de regressão a passar pela origem do plano cartesiano (ponto (0,0)). Essa decisão pode ser motivada por razões teóricas sólidas ou por evidências empíricas anteriores.

Por que usar um modelo sem intercepto?

Dois exemplos clássicos ilustram essa necessidade:

1.                   Movimento Retilíneo Uniforme: Na Física, se um corpo parte do repouso em uma trajetória retilínea, no instante inicial (tempo zero) a distância percorrida é necessariamente zero. Um modelo que não passe pela origem não faria sentido físico.

2.                   Módulo de Young: Na Engenharia de Materiais, o módulo de Young, que mede a rigidez de um material, é definido pela inclinação da curva tensão-deformação no regime elástico. Se não há tensão aplicada, não há deformação. Portanto, a reta que modela esse comportamento deve passar pela origem.

A Figura 1 ilustra essa relação no contexto do módulo de Young.

                                                     Figura 1


Embora a regressão linear simples sem intercepto tenha utilidade em estatística aplicada, é recomendável compará-la com um modelo que inclua o termo de interceptação. A decisão sobre qual modelo utilizar pode ser controversa e depende do contexto da análise.

O Modelo Matemático

Ao impor que a reta passe pela origem, nosso modelo simplifica para:

Onde:

      ·     é a variável independente.

      ·     Y é a variável dependente.

      ·    b  é o parâmetro (coeficiente angular) que queremos estimar.

      ·    e é o termo de erro aleatório.

      A estimativa de b  é dada pela fórmula:

 

A reta de regressão ajustada é, portanto:

                                                 

Os desvios ou resíduos são dados por

 

Avaliando o Ajuste do Modelo

Uma diferença crucial em relação ao modelo com intercepto é que a soma dos resíduos (Σei) não é necessariamente zero. Ao forçar a reta a passar por (0,0), perdemos o grau de liberdade que "ajustava" a altura da reta para minimizar os resíduos.

Para avaliar a qualidade do ajuste, recorremos à análise de variância (ANOVA). Os graus de liberdade são ajustados da seguinte forma:

·      SQ Total: n graus de liberdade.

·      SQ Regressão: k graus de liberdade (onde k=1).

·      SQ Resíduo: n-k graus de liberdade.


As somas de quadrados são dadas pelas fórmulas:



 Podemos, então, construir a tabela de análise de variância (ANOVA) apresentada na Tabela 1. 


Exemplo Prático

Considere os dados da Tabela 2, para os quais vamos ajustar um modelo que passa pela origem. Os resultados da ANOVA estão na Tabela 3.


Logo, a equação da reta de regressão é:


Também podem ser calculados os valores do desvio padrão (s), do coeficiente de determinação (R2) e o valor do teste t para o coeficiente angular b. Veja as fórmulas:


Para os dados do exemplo:


A Figura 2 apresenta os valores observados, os valores obtidos pela reta de regressão e a reta ajustada.

O “output” do Minitab está apresentada em seguida.








No comments:

Post a Comment