Qual é a diferença entre as equações de regressão linear e não linear em análise de regressão?

Anteriormente eu escrevi sobre quando escolher a regressão não-linear e como modelar a curvatura com regressão linear e não-linear. Desde então, recebi vários comentários expressando confusão sobre o que diferencia equações não-lineares de equações lineares. Essa confusão é compreensível porque os dois tipos podem modelar curvas.

Então, se não é a capacidade de modelar uma curva, qual é a diferença entre uma equação de regressão linear e uma não-linear?

Equações de regressão linear

A regressão linear requer um modelo linear. Até aí tudo bem, certo? Mas o que isso quer dizer?

Um modelo é linear quando cada termo é ou uma constante, ou o produto de um parâmetro e uma variável preditora. Uma equação linear é construída adicionando os resultados para cada termo. Isso restringe a equação a apenas uma forma básica:

Resposta = constante + parâmetro * preditor + ... + parâmetro * preditor

Y = b_o + b₁X₁ + b₂X₂ + ... + b_kX_k

Na estatística, uma equação (ou função) de regressão é linear quando ela é linear em seus parâmetros. Apesar da equação ter que ser linear nos parâmetros, você pode transformar as variáveis preditoras de maneiras que produzam curvatura. Por exemplo, você pode incluir uma variável ao quadrado para produzir uma curva em forma de U.

Y = b_o + b₁X₁ + b₂X₁²

Este modelo ainda é linear nos parâmetros, mesmo que a variável preditora esteja elevada ao quadrado. Você também pode usar formas funcionais de logaritmo e inversa que sejam lineares nos parâmetros para produzir diferentes tipos de curvas.

Segue um exemplo de um modelo de regressão linear que usa um termo ao quadrado para ajustar a relação de curvatura entre o IMC e percentual de gordura corporal.

grafico-de-linha-ajustada-2-1

Equações de regressão não-linear

Enquanto uma equação linear tem uma forma básica, as equações não-lineares podem assumir muitas formas diferentes. A maneira mais fácil de determinar se uma equação é não-linear é se concentrar no termo “não-linear” em si. Ela é realmente não linear. Se a equação não atender aos critérios acima para uma equação linear, ela não é linear.

Isso abrange muitas formas diferentes, e é por isso que a regressão não-linear proporciona um ajuste de curva mais flexível. Aqui estão vários exemplos do catálogo de funções não-lineares do Minitab. Thetas representam os parâmetros e X representa a preditora nas funções não-lineares. Ao contrário da regressão linear, essas funções podem ter mais de um parâmetro por variável preditora.

Função não-linear	Um formato possível
Poder (convexo): Theta1 * X^Theta2
Crescimento de Weibull: Theta1 + (Theta2 - Theta1) * exp(-Theta3 * X^Theta4)
Fourier: Theta1 * cos(X + Theta4) + (Theta2 * cos(2*X + Theta4) + Theta3

Aqui está um exemplo de um modelo de regressão não-linear da relação entre densidade e mobilidade do elétron.

grafico-de-linha-ajustada-3-1

A equação não-linear é tão comprida que não cabe no gráfico:

equacao

A regressão linear e a não-linear são nomeadas de acordo com a forma funcional dos modelos que cada análise aceita. Espero que a distinção entre equações lineares e não-lineares esteja mais clara e que você entenda como é possível para a regressão linear modelar curvaturas! Também explica porque você verá o R-quadrado exibido para alguns modelos de curvatura, mesmo que seja impossível calcular o R-quadrado para a regressão não-linear.

Se você está aprendendo sobre regressão, leia meu tutorial sobre regressão!

*Alguns dos links relacionados podem conter informações em outros idiomas

Qual é a diferença entre as equações de regressão linear e não linear em análise de regressão?

Equações de regressão linear

Equações de regressão não-linear

Você pode gostar também