Regresión polinómica

Completado

Hasta ahora, solo hemos visto modelos de regresión lineal: modelos que se pueden modelar como líneas rectas. Sin embargo, los modelos de regresión pueden funcionar con prácticamente cualquier otro tipo de relación.

¿En qué consiste la regresión polinómica?

La regresión polinómica modela las relaciones como un tipo determinado de curva. Los polinomios son una familia de curvas que abarcan desde las formas simples hasta las complejas. Cuantos más parámetros tenga la ecuación (modelo), más compleja puede ser la curva.

Por ejemplo, un polinomio de dos parámetros es simplemente una línea recta:

y = intersección + B1 * x

Diagram showing a two-parameter polynomial regression graph.

Mientras que un polinomio de tres parámetros tiene una única curva:

y = intersección + B1 * x + B2 * x2

Diagram showing a three-parameter polynomial regression graph.

Un polinomio de cuatro parámetros puede tener dos curvas:

y = intersección + B1 * x + B2 * x2 + B3 * x3

Diagram showing a four-parameter polynomial regression graph.

Polinomio frente a otras curvas

Hay muchos tipos de curvas, como las curvas de registro y las curvas logísticas (en forma de s), que se pueden usar con regresión.

Diagram showing polynomial, log and logistic curves.

Una ventaja importante de la regresión polinómica es que se puede usar para observar todo tipo de relaciones. Por ejemplo, la regresión polinómica se puede usar para relaciones que son negativas dentro de un determinado intervalo de valores de características, pero positivas dentro de otras. También se puede usar cuando la etiqueta (valor y) no tiene límite superior teórico.

Diagram showing polynomial, log and logistic curves with plot points on the polynomial curve.

La desventaja principal de las curvas polinómicas es que a menudo se extrapolan de manera errónea. En otras palabras, si intentamos predecir valores mayores o menores que nuestros datos de entrenamiento, los polinomios pueden predecir valores extremos muy poco realistas. Otra desventaja es que las curvas polinómicas son fáciles de sobreajustar. Esto significa que el ruido en los datos puede cambiar la forma de la curva mucho más que los modelos más sencillos, como la regresión lineal simple.

Diagram showing an incorrect polynomial curve with plots.

¿Se pueden usar curvas con varias características?

Hemos visto cómo la regresión múltiple puede ajustarse a varias relaciones lineales al mismo tiempo. Sin embargo, no es necesario que se limite a las relaciones lineales. Se pueden usar curvas de todo tipo para estas relaciones cuando corresponda. Aunque se debe tener cuidado de no usar curvas, como polinomios, con varias características donde no son necesarias. Esto se debe a que las relaciones pueden acabar siendo muy complejas, lo que dificulta la comprensión de los modelos y la evaluación de si realizan predicciones sin sentido en el mundo real.