Polynomická regrese

Dokončeno

Zatím jsme se podívali pouze na lineární regresní modely; modely, které lze modelovat jako rovné čáry. Regresní modely ale můžou pracovat s prakticky jakýmkoli jiným druhem vztahu.

Co je polynomická regrese?

Polynomické regresní modely relace jako konkrétní typ křivky. Polynomy jsou řada křivek, od jednoduchých až po složité tvary. Čím více parametrů v rovnici (modelu), tím složitější může být křivka.

Například polynom se dvěma parametry je jednoduše přímka:

y = průsečík + B1*x

Diagram showing a two-parameter polynomial regression graph.

Polynom se třemi parametry má v něm jeden ohyb:

y = průsečík + B1*x + B2 * x2

Diagram showing a three-parameter polynomial regression graph.

A polynom čtyř parametrů může mít dva ohyby:

y = průsečík + B1*x + B2 * x2 + B3 * x3

Diagram showing a four-parameter polynomial regression graph.

Polynom a jiné křivky

Existuje mnoho druhů křivek, jako jsou křivky protokolů a logistické (tvarované) křivky, z nichž všechny lze použít s regresí.

Diagram showing polynomial, log and logistic curves.

Hlavní výhodou polynomické regrese je, že ji můžete použít k zobrazení nejrůznějších relací. Například můžete použít polynomické regrese pro relace, které jsou záporné v určitém rozsahu hodnot funkcí, ale pozitivní v jiných. Můžete ho také použít tam, kde popisek (hodnota y) nemá žádný teoreticky horní limit.

Diagram showing polynomial, log and logistic curves with plot points on the polynomial curve.

Hlavní nevýhodou polynomálních křivek je, že často extrapolují špatně. Jinými slovy, pokud se pokusíme předpovědět hodnoty, které jsou větší nebo menší než naše trénovací data, polynomické hodnoty můžou předpovědět nereálně extrémní hodnoty. Další nevýhodou je, že polynomické křivky se snadno převléknou. To znamená, že šum v datech může změnit tvar křivky mnohem více než jednodušší modely, jako je jednoduchá lineární regrese.

Diagram showing an incorrect polynomial curve with plots.

Dají se křivky používat s více funkcemi?

Viděli jsme, jak se může více regrese ve stejnou dobu přizpůsobit několika lineárním relacím. Není však nutné, aby tyto vztahy byly omezeny na lineární relace. Křivky všech druhů lze pro tyto relace použít tam, kde je to vhodné. I když byste se měli postarat o to, abyste nepoužívali křivky, jako jsou polynomy s více funkcemi, které nejsou nezbytné. Je to proto, že relace můžou skončit velmi složité, což ztěžuje pochopení modelů a vyhodnocení, jestli budou provádět předpovědi, které nemají smysl z reálného hlediska.