Delen via


series_fit_poly()

Hiermee past u een polynomiale regressie toe van een onafhankelijke variabele (x_series) op een afhankelijke variabele (y_series). Deze functie maakt gebruik van een tabel met meerdere reeksen (dynamische numerieke matrices) en genereert de meest geschikte high-order polynomiale voor elke reeks met behulp van polynomiale regressie.

Tip

  • Gebruik de eenvoudigere functie series_fit_line() voor lineaire regressie van een gelijkmatig gespendeerde reeks, zoals gemaakt door de operator make-series. Zie voorbeeld 2.
  • Als x_series wordt opgegeven en de regressie voor een hoge graad wordt uitgevoerd, kunt u overwegen om te normaliseren naar het bereik van [0-1]. Zie voorbeeld 3.
  • Als x_series van het datum/tijd-type is, moet deze worden geconverteerd naar een dubbele waarde en genormaliseerd. Zie voorbeeld 3.
  • Zie series_fit_poly_fl() voor referentie-implementatie van polynomiale regressie met behulp van inline Python.

Syntax

T | extend series_fit_poly(y_series [,x_series,graad ])

Meer informatie over syntaxisconventies.

Parameters

Naam Type Vereist Beschrijving
y_series dynamic ✔️ Een matrix met numerieke waarden die de afhankelijke variabele bevat.
x_series dynamic Een matrix met numerieke waarden die de onafhankelijke variabele bevat. Alleen vereist voor ongelijk verdeelde reeksen. Als dit niet wordt opgegeven, wordt deze ingesteld op een standaardwaarde van [1, 2, ..., lengte(y_series)].
Mate De vereiste volgorde van de polynoom om te passen. Bijvoorbeeld 1 voor lineaire regressie, 2 voor kwadratische regressie, enzovoort. De standaardwaarde is 1, wat lineaire regressie aangeeft.

Retouren

De series_fit_poly() functie retourneert de volgende kolommen:

  • rsquare: r-square is een standaardmaat voor de kwaliteit van de pasvorm. De waarde is een getal in het bereik [0-1], waarbij 1 - de best mogelijke pasvorm is en 0 betekent dat de gegevens ongeordeerd zijn en niet op een lijn passen.
  • coefficients: Numerieke matrix met de coëfficiënten van de best passende polynoom met de opgegeven graad, geordend van de hoogste machtscoëfficiënt naar de laagste.
  • variance: Variantie van de afhankelijke variabele (y_series).
  • rvariance: Resterende variantie die de variantie is tussen de invoergegevenswaarden en de geschatte waarden.
  • poly_fit: Numerieke matrix met een reeks waarden van de best passende polynoom. De reekslengte is gelijk aan de lengte van de afhankelijke variabele (y_series). De waarde wordt gebruikt voor het in kaart brengen van grafieken.

Voorbeelden

Voorbeeld 1

Een vijfde orde polynoom met ruis op x & y assen:

range x from 1 to 200 step 1
| project x = rand()*5 - 2.3
| extend y = pow(x, 5)-8*pow(x, 3)+10*x+6
| extend y = y + (rand() - 0.5)*0.5*y
| summarize x=make_list(x), y=make_list(y)
| extend series_fit_poly(y, x, 5)
| project-rename fy=series_fit_poly_y_poly_fit, coeff=series_fit_poly_y_coefficients
|fork (project x, y, fy) (project-away x, y, fy)
| render linechart 

Grafiek met een polynomiale vijfde orde die past bij een reeks met ruis.

Coëfficiënten van de vijfde orde polynomiaal passen op een reeks met ruis.

Voorbeeld 2

Controleer series_fit_poly of met degree=1 overeenkomt series_fit_linemet :

demo_series1
| extend series_fit_line(y)
| extend series_fit_poly(y)
| project-rename y_line = series_fit_line_y_line_fit, y_poly = series_fit_poly_y_poly_fit
| fork (project x, y, y_line, y_poly) (project-away id, x, y, y_line, y_poly) 
| render linechart with(xcolumn=x, ycolumns=y, y_line, y_poly)

Grafiek met lineaire regressie.

Coëfficiënten van lineaire regressie.

Voorbeeld 3

Onregelmatige (ongelijkmatig verdeelde) tijdreeksen:

//
//  x-axis must be normalized to the range [0-1] if either degree is relatively big (>= 5) or original x range is big.
//  so if x is a time axis it must be normalized as conversion of timestamp to long generate huge numbers (number of 100 nano-sec ticks from 1/1/1970)
//
//  Normalization: x_norm = (x - min(x))/(max(x) - min(x))
//
irregular_ts
| extend series_stats(series_add(TimeStamp, 0))                                                                 //  extract min/max of time axis as doubles
| extend x = series_divide(series_subtract(TimeStamp, series_stats__min), series_stats__max-series_stats__min)  // normalize time axis to [0-1] range
| extend series_fit_poly(num, x, 8)
| project-rename fnum=series_fit_poly_num_poly_fit
| render timechart with(ycolumns=num, fnum)

Grafiek met polynomiale geschiktheid van de achtste orde voor een onregelmatige tijdreeks.