ForecastingSettings Klasse
Vorhersageeinstellungen für einen AutoML-Auftrag.
- Vererbung
-
azure.ai.ml.entities._mixins.RestTranslatableMixinForecastingSettings
Konstruktor
ForecastingSettings(*, country_or_region_for_holidays: str | None = None, cv_step_size: int | None = None, forecast_horizon: str | int | None = None, target_lags: str | int | List[int] | None = None, target_rolling_window_size: str | int | None = None, frequency: str | None = None, feature_lags: str | None = None, seasonality: str | int | None = None, use_stl: str | None = None, short_series_handling_config: str | None = None, target_aggregate_function: str | None = None, time_column_name: str | None = None, time_series_id_column_names: str | List[str] | None = None, features_unknown_at_forecast_time: str | List[str] | None = None)
Parameter
Name | Beschreibung |
---|---|
country_or_region_for_holidays
Erforderlich
|
Das Land/die Region, das bzw. die zum Generieren von Feiertagsfunktionen verwendet wird. Dabei sollte es sich um den aus zwei Buchstaben bestehenden Länder-/Regionscode nach ISO 3166 handeln (z. B. „US“ oder „GB“). |
cv_step_size
Erforderlich
|
Die Anzahl von Zeiträumen zwischen der „origin_time“ eines Kreuzvalidierungsfolds und dem nächsten Fold. Wenn für tägliche Daten beispielsweise n_step = 3 ist, liegt die Ursprungszeit für jeden Fold drei Tage auseinander. |
forecast_horizon
Erforderlich
|
Der gewünschte maximale Prognosehorizont in Einheiten der Zeitreihenhäufigkeit. Der Standardwert ist 1. Die Einheiten basieren auf dem Zeitintervall Ihrer Trainingsdaten (z. B. monatlich oder wöchentlich), die vorhergesagt werden sollen. Bei Vorhersageaufgaben ist dieser Parameter erforderlich. Weitere Informationen zum Festlegen von Vorhersageparametern finden Sie unter Automatisches Trainieren eines Modells für die Zeitreihenprognose. |
target_lags
Erforderlich
|
Die Anzahl vergangener Zeiträume, um die die Zielspalte verzögert werden soll. Standardmäßig sind die Verzögerungen deaktiviert. Bei Vorhersagen stellt dieser Parameter die Anzahl von Zeilen dar, um die die Zielwerte basierend auf der Häufigkeit der Daten verzögert werden sollen. Dies wird als eine Liste oder als einzelner Integer dargestellt. Die Verzögerung sollte verwendet werden, wenn die Beziehung zwischen den unabhängigen Variablen und der abhängigen Variablen standardmäßig nicht übereinstimmt oder korreliert. Wenn Sie beispielsweise versuchen, die Nachfrage nach einem Produkt vorherzusagen, hängt die Nachfrage in einem Monat möglicherweise vom Preis für bestimmte Produkte vor 3 Monaten ab. In diesem Beispiel möchten Sie möglicherweise den Zielwert (Nachfrage) um 3 Monate negativ verzögern, sodass das Modell mit der richtigen Beziehung trainiert wird. Weitere Informationen finden Sie unter Automatisches Trainieren eines Modells für die Zeitreihenprognose. Hinweis zur automatischen Erkennung von Zielverzögerungen und der Größe des rollierenden Fensters. Weitere Informationen finden Sie in den entsprechenden Kommentaren im Abschnitt zum rollierenden Fenster. Wir verwenden den nächsten Algorithmus, um die optimale Zielverzögerung und Größe des rollierenden Fensters zu erkennen.
|
target_rolling_window_size
Erforderlich
|
Die Anzahl vergangener Zeiträume, die zum Erstellen eines Durchschnittswerts für das rollierende Fenster der Zielspalte verwendet werden. Bei Vorhersagen stellt dieser Parameter n historische Zeiträume zum Generieren von vorhergesagten Werten dar, <= Größe des Trainingssatzes. Wenn nicht angegeben, ist n die vollständige Trainingsmenge. Geben Sie diesen Parameter an, wenn Sie beim Trainieren des Modells nur eine bestimmte Menge des Verlaufs beachten möchten. Wenn „auto“ festgelegt ist, wird das rollierende Fenster geschätzt und der letzte Wert verwendet, bei dem der PACF-Wert größer als der Signifikanzschwellenwert ist. Weitere Informationen finden Sie im Abschnitt zu „target_lags“. |
frequency
Erforderlich
|
Die Vorhersagehäufigkeit. Bei Vorhersagen stellt dieser Parameter den Zeitraum dar, für den die Vorhersage erfolgen soll, z. B. täglich, wöchentlich, jährlich usw. Die Vorhersagehäufigkeit ist standardmäßig auf die Dataset-Häufigkeit festgelegt. Sie können sie optional auf einen größeren (aber nicht auf einen kleineren) Wert als die Dataset-Häufigkeit festlegen. Wir aggregieren die Daten und generieren die Ergebnisse mit der Vorhersagehäufigkeit. Für tägliche Daten können Sie die Häufigkeit beispielsweise auf täglich, wöchentlich oder monatlich festlegen, aber nicht auf stündlich. Die Häufigkeit muss ein Pandas-Offset-Alias sein. Weitere Informationen finden Sie in der Pandas-Dokumentation: https://pandas.pydata.org/pandas-docs/stable/user_guide/timeseries.html#dateoffset-objects |
feature_lags
Erforderlich
|
Flag zum Generieren von Verzögerungen für numerische Features mit „auto“ oder „None“. |
seasonality
Erforderlich
|
Festlegen der Saisonalität von Zeitreihen als ganzzahliges Vielfaches der Zeitreihenhäufigkeit. Wenn „auto“ festgelegt ist, wird die Saisonalität abgeleitet. Wenn „None“ festgelegt ist, wird davon ausgegangen, dass die Zeitreihe nicht saisonal ist, was „seasonality=1“ entspricht. |
use_stl
Erforderlich
|
Konfigurieren Sie die STL-Aufschlüsselung der Zeitreihen-Zielspalte. Für „use_stl“ sind drei Werte möglich: „None“ (Standardwert, keine STL-Aufschlüsselung), „season“ (nur die Saisonkomponente generieren) und „season_trend“ (sowohl Saison- als auch Trendkomponenten generieren). |
short_series_handling_config
Erforderlich
|
Der Parameter definiert, wie kurze Zeitreihen beim automatisierten maschinellen Lernen verarbeitet werden. Mögliche Werte: „auto“ (Standardwert), „pad“, „drop“ und „None“.
Date numeric_value string Ziel 2020-01-01 23 green 55 Ausgabe, wenn die Mindestanzahl von Werten 4 ist: Date numeric_value string Ziel 2019-12-29 0 Nicht verfügbar 55.1 2019-12-30 0 Nicht verfügbar 55.6 2019-12-31 0 Nicht verfügbar 54.5 2020-01-01 23 green 55 Hinweis: Wir haben zwei Parameter, short_series_handling_configuration und Legacy-short_series_handling. Wenn beide Parameter festgelegt sind, werden sie wie in der folgenden Tabelle dargestellt synchronisiert (short_series_handling_configuration und short_series_handling sind aus Gründen der Einfachheit als handling_configuration bzw. handling angegeben). Handhabung Behandeln der Konfiguration resultierende Behandlung resultierende handlingconfiguration True auto True auto True Pad True auto True drop True auto True Keine False Keine False auto False Keine False Pad False Keine False drop False Keine False Keine False Keine |
target_aggregate_function
Erforderlich
|
Die Funktion zum Aggregieren der Zeitreihen-Zielspalte, um sie an eine benutzerdefinierte Häufigkeit anzupassen. Wenn die target_aggregation_function festgelegt ist, aber nicht der freq-Parameter, wird ein Fehler ausgelöst. Die möglichen Zielaggregationsfunktionen sind „sum“, „max“, „min“ und „mean“.
Freq target_aggregation_function Data RegularityFixing-Mechanismus Keine (Standard) Keine (Standard) Die Aggregation wird nicht angewendet. Wenn die Gültigkeitsfrequenz nicht bestimmt werden kann, wird der Fehler ausgelöst. Einige Werte Keine (Standard) Die Aggregation wird nicht angewendet. Wenn die Anzahl der Datenpunkte, die mit dem angegebenen Frequenzraster kompatibel sind, kleiner ist, werden diese Punkte um 90 % entfernt, andernfalls wird der Fehler ausgelöst. Keine (Standard) Aggregationsfunktion Der Fehler über den Parameter "Fehlende Frequenz" wird ausgelöst. Einige Werte Aggregationsfunktion Aggregieren sie mit der bereitgestellten Aggregationsfunktion zur Häufigkeit. |
time_column_name
Erforderlich
|
Der Name der Zeitspalte. Dieser Parameter ist bei Vorhersageaufgaben erforderlich, um die Spalte „datetime“ in den Eingabedaten anzugeben, die zum Erstellen der Zeitreihe sowie zum Ableiten des Intervalls verwendet wird. |
time_series_id_column_names
Erforderlich
|
Die Namen von Spalten, die zum Gruppieren einer Zeitreihe verwendet werden. Dieser Parameter kann zum Erstellen mehrerer Reihen verwendet werden. Wenn die Namen der Spalten mit der Zeitreihen-ID nicht definiert sind oder durch die angegebenen Bezeichnerspalten nicht alle Reihen im Dataset identifiziert werden, werden die Zeitreihenbezeichner automatisch für Ihr Dataset erstellt. |
features_unknown_at_forecast_time
Erforderlich
|
Die Featurespalten, die für das Training verfügbar sind, aber zum Zeitpunkt der Vorhersage/Rückschlüsse unbekannt sind. Wenn features_unknown_at_forecast_time auf eine leere Liste festgelegt ist, wird davon ausgegangen, dass alle Featurespalten im Dataset zum Rückschlusszeitpunkt bekannt sind. Wenn dieser Parameter nicht festgelegt ist, wird die Unterstützung für zukünftige Features nicht aktiviert. |
Keyword-Only Parameter
Name | Beschreibung |
---|---|
country_or_region_for_holidays
Erforderlich
|
|
cv_step_size
Erforderlich
|
|
forecast_horizon
Erforderlich
|
|
target_lags
Erforderlich
|
|
target_rolling_window_size
Erforderlich
|
|
frequency
Erforderlich
|
|
feature_lags
Erforderlich
|
|
seasonality
Erforderlich
|
|
use_stl
Erforderlich
|
|
short_series_handling_config
Erforderlich
|
|
target_aggregate_function
Erforderlich
|
|
time_column_name
Erforderlich
|
|
time_series_id_column_names
Erforderlich
|
|
features_unknown_at_forecast_time
Erforderlich
|
|
Azure SDK for Python
Feedback
https://aka.ms/ContentUserFeedback.
Bald verfügbar: Im Laufe des Jahres 2024 werden wir GitHub-Issues stufenweise als Feedbackmechanismus für Inhalte abbauen und durch ein neues Feedbacksystem ersetzen. Weitere Informationen finden Sie unterFeedback senden und anzeigen für