ForecastingSettings Sınıf

AutoML İşi için tahmin ayarları.

Devralma
azure.ai.ml.entities._mixins.RestTranslatableMixin
ForecastingSettings

Oluşturucu

ForecastingSettings(*, country_or_region_for_holidays: str | None = None, cv_step_size: int | None = None, forecast_horizon: str | int | None = None, target_lags: str | int | List[int] | None = None, target_rolling_window_size: str | int | None = None, frequency: str | None = None, feature_lags: str | None = None, seasonality: str | int | None = None, use_stl: str | None = None, short_series_handling_config: str | None = None, target_aggregate_function: str | None = None, time_column_name: str | None = None, time_series_id_column_names: str | List[str] | None = None, features_unknown_at_forecast_time: str | List[str] | None = None)

Parametreler

Name Description
country_or_region_for_holidays
Gerekli

Tatil özellikleri oluşturmak için kullanılan ülke/bölge. Bunlar ISO 3166 iki harfli ülke/bölge kodu olmalıdır, örneğin "ABD" veya "GB".

cv_step_size
Gerekli

Bir CV katlama ile bir sonraki katlamanın origin_time arasındaki dönem sayısı. Örneğin, günlük veriler için n_step = 3 ise, her katlamanın çıkış süresi üç gün arayla olur.

forecast_horizon
Gerekli

Zaman serisi sıklığı birimleri cinsinden istenen maksimum tahmin ufku. Varsayılan değer 1’dir.

Birimler, eğitim verilerinizin zaman aralığına (örn. tahminde bulunanın tahmin etmesi gereken aylık, haftalık) bağlıdır. Görev türü tahmin edilirken bu parametre gereklidir. Tahmin parametrelerini ayarlama hakkında daha fazla bilgi için bkz. Zaman serisi tahmin modelini otomatik olarak eğitme.

target_lags
Gerekli

Hedef sütundan geri alınacak geçmiş dönemlerin sayısı. Gecikmeler varsayılan olarak kapalıdır.

Tahmin yaparken, bu parametre verilerin sıklığına bağlı olarak hedef değerlerin gecikmesi için satır sayısını temsil eder. Bu, bir liste veya tek bir tamsayı olarak temsil edilir. Bağımsız değişkenler ile bağımlı değişken arasındaki ilişki varsayılan olarak eşleşmediğinde veya ilişkilendirilmediğinde gecikme kullanılmalıdır. Örneğin, bir ürünün talebini tahmin etmeye çalışırken, herhangi bir aydaki talep, 3 ay önceki belirli emtiaların fiyatına bağlı olabilir. Bu örnekte, modelin doğru ilişki üzerinde eğitim görebilmesi için hedefi (talebi) 3 ay gecikmeli olarak geçirmek isteyebilirsiniz. Daha fazla bilgi için bkz. Zaman serisi tahmin modelini otomatik olarak eğitme.

Hedef gecikmelerin ve sıralı pencere boyutunun otomatik olarak algılanmasıyla ilgili not. Lütfen sıralı pencere bölümünde ilgili yorumlara bakın. En uygun hedef gecikmesini ve sıralı pencere boyutunu algılamak için bir sonraki algoritmayı kullanırız.

  1. Geriye bakma özelliği seçimi için maksimum gecikme sırasını tahmin edin. Bizim örneğimizde bir sonraki tarih sıklığı ayrıntı düzeyine kadar olan dönem sayısıdır; örneğin sıklık günlükse bir hafta (7), hafta ise ay (4) olur. Bu değerlerin iki ile çarpılması, gecikme/hareketli pencerelerin mümkün olan en büyük değerleridir. Örneklerimizde sırasıyla 14 ve 8 maksimum gecikme sırasını dikkate alacaktır).

  2. Eğilim ve artık bileşenler ekleyerek mevsimselleştirilmiş bir seri oluşturun. Bu, sonraki adımda kullanılacaktır.

  3. (2) verilerinde PACF - Kısmi Otomatik Bağıntı İşlevi'ni tahmin edin ve noktaları arayın; burada otomatik bağıntı önemlidir; yani mutlak değeri daha fazladır ve %95'in önemine karşılık gelen 1,96/square_root(maksimum gecikme değeri).

  4. Tüm noktalar önemliyse, bunu güçlü mevsimsellik olarak değerlendiririz ve geriye dönüp bakma özellikleri oluşturmayız.

  5. PACF değerlerini baştan tararız ve ilk önemsiz otomatik bağıntıdan önceki değer gecikmeyi belirleyecektir. İlk önemli öğe (değer kendisiyle bağıntılı) ve ardından önemsiz bir öğe gelirse, gecikme 0 olur ve geçmişe bakma özelliklerini kullanmayız.

target_rolling_window_size
Gerekli

Hedef sütunun sıralı pencere ortalamasını oluşturmak için kullanılan geçmiş dönemlerin sayısı.

Tahmin yaparken, bu parametre tahmin edilen değerleri oluşturmak için kullanılacak n geçmiş dönemi , <= eğitim kümesi boyutunu temsil eder. Belirtilmezse , n tam eğitim kümesi boyutudur. Modeli eğitirken yalnızca belirli bir geçmiş miktarını göz önünde bulundurmak istediğinizde bu parametreyi belirtin. 'otomatik' olarak ayarlanırsa, sıralı pencere PACF'nin anlam eşiğinden daha fazla olduğu son değer olarak tahmin edilir. Ayrıntılar için lütfen target_lags bölüme bakın.

frequency
Gerekli

Tahmin sıklığı.

Tahmin yaparken, bu parametre tahminin istendiği dönemi (örneğin, günlük, haftalık, yıllık vb.) temsil eder. Tahmin sıklığı varsayılan olarak veri kümesi sıklığıdır. İsteğe bağlı olarak bunu veri kümesi sıklığından daha büyük (ancak daha küçük değil) olarak ayarlayabilirsiniz. Verileri toplayarak sonuçları tahmin sıklığında oluşturacağız. Örneğin, günlük veriler için sıklığı günlük, haftalık veya aylık olarak ayarlayabilirsiniz ancak saatlik olarak ayarlayamayabilirsiniz. Sıklığın pandas uzaklık diğer adı olması gerekir. Daha fazla bilgi için lütfen pandas belgelerine bakın: https://pandas.pydata.org/pandas-docs/stable/user_guide/timeseries.html#dateoffset-objects

feature_lags
Gerekli

'auto' veya None ile sayısal özellikler için gecikme oluşturma bayrağı.

seasonality
Gerekli

Zaman serisi mevsimselliğini, seri sıklığının tamsayı katı olarak ayarlayın. Mevsimsellik 'otomatik' olarak ayarlanırsa, çıkarsanır. Hiçbiri olarak ayarlanırsa, zaman serisi mevsimsellik dışı kabul edilir ve bu da mevsimsellik=1 ile eşdeğerdir.

use_stl
Gerekli

Zaman serisi hedef sütununun STL Ayrıştırma'sını yapılandırın. use_stl üç değer alabilir: Yok (varsayılan) - ayrıştırma yok, 'sezon' - yalnızca sezon bileşeni ve season_trend oluştur - hem mevsim hem de eğilim bileşenlerini oluşturun.

short_series_handling_config
Gerekli

AutoML'nin kısa zaman serisini nasıl işleyeceklerini tanımlayan parametre.

Olası değerler: 'auto' (varsayılan), 'pad', 'drop' ve None.

  • otomatik kısa seri, uzun seri yoksa doldurulur, aksi takdirde kısa seri bırakılır.
  • tuş takımı tüm kısa seriler doldurulacaktır.
  • tüm kısa seriler bırakılacaktır".
  • Hiçbiri kısa seri değiştirilmez. 'pad' olarak ayarlanırsa tablo, verilen zaman serisi kimliği için ortalama hedef değere eşit ortanca değere sahip hedef için regresörler ve rastgele değerler için sıfırlar ve boş değerlerle doldurulur. Ortanca değer sıfırdan büyük veya sıfıra eşitse, minimum doldurulmuş değer sıfıra kırpılır. Giriş:

Date

numeric_value

Dize

Hedef

2020-01-01

23

green

55

Minimum değer sayısının dört olduğunu varsayarsak çıkış:

Date

numeric_value

Dize

Hedef

2019-12-29

0

NA

55.1

2019-12-30

0

NA

55.6

2019-12-31

0

NA

54.5

2020-01-01

23

green

55

Not: short_series_handling_configuration ve eski short_series_handling iki parametremiz vardır. Her iki parametre de ayarlandığında, bunları aşağıdaki tabloda gösterildiği gibi eşitleriz (short_series_handling_configuration ve kısaltma için short_series_handling sırasıyla handling_configuration ve işleme olarak işaretlenir).

Işleme

yapılandırmayı işleme

sonuçta elde edilen işleme

sonuçta elde edilen işleme yapılandırması

Doğru

auto

Doğru

auto

Doğru

Pad

Doğru

auto

Doğru

drop

Doğru

auto

Doğru

Hiçbiri

Yanlış

Hiçbiri

Yanlış

auto

Yanlış

Hiçbiri

Yanlış

Pad

Yanlış

Hiçbiri

Yanlış

drop

Yanlış

Hiçbiri

Yanlış

Hiçbiri

Yanlış

Hiçbiri

target_aggregate_function
Gerekli
str

Zaman serisi hedef sütununu kullanıcının belirtilen sıklığına uyacak şekilde toplamak için kullanılacak işlev. target_aggregation_function ayarlanmışsa ancak freq parametresi ayarlanmadıysa hata oluşur. Olası hedef toplama işlevleri şunlardır: "sum", "max", "min" ve "mean".

  • Hedef sütun değerleri, belirtilen işleme göre toplanır. Genellikle toplam çoğu senaryo için uygundur.

  • Verilerinizdeki sayısal tahmin aracı sütunları toplam, ortalama, minimum değer ve maksimum değere göre toplanır. Sonuç olarak, otomatik ML toplama işlevi adıyla ekli yeni sütunlar oluşturur ve seçili toplama işlemini uygular.

  • Kategorik tahmin sütunları için veriler, penceredeki en belirgin kategori olan moda göre toplanır.

  • Tarih tahmincisi sütunları minimum değer, en büyük değer ve mod tarafından toplanır.

Frekans

target_aggregation_function

Veri düzenliliği düzeltme mekanizması

Hiçbiri (Varsayılan)

Hiçbiri (Varsayılan)

Toplama uygulanmaz. Geçerlifrekans belirlenemezse hata oluşur.

Bazı Değerler

Hiçbiri (Varsayılan)

Toplama uygulanmaz. Verilen sıklık kılavuzları ile uyumlu olan veri noktalarının sayısı daha azsa bu noktaların %90'ı kaldırılır, aksi takdirde hata oluşur.

Hiçbiri (Varsayılan)

Toplama işlevi

Missingfrequency parametresiyle ilgili hata oluştu.

Bazı Değerler

Toplama işlevi

Toplamadan sıklık düzeyine toplama işlevini kullanarak toplama.

time_column_name
Gerekli

Saat sütununun adı. Bu parametre, zaman serisini oluşturmak ve sıklığını çıkarsamak için kullanılan giriş verilerinde tarih saat sütununu belirtmek için tahminde bulunurken gereklidir.

time_series_id_column_names
Gerekli

Zaman zamanlarını gruplandırmak için kullanılan sütunların adları. Birden çok seri oluşturmak için kullanılabilir. Zaman serisi kimliği sütun adları tanımlanmamışsa veya belirtilen tanımlayıcı sütunları veri kümesindeki tüm serileri tanımlamazsa, zaman serisi tanımlayıcıları veri kümeniz için otomatik olarak oluşturulur.

features_unknown_at_forecast_time
Gerekli

Eğitim için kullanılabilen ancak tahmin/çıkarım sırasında bilinmeyen özellik sütunları. features_unknown_at_forecast_time boş bir listeye ayarlanırsa, veri kümesindeki tüm özellik sütunlarının çıkarım zamanında bilindiği varsayılır. Bu parametre ayarlanmadıysa gelecekteki özellikler için destek etkinleştirilmez.

Yalnızca Anahtar Sözcük Parametreleri

Name Description
country_or_region_for_holidays
Gerekli
cv_step_size
Gerekli
forecast_horizon
Gerekli
target_lags
Gerekli
target_rolling_window_size
Gerekli
frequency
Gerekli
feature_lags
Gerekli
seasonality
Gerekli
use_stl
Gerekli
short_series_handling_config
Gerekli
target_aggregate_function
Gerekli
time_column_name
Gerekli
time_series_id_column_names
Gerekli
features_unknown_at_forecast_time
Gerekli