ForecastingJob Sınıf

AutoML Tahmin Görevi yapılandırması.

Devralma
azure.ai.ml.entities._job.automl.tabular.automl_tabular.AutoMLTabular
ForecastingJob

Oluşturucu

ForecastingJob(*, primary_metric: Optional[str] = None, forecasting_settings: Optional[azure.ai.ml.entities._job.automl.tabular.forecasting_settings.ForecastingSettings] = None, **kwargs)

Yöntemler

set_forecast_settings

Tahmin görevleri tarafından kullanılan parametreleri yönetin.

set_training

Eğitimle ilgili ayarları yapılandırma yöntemi.

Varsayılan değer False'tur. Open Neural Network Exchange (ONNX) ve Azure Machine Learning hakkında daha fazla bilgi için bu makaleye bakın., :type enable_onnx_compatible_models: bool, isteğe bağlı :p aram enable_dnn_training: Model seçimi sırasında DNN tabanlı modellerin dahil edilip edilmeyeceği. Varsayılan değer Yok'tur. Ancak, DNN NLP görevleri için varsayılan değer True, diğer tüm AutoML görevleri için ise False'tur. :type enable_dnn_training: bool, isteğe bağlı :p aram enable_model_explainability: Tüm AutoML eğitim yinelemelerinin sonunda en iyi AutoML modelinin açıklanmasının etkinleştirilip etkinleştirilmeyeceğini belirtin. Varsayılan değer Yok'tur. Daha fazla bilgi için bkz. Yorumlanabilirlik: otomatik makine öğrenmesinde model açıklamaları. :type enable_model_explainability: bool, isteğe bağlı :p aram enable_stack_ensemble: StackEnsemble yinelemesini etkinleştirme/devre dışı bırakma. Varsayılan değer Yok'tur. enable_onnx_compatible_models bayrağı ayarlanıyorsa StackEnsemble yinelemesi devre dışı bırakılır. Benzer şekilde, Timeseries görevleri için StackEnsemble yinelemesi, meta öğrenciyi sığdırmak için kullanılan küçük eğitim kümesi nedeniyle fazla uygunluk risklerini önlemek için varsayılan olarak devre dışı bırakılır. Topluluklar hakkında daha fazla bilgi için bkz. Grup yapılandırması. :type enable_stack_ensemble: bool, isteğe bağlı :p aram enable_vote_ensemble:VotingEnsemble yinelemesini etkinleştirme/devre dışı bırakma. Varsayılan değer True'dur. Topluluklar hakkında daha fazla bilgi için bkz. Grup yapılandırması. :type enable_vote_ensemble: bool, isteğe bağlı :p aram stack_ensemble_settings: StackEnsemble yineleme ayarları. :type stack_ensemble_settings: StackEnsembleSettings, isteğe bağlı :p aram ensemble_model_download_timeout: VotingEnsemble ve StackEnsemble model oluşturma sırasında, önceki alt çalıştırmalardan uydurılan birden çok model indirilir. Daha fazla zaman gerekiyorsa bu parametreyi 300 saniyeden daha yüksek bir değerle yapılandırın. :type ensemble_model_download_timeout: int, isteğe bağlı :p aram allowed_training_algorithms: Deneme aramak için model adlarının listesi. Belirtilmezse, görev için desteklenen tüm modeller tensorflow modellerinde blocked_training_algorithms belirtilen veya kullanım dışı bırakılan modellerden çıkarılır. :type allowed_training_algorithms: List[str], isteğe bağlı :p aram blocked_training_algorithms: Deneme için yoksayılabilir algoritmaların listesi. :type blocked_training_algorithms:List(str) veya Sınıflandırma görevi için List(azureml.train.automl.ClassificationModels), regresyon görevi için List(azure.ai.ml.automl.RegressionModels) veya tahmin görevi için List(azure.ai.ml.automl.ForecastingModels)

set_forecast_settings

Tahmin görevleri tarafından kullanılan parametreleri yönetin.

set_forecast_settings(*, time_column_name: Optional[str] = None, forecast_horizon: Optional[Union[str, int]] = None, time_series_id_column_names: Optional[Union[str, List[str]]] = None, target_lags: Optional[Union[str, int, List[int]]] = None, feature_lags: Optional[str] = None, target_rolling_window_size: Optional[Union[str, int]] = None, country_or_region_for_holidays: Optional[str] = None, use_stl: Optional[str] = None, seasonality: Optional[Union[str, int]] = None, short_series_handling_config: Optional[str] = None, frequency: Optional[str] = None, target_aggregate_function: Optional[str] = None, cv_step_size: Optional[int] = None) -> None

Parametreler

time_column_name
str
Gerekli

Saat sütununun adı. Bu parametre, zaman serisini oluşturmak ve sıklığını çıkarsamak için kullanılan giriş verilerinde tarih saat sütununu belirtmek için tahminde bulunurken gereklidir.

forecast_horizon
int veya str
Gerekli

Zaman serisi sıklığı birimleri cinsinden istenen maksimum tahmin ufku. Varsayılan değer 1’dir.

Birimler, eğitim verilerinizin zaman aralığına (örn. tahminde bulunanın tahmin etmesi gereken aylık, haftalık) bağlıdır. Görev türü tahmin edilirken bu parametre gereklidir. Tahmin parametrelerini ayarlama hakkında daha fazla bilgi için bkz. Zaman serisi tahmin modelini otomatik olarak eğitme.

time_series_id_column_names
str veya list(str)
Gerekli

Zaman aralıklarını gruplandırmak için kullanılan sütunların adları. Birden çok seri oluşturmak için kullanılabilir. Zaman serisi kimliği sütun adları tanımlanmamışsa veya belirtilen tanımlayıcı sütunları veri kümesindeki tüm serileri tanımmıyorsa, zaman serisi tanımlayıcıları veri kümeniz için otomatik olarak oluşturulur.

target_lags
int, <xref:str,> veya list(int)
Gerekli

Hedef sütundan geri alınacak geçmiş dönemlerin sayısı. Gecikmeler varsayılan olarak kapalıdır.

Tahmin yaparken, bu parametre verilerin sıklığına bağlı olarak hedef değerlerin gecikmesi için satır sayısını temsil eder. Bu, bir liste veya tek bir tamsayı olarak temsil edilir. Bağımsız değişkenler ile bağımlı değişken arasındaki ilişki varsayılan olarak eşleşmediğinde veya ilişkilendirilmediğinde gecikme kullanılmalıdır. Örneğin, bir ürünün talebini tahmin etmeye çalışırken, herhangi bir aydaki talep, 3 ay önceki belirli emtiaların fiyatına bağlı olabilir. Bu örnekte, modelin doğru ilişki üzerinde eğitim görebilmesi için hedefi (talebi) 3 ay gecikmeli olarak geçirmek isteyebilirsiniz. Daha fazla bilgi için bkz. Zaman serisi tahmin modelini otomatik olarak eğitme.

Hedef gecikmelerin ve sıralı pencere boyutunun otomatik olarak algılanmasıyla ilgili not. Lütfen sıralı pencere bölümünde ilgili yorumlara bakın. En uygun hedef gecikmesini ve sıralı pencere boyutunu algılamak için bir sonraki algoritmayı kullanırız.

  1. Geriye bakma özelliği seçimi için maksimum gecikme sırasını tahmin edin. Bizim örneğimizde bir sonraki tarih sıklığı ayrıntı düzeyine kadar olan dönem sayısıdır; örneğin sıklık günlükse bir hafta (7), hafta ise ay (4) olur. Bu değerlerin iki ile çarpılması, gecikme/hareketli pencerelerin mümkün olan en büyük değerleridir. Örneklerimizde sırasıyla 14 ve 8 maksimum gecikme sırasını dikkate alacaktır).

  2. Eğilim ve artık bileşenler ekleyerek mevsimselleştirilmiş bir seri oluşturun. Bu, sonraki adımda kullanılacaktır.

  3. (2) verilerinde PACF - Kısmi Otomatik Bağıntı İşlevi'ni tahmin edin ve noktaları arayın; burada otomatik bağıntı önemlidir; yani mutlak değeri daha fazladır ve %95'in önemine karşılık gelen 1,96/square_root(maksimum gecikme değeri).

  4. Tüm noktalar önemliyse, bunu güçlü mevsimsellik olarak değerlendiririz ve geriye dönüp bakma özellikleri oluşturmayız.

  5. PACF değerlerini baştan tararız ve ilk önemsiz otomatik bağıntıdan önceki değer gecikmeyi belirleyecektir. İlk önemli öğe (değer kendisiyle bağıntılı) ve ardından önemsiz bir öğe gelirse, gecikme 0 olur ve geçmişe bakma özelliklerini kullanmayız.

feature_lags
str veya None
Gerekli

'auto' veya None ile sayısal özellikler için gecikme oluşturma bayrağı.

target_rolling_window_size
int, str veya None
Gerekli

Hedef sütunun sıralı pencere ortalamasını oluşturmak için kullanılan geçmiş dönemlerin sayısı.

Tahmin yaparken, bu parametre tahmin edilen değerleri oluşturmak için kullanılacak n geçmiş dönemi , <= eğitim kümesi boyutunu temsil eder. Belirtilmezse , n tam eğitim kümesi boyutudur. Modeli eğitirken yalnızca belirli bir geçmiş miktarını göz önünde bulundurmak istediğinizde bu parametreyi belirtin. 'otomatik' olarak ayarlanırsa, sıralı pencere PACF'nin anlam eşiğinden daha fazla olduğu son değer olarak tahmin edilir. Ayrıntılar için lütfen target_lags bölüme bakın.

country_or_region_for_holidays
str veya None
Gerekli

Tatil özellikleri oluşturmak için kullanılan ülke/bölge. Bunlar ISO 3166 iki harfli ülke/bölge kodları olmalıdır, örneğin 'ABD' veya 'GB'.

use_stl
str veya None
Gerekli

Zaman serisi hedef sütununun STL Ayrıştırma'sını yapılandırın. use_stl üç değer alabilir: Yok (varsayılan) - ayrıştırma yok, 'sezon' - yalnızca sezon bileşeni ve season_trend oluştur - hem mevsim hem de eğilim bileşenlerini oluşturun.

seasonality
int, str veya None
Gerekli

Zaman serisi mevsimselliğini, seri sıklığının tamsayı katı olarak ayarlayın. Mevsimsellik 'otomatik' olarak ayarlanırsa çıkarım yapılır. Hiçbiri olarak ayarlanırsa, zaman serisi mevsimsellik dışı kabul edilir ve bu da mevsimsellik=1 ile eşdeğerdir.

short_series_handling_config
str veya None
Gerekli

AutoML'nin kısa zaman serisini nasıl işleyeceklerini tanımlayan parametre.

Olası değerler: 'auto' (varsayılan), 'pad', 'drop' ve None.

  • otomatik kısa seri, uzun seri yoksa doldurulur, aksi takdirde kısa seri bırakılır.
  • tuş takımı tüm kısa seriler doldurulacaktır.
  • tüm kısa seriler bırakılacaktır".
  • Hiçbiri kısa seri değiştirilmez. 'pad' olarak ayarlanırsa tablo, verilen zaman serisi kimliği için ortalama hedef değere eşit ortanca değere sahip hedef için regresörler ve rastgele değerler için sıfırlar ve boş değerlerle doldurulur. Ortanca değer sıfırdan büyük veya sıfıra eşitse, minimum doldurulmuş değer sıfıra kırpılır: Giriş:

Date

numeric_value

Dize

Hedef

2020-01-01

23

green

55

Minimum değer sayısının dört olduğunu varsayarsak çıkış:

Date

numeric_value

Dize

Hedef

2019-12-29

0

NA

55.1

2019-12-30

0

NA

55.6

2019-12-31

0

NA

54.5

2020-01-01

23

green

55

Not: short_series_handling_configuration ve eski short_series_handling iki parametremiz vardır. Her iki parametre de ayarlandığında, bunları aşağıdaki tabloda gösterildiği gibi eşitleriz (short_series_handling_configuration ve kısaltma için short_series_handling sırasıyla handling_configuration ve işleme olarak işaretlenir).

Işleme

handling_configuration

sonuçta elde edilen işleme

sonuç handling_configuration

Doğru

auto

Doğru

auto

Doğru

Pad

Doğru

auto

Doğru

drop

Doğru

auto

Doğru

Hiçbiri

Yanlış

Hiçbiri

Yanlış

auto

Yanlış

Hiçbiri

Yanlış

Pad

Yanlış

Hiçbiri

Yanlış

drop

Yanlış

Hiçbiri

Yanlış

Hiçbiri

Yanlış

Hiçbiri

frequency
str veya None
Gerekli

Tahmin sıklığı.

Tahmin yaparken, bu parametre tahminin istendiği dönemi (örneğin, günlük, haftalık, yıllık vb.) temsil eder. Tahmin sıklığı varsayılan olarak veri kümesi sıklığıdır. İsteğe bağlı olarak bunu veri kümesi sıklığından daha büyük (ancak daha küçük değil) olarak ayarlayabilirsiniz. Verileri toplayarak sonuçları tahmin sıklığında oluşturacağız. Örneğin, günlük veriler için sıklığı günlük, haftalık veya aylık olarak ayarlayabilirsiniz ancak saatlik olarak ayarlayamayabilirsiniz. Sıklığın pandas uzaklık diğer adı olması gerekir. Daha fazla bilgi için lütfen pandas belgelerine bakın: https://pandas.pydata.org/pandas-docs/stable/user_guide/timeseries.html#dateoffset-objects

target_aggregate_function
str veya None
Gerekli

Zaman serisi hedef sütununu kullanıcının belirtilen sıklığına uyacak şekilde toplamak için kullanılacak işlev. target_aggregation_function ayarlanmışsa ancak freq parametresi ayarlanmadıysa hata oluşur. Olası hedef toplama işlevleri şunlardır: "sum", "max", "min" ve "ortalama".

  • Hedef sütun değerleri belirtilen işleme göre toplanır. Genellikle toplam çoğu senaryo için uygundur.

  • Verilerinizdeki sayısal tahmin aracı sütunları toplam, ortalama, minimum değer ve maksimum değere göre toplanır. Sonuç olarak, otomatik ML toplama işlevi adıyla ekli yeni sütunlar oluşturur ve seçili toplama işlemini uygular.

  • Kategorik tahmin sütunları için veriler, penceredeki en belirgin kategori olan moda göre toplanır.

  • Tarih tahmincisi sütunları minimum değer, maksimum değer ve mod ile toplanır.

Frekans

target_aggregation_function

Veri düzenliliği düzeltme mekanizması

Hiçbiri (Varsayılan)

Hiçbiri (Varsayılan)

Toplama uygulanmaz. Geçerli sıklık belirlenemezse hata oluşur.

Bazı Değerler

Hiçbiri (Varsayılan)

Toplama uygulanmaz. Verilen frekans kılavuzuyla uyumlu veri noktası sayısı daha azsa bu noktalar %90 kaldırılır, aksi takdirde hata oluşur.

Hiçbiri (Varsayılan)

Toplama işlevi

Eksik sıklık parametresiyle ilgili hata oluştu.

Bazı Değerler

Toplama işlevi

providedaggregation işlevini kullanarak sıklık olarak toplama.

cv_step_size
int veya None
Gerekli

Bir CV katlama ile bir sonraki katlamanın origin_time arasındaki dönem sayısı. Örneğin, günlük veriler için n_step = 3 ise, her katlamanın çıkış süresi üç gün arayla olur.

set_training

Eğitimle ilgili ayarları yapılandırma yöntemi.

Varsayılan değer False'tur. Open Neural Network Exchange (ONNX) ve Azure Machine Learning hakkında daha fazla bilgi için bu makaleye bakın., :type enable_onnx_compatible_models: bool, isteğe bağlı :p aram enable_dnn_training: Model seçimi sırasında DNN tabanlı modellerin dahil edilip edilmeyeceği. Varsayılan değer Yok'tur. Ancak, DNN NLP görevleri için varsayılan değer True, diğer tüm AutoML görevleri için ise False'tur. :type enable_dnn_training: bool, isteğe bağlı :p aram enable_model_explainability: Tüm AutoML eğitim yinelemelerinin sonunda en iyi AutoML modelinin açıklanmasının etkinleştirilip etkinleştirilmeyeceğini belirtin. Varsayılan değer Yok'tur. Daha fazla bilgi için bkz. Yorumlanabilirlik: otomatik makine öğrenmesinde model açıklamaları. :type enable_model_explainability: bool, isteğe bağlı :p aram enable_stack_ensemble: StackEnsemble yinelemesini etkinleştirme/devre dışı bırakma. Varsayılan değer Yok'tur. enable_onnx_compatible_models bayrağı ayarlanıyorsa StackEnsemble yinelemesi devre dışı bırakılır. Benzer şekilde, Timeseries görevleri için StackEnsemble yinelemesi, meta öğrenciyi sığdırmak için kullanılan küçük eğitim kümesi nedeniyle fazla uygunluk risklerini önlemek için varsayılan olarak devre dışı bırakılır. Topluluklar hakkında daha fazla bilgi için bkz. Grup yapılandırması. :type enable_stack_ensemble: bool, isteğe bağlı :p aram enable_vote_ensemble:VotingEnsemble yinelemesini etkinleştirme/devre dışı bırakma. Varsayılan değer True'dur. Topluluklar hakkında daha fazla bilgi için bkz. Grup yapılandırması. :type enable_vote_ensemble: bool, isteğe bağlı :p aram stack_ensemble_settings: StackEnsemble yineleme ayarları. :type stack_ensemble_settings: StackEnsembleSettings, isteğe bağlı :p aram ensemble_model_download_timeout: VotingEnsemble ve StackEnsemble model oluşturma sırasında, önceki alt çalıştırmalardan uydurılan birden çok model indirilir. Daha fazla zaman gerekiyorsa bu parametreyi 300 saniyeden daha yüksek bir değerle yapılandırın. :type ensemble_model_download_timeout: int, isteğe bağlı :p aram allowed_training_algorithms: Deneme aramak için model adlarının listesi. Belirtilmezse, görev için desteklenen tüm modeller tensorflow modellerinde blocked_training_algorithms belirtilen veya kullanım dışı bırakılan modellerden çıkarılır. :type allowed_training_algorithms: List[str], isteğe bağlı :p aram blocked_training_algorithms: Deneme için yoksayılabilir algoritmaların listesi. :type blocked_training_algorithms:List(str) veya Sınıflandırma görevi için List(azureml.train.automl.ClassificationModels), regresyon görevi için List(azure.ai.ml.automl.RegressionModels) veya tahmin görevi için List(azure.ai.ml.automl.ForecastingModels)

set_training(*, enable_onnx_compatible_models: Optional[bool] = None, enable_dnn_training: Optional[bool] = None, enable_model_explainability: Optional[bool] = None, enable_stack_ensemble: Optional[bool] = None, enable_vote_ensemble: Optional[bool] = None, stack_ensemble_settings: Optional[azure.ai.ml.entities._job.automl.stack_ensemble_settings.StackEnsembleSettings] = None, ensemble_model_download_timeout: Optional[int] = None, allowed_training_algorithms: Optional[List[str]] = None, blocked_training_algorithms: Optional[List[str]] = None) -> None

Parametreler

enable_onnx_compatible_models
Gerekli

ONNX uyumlu modelleri zorunlu tutmanın etkinleştirilip etkinleştirilmeyileceği veya devre dışı bırakılıp bırakılmaymayacağı.

Öznitelikler

forecasting_settings

primary_metric

training