ForecastingJob Sınıf
AutoML Tahmin Görevi yapılandırması.
- Devralma
-
azure.ai.ml.entities._job.automl.tabular.automl_tabular.AutoMLTabularForecastingJob
Oluşturucu
ForecastingJob(*, primary_metric: Optional[str] = None, forecasting_settings: Optional[azure.ai.ml.entities._job.automl.tabular.forecasting_settings.ForecastingSettings] = None, **kwargs)
Yöntemler
set_forecast_settings |
Tahmin görevleri tarafından kullanılan parametreleri yönetin. |
set_training |
Eğitimle ilgili ayarları yapılandırma yöntemi. Varsayılan değer False'tur. Open Neural Network Exchange (ONNX) ve Azure Machine Learning hakkında daha fazla bilgi için bu makaleye bakın., :type enable_onnx_compatible_models: bool, isteğe bağlı :p aram enable_dnn_training: Model seçimi sırasında DNN tabanlı modellerin dahil edilip edilmeyeceği. Varsayılan değer Yok'tur.
Ancak, DNN NLP görevleri için varsayılan değer True, diğer tüm AutoML görevleri için ise False'tur.
:type enable_dnn_training: bool, isteğe bağlı :p aram enable_model_explainability: Tüm AutoML eğitim yinelemelerinin sonunda en iyi AutoML modelinin açıklanmasının etkinleştirilip etkinleştirilmeyeceğini belirtin. Varsayılan değer Yok'tur. Daha fazla bilgi için bkz. Yorumlanabilirlik: otomatik makine öğrenmesinde model açıklamaları.
:type enable_model_explainability: bool, isteğe bağlı :p aram enable_stack_ensemble: StackEnsemble yinelemesini etkinleştirme/devre dışı bırakma. Varsayılan değer Yok'tur.
enable_onnx_compatible_models bayrağı ayarlanıyorsa StackEnsemble yinelemesi devre dışı bırakılır.
Benzer şekilde, Timeseries görevleri için StackEnsemble yinelemesi, meta öğrenciyi sığdırmak için kullanılan küçük eğitim kümesi nedeniyle fazla uygunluk risklerini önlemek için varsayılan olarak devre dışı bırakılır.
Topluluklar hakkında daha fazla bilgi için bkz. Grup yapılandırması.
:type enable_stack_ensemble: bool, isteğe bağlı :p aram enable_vote_ensemble:VotingEnsemble yinelemesini etkinleştirme/devre dışı bırakma. Varsayılan değer True'dur.
Topluluklar hakkında daha fazla bilgi için bkz. Grup yapılandırması.
:type enable_vote_ensemble: bool, isteğe bağlı :p aram stack_ensemble_settings: StackEnsemble yineleme ayarları.
:type stack_ensemble_settings: StackEnsembleSettings, isteğe bağlı :p aram ensemble_model_download_timeout: VotingEnsemble ve StackEnsemble model oluşturma sırasında, önceki alt çalıştırmalardan uydurılan birden çok model indirilir. Daha fazla zaman gerekiyorsa bu parametreyi 300 saniyeden daha yüksek bir değerle yapılandırın.
:type ensemble_model_download_timeout: int, isteğe bağlı :p aram allowed_training_algorithms: Deneme aramak için model adlarının listesi. Belirtilmezse, görev için desteklenen tüm modeller tensorflow modellerinde |
set_forecast_settings
Tahmin görevleri tarafından kullanılan parametreleri yönetin.
set_forecast_settings(*, time_column_name: Optional[str] = None, forecast_horizon: Optional[Union[str, int]] = None, time_series_id_column_names: Optional[Union[str, List[str]]] = None, target_lags: Optional[Union[str, int, List[int]]] = None, feature_lags: Optional[str] = None, target_rolling_window_size: Optional[Union[str, int]] = None, country_or_region_for_holidays: Optional[str] = None, use_stl: Optional[str] = None, seasonality: Optional[Union[str, int]] = None, short_series_handling_config: Optional[str] = None, frequency: Optional[str] = None, target_aggregate_function: Optional[str] = None, cv_step_size: Optional[int] = None) -> None
Parametreler
- time_column_name
- str
Saat sütununun adı. Bu parametre, zaman serisini oluşturmak ve sıklığını çıkarsamak için kullanılan giriş verilerinde tarih saat sütununu belirtmek için tahminde bulunurken gereklidir.
Zaman serisi sıklığı birimleri cinsinden istenen maksimum tahmin ufku. Varsayılan değer 1’dir.
Birimler, eğitim verilerinizin zaman aralığına (örn. tahminde bulunanın tahmin etmesi gereken aylık, haftalık) bağlıdır. Görev türü tahmin edilirken bu parametre gereklidir. Tahmin parametrelerini ayarlama hakkında daha fazla bilgi için bkz. Zaman serisi tahmin modelini otomatik olarak eğitme.
Zaman aralıklarını gruplandırmak için kullanılan sütunların adları. Birden çok seri oluşturmak için kullanılabilir. Zaman serisi kimliği sütun adları tanımlanmamışsa veya belirtilen tanımlayıcı sütunları veri kümesindeki tüm serileri tanımmıyorsa, zaman serisi tanımlayıcıları veri kümeniz için otomatik olarak oluşturulur.
Hedef sütundan geri alınacak geçmiş dönemlerin sayısı. Gecikmeler varsayılan olarak kapalıdır.
Tahmin yaparken, bu parametre verilerin sıklığına bağlı olarak hedef değerlerin gecikmesi için satır sayısını temsil eder. Bu, bir liste veya tek bir tamsayı olarak temsil edilir. Bağımsız değişkenler ile bağımlı değişken arasındaki ilişki varsayılan olarak eşleşmediğinde veya ilişkilendirilmediğinde gecikme kullanılmalıdır. Örneğin, bir ürünün talebini tahmin etmeye çalışırken, herhangi bir aydaki talep, 3 ay önceki belirli emtiaların fiyatına bağlı olabilir. Bu örnekte, modelin doğru ilişki üzerinde eğitim görebilmesi için hedefi (talebi) 3 ay gecikmeli olarak geçirmek isteyebilirsiniz. Daha fazla bilgi için bkz. Zaman serisi tahmin modelini otomatik olarak eğitme.
Hedef gecikmelerin ve sıralı pencere boyutunun otomatik olarak algılanmasıyla ilgili not. Lütfen sıralı pencere bölümünde ilgili yorumlara bakın. En uygun hedef gecikmesini ve sıralı pencere boyutunu algılamak için bir sonraki algoritmayı kullanırız.
Geriye bakma özelliği seçimi için maksimum gecikme sırasını tahmin edin. Bizim örneğimizde bir sonraki tarih sıklığı ayrıntı düzeyine kadar olan dönem sayısıdır; örneğin sıklık günlükse bir hafta (7), hafta ise ay (4) olur. Bu değerlerin iki ile çarpılması, gecikme/hareketli pencerelerin mümkün olan en büyük değerleridir. Örneklerimizde sırasıyla 14 ve 8 maksimum gecikme sırasını dikkate alacaktır).
Eğilim ve artık bileşenler ekleyerek mevsimselleştirilmiş bir seri oluşturun. Bu, sonraki adımda kullanılacaktır.
(2) verilerinde PACF - Kısmi Otomatik Bağıntı İşlevi'ni tahmin edin ve noktaları arayın; burada otomatik bağıntı önemlidir; yani mutlak değeri daha fazladır ve %95'in önemine karşılık gelen 1,96/square_root(maksimum gecikme değeri).
Tüm noktalar önemliyse, bunu güçlü mevsimsellik olarak değerlendiririz ve geriye dönüp bakma özellikleri oluşturmayız.
PACF değerlerini baştan tararız ve ilk önemsiz otomatik bağıntıdan önceki değer gecikmeyi belirleyecektir. İlk önemli öğe (değer kendisiyle bağıntılı) ve ardından önemsiz bir öğe gelirse, gecikme 0 olur ve geçmişe bakma özelliklerini kullanmayız.
'auto' veya None ile sayısal özellikler için gecikme oluşturma bayrağı.
Hedef sütunun sıralı pencere ortalamasını oluşturmak için kullanılan geçmiş dönemlerin sayısı.
Tahmin yaparken, bu parametre tahmin edilen değerleri oluşturmak için kullanılacak n geçmiş dönemi , <= eğitim kümesi boyutunu temsil eder. Belirtilmezse , n tam eğitim kümesi boyutudur. Modeli eğitirken yalnızca belirli bir geçmiş miktarını göz önünde bulundurmak istediğinizde bu parametreyi belirtin. 'otomatik' olarak ayarlanırsa, sıralı pencere PACF'nin anlam eşiğinden daha fazla olduğu son değer olarak tahmin edilir. Ayrıntılar için lütfen target_lags bölüme bakın.
Tatil özellikleri oluşturmak için kullanılan ülke/bölge. Bunlar ISO 3166 iki harfli ülke/bölge kodları olmalıdır, örneğin 'ABD' veya 'GB'.
Zaman serisi hedef sütununun STL Ayrıştırma'sını yapılandırın. use_stl üç değer alabilir: Yok (varsayılan) - ayrıştırma yok, 'sezon' - yalnızca sezon bileşeni ve season_trend oluştur - hem mevsim hem de eğilim bileşenlerini oluşturun.
Zaman serisi mevsimselliğini, seri sıklığının tamsayı katı olarak ayarlayın. Mevsimsellik 'otomatik' olarak ayarlanırsa çıkarım yapılır. Hiçbiri olarak ayarlanırsa, zaman serisi mevsimsellik dışı kabul edilir ve bu da mevsimsellik=1 ile eşdeğerdir.
AutoML'nin kısa zaman serisini nasıl işleyeceklerini tanımlayan parametre.
Olası değerler: 'auto' (varsayılan), 'pad', 'drop' ve None.
- otomatik kısa seri, uzun seri yoksa doldurulur, aksi takdirde kısa seri bırakılır.
- tuş takımı tüm kısa seriler doldurulacaktır.
- tüm kısa seriler bırakılacaktır".
- Hiçbiri kısa seri değiştirilmez. 'pad' olarak ayarlanırsa tablo, verilen zaman serisi kimliği için ortalama hedef değere eşit ortanca değere sahip hedef için regresörler ve rastgele değerler için sıfırlar ve boş değerlerle doldurulur. Ortanca değer sıfırdan büyük veya sıfıra eşitse, minimum doldurulmuş değer sıfıra kırpılır: Giriş:
Date
numeric_value
Dize
Hedef
2020-01-01
23
green
55
Minimum değer sayısının dört olduğunu varsayarsak çıkış:
Date
numeric_value
Dize
Hedef
2019-12-29
0
NA
55.1
2019-12-30
0
NA
55.6
2019-12-31
0
NA
54.5
2020-01-01
23
green
55
Not: short_series_handling_configuration ve eski short_series_handling iki parametremiz vardır. Her iki parametre de ayarlandığında, bunları aşağıdaki tabloda gösterildiği gibi eşitleriz (short_series_handling_configuration ve kısaltma için short_series_handling sırasıyla handling_configuration ve işleme olarak işaretlenir).
Işleme
handling_configuration
sonuçta elde edilen işleme
sonuç handling_configuration
Doğru
auto
Doğru
auto
Doğru
Pad
Doğru
auto
Doğru
drop
Doğru
auto
Doğru
Hiçbiri
Yanlış
Hiçbiri
Yanlış
auto
Yanlış
Hiçbiri
Yanlış
Pad
Yanlış
Hiçbiri
Yanlış
drop
Yanlış
Hiçbiri
Yanlış
Hiçbiri
Yanlış
Hiçbiri
Tahmin sıklığı.
Tahmin yaparken, bu parametre tahminin istendiği dönemi (örneğin, günlük, haftalık, yıllık vb.) temsil eder. Tahmin sıklığı varsayılan olarak veri kümesi sıklığıdır. İsteğe bağlı olarak bunu veri kümesi sıklığından daha büyük (ancak daha küçük değil) olarak ayarlayabilirsiniz. Verileri toplayarak sonuçları tahmin sıklığında oluşturacağız. Örneğin, günlük veriler için sıklığı günlük, haftalık veya aylık olarak ayarlayabilirsiniz ancak saatlik olarak ayarlayamayabilirsiniz. Sıklığın pandas uzaklık diğer adı olması gerekir. Daha fazla bilgi için lütfen pandas belgelerine bakın: https://pandas.pydata.org/pandas-docs/stable/user_guide/timeseries.html#dateoffset-objects
Zaman serisi hedef sütununu kullanıcının belirtilen sıklığına uyacak şekilde toplamak için kullanılacak işlev. target_aggregation_function ayarlanmışsa ancak freq parametresi ayarlanmadıysa hata oluşur. Olası hedef toplama işlevleri şunlardır: "sum", "max", "min" ve "ortalama".
Hedef sütun değerleri belirtilen işleme göre toplanır. Genellikle toplam çoğu senaryo için uygundur.
Verilerinizdeki sayısal tahmin aracı sütunları toplam, ortalama, minimum değer ve maksimum değere göre toplanır. Sonuç olarak, otomatik ML toplama işlevi adıyla ekli yeni sütunlar oluşturur ve seçili toplama işlemini uygular.
Kategorik tahmin sütunları için veriler, penceredeki en belirgin kategori olan moda göre toplanır.
Tarih tahmincisi sütunları minimum değer, maksimum değer ve mod ile toplanır.
Frekans
target_aggregation_function
Veri düzenliliği düzeltme mekanizması
Hiçbiri (Varsayılan)
Hiçbiri (Varsayılan)
Toplama uygulanmaz. Geçerli sıklık belirlenemezse hata oluşur.
Bazı Değerler
Hiçbiri (Varsayılan)
Toplama uygulanmaz. Verilen frekans kılavuzuyla uyumlu veri noktası sayısı daha azsa bu noktalar %90 kaldırılır, aksi takdirde hata oluşur.
Hiçbiri (Varsayılan)
Toplama işlevi
Eksik sıklık parametresiyle ilgili hata oluştu.
Bazı Değerler
Toplama işlevi
providedaggregation işlevini kullanarak sıklık olarak toplama.
set_training
Eğitimle ilgili ayarları yapılandırma yöntemi.
Varsayılan değer False'tur. Open Neural Network Exchange (ONNX) ve Azure Machine Learning hakkında daha fazla bilgi için bu makaleye bakın., :type enable_onnx_compatible_models: bool, isteğe bağlı :p aram enable_dnn_training: Model seçimi sırasında DNN tabanlı modellerin dahil edilip edilmeyeceği. Varsayılan değer Yok'tur.
Ancak, DNN NLP görevleri için varsayılan değer True, diğer tüm AutoML görevleri için ise False'tur.
:type enable_dnn_training: bool, isteğe bağlı :p aram enable_model_explainability: Tüm AutoML eğitim yinelemelerinin sonunda en iyi AutoML modelinin açıklanmasının etkinleştirilip etkinleştirilmeyeceğini belirtin. Varsayılan değer Yok'tur. Daha fazla bilgi için bkz. Yorumlanabilirlik: otomatik makine öğrenmesinde model açıklamaları.
:type enable_model_explainability: bool, isteğe bağlı :p aram enable_stack_ensemble: StackEnsemble yinelemesini etkinleştirme/devre dışı bırakma. Varsayılan değer Yok'tur.
enable_onnx_compatible_models bayrağı ayarlanıyorsa StackEnsemble yinelemesi devre dışı bırakılır.
Benzer şekilde, Timeseries görevleri için StackEnsemble yinelemesi, meta öğrenciyi sığdırmak için kullanılan küçük eğitim kümesi nedeniyle fazla uygunluk risklerini önlemek için varsayılan olarak devre dışı bırakılır.
Topluluklar hakkında daha fazla bilgi için bkz. Grup yapılandırması.
:type enable_stack_ensemble: bool, isteğe bağlı :p aram enable_vote_ensemble:VotingEnsemble yinelemesini etkinleştirme/devre dışı bırakma. Varsayılan değer True'dur.
Topluluklar hakkında daha fazla bilgi için bkz. Grup yapılandırması.
:type enable_vote_ensemble: bool, isteğe bağlı :p aram stack_ensemble_settings: StackEnsemble yineleme ayarları.
:type stack_ensemble_settings: StackEnsembleSettings, isteğe bağlı :p aram ensemble_model_download_timeout: VotingEnsemble ve StackEnsemble model oluşturma sırasında, önceki alt çalıştırmalardan uydurılan birden çok model indirilir. Daha fazla zaman gerekiyorsa bu parametreyi 300 saniyeden daha yüksek bir değerle yapılandırın.
:type ensemble_model_download_timeout: int, isteğe bağlı :p aram allowed_training_algorithms: Deneme aramak için model adlarının listesi. Belirtilmezse, görev için desteklenen tüm modeller tensorflow modellerinde blocked_training_algorithms
belirtilen veya kullanım dışı bırakılan modellerden çıkarılır.
:type allowed_training_algorithms: List[str], isteğe bağlı :p aram blocked_training_algorithms: Deneme için yoksayılabilir algoritmaların listesi.
:type blocked_training_algorithms:List(str) veya Sınıflandırma görevi için List(azureml.train.automl.ClassificationModels), regresyon görevi için List(azure.ai.ml.automl.RegressionModels) veya tahmin görevi için List(azure.ai.ml.automl.ForecastingModels)
set_training(*, enable_onnx_compatible_models: Optional[bool] = None, enable_dnn_training: Optional[bool] = None, enable_model_explainability: Optional[bool] = None, enable_stack_ensemble: Optional[bool] = None, enable_vote_ensemble: Optional[bool] = None, stack_ensemble_settings: Optional[azure.ai.ml.entities._job.automl.stack_ensemble_settings.StackEnsembleSettings] = None, ensemble_model_download_timeout: Optional[int] = None, allowed_training_algorithms: Optional[List[str]] = None, blocked_training_algorithms: Optional[List[str]] = None) -> None
Parametreler
- enable_onnx_compatible_models
ONNX uyumlu modelleri zorunlu tutmanın etkinleştirilip etkinleştirilmeyileceği veya devre dışı bırakılıp bırakılmaymayacağı.
Öznitelikler
forecasting_settings
primary_metric
training
Geri Bildirim
Gönderin ve geri bildirimi görüntüleyin