Share via


CLI (v2) Otomatik ML Tahmin komutu işi YAML şeması

ŞUNLAR IÇIN GEÇERLIDIR:Azure CLI ml uzantısı v2 (geçerli)

Kaynak JSON şemasına şu konumdan ulaşabilirsiniz: https://azuremlschemas.azureedge.net/latest/autoMLForecastingJob.schema.json

Not

Bu belgede ayrıntılı olarak açıklanan YAML söz dizimi, ML CLI v2 uzantısının en son sürümünün JSON şemasını temel alır. Bu söz diziminin yalnızca ML CLI v2 uzantısının en son sürümüyle çalışacağı garanti edilir. Eski uzantı sürümleri için şemaları adresinde https://azuremlschemasprod.azureedge.net/bulabilirsiniz.

YAML söz dizimi

Anahtar Tür Açıklama İzin verilen değerler Varsayılan değer
$schema string YAML şemasını yüklemek için konum/URL.
Kullanıcı YAML dosyasını yazmak için Azure Machine Learning VS Code uzantısını kullanıyorsa ve dosyanın en üstündekiler de dahil olmak üzere $schema kullanıcının şema ve kaynak tamamlamalarını çağırmasına olanak tanır.
compute string Gerekli.
İşin yürütülecek AML işlem altyapısının adı.
İşlem, çalışma alanında var olan bir işlem makinesine başvuru olabilir
Not: İşlem hattındaki işler olarak compute'yerel'i desteklemez. Buradaki 'yerel', kullanıcının Azure Machine Learning stüdyosu çalışma alanında oluşturulan işlem örneğinin olduğu anlamına gelir.
1. mevcut işlem kullanmak için desen [^azureml:<compute_name>] ,
2.'local' yerel yürütmeyi kullanmak için
'local'
limits object Otomatik ML tablo işinin sınır yapılandırmalarından oluşan bir sözlük nesnesini temsil eder.
Anahtar, iş bağlamındaki sınırın adıdır ve değer sınır değeridir. Bu nesnenin özelliklerini bulmak için sınırlamalara bakın.
name string Gönderilen Otomatik ML işinin adı.
Çalışma alanı içindeki tüm işlerde benzersiz olmalıdır. Belirtilmezse, Azure Machine Learning ad için otomatik olarak bir GUID oluşturur.
description string Otomatik ML işinin açıklaması.
display_name string Kullanıcının stüdyo kullanıcı arabiriminde görüntülemek istediği işin adı. Çalışma alanı içinde benzersiz olmayabilir. Belirtilmezse, Azure Machine Learning görünen ad için insan tarafından okunabilir bir sıfat-isim tanımlayıcısı oluşturur.
experiment_name string Denemenin adı.
Denemeler, Azure'da ML eğitim işlerinizin kayıtlarıdır. Denemeler, çalıştırmalarınızın sonuçlarının yanı sıra günlükleri, grafikleri ve grafikleri içerir. Her işin çalıştırma kaydı, stüdyonun "Denemeler" sekmesinde karşılık gelen denemenin altında düzenlenir.
Oluşturulduğu çalışma dizininin adı
environment_variables object Komutun yürütüldüğü işlemde ayarlanacağı ortam değişkenlerinin sözlük nesnesi.
outputs object İşin çıkış yapılandırmalarının sözlüğünü temsil eder. Anahtar, işin bağlamındaki çıkışın adıdır ve değer de çıkış yapılandırmasıdır. Bu nesnenin özelliklerini bulmak için iş çıktısına bakın.
log_files object Otomatik ML işi yürütme günlüklerini içeren bir sözlük nesnesi
log_verbosity string Günlük dosyasına yazmak için günlük ayrıntı düzeyi.
Kabul edilebilir değerler Python günlük kitaplığında tanımlanır.
'not_set', 'debug', 'info', 'warning', 'error', 'critical' 'info'
type const Gerekli.
İşin türü.
automl automl
task const Gerekli.
Yürütülecek Otomatik ML görevinin türü.
forecasting forecasting
target_column_name string Gerekli.
Tahmin edilecek sütunun adını temsil eder. Otomatik ML işi belirtilmezse bir hata oluşturur.
featurization object Özel özellik geliştirme yapılandırmasını tanımlayan bir sözlük nesnesi. Oluşturulmamış olması durumunda Otomatik ML yapılandırması otomatik özellik geliştirme uygular. Bu nesnenin özelliklerini görmek için özellik kazandırmaya bakın.
forecasting object Tahmin işinin ayarlarını tanımlayan bir sözlük nesnesi. Bu nesnenin özelliklerini bulmak için tahmine bakın.
n_cross_validations dize veya tamsayı Belirtilmezse validation_data model/işlem hattı seçimi sırasında gerçekleştirilecek çapraz doğrulamaların sayısı.
Hem hem de validation_data bu parametre sağlanmazsa veya olarak ayarlı Nonedeğilse, Otomatik ML işi bunu varsayılan olarak olarak ayarlar auto . Etkinleştirilmesi ve validation_data belirtilmemiş olması durumunda distributed_featurization varsayılan olarak 2 olarak ayarlanır.
'auto', [int] None
primary_metric string Otomatik ML'nin Zaman Serisi Tahmin modeli seçimi için iyileştirdiğini belirten ölçüm.
Eğitim için kullanılacak 'tcn_forecaster' varsa allowed_training_algorithms Otomatik ML yalnızca 'normalized_root_mean_squared_error' ve 'normalized_mean_absolute_error' primary_metric olarak kullanılmasını destekler.
"spearman_correlation", "normalized_root_mean_squared_error", "r2_score""normalized_mean_absolute_error" "normalized_root_mean_squared_error"
training object Model eğitiminde kullanılan yapılandırmayı tanımlayan bir sözlük nesnesi.
Bu nesnenin özelliklerini bulmak için eğitimi denetleyin.
training_data object Gerekli
Model eğitimi için giriş olarak kullanılacak eğitim verilerini tanımlayan MLTable yapılandırmasını içeren bir sözlük nesnesi. Bu veriler verilerin bir alt kümesidir ve hem bağımsız özelliklerden/sütunlardan hem de hedef özellik/sütundan oluşmalıdır. Kullanıcı, ':' biçimini kullanarak çalışma alanında kayıtlı bir MLTable kullanabilir (örn. Input(mltable='my_mltable:1')) VEYA yerel bir dosyayı veya klasörü MLTable olarak kullanabilir (örn. Input(mltable=MLTable(local_path="./data")). Bu nesne sağlanmalıdır. Hedef özellik kaynak dosyada yoksa Otomatik ML bir hata oluşturur. Bu nesnenin özelliklerini bulmak için eğitim, doğrulama veya test verilerini denetleyin.
validation_data object Çapraz doğrulama için Otomatik ML denemesinde kullanılacak doğrulama verilerini tanımlayan MLTable yapılandırmasını içeren bir sözlük nesnesi. Bu nesne sağlanmışsa hem bağımsız özelliklerden/sütunlardan hem de hedef özellik/sütundan oluşmalıdır. Eğitim verileri ve doğrulama verilerindeki örnekler katlanmış olarak çakışamaz.
Bu nesnenin özelliklerini bulmak için eğitim, doğrulama veya test verilerine bakın. Bu nesne tanımlanmamışsa Otomatik ML, doğrulama verilerini nesnede training_data tanımlanan eğitim verilerinden bölmek için kullanırn_cross_validations.
test_data object MlTable yapılandırmasını içeren bir sözlük nesnesi, en iyi modeli kullanarak tahminler için test çalıştırmasında kullanılacak test verilerini tanımlar ve tanımlanan ölçümleri kullanarak modeli değerlendirir. Bu nesne sağlanmışsa yalnızca eğitim verilerinde kullanılan bağımsız özelliklerden (hedef özellik olmadan) oluşmalıdır.
Bu nesnenin özelliklerini bulmak için eğitim, doğrulama veya test verilerini denetleyin. Sağlanmadıysa, Otomatik ML çıkarım için kullanılacak en iyi modeli önermek için diğer yerleşik yöntemleri kullanır.

Sınır -ları

Anahtar Tür Açıklama İzin verilen değerler Varsayılan değer
enable_early_termination boolean 'x' yineleme sayısından sonra kayıp puanı iyileşmezse deneme sonlandırmanın etkinleştirilip etkinleştirilmeymeyeceğini temsil eder.
Otomatik ML işinde, ilk 20 yinelemeye erken durdurma uygulanmaz. Erken durdurma penceresi yalnızca ilk 20 yinelemeden sonra başlar.
true, false true
max_concurrent_trials tamsayı Paralel olarak yürütülecek en fazla deneme sayısı (alt iş). Eşzamanlı çalıştırma sayısını kümedeki düğüm sayısına (içinde tanımlanan computeaml işlemi) ayarlamanız kesinlikle önerilir. 1
max_trials tamsayı Bir Otomatik ML işinin farklı hiper parametreler bileşimine sahip bir eğitim algoritması çalıştırmayı deneyebileceği en fazla deneme sayısını temsil eder. Varsayılan değeri 1000 olarak ayarlanmıştır. tanımlanırsa enable_early_termination , eğitim algoritmalarını çalıştırmak için kullanılan denemelerin sayısı daha az olabilir. 1000
max_cores_per_trial tamsayı Her deneme için kullanılabilecek çekirdek başına maksimum çekirdek sayısını temsil eder. Varsayılan değeri -1 olarak ayarlanmıştır ve bu da işlemde tüm çekirdeklerin kullanıldığı anlamına gelir. -1
timeout_minutes tamsayı Gönderilen Otomatik ML işinin çalışması için gereken en uzun süre (dakika cinsinden). Belirtilen süreden sonra iş sonlandırılır. Bu zaman aşımı tüm denemelerde kurulum, özellik kazandırma, eğitim çalıştırmaları, benzerliği ve model açıklanabilirliğini (sağlanırsa) içerir.
Tüm denemeler (çocuk işleri) tamamlandıktan sonra bu özellikler kullanılabilir olduğundan işin tamamlanmaması timeout_minutes durumunda işlemin sonundaki benzer ve model açıklanabilirlik çalıştırmalarını içermediğini unutmayın.
Varsayılan değeri 360 dakika (6 saat) olarak ayarlanır. 1 saatten kısa veya buna eşit bir zaman aşımı (60 dakika) belirtmek için, kullanıcı veri kümesinin boyutunun 10.000.000'den (satır çarpı sütunu) büyük olmadığından veya hata sonuçlarından emin olmalıdır.
360
trial_timeout_minutes tamsayı Gönderilen Otomatik ML işinde her denemenin (alt iş) çalıştırabileceği en uzun süre (dakika cinsinden). Belirtilen süreden sonra alt iş sonlandırılır. 30
exit_score float Deneme tarafından elde edilen puan. Belirtilen puana ulaşıldıktan sonra deneme sonlandırılır. Belirtilmezse (ölçüt yoksa), tanımlanan primary metricüzerinde başka bir ilerleme kaydedilinceye kadar deneme çalıştırılır.

Tahmin

Anahtar Tür Açıklama İzin verilen değerler Varsayılan değer
time_column_name string Gerekli
Veri kümesindeki her zaman serisinin zaman eksenine karşılık gelen sütunun adı. Görev ise forecastingeğitim, doğrulama veya test için giriş veri kümesi bu sütunu içermelidir. Sağlanmazsa veya olarak ayarlanırsa None, Otomatik ML tahmin işi bir hata oluşturur ve denemeyi sonlandırır.
forecast_horizon dize veya tamsayı Zaman serisi sıklığı birimleri cinsinden maksimum tahmin ufku. Bu birimler, tahmin edicinin tahmin etmek için kullandığı eğitim verilerinizin çıkarsanan zaman aralığına (ör. aylık, haftalık) dayanır. Yok veya autoolarak ayarlanırsa, varsayılan değeri 1 olarak ayarlanır; bu da giriş verilerindeki son zaman damgası t'den 't+1' anlamına gelir. auto, [int] 1
frequency string Tahmin oluşturmanın istendiği sıklık (örneğin, günlük, haftalık, yıllık vb.).
Belirtilmemişse veya Yok olarak ayarlıysa, varsayılan değeri veri kümesi zaman dizininden çıkarılır. Kullanıcı, değerini veri kümesinin çıkarılma sıklığından daha büyük ancak ondan küçük değil olarak ayarlayabilir. Örneğin, veri kümesinin sıklığı günlükse günlük, haftalık, aylık gibi değerler alabilir ancak saatlik değer günlükten (24 saat) küçük olduğundan saatlik olamaz.
Daha fazla bilgi için pandas belgelerine bakın .
None
time_series_id_column_names dize veya liste(dizeler) Verileri birden çok zaman serisinde gruplandırmak için kullanılacak verilerdeki sütunların adları. time_series_id_column_names tanımlanmamışsa veya Hiçbiri olarak ayarlanmamışsa, Otomatik ML sütunları algılamak için otomatik algılama mantığını kullanır. None
feature_lags string Kullanıcının sağlanan sayısal özellikler için otomatik olarak gecikmeler oluşturmak isteyip istemediğini temsil eder. Varsayılan olarak ayarlanır auto, yani Otomatik ML, gecikme siparişlerini otomatik olarak seçmek ve tüm sayısal özellikler için karşılık gelen gecikme özelliklerini oluşturmak için otomatik korelasyon tabanlı buluşsal yöntemler kullanır. "Hiçbiri", herhangi bir sayısal özellik için gecikme oluşturulmadığını gösterir. 'auto', None None
country_or_region_for_holidays string Tatil özellikleri oluşturmak için kullanılacak ülke veya bölge. Bu karakterler ISO 3166 iki harfli ülke/bölge kodlarında (örneğin, 'ABD' veya 'GB' ) gösterilmelidir. ISO kodlarının listesi adresinde https://wikipedia.org/wiki/List_of_ISO_3166_country_codesbulunabilir. None
cv_step_size dize veya tamsayı Bir CV katlama ile bir sonraki katlamanın origin_time arasındaki dönem sayısı. Örneğin, günlük veriler için 3 olarak ayarlanırsa, her katlamanın çıkış süresi üç gün arayla olur. Yok olarak ayarlanırsa veya belirtilmezse, varsayılan olarak olarak ayarlanır auto . Tamsayı türündeyse, alabileceği en düşük değer 1'dir, aksi takdirde hata oluşturur. auto, [int] auto
seasonality dize veya tamsayı Seri sıklığının tamsayı katı olarak zaman serisi mevsimselliği. Mevsimsellik belirtilmezse değeri olarak 'auto'ayarlanır, yani Otomatik ML tarafından otomatik olarak çıkarılır. Bu parametre olarak Noneayarlanmamışsa, Otomatik ML zaman serisini mevsimsel olmayan olarak kabul eder ve bu da bunu 1 tamsayı değeri olarak ayarlamaya eşdeğerdir. 'auto', [int] auto
short_series_handling_config string Otomatik ML'nin belirtilirse kısa zaman serisini nasıl işleyeceklerini temsil eder. Aşağıdaki değerleri alır:
  • 'auto' : Uzun seri yoksa kısa seriler doldurulur, aksi takdirde kısa seri bırakılır.
  • 'pad': tüm kısa seriler sıfırlarla doldurulur.
  • 'drop': tüm kısa seriler bırakılır.
  • None: kısa seri değiştirilmez.
    'auto', 'pad', 'drop', None auto
    target_aggregate_function string Zaman serisindeki hedef sütunu toplamak ve belirtilen sıklıkta tahminler oluşturmak için kullanılacak toplama işlevini temsil eder (içinde freqtanımlanır). Bu parametre ayarlandıysa ancak freq parametre ayarlanmadıysa bir hata oluşur. Atlanır veya Yok olarak ayarlanır, sonra toplama uygulanmaz. 'sum', 'max', 'min', 'mean' auto
    target_lags dize veya tamsayı veya liste (tamsayı) Veri kümesi sıklığına göre hedef değerlerden gecikmek için kullanılacak geçmiş/geçmiş dönemlerin sayısı. Varsayılan olarak, bu parametre kapalıdır. Bu 'auto' ayar, sistemin otomatik buluşsal tabanlı gecikme kullanmasını sağlar.
    Bağımsız değişkenler ile bağımlı değişken arasındaki ilişki varsayılan olarak bağıntılı olmadığında bu gecikme özelliği kullanılmalıdır. Daha fazla bilgi için bkz . Otomatik ML'de zaman serisi tahmini için gecikmiş özellikler.
    'auto', [int] None
    target_rolling_window_size dize veya tamsayı Hedef sütunun sıralı pencere ortalamasını oluşturmak için kullanılacak geçmiş gözlemlerin sayısı. Tahmin yaparken, bu parametre tahmin edilen değerleri oluşturmak için kullanılacak n geçmiş dönemi, <= eğitim kümesi boyutunu temsil eder. Belirtilmezse, n tam eğitim kümesi boyutudur. Modeli eğitirken yalnızca belirli bir geçmiş miktarını göz önünde bulundurmak istediğinizde bu parametreyi belirtin. 'auto'Tamsayı None None
    use_stl string Zaman serisine STL ayrıştırma uygulayarak oluşturulacak bileşenler. Sağlanmazsa veya Hiçbiri olarak ayarlanırsa, zaman serisi bileşeni oluşturulmaz.
    use_stl iki değer alabilir:
    'season' : sezon bileşeni oluşturmak için.
    'season_trend' : hem sezon Otomatik ML hem de eğilim bileşenleri oluşturmak için.
    'season', 'seasontrend' None

    eğitim veya doğrulama veya test verileri

    Anahtar Tür Açıklama İzin verilen değerler Varsayılan değer
    datastore string Verilerin kullanıcı tarafından karşıya yüklendiği veri deposunun adı.
    path string Verilerin yüklendiği yol. Bir yol, folder yol veya pattern yollar için olabilirfile.
    pattern veri içeren dosya ve klasörlerin globbing(* ve **) izin vermek için bir arama deseni belirtir. Desteklenen URI türleri : azureml, https, wasbs, abfssve adl. Daha fazla bilgi için URI biçiminin nasıl kullanılacağını azureml:// anlamak için bkz. Çekirdek yaml söz dizimi. Yapıt dosyasının konumunun URI'sini. Bu URI'nin bir şeması yoksa (örneğin http:, azureml: vb.), yerel başvuru olarak kabul edilir ve varlık oluşturulduktan sonra işaret edilen dosya varsayılan çalışma alanı blob depolama alanına yüklenir.
    type const Giriş verilerinin türü. Görüntü işleme modelleri oluşturmak için kullanıcının etiketlenmiş görüntü verilerini MLTable biçiminde model eğitimi için giriş olarak getirmesi gerekir. mltable mltable

    Eğitim

    Anahtar Tür Açıklama İzin verilen değerler Varsayılan değer
    allowed_training_algorithms list(dize) Bir denemede model eğitimi için temel model olarak deneyebileceğiniz Zaman Serisi Tahmin algoritmalarının listesi. Atlanırsa veya Hiçbiri olarak ayarlanırsa, deneme sırasında içinde belirtilen blocked_training_algorithmsalgoritmalar dışında desteklenen tüm algoritmalar kullanılır. 'auto_arima', 'prophet', 'naive','seasonal_naive', 'average', 'seasonal_average', 'exponential_smoothing', 'arimax', 'tcn_forecaster', 'elastic_net', 'gradient_boosting', 'decision_tree', 'knn', 'lasso_lars', 'sgd', 'random_forest', 'extreme_random_trees', 'light_gbm', 'xg_boost_regressor' None
    blocked_training_algorithms list(dize) Bir denemede model eğitimi sırasında temel model olarak çalıştırılmayan Zaman Serisi Tahmin algoritmalarının listesi. Atlanırsa veya Hiçbiri olarak ayarlanırsa, model eğitimi sırasında desteklenen tüm algoritmalar kullanılır. 'auto_arima', 'prophet', 'naive', 'seasonal_naive', 'average', 'seasonal_average', 'exponential_smoothing', 'arimax','tcn_forecaster', 'elastic_net', 'gradient_boosting', 'decision_tree', 'knn', 'lasso_lars', 'sgd', 'random_forest', 'extreme_random_trees', 'light_gbm', 'xg_boost_regressor' None
    enable_dnn_training boolean Model seçimi sırasında denemek üzere DNN tabanlı modellerin eklenmesini açmak veya kapatmak için bir bayrak. True, False False
    enable_model_explainability boolean Otomatik ML sistemi tarafından değerlendirilen en iyi modelin özellik önemi gibi model açıklanabilirliğini açmak için bir bayrağı temsil eder. True, False True
    enable_vote_ensemble boolean Oylama algoritmasını kullanarak bazı temel modellerin benzerini etkinleştirmek veya devre dışı bırakmak için bir bayrak. Topluluklar hakkında daha fazla bilgi için bkz. Otomatik eğiti ayarlama. true, false true
    enable_stack_ensemble boolean Yığınlama algoritmasını kullanarak bazı temel modellerin benzerini etkinleştirmek veya devre dışı bırakmak için bir bayrak. Tahmin görevlerinde, meta öğrenciyi sığdırmak için kullanılan küçük eğitim kümesi nedeniyle fazla uygunluk risklerinden kaçınmak için bu bayrak varsayılan olarak kapalıdır. Topluluklar hakkında daha fazla bilgi için bkz. Otomatik eğiti ayarlama. true, false false

    özellik kazandırma

    Anahtar Tür Açıklama İzin verilen değerler Varsayılan değer
    mode string Otomatik ML işi tarafından kullanılacak özellik geliştirme modu.
    Şu şekilde ayarlanır:
    'auto' özellik geliştirme adımının otomatik olarak yapılıp yapılmayacağını gösterir
    'off' özellik kazandırma<'custom' olmadığını belirtir, özelleştirilmiş özellik geliştirmenin kullanılması gerekip gerekmediğini gösterir.

    Not: Giriş verileri seyrekse özellik özelliği açılamaz.
    'auto', 'off', 'custom' None
    blocked_transformers list(dize) Özellik geliştirme mode 'özel' olarak ayarlandıysa, Otomatik ML'nin özellik geliştirme adımı sırasında engellenecek transformatör adlarının listesi. 'text_target_encoder', 'one_hot_encoder', 'cat_target_encoder', 'tf_idf', 'wo_e_target_encoder', 'label_encoder', 'word_embedding', 'naive_bayes', 'count_vectorizer', 'hash_one_hot_encoder' None
    column_name_and_types object Özellik oluşturma 'özel' olarak ayarlandıysa mode , sütun amacını ilişkili değer olarak güncelleştirmek için kullanılan dikte anahtarı ve özellik türleri olarak sütun adlarından oluşan bir sözlük nesnesi.
    transformer_params object Özellik geliştirme 'özel' olarak ayarlandıysa mode , özellik geliştirme için veri kümesi sütunlarında anahtar olarak transformatör adından ve ilgili özelleştirme parametrelerinden oluşan iç içe bir sözlük nesnesi.
    Tahmin yalnızca özelleştirme için transformatörü destekler imputer .
    Özelleştirme parametrelerinin nasıl oluşturulacağını öğrenmek için column_transformers göz atın.
    None

    column_transformers

    Anahtar Tür Açıklama İzin verilen değerler Varsayılan değer
    fields list(dize) Sağlanan transformer_params sütun adlarının listesi uygulanmalıdır.
    parameters object Anahtar olarak 'strategy' ve imputation strategy olarak değerden oluşan bir sözlük nesnesi.
    Bunun nasıl sağlandığı hakkında daha fazla ayrıntı burada verilen örneklerde verilmiştir.

    İş çıkışları

    Anahtar Tür Açıklama İzin verilen değerler Varsayılan değer
    type string İş çıktısının türü. Varsayılan uri_folder tür için çıkış bir klasöre karşılık gelir. uri_folder , mlflow_model, custom_model uri_folder
    mode string Çıkış dosyasının hedef depolamaya teslim etme modu. Okuma-yazma bağlama modu (rw_mount) için çıkış dizini bağlı bir dizindir. Karşıya yükleme modu için yazılan dosyalar işin sonunda karşıya yüklenir. rw_mount, upload rw_mount

    CLI aracılığıyla tahmin işini çalıştırma

    az ml job create --file [YOUR_CLI_YAML_FILE] --workspace-name [YOUR_AZURE_WORKSPACE] --resource-group [YOUR_AZURE_RESOURCE_GROUP] --subscription [YOUR_AZURE_SUBSCRIPTION]