Megosztás a következőn keresztül:


PARANCSSOR (v2) Automatizált gépi tanulási előrejelzés parancsfeladat YAML-sémája

ÉRVÉNYES:Azure CLI ml-bővítmény 2-es verzió (aktuális)

A forrás JSON-séma a következő helyen található: https://azuremlschemas.azureedge.net/latest/autoMLForecastingJob.schema.json

Feljegyzés

A dokumentumban részletezett YAML-szintaxis az ML CLI v2 bővítmény legújabb verziójának JSON-sémáján alapul. Ez a szintaxis garantáltan csak az ML CLI v2 bővítmény legújabb verziójával működik. A régebbi bővítményverziók sémáit a következő helyen https://azuremlschemasprod.azureedge.net/találja: .

YAML-szintaxis

Kulcs Típus Leírás Megengedett értékek Alapértelmezett érték
$schema húr A YAML-séma betöltésének helye/URL-címe.
Ha a felhasználó az Azure Machine Learning VS Code bővítményt használja a YAML-fájl létrehozásához, a fájl tetején is $schema lehetővé teszi a felhasználó számára a séma- és erőforrás-kiegészítések meghívását.
compute húr Szükséges.
A feladat végrehajtásához használandó AML számítási infrastruktúra neve.
A számítás lehet hivatkozás egy meglévő számítási gépre a munkaterületen
Megjegyzés: a folyamatban lévő feladatok nem támogatják a "helyi" mint compute. A "helyi" itt azt jelenti, hogy a számítási példány a felhasználó Azure Machine Learning Studio-munkaterületén jött létre.
1. meglévő számítási minta [^azureml:<compute_name>] ,
2.'local' helyi végrehajtás használata
'local'
limits object Az automatizált gépi tanulási táblázatos feladat korlátkonfigurációiból álló szótárobjektumot jelöl.
A kulcs a feladat környezetében a korlát neve, az érték pedig a korlát értéke. Az objektum tulajdonságainak kiderítéséhez tekintse meg a korlátokat .
name húr A beküldött automatizált gépi tanulási feladat neve.
A munkaterület összes feladatában egyedinek kell lennie. Ha nincs megadva, az Azure Machine Learning automatikusan létrehoz egy GUID azonosítót a névhez.
description húr Az automatizált gépi tanulási feladat leírása.
display_name húr Annak a feladatnak a neve, amelyet a felhasználó meg szeretne jeleníteni a stúdió felhasználói felületén. Nem egyedi lehet a munkaterületen belül. Ha nincs megadva, az Azure Machine Learning automatikusan létrehozza a megjelenítendő névhez tartozó, olvasható melléknév-főnév azonosítóját.
experiment_name húr A kísérlet neve.
A kísérletek az Azure-beli gépi tanulási feladatok rekordjai. A kísérletek a futtatások eredményeit, valamint a naplókat, diagramokat és grafikonokat tartalmazzák. Az egyes feladatok futási rekordja a megfelelő kísérlet alatt van rendszerezve a stúdió "Kísérletek" lapján.
Annak a munkakönyvtárnak a neve, amelyben létrejött
environment_variables object A parancs végrehajtásának folyamatához beállítandó környezeti változók szótárobjektuma.
outputs object A feladat kimeneti konfigurációinak szótárát jelöli. A kulcs a feladat környezetében lévő kimenet neve, az érték pedig a kimeneti konfiguráció. Az objektum tulajdonságainak megkereséséhez tekintse meg a feladat kimenetét .
log_files object Egy automatikus gépi tanulási feladat végrehajtásának naplóit tartalmazó szótárobjektum
log_verbosity húr A naplófájlba való írás részletességének szintje.
Az elfogadható értékek a Python naplózási kódtárában vannak definiálva.
'not_set', 'debug', 'info', 'warning''error''critical' 'info'
type Const Szükséges.
A feladat típusa.
automl automl
task Const Szükséges.
A végrehajtandó automatizált gépi tanulási feladat típusa.
forecasting forecasting
target_column_name húr Szükséges.
Az előrejelzendő oszlop nevét jelöli. Az automatizált gépi tanulási feladat hibát jelez, ha nincs megadva.
featurization object Az egyéni featurizáció konfigurálását meghatározó szótárobjektum. Ha nem jön létre, az automatikus gépi tanulási konfiguráció automatikus featurizációt alkalmaz. Az objektum tulajdonságainak megtekintéséhez tekintse meg a featurizációt .
forecasting object Az előrejelzési feladat beállításait meghatározó szótárobjektum. Tekintse meg az előrejelzést az objektum tulajdonságainak kiderítéséhez.
n_cross_validations sztring vagy egész szám A modell/folyamat kiválasztása során végrehajtandó keresztérvényesítések száma, ha validation_data nincs megadva.
Ha mind a paraméter, mind validation_data a paraméter nincs megadva vagy be van állítva None, akkor az automatikus gépi tanulási feladat alapértelmezés szerint be auto van állítva. distributed_featurization Ha engedélyezve van, és validation_data nincs megadva, akkor alapértelmezés szerint 2 értékre van állítva.
'auto', [int] None
primary_metric húr Az automatizált gépi tanulás által a Time Series Előrejelzési modell kiválasztásához optimalizált metrika.
Ha allowed_training_algorithms "tcn_forecaster" van használatban a betanításhoz, akkor az automatizált gépi tanulás csak a "normalized_root_mean_squared_error" és a "normalized_mean_absolute_error" használatát támogatja primary_metric.
"spearman_correlation", , "normalized_root_mean_squared_error""r2_score""normalized_mean_absolute_error" "normalized_root_mean_squared_error"
training object A modell betanításában használt konfigurációt meghatározó szótárobjektum.
Az objektum tulajdonságainak kiderítéséhez tekintse meg a betanítást .
training_data object Szükséges
Egy szótárobjektum, amely az MLTable-konfigurációt tartalmazza, amely meghatározza a modellbetanítás bemeneteként használandó betanítási adatokat. Ezek az adatok az adatok egy részhalmazát alkotják, és független funkciókból/oszlopokból és célfunkciókból/oszlopokból kell lenniük. A felhasználó használhat egy regisztrált MLTable-t a munkaterületen ":" formátumban (pl. Input(mltable='my_mltable:1')) VAGY használhat helyi fájlt vagy mappát MLTable-ként (pl. Input(mltable=MLTable(local_path="./data")). Ezt az objektumot meg kell adni. Ha a célfunkció nem szerepel a forrásfájlban, akkor az automatizált gépi tanulás hibát jelez. Ellenőrizze a betanítási, ellenőrzési vagy tesztelési adatokat az objektum tulajdonságainak kiderítéséhez.
validation_data object Egy szótárobjektum, amely az MLTable konfigurációt tartalmazza, amely meghatározza az automatizált gépi tanulási kísérletben a keresztérvényesítéshez használandó érvényesítési adatokat. Az objektumnak független funkciókból/oszlopokból és célfunkcióból/oszlopból kell állnia, ha ez az objektum meg van adva. A betanítási és érvényesítési adatok mintái nem fedhetik egymást egymással.
Az objektum tulajdonságainak kiderítéséhez tekintse meg a betanítási, érvényesítési vagy tesztelési adatokat . Ha ez az objektum nincs definiálva, akkor az automatizált gépi tanulás az érvényességi adatok felosztását használja n_cross_validations az objektumban definiált betanítási training_data adatokból.
test_data object Egy szótárobjektum, amely az MLTable konfigurációt tartalmazza, amely meghatározza a tesztfuttatásban használandó tesztadatokat az előrejelzésekhez a legjobb modell használatával, és meghatározott metrikák használatával értékeli ki a modellt. Az objektum csak a betanítási adatokban használt független funkciókból állhat (célfunkció nélkül), ha ez az objektum meg van adva.
Ellenőrizze a betanítási, ellenőrzési vagy tesztelési adatokat az objektum tulajdonságainak kiderítéséhez. Ha nincs megadva, akkor az automatizált gépi tanulás más beépített módszerekkel javasolja a legjobb modellt a következtetéshez.

Határok

Kulcs Típus Leírás Megengedett értékek Alapértelmezett érték
enable_early_termination Logikai Azt jelzi, hogy engedélyezi-e a kísérlet befejezését, ha a veszteség pontszáma nem javul az "x" iterációk száma után.
Automatizált gépi tanulási feladat esetén az első 20 iterációban nincs korai leállítás. A korai leállítási ablak csak az első 20 iteráció után indul el.
true, false true
max_concurrent_trials egész szám A párhuzamosan végrehajtandó kísérletek (gyermekfeladatok) maximális száma. Erősen ajánlott az egyidejű futtatások számát a fürt csomópontjainak számára állítani (aml számítás definiálva compute). 1
max_trials egész szám Az automatizált ml-feladatok által a hiperparaméterek különböző kombinációjával futtatható betanítási algoritmusok maximális számát jelöli. Alapértelmezett értéke 1000. Ha enable_early_termination meg van adva, akkor a betanítási algoritmusok futtatásához használt kísérletek száma kisebb lehet. 1000
max_cores_per_trial egész szám Az egyes próbaverziók által használható magok maximális számát jelöli. Az alapértelmezett érték -1, ami azt jelenti, hogy a folyamat minden magját használja. -1
timeout_minutes egész szám Az elküldött automatizált gépi tanulási feladat futtatásának maximális időtartama percekben. A megadott idő elteltével a feladat leáll. Ez az időtúllépés magában foglalja a telepítést, a featurizációt, a betanítási futtatásokat, az ensemblinget és a modell magyarázatát (ha van ilyen) az összes próba esetében.
Vegye figyelembe, hogy nem tartalmazza az ensembling és a modell magyarázatát a folyamat végén, ha a feladat nem fejeződik be a megadott határidőn timeout_minutes belül, mivel ezek a funkciók az összes próba (gyermekfeladat) elvégzése után érhetők el.
Alapértelmezett értéke 360 perc (6 óra). Ha 1 óránál (60 percnél) rövidebb vagy egyenlő időtúllépést szeretne megadni, a felhasználónak meg kell győződnie arról, hogy az adathalmaz mérete nem nagyobb 10 000 000-nél (sorok száma oszlop) vagy hibaeredménynél.
360
trial_timeout_minutes egész szám Percekben megadott maximális idő, amellyel a beküldött automatizált gépi tanulási feladat minden próbafeladata (gyermekfeladata) futtatható. A megadott idő elteltével a gyermekfeladat leáll. 30
exit_score float A kísérlet által elérni kívánt pontszám. A kísérlet a megadott pontszám elérése után leáll. Ha nincs megadva (nincs feltétel), a kísérlet addig fut, amíg nem történik további előrehaladás a megadott primary metric.

előrejelzés

Kulcs Típus Leírás Megengedett értékek Alapértelmezett érték
time_column_name húr Szükséges
Az adathalmaz azon oszlopának neve, amely az egyes idősorok időtengelyének felel meg. A betanításhoz, ellenőrzéshez vagy teszteléshez használt bemeneti adatkészletnek tartalmaznia kell ezt az oszlopot, ha a tevékenység .forecasting Ha nincs megadva vagy beállítva, az Noneautomatizált gépi tanulási előrejelzési feladat hibát jelez, és leállítja a kísérletet.
forecast_horizon sztring vagy egész szám A maximális előrejelzési horizont az idősor gyakoriságának egységeiben. Ezek az egységek a betanítási adatok (például havonta, hetente) becsült időintervallumán alapulnak, amelyet az előrejelzési szolgáltató előre jelez. Ha Nincs vagy auto, akkor az alapértelmezett értéke 1, azaz "t+1" a bemeneti adatok utolsó időbélyegének t értékéből. auto, [int] 0
frequency húr Az előrejelzés létrehozásának gyakorisága, például napi, heti, éves stb.
Ha nincs megadva, vagy Nincs értékre van állítva, akkor az alapértelmezett értéke az adathalmaz időindexéből lesz levonva. A felhasználó az adathalmaz kikövetkeztetett gyakoriságánál nagyobb értéket állíthat be, de nem kisebbet. Ha például az adathalmaz gyakorisága napi, akkor olyan értékeket vehet fel, mint a napi, heti, havi, de nem óránként, mivel az óránkénti gyakoriság kisebb, mint a napi (24 óra).
További információért tekintse meg a pandas dokumentációját .
None
time_series_id_column_names sztring vagy lista(sztringek) Az adatok több idősorba való csoportosításához használandó adatok oszlopainak neve. Ha time_series_id_column_names nincs definiálva, vagy Nincs értékre van állítva, az automatikus gépi tanulás automatikus észlelési logikával észleli az oszlopokat. None
feature_lags húr Azt jelzi, hogy a felhasználó automatikusan késéseket szeretne-e generálni a megadott numerikus funkciókhoz. Az alapértelmezett érték a következő, autoami azt jelenti, hogy az automatizált gépi tanulás automatikus javítási alapú heurisztika használatával automatikusan kiválasztja az késési rendeléseket, és létrehozza a megfelelő késési funkciókat az összes numerikus funkcióhoz. A "Nincs" azt jelenti, hogy nem jön létre késés a numerikus funkciókhoz. 'auto', None None
country_or_region_for_holidays húr Az ünnepi szolgáltatások létrehozásához használandó ország vagy régió. Ezeket a karaktereket az ISO 3166 kétbetűs ország-/régiókódokban kell ábrázolni, például "US" vagy "GB". Az ISO-kódok listája a következő helyen https://wikipedia.org/wiki/List_of_ISO_3166_country_codestalálható: . None
cv_step_size sztring vagy egész szám Az egyes CV-hajtások origin_time és a következő hajtás közötti időszakok száma. Ha például napi adatok esetében 3-ra van állítva, az egyes hajtások forrásideje három nap különbséget jelent. Ha nincs megadva, vagy nincs megadva, akkor alapértelmezés szerint be van állítva auto . Ha egész szám típusú, akkor a minimális érték 1, máskülönben hibát jelez. auto, [int] auto
seasonality sztring vagy egész szám Az idősor szezonalitása az adatsor gyakoriságának egész számaként. Ha a szezonalitás nincs megadva, annak értéke a következőre 'auto'van állítva, ami azt jelenti, hogy az automatikus gépi tanulás automatikusan kikövetkezteti. Ha ez a paraméter nincs beállítva None, az automatizált gépi tanulás nem szezonálisként feltételezi az idősort, ami egyenértékű az 1 egész szám értékének beállításával. 'auto', [int] auto
short_series_handling_config húr Azt jelzi, hogy az automatizált gépi tanulás hogyan kezelje a rövid idősorokat, ha meg van adva. A következő értékeket veszi fel:
  • 'auto' : a rövid sorozat ki van párnázva, ha nincsenek hosszú sorozatok, ellenkező esetben a rövid sorozat el van dobva.
  • 'pad': az összes rövid sorozat nullákkal van párnázva.
  • 'drop': az összes rövid sorozat el van dobva.
  • None: a rövid sorozat nem módosul.
    'auto', 'pad', 'drop'None auto
    target_aggregate_function húr A céloszlop idősorokban való összesítéséhez és az előrejelzések meghatározott gyakoriságú (a következőben freqdefiniált) aggregátumfüggvényét jelöli. Ha ez a paraméter be van állítva, de a freq paraméter nincs beállítva, a rendszer hibát jelez. A rendszer kihagyja vagy Nincs értékre állítja, majd nem alkalmaz összesítést. 'sum', 'max', 'min''mean' auto
    target_lags sztring vagy egész szám vagy lista(egész szám) Az adathalmaz gyakorisága alapján a célértékektől való eltéréshez használandó múltbeli/előzményidőszakok száma. Alapértelmezés szerint ez a paraméter ki van kapcsolva. A 'auto' beállítás lehetővé teszi, hogy a rendszer automatikus heurisztikus késést használjon.
    Ezt az késési tulajdonságot akkor kell használni, ha a független változók és a függő változók közötti kapcsolat alapértelmezés szerint nem korrelál. További információ: Az idősorok előrejelzésének késési funkciói az automatizált gépi tanulásban.
    'auto', [int] None
    target_rolling_window_size sztring vagy egész szám A céloszlop gördülőablak-átlagának létrehozásához használandó múltbeli megfigyelések száma. Az előrejelzés során ez a paraméter n előzményidőszakot jelöl az előrejelzett értékek létrehozásához, <= betanítási csoport mérete. Ha nincs megadva, n a betanítási csoport teljes mérete. Adja meg ezt a paramétert, ha csak bizonyos mennyiségű előzményt szeretne figyelembe venni a modell betanításakor. 'auto'egész szám None None
    use_stl húr Az STL-felbontás idősorokra való alkalmazásával létrehozandó összetevők. Ha nincs megadva, vagy Nincs értékre van állítva, a rendszer nem hoz létre idősor-összetevőt.
    use_stl két értéket vehet fel:
    'season' : szezonösszetevő létrehozása.
    'season_trend' : szezonautomata és trendösszetevők létrehozása.
    'season', 'seasontrend' None

    betanítási, ellenőrzési vagy tesztelési adatok

    Kulcs Típus Leírás Megengedett értékek Alapértelmezett érték
    datastore húr Annak az adattárnak a neve, amelyben a felhasználó adatokat tölt fel.
    path húr Az az elérési út, ahonnan az adatokat be kell tölteni. Lehet elérési file út, folder elérési út vagy pattern elérési út.
    pattern egy keresési mintát ad meg, amely lehetővé teszi az adatokat tartalmazó fájlok és mappák globbing(* és **) használatát. A támogatott URI-típusok a következőkazureml: , https, wasbsabfssés adl. További információ: Core yaml szintaxis az azureml:// URI formátum használatának megértéséhez. Az összetevőfájl helyének URI-ja. Ha ez az URI nem rendelkezik sémával (például http:, azureml: stb.), akkor helyi hivatkozásnak számít, és az entitás létrehozásakor a rendszer feltölti az alapértelmezett munkaterületi blobtárolóba.
    type Const A bemeneti adatok típusa. A számítógépes látásmodellek létrehozásához a felhasználónak címkézett képadatokat kell bevinnie a modell betanításához MLTable formátumban. mltable mltable

    képzés

    Kulcs Típus Leírás Megengedett értékek Alapértelmezett érték
    allowed_training_algorithms list(sztring) A kísérlet modellbetanításának alapmodelljeként kipróbálandó idősor-előrejelzési algoritmusok listája. Ha nincs megadva, vagy Nincs értékre van állítva, akkor a kísérlet során minden támogatott algoritmust használ, kivéve a megadott blocked_training_algorithmsalgoritmusokat. 'auto_arima', 'prophet', 'naive','seasonal_naive' , 'average''seasonal_average', 'exponential_smoothing', 'arimax''tcn_forecaster', , 'elastic_net', 'gradient_boosting', 'decision_tree', 'knn', , 'lasso_lars', 'sgd', 'random_forest', 'extreme_random_trees''light_gbm''xg_boost_regressor' None
    blocked_training_algorithms list(sztring) Az idősor-előrejelzési algoritmusok listája, hogy ne fussanak alapmodellként, miközben modellbetanítást futtatnak egy kísérletben. Ha nincs megadva, vagy Nincs értékre van állítva, akkor a modell betanítása során minden támogatott algoritmust használ. 'auto_arima', 'prophet', 'naive', 'seasonal_naive', 'average', 'seasonal_average''exponential_smoothing', 'arimax', ,'tcn_forecaster''elastic_net' , 'gradient_boosting', 'decision_tree', 'knn', , 'lasso_lars', 'sgd', 'random_forest', 'extreme_random_trees''light_gbm''xg_boost_regressor' None
    enable_dnn_training Logikai A DNN-alapú modellek felvételének bekapcsolására vagy kikapcsolására használható jelző, amely kipróbálható a modell kiválasztása során. True, False False
    enable_model_explainability Logikai Egy jelzőt jelöl, amely bekapcsolja a modell magyarázhatóságát, például a funkció fontosságát, az automatizált gépi tanulási rendszer által kiértékelt legjobb modellnek. True, False True
    enable_vote_ensemble Logikai Jelölő egyes alapmodellek szavazási algoritmussal való engedélyezéséhez vagy letiltásához. Az együttesekről további információt az Automatikus betanítása beállítás című témakörben talál. true, false true
    enable_stack_ensemble Logikai Jelölő egyes alapmodellek veremezési algoritmussal való engedélyezéséhez vagy letiltásához. Az előrejelzési feladatokban ez a jelző alapértelmezés szerint ki van kapcsolva, hogy elkerülje a túlillesztés kockázatát a metatanuló illesztéséhez használt kis betanítási készlet miatt. Az együttesekről további információt az Automatikus betanítása beállítás című témakörben talál. true, false false

    featurization

    Kulcs Típus Leírás Megengedett értékek Alapértelmezett érték
    mode húr Az automatizált gépi tanulási feladat által használandó featurizációs mód.
    Beállítás a következőre:
    'auto' azt jelzi, hogy a featurizációs lépést automatikusan kell-e elvégezni
    'off' azt jelzi, hogy nincs olyan featurizáció<'custom' , amely azt jelzi, hogy a testre szabott featurizációt kell-e használni.

    Megjegyzés: Ha a bemeneti adatok ritkán fordulnak elő, a featurizáció nem kapcsolható be.
    'auto', , 'off''custom' None
    blocked_transformers list(sztring) Az automated ML által a featurizáció során letiltandó transzformátornevek listája, ha a featurizáció mode "egyéni" értékre van állítva. 'text_target_encoder', 'one_hot_encoder', 'cat_target_encoder', 'tf_idf', 'wo_e_target_encoder''label_encoder', 'word_embedding', 'naive_bayes', , 'count_vectorizer''hash_one_hot_encoder' None
    column_name_and_types object Egy szótárobjektum, amely oszlopneveket tartalmaz diktálási kulcsként, és az oszlop céljának társított értékként való frissítéséhez használt funkciótípusokat, ha a featurizáció mode "egyéni" értékre van állítva.
    transformer_params object Egy beágyazott szótárobjektum, amely kulcsként transzformátornevet és a megfelelő testreszabási paramétereket tartalmaz az adathalmazoszlopokon a featurizáláshoz, ha a featurizáció mode "egyéni" értékre van állítva.
    Az előrejelzés csak a testreszabáshoz támogatja imputer a transzformátort.
    Tekintse meg column_transformers , hogyan hozhat létre testreszabási paramétereket.
    None

    column_transformers

    Kulcs Típus Leírás Megengedett értékek Alapértelmezett érték
    fields list(sztring) A megadott transformer_params oszlopnevek listája.
    parameters object Egy olyan szótárobjektum, amely kulcsként és értékként a "stratégia" mint számítási stratégia.
    A megadásával kapcsolatos további részleteket az alábbi példákban találja.

    Feladatkimenetek

    Kulcs Típus Leírás Megengedett értékek Alapértelmezett érték
    type húr A feladat kimenetének típusa. Az alapértelmezett uri_folder típus esetében a kimenet egy mappának felel meg. uri_folder, , mlflow_modelcustom_model uri_folder
    mode húr A kimeneti fájl(ok) céltárolóba való kézbesítésének módja. Olvasási-írási csatlakoztatási mód (rw_mount) esetén a kimeneti könyvtár egy csatlakoztatott könyvtár. Feltöltési mód esetén az írott fájl(ok) a feladat végén lesznek feltöltve. rw_mount, upload rw_mount

    Előrejelzési feladat futtatása parancssori felületen

    az ml job create --file [YOUR_CLI_YAML_FILE] --workspace-name [YOUR_AZURE_WORKSPACE] --resource-group [YOUR_AZURE_RESOURCE_GROUP] --subscription [YOUR_AZURE_SUBSCRIPTION]