PARANCSSORI (v2) folyamatfeladat YAML-sémája
A KÖVETKEZŐRE VONATKOZIK: Azure CLI ml-bővítmény v2 (aktuális)
A forrás JSON-sémát a következő helyen https://azuremlschemas.azureedge.net/latest/pipelineJob.schema.jsontalálja: .
Feljegyzés
A dokumentumban részletezett YAML-szintaxis az ML CLI v2 bővítmény legújabb verziójának JSON-sémáján alapul. Ez a szintaxis garantáltan csak az ML CLI v2 bővítmény legújabb verziójával működik. A régebbi bővítményverziók sémáit a következő helyen https://azuremlschemasprod.azureedge.net/találja: .
YAML-szintaxis
Kulcs | Típus | Leírás | Megengedett értékek | Alapértelmezett érték |
---|---|---|---|---|
$schema |
húr | A YAML-séma. Ha az Azure Machine Learning VS Code-bővítményt használja a YAML-fájl létrehozásához, séma- és erőforrás-kiegészítéseket hívhat meg, ha a fájl tetején szerepel $schema . |
||
type |
Const | Szükséges. A feladat típusa. | pipeline |
|
name |
húr | A feladat neve. A munkaterület összes feladatának egyedinek kell lennie. Ha nincs megadva, az Azure Machine Learning automatikusan létrehoz egy GUID azonosítót a névhez. | ||
display_name |
húr | A feladat megjelenítendő neve a stúdió felhasználói felületén. Nem egyedi lehet a munkaterületen belül. Ha nincs megadva, az Azure Machine Learning automatikusan létrehoz egy emberi olvasásra alkalmas melléknév-főnév azonosítót a megjelenítendő névhez. | ||
experiment_name |
húr | Rendszerezze a feladatot a kísérlet neve alatt. Az egyes feladatok futtatási rekordja a megfelelő kísérlet alatt van rendszerezve a stúdió "Kísérletek" lapján. Ha nincs megadva, az Azure Machine Learning alapértelmezés szerint experiment_name annak a munkakönyvtárnak a nevére kerül, ahol a feladatot létrehozták. |
||
tags |
object | A feladat címkéinek szótára. | ||
settings |
object | A folyamatfeladat alapértelmezett beállításai. Keresse fel a settings konfigurálható tulajdonságok halmazához tartozó kulcs attribútumait. |
||
jobs |
object | Szükséges. A folyamaton belüli lépésekként futtatandó egyes feladatok szótára. Ezek a feladatok a szülőfolyamat-feladat gyermekfeladatainak minősülnek. A kulcs a folyamatfeladat környezetében lévő lépés neve. Ez a név eltér a gyermekfeladat egyedi feladatnevétől. Az érték a feladat specifikációja, amely követheti a parancsfeladat sémáját vagy a takarítási feladat sémáját. Jelenleg csak a parancsfeladatok és a takarítási feladatok futtathatók egy folyamatban. A későbbi kiadásokban más feladattípusok is támogatottak lesznek. |
||
inputs |
object | A folyamatfeladat bemeneteinek szótára. A kulcs a bemenet neve a feladat kontextusában. Az érték a bemeneti érték. A folyamat egyes lépésfeladatainak bemenetei hivatkozhatnak ezekre a folyamatbemenetekre a ${{ parent.inputs.<input_name> }} kifejezéssel. A folyamatlépés bemeneteinek a legfelső szintű folyamatfeladat bemeneteihez való kötéséről további információt a Folyamatfeladat lépései közötti kötési bemenetek és kimenetek kifejezésszintaxisában talál. |
||
inputs.<input_name> |
szám, egész szám, logikai érték, sztring vagy objektum | Egy literális érték (típusszám, egész szám, logikai vagy sztring) vagy egy feladat bemeneti adatspecifikációját tartalmazó objektum. | ||
outputs |
object | A folyamatfeladat kimeneti konfigurációinak szótára. A kulcs a feladat környezetében lévő kimenet neve. Az érték a kimeneti konfiguráció. A folyamat egyes lépésfeladatainak kimenetei hivatkozhatnak ezekre a folyamatkimenetekre a ${{ parents.outputs.<output_name> }} kifejezéssel. A folyamatlépés kimeneteinek a legfelső szintű folyamatfeladat kimeneteihez való kötésével kapcsolatos további információkért tekintse meg a Folyamatfeladat lépései közötti kötési bemenetek és kimenetek kifejezésszintaxisát. |
||
outputs.<output_name> |
object | Üresen hagyhatja az objektumot. Ebben az esetben alapértelmezés szerint a kimenet típusa uri_folder lesz, és az Azure Machine Learning rendszer által generál egy kimeneti helyet a kimenethez az alábbi templatizált elérési út alapján: {settings.datastore}/azureml/{job-name}/{output-name}/ . A kimeneti könyvtárba tartozó fájl(ok) írásvédett csatlakoztatással lesznek megírva. Másik kimeneti mód megadásához adjon meg egy objektumot, amely tartalmazza a feladat kimeneti specifikációját. |
||
identity |
object | Az identitás az adathozzáféréshez használatos. Ez lehet UserIdentityConfiguration, ManagedIdentityConfiguration vagy None. UserIdentityConfiguration esetén a feladat-beküldő identitása a bemeneti adatok elérésére és az eredmények kimeneti mappába való írására szolgál, ellenkező esetben a számítási cél felügyelt identitása lesz használva. |
A kulcs attribútumai settings
Kulcs | Típus | Leírás | Alapértelmezett érték |
---|---|---|---|
default_datastore |
húr | A folyamatfeladat alapértelmezett adattáraként használni kívánt adattár neve. Ennek az értéknek a szintaxist használó meglévő adattárra kell hivatkoznia a azureml:<datastore-name> munkaterületen. A szülőfolyamat-feladat vagy a outputs gyermeklépési feladatok tulajdonságában definiált kimenetek ebben az adattárban vannak tárolva. Ha nincs megadva, a kimenetek a munkaterület blobadattárában lesznek tárolva. |
|
default_compute |
húr | Annak a számítási célnak a neve, amelyet a folyamat összes lépéséhez alapértelmezett számításként szeretne használni. A lépés szintjén definiált számítás felülírja az adott lépés alapértelmezett számítását. Az default_compute értéknek a szintaxist használó azureml:<compute-name> , a munkaterületen meglévő számításra való hivatkozásnak kell lennie. |
|
continue_on_step_failure |
Logikai | Ez a beállítás határozza meg, hogy mi történik, ha a folyamat egy lépése meghiúsul. Alapértelmezés szerint a folyamat akkor is futni fog, ha egy lépés meghiúsul. Ez azt jelenti, hogy a sikertelen lépéstől nem függő lépések végrehajtása továbbra is megtörténik. Ha azonban ezt a beállítást Hamis értékre módosítja, a teljes folyamat leáll, és az aktuálisan futó lépések megszakadnak, ha egy lépés meghiúsul. | True |
force_rerun |
Logikai | A teljes folyamat újrafuttatásának kényszerítése. Az alapértelmezett érték False . Ez azt jelenti, hogy a folyamat alapértelmezés szerint megpróbálja újra felhasználni az előző feladat kimenetét, ha megfelel az újrafelhasználási feltételeknek. Ha be van állítva, True a folyamat összes lépése újrafut. |
False |
Feladatbemenetek
Kulcs | Típus | Leírás | Megengedett értékek | Alapértelmezett érték |
---|---|---|---|---|
type |
húr | A feladatbemenet típusa. Adja meg uri_file az egyetlen fájlforrásra ható bemeneti adatokat, illetve uri_folder a mappaforrásra ható bemeneti adatokat. További információ: További információ az adathozzáférésről. |
uri_file , uri_folder , mltable mlflow_model |
uri_folder |
path |
húr | A bemenetként használni kívánt adatok elérési útja. Ez többféleképpen is megadható: - Az adatforrásfájl vagy -mappa helyi elérési útja, például. path: ./iris.csv Az adatok feltöltése a feladat beküldése során. - A bemenetként használni kívánt fájl vagy mappa felhőbeli elérési útjának URI-ja. A támogatott URI-típusok a következők azureml : , https , wasbs , abfss adl . Az URI formátum használatáról további információt a azureml:// Core yaml szintaxisában talál. – Meglévő regisztrált Azure Machine Learning-adategység bemenetként való használatához. Regisztrált adategységre való hivatkozáshoz használja a azureml:<data_name>:<data_version> szintaxist vagy azureml:<data_name>@latest (az adategység legújabb verziójára való hivatkozáshoz), például vagy path: azureml:cifar10-data:1 path: azureml:cifar10-data@latest . |
||
mode |
húr | Az adatok számítási célba való kézbesítésének módja. Írásvédett csatlakoztatás ro_mount () esetén az adatok csatlakoztatási útvonalként lesznek felhasználva. A mappa mappaként van csatlakoztatva, a fájl pedig fájlként van csatlakoztatva. Az Azure Machine Learning feloldja a csatlakoztatási útvonal bemenetét. Mód esetén download az adatok a számítási célra lesznek letöltve. Az Azure Machine Learning feloldja a letöltött elérési út bemenetét. Csak az adatösszetevő vagy -összetevők tárolási helyének URL-címe esetén az adatok csatlakoztatása vagy letöltése helyett használja a direct módot. Ez a feladat bemeneteként a tárolási hely URL-címét adja át. Ebben az esetben teljes mértékben Ön a felelős a tárhoz való hozzáféréshez szükséges hitelesítő adatok kezeléséért. |
ro_mount , , download direct |
ro_mount |
Feladatkimenetek
Kulcs | Típus | Leírás | Megengedett értékek | Alapértelmezett érték |
---|---|---|---|---|
type |
húr | A feladat kimenetének típusa. Az alapértelmezett uri_folder típus esetében a kimenet egy mappának felel meg. |
uri_file , uri_folder , mltable mlflow_model |
uri_folder |
mode |
húr | A kimeneti fájl vagy fájlok céltárolóba való kézbesítésének módja. Olvasási-írási csatlakoztatási mód (rw_mount ) esetén a kimeneti könyvtár egy csatlakoztatott könyvtár lesz. A feltöltési mód esetében az írott fájl(ok) a feladat végén lesznek feltöltve. |
rw_mount , upload |
rw_mount |
Identitáskonfigurációk
UserIdentityConfiguration
Kulcs | Típus | Leírás | Megengedett értékek |
---|---|---|---|
type |
Const | Szükséges. Identitástípus. | user_identity |
ManagedIdentityConfiguration
Kulcs | Típus | Leírás | Megengedett értékek |
---|---|---|---|
type |
Const | Szükséges. Identitástípus. | managed vagy managed_identity |
Megjegyzések
A paranccsal kezelheti az az ml job
Azure Machine Learning-feladatokat.
Példák
Példákért tekintse meg a GitHub-adattárat . Itt több is látható:
YAML: hello pipeline
$schema: https://azuremlschemas.azureedge.net/latest/pipelineJob.schema.json
type: pipeline
display_name: hello_pipeline
jobs:
hello_job:
command: echo "hello"
environment: azureml://registries/azureml/environments/sklearn-1.5/labels/latest
compute: azureml:cpu-cluster
world_job:
command: echo "world"
environment: azureml://registries/azureml/environments/sklearn-1.5/labels/latest
compute: azureml:cpu-cluster
YAML: bemeneti/kimeneti függőség
$schema: https://azuremlschemas.azureedge.net/latest/pipelineJob.schema.json
type: pipeline
display_name: hello_pipeline_io
jobs:
hello_job:
command: echo "hello" && echo "world" > ${{outputs.world_output}}/world.txt
environment: azureml://registries/azureml/environments/sklearn-1.5/labels/latest
compute: azureml:cpu-cluster
outputs:
world_output:
world_job:
command: cat ${{inputs.world_input}}/world.txt
environment: azureml://registries/azureml/environments/sklearn-1.5/labels/latest
compute: azureml:cpu-cluster
inputs:
world_input: ${{parent.jobs.hello_job.outputs.world_output}}
YAML: a folyamatfeladatok gyakori beállításai
$schema: https://azuremlschemas.azureedge.net/latest/pipelineJob.schema.json
type: pipeline
display_name: hello_pipeline_settings
settings:
default_datastore: azureml:workspaceblobstore
default_compute: azureml:cpu-cluster
jobs:
hello_job:
command: echo 202204190 & echo "hello"
environment: azureml://registries/azureml/environments/sklearn-1.5/labels/latest
world_job:
command: echo 202204190 & echo "hello"
environment: azureml://registries/azureml/environments/sklearn-1.5/labels/latest
YAML: felső szintű bemenet és a folyamatfeladatok gyakori beállításainak felülbírálása
$schema: https://azuremlschemas.azureedge.net/latest/pipelineJob.schema.json
type: pipeline
display_name: hello_pipeline_abc
settings:
default_compute: azureml:cpu-cluster
inputs:
hello_string_top_level_input: "hello world"
jobs:
a:
command: echo hello ${{inputs.hello_string}}
environment: azureml://registries/azureml/environments/sklearn-1.5/labels/latest
inputs:
hello_string: ${{parent.inputs.hello_string_top_level_input}}
b:
command: echo "world" >> ${{outputs.world_output}}/world.txt
environment: azureml://registries/azureml/environments/sklearn-1.5/labels/latest
outputs:
world_output:
c:
command: echo ${{inputs.world_input}}/world.txt
environment: azureml://registries/azureml/environments/sklearn-1.5/labels/latest
inputs:
world_input: ${{parent.jobs.b.outputs.world_output}}