Megosztás a következőn keresztül:


PARANCSSORI (v2) folyamatfeladat YAML-sémája

A KÖVETKEZŐRE VONATKOZIK: Azure CLI ml-bővítmény v2 (aktuális)

A forrás JSON-sémát a következő helyen https://azuremlschemas.azureedge.net/latest/pipelineJob.schema.jsontalálja: .

Feljegyzés

A dokumentumban részletezett YAML-szintaxis az ML CLI v2 bővítmény legújabb verziójának JSON-sémáján alapul. Ez a szintaxis garantáltan csak az ML CLI v2 bővítmény legújabb verziójával működik. A régebbi bővítményverziók sémáit a következő helyen https://azuremlschemasprod.azureedge.net/találja: .

YAML-szintaxis

Kulcs Típus Leírás Megengedett értékek Alapértelmezett érték
$schema húr A YAML-séma. Ha az Azure Machine Learning VS Code-bővítményt használja a YAML-fájl létrehozásához, séma- és erőforrás-kiegészítéseket hívhat meg, ha a fájl tetején szerepel $schema .
type Const Szükséges. A feladat típusa. pipeline
name húr A feladat neve. A munkaterület összes feladatának egyedinek kell lennie. Ha nincs megadva, az Azure Machine Learning automatikusan létrehoz egy GUID azonosítót a névhez.
display_name húr A feladat megjelenítendő neve a stúdió felhasználói felületén. Nem egyedi lehet a munkaterületen belül. Ha nincs megadva, az Azure Machine Learning automatikusan létrehoz egy emberi olvasásra alkalmas melléknév-főnév azonosítót a megjelenítendő névhez.
experiment_name húr Rendszerezze a feladatot a kísérlet neve alatt. Az egyes feladatok futtatási rekordja a megfelelő kísérlet alatt van rendszerezve a stúdió "Kísérletek" lapján. Ha nincs megadva, az Azure Machine Learning alapértelmezés szerint experiment_name annak a munkakönyvtárnak a nevére kerül, ahol a feladatot létrehozták.
tags object A feladat címkéinek szótára.
settings object A folyamatfeladat alapértelmezett beállításai. Keresse fel a settings konfigurálható tulajdonságok halmazához tartozó kulcs attribútumait.
jobs object Szükséges. A folyamaton belüli lépésekként futtatandó egyes feladatok szótára. Ezek a feladatok a szülőfolyamat-feladat gyermekfeladatainak minősülnek.

A kulcs a folyamatfeladat környezetében lévő lépés neve. Ez a név eltér a gyermekfeladat egyedi feladatnevétől. Az érték a feladat specifikációja, amely követheti a parancsfeladat sémáját vagy a takarítási feladat sémáját. Jelenleg csak a parancsfeladatok és a takarítási feladatok futtathatók egy folyamatban. A későbbi kiadásokban más feladattípusok is támogatottak lesznek.
inputs object A folyamatfeladat bemeneteinek szótára. A kulcs a bemenet neve a feladat kontextusában. Az érték a bemeneti érték.

A folyamat egyes lépésfeladatainak bemenetei hivatkozhatnak ezekre a folyamatbemenetekre a ${{ parent.inputs.<input_name> }} kifejezéssel. A folyamatlépés bemeneteinek a legfelső szintű folyamatfeladat bemeneteihez való kötéséről további információt a Folyamatfeladat lépései közötti kötési bemenetek és kimenetek kifejezésszintaxisában talál.
inputs.<input_name> szám, egész szám, logikai érték, sztring vagy objektum Egy literális érték (típusszám, egész szám, logikai vagy sztring) vagy egy feladat bemeneti adatspecifikációját tartalmazó objektum.
outputs object A folyamatfeladat kimeneti konfigurációinak szótára. A kulcs a feladat környezetében lévő kimenet neve. Az érték a kimeneti konfiguráció.

A folyamat egyes lépésfeladatainak kimenetei hivatkozhatnak ezekre a folyamatkimenetekre a ${{ parents.outputs.<output_name> }} kifejezéssel. A folyamatlépés kimeneteinek a legfelső szintű folyamatfeladat kimeneteihez való kötésével kapcsolatos további információkért tekintse meg a Folyamatfeladat lépései közötti kötési bemenetek és kimenetek kifejezésszintaxisát.
outputs.<output_name> object Üresen hagyhatja az objektumot. Ebben az esetben alapértelmezés szerint a kimenet típusa uri_folderlesz, és az Azure Machine Learning rendszer által generál egy kimeneti helyet a kimenethez az alábbi templatizált elérési út alapján: {settings.datastore}/azureml/{job-name}/{output-name}/. A kimeneti könyvtárba tartozó fájl(ok) írásvédett csatlakoztatással lesznek megírva. Másik kimeneti mód megadásához adjon meg egy objektumot, amely tartalmazza a feladat kimeneti specifikációját.
identity object Az identitás az adathozzáféréshez használatos. Ez lehet UserIdentityConfiguration, ManagedIdentityConfiguration vagy None. UserIdentityConfiguration esetén a feladat-beküldő identitása a bemeneti adatok elérésére és az eredmények kimeneti mappába való írására szolgál, ellenkező esetben a számítási cél felügyelt identitása lesz használva.

A kulcs attribútumai settings

Kulcs Típus Leírás Alapértelmezett érték
default_datastore húr A folyamatfeladat alapértelmezett adattáraként használni kívánt adattár neve. Ennek az értéknek a szintaxist használó meglévő adattárra kell hivatkoznia a azureml:<datastore-name> munkaterületen. A szülőfolyamat-feladat vagy a outputs gyermeklépési feladatok tulajdonságában definiált kimenetek ebben az adattárban vannak tárolva. Ha nincs megadva, a kimenetek a munkaterület blobadattárában lesznek tárolva.
default_compute húr Annak a számítási célnak a neve, amelyet a folyamat összes lépéséhez alapértelmezett számításként szeretne használni. A lépés szintjén definiált számítás felülírja az adott lépés alapértelmezett számítását. Az default_compute értéknek a szintaxist használó azureml:<compute-name> , a munkaterületen meglévő számításra való hivatkozásnak kell lennie.
continue_on_step_failure Logikai Ez a beállítás határozza meg, hogy mi történik, ha a folyamat egy lépése meghiúsul. Alapértelmezés szerint a folyamat akkor is futni fog, ha egy lépés meghiúsul. Ez azt jelenti, hogy a sikertelen lépéstől nem függő lépések végrehajtása továbbra is megtörténik. Ha azonban ezt a beállítást Hamis értékre módosítja, a teljes folyamat leáll, és az aktuálisan futó lépések megszakadnak, ha egy lépés meghiúsul. True
force_rerun Logikai A teljes folyamat újrafuttatásának kényszerítése. Az alapértelmezett érték False. Ez azt jelenti, hogy a folyamat alapértelmezés szerint megpróbálja újra felhasználni az előző feladat kimenetét, ha megfelel az újrafelhasználási feltételeknek. Ha be van állítva, Truea folyamat összes lépése újrafut. False

Feladatbemenetek

Kulcs Típus Leírás Megengedett értékek Alapértelmezett érték
type húr A feladatbemenet típusa. Adja meg uri_file az egyetlen fájlforrásra ható bemeneti adatokat, illetve uri_folder a mappaforrásra ható bemeneti adatokat. További információ: További információ az adathozzáférésről. uri_file, uri_folder, mltablemlflow_model uri_folder
path húr A bemenetként használni kívánt adatok elérési útja. Ez többféleképpen is megadható:

- Az adatforrásfájl vagy -mappa helyi elérési útja, például. path: ./iris.csv Az adatok feltöltése a feladat beküldése során.

- A bemenetként használni kívánt fájl vagy mappa felhőbeli elérési útjának URI-ja. A támogatott URI-típusok a következőkazureml: , https, wasbs, abfssadl. Az URI formátum használatáról további információt a azureml:// Core yaml szintaxisában talál.

– Meglévő regisztrált Azure Machine Learning-adategység bemenetként való használatához. Regisztrált adategységre való hivatkozáshoz használja a azureml:<data_name>:<data_version> szintaxist vagy azureml:<data_name>@latest (az adategység legújabb verziójára való hivatkozáshoz), például vagy path: azureml:cifar10-data:1 path: azureml:cifar10-data@latest.
mode húr Az adatok számítási célba való kézbesítésének módja.

Írásvédett csatlakoztatásro_mount () esetén az adatok csatlakoztatási útvonalként lesznek felhasználva. A mappa mappaként van csatlakoztatva, a fájl pedig fájlként van csatlakoztatva. Az Azure Machine Learning feloldja a csatlakoztatási útvonal bemenetét.

Mód esetén download az adatok a számítási célra lesznek letöltve. Az Azure Machine Learning feloldja a letöltött elérési út bemenetét.

Csak az adatösszetevő vagy -összetevők tárolási helyének URL-címe esetén az adatok csatlakoztatása vagy letöltése helyett használja a direct módot. Ez a feladat bemeneteként a tárolási hely URL-címét adja át. Ebben az esetben teljes mértékben Ön a felelős a tárhoz való hozzáféréshez szükséges hitelesítő adatok kezeléséért.
ro_mount, , downloaddirect ro_mount

Feladatkimenetek

Kulcs Típus Leírás Megengedett értékek Alapértelmezett érték
type húr A feladat kimenetének típusa. Az alapértelmezett uri_folder típus esetében a kimenet egy mappának felel meg. uri_file, uri_folder, mltablemlflow_model uri_folder
mode húr A kimeneti fájl vagy fájlok céltárolóba való kézbesítésének módja. Olvasási-írási csatlakoztatási mód (rw_mount) esetén a kimeneti könyvtár egy csatlakoztatott könyvtár lesz. A feltöltési mód esetében az írott fájl(ok) a feladat végén lesznek feltöltve. rw_mount, upload rw_mount

Identitáskonfigurációk

UserIdentityConfiguration

Kulcs Típus Leírás Megengedett értékek
type Const Szükséges. Identitástípus. user_identity

ManagedIdentityConfiguration

Kulcs Típus Leírás Megengedett értékek
type Const Szükséges. Identitástípus. managed vagy managed_identity

Megjegyzések

A paranccsal kezelheti az az ml job Azure Machine Learning-feladatokat.

Példák

Példákért tekintse meg a GitHub-adattárat . Itt több is látható:

YAML: hello pipeline

$schema: https://azuremlschemas.azureedge.net/latest/pipelineJob.schema.json
type: pipeline
display_name: hello_pipeline
jobs:
  hello_job:
    command: echo "hello"
    environment: azureml://registries/azureml/environments/sklearn-1.5/labels/latest
    compute: azureml:cpu-cluster
  world_job:
    command: echo "world"
    environment: azureml://registries/azureml/environments/sklearn-1.5/labels/latest
    compute: azureml:cpu-cluster

YAML: bemeneti/kimeneti függőség

$schema: https://azuremlschemas.azureedge.net/latest/pipelineJob.schema.json
type: pipeline
display_name: hello_pipeline_io
jobs:
  hello_job:
    command: echo "hello" && echo "world" > ${{outputs.world_output}}/world.txt
    environment: azureml://registries/azureml/environments/sklearn-1.5/labels/latest
    compute: azureml:cpu-cluster
    outputs:
      world_output:
  world_job:
    command: cat ${{inputs.world_input}}/world.txt
    environment: azureml://registries/azureml/environments/sklearn-1.5/labels/latest
    compute: azureml:cpu-cluster
    inputs:
      world_input: ${{parent.jobs.hello_job.outputs.world_output}}

YAML: a folyamatfeladatok gyakori beállításai

$schema: https://azuremlschemas.azureedge.net/latest/pipelineJob.schema.json
type: pipeline
display_name: hello_pipeline_settings

settings:
  default_datastore: azureml:workspaceblobstore
  default_compute: azureml:cpu-cluster
jobs:
  hello_job:
    command: echo 202204190 & echo "hello"
    environment: azureml://registries/azureml/environments/sklearn-1.5/labels/latest
  world_job:
    command: echo 202204190 & echo "hello"
    environment: azureml://registries/azureml/environments/sklearn-1.5/labels/latest

YAML: felső szintű bemenet és a folyamatfeladatok gyakori beállításainak felülbírálása

$schema: https://azuremlschemas.azureedge.net/latest/pipelineJob.schema.json
type: pipeline
display_name: hello_pipeline_abc
settings:
    default_compute: azureml:cpu-cluster
  
inputs:
  hello_string_top_level_input: "hello world"
jobs:
  a:
    command: echo hello ${{inputs.hello_string}}
    environment: azureml://registries/azureml/environments/sklearn-1.5/labels/latest
    inputs:
      hello_string: ${{parent.inputs.hello_string_top_level_input}}
  b:
    command: echo "world" >> ${{outputs.world_output}}/world.txt
    environment: azureml://registries/azureml/environments/sklearn-1.5/labels/latest
    outputs:
      world_output:
  c:
    command: echo ${{inputs.world_input}}/world.txt
    environment: azureml://registries/azureml/environments/sklearn-1.5/labels/latest
    inputs:
      world_input: ${{parent.jobs.b.outputs.world_output}}

Következő lépések