Sdílení modelů, komponent a prostředí napříč pracovními prostory pomocí registrů

Článek
04/09/2024

Registr služby Azure Machine Learning umožňuje spolupracovat napříč pracovními prostory ve vaší organizaci. Pomocí registrů můžete sdílet modely, komponenty a prostředí.

Existují dva scénáře, ve kterých byste chtěli použít stejnou sadu modelů, komponent a prostředí ve více pracovních prostorech:

MLOps mezi pracovními prostory: Trénujete model v dev pracovním prostoru a potřebujete ho nasadit do test pracovních prostorů a prod pracovních prostorů. V takovém případě chcete mít kompletní rodokmen mezi koncovými body, na které je model nasazený v pracovních prostorech nebo prod v test pracovních prostorech, a trénovací úlohou, metrikami, kódem, daty a prostředím, které se použily k trénování modelu v dev pracovním prostoru.
Sdílení a opakované použití modelů a kanálů napříč různými týmy: Sdílení a opakované použití zlepšuje spolupráci a produktivitu. V tomto scénáři můžete chtít publikovat natrénovaný model a přidružené komponenty a prostředí, které se používají k jeho trénování do centrálního katalogu. Odsud můžou kolegové z jiných týmů vyhledávat a opakovaně používat prostředky, které jste sdíleli ve svých vlastních experimentech.

V tomto článku se naučíte:

Vytvořte prostředí a komponentu v registru.
Pomocí komponenty z registru odešlete úlohu trénování modelu v pracovním prostoru.
Zaregistrujte natrénovaný model v registru.
Nasaďte model z registru do online koncového bodu v pracovním prostoru a pak odešlete žádost o odvozování.

Požadavky

Než budete postupovat podle kroků v tomto článku, ujistěte se, že máte následující požadavky:

Předplatné Azure. Pokud ještě nemáte předplatné Azure, vytvořte si napřed bezplatný účet. Vyzkoušejte bezplatnou nebo placenou verzi služby Azure Machine Learning.

Registr služby Azure Machine Learning pro sdílení modelů, komponent a prostředí Pokud chcete vytvořit registr, přečtěte si, jak vytvořit registr.
Pracovní prostor služby Azure Machine Learning. Pokud ho nemáte, vytvořte ho pomocí kroků v rychlém startu : Vytvoření článku o prostředcích pracovního prostoru.

Důležité

Oblast (umístění) Azure, ve které pracovní prostor vytvoříte, musí být v seznamu podporovaných oblastí pro registr služby Azure Machine Learning.
Azure CLI a ml rozšíření nebo sada Azure Machine Learning Python SDK v2:
- Azure CLI
- Python SDK
Pokud chcete nainstalovat Azure CLI a rozšíření, přečtěte si téma Instalace, nastavení a použití rozhraní příkazového řádku (v2).
Důležité
- Příklady rozhraní příkazového řádku v tomto článku předpokládají, že používáte prostředí Bash (nebo kompatibilní). Například ze systému Linux nebo Subsystém Windows pro Linux.
- V příkladech se také předpokládá, že jste pro Azure CLI nakonfigurovali výchozí hodnoty, abyste nemuseli zadávat parametry pro vaše předplatné, pracovní prostor, skupinu prostředků nebo umístění. Pokud chcete nastavit výchozí nastavení, použijte následující příkazy. Nahraďte následující parametry hodnotami pro vaši konfiguraci:
  
  <subscription> nahraďte ID vašeho předplatného Azure.
  
  Nahraďte <workspace> názvem pracovního prostoru služby Azure Machine Learning.
  
  Nahraďte <resource-group> skupinou prostředků Azure, která obsahuje váš pracovní prostor.
  
  Nahraďte <location> oblastí Azure, která obsahuje váš pracovní prostor.
  
  az account set --subscription <subscription> az configure --defaults workspace=<workspace> group=<resource-group> location=<location>
  
  Pomocí příkazu můžete zjistit, jaké jsou az configure -l vaše aktuální výchozí hodnoty.
K instalaci sady Python SDK v2 použijte následující příkaz:
```
pip install --pre --upgrade azure-ai-ml azure-identity
```

Úložiště klonování příkladů

Příklady kódu v tomto článku jsou založené na nyc_taxi_data_regression ukázce v úložišti příkladů. Pokud chcete tyto soubory použít ve vývojovém prostředí, naklonujte úložiště pomocí následujících příkazů a změňte adresáře na příklad:

git clone https://github.com/Azure/azureml-examples
cd azureml-examples

Azure CLI
Python SDK

V příkladu rozhraní příkazového řádku změňte adresáře na cli/jobs/pipelines-with-components/nyc_taxi_data_regression místní klon úložiště příkladů.

cd cli/jobs/pipelines-with-components/nyc_taxi_data_regression

V příkladu sady Python SDK použijte ukázku nyc_taxi_data_regression z úložiště příkladů. Ukázkový poznámkový blok, share-models-components-environment.ipynb, je k dispozici ve sdk/python/assets/assets-in-registry složce. Všechny ukázkové YAML pro komponenty, trénovací kód modelu, ukázková data pro trénování a odvozování jsou k dispozici v cli/jobs/pipelines-with-components/nyc_taxi_data_regression. Přejděte do sdk/resources/registry adresáře a otevřete share-models-components-environments.ipynb poznámkový blok, pokud chcete procházet poznámkový blok a vyzkoušet kód v tomto dokumentu.

Vytvoření připojení sady SDK

Tip

Tento krok je potřeba jenom při použití sady Python SDK.

Vytvořte připojení klienta k pracovnímu prostoru Azure Machine Learning i registru:

ml_client_workspace = MLClient( credential=credential,
    subscription_id = "<workspace-subscription>",
    resource_group_name = "<workspace-resource-group",
    workspace_name = "<workspace-name>")
print(ml_client_workspace)

ml_client_registry = MLClient(credential=credential,
                        registry_name="<REGISTRY_NAME>",
                        registry_location="<REGISTRY_REGION>")
print(ml_client_registry)

Vytvoření prostředí v registru

Prostředí definují kontejner Dockeru a závislosti Pythonu potřebné ke spouštění trénovacích úloh nebo nasazování modelů. Další informace o prostředích najdete v následujících článcích:

Azure CLI
Python SDK

Tip

Stejný příkaz az ml environment create rozhraní příkazového řádku lze použít k vytvoření prostředí v pracovním prostoru nebo registru. Spuštění příkazu příkazem --workspace-name vytvoří prostředí v pracovním prostoru, zatímco spuštěním příkazu --registry-name vytvoříte prostředí v registru.

Vytvoříme prostředí, které používá image Dockeru python:3.8 a nainstaluje balíčky Pythonu potřebné ke spuštění trénovací úlohy pomocí architektury SciKit Learn. Pokud jste naklonovali úložiště příkladů a nacházíte se ve složce cli/jobs/pipelines-with-components/nyc_taxi_data_regression, měli byste být schopni zobrazit definiční soubor env_train.yml prostředí, který odkazuje na soubor env_train/DockerfileDockeru . Níže env_train.yml je znázorněno pro vaši referenci:

$schema: https://azuremlschemas.azureedge.net/latest/environment.schema.json
name: SKLearnEnv
version: 1
build:
  path: ./env_train

Vytvořte prostředí následujícím az ml environment create způsobem:

az ml environment create --file env_train.yml --registry-name <registry-name>

Pokud se zobrazí chyba, že prostředí s tímto názvem a verzí již v registru existuje, můžete pole env_train.yml upravit version nebo zadat jinou verzi v rozhraní příkazového řádku, která přepíše hodnotu verze v env_train.yml.

# use shell epoch time as the version
version=$(date +%s)
az ml environment create --file env_train.yml --registry-name <registry-name> --set version=$version

Tip

version=$(date +%s) funguje jenom v Linuxu. Pokud to nepomůže, nahraďte $version náhodným číslem.

name Poznamenejte si a version prostředí z výstupu az ml environment create příkazu a použijte je s az ml environment show příkazy následujícím způsobem. Při vytváření komponenty v registru budete potřebovat komponentu name a version v další části.

az ml environment show --name SKLearnEnv --version 1 --registry-name <registry-name>

Tip

Pokud jste použili jiný název nebo verzi prostředí, nahraďte parametry --name odpovídajícím --version způsobem.

Můžete také použít az ml environment list --registry-name <registry-name> k výpisu všech prostředí v registru.

Tip

Totéž MLClient.environments.create_or_update() lze použít k vytvoření prostředí v pracovním prostoru nebo registru v závislosti na cíli, se kterým byl inicializován. Vzhledem k tomu, že pracujete s pracovním prostorem i registrem v tomto dokumentu, inicializovali ml_client_workspace jste pracovní prostor a registr a ml_client_registry mohli pracovat s pracovním prostorem a registrem.

Vytvoříme prostředí, které používá image Dockeru python:3.8 a nainstaluje balíčky Pythonu potřebné ke spuštění trénovací úlohy pomocí architektury SciKit Learn. Základní Dockerfile image a seznam balíčků Pythonu, které se mají nainstalovat, jsou k dispozici v cli/jobs/pipelines-with-components/nyc_taxi_data_regression/env_train. Inicializuje objekt prostředí a vytvoří prostředí.

env_docker_context = Environment(
    build=BuildContext(path="../../../../cli/jobs/pipelines-with-components/nyc_taxi_data_regression/env_train/"),
    name="SKLearnEnv",
    version=str(1),
    description="Scikit Learn environment",
)
ml_client_registry.environments.create_or_update(env_docker_context)

Tip

Pokud se zobrazí chyba, že prostředí s tímto názvem a verzí již v registru existuje, zadejte jinou verzi parametru version .

name Poznamenejte si a version prostředí z výstupu a předejte je ml_client_registry.environments.get() metodě pro načtení prostředí z registru.

Můžete také použít ml_client_registry.environments.list() k výpisu všech prostředí v registru.

Můžete procházet všechna prostředí v studio Azure Machine Learning. Nezapomeňte přejít do globálního uživatelského rozhraní a vyhledat položku Registry .

Vytvoření komponenty v registru

Komponenty jsou opakovaně použitelné stavební bloky kanálů Machine Learning ve službě Azure Machine Learning. Kód, příkaz, prostředí, vstupní rozhraní a výstupní rozhraní jednotlivých kroků kanálu můžete zabalit do komponenty. Potom můžete komponentu znovu použít napříč několika kanály, aniž byste se museli starat o přenos závislostí a kódu pokaždé, když napíšete jiný kanál.

Vytvoření komponenty v pracovním prostoru umožňuje použít tuto komponentu v libovolné úloze kanálu v daném pracovním prostoru. Vytvoření komponenty v registru umožňuje použít tuto komponentu v libovolném kanálu v libovolném pracovním prostoru ve vaší organizaci. Vytváření komponent v registru je skvělý způsob, jak vytvářet modulární opakovaně použitelné nástroje nebo sdílené trénovací úkoly, které můžou používat k experimentování různými týmy ve vaší organizaci.

Další informace o součástech najdete v následujících článcích:

Koncepty komponent
Jak používat komponenty v kanálech (CLI)
Jak používat komponenty v kanálech (SDK)

Důležité

Podpora registru má pouze pojmenované prostředky (data/model/komponenta/prostředí). Pokud chcete odkazovat na prostředek v registru, musíte ho nejprve vytvořit v registru. Zejména pro případ součásti kanálu, pokud chcete odkazovat komponentu nebo prostředí v komponentě kanálu, musíte nejprve vytvořit komponentu nebo prostředí v registru.

Azure CLI
Python SDK

Ujistěte se, že jste ve složce cli/jobs/pipelines-with-components/nyc_taxi_data_regression. Najdete soubor definice train.yml komponenty, který zabalí trénovací skript train_src/train.py Scikit Learn a kurátorované prostředí AzureML-sklearn-0.24-ubuntu18.04-py37-cpu. Místo kurátorovaných prostředí použijeme prostředí Scikit Learn vytvořené v podrobném kroku. Pole můžete upravit environment tak train.yml , aby odkazovat na prostředí Scikit Learn. Výsledný definiční soubor train.yml komponenty bude podobný následujícímu příkladu:

# <component>
$schema: https://azuremlschemas.azureedge.net/latest/commandComponent.schema.json
name: train_linear_regression_model
display_name: TrainLinearRegressionModel
version: 1
type: command
inputs:
  training_data: 
    type: uri_folder
  test_split_ratio:
    type: number
    min: 0
    max: 1
    default: 0.2
outputs:
  model_output:
    type: mlflow_model
  test_data:
    type: uri_folder
code: ./train_src
environment: azureml://registries/<registry-name>/environments/SKLearnEnv/versions/1`
command: >-
  python train.py 
  --training_data ${{inputs.training_data}} 
  --test_data ${{outputs.test_data}} 
  --model_output ${{outputs.model_output}}
  --test_split_ratio ${{inputs.test_split_ratio}}

Pokud jste použili jiný název nebo verzi, obecnější reprezentace vypadá takto: environment: azureml://registries/<registry-name>/environments/<sklearn-environment-name>/versions/<sklearn-environment-version>, proto nezapomeňte nahradit a <registry-name><sklearn-environment-name> <sklearn-environment-version> odpovídajícím způsobem. Potom spuštěním az ml component create příkazu vytvořte komponentu následujícím způsobem.

az ml component create --file train.yml --registry-name <registry-name>

Tip

Stejný příkaz az ml component create rozhraní příkazového řádku můžete použít k vytvoření komponent v pracovním prostoru nebo registru. Spuštění příkazu s příkazem --workspace-name vytvoří komponentu v pracovním prostoru, zatímco spuštění příkazu s příkazem --registry-name vytvoří komponentu v registru.

Pokud nechcete název prostředí upravovat train.yml, můžete název prostředí v rozhraní příkazového řádku přepsat následujícím způsobem:

az ml component create --file train.yml --registry-name <registry-name>` --set environment=azureml://registries/<registry-name>/environments/SKLearnEnv/versions/1
# or if you used a different name or version, replace `<sklearn-environment-name>` and `<sklearn-environment-version>` accordingly
az ml component create --file train.yml --registry-name <registry-name>` --set environment=azureml://registries/<registry-name>/environments/<sklearn-environment-name>/versions/<sklearn-environment-version>

Tip

Pokud se zobrazí chyba, že název komponenty již v registru existuje, můžete buď upravit verzi v train.yml rozhraní příkazového řádku, nebo ji přepsat náhodnou verzí.

name Poznamenejte si a version komponentu z výstupu az ml component create příkazu a použijte je s az ml component show příkazy následujícím způsobem. Při vytváření úlohy trénování v pracovním prostoru budete potřebovat a name version v další části.

az ml component show --name <component_name> --version <component_version> --registry-name <registry-name>

Můžete také použít az ml component list --registry-name <registry-name> k výpisu všech komponent v registru.

Projděte si definiční soubor train.yml komponenty a kód train_src/train.py Pythonu a natrénujte regresní model pomocí knihovny Scikit Learn, která je k dispozici ve cli/jobs/pipelines-with-components/nyc_taxi_data_regression složce. Načtěte objekt komponenty z definičního souboru train.ymlkomponenty .

parent_dir = "../../../../cli/jobs/pipelines-with-components/nyc_taxi_data_regression"
train_model = load_component(path=parent_dir + "/train.yml")
print(train_model)

environment Aktualizujte bod na SKLearnEnv prostředí vytvořené v předchozí části a vytvořte prostředí.

train_model.environment=env_from_registry
ml_client_registry.components.create_or_update(train_model)

Tip

Pokud se zobrazí chyba, že název komponenty již v registru existuje, můžete před vytvořením komponenty aktualizovat verzi train_model.version=<unique_version_number> .

name Poznamenejte si a version komponentu z výstupu a předejte je ml_client_registry.components.get() metodě pro načtení komponenty z registru.

Můžete také použít ml_client_registry.components.list() k výpisu všech komponent v registru nebo procházení všech komponent v uživatelském rozhraní studio Azure Machine Learning. Ujistěte se, že přejdete do globálního uživatelského rozhraní a vyhledáte centrum Registry.

Můžete procházet všechny komponenty v studio Azure Machine Learning. Nezapomeňte přejít do globálního uživatelského rozhraní a vyhledat položku Registry .

Spuštění úlohy kanálu v pracovním prostoru pomocí komponenty z registru

Při spuštění úlohy kanálu, která používá komponentu z registru, jsou výpočetní prostředky a trénovací data pro pracovní prostor místní. Další informace o spouštění úloh najdete v následujících článcích:

Azure CLI
Python SDK

Spustíme úlohu kanálu s trénovací komponentou Scikit Learn vytvořenou v předchozí části pro trénování modelu. Zkontrolujte, že jste ve složce cli/jobs/pipelines-with-components/nyc_taxi_data_regression. Trénovací datová sada se nachází ve data_transformed složce. component Upravte oddíl v části train_job single-job-pipeline.yml souboru tak, aby odkazovat na trénovací komponentu vytvořenou v předchozí části. Výsledek single-job-pipeline.yml je zobrazený níže.

$schema: https://azuremlschemas.azureedge.net/latest/pipelineJob.schema.json
type: pipeline
display_name: nyc_taxi_data_regression_single_job
description: Single job pipeline to train regression model based on nyc taxi dataset

jobs:
  train_job:
    type: command
    component: azureml://registries/<registry-name>/component/train_linear_regression_model/versions/1
    compute: azureml:cpu-cluster
    inputs:
      training_data: 
        type: uri_folder
        path: ./data_transformed
    outputs:
      model_output: 
        type: mlflow_model
      test_data:

Klíčovým aspektem je, že tento kanál se bude spouštět v pracovním prostoru pomocí komponenty, která není v konkrétním pracovním prostoru. Komponenta je v registru, který lze použít s jakýmkoli pracovním prostorem ve vaší organizaci. Tuto trénovací úlohu můžete spustit v jakémkoli pracovním prostoru, ke kterému máte přístup, aniž byste se museli starat o zpřístupnění trénovacího kódu a prostředí v tomto pracovním prostoru.

Upozorňující

Před spuštěním úlohy kanálu ověřte, že pracovní prostor, ve kterém budete úlohu spouštět, je v oblasti Azure, kterou podporuje registr, ve kterém jste vytvořili komponentu.
Ověřte, že má pracovní prostor výpočetní cluster s názvem cpu-cluster nebo upravte compute pole pod jobs.train_job.compute názvem vašeho výpočetního prostředí.

Spusťte úlohu kanálu pomocí az ml job create příkazu.

az ml job create --file single-job-pipeline.yml

Tip

Pokud jste nenakonfigurovali výchozí pracovní prostor a skupinu prostředků, jak je vysvětleno v části Požadavky, budete muset zadat --workspace-name parametry, --resource-group které az ml job create budou fungovat.

Případně můžete přeskočit úpravy single-job-pipeline.yml a přepsat název komponenty používaný train_job v rozhraní příkazového řádku.

az ml job create --file single-job-pipeline.yml --set jobs.train_job.component=azureml://registries/<registry-name>/component/train_linear_regression_model/versions/1

Vzhledem k tomu, že komponenta použitá v úloze trénování se sdílí prostřednictvím registru, můžete ji odeslat do libovolného pracovního prostoru, ke kterému máte přístup ve vaší organizaci, a to i v různých předplatných. Pokud máte například dev-workspacetest-workspace a prod-workspacespuštění trénovací úlohy v těchto třech pracovních prostorech je stejně snadné jako spuštění tří az ml job create příkazů.

az ml job create --file single-job-pipeline.yml --workspace-name dev-workspace --resource-group <resource-group-of-dev-workspace>
az ml job create --file single-job-pipeline.yml --workspace-name test-workspace --resource-group <resource-group-of-test-workspace>
az ml job create --file single-job-pipeline.yml --workspace-name prod-workspace --resource-group <resource-group-of-prod-workspace>

Spustíte úlohu kanálu s trénovací komponentou Scikit Learn vytvořenou v předchozí části pro trénování modelu. Trénovací datová sada se nachází ve cli/jobs/pipelines-with-components/nyc_taxi_data_regression/data_transformed složce. Vytvořte kanál pomocí komponenty vytvořené v předchozím kroku.

@pipeline()
def pipeline_with_registered_components(
    training_data
):
    train_job = train_component_from_registry(
        training_data=training_data,
    )
pipeline_job = pipeline_with_registered_components(
    training_data=Input(type="uri_folder", path=parent_dir + "/data_transformed/"),
)
pipeline_job.settings.default_compute = "cpu-cluster"
print(pipeline_job)

Upozorňující

Před spuštěním úlohy kanálu ověřte, že pracovní prostor, ve kterém tuto úlohu spustíte, je v umístění Azure podporovaném registrem, ve kterém jste vytvořili součást.
Ověřte, že má pracovní prostor výpočetní cluster s názvem cpu-cluster nebo ho pipeline_job.settings.default_compute=<compute-cluster-name>aktualizujte.

Spusťte úlohu kanálu a počkejte na dokončení.

pipeline_job = ml_client_workspace.jobs.create_or_update(
    pipeline_job, experiment_name="sdk_job_component_from_registry" ,  skip_validation=True
)
ml_client_workspace.jobs.stream(pipeline_job.name)
pipeline_job=ml_client_workspace.jobs.get(pipeline_job.name)
pipeline_job

Tip

Všimněte si, že používáte ml_client_workspace ke spuštění úlohy kanálu, zatímco jste použili ml_client_registry k vytvoření prostředí a komponenty.

Vzhledem k tomu, že komponenta použitá v úloze trénování se sdílí prostřednictvím registru, můžete ji odeslat do libovolného pracovního prostoru, ke kterému máte přístup ve vaší organizaci, a to i v různých předplatných. Pokud dev-workspacetest-workspace máte například a prod-workspace, můžete se k těmto pracovním prostorům připojit a znovu odeslat úlohu.

V studio Azure Machine Learning výběrem odkazu na koncový bod ve výstupu úlohy zobrazte úlohu. Tady můžete analyzovat trénovací metriky, ověřit, že úloha používá komponentu a prostředí z registru, a zkontrolovat natrénovaný model. name Poznamenejte si úlohu z výstupu nebo vyhledejte stejné informace z přehledu úlohy v studio Azure Machine Learning. Tyto informace budete potřebovat ke stažení natrénovaného modelu v další části o vytváření modelů v registru.

Vytvoření modelu v registru

V této části se dozvíte, jak vytvořit modely v registru. Další informace o správě modelů ve službě Azure Machine Learning najdete v tématu Správa modelů. Podíváme se na dva různé způsoby vytvoření modelu v registru. První je z místních souborů. Zadruhé je zkopírování modelu zaregistrovaného v pracovním prostoru do registru.

V obou možnostech vytvoříte model s formátem MLflow, který vám pomůže tento model nasadit pro odvozování bez psaní kódu odvozování.

Vytvoření modelu v registru z místních souborů

Azure CLI
Python SDK

Stáhněte si model, který je k dispozici jako výstup train_job , nahrazením <job-name> názvu z úlohy z předchozí části. Model spolu se soubory metadat MLflow by měl být k dispozici v souboru ./artifacts/model/.

# fetch the name of the train_job by listing all child jobs of the pipeline job
train_job_name=$(az ml job list --parent-job-name <job-name> --query [0].name | sed 's/\"//g')
# download the default outputs of the train_job
az ml job download --name $train_job_name 
# review the model files
ls -l ./artifacts/model/

Tip

Upozorňující

Výstup az ml job list je předán do sed. Funguje to jenom v linuxových prostředích. Pokud používáte Windows, spusťte az ml job list --parent-job-name <job-name> --query [0].name a odstraňte všechny uvozovky, které vidíte v názvu úlohy vlaku.

Pokud nemůžete stáhnout model, najdete ukázkový model MLflow natrénovaný úlohou trénování v předchozí části ve cli/jobs/pipelines-with-components/nyc_taxi_data_regression/artifacts/model/ složce.

Vytvořte model v registru:

# create model in registry
az ml model create --name nyc-taxi-model --version 1 --type mlflow_model --path ./artifacts/model/ --registry-name <registry-name>

Tip

Pokud se zobrazí chyba názvu a verze modelu, použijte pro version parametr náhodné číslo.
Stejný příkaz az ml model create rozhraní příkazového řádku můžete použít k vytváření modelů v pracovním prostoru nebo registru. Spuštění příkazu příkazem --workspace-name vytvoří model v pracovním prostoru, zatímco spuštění příkazu s příkazem --registry-name vytvoří model v registru.

Nezapomeňte použít pipeline_job objekt z předchozí části nebo načíst úlohu kanálu pomocí ml_client_workspace.jobs.get(name="<pipeline-job-name>") metody k získání seznamu podřízených úloh v kanálu. Pak vyhledáte úlohu jako display_name train_job a stáhnete natrénovaný model z train_job výstupu. Stažený model spolu se soubory metadat MLflow by měl být k dispozici v souboru ./artifacts/model/.

jobs=ml_client_workspace.jobs.list(parent_job_name=pipeline_job.name)
for job in jobs:
    if (job.display_name == "train_job"):
        print (job.name)
        ml_client_workspace.jobs.download(job.name)

Pokud nemůžete stáhnout model, najdete ukázkový model MLflow natrénovaný úlohou trénování v předchozí části ve sdk/resources/registry/model složce.

Vytvořte model v registru.

mlflow_model = Model(
    path="./artifacts/model/",
    type=AssetTypes.MLFLOW_MODEL,
    name="nyc-taxi-model",
    version=str(1), # use str(int(time.time())) if you want a random model number
    description="MLflow model created from local path",
)
ml_client_registry.models.create_or_update(mlflow_model)

V tomto pracovním postupu nejprve vytvoříte model v pracovním prostoru a pak ho nasdílíte do registru. Tento pracovní postup je užitečný, pokud chcete model před sdílením otestovat v pracovním prostoru. Můžete ho například nasadit do koncových bodů, vyzkoušet odvozování s některými testovacími daty a pak model zkopírovat do registru, pokud všechno vypadá dobře. Tento pracovní postup může být užitečný také při vývoji řady modelů pomocí různých technik, architektur nebo parametrů a chcete upřednostnit pouze jeden z nich do registru jako produkčního kandidáta.

Azure CLI
Python SDK

Ujistěte se, že máte název úlohy kanálu z předchozí části, a nahraďte ji v příkazu, abyste mohli načíst název trénovací úlohy níže. Pak model zaregistrujete z výstupu trénovací úlohy do pracovního prostoru. Všimněte si, jak --path parametr odkazuje na výstup train_job s syntaxí azureml://jobs/$train_job_name/outputs/artifacts/paths/model .

# fetch the name of the train_job by listing all child jobs of the pipeline job
train_job_name=$(az ml job list --parent-job-name <job-name> --workspace-name <workspace-name> --resource-group <workspace-resource-group> --query [0].name | sed 's/\"//g')
# create model in workspace
az ml model create --name nyc-taxi-model --version 1 --type mlflow_model --path azureml://jobs/$train_job_name/outputs/artifacts/paths/model

Tip

Pokud se zobrazí chyba názvu modelu a verze, použijte pro version parametr náhodné číslo.
Pokud jste nenakonfigurovali výchozí pracovní prostor a skupinu prostředků, jak je vysvětleno v části Požadavky, budete muset zadat --workspace-name parametry, --resource-group které az ml model create budou fungovat.

Poznamenejte si název a verzi modelu. Pokud je model zaregistrovaný v pracovním prostoru, můžete ho ověřit tak, že ho přejdete v uživatelském rozhraní studia nebo pomocí az ml model show --name nyc-taxi-model --version $model_version příkazu.

V dalším kroku budete model sdílet z pracovního prostoru do registru.

# share model registered in workspace to registry
az ml model share --name nyc-taxi-model --version 1 --registry-name <registry-name> --share-with-name <new-name> --share-with-version <new-version>

Tip

Pokud jste ho az ml model create v příkazu změnili, nezapomeňte použít správný název a verzi modelu.
Výše uvedený příkaz obsahuje dva volitelné parametry --share-with-name a --share-with-version. Pokud tento nový model nezadá, bude mít stejný název a verzi jako model, který se sdílí. name Poznamenejte si model a version z výstupu az ml model create příkazu a použijte je s následujícími az ml model show příkazy. Při nasazení modelu do online koncového bodu k odvozování budete potřebovat name model a version v další části.

az ml model show --name <model_name> --version <model_version> --registry-name <registry-name>

Můžete také použít az ml model list --registry-name <registry-name> k výpisu všech modelů v registru nebo procházení všech komponent v uživatelském rozhraní studio Azure Machine Learning. Ujistěte se, že přejdete do globálního uživatelského rozhraní a vyhledáte centrum Registry.

Nezapomeňte použít pipeline_job objekt z předchozí části nebo načíst úlohu kanálu pomocí ml_client_workspace.jobs.get(name="<pipeline-job-name>") metody k získání seznamu podřízených úloh v kanálu. Pak vyhledáte úlohu jako display_name train_job a použijete name train_job ji k vytvoření cesty odkazující na výstup modelu, který vypadá takto: azureml://jobs/<job_name>/outputs/artifacts/paths/model

jobs=ml_client_workspace.jobs.list(parent_job_name=pipeline_job.name)
for job in jobs:
    if (job.display_name == "train_job"):
        print (job.name)
        model_path_from_job="azureml://jobs/{job_name}/outputs/artifacts/paths/model".format(job_name=job.name)

print(model_path_from_job)

Pomocí výše vytvořené cesty zaregistrujte model z výstupu trénovací úlohy do pracovního prostoru.

mlflow_model = Model(
    path=model_path_from_job,
    type=AssetTypes.MLFLOW_MODEL,
    name="nyc-taxi-model",
    version=version_timestamp,
    description="MLflow model created from job output",
)
ml_client_workspace.models.create_or_update(mlflow_model)

Tip

Všimněte si, že používáte objekt ml_client_workspace MLClient, protože vytváříte model v pracovním prostoru.

Poznamenejte si název a verzi modelu. Pokud je model zaregistrovaný v pracovním prostoru, můžete ho ověřit tak, že ho přejdete do uživatelského rozhraní studia nebo ho načtete pomocí ml_client_workspace.model.get() metody.

V dalším kroku budete model sdílet z pracovního prostoru do registru.

# share the model from registry to workspace
ml_client.models.share(name="nyc-taxi-model", version=1, registry_name=<registry_name>, share_with_name=<new-name>, share_with_version=<new-version>)

Tip

Výše uvedený kód má dva volitelné parametry "share-with-name" a "share-with-version". Pokud tento nový model nezadá, bude mít stejný název a verzi jako model, který se sdílí.

name Poznamenejte si výstup a version model a použijte je s následujícími ml_client_workspace.model.get() příkazy. Při nasazení modelu do online koncového bodu k odvozování budete potřebovat name model a version v další části.

mlflow_model_from_registry = ml_client_registry.models.get(name="nyc-taxi-model", version=str(1))
print(mlflow_model_from_registry)

Můžete také použít ml_client_registry.models.list() k výpisu všech modelů v registru nebo procházení všech komponent v uživatelském rozhraní studio Azure Machine Learning. Ujistěte se, že přejdete do globálního uživatelského rozhraní a vyhledáte centrum Registry.

Následující snímek obrazovky ukazuje model v registru v studio Azure Machine Learning. Pokud jste vytvořili model z výstupu úlohy a zkopírovali ho z pracovního prostoru do registru, uvidíte, že model obsahuje odkaz na úlohu, která model natrénovala. Pomocí odkazu můžete přejít na trénovací úlohu a zkontrolovat kód, prostředí a data použitá k trénování modelu.

Nasazení modelu z registru do online koncového bodu v pracovním prostoru

V poslední části nasadíte model z registru do online koncového bodu v pracovním prostoru. Můžete se rozhodnout nasadit libovolný pracovní prostor, ke kterým máte přístup ve vaší organizaci, za předpokladu, že umístění pracovního prostoru je jedním z umístění podporovaných registrem. Tato funkce je užitečná, pokud jste model vytrénovali v dev pracovním prostoru a teď potřebujete model nasadit do pracovního prostoru nebo prod do test pracovního prostoru a současně zachovat informace rodokmenu týkající se kódu, prostředí a dat používaných k trénování modelu.

Online koncové body umožňují nasadit modely a odesílat žádosti o odvozování prostřednictvím rozhraní REST API. Další informace najdete v tématu Nasazení a určení skóre modelu strojového učení pomocí online koncového bodu.

Azure CLI
Python SDK

Vytvořte online koncový bod.

az ml online-endpoint create --name reg-ep-1234

model: Aktualizujte řádek deploy.yml dostupný ve cli/jobs/pipelines-with-components/nyc_taxi_data_regression složce tak, aby odkazovat na název a verzi modelu z podrobného kroku. Vytvořte online nasazení do online koncového bodu. Níže deploy.yml je uveden odkaz.

$schema: https://azuremlschemas.azureedge.net/latest/managedOnlineDeployment.schema.json
name: demo
endpoint_name: reg-ep-1234
model: azureml://registries/<registry-name>/models/nyc-taxi-model/versions/1
instance_type: Standard_DS2_v2
instance_count: 1

Vytvořte online nasazení. Dokončení nasazení trvá několik minut.

az ml online-deployment create --file deploy.yml --all-traffic

Načtěte identifikátor URI bodování a odešlete ukázkový požadavek na bodování. Ukázková data pro žádost o bodování jsou k dispozici ve scoring-data.json cli/jobs/pipelines-with-components/nyc_taxi_data_regression složce.

ENDPOINT_KEY=$(az ml online-endpoint get-credentials -n reg-ep-1234 -o tsv --query primaryKey)
SCORING_URI=$(az ml online-endpoint show -n reg-ep-1234 -o tsv --query scoring_uri)
curl --request POST "$SCORING_URI" --header "Authorization: Bearer $ENDPOINT_KEY" --header 'Content-Type: application/json' --data @./scoring-data.json

Tip

curl příkaz funguje jenom v Linuxu.
Pokud jste nenakonfigurovali výchozí pracovní prostor a skupinu prostředků, jak je vysvětleno v části Požadavky, budete muset zadat --workspace-name a --resource-group parametry pro fungování az ml online-endpoint příkazů a az ml online-deployment příkazů.

Vytvořte online koncový bod.

online_endpoint_name = "endpoint-" + datetime.datetime.now().strftime("%m%d%H%M%f")
endpoint = ManagedOnlineEndpoint(
    name=online_endpoint_name,
    description="this is a sample online endpoint for mlflow model",
    auth_mode="key"
)
ml_client_workspace.begin_create_or_update(endpoint)

Ujistěte se, že máte mlflow_model_from_registry objekt modelu z předchozí části nebo načtěte model z registru pomocí ml_client_registry.models.get() metody. Předejte ho do objektu konfigurace nasazení a vytvořte online nasazení. Dokončení nasazení trvá několik minut. Nastavte veškerý provoz, který se má směrovat do nového nasazení.

demo_deployment = ManagedOnlineDeployment(
    name="demo",
    endpoint_name=online_endpoint_name,
    model=mlflow_model_from_registry,
    instance_type="Standard_F4s_v2",
    instance_count=1
)
ml_client_workspace.online_deployments.begin_create_or_update(demo_deployment)

endpoint.traffic = {"demo": 100}
ml_client_workspace.begin_create_or_update(endpoint)

Odešlete ukázkovou žádost o bodování pomocí ukázkového datového souboru scoring-data.json. Tento soubor je k dispozici ve cli/jobs/pipelines-with-components/nyc_taxi_data_regression složce.

# test the  deployment with some sample data
ml_client_workspace.online_endpoints.invoke(
    endpoint_name=online_endpoint_name,
    deployment_name="demo",
    request_file=parent_dir + "/scoring-data.json"
)

Vyčištění prostředků

Pokud nasazení nepoužíváte, měli byste ho odstranit, abyste snížili náklady. Následující příklad odstraní koncový bod a všechna základní nasazení:

Azure CLI
Python SDK

az ml online-endpoint delete --name reg-ep-1234 --yes --no-wait

ml_client_workspace.online_endpoints.begin_delete(name=online_endpoint_name)

Sdílet prostřednictvím

Požadavky

Úložiště klonování příkladů

Vytvoření připojení sady SDK

Vytvoření prostředí v registru

Vytvoření komponenty v registru

Spuštění úlohy kanálu v pracovním prostoru pomocí komponenty z registru

Vytvoření modelu v registru

Vytvoření modelu v registru z místních souborů

Nasazení modelu z registru do online koncového bodu v pracovním prostoru

Vyčištění prostředků

Další kroky

Váš názor

Váš názor

Další materiály

Sdílet prostřednictvím

Požadavky

Úložiště klonování příkladů

Vytvoření připojení sady SDK

Vytvoření prostředí v registru

Vytvoření komponenty v registru

Spuštění úlohy kanálu v pracovním prostoru pomocí komponenty z registru

Vytvoření modelu v registru

Vytvoření modelu v registru z místních souborů

Sdílení modelu z pracovního prostoru do registru

Nasazení modelu z registru do online koncového bodu v pracovním prostoru

Vyčištění prostředků

Další kroky

Váš názor

Váš názor

Další materiály