Bestaande pijplijntaken implementeren op batch-eindpunten

Artikel
04/07/2024

VAN TOEPASSING OP:Azure CLI ml extension v2 (current)Python SDK azure-ai-ml v2 (current)

Met Batch-eindpunten kunt u pijplijnonderdelen implementeren, wat een handige manier biedt om pijplijnen in Azure Machine Learning operationeel te maken. Batch-eindpunten accepteren pijplijnonderdelen voor implementatie. Als u echter al een pijplijntaak hebt die succesvol wordt uitgevoerd, kan Azure Machine Learning die taak accepteren als invoer voor uw batch-eindpunt en het pijplijnonderdeel automatisch voor u maken. In dit artikel leert u hoe u uw bestaande pijplijntaak gebruikt als invoer voor batchimplementatie.

U leert het volgende:

De pijplijntaak uitvoeren en maken die u wilt implementeren
Een batchimplementatie maken op basis van de bestaande taak
De implementatie testen

Over dit voorbeeld

In dit voorbeeld gaan we een pijplijn implementeren die bestaat uit een eenvoudige opdrachttaak waarmee 'hallo wereld!' wordt afgedrukt. In plaats van het pijplijnonderdeel vóór de implementatie te registreren, geven we een bestaande pijplijntaak aan die moet worden gebruikt voor implementatie. Azure Machine Learning maakt vervolgens automatisch het pijplijnonderdeel en implementeert het als een pijplijnonderdeel voor batcheindpunten.

Het voorbeeld in dit artikel is gebaseerd op codevoorbeelden in de opslagplaats azureml-examples . Als u de opdrachten lokaal wilt uitvoeren zonder YAML en andere bestanden te hoeven kopiëren/plakken, kloont u eerst de opslagplaats en wijzigt u vervolgens mappen in de map:

Azure-CLI
Python

git clone https://github.com/Azure/azureml-examples --depth 1
cd azureml-examples/cli

git clone https://github.com/Azure/azureml-examples --depth 1
cd azureml-examples/sdk/python

De bestanden voor dit voorbeeld bevinden zich in:

cd endpoints/batch/deploy-pipelines/hello-batch

Vereisten

Voordat u de stappen in dit artikel volgt, moet u ervoor zorgen dat u over de volgende vereisten beschikt:

Een Azure-abonnement. Als u nog geen abonnement op Azure hebt, maak dan een gratis account aan voordat u begint. Probeer de gratis of betaalde versie van Azure Machine Learning.
Een Azure Machine Learning-werkruimte. Als u nog geen werkruimte hebt, gebruikt u de stappen in het artikel Azure Machine Learning-werkruimten beheren om er een te maken.
Zorg ervoor dat u over de volgende machtigingen in de werkruimte beschikt:
- Batch-eindpunten en -implementaties maken of beheren: gebruik een eigenaar, inzender of aangepaste rol die dit toestaat Microsoft.MachineLearningServices/workspaces/batchEndpoints/*.
- ARM-implementaties maken in de resourcegroep van de werkruimte: gebruik een eigenaar, inzender of aangepaste rol die het mogelijk maakt Microsoft.Resources/deployments/write in de resourcegroep waarin de werkruimte wordt geïmplementeerd.
U moet de volgende software installeren om te kunnen werken met Azure Machine Learning:
- Azure-CLI
- Python
De Azure CLI en de ml extensie voor Azure Machine Learning.
```
az extension add -n ml
```
Notitie

Implementaties van pijplijnonderdelen voor Batch-eindpunten zijn geïntroduceerd in versie 2.7 van de ml extensie voor Azure CLI. Gebruik az extension update --name ml deze om de laatste versie ervan op te halen.
De Azure Machine Learning SDK voor Python.
```
pip install azure-ai-ml
```
Notitie

ModelBatchDeployment Klassen en PipelineComponentBatchDeployment zijn geïntroduceerd in versie 1.7.0 van de SDK. Gebruik pip install -U azure-ai-ml deze om de laatste versie ervan op te halen.

Verbinding maken met uw werkruimte

De werkruimte is de resource op het hoogste niveau voor Azure Machine Learning en biedt een gecentraliseerde werkplek met alle artefacten die u maakt in Azure Machine Learning. In deze sectie maken we verbinding met de werkruimte waarin u implementatietaken uitvoert.

Azure-CLI
Python

Geef de waarden voor uw abonnements-id, werkruimte, locatie en resourcegroep door in de volgende code:

az account set --subscription <subscription>
az configure --defaults workspace=<workspace> group=<resource-group> location=<location>

Importeer de vereiste bibliotheken:

from azure.ai.ml import MLClient, Input, load_component
from azure.ai.ml.entities import BatchEndpoint, ModelBatchDeployment, ModelBatchDeploymentSettings, PipelineComponentBatchDeployment, Model, AmlCompute, Data, BatchRetrySettings, CodeConfiguration, Environment, Data
from azure.ai.ml.constants import AssetTypes, BatchDeploymentOutputAction
from azure.ai.ml.dsl import pipeline
from azure.identity import DefaultAzureCredential

Configureer de details van de werkruimte en haal een ingang op voor de werkruimte:

Geef de waarden voor uw abonnements-id, werkruimte en resourcegroep door in de volgende code:

subscription_id = "<subscription>"
resource_group = "<resource-group>"
workspace = "<workspace>"

ml_client = MLClient(DefaultAzureCredential(), subscription_id, resource_group, workspace)

Voer de pijplijntaak uit die u wilt implementeren

In deze sectie beginnen we met het uitvoeren van een pijplijntaak:

Azure-CLI
Python

Het volgende pipeline-job.yml bestand bevat de configuratie voor de pijplijntaak:

pipeline-job.yml

$schema: https://azuremlschemas.azureedge.net/latest/pipelineJob.schema.json
type: pipeline

experiment_name: hello-pipeline-batch
display_name: hello-pipeline-batch-job
description: This job demonstrates how to run the a pipeline component in a pipeline job. You can use this example to test a component in an standalone job before deploying it in an endpoint.

compute: batch-cluster
component: hello-component/hello.yml

Laad het pijplijnonderdeel en instantieer het:

hello_batch = load_component(source="hello-component/hello.yml")
pipeline_job = hello_batch()

Configureer nu enkele uitvoeringsinstellingen om de test uit te voeren. In dit artikel wordt ervan uitgegaan dat u een rekencluster hebt met de naam batch-cluster. U kunt het cluster vervangen door de naam van uw cluster.

pipeline_job.settings.default_compute = "batch-cluster"
pipeline_job.settings.default_datastore = "workspaceblobstore"

Maak de pijplijntaak:

Azure-CLI
Python

JOB_NAME=$(az ml job create -f pipeline-job.yml --query name -o tsv)

pipeline_job_run = ml_client.jobs.create_or_update(
    pipeline_job, experiment_name="hello-batch-pipeline"
)
pipeline_job_run

Een batch-eindpunt maken

Voordat we de pijplijntaak implementeren, moeten we een batch-eindpunt implementeren om de implementatie te hosten.

Geef een naam op voor het eindpunt. De naam van een batch-eindpunt moet uniek zijn in elke regio, omdat de naam wordt gebruikt om de aanroep-URI samen te stellen. Voeg eventuele volgtekens toe aan de naam die in de volgende code is opgegeven om de uniekheid te garanderen.
- Azure-CLI
- Python
```
ENDPOINT_NAME="hello-batch"
```
```
endpoint_name="hello-batch"
```

Configureer het eindpunt:

Azure-CLI
Python

Het endpoint.yml bestand bevat de configuratie van het eindpunt.

endpoint.yml

$schema: https://azuremlschemas.azureedge.net/latest/batchEndpoint.schema.json
name: hello-batch
description: A hello world endpoint for component deployments.
auth_mode: aad_token

endpoint = BatchEndpoint(
    name=endpoint_name,
    description="A hello world endpoint for component deployments",
)

Maak het eindpunt:

Azure-CLI
Python

az ml batch-endpoint create --name $ENDPOINT_NAME  -f endpoint.yml

ml_client.batch_endpoints.begin_create_or_update(endpoint).result()

Voer een query uit op de eindpunt-URI:

Azure-CLI
Python

az ml batch-endpoint show --name $ENDPOINT_NAME

endpoint = ml_client.batch_endpoints.get(name=endpoint_name)
print(endpoint)

De pijplijntaak implementeren

Om het pijplijnonderdeel te implementeren, moeten we een batchimplementatie maken op basis van de bestaande taak.

We moeten Azure Machine Learning de naam vertellen van de taak die we willen implementeren. In ons geval wordt die taak aangegeven in de volgende variabele:
- Azure-CLI
- Python
```
echo $JOB_NAME
```
```
print(job.name)
```

Configureer de implementatie.

Azure-CLI
Python

Het deployment-from-job.yml bestand bevat de configuratie van de implementatie. U ziet hoe we de sleutel job_definition gebruiken in plaats van aan te geven dat deze implementatie wordt gemaakt op basis van component een pijplijntaak:

deployment-from-job.yml

$schema: https://azuremlschemas.azureedge.net/latest/pipelineComponentBatchDeployment.schema.json
name: hello-batch-from-job
endpoint_name: hello-pipeline-batch
type: pipeline
job_definition: azureml:job_name_placeholder
settings:
    continue_on_step_failure: false
    default_compute: batch-cluster

U ziet nu hoe we de eigenschap job_definition gebruiken in plaats van component:

deployment = PipelineComponentBatchDeployment(
    name="hello-batch-from-job",
    description="A hello world deployment with a single step. This deployment is created from a pipeline job.",
    endpoint_name=endpoint.name,
    job_definition=pipeline_job_run,
    settings={
        "default_compute": "batch-cluster",
        "continue_on_step_failure": False
    }
)

Tip

Bij deze configuratie wordt ervan uitgegaan dat u een rekencluster hebt met de naam batch-cluster. U kunt deze waarde vervangen door de naam van uw cluster.

De implementatie maken:
- Azure-CLI
- Python
Voer de volgende code uit om een batch-implementatie te maken onder het batch-eindpunt en deze in te stellen als de standaardimplementatie.
```
az ml batch-deployment create --endpoint $ENDPOINT_NAME --set job_definition=azureml:$JOB_NAME -f deployment-from-job.yml
```
Tip

Let op het gebruik van --set job_definition=azureml:$JOB_NAME. Omdat taaknamen uniek zijn, wordt de opdracht --set hier gebruikt om de naam van de taak te wijzigen wanneer u deze uitvoert in uw werkruimte.
Met deze opdracht wordt het maken van de implementatie gestart en wordt een bevestigingsantwoord geretourneerd terwijl het maken van de implementatie wordt voortgezet.
```
ml_client.batch_deployments.begin_create_or_update(deployment).result()
```
Zodra deze nieuwe implementatie is gemaakt, gaan we deze nieuwe implementatie configureren als de standaardimplementatie:
```
endpoint = ml_client.batch_endpoints.get(endpoint.name)
endpoint.defaults.deployment_name = deployment.name
ml_client.batch_endpoints.begin_create_or_update(endpoint).result()
```
Uw implementatie is klaar voor gebruik.

De implementatie testen

Zodra de implementatie is gemaakt, kunt u taken ontvangen. U kunt de standaardimplementatie als volgt aanroepen:

Azure-CLI
Python

JOB_NAME=$(az ml batch-endpoint invoke -n $ENDPOINT_NAME --query name -o tsv)

job = ml_client.batch_endpoints.invoke(
    endpoint_name=endpoint.name, 
)

U kunt de voortgang van de voorstelling controleren en de logboeken streamen met behulp van:

Azure-CLI
Python

az ml job stream -n $JOB_NAME

ml_client.jobs.get(name=job.name)

Voer de volgende code uit om te wachten tot de taak is voltooid:

ml_client.jobs.stream(name=job.name)

Resources opschonen

Wanneer u klaar bent, verwijdert u de gekoppelde resources uit de werkruimte:

Azure-CLI
Python

Voer de volgende code uit om het batch-eindpunt en de onderliggende implementatie te verwijderen. --yes wordt gebruikt om de verwijdering te bevestigen.

az ml batch-endpoint delete -n $ENDPOINT_NAME --yes

Verwijder het eindpunt:

ml_client.batch_endpoints.begin_delete(endpoint.name).result()

Delen via