Gecureerde omgevingen verkennen en gebruiken

Voltooid

Gecureerde omgevingen zijn vooraf gedefinieerde omgevingen voor de meest voorkomende machine learning-workloads, die standaard beschikbaar zijn in uw werkruimte.

Gecureerde omgevingen maken gebruik van het voorvoegsel AzureML en zijn ontworpen voor scripts die gebruikmaken van populaire machine learning-frameworks en hulpprogramma's.

Er zijn bijvoorbeeld gecureerde omgevingen voor wanneer u een script wilt uitvoeren waarmee een regressie-, clustering- of classificatiemodel wordt getraind met Scikit-Learn.

Als u een gecureerde omgeving wilt verkennen, kunt u deze bekijken in de studio, met behulp van de Azure CLI of de Python SDK.

Met de volgende opdracht kunt u de beschrijving en tags van een gecureerde omgeving ophalen met de Python SDK:

env = ml_client.environments.get("AzureML-sklearn-0.24-ubuntu18.04-py37-cpu", version=44)
print(env. description, env.tags)

Een gecureerde omgeving gebruiken

Meestal gebruikt u omgevingen wanneer u een script wilt uitvoeren als een (opdracht)-taak.

Als u wilt opgeven welke omgeving u wilt gebruiken om uw script uit te voeren, verwijst u naar een omgeving op basis van de naam en versie.

De volgende code laat bijvoorbeeld zien hoe u een opdrachttaak configureert met de Python SDK, die gebruikmaakt van een gecureerde omgeving, waaronder Scikit-Learn:

from azure.ai.ml import command

# configure job
job = command(
    code="./src",
    command="python train.py",
    environment="AzureML-sklearn-0.24-ubuntu18.04-py37-cpu@latest",
    compute="aml-cluster",
    display_name="train-with-curated-environment",
    experiment_name="train-with-curated-environment"
)

# submit job
returned_job = ml_client.create_or_update(job)

Een gecureerde omgeving testen en problemen oplossen

Omdat gecureerde omgevingen snellere implementatietijd mogelijk maken, is het een best practice om eerst te verkennen of een van de vooraf gemaakte gecureerde omgevingen kan worden gebruikt om uw code uit te voeren.

U kunt controleren of een gecureerde omgeving alle benodigde pakketten bevat door de details ervan te bekijken. Vervolgens kunt u testen met behulp van de omgeving om het script uit te voeren.

Als een omgeving niet alle benodigde pakketten bevat om uw code uit te voeren, mislukt uw taak.

Wanneer een taak mislukt, kunt u de gedetailleerde foutenlogboeken bekijken op het tabblad Uitvoer en logboeken van uw taak in de Azure Machine Learning-studio.

Een veelvoorkomend foutbericht dat aangeeft dat uw omgeving onvolledig is, is ModuleNotFoundError. De module die niet wordt gevonden, wordt weergegeven in het foutbericht. Door het foutbericht te bekijken, kunt u de omgeving bijwerken om de bibliotheken op te nemen om ervoor te zorgen dat de benodigde pakketten zijn geïnstalleerd op het rekendoel voordat u de code uitvoert.

Wanneer u andere benodigde pakketten wilt opgeven, kunt u een gecureerde omgeving gebruiken als referentie voor uw eigen aangepaste omgevingen door de Dockerfiles te wijzigen die zijn gekoppeld aan deze gecureerde omgevingen.