Prozkoumání a používání kurátorovaných prostředí

Dokončeno

Kurátorovaná prostředí jsou předem připravená prostředí pro nejběžnější úlohy strojového učení, která jsou ve výchozím nastavení dostupná ve vašem pracovním prostoru.

Kurátorovaná prostředí používají předponu AzureML a jsou navržená tak, aby poskytovala skripty, které používají oblíbené architektury a nástroje strojového učení.

Existují například kurátorovaná prostředí, pro která chcete spustit skript, který trénuje regresi, clustering nebo klasifikační model pomocí Scikit-Learn.

Pokud chcete prozkoumat kurátorované prostředí, můžete ho zobrazit v sadě Studio, pomocí Azure CLI nebo sady Python SDK.

Následující příkaz umožňuje načíst popis a značky kurátorovaného prostředí pomocí sady Python SDK:

env = ml_client.environments.get("AzureML-sklearn-0.24-ubuntu18.04-py37-cpu", version=44)
print(env. description, env.tags)

Použití kurátorovaného prostředí

Prostředí nejčastěji používáte, když chcete spustit skript jako úlohu (příkaz).

Chcete-li určit, které prostředí chcete použít ke spuštění skriptu, odkazujete na prostředí podle názvu a verze.

Následující kód například ukazuje, jak nakonfigurovat úlohu příkazu se sadou Python SDK, která používá kurátorované prostředí včetně Scikit-Learn:

from azure.ai.ml import command

# configure job
job = command(
    code="./src",
    command="python train.py",
    environment="AzureML-sklearn-0.24-ubuntu18.04-py37-cpu@latest",
    compute="aml-cluster",
    display_name="train-with-curated-environment",
    experiment_name="train-with-curated-environment"
)

# submit job
returned_job = ml_client.create_or_update(job)

Testování a řešení potíží s kurátorovaným prostředím

Vzhledem k tomu, že kurátorovaná prostředí umožňují rychlejší dobu nasazení, je osvědčeným postupem nejprve prozkoumat, jestli se ke spuštění kódu dá použít jedno z předem vytvořených kurátorovaných prostředí.

Ověřit, že kurátorované prostředí zahrnuje všechny potřebné balíčky, můžete tím, že zkontrolujete jeho podrobnosti. Pak můžete otestovat spuštěním skriptu pomocí prostředí.

Pokud prostředí neobsahuje všechny potřebné balíčky ke spuštění kódu, úloha selže.

Pokud úloha selže, můžete si projít podrobné protokoly chyb na kartě Výstupy a protokoly vaší úlohy v nástroji Azure Machine Learning Studio.

Běžná chybová zpráva, která indikuje, že vaše prostředí je neúplné, je ModuleNotFoundError. Modul, který nebyl nalezen, je uveden v chybové zprávě. Když si projdete chybovou zprávu, můžete prostředí aktualizovat tak, aby zahrnovalo knihovny, aby se zajistilo, že jsou potřebné balíčky před spuštěním kódu nainstalované do cílového výpočetního objektu.

Pokud potřebujete zadat další nezbytné balíčky, můžete jako referenci pro vlastní prostředí použít kurátorované prostředí úpravou souborů Dockerfile, které tato kurátorovaná prostředí zálohují.