Prozkoumání sady Python SDK
Důležitý
V současné době existují dvě verze sady Python SDK: verze 1 (v1) a verze 2 (v2). Pro všechny nové projekty byste měli použít v2, a proto obsah v této jednotce pokrývá pouze v2. Zjistěte více o rozhodování mezi v1 a v2.
Datoví vědci můžou pomocí služby Azure Machine Learning trénovat, sledovat a spravovat modely strojového učení. Jako datový vědec budete většinou pracovat s prostředky v pracovním prostoru Azure Machine Learning pro úlohy strojového učení.
Protože většina datových vědců je obeznámená s Pythonem, azure Machine Learning nabízí sadu SDK (Software Development Kit), abyste mohli pracovat s pracovním prostorem pomocí Pythonu.
Sada Python SDK pro Azure Machine Learning je ideální nástroj pro datové vědce, který je možné použít v jakémkoli prostředí Pythonu. Ať už běžně pracujete s poznámkovými bloky Jupyter nebo s Visual Studio Code, můžete nainstalovat sadu SDK pro Python a připojit se k pracovnímu prostoru.
Instalace sady Python SDK
K instalaci sady Python SDK v prostředí Pythonu potřebujete Python 3.7 nebo novější. Balíček můžete nainstalovat pomocí pip:
pip install azure-ai-ml
Poznámka
Při práci s poznámkovými bloky v nástroji Azure Machine Learning Studio se nová sada Python SDK už nainstaluje při použití Pythonu 3.10 nebo novějšího. Sadu Python SDK v2 můžete použít se staršími verzemi Pythonu, ale musíte ji nejdřív nainstalovat.
Připojení k pracovnímu prostoru
Po instalaci sady Python SDK se budete muset připojit k pracovnímu prostoru. Připojením ověřujete své prostředí, abyste mohli interagovat s pracovním prostorem a vytvářet a spravovat aktiva a prostředky.
K ověření potřebujete hodnoty na tři nezbytné parametry:
-
subscription_id: ID vašeho předplatného. -
resource_group: Název vaší skupiny prostředků. -
workspace_name: Název pracovního prostoru.
Dále můžete ověřování definovat pomocí následujícího kódu:
from azure.ai.ml import MLClient
from azure.identity import DefaultAzureCredential
ml_client = MLClient(
DefaultAzureCredential(), subscription_id, resource_group, workspace
)
Po definování ověřování je potřeba volat MLClient, aby se prostředí připojilo k pracovnímu prostoru. Zavoláte MLClient kdykoli budete chtít vytvořit nebo aktualizovat prostředek nebo zdroj v pracovním prostoru.
Když například vytvoříte novou úlohu pro trénování modelu, připojíte se k pracovnímu prostoru:
from azure.ai.ml import command
# configure job
job = command(
code="./src",
command="python train.py",
environment="AzureML-sklearn-0.24-ubuntu18.04-py37-cpu@latest",
compute="aml-cluster",
experiment_name="train-model"
)
# connect to workspace and submit job
returned_job = ml_client.create_or_update(job)
Použití referenční dokumentace
Pokud chcete efektivně pracovat se sadou Python SDK, budete muset použít referenční dokumentaci. V referenční dokumentaci najdete všechny možné třídy, metody a parametry dostupné v sadě Python SDK.
Referenční dokumentace k MLClient třídě obsahuje metody, které můžete použít k připojení a interakci s pracovním prostorem. Kromě toho také odkazuje na možné operace pro různé entity, jako je seznam existujících úložišť dat ve vašem pracovním prostoru.
Referenční dokumentace obsahuje také seznam tříd pro všechny entity, se kterými můžete pracovat. Například existují samostatné třídy, pokud chcete vytvořit úložiště dat, které odkazuje na Azure Blob Storage nebo na Azure Data Lake Gen2.
Výběrem konkrétní třídy, jako je AmlCompute ze seznamu entit, najdete podrobnější stránku o tom, jak používat třídu a jaké parametry přijímá.