De Python SDK verkennen

Voltooid

Belangrijk

Er zijn momenteel twee versies van de Python SDK: versie 1 (v1) en versie 2 (v2). Voor nieuwe projecten moet u v2 gebruiken en daarom geldt dat de inhoud in deze les alleen betrekking heeft op v2. Meer informatie over het kiezen tussen v1 en v2.

Gegevenswetenschappers kunnen Azure Machine Learning gebruiken om machine learning-modellen te trainen, bij te houden en te beheren. Als data scientist werkt u meestal met de assets in de Azure Machine Learning-werkruimte voor uw machine learning-workloads.

Omdat de meeste gegevenswetenschappers bekend zijn met Python, biedt Azure Machine Learning een SDK (Software Development Kit) zodat u met python kunt communiceren met de werkruimte.

De Python SDK voor Azure Machine Learning is een ideaal hulpprogramma voor gegevenswetenschappers die in elke Python-omgeving kunnen worden gebruikt. Of u nu normaal werkt met Jupyter-notebooks, Visual Studio Code, u kunt de Python SDK installeren en verbinding maken met de werkruimte.

De Python SDK installeren

Als u de Python SDK in uw Python-omgeving wilt installeren, hebt u Python 3.7 of hoger nodig. U kunt het pakket installeren met pip:

pip install azure-ai-ml

Notitie

Wanneer u werkt met notebooks in de Azure Machine Learning-studio, is de nieuwe Python SDK al geïnstalleerd wanneer u Python 3.10 of hoger gebruikt. U kunt de Python SDK v2 gebruiken met eerdere versies van Python, maar u moet deze eerst installeren.

Verbinding maken naar de werkruimte

Nadat de Python SDK is geïnstalleerd, moet u verbinding maken met de werkruimte. Door verbinding te maken, verificeert u uw omgeving om te communiceren met de werkruimte om assets en resources te maken en te beheren.

Voor verificatie hebt u de waarden nodig tot drie vereiste parameters:

  • subscription_id: uw abonnements-id.
  • resource_group: de naam van uw resourcegroep.
  • workspace_name: De naam van uw werkruimte.

Vervolgens kunt u de verificatie definiëren met behulp van de volgende code:

from azure.ai.ml import MLClient
from azure.identity import DefaultAzureCredential

ml_client = MLClient(
    DefaultAzureCredential(), subscription_id, resource_group, workspace
)

Nadat u de verificatie hebt gedefinieerd, moet u de omgeving aanroepen MLClient om verbinding te maken met de werkruimte. U roept MLClient telkens aan wanneer u een asset of resource in de werkruimte wilt maken of bijwerken.

U maakt bijvoorbeeld verbinding met de werkruimte wanneer u een nieuwe taak maakt om een model te trainen:

from azure.ai.ml import command

# configure job
job = command(
    code="./src",
    command="python train.py",
    environment="AzureML-sklearn-0.24-ubuntu18.04-py37-cpu@latest",
    compute="aml-cluster",
    experiment_name="train-model"
)

# connect to workspace and submit job
returned_job = ml_client.create_or_update(job)

De referentiedocumentatie gebruiken

Als u efficiënt wilt werken met de Python SDK, moet u de referentiedocumentatie gebruiken. In de referentiedocumentatie vindt u alle mogelijke klassen, methoden en parameters die beschikbaar zijn in de Python SDK.

De referentiedocumentatie in de MLClient klasse bevat de methoden die u kunt gebruiken om verbinding te maken en te communiceren met de werkruimte. Bovendien wordt er ook een koppeling gemaakt naar de mogelijke bewerkingen voor de verschillende entiteiten, zoals het weergeven van de bestaande gegevensarchieven in uw werkruimte.

De referentiedocumentatie bevat ook een lijst met de klassen voor alle entiteiten waarmee u kunt werken. Er bestaan bijvoorbeeld afzonderlijke klassen wanneer u een gegevensarchief wilt maken dat is gekoppeld aan een Azure Blob Storage of een Azure Data Lake Gen 2.

Door een specifieke klasse te selecteren, zoals AmlCompute in de lijst met entiteiten, vindt u een gedetailleerdere pagina over het gebruik van de klasse en de parameters die worden geaccepteerd.