Explorar o SDK do Python
Importante
Atualmente, há duas versões do SDK do Python: versão 1 (v1) e versão 2 (v2). Em novos projetos, você deve usar v2, portanto, o conteúdo nesta unidade abrange apenas a v2. Saiba mais sobre como decidir entre a v1 e a v2.
Os cientistas de dados podem usar o Azure Machine Learning para treinar, acompanhar e gerenciar modelos de machine learning. Como cientista de dados, você trabalhará principalmente com os ativos dentro do workspace do Azure Machine Learning para suas cargas de trabalho de aprendizado de máquina.
Como a maioria dos cientistas de dados está familiarizada com o Python, o Azure Machine Learning oferece um SDK (software development kit) para que você possa interagir com o workspace usando o Python.
O SDK do Python para Azure Machine Learning é uma ferramenta ideal para cientistas de dados que podem ser usados em qualquer ambiente do Python. Seja você normalmente trabalhe com notebooks Jupyter ou Visual Studio Code, pode instalar o SDK do Python e se conectar ao espaço de trabalho.
Instalar o SDK do Python
Para instalar o SDK do Python em seu ambiente python, você precisa do Python 3.7 ou posterior. Você pode instalar o pacote com pip:
pip install azure-ai-ml
Nota
Ao trabalhar com notebooks no estúdio do Azure Machine Learning, o novo SDK do Python já está instalado ao usar o Python 3.10 ou posterior. Você pode usar o SDK do Python v2 com versões anteriores do Python, mas precisará instalá-lo primeiro.
Conectar-se à área de trabalho
Depois que o SDK do Python for instalado, você precisará se conectar ao workspace. Ao se conectar, você está autenticando seu ambiente para interagir com o workspace para criar e gerenciar ativos e recursos.
Para autenticar, você precisa dos valores para três parâmetros necessários:
subscription_id: sua ID de assinatura.resource_group: o nome do grupo de recursos.workspace_name: o nome de seu workspace.
Em seguida, você pode definir a autenticação usando o seguinte código:
from azure.ai.ml import MLClient
from azure.identity import DefaultAzureCredential
ml_client = MLClient(
DefaultAzureCredential(), subscription_id, resource_group, workspace
)
Depois de definir a autenticação, você precisa chamar MLClient para que o ambiente se conecte ao workspace. Você chamará MLClient sempre que quiser criar ou atualizar um ativo ou recurso no workspace.
Por exemplo, você se conectará ao workspace ao criar um novo trabalho para treinar um modelo:
from azure.ai.ml import command
# configure job
job = command(
code="./src",
command="python train.py",
environment="AzureML-sklearn-0.24-ubuntu18.04-py37-cpu@latest",
compute="aml-cluster",
experiment_name="train-model"
)
# connect to workspace and submit job
returned_job = ml_client.create_or_update(job)
Usar a documentação de referência
Para trabalhar com eficiência com o SDK do Python, você precisará usar a documentação de referência. Na documentação de referência, você encontrará todas as classes, métodos e parâmetros possíveis disponíveis no SDK do Python.
A documentação de referência sobre a classe MLClient inclui os métodos que você pode usar para se conectar e interagir com a área de trabalho. Além disso, ele também se vincula às operações possíveis para as várias entidades, como listar os armazenamentos de dados existentes em seu workspace.
A documentação de referência também inclui uma lista das classes para todas as entidades com as quais você pode interagir. Por exemplo, existem classes separadas quando você deseja criar um armazenamento de dados que se vincule a um Armazenamento de Blobs do Azure ou a um Azure Data Lake Gen 2.
Selecionando uma classe específica como AmlCompute na lista de entidades, você pode encontrar uma página mais detalhada sobre como usar a classe e quais parâmetros ela aceita.