Trenowanie modeli za pomocą interfejsu wiersza polecenia, zestawu SDK i interfejsu API REST usługi Azure Machine Edukacja

Artykuł
11/15/2023

DOTYCZY: Rozszerzenie interfejsu wiersza polecenia platformy Azure w wersji 2 (current)Zestaw PYTHON SDK azure-ai-ml v2 (bieżąca)

Usługa Azure Machine Edukacja oferuje wiele sposobów przesyłania zadań trenowania uczenia maszynowego. W tym artykule dowiesz się, jak przesyłać zadania przy użyciu następujących metod:

Rozszerzenie interfejsu wiersza polecenia platformy Azure do uczenia maszynowego: ml rozszerzenie nazywane również interfejsem wiersza polecenia w wersji 2.
Zestaw PYTHON SDK w wersji 2 dla usługi Azure Machine Edukacja.
Interfejs API REST: interfejs API, na który jest oparty interfejs wiersza polecenia i zestaw SDK.

Wymagania wstępne

Subskrypcja platformy Azure. Jeśli nie masz subskrypcji platformy Azure, przed rozpoczęciem utwórz bezpłatne konto. Wypróbuj bezpłatną lub płatną wersję usługi Azure Machine Edukacja.
Obszar roboczy usługi Azure Machine Learning. Jeśli go nie masz, możesz użyć kroków opisanych w artykule Tworzenie zasobów, aby rozpocząć pracę .

Aby użyć informacji o zestawie SDK, zainstaluj zestaw Azure Machine Edukacja SDK w wersji 2 dla języka Python.

Aby korzystać z informacji o interfejsie API REST, potrzebne są następujące elementy:

Jednostka usługi w obszarze roboczym. Administracja istracyjne żądania REST używają uwierzytelniania jednostki usługi.
Token uwierzytelniania jednostki usługi. Wykonaj kroki opisane w temacie Pobieranie tokenu uwierzytelniania jednostki usługi, aby pobrać ten token.
Narzędzie curl . Program curl jest dostępny w Podsystem Windows dla systemu Linux lub dowolnej dystrybucji system UNIX.

Napiwek

W programie PowerShell curl jest aliasem dla Invoke-WebRequest elementu i curl -d "key=val" -X POST uri staje się .Invoke-WebRequest -Body "key=val" -Method POST -Uri uri

Chociaż istnieje możliwość wywołania interfejsu API REST z poziomu programu PowerShell, przykłady w tym artykule zakładają, że używasz powłoki Bash.
Narzędzie jq do przetwarzania kodu JSON. To narzędzie służy do wyodrębniania wartości z dokumentów JSON zwracanych z wywołań interfejsu API REST.

Klonowanie repozytorium przykładów

Fragmenty kodu w tym artykule są oparte na przykładach w repozytorium GitHub w usłudze Azure Machine Edukacja przykłady. Aby sklonować repozytorium do środowiska deweloperskiego, użyj następującego polecenia:

git clone --depth 1 https://github.com/Azure/azureml-examples

Napiwek

Użyj --depth 1 polecenia , aby sklonować tylko najnowsze zatwierdzenie do repozytorium, co skraca czas na ukończenie operacji.

Przykładowe zadanie

W przykładach w tym artykule użyto zestawu danych irysów kwiat do wytrenowania modelu MLFlow.

Szkolenie w chmurze

Podczas trenowania w chmurze musisz nawiązać połączenie z obszarem roboczym usługi Azure Machine Edukacja i wybrać zasób obliczeniowy, który będzie używany do uruchamiania zadania szkoleniowego.

1. Połączenie do obszaru roboczego

Napiwek

Użyj poniższych kart, aby wybrać metodę, której chcesz użyć do wytrenowania modelu. Wybranie karty spowoduje automatyczne przełączenie wszystkich kart w tym artykule na tę samą kartę. W dowolnym momencie możesz wybrać inną kartę.

Aby nawiązać połączenie z obszarem roboczym, potrzebujesz parametrów identyfikatora — subskrypcji, grupy zasobów i nazwy obszaru roboczego. Te szczegóły będą używane w przestrzeni nazw, MLClientazure.ai.ml aby uzyskać dojście do wymaganego obszaru roboczego usługi Azure Machine Edukacja. Do uwierzytelniania należy użyć domyślnego uwierzytelniania platformy Azure. Zapoznaj się z tym przykładem , aby uzyskać więcej informacji na temat konfigurowania poświadczeń i nawiązywania połączenia z obszarem roboczym.

#import required libraries
from azure.ai.ml import MLClient
from azure.identity import DefaultAzureCredential

#Enter details of your Azure Machine Learning workspace
subscription_id = '<SUBSCRIPTION_ID>'
resource_group = '<RESOURCE_GROUP>'
workspace = '<AZUREML_WORKSPACE_NAME>'

#connect to the workspace
ml_client = MLClient(DefaultAzureCredential(), subscription_id, resource_group, workspace)

W przypadku korzystania z interfejsu wiersza polecenia platformy Azure potrzebne są parametry identyfikatora — subskrypcja, grupa zasobów i nazwa obszaru roboczego. Chociaż można określić te parametry dla każdego polecenia, można również ustawić wartości domyślne, które będą używane dla wszystkich poleceń. Użyj następujących poleceń, aby ustawić wartości domyślne. Zastąp <subscription ID>wartości , <Azure Machine Learning workspace name>i <resource group> wartościami konfiguracji:

az account set --subscription <subscription ID>
az configure --defaults workspace=<Azure Machine Learning workspace name> group=<resource group>

Przykłady interfejsu API REST w tym artykule używają $SUBSCRIPTION_IDsymboli zastępczych , $RESOURCE_GROUP, $LOCATIONi $WORKSPACE . Zastąp symbole zastępcze własnymi wartościami w następujący sposób:

$SUBSCRIPTION_ID: Identyfikator subskrypcji platformy Azure.
$RESOURCE_GROUP: grupa zasobów platformy Azure zawierająca obszar roboczy.
$LOCATION: region świadczenia usługi Azure, w którym znajduje się obszar roboczy.
$WORKSPACE: nazwa obszaru roboczego usługi Azure Machine Edukacja.
$COMPUTE_NAME: nazwa klastra obliczeniowego usługi Azure Machine Edukacja.

Administracja istrative REST żąda tokenu uwierzytelniania jednostki usługi. Token można pobrać za pomocą następującego polecenia. Token jest przechowywany w zmiennej środowiskowej $TOKEN :

TOKEN=$(az account get-access-token --query accessToken -o tsv)

Dostawca usług używa argumentu api-version w celu zapewnienia zgodności. Argument api-version różni się od usługi do usługi. Ustaw wersję interfejsu API jako zmienną, aby uwzględnić przyszłe wersje:

API_VERSION="2022-05-01"

Podczas trenowania przy użyciu interfejsu API REST skrypty danych i trenowania muszą być przekazywane do konta magazynu, do którego można uzyskać dostęp do obszaru roboczego. Poniższy przykład pobiera informacje o magazynie dla obszaru roboczego i zapisuje je w zmiennych, abyśmy mogli ich użyć później:

# Get values for storage account
response=$(curl --location --request GET "https://management.azure.com/subscriptions/$SUBSCRIPTION_ID/resourceGroups/$RESOURCE_GROUP/providers/Microsoft.MachineLearningServices/workspaces/$WORKSPACE/datastores?api-version=$API_VERSION&isDefault=true" \
--header "Authorization: Bearer $TOKEN")
AZUREML_DEFAULT_DATASTORE=$(echo $response | jq -r '.value[0].name')
AZUREML_DEFAULT_CONTAINER=$(echo $response | jq -r '.value[0].properties.containerName')
export AZURE_STORAGE_ACCOUNT=$(echo $response | jq -r '.value[0].properties.accountName')

2. Tworzenie zasobu obliczeniowego na potrzeby trenowania

Uwaga

Aby wypróbować bezserwerowe obliczenia, pomiń ten krok i przejdź do 3. Prześlij zadanie szkoleniowe.

Klaster obliczeniowy usługi Azure Machine Edukacja to w pełni zarządzany zasób obliczeniowy, który może służyć do uruchamiania zadania trenowania. W poniższych przykładach tworzony jest klaster obliczeniowy o nazwie cpu-compute .

from azure.ai.ml.entities import AmlCompute

# specify aml compute name.
cpu_compute_target = "cpu-cluster"

try:
    ml_client.compute.get(cpu_compute_target)
except Exception:
    print("Creating a new cpu compute target...")
    compute = AmlCompute(
        name=cpu_compute_target, size="STANDARD_D2_V2", min_instances=0, max_instances=4
    )
    ml_client.compute.begin_create_or_update(compute).result()

az ml compute create -n cpu-cluster --type amlcompute --min-instances 0 --max-instances 4

curl -X PUT \
  "https://management.azure.com/subscriptions/$SUBSCRIPTION_ID/resourceGroups/$RESOURCE_GROUP/providers/Microsoft.MachineLearningServices/workspaces/$WORKSPACE/computes/$COMPUTE_NAME?api-version=$API_VERSION" \
  -H "Authorization:Bearer $TOKEN" \
  -H "Content-Type: application/json" \
  -d '{
    "location": "'$LOCATION'",
    "properties": {
        "computeType": "AmlCompute",
        "properties": {
            "vmSize": "Standard_D2_V2",
            "vmPriority": "Dedicated",
            "scaleSettings": {
                "maxNodeCount": 4,
                "minNodeCount": 0,
                "nodeIdleTimeBeforeScaleDown": "PT30M"
            }
        }
    }
}'

Napiwek

Chociaż odpowiedź jest zwracana po kilku sekundach, oznacza to tylko, że żądanie utworzenia zostało zaakceptowane. Ukończenie tworzenia klastra może potrwać kilka minut.

3. Prześlij zadanie szkoleniowe

Aby uruchomić ten skrypt, użyjesz skryptu wykonującego command main.py skryptu języka Python znajdującego się w folderze ./sdk/python/jobs/single-step/lightgbm/iris/src/. Polecenie zostanie uruchomione przez przesłanie go jako elementu job do usługi Azure Machine Edukacja.

Uwaga

Aby użyć bezserwerowych obliczeń, usuń compute="cpu-cluster" w tym kodzie.

from azure.ai.ml import command, Input

# define the command
command_job = command(
    code="./src",
    command="python main.py --iris-csv ${{inputs.iris_csv}} --learning-rate ${{inputs.learning_rate}} --boosting ${{inputs.boosting}}",
    environment="AzureML-lightgbm-3.2-ubuntu18.04-py37-cpu@latest",
    inputs={
        "iris_csv": Input(
            type="uri_file",
            path="https://azuremlexamples.blob.core.windows.net/datasets/iris.csv",
        ),
        "learning_rate": 0.9,
        "boosting": "gbdt",
    },
    compute="cpu-cluster",
)

# submit the command
returned_job = ml_client.jobs.create_or_update(command_job)
# get a URL for the status of the job
returned_job.studio_url

W powyższych przykładach skonfigurowano:

code — ścieżka, w której znajduje się kod do uruchomienia polecenia
command - polecenie, które należy uruchomić
environment — środowisko potrzebne do uruchomienia skryptu szkoleniowego. W tym przykładzie używamy nadzorowanego lub gotowego środowiska dostarczonego przez usługę Azure Machine Edukacja o nazwie AzureML-lightgbm-3.2-ubuntu18.04-py37-cpu. Używamy najnowszej wersji tego środowiska przy użyciu @latest dyrektywy . Możesz również użyć środowisk niestandardowych, określając podstawowy obraz platformy Docker i określając na nim plik yaml conda.
inputs - słownik danych wejściowych używających par wartości nazw do polecenia . Klucz jest nazwą danych wejściowych w kontekście zadania, a wartość jest wartością wejściową. Dane wejściowe są przywoływane przy command użyciu ${{inputs.<input_name>}} wyrażenia . Aby użyć plików lub folderów jako danych wejściowych, możesz użyć Input klasy . Aby uzyskać więcej informacji, zobacz Zestaw SDK i wyrażenia interfejsu wiersza polecenia w wersji 2.

Aby uzyskać więcej informacji, zobacz dokumentację referencyjną.

Po przesłaniu zadania adres URL jest zwracany do stanu zadania w usłudze Azure Machine Edukacja Studio. Użyj interfejsu użytkownika programu Studio, aby wyświetlić postęp zadania. Możesz również użyć returned_job.status polecenia , aby sprawdzić bieżący stan zadania.

Polecenie az ml job create użyte w tym przykładzie wymaga pliku definicji zadania YAML. Zawartość pliku użytego w tym przykładzie to:

Uwaga

Aby użyć bezserwerowych obliczeń, usuń compute: azureml:cpu-cluster" w tym kodzie.

$schema: https://azuremlschemas.azureedge.net/latest/commandJob.schema.json
code: src
command: >-
  python main.py 
  --iris-csv ${{inputs.iris_csv}}
  --C ${{inputs.C}}
  --kernel ${{inputs.kernel}}
  --coef0 ${{inputs.coef0}}
inputs:
  iris_csv: 
    type: uri_file
    path: wasbs://datasets@azuremlexamples.blob.core.windows.net/iris.csv
  C: 0.8
  kernel: "rbf"
  coef0: 0.1
environment: azureml:AzureML-sklearn-0.24-ubuntu18.04-py37-cpu@latest
compute: azureml:cpu-cluster
display_name: sklearn-iris-example
experiment_name: sklearn-iris-example
description: Train a scikit-learn SVM on the Iris dataset.

W powyższych konfiguracjach:

code — ścieżka, w której znajduje się kod do uruchomienia polecenia
command - polecenie, które należy uruchomić
inputs - słownik danych wejściowych używających par wartości nazw do polecenia . Klucz jest nazwą danych wejściowych w kontekście zadania, a wartość jest wartością wejściową. Dane wejściowe są przywoływane przy command użyciu ${{inputs.<input_name>}} wyrażenia . Aby uzyskać więcej informacji, zobacz Zestaw SDK i wyrażenia interfejsu wiersza polecenia w wersji 2.
environment — środowisko potrzebne do uruchomienia skryptu szkoleniowego. W tym przykładzie używamy nadzorowanego lub gotowego środowiska dostarczonego przez usługę Azure Machine Edukacja o nazwie AzureML-sklearn-0.24-ubuntu18.04-py37-cpu. Używamy najnowszej wersji tego środowiska przy użyciu @latest dyrektywy . Możesz również użyć środowisk niestandardowych, określając podstawowy obraz platformy Docker i określając na nim plik yaml conda. Aby przesłać zadanie, użyj następującego polecenia. Identyfikator przebiegu (nazwa) zadania trenowania jest przechowywany w zmiennej $run_id :

run_id=$(az ml job create -f jobs/single-step/scikit-learn/iris/job.yml --query name -o tsv)

Możesz użyć przechowywanego identyfikatora przebiegu, aby zwrócić informacje o zadaniu. Parametr --web otwiera internetowy interfejs użytkownika usługi Azure Machine Edukacja Studio, w którym można przejść do szczegółów zadania:

az ml job show -n $run_id --web

W ramach przesyłania zadania skrypty szkoleniowe i dane muszą zostać przekazane do lokalizacji magazynu w chmurze, do którego może uzyskiwać dostęp obszar roboczy usługi Azure Machine Edukacja.

Użyj następującego polecenia interfejsu wiersza polecenia platformy Azure, aby przekazać skrypt szkoleniowy. Polecenie określa katalog zawierający pliki wymagane do trenowania, a nie pojedynczy plik. Jeśli zamiast tego chcesz użyć interfejsu REST do przekazania danych, zapoznaj się z dokumentacją Put Blob :
```
az storage blob upload-batch -d $AZUREML_DEFAULT_CONTAINER/testjob -s cli/jobs/single-step/scikit-learn/iris/src/ --account-name $AZURE_STORAGE_ACCOUNT
```

Utwórz odwołanie do wersji danych szkoleniowych. W tym przykładzie dane znajdują się już w chmurze i znajdują się w https://azuremlexamples.blob.core.windows.net/datasets/iris.csvlokalizacji . Aby uzyskać więcej informacji na temat odwoływania się do danych, zobacz Dane w usłudze Azure Machine Edukacja:

DATA_VERSION=$RANDOM
curl --location --request PUT "https://management.azure.com/subscriptions/$SUBSCRIPTION_ID/resourceGroups/$RESOURCE_GROUP/providers/Microsoft.MachineLearningServices/workspaces/$WORKSPACE/data/iris-data/versions/$DATA_VERSION?api-version=$API_VERSION" \
--header "Authorization: Bearer $TOKEN" \
--header "Content-Type: application/json" \
--data-raw "{
        \"properties\": {
        \"description\": \"Iris dataset\",
        \"dataType\": \"uri_file\",
        \"dataUri\": \"https://azuremlexamples.blob.core.windows.net/datasets/iris.csv\"
    }
}"

Zarejestruj w wersji odwołanie do skryptu szkoleniowego do użycia z zadaniem. W tym przykładzie lokalizacja skryptu jest domyślnym kontem magazynu i kontenerem przekazanym w kroku 1. Identyfikator wersji kodu szkoleniowego jest zwracany i przechowywany w zmiennej $TRAIN_CODE :

TRAIN_CODE=$(curl --location --request PUT "https://management.azure.com/subscriptions/$SUBSCRIPTION_ID/resourceGroups/$RESOURCE_GROUP/providers/Microsoft.MachineLearningServices/workspaces/$WORKSPACE/codes/train-lightgbm/versions/1?api-version=$API_VERSION" \
--header "Authorization: Bearer $TOKEN" \
--header "Content-Type: application/json" \
--data-raw "{
        \"properties\": {
        \"description\": \"Train code\",
        \"codeUri\": \"https://$AZURE_STORAGE_ACCOUNT.blob.core.windows.net/$AZUREML_DEFAULT_CONTAINER/testjob\"
    }
}" | jq -r '.id')

Utwórz środowisko, za pomocą którego klaster będzie uruchamiał skrypt trenowania. W tym przykładzie używamy nadzorowanego lub gotowego środowiska dostarczonego przez usługę Azure Machine Edukacja o nazwie AzureML-lightgbm-3.2-ubuntu18.04-py37-cpu. Następujące polecenie pobiera listę wersji środowiska, a najnowsze znajdują się w górnej części kolekcji. jq Służy do pobierania identyfikatora najnowszej wersji ([0]), która jest następnie przechowywana w zmiennej $ENVIRONMENT .
```
ENVIRONMENT=$(curl --location --request GET "https://management.azure.com/subscriptions/$SUBSCRIPTION_ID/resourceGroups/$RESOURCE_GROUP/providers/Microsoft.MachineLearningServices/workspaces/$WORKSPACE/environments/AzureML-lightgbm-3.2-ubuntu18.04-py37-cpu/versions?api-version=$API_VERSION" --header "Authorization: Bearer $TOKEN" | jq -r .value[0].id)
```

Na koniec prześlij zadanie. W poniższym przykładzie pokazano, jak przesłać zadanie, odwołać się do identyfikatora kodu trenowania, identyfikatora środowiska, adresu URL danych wejściowych i identyfikatora klastra obliczeniowego. Lokalizacja wyjściowa zadania będzie przechowywana w zmiennej $JOB_OUTPUT :

Napiwek

Nazwa zadania musi być unikatowa. W tym przykładzie uuidgen jest używany do generowania unikatowej wartości nazwy.

Uwaga

Aby używać bezserwerowych obliczeń, usuń \"computeId\": wiersz w tym kodzie.

run_id=$(uuidgen)
curl --location --request PUT "https://management.azure.com/subscriptions/$SUBSCRIPTION_ID/resourceGroups/$RESOURCE_GROUP/providers/Microsoft.MachineLearningServices/workspaces/$WORKSPACE/jobs/$run_id?api-version=$API_VERSION" \
--header "Authorization: Bearer $TOKEN" \
--header "Content-Type: application/json" \
--data-raw "{
    \"properties\": {
        \"jobType\": \"Command\",
        \"codeId\": \"$TRAIN_CODE\",
        \"command\": \"python main.py --iris-csv \$AZURE_ML_INPUT_iris\",
        \"environmentId\": \"$ENVIRONMENT\",
        \"inputs\": {
            \"iris\": {
                \"jobInputType\": \"uri_file\",
                \"uri\": \"https://azuremlexamples.blob.core.windows.net/datasets/iris.csv\"
            }
        },
        \"experimentName\": \"lightgbm-iris\",
        \"computeId\": \"/subscriptions/$SUBSCRIPTION_ID/resourceGroups/$RESOURCE_GROUP/providers/Microsoft.MachineLearningServices/workspaces/$WORKSPACE/computes/$COMPUTE_NAME\"
    }
}"

Rejestrowanie wytrenowanego modelu

W poniższych przykładach pokazano, jak zarejestrować model w obszarze roboczym usługi Azure Machine Edukacja.

Napiwek

Właściwość name zwrócona przez zadanie trenowania jest używana jako część ścieżki do modelu.

from azure.ai.ml.entities import Model
from azure.ai.ml.constants import AssetTypes

run_model = Model(
    path="azureml://jobs/{}/outputs/artifacts/paths/model/".format(returned_job.name),
    name="run-model-example",
    description="Model created from run.",
    type=AssetTypes.MLFLOW_MODEL
)

ml_client.models.create_or_update(run_model)

Napiwek

Nazwa (przechowywana w zmiennej $run_id ) jest używana jako część ścieżki do modelu.

az ml model create -n sklearn-iris-example -v 1 -p runs:/$run_id/model --type mlflow_model

Napiwek

Nazwa (przechowywana w zmiennej $run_id ) jest używana jako część ścieżki do modelu.

curl --location --request PUT "https://management.azure.com/subscriptions/$SUBSCRIPTION_ID/resourceGroups/$RESOURCE_GROUP/providers/Microsoft.MachineLearningServices/workspaces/$WORKSPACE/models/sklearn/versions/1?api-version=$API_VERSION" \
--header "Authorization: Bearer $TOKEN" \
--header "Content-Type: application/json" \
--data-raw "{
    \"properties\": {
        \"modelType\": \"mlflow_model\",
        \"modelUri\":\"runs:/$run_id/model\"
    }
}"

Następne kroki

Teraz, gdy masz wytrenowany model, dowiedz się , jak wdrożyć go przy użyciu punktu końcowego online.

Aby uzyskać więcej przykładów, zobacz repozytorium GitHub przykłady usługi Azure Machine Edukacja.

Aby uzyskać więcej informacji na temat poleceń interfejsu wiersza polecenia platformy Azure, klas zestawu SDK języka Python lub interfejsów API REST używanych w tym artykule, zobacz następującą dokumentację referencyjną:

Trenowanie modeli za pomocą interfejsu wiersza polecenia, zestawu SDK i interfejsu API REST usługi Azure Machine Edukacja

Wymagania wstępne

Klonowanie repozytorium przykładów

Przykładowe zadanie

Szkolenie w chmurze

1. Połączenie do obszaru roboczego

2. Tworzenie zasobu obliczeniowego na potrzeby trenowania

3. Prześlij zadanie szkoleniowe

Rejestrowanie wytrenowanego modelu

Następne kroki

Dodatkowe zasoby