Używanie zadania zamiatania na potrzeby dostrajania hiperparametrów

8 min

W usłudze Azure Machine Edukacja można dostroić hiperparametry, uruchamiając zadanie zamiatania.

Tworzenie skryptu szkoleniowego na potrzeby dostrajania hiperparametrów

Aby uruchomić zadanie zamiatania, należy utworzyć skrypt szkoleniowy w taki sam sposób, jak w przypadku dowolnego innego zadania szkoleniowego, z tą różnicą, że skrypt musi:

Dołącz argument dla każdego hiperparametru, który chcesz różnić.
Rejestrowanie docelowej metryki wydajności za pomocą biblioteki MLflow. Zarejestrowana metryka umożliwia zadaniu zamiatania ocenę wydajności zainicjowanych prób i zidentyfikowanie tego, który generuje najlepszy model.

Uwaga

Dowiedz się, jak śledzić eksperymenty i modele uczenia maszynowego za pomocą biblioteki MLflow w usłudze Azure Machine Edukacja.

Na przykład poniższy przykładowy skrypt szkoli model regresji logistycznej przy użyciu --regularization argumentu w celu ustawienia hiperparametru szybkości regularyzacji i rejestruje metrykę dokładności o nazwie Accuracy:

import argparse
import pandas as pd
import numpy as np
from sklearn.model_selection import train_test_split
from sklearn.linear_model import LogisticRegression
import mlflow

# get regularization hyperparameter
parser = argparse.ArgumentParser()
parser.add_argument('--regularization', type=float, dest='reg_rate', default=0.01)
args = parser.parse_args()
reg = args.reg_rate

# load the training dataset
data = pd.read_csv("data.csv")

# separate features and labels, and split for training/validatiom
X = data[['feature1','feature2','feature3','feature4']].values
y = data['label'].values
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.30)

# train a logistic regression model with the reg hyperparameter
model = LogisticRegression(C=1/reg, solver="liblinear").fit(X_train, y_train)

# calculate and log accuracy
y_hat = model.predict(X_test)
acc = np.average(y_hat == y_test)
mlflow.log_metric("Accuracy", acc)

Konfigurowanie i uruchamianie zadania zamiatania

Aby przygotować zadanie zamiatania, należy najpierw utworzyć podstawowe zadanie polecenia, które określa skrypt do uruchomienia i definiuje parametry używane przez skrypt:

from azure.ai.ml import command

# configure command job as base
job = command(
    code="./src",
    command="python train.py --regularization ${{inputs.reg_rate}}",
    inputs={
        "reg_rate": 0.01,
    },
    environment="AzureML-sklearn-0.24-ubuntu18.04-py37-cpu@latest",
    compute="aml-cluster",
    )

Następnie możesz zastąpić parametry wejściowe obszarem wyszukiwania:

from azure.ai.ml.sweep import Choice

command_job_for_sweep = job(
    reg_rate=Choice(values=[0.01, 0.1, 1]),
)

Na koniec wywołaj sweep() zadanie polecenia, aby zamiatać obszar wyszukiwania:

from azure.ai.ml import MLClient

# apply the sweep parameter to obtain the sweep_job
sweep_job = command_job_for_sweep.sweep(
    compute="aml-cluster",
    sampling_algorithm="grid",
    primary_metric="Accuracy",
    goal="Maximize",
)

# set the name of the sweep job experiment
sweep_job.experiment_name="sweep-example"

# define the limits for this sweep
sweep_job.set_limits(max_total_trials=4, max_concurrent_trials=2, timeout=7200)

# submit the sweep
returned_sweep_job = ml_client.create_or_update(sweep_job)

Monitorowanie i przeglądanie zadań zamiatania

Zadania zamiatania można monitorować w usłudze Azure Machine Edukacja Studio. Zadanie zamiatania zainicjuje próby dla każdej kombinacji hiperparametrów do wypróbowania. Dla każdej wersji próbnej można przejrzeć wszystkie zarejestrowane metryki.

Ponadto można oceniać i porównywać modele, wizualizując wersje próbne w studio. Każdy wykres można dostosować tak, aby pokazywał i porównywał wartości hiperparametrów i metryki dla każdej wersji próbnej.

Napiwek

Dowiedz się więcej na temat wizualizowania zadań dostrajania hiperparametrów.

Kontynuuj

Używanie zadania zamiatania na potrzeby dostrajania hiperparametrów

Tworzenie skryptu szkoleniowego na potrzeby dostrajania hiperparametrów

Konfigurowanie i uruchamianie zadania zamiatania

Monitorowanie i przeglądanie zadań zamiatania

Opinia