Wdrażanie i uruchamianie modeli MLflow w zadaniach platformy Spark

Artykuł
06/13/2024

W tym artykule dowiesz się, jak wdrożyć i uruchomić model MLflow w zadaniach platformy Spark w celu wnioskowania na dużych ilościach danych lub w ramach zadań uzdatniania danych.

Informacje o tym przykładzie

W tym przykładzie pokazano, jak wdrożyć model MLflow zarejestrowany w usłudze Azure Machine Learning w zadaniach platformy Spark uruchomionych w zarządzanych klastrach Spark (wersja zapoznawcza), usłudze Azure Databricks lub Azure Synapse Analytics w celu wnioskowania na dużych ilościach danych.

Model jest oparty na zestawie danych choroby serca UCI. Baza danych zawiera 76 atrybutów, ale używamy podzestawu 14 z nich. Model próbuje przewidzieć obecność choroby serca u pacjenta. Jest to liczba całkowita z zakresu od 0 (brak obecności) do 1 (obecność). Został on wytrenowany przy użyciu XGBBoost klasyfikatora, a wszystkie wymagane przetwarzanie wstępne zostało spakowane jako potok, dzięki czemu ten model jest potokiem kompleksowego scikit-learn , który przechodzi od nieprzetworzonych danych do przewidywań.

Informacje przedstawione w tym artykule są oparte na przykładach kodu zawartych w repozytorium azureml-examples . Aby uruchomić polecenia lokalnie bez konieczności kopiowania/wklejania plików, sklonuj repozytorium, a następnie zmień katalogi na sdk/using-mlflow/deploy.

git clone https://github.com/Azure/azureml-examples --depth 1
cd sdk/python/using-mlflow/deploy

Wymagania wstępne

Przed wykonaniem kroków opisanych w tym artykule upewnij się, że masz następujące wymagania wstępne:

Zainstaluj pakiet mlflow zestawu MLflow SDK i wtyczkę usługi Azure Machine Learning dla biblioteki MLflow azureml-mlflow.
```
pip install mlflow azureml-mlflow
```
Napiwek

Możesz użyć mlflow-skinny pakietu, który jest lekkim pakietem MLflow bez magazynu SQL, serwera, interfejsu użytkownika lub zależności nauki o danych. mlflow-skinny jest zalecany dla użytkowników, którzy potrzebują głównie możliwości śledzenia i rejestrowania MLflow bez importowania pełnego zestawu funkcji, w tym wdrożeń.
Obszar roboczy usługi Azure Machine Learning. Możesz go utworzyć, wykonując czynności opisane w samouczku Tworzenie zasobów uczenia maszynowego.
- Sprawdź, które uprawnienia dostępu są potrzebne do wykonywania operacji MLflow w obszarze roboczym.
Jeśli wykonujesz zdalne śledzenie (czyli śledzenie eksperymentów uruchomionych poza usługą Azure Machine Learning), skonfiguruj rozwiązanie MLflow, aby wskazywało identyfikator URI śledzenia obszaru roboczego usługi Azure Machine Learning. Aby uzyskać więcej informacji na temat łączenia platformy MLflow z obszarem roboczym, zobacz Konfigurowanie biblioteki MLflow dla usługi Azure Machine Learning.

Musisz mieć model MLflow zarejestrowany w obszarze roboczym. W szczególności w tym przykładzie zostanie zarejestrowany model przeszkolony dla zestawu danych Diabetes.

Nawiązywanie połączenia z obszarem roboczym

Najpierw połączmy się z obszarem roboczym usługi Azure Machine Learning, w którym zarejestrowano model.

Obliczenia w usłudze Azure Machine Learning
Zdalne obliczenia

Śledzenie jest już skonfigurowane. Domyślne poświadczenia będą również używane podczas pracy z platformą MLflow.

Konfigurowanie identyfikatora URI śledzenia

Pobierz identyfikator URI śledzenia dla obszaru roboczego:
DOTYCZY: Rozszerzenie interfejsu wiersza polecenia platformy Azure ml w wersji 2 (bieżąca)
1. Zaloguj się i skonfiguruj obszar roboczy:
```
az account set --subscription <subscription>
az configure --defaults workspace=<workspace> group=<resource-group> location=<location> 
```
2. Identyfikator URI śledzenia można uzyskać za pomocą az ml workspace polecenia :
```
az ml workspace show --query mlflow_tracking_uri
```
DOTYCZY: Zestaw PYTHON SDK azure-ai-ml w wersji 2 (bieżąca)

Identyfikator URI śledzenia usługi Azure ML MLflow można uzyskać przy użyciu zestawu Azure Machine Learning SDK w wersji 2 dla języka Python. Upewnij się, że biblioteka azure-ai-ml jest zainstalowana w używanym środowisku obliczeniowym. Poniższy przykład pobiera unikatowy identyfikator URI śledzenia MLFLow skojarzony z obszarem roboczym.
1. Zaloguj się do obszaru roboczego przy użyciu polecenia MLClient. Łatwiejszym sposobem na to jest użycie pliku konfiguracji obszaru roboczego:
```
from azure.ai.ml import MLClient
from azure.identity import DefaultAzureCredential

ml_client = MLClient.from_config(credential=DefaultAzureCredential())
```
  Napiwek
  
  Plik konfiguracji obszaru roboczego można pobrać, wykonując następujące czynności:
  
  Przejdź do usługi Azure ML Studio
  
  Kliknij prawy górny róg strony —> pobierz plik konfiguracji.
  
  Zapisz plik config.json w tym samym katalogu, nad którym pracujesz.
2. Alternatywnie możesz użyć identyfikatora subskrypcji, nazwy grupy zasobów i nazwy obszaru roboczego, aby go pobrać:
```
from azure.ai.ml import MLClient
from azure.identity import DefaultAzureCredential

#Enter details of your AzureML workspace
subscription_id = '<SUBSCRIPTION_ID>'
resource_group = '<RESOURCE_GROUP>'
workspace_name = '<WORKSPACE_NAME>'

ml_client = MLClient(credential=DefaultAzureCredential(),
                        subscription_id=subscription_id, 
                        resource_group_name=resource_group,
                        workspace_name=workspace_name)
```
  Ważne
  
  DefaultAzureCredential Program podejmie próbę ściągnięcia poświadczeń z dostępnego kontekstu. Jeśli chcesz określić poświadczenia w inny sposób, na przykład przy użyciu przeglądarki internetowej w interaktywny sposób, możesz użyć InteractiveBrowserCredential lub innej metody dostępnej w azure.identity pakiecie.
3. Pobierz identyfikator URI śledzenia usługi Azure Machine Learning:
```
mlflow_tracking_uri = ml_client.workspaces.get(ml_client.workspace_name).mlflow_tracking_uri
```
Użyj portalu usługi Azure Machine Learning, aby uzyskać identyfikator URI śledzenia:
1. Otwórz portal usługi Azure Machine Learning Studio i zaloguj się przy użyciu swoich poświadczeń.
2. W prawym górnym rogu kliknij nazwę obszaru roboczego, aby wyświetlić blok Katalog + subskrypcja i obszar roboczy .
3. Kliknij pozycję Wyświetl wszystkie właściwości w witrynie Azure Portal.
4. W sekcji Podstawy znajdziesz identyfikator URI śledzenia MLflow właściwości.
Identyfikator URI śledzenia usługi Azure Machine Learning można utworzyć przy użyciu identyfikatora subskrypcji, regionu, w którym wdrożono zasób, nazwy grupy zasobów i nazwy obszaru roboczego. Poniższy przykładowy kod pokazuje, jak:

Ostrzeżenie

Jeśli pracujesz w obszarze roboczym z obsługą łącza prywatnego, punkt końcowy platformy MLflow będzie również używać łącza prywatnego do komunikowania się z usługą Azure Machine Learning. W związku z tym identyfikator URI śledzenia będzie wyglądać inaczej, jak zaproponowano tutaj. W tych przypadkach musisz uzyskać identyfikator URI śledzenia przy użyciu zestawu AZURE ML SDK lub interfejsu wiersza polecenia w wersji 2.
```
region = "<LOCATION>"
subscription_id = '<SUBSCRIPTION_ID>'
resource_group = '<RESOURCE_GROUP>'
workspace_name = '<AML_WORKSPACE_NAME>'

mlflow_tracking_uri = f"azureml://{region}.api.azureml.ms/mlflow/v1.0/subscriptions/{subscription_id}/resourceGroups/{resource_group}/providers/Microsoft.MachineLearningServices/workspaces/{workspace_name}"
```
Konfigurowanie identyfikatora URI śledzenia:
- Korzystanie z zestawu MLflow SDK
- Używanie zmiennych środowiskowych
Następnie metoda set_tracking_uri() wskazuje identyfikator URI śledzenia MLflow na ten identyfikator URI.
```
import mlflow

mlflow.set_tracking_uri(mlflow_tracking_uri)
```
Zmienne środowiskowe MLflow można ustawić MLFLOW_TRACKING_URI w obliczeniach, aby dowolna interakcja z usługą MLflow w tym środowisku obliczeniowym domyślnie wskazywała usługę Azure Machine Learning.
```
MLFLOW_TRACKING_URI=$(az ml workspace show --query mlflow_tracking_uri | sed 's/"//g') 
```
Napiwek

Podczas pracy w środowiskach udostępnionych, takich jak klaster usługi Azure Databricks, klaster usługi Azure Synapse Analytics lub podobny, warto ustawić zmienną środowiskową MLFLOW_TRACKING_URI na poziomie klastra, aby automatycznie skonfigurować identyfikator URI śledzenia MLflow w taki sposób, aby wskazywał usługę Azure Machine Learning dla wszystkich sesji uruchomionych w klastrze, a nie w celu wykonania jej dla poszczególnych sesji.

Konfiguruj uwierzytelnianie

Po skonfigurowaniu śledzenia należy również skonfigurować sposób uwierzytelniania w skojarzonym obszarze roboczym. Domyślnie wtyczka usługi Azure Machine Learning dla platformy MLflow przeprowadzi uwierzytelnianie interakcyjne, otwierając domyślną przeglądarkę, aby wyświetlić monit o poświadczenia. Zobacz Konfigurowanie platformy MLflow dla usługi Azure Machine Learning: konfigurowanie uwierzytelniania na dodatkowe sposoby konfigurowania uwierzytelniania dla platformy MLflow w obszarach roboczych usługi Azure Machine Learning.

W przypadku zadań interaktywnych, w których istnieje użytkownik połączony z sesją, można polegać na uwierzytelnianiu interakcyjnym i dlatego nie jest wymagana żadna dalsza akcja.

Ostrzeżenie

Uwierzytelnianie interakcyjne przeglądarki zablokuje wykonywanie kodu podczas monitowania o poświadczenia. Nie jest to odpowiednia opcja uwierzytelniania w środowiskach nienadzorowanych, takich jak zadania szkoleniowe. Zalecamy skonfigurowanie innego trybu uwierzytelniania.

W przypadku tych scenariuszy, w których wymagane jest nienadzorowane wykonanie, należy skonfigurować jednostkę usługi do komunikowania się z usługą Azure Machine Learning.

MLflow SDK
Używanie zmiennych środowiskowych

import os

os.environ["AZURE_TENANT_ID"] = "<AZURE_TENANT_ID>"
os.environ["AZURE_CLIENT_ID"] = "<AZURE_CLIENT_ID>"
os.environ["AZURE_CLIENT_SECRET"] = "<AZURE_CLIENT_SECRET>"

export AZURE_TENANT_ID="<AZURE_TENANT_ID>"
export AZURE_CLIENT_ID="<AZURE_CLIENT_ID>"
export AZURE_CLIENT_SECRET="<AZURE_CLIENT_SECRET>"

Napiwek

Podczas pracy w środowiskach udostępnionych zaleca się skonfigurowanie tych zmiennych środowiskowych w środowisku obliczeniowym. Najlepszym rozwiązaniem jest zarządzanie nimi jako wpisami tajnymi w wystąpieniu usługi Azure Key Vault zawsze, gdy jest to możliwe. Na przykład w usłudze Azure Databricks można używać wpisów tajnych w zmiennych środowiskowych w następujący sposób w konfiguracji klastra: AZURE_CLIENT_SECRET={{secrets/<scope-name>/<secret-name>}}. Zobacz Odwołanie do wpisu tajnego w zmiennej środowiskowej , aby dowiedzieć się, jak to zrobić w usłudze Azure Databricks lub zapoznaj się z podobną dokumentacją na platformie.

Rejestrowanie modelu

Do wnioskowania potrzebujemy modelu zarejestrowanego w rejestrze usługi Azure Machine Learning. W tym przypadku mamy już lokalną kopię modelu w repozytorium, więc musimy opublikować model tylko w rejestrze w obszarze roboczym. Ten krok można pominąć, jeśli model, który próbujesz wdrożyć, jest już zarejestrowany.

model_name = 'heart-classifier'
model_local_path = "model"

registered_model = mlflow_client.create_model_version(
    name=model_name, source=f"file://{model_local_path}"
)
version = registered_model.version

Alternatywnie, jeśli model został zarejestrowany wewnątrz przebiegu, możesz zarejestrować go bezpośrednio.

Napiwek

Aby zarejestrować model, musisz znać lokalizację, w której został zapisany model. Jeśli używasz autolog funkcji MLflow, ścieżka będzie zależeć od typu i struktury używanego modelu. Zalecamy sprawdzenie danych wyjściowych zadań w celu zidentyfikowania nazwy tego folderu. Możesz wyszukać folder zawierający plik o nazwie MLModel. Jeśli rejestrujesz modele ręcznie przy użyciu metody log_model, ścieżka jest argumentem przekazywanym do takiej metody. Jeśli na przykład rejestrujesz model przy użyciu mlflow.sklearn.log_model(my_model, "classifier")metody , ścieżka, w której jest przechowywany model, to classifier.

model_name = 'heart-classifier'

registered_model = mlflow_client.create_model_version(
    name=model_name, source=f"runs://{RUN_ID}/{MODEL_PATH}"
)
version = registered_model.version

Uwaga

Ścieżka MODEL_PATH to lokalizacja, w której model został zapisany w przebiegu.

Pobieranie danych wejściowych w celu oceny

Do uruchomienia lub zadań potrzebnych będzie kilka danych wejściowych. W tym przykładzie pobierzemy przykładowe dane z Internetu i umieścimy je w udostępnionym magazynie używanym przez klaster Spark.

import urllib

urllib.request.urlretrieve("https://azuremlexampledata.blob.core.windows.net/data/heart-disease-uci/data/heart.csv", "/tmp/data")

Przenieś dane do zainstalowanego konta magazynu dostępnego dla całego klastra.

dbutils.fs.mv("file:/tmp/data", "dbfs:/")

Ważne

W poprzednim kodzie jest używane dbutilsnarzędzie dostępne w klastrze usługi Azure Databricks. Użyj odpowiedniego narzędzia w zależności od używanej platformy.

Dane wejściowe są następnie umieszczane w następującym folderze:

input_data_path = "dbfs:/data"

Uruchamianie modelu w klastrach Spark

W poniższej sekcji wyjaśniono, jak uruchamiać modele MLflow zarejestrowane w usłudze Azure Machine Learning w zadaniach platformy Spark.

Upewnij się, że w klastrze są zainstalowane następujące biblioteki:

- mlflow<3,>=2.1
- cloudpickle==2.2.0
- scikit-learn==1.2.0
- xgboost==1.7.2

Użyjemy notesu, aby pokazać, jak utworzyć procedurę oceniania za pomocą modelu MLflow zarejestrowanego w usłudze Azure Machine Learning. Utwórz notes i użyj narzędzia PySpark jako języka domyślnego.

Zaimportuj wymagane przestrzenie nazw:

import mlflow
import pyspark.sql.functions as f

Skonfiguruj identyfikator URI modelu. Poniższy identyfikator URI wprowadza model o nazwie heart-classifier w najnowszej wersji.
```
model_uri = "models:/heart-classifier/latest"
```
Załaduj model jako funkcję UDF. Funkcja zdefiniowana przez użytkownika (UDF) jest funkcją zdefiniowaną przez użytkownika, umożliwiając ponowne użycie logiki niestandardowej w środowisku użytkownika.
```
predict_function = mlflow.pyfunc.spark_udf(spark, model_uri, result_type='double') 
```
Napiwek

Użyj argumentu result_type , aby kontrolować typ zwracany przez predict() funkcję.
Przeczytaj dane, które chcesz ocenić:
```
df = spark.read.option("header", "true").option("inferSchema", "true").csv(input_data_path).drop("target")
```
W naszym przypadku dane wejściowe są w CSV formacie i umieszczane w folderze dbfs:/data/. Usuwamy również kolumnę target , ponieważ ten zestaw danych zawiera zmienną docelową do przewidzenia. W scenariuszach produkcyjnych dane nie będą miały tej kolumny.
Uruchom funkcję predict_function i umieść przewidywania w nowej kolumnie. W tym przypadku umieszczamy przewidywania w kolumnie predictions.
```
df.withColumn("predictions", score_function(*df.columns))
```
Napiwek

Odebrane predict_function jako argumenty wymagane kolumny. W naszym przypadku wszystkie kolumny ramki danych są oczekiwane przez model i dlatego df.columns są używane. Jeśli model wymaga podzbioru kolumn, możesz wprowadzić je ręcznie. Jeśli model ma podpis, typy muszą być zgodne między danymi wejściowymi i oczekiwanymi typami.

Przewidywania można zapisywać z powrotem do magazynu:

scored_data_path = "dbfs:/scored-data"
scored_data.to_csv(scored_data_path)

Uruchamianie modelu w autonomicznym zadaniu spark w usłudze Azure Machine Learning

Usługa Azure Machine Learning obsługuje tworzenie autonomicznego zadania platformy Spark oraz tworzenie składnika platformy Spark wielokrotnego użytku, który może być używany w potokach usługi Azure Machine Learning. W tym przykładzie wdrożymy zadanie oceniania uruchamiane w autonomicznym zadaniu platformy Spark usługi Azure Machine Learning i uruchamiamy model MLflow w celu przeprowadzenia wnioskowania.

Uwaga

Aby dowiedzieć się więcej o zadaniach platformy Spark w usłudze Azure Machine Learning, zobacz Przesyłanie zadań platformy Spark w usłudze Azure Machine Learning (wersja zapoznawcza).

Zadanie platformy Spark wymaga skryptu języka Python, który przyjmuje argumenty. Utwórz skrypt oceniania:

score.py
```
import argparse

parser = argparse.ArgumentParser()
parser.add_argument("--model")
parser.add_argument("--input_data")
parser.add_argument("--scored_data")

args = parser.parse_args()
print(args.model)
print(args.input_data)

# Load the model as an UDF function
predict_function = mlflow.pyfunc.spark_udf(spark, args.model, env_manager="conda")

# Read the data you want to score
df = spark.read.option("header", "true").option("inferSchema", "true").csv(input_data).drop("target")

# Run the function `predict_function` and place the predictions on a new column
scored_data = df.withColumn("predictions", score_function(*df.columns))

# Save the predictions
scored_data.to_csv(args.scored_data)
```
Powyższy skrypt przyjmuje trzy argumenty --model, --input_data i --scored_data. Pierwsze dwa to dane wejściowe i reprezentują model, który chcemy uruchomić, a dane wejściowe, ostatni to dane wyjściowe i jest to folder wyjściowy, w którym zostaną umieszczone przewidywania.

Napiwek

Instalacja pakietów języka Python: poprzedni skrypt oceniania ładuje model MLflow do funkcji UDF, ale wskazuje parametr env_manager="conda". Po ustawieniu tego parametru narzędzie MLflow przywróci wymagane pakiety zgodnie z definicją modelu w izolowanym środowisku, w którym jest uruchamiana tylko funkcja UDF. Aby uzyskać więcej informacji, zobacz mlflow.pyfunc.spark_udf dokumentację.

Utwórz definicję zadania:

mlflow-score-spark-job.yml

$schema: http://azureml/sdk-2-0/SparkJob.json
type: spark

code: ./src
entry:
  file: score.py

conf:
  spark.driver.cores: 1
  spark.driver.memory: 2g
  spark.executor.cores: 2
  spark.executor.memory: 2g
  spark.executor.instances: 2

inputs:
  model:
    type: mlflow_model
    path: azureml:heart-classifier@latest
  input_data:
    type: uri_file
    path: https://azuremlexampledata.blob.core.windows.net/data/heart-disease-uci/data/heart.csv
    mode: direct

outputs:
  scored_data:
    type: uri_folder

args: >-
  --model ${{inputs.model}}
  --input_data ${{inputs.input_data}}
  --scored_data ${{outputs.scored_data}}

identity:
  type: user_identity

resources:
  instance_type: standard_e4s_v3
  runtime_version: "3.2"

Napiwek

Aby użyć dołączonej puli platformy Synapse Spark, zdefiniuj compute właściwość w przykładowym pliku specyfikacji YAML pokazanym powyżej zamiast resources właściwości.

Pliki YAML pokazane powyżej mogą być używane w az ml job create poleceniu z parametrem --file w celu utworzenia autonomicznego zadania platformy Spark, jak pokazano poniżej:
```
az ml job create -f mlflow-score-spark-job.yml
```

Udostępnij za pośrednictwem

Wdrażanie i uruchamianie modeli MLflow w zadaniach platformy Spark

Informacje o tym przykładzie

Wymagania wstępne

Nawiązywanie połączenia z obszarem roboczym

Rejestrowanie modelu

Pobieranie danych wejściowych w celu oceny

Uruchamianie modelu w klastrach Spark

Uruchamianie modelu w autonomicznym zadaniu spark w usłudze Azure Machine Learning

Następne kroki

Opinia

Opinia

Dodatkowe zasoby