Modell online végponton történő üzembe helyezése egyéni tároló használatával

Cikk
11/05/2024

ÉRVÉNYES:Azure CLI ml-bővítmény v2 (aktuális)Python SDK azure-ai-ml v2 (aktuális)

Megtudhatja, hogyan helyezhet üzembe egy modellt egy online végponton az Azure Machine Learningben egyéni tároló használatával.

Az egyéni tárolótelepítések az Azure Machine Learning által használt alapértelmezett Python Flask-kiszolgálótól eltérő webkiszolgálókat is használhatnak. Ezen üzemelő példányok felhasználói továbbra is kihasználhatják az Azure Machine Learning beépített monitorozási, skálázási, riasztási és hitelesítési előnyeit.

Az alábbi táblázat olyan egyéni tárolókat használó üzembe helyezési példákat sorol fel, mint a TensorFlow-kiszolgáló, a TorchServe, a Triton Inference Server, a Plumber R-csomag és az Azure Machine Learning Következtetés minimális rendszerképe.

Példa	Szkript (CLI)	Leírás
minimális/többmodelles	deploy-custom-container-minimal-multimodel	Több modell üzembe helyezése egyetlen üzembe helyezéshez az Azure Machine Learning Következtetés minimális rendszerképének kibővítésével.
minimális/egymodelles	deploy-custom-container-minimal-single-model	Egyetlen modell üzembe helyezése az Azure Machine Learning Következtetés minimális rendszerképének kibővítésével.
mlflow/multideployment-scikit	deploy-custom-container-mlflow-multideployment-scikit	Helyezzen üzembe két különböző Python-követelményeket tartalmazó MLFlow-modellt két különálló üzembe helyezésre egyetlen végpont mögött az Azure Machine Learning Következtetés minimális rendszerképének használatával.
r/többmodelles vízvezeték-szerelő	deploy-custom-container-r-multimodel-plumber	Három regressziós modell üzembe helyezése egy végponton a Plumber R csomag használatával
tfserving/half-plus-two	deploy-custom-container-tfserving-half-plus-two	Egy Half Plus Két modell üzembe helyezése egyéni TensorFlow-tárolóval a standard modellregisztrációs folyamattal.
tfserving/half-plus-two-integrated	deploy-custom-container-tfserving-half-plus-two-integrated	Egy Half Plus Two modell üzembe helyezése egy Egyéni TensorFlow-tároló használatával a modell képbe integrált használatával.
torchserve/densenet	deploy-custom-container-torchserve-densenet	Egyetlen modell üzembe helyezése egyéni TorchServe-tárolóval.
triton/egymodell	deploy-custom-container-triton-single-model	Triton-modell üzembe helyezése egyéni tároló használatával

Ez a cikk egy TensorFlow-modell és a TensorFlow (TF) szolgáltatással való kiszolgálására összpontosít.

Figyelmeztetés

Előfordulhat, hogy a Microsoft nem tud segíteni az egyéni rendszerképek által okozott problémák elhárításában. Ha problémákat tapasztal, előfordulhat, hogy az alapértelmezett rendszerkép vagy a Microsoft által biztosított képek egyikének használatával állapítja meg, hogy a probléma az Ön képére vonatkozik-e.

Előfeltételek

A cikkben ismertetett lépések végrehajtása előtt győződjön meg arról, hogy rendelkezik a következő előfeltételekkel:

Egy Azure Machine Learning-munkaterület. Ha nincs ilyenje, a gyorsútmutató lépéseit követve hozzon létre egyet a munkaterület erőforrásainak létrehozása című cikkben.
Az Azure CLI és a ml bővítmény vagy az Azure Machine Learning Python SDK v2:
- Az Azure CLI és a bővítmény telepítéséhez lásd a parancssori felület (v2) telepítését, beállítását és használatát.
  
  Fontos
  
  A jelen cikkben szereplő CLI-példák feltételezik, hogy a Bash (vagy kompatibilis) rendszerhéjat használja. Például linuxos rendszerből vagy Linuxos Windows-alrendszer.
- A Python SDK v2 telepítéséhez használja a következő parancsot:
```
pip install azure-ai-ml azure-identity
```
  Ha frissíteni szeretné az SDK meglévő telepítését a legújabb verzióra, használja a következő parancsot:
```
pip install --upgrade azure-ai-ml azure-identity
```
  További információ: Az Azure Machine Learninghez készült Python SDK v2 telepítése.

Önnek vagy a használt szolgáltatásnévnek közreműködői hozzáféréssel kell rendelkeznie a munkaterületet tartalmazó Azure-erőforráscsoporthoz. Ilyen erőforráscsoporttal rendelkezik, ha a gyorsútmutató-cikk használatával konfigurálta a munkaterületet.
A helyi üzembe helyezéshez helyileg kell futtatnia a Docker-motort . Ez a lépés erősen ajánlott. Segít a hibák hibakeresésében.

Forráskód letöltése

Az oktatóanyagot követve klónozza a forráskódot a GitHubról.

Azure CLI
Python SDK

git clone https://github.com/Azure/azureml-examples --depth 1
cd azureml-examples/cli

git clone https://github.com/Azure/azureml-examples --depth 1
cd azureml-examples/cli

Lásd még a példajegyzetfüzetet, de vegye figyelembe, hogy 3. Test locally a jegyzetfüzet szakasza feltételezi, hogy a azureml-examples/sdk könyvtár alatt fut.

Környezeti változók inicializálása

Környezeti változók definiálása:

BASE_PATH=endpoints/online/custom-container/tfserving/half-plus-two
AML_MODEL_NAME=tfserving-mounted
MODEL_NAME=half_plus_two
MODEL_BASE_PATH=/var/azureml-app/azureml-models/$AML_MODEL_NAME/1

TensorFlow-modell letöltése

Töltse le és bontsa ki azt a modellt, amely két bemenettel osztja el a bemenetet, és 2-et ad hozzá az eredményhez:

wget https://aka.ms/half_plus_two-model -O $BASE_PATH/half_plus_two.tar.gz
tar -xvf $BASE_PATH/half_plus_two.tar.gz -C $BASE_PATH

TF-kiszolgáló lemezképének helyi futtatása annak ellenőrzéséhez, hogy működik-e

A docker használatával helyileg futtathatja a rendszerképet teszteléshez:

docker run --rm -d -v $PWD/$BASE_PATH:$MODEL_BASE_PATH -p 8501:8501 \
 -e MODEL_BASE_PATH=$MODEL_BASE_PATH -e MODEL_NAME=$MODEL_NAME \
 --name="tfserving-test" docker.io/tensorflow/serving:latest
sleep 10

Ellenőrizze, hogy küldhet-e élősséget és pontozási kéréseket a képre

Először ellenőrizze, hogy a tároló életben van-e, ami azt jelenti, hogy a tárolón belüli folyamat továbbra is fut. 200 (OK) választ kell kapnia.

curl -v http://localhost:8501/v1/models/$MODEL_NAME

Ezután ellenőrizze, hogy kaphat-e előrejelzéseket a címkézetlen adatokról:

curl --header "Content-Type: application/json" \
  --request POST \
  --data @$BASE_PATH/sample_request.json \
  http://localhost:8501/v1/models/$MODEL_NAME:predict

A kép leállítása

Most, hogy helyileg tesztelt, állítsa le a képet:

docker stop tfserving-test

Az online végpont üzembe helyezése az Azure-ban

Ezután helyezze üzembe az online végpontot az Azure-ban.

Azure CLI
Python SDK

YAML-fájl létrehozása a végponthoz és az üzembe helyezéshez

A felhőbeli üzembe helyezést a YAML használatával konfigurálhatja. Tekintse meg a példához tartozó YAML-mintát:

tfserving-endpoint.yml

$schema: https://azuremlsdk2.blob.core.windows.net/latest/managedOnlineEndpoint.schema.json
name: tfserving-endpoint
auth_mode: aml_token

tfserving-deployment.yml

$schema: https://azuremlschemas.azureedge.net/latest/managedOnlineDeployment.schema.json
name: tfserving-deployment
endpoint_name: tfserving-endpoint
model:
  name: tfserving-mounted
  version: {{MODEL_VERSION}}
  path: ./half_plus_two
environment_variables:
  MODEL_BASE_PATH: /var/azureml-app/azureml-models/tfserving-mounted/{{MODEL_VERSION}}
  MODEL_NAME: half_plus_two
environment:
  #name: tfserving
  #version: 1
  image: docker.io/tensorflow/serving:latest
  inference_config:
    liveness_route:
      port: 8501
      path: /v1/models/half_plus_two
    readiness_route:
      port: 8501
      path: /v1/models/half_plus_two
    scoring_route:
      port: 8501
      path: /v1/models/half_plus_two:predict
instance_type: Standard_DS3_v2
instance_count: 1

Csatlakozás az Azure Machine Learning-munkaterülethez

Csatlakozzon az Azure Machine Learning-munkaterülethez, konfigurálja a munkaterület részleteit, és kérje le a leírót a munkaterülethez az alábbiak szerint:

Importálja a szükséges kódtárakat:

# import required libraries
from azure.ai.ml import MLClient
from azure.ai.ml.entities import (
   ManagedOnlineEndpoint,
   ManagedOnlineDeployment,
   Model,
   Environment,
   CodeConfiguration,
)
from azure.identity import DefaultAzureCredential

Konfigurálja a munkaterület részleteit, és szerezze be a munkaterülethez a leírót:

# enter details of your Azure Machine Learning workspace
subscription_id = "<SUBSCRIPTION_ID>"
resource_group = "<RESOURCE_GROUP>"
workspace = "<AZUREML_WORKSPACE_NAME>"

# get a handle to the workspace
ml_client = MLClient(
   DefaultAzureCredential(), subscription_id, resource_group, workspace
)

További információ: Gépi tanulási modellek üzembe helyezése felügyelt online végponton Python SDK v2 használatával.

Online végpont konfigurálása

Tipp.

name: A végpont neve. Egyedinek kell lennie az Azure-régióban. A végpont nevének nagybetűvel vagy kisbetűvel kell kezdődnie, és csak "-" és alfanumerikus karakterekből áll. Az elnevezési szabályokkal kapcsolatos további információkért tekintse meg a végpontkorlátokat.
auth_mode : Kulcsalapú hitelesítéshez használható key . Azure Machine Learning-jogkivonat-alapú hitelesítéshez használható aml_token . Az A key nem jár le, de aml_token lejár. A hitelesítéssel kapcsolatos további információkért lásd : Hitelesítés online végponton.

Igény szerint leírást és címkéket is hozzáadhat a végponthoz.

# Creating a unique endpoint name with current datetime to avoid conflicts
import datetime

online_endpoint_name = "endpoint-" + datetime.datetime.now().strftime("%m%d%H%M%f")

# create an online endpoint
endpoint = ManagedOnlineEndpoint(
    name=online_endpoint_name,
    description="this is a sample online endpoint",
    auth_mode="key",
    tags={"foo": "bar"},
)

Online üzemelő példány konfigurálása

Az üzembe helyezés a tényleges következtetést okozó modell üzemeltetéséhez szükséges erőforrások készlete. Hozzon létre egy üzembe helyezést a végponthoz az ManagedOnlineDeployment osztály használatával.

Tipp.

name - Az üzembe helyezés neve.
endpoint_name – Az üzembe helyezés létrehozásához szükséges végpont neve.
model - Az üzembe helyezéshez használni kívánt modell. Ez az érték lehet a munkaterület egy meglévő verziójú > modelljére való hivatkozás, vagy egy beágyazott modell specifikációja.
environment - Az üzembe helyezéshez használni kívánt környezet. Ez az érték hivatkozhat a munkaterület meglévő > verziójú környezetére, vagy egy beágyazott környezeti specifikációra.
code_configuration - a forráskód és a pontozási szkript konfigurációja
- path– A modell pontozásához használt forráskódkönyvtár elérési útja
- scoring_script – A forráskód könyvtárában található pontozófájl relatív elérési útja
instance_type – Az üzembe helyezéshez használandó virtuálisgép-méret. A támogatott méretek listáját a végpontok termékváltozatának listájában találja.
instance_count – Az üzembe helyezéshez használandó példányok száma

# create a blue deployment
model = Model(name="tfserving-mounted", version="1", path="half_plus_two")

env = Environment(
    image="docker.io/tensorflow/serving:latest",
    inference_config={
        "liveness_route": {"port": 8501, "path": "/v1/models/half_plus_two"},
        "readiness_route": {"port": 8501, "path": "/v1/models/half_plus_two"},
        "scoring_route": {"port": 8501, "path": "/v1/models/half_plus_two:predict"},
    },
)

blue_deployment = ManagedOnlineDeployment(
    name="blue",
    endpoint_name=online_endpoint_name,
    model=model,
    environment=env,
    environment_variables={
        "MODEL_BASE_PATH": "/var/azureml-app/azureml-models/tfserving-mounted/1",
        "MODEL_NAME": "half_plus_two",
    },
    instance_type="Standard_DS2_v2",
    instance_count=1,
)

Ebben a YAML/Python-paraméterben néhány fontos fogalmat érdemes figyelembe venni:

Alaprendszerkép

Az alaprendszerkép paraméterként van megadva a környezetben, és docker.io/tensorflow/serving:latest ebben a példában használatos. A tároló vizsgálata során láthatja, hogy ez a kiszolgáló egy belépési pont szkriptjének elindítására használja ENTRYPOINT , amely felveszi az olyan környezeti változókat, mint MODEL_BASE_PATH például az és MODEL_NAME, és elérhetővé teszi az olyan portokat, mint a 8501. Ezek a részletek a kiválasztott kiszolgáló összes konkrét információi. A kiszolgáló ezen ismerete alapján meghatározhatja az üzemelő példány definiálását. Ha például környezeti változókat MODEL_BASE_PATH állít be az üzembehelyezési definícióhoz és MODEL_NAME a környezet definíciójában, a kiszolgáló (ebben az esetben a TF-kiszolgáló) a kiszolgáló indításához veszi az értékeket. Hasonlóképpen, ha beállítja az útvonalak 8501 portját az üzembehelyezési definícióban, a rendszer helyesen irányítja az ilyen útvonalakra irányuló felhasználói kérést a TF kiszolgálóra.

Vegye figyelembe, hogy ez a konkrét példa a TF-kiszolgálói eseten alapul, de bármilyen tárolót használhat, amely továbbra is naprakész marad, és válaszol az élethez, a felkészültséghez és a pontozási útvonalakhoz érkező kérésekre. További példákra is hivatkozhat, és megtekintheti, hogyan jön létre a dockerfile (például ahelyettENTRYPOINT), CMD hogy létrehozza a tárolókat.

Következtetés konfigurációja

A következtetési konfiguráció egy paraméter a környezetben, és az útvonal 3 típusának portját és elérési útját adja meg: az élőképességet, a készültséget és a pontozási útvonalat. Következtetési konfigurációra van szükség, ha saját tárolót szeretne futtatni felügyelt online végponttal.

Készültségi útvonal és élőség útvonala

A választott API-kiszolgáló módot biztosíthat a kiszolgáló állapotának ellenőrzésére. Az útvonalnak két típusa van: az élőség és a felkészültség. A rendszer egy élőségi útvonalat használ annak ellenőrzésére, hogy a kiszolgáló fut-e. A rendszer készenléti útvonalat használ annak ellenőrzésére, hogy a kiszolgáló készen áll-e a munkára. A gépi tanulási következtetés kontextusában a kiszolgáló a modell betöltése előtt 200 OK-ra válaszolhatott egy élességi kérelemre, a kiszolgáló pedig csak a modell memóriába való betöltése után tudott válaszolni a 200 OK-ra.

Az élettel és a készültségi mintavételekkel kapcsolatos további információkért tekintse meg a Kubernetes dokumentációját.

Az élettartamot és a készültségi útvonalakat az Ön által választott API-kiszolgáló határozza meg, amint azt a tároló helyi tesztelésekor azonosította volna a korábbi lépésben. Vegye figyelembe, hogy a cikkben szereplő példatelepítés ugyanazt az útvonalat használja mind az élőség, mind a felkészültség szempontjából, mivel a TF-kiszolgáló csak egy élőségi útvonalat határoz meg. Az útvonalak meghatározásához tekintse meg a különböző mintákra vonatkozó egyéb példákat.

Pontozási útvonal

A választott API-kiszolgáló módot adna a hasznos adatok fogadására, hogy működjenek. A gépi tanulási következtetés kontextusában a kiszolgáló egy adott útvonalon kapja meg a bemeneti adatokat. Azonosítsa ezt az útvonalat az API-kiszolgálóhoz, amikor a tárolót helyileg teszteli a korábbi lépésben, és adja meg, amikor meghatározza a létrehozandó üzembe helyezést. Vegye figyelembe, hogy az üzembe helyezés sikeres létrehozása a végpont scoring_uri paraméterét is frissíti, amelyet ellenőrizheti az ml online-endpoint show -n <name> --query scoring_uri.

A csatlakoztatott modell keresése

Amikor online végpontként helyez üzembe egy modellt, az Azure Machine Learning csatlakoztatja a modellt a végponthoz. A modell csatlakoztatása lehetővé teszi a modell új verzióinak üzembe helyezését anélkül, hogy új Docker-lemezképet kellene létrehoznia. Alapértelmezés szerint a foo névvel és az 1. verzióval regisztrált modell a következő elérési úton található az üzembe helyezett tárolóban: /var/azureml-app/azureml-models/foo/1

Ha például a /azureml-examples/cli/endpoints/online/custom-container könyvtárstruktúrája van a helyi gépen, ahol a modell neve half_plus_two:

A helyi könyvtárszerkezet fanézetét bemutató diagram.

Azure CLI
Python SDK

És tfserving-deployment.yml a következőket tartalmazza:

model:
    name: tfserving-mounted
    version: 1
    path: ./half_plus_two

Az Model osztály a következőket tartalmazza:

model = Model(name="tfserving-mounted", version="1", path="half_plus_two")

Ezután a modell a /var/azureml-app/azureml-models/tfserving-deployment/1 területen található az üzembe helyezés során:

Az üzembehelyezési könyvtár szerkezetének fanézetét bemutató ábra.

Igény szerint konfigurálhatja a .model_mount_path Lehetővé teszi a modell csatlakoztatási útvonalának módosítását.

Fontos

Az model_mount_path elérési útnak érvényes abszolút elérési útnak kell lennie Linuxon (a tárolórendszerkép operációs rendszerének).

Azure CLI
Python SDK

Például rendelkezhet model_mount_path paramétert a tfserving-deployment.yml:

name: tfserving-deployment
endpoint_name: tfserving-endpoint
model:
  name: tfserving-mounted
  version: 1
  path: ./half_plus_two
model_mount_path: /var/tfserving-model-mount
.....

Például a paraméter az osztályban ManagedOnlineDeployment is szerepelhetmodel_mount_path:

blue_deployment = ManagedOnlineDeployment(
    name="blue",
    endpoint_name=online_endpoint_name,
    model=model,
    environment=env,
    model_mount_path="/var/tfserving-model-mount",
    ...
)

Ezután a modell a /var/tfserving-model-mount/tfserving-deployment/1 helyen található az üzembe helyezésben. Vegye figyelembe, hogy már nem az azureml-app/azureml-models alatt van, hanem a megadott csatlakoztatási útvonal alatt:

Az üzembehelyezési könyvtár szerkezetének fanézetét ábrázoló diagram mount_model_path használatakor.

A végpont és az üzembe helyezés létrehozása

Azure CLI
Python SDK

Most, hogy megismerte a YAML létrehozásának módját, hozza létre a végpontot.

az ml online-endpoint create --name tfserving-endpoint -f endpoints/online/custom-container/tfserving-endpoint.yml

Az üzembe helyezés létrehozása eltarthat néhány percig.

az ml online-deployment create --name tfserving-deployment -f endpoints/online/custom-container/tfserving-deployment.yml --all-traffic

MLClient A korábban létrehozott parancs használatával hozza létre a végpontot a munkaterületen. Ez a parancs elindítja a végpont létrehozását, és egy megerősítést kérő választ ad vissza, amíg a végpont létrehozása folytatódik.

ml_client.begin_create_or_update(endpoint)

Hozza létre az üzembe helyezést a következő futtatásával:

ml_client.begin_create_or_update(blue_deployment)

A végpont meghívása

Az üzembe helyezés befejezése után ellenőrizze, hogy tud-e pontozási kérelmet küldeni az üzembe helyezett végpontra.

Azure CLI
Python SDK

RESPONSE=$(az ml online-endpoint invoke -n $ENDPOINT_NAME --request-file $BASE_PATH/sample_request.json)

MLClient A korábban létrehozottak használatával kap egy leírót a végponthoz. A végpont a következő paraméterekkel hívható meg a invoke paranccsal:

endpoint_name - A végpont neve
request_file - Kérelemadatokkal rendelkező fájl
deployment_name – A végponton tesztelni kívánt adott üzembe helyezés neve

Küldjön egy mintakérelmet egy JSON-fájl használatával. A minta JSON a példaadattárban található.

# test the blue deployment with some sample data
ml_client.online_endpoints.invoke(
    endpoint_name=online_endpoint_name,
    deployment_name="blue",
    request_file="sample-request.json",
)

A végpont törlése

Most, hogy sikeresen pontszámot szerzett a végponttal, törölheti azt:

Azure CLI
Python SDK

az ml online-endpoint delete --name tfserving-endpoint

ml_client.online_endpoints.begin_delete(name=online_endpoint_name)

Megosztás a következőn keresztül:

Modell online végponton történő üzembe helyezése egyéni tároló használatával

Előfeltételek

Forráskód letöltése

Környezeti változók inicializálása

TensorFlow-modell letöltése

TF-kiszolgáló lemezképének helyi futtatása annak ellenőrzéséhez, hogy működik-e

Ellenőrizze, hogy küldhet-e élősséget és pontozási kéréseket a képre

A kép leállítása

Az online végpont üzembe helyezése az Azure-ban

YAML-fájl létrehozása a végponthoz és az üzembe helyezéshez

Csatlakozás az Azure Machine Learning-munkaterülethez

Online végpont konfigurálása

Online üzemelő példány konfigurálása

Alaprendszerkép

Következtetés konfigurációja

Készültségi útvonal és élőség útvonala

Pontozási útvonal

A csatlakoztatott modell keresése

A végpont és az üzembe helyezés létrehozása

A végpont meghívása

A végpont törlése

Visszajelzés

További források

Megosztás a következőn keresztül:

Modell online végponton történő üzembe helyezése egyéni tároló használatával

Előfeltételek

Forráskód letöltése

Környezeti változók inicializálása

TensorFlow-modell letöltése

TF-kiszolgáló lemezképének helyi futtatása annak ellenőrzéséhez, hogy működik-e

Ellenőrizze, hogy küldhet-e élősséget és pontozási kéréseket a képre

A kép leállítása

Az online végpont üzembe helyezése az Azure-ban

YAML-fájl létrehozása a végponthoz és az üzembe helyezéshez

Alaprendszerkép

Következtetés konfigurációja

Készültségi útvonal és élőség útvonala

Pontozási útvonal

A csatlakoztatott modell keresése

A végpont és az üzembe helyezés létrehozása

A végpont meghívása

A végpont törlése

Kapcsolódó tartalom

Visszajelzés

További források