Ml-kísérletek és modellek nyomon követése az MLflow használatával

Cikk
02/23/2024

Ebből a cikkből megtudhatja, hogyan használhatja az MLflow-t a kísérletek nyomon követéséhez és az Azure Machine Tanulás munkaterületeken való futtatáshoz.

A nyomon követés a futtatott kísérletekre vonatkozó információk mentésének folyamata. A mentett információk (metaadatok) a projekttől függően változnak, és a következők lehetnek:

Kód
Környezet részletei (például operációsrendszer-verzió, Python-csomagok)
Bemeneti adatok
Paraméterkonfigurációk
Modellek
Értékelési metrikák
Kiértékelési vizualizációk (például keveredési mátrixok, fontossági diagramok)
Kiértékelési eredmények (beleértve néhány kiértékelési előrejelzést is)

Amikor az Azure Machine Tanulás-beli feladatokkal dolgozik, az Azure Machine Tanulás automatikusan nyomon követi a kísérletek bizonyos adatait, például a kódokat, a környezetet, valamint a bemeneti és kimeneti adatokat. Mások, például modellek, paraméterek és metrikák esetében azonban a modellkészítőnek konfigurálnia kell a nyomon követésüket, mivel azok az adott forgatókönyvre vonatkoznak.

Feljegyzés

Ha nyomon szeretné követni az Azure Databricksen futó kísérleteket, tekintse meg az Azure Databricks ML-kísérletek nyomon követését az MLflow és az Azure Machine Tanulás használatával. Az Azure Synapse Analyticsben futó kísérletek nyomon követéséről az Azure Synapse Analytics ML-kísérleteinek nyomon követése az MLflow és az Azure Machine Tanulás című témakörben olvashat.

A kísérletek nyomon követésének előnyei

Határozottan javasoljuk, hogy a gépi tanulási szakemberek nyomon kövessék a kísérleteket, függetlenül attól, hogy az Azure Machine-Tanulás vagy a jegyzetfüzetek interaktív betanításával dolgozik. A kísérletkövetés lehetővé teszi a következőt:

Az összes gépi tanulási kísérletet egyetlen helyen rendszerezheti. Ezután kereshet és szűrhet kísérleteket, és lehatolást végezhet a korábban futtatott kísérletek részleteinek megtekintéséhez.
Hasonlítsa össze a kísérleteket, elemezze az eredményeket és hibakeresési modell betanítását kevés extra munkával.
Kísérletek reprodukálása vagy újrafuttatása az eredmények ellenőrzéséhez.
Az együttműködés javítása, mivel láthatja, hogy más csapattársak mit csinálnak, megoszthatják a kísérlet eredményeit, és programozott módon hozzáférhetnek a kísérleti adatokhoz.

Miért érdemes MLflow-t használni a kísérletek nyomon követéséhez?

Az Azure Machine Tanulás-munkaterületek MLflow-kompatibilisek, ami azt jelenti, hogy az MLflow használatával nyomon követheti a futtatásokat, metrikákat, paramétereket és összetevőket az Azure Machine Tanulás-munkaterületeken. Az MLflow nyomkövetéshez való használatának egyik fő előnye, hogy nem kell módosítania a betanítási rutinokat az Azure Machine Tanulás használatához, és nem kell felhőspecifikus szintaxist beszúrnia.

A támogatott MLflow-ról és az Azure Machine Tanulás funkcióiról további információt az MLflow és az Azure Machine Tanulás című témakörben talál.

Korlátozások

Előfordulhat, hogy az MLflow API-ban elérhető egyes metódusok nem érhetők el az Azure Machine-Tanulás való csatlakozáskor. A támogatott és nem támogatott műveletekről további információt a futtatások és kísérletek lekérdezésének támogatási mátrixában talál.

Előfeltételek

Azure-előfizetés. Ha még nincs Azure-előfizetése, kezdés előtt hozzon létre egy ingyenes fiókot. Próbálja ki az Azure Machine Tanulás ingyenes vagy fizetős verzióját.

Telepítse az MLflow SDK-csomagot mlflow és az Azure Machine Tanulás beépülő modult az MLflow-hozazureml-mlflow.
```
pip install mlflow azureml-mlflow
```
Tipp.

Használhatja a mlflow-skinny csomagot, amely egy egyszerű MLflow-csomag SQL Storage, kiszolgáló, felhasználói felület vagy adatelemzési függőségek nélkül. mlflow-skinny Azoknak a felhasználóknak ajánlott, akiknek elsősorban az MLflow nyomkövetési és naplózási képességeire van szükségük anélkül, hogy importálni kellene a teljes szolgáltatáscsomagot, beleértve az üzembe helyezéseket is.
Egy Azure Machine Learning-munkaterület. Létrehozhat egyet a Gépi tanulási erőforrások létrehozása oktatóanyagot követve.
- Megtekintheti, hogy milyen hozzáférési engedélyekre van szüksége az MLflow-műveletek munkaterületen való végrehajtásához.
Ha távoli nyomkövetést végez (vagyis az Azure Machine Tanulás kívül futó nyomkövetési kísérleteket), az MLflow konfigurálása az Azure Machine Tanulás-munkaterület nyomon követésére mutató URI-jára mutat. További információ az MLflow munkaterülethez való csatlakoztatásáról: MLflow konfigurálása az Azure Machine Tanulás.

A kísérlet konfigurálása

Az MLflow kísérletekben és futtatásokban rendszerezi az információkat (a futtatásokat feladatnak nevezzük az Azure Machine Tanulás). Alapértelmezés szerint a rendszer naplózza a futtatásokat egy Alapértelmezett nevű kísérletbe, amely automatikusan létrejön Önnek. Konfigurálhatja azt a kísérletet, amelyben a nyomon követés történik.

Interaktív munka
Feladatok használata

Interaktív betanításhoz, például Jupyter-jegyzetfüzetekben, használja az MLflow parancsot mlflow.set_experiment(). A következő kódrészlet például konfigurál egy kísérletet:

experiment_name = 'hello-world-example'
mlflow.set_experiment(experiment_name)

Feladatok elküldéséhez az Azure Machine Tanulás CLI vagy SDK használatakor állítsa be a kísérlet nevét a experiment_name feladat tulajdonságával. Nem kell konfigurálnia azt a betanítási szkriptben.

$schema: https://azuremlschemas.azureedge.net/latest/commandJob.schema.json
command: echo "hello world"
environment:
  image: library/python:latest
tags:
  hello: world
display_name: hello-world-example
experiment_name: hello-world-example
description: |

A futtatás konfigurálása

Az Azure Machine Tanulás nyomon követi az MLflow által futtatásnak hívott betanítási feladatokat. Futtatásokkal rögzítheti a feladat által végrehajtott összes feldolgozást.

Interaktív munka
Feladatok használata

Amikor interaktívan dolgozik, az MLflow azonnal elkezdi nyomon követni a betanítási rutint, amint megpróbál naplózni az aktív futtatást igénylő információkat. Az MLflow-követés például akkor indul el, amikor naplóz egy metrikát, egy paramétert vagy elindít egy betanítási ciklust, és az Mlflow automatikusan elérhető funkciói engedélyezve lesznek. Azonban általában hasznos a futtatás explicit elindítása, különösen akkor, ha a kísérlet teljes idejét szeretné rögzíteni az Időtartam mezőben. A futtatás explicit elindításához használja a következőt mlflow.start_run(): .

Akár manuálisan indítja el a futtatást, akár nem, végül le kell állítania a futtatást, hogy az MLflow tudja, hogy a kísérlet futtatása befejeződött, és befejezettként megjelölheti a futtatás állapotát. A futtatás leállításához használja a következőt mlflow.end_run(): .

Javasoljuk, hogy manuálisan indítsa el a futtatásokat, hogy ne felejtse el befejezni őket, amikor jegyzetfüzetekben dolgozik.

A futtatás manuális indítása és befejezése, ha végzett a jegyzetfüzetben végzett munkával:
```
mlflow.start_run()

# Your code

mlflow.end_run()
```
Általában hasznos, ha a környezetkezelői paradigmát használja a futtatás befejezéséhez:
```
with mlflow.start_run() as run:
    # Your code
```
Új futtatás mlflow.start_run()indításakor hasznos lehet megadni a run_name paramétert, amely később az Azure Machine Tanulás felhasználói felületén a futtatás nevére fordítja le, és segít a futtatás gyorsabb azonosításában:
```
with mlflow.start_run(run_name="hello-world-example") as run:
    # Your code
```

Az Azure Machine Tanulás-feladatok lehetővé teszik, hogy hosszú ideig futó betanítási vagy következtetési rutinokat küldjön el izolált és reprodukálható végrehajtásként.

Betanítási rutin létrehozása

A feladatok használatakor általában az összes betanítási logikát fájlként helyezi el egy mappában, például src. Az egyik ilyen fájl egy Python-fájl a betanítási kód belépési pontjával. Az alábbi példa egy hello_world.py példát mutat be:

# imports
import os
import mlflow

from random import random

# define functions
def main():
    mlflow.log_param("hello_param", "world")
    mlflow.log_metric("hello_metric", random())
    os.system(f"echo 'hello world' > helloworld.txt")
    mlflow.log_artifact("helloworld.txt")


# run functions
if __name__ == "__main__":
    # run main function
    main()

Az előző példakód nem használható mlflow.start_run() , de ha használja, az MLflow újra felhasználja az aktuális aktív futtatásokat. Ezért nem kell eltávolítania a kód Azure Machine-Tanulás való migrálásakor használt mlflow.start_run() sort.

Nyomon követés hozzáadása a rutinhoz

Az MLflow SDK használatával nyomon követheti a metrikákat, paramétereket, összetevőket vagy modelleket. A naplózással kapcsolatos példákért tekintse meg a naplómetrikákat, paramétereket és fájlokat az MLflow használatával.

Győződjön meg arról, hogy a feladat környezetében telepítve van az MLflow

Az Összes Azure Machine Tanulás-környezethez már telepítve van az MLflow, ezért válogatott környezet használata esetén nincs szükség műveletre. Ha azonban egyéni környezetet szeretne használni:

Hozzon létre egy conda.yaml fájlt a szükséges függőségekkel:

channels:
- conda-forge
dependencies:
- python=3.8.5
- pip
- pip:
  - mlflow
  - azureml-mlflow
  - fastparquet
  - cloudpickle==1.6.0
  - colorama==0.4.4
  - dask==2023.2.0

Hivatkozzon a használt feladat környezetére.

A feladat nevének konfigurálása

A futtatás nevének konfigurálásához használja az Azure Machine Tanulás feladatparamétertdisplay_name.

display_name A tulajdonság használatával konfigurálhatja a feladatot.

Azure CLI
Python SDK

A feladat elküldéséhez hozzon létre egy YAML-fájlt a feladatdefinícióval egy job.yml fájlban. Ezt a fájlt a src könyvtáron kívül kell létrehozni.

$schema: https://azuremlschemas.azureedge.net/latest/commandJob.schema.json
command: echo "hello world"
environment:
  image: library/python:latest
tags:
  hello: world
display_name: hello-world-example
experiment_name: hello-world-example
description: |

from azure.ai.ml import command, Environment

command_job = command(
    code="src",
    command="echo "hello world",
    environment=Environment(image="library/python:latest"),
    compute="cpu-cluster",
    display_name="hello-world-example"
)

Győződjön meg arról, hogy nem a betanítási rutinon belül használja mlflow.start_run(run_name="") .

Feladat küldése

Először csatlakozzon az Azure Machine Tanulás munkaterülethez, ahol dolgozni fog.
- Azure CLI
- Python SDK
```
az account set --subscription <subscription>
az configure --defaults workspace=<workspace> group=<resource-group> location=<location>
```
A munkaterület az Azure Machine Learning legfelső szintű erőforrása, amely egy központi helyet biztosít az Azure Machine Learning használata során létrehozott összetevőkkel való munkához. Ebben a szakaszban ahhoz a munkaterülethez csatlakozik, ahol üzembe helyezési feladatokat fog végrehajtani.
1. Importálja a szükséges kódtárakat:
```
from azure.ai.ml import MLClient
from azure.identity import DefaultAzureCredential
```
2. Konfigurálja a munkaterület részleteit, és szerezze be a munkaterülethez a leírót:
```
subscription_id = "<subscription>"
resource_group = "<resource-group>"
workspace = "<workspace>"

ml_client = MLClient(DefaultAzureCredential(), subscription_id, resource_group, workspace)
```
Feladat küldése
- Azure CLI
- Python SDK
A feladat elküldéséhez használja az Azure Machine Tanulás parancssori felületét. Az MLflow-t használó és az Azure Machine-en futó feladatok Tanulás automatikusan naplóznak minden nyomkövetési információt a munkaterületen. Nyissa meg a terminált, és használja a következő kódot a feladat elküldéséhez.
```
az ml job create -f job.yml --web
```
A Python SDK használatával küldje el a feladatát. Az MLflow-t használó és az Azure Machine-en futó feladatok Tanulás automatikusan naplóznak minden nyomkövetési információt a munkaterületen.
```
returned_job = ml_client.jobs.create_or_update(command_job)
returned_job.studio_url
```
A feladatok előrehaladásának figyelése az Azure Machine Tanulás Studióban.

Az MLflow automatikus kitöltésének engedélyezése

A metrikákat, paramétereket és fájlokat manuálisan naplózhatja az MLflow használatával. Az MLflow automatikus naplózási funkciójára is támaszkodhat. Az MLflow által támogatott összes gépi tanulási keretrendszer dönti el, hogy mi legyen automatikusan nyomon követve.

Az automatikus naplózás engedélyezéséhez szúrja be a következő kódot a betanítási kód elé:

mlflow.autolog()

Metrikák és összetevők megtekintése a munkaterületen

Az MLflow naplózásából származó metrikákat és összetevőket a rendszer nyomon követi a munkaterületen. Bármikor megtekintheti és elérheti őket a stúdióban, vagy programozott módon is elérheti őket az MLflow SDK-val.

Metrikák és összetevők megtekintése a stúdióban:

Nyissa meg az Azure Machine Tanulás Studiót.
Lépjen a munkaterületre.
Keresse meg a kísérletet név szerint a munkaterületen.
Válassza ki a naplózott metrikákat a diagramok jobb oldalon való megjelenítéséhez. A diagramokat simítással, színmódosítással vagy több metrika egyetlen gráfon való ábrázolásával testre szabhatja. Igény szerint átméretezheti és átrendezheti az elrendezést.
Miután létrehozta a kívánt nézetet, mentse későbbi használatra, és ossza meg a csapattagokkal egy közvetlen hivatkozás használatával.

A metrikák, paraméterek és összetevők az MLflow SDK-n keresztül programozott módon való eléréséhez vagy lekérdezéséhez használja a mlflow.get_run()-t.

import mlflow

run = mlflow.get_run("<RUN_ID>")

metrics = run.data.metrics
params = run.data.params
tags = run.data.tags

print(metrics, params, tags)

Tipp.

Metrikák esetén az előző példakód csak egy adott metrika utolsó értékét adja vissza. Ha egy adott metrika összes értékét le szeretné kérni, használja a metódust mlflow.get_metric_history . A metrikák értékeinek lekéréséről további információt a paramok és metrikák lekérése futtatásból című témakörben talál.

A naplózott összetevők, például fájlok és modellek letöltéséhez használja a mlflow.artifacts.download_artifacts()-t.

mlflow.artifacts.download_artifacts(run_id="<RUN_ID>", artifact_path="helloworld.txt")

Az Azure Machine Tanulás MLflow használatával végzett kísérletek és futtatások adatainak lekéréséről és összehasonlításáról további információt a Lekérdezés > kísérletek és futtatások összehasonlítása az MLflow használatával című témakörben talál.

Share via

Ml-kísérletek és modellek nyomon követése az MLflow használatával

A kísérletek nyomon követésének előnyei

Miért érdemes MLflow-t használni a kísérletek nyomon követéséhez?

Korlátozások

Előfeltételek

A kísérlet konfigurálása

A futtatás konfigurálása

Betanítási rutin létrehozása

Nyomon követés hozzáadása a rutinhoz

Győződjön meg arról, hogy a feladat környezetében telepítve van az MLflow

A feladat nevének konfigurálása

Feladat küldése

Az MLflow automatikus kitöltésének engedélyezése

Metrikák és összetevők megtekintése a munkaterületen

További források

Share via

Ml-kísérletek és modellek nyomon követése az MLflow használatával

A kísérletek nyomon követésének előnyei

Miért érdemes MLflow-t használni a kísérletek nyomon követéséhez?

Korlátozások

Előfeltételek

A kísérlet konfigurálása

A futtatás konfigurálása

Az MLflow automatikus kitöltésének engedélyezése

Metrikák és összetevők megtekintése a munkaterületen

Kapcsolódó tartalom

További források