Megosztás:


MLflow-kísérlet erőforrás hozzáadása Egy Databricks-alkalmazáshoz

Adjon hozzá MLflow-kísérleteket Databricks Apps-erőforrásokként, hogy lehetővé tegye a gépi tanulási kísérletek nyomon követését az alkalmazásokban. Az MLflow-kísérletek strukturált módszert biztosítanak a betanítási futtatások rendszerezésére és naplózására, a paraméterek, metrikák és összetevők nyomon követésére a modellfejlesztési életciklus során.

Amikor erőforrásként MLflow-kísérletet ad hozzá, az alkalmazás a következőkre képes:

  • A naplóbetanítás paraméterekkel és metrikákkal fut
  • Kísérletadatok lekérése és a modell teljesítményének összehasonlítása
  • Kísérlet metaadatainak elérése és futtatási előzmények
  • Az ML életciklusának programozott kezelése

MLflow-kísérlet erőforrás hozzáadása

Mielőtt erőforrásként hozzáad egy MLflow-kísérletet, tekintse át az alkalmazáserőforrás előfeltételeit.

  1. Alkalmazás létrehozásakor vagy szerkesztésekor lépjen a Konfigurálás lépésre.
  2. Az Alkalmazáserőforrások szakaszban kattintson az + Erőforrás hozzáadása elemre.
  3. Erőforrástípusként válassza az MLflow-kísérletet .
  4. Válasszon egy MLflow-kísérletet a munkaterületen elérhető kísérletek listájából.
  5. Válassza ki az alkalmazás megfelelő jogosultsági szintjét:
    • Olvasható: Engedélyt ad az alkalmazásnak a kísérlet metaadatainak, futtatásának, paramétereinek és metrikáinak megtekintésére. A kísérlet eredményeit megjelenítő alkalmazásokhoz használható.
    • Szerkesztheti a következőt: Engedélyt ad az alkalmazásnak a kísérlet beállításainak és metaadatainak módosítására.
    • Kezelheti a következőt: Teljes rendszergazdai hozzáférést biztosít az alkalmazásnak a kísérlethez.
  6. (Nem kötelező) Adjon meg egy egyéni erőforráskulcsot, így hivatkozhat a kísérletre az alkalmazáskonfigurációban. Az alapértelmezett kulcs a következő experiment.

MLflow-kísérleterőforrás hozzáadásakor:

  • Az Azure Databricks megadja az alkalmazás szolgáltatásnevének a kiválasztott kísérlethez megadott engedélyeket.
  • Az alkalmazás naplózhatja a betanítási futtatásokat, és hozzáférhet a kísérletadatokhoz az MLflow Tracking API-val.
  • A hozzáférés hatóköre csak a kijelölt kísérletre terjed ki. Az alkalmazás csak akkor férhet hozzá más kísérletekhez, ha külön erőforrásként adja hozzá őket.

Környezeti változók

Amikor MLflow-kísérleterőforrással üzembe helyez egy alkalmazást, az Azure Databricks környezeti változókon keresztül teszi elérhetővé a kísérlet azonosítóját, amelyekre a valueFrom konfigurációban lévő app.yaml mező használatával hivatkozhat.

Példakonfiguráció:

env:
  - name: MLFLOW_EXPERIMENT_ID
    valueFrom: experiment # Use your custom resource key if different

A kísérletazonosító használata az alkalmazásban:

import os
import mlflow

# Access the experiment using the injected environment variable
experiment_id = os.getenv("MLFLOW_EXPERIMENT_ID")

# Set the experiment for tracking
mlflow.set_experiment(experiment_id=experiment_id)

# Log parameters and metrics
with mlflow.start_run():
    mlflow.log_param("learning_rate", 0.01)
    mlflow.log_metric("accuracy", 0.95)
    mlflow.log_artifact("model.pkl")

További információkért olvassa el az Erőforrásokból származó környezeti változók elérése című részt.

MLflow-kísérlet erőforrás eltávolítása

Ha eltávolít egy MLflow-kísérleti erőforrást egy alkalmazásból, az alkalmazás szolgáltatásfőneve elveszíti a hozzáférést a kísérlethez. Maga a kísérlet változatlan marad, és továbbra is elérhető lesz más, megfelelő engedélyekkel rendelkező felhasználók és alkalmazások számára.

Ajánlott eljárások

Kövesse az alábbi ajánlott eljárásokat az MLflow-kísérlet erőforrásainak használatakor:

  • A kísérleteket projekt vagy modelltípus szerint logikusan rendszerezheti a felderíthetőség javítása érdekében.
  • Konzisztens elnevezési konvenciók használata futtatásokhoz és paraméterekhez a szervezeten belül.
  • Fontolja meg a kísérletmegőrzési szabályzatokat és a tárolókezelést a hosszú ideig futó projektekhez.