Gérer le cycle de vie des modèles dans Unity Catalog

Importante

Cette page documente les modèles dans Unity Catalog, que Databricks recommande pour la gouvernance et le déploiement des modèles. Si votre espace de travail n’est pas activé pour Unity Catalog, la fonctionnalité présentée sur cette page n’est pas disponible. En lieu et place, consultez l’article Gérer le cycle de vie du modèle au moyen du Registre des modèles d’espace de travail (hérité). Pour obtenir des conseils sur la mise à niveau du Registre de modèles d’espaces de travail vers Unity Catalog, consultez Migrer les flux de travail et les modèles vers Unity Catalog.
Les modèles du catalogue Unity ne sont pas disponibles dans les régions Azure Government.

Cet article explique comment utiliser Models dans Unity Catalog dans le cadre de votre flux de travail de l’apprentissage automatique pour gérer le cycle de vie complet des modèles ML. Databricks fournit une version hébergée du registre de modèles MLflow dans Unity Catalog. Dans Unity Catalog, Models étend les avantages de Unity Catalog aux modèles ML, notamment le contrôle d’accès centralisé, l’audit, la traçabilité et la découverte de modèles dans les espaces de travail. Dans Unity Catalog, Models est compatible avec le client Python MLflow open source.

Pour obtenir une vue d’ensemble des concepts du Registre de modèles, consultez MLflow sur Databricks.

MLflow 3 apporte des améliorations significatives au registre de modèles MLflow dans le catalogue Unity, ce qui permet à vos modèles de capturer directement des données telles que des paramètres et des métriques et de les rendre disponibles dans tous les espaces de travail et expériences. L’URI de Registre par défaut dans MLflow 3 est databricks-uc, ce qui signifie que le registre de modèles MLflow dans le catalogue Unity sera utilisé. Pour plus d’informations, consultez Prise en main de MLflow 3 pour connaître les améliorations apportées aux modèles et au Registre de modèles avec MLflow 3.

Spécifications

Unity Catalog doit être activé dans votre espace de travail. Consultez Prise en main d’Unity Catalog pour créer un metastore Unity Catalog, l’activer dans un espace de travail et créer un catalogue. Si Unity Catalog n’est pas activé, utilisez le registre de modèles d’espace de travail.
Vous devez utiliser une ressource de calcul qui a accès à Unity Catalog. Pour les charges de travail ML, cela signifie que le mode d’accès du calcul doit être dédié (anciennement utilisateur unique). Pour plus d’informations, consultez les modes d’accès. Avec Databricks Runtime 15.4 LTS ML et versions ultérieures, vous pouvez également utiliser mode d’accès de groupe dédié.
Pour créer des modèles inscrits, vous avez besoin des privilèges suivants :
- Privilèges USE SCHEMA et USE CATALOG sur le schéma et son catalogue englobant.
- Privilège CREATE MODEL ou CREATE FUNCTION sur le schéma. Pour accorder des privilèges, utilisez l’interface utilisateur de l’Explorateur de catalogues ou la commande SQL GRANT:
```
GRANT CREATE MODEL ON SCHEMA <schema-name> TO <principal>
```
Si vous rencontrez des problèmes d’autorisation lors de la tentative d’inscription d’un modèle, essayez de définir la variable d’environnement MLFLOW_USE_DATABRICKS_SDK_MODEL_ARTIFACTS_REPO_FOR_UC sur True. Incluez une cellule dans votre bloc-notes avec le code suivant :
```
import os
os.environ['MLFLOW_USE_DATABRICKS_SDK_MODEL_ARTIFACTS_REPO_FOR_UC'] = 'True'
```
Cette approche ne peut pas être utilisée pour les modèles partagés avec le partage Delta qui utilisent le stockage par défaut.

Remarque

Votre espace de travail doit être attaché à un metastore Unity Catalog qui prend en charge l’héritage des privilèges. Cela est vrai pour tous les metastores créés après le 25 août 2022. Si vous exécutez sur un metastore plus ancien, suivez la documentation pour effectuer la mise à niveau.

Installer et configurer le client MLflow pour Unity Catalog

Cette section contient des instructions pour l’installation et la configuration du client MLflow pour Unity Catalog.

Installer le client Python MLflow

La prise en charge des modèles dans le catalogue Unity est incluse dans Databricks Runtime 13.2 ML et versions ultérieures (Databricks Runtime 15.0 ML et versions ultérieures dans Azure Chine).

Vous pouvez également utiliser des modèles dans Unity Catalog sur Databricks Runtime 11.3 LTS et versions ultérieures en installant la dernière version du client Python MLflow dans votre notebook, à l’aide du code suivant.

%pip install --upgrade "mlflow-skinny[databricks]"
dbutils.library.restartPython()

Configurer le client MLflow pour accéder aux modèles dans Unity Catalog

Si le catalogue par défaut de votre espace de travail se trouve dans le catalogue Unity (plutôt que hive_metastore) et que vous exécutez un cluster à l’aide de Databricks Runtime 13.3 LTS ou version ultérieure (Databricks Runtime 15.0 ou version ultérieure dans les régions Azure Chine) ou que vous utilisez MLflow 3, les modèles sont automatiquement créés et chargés à partir du catalogue par défaut.

Pour les autres espaces de travail, le client Python MLflow crée des modèles dans le registre de modèles d’espace de travail Databricks. Pour effectuer une mise à niveau vers des modèles dans Unity Catalog, utilisez le code suivant dans vos notebooks pour configurer le client MLflow :

import mlflow
mlflow.set_registry_uri("databricks-uc")

Pour un petit nombre d’espaces de travail où le catalogue par défaut a été configuré sur un catalogue dans Unity Catalog avant janvier 2024 et que le registre de modèles d’espace de travail a été utilisé avant janvier 2024, vous devez définir manuellement le catalogue par défaut sur Unity Catalog à l’aide de la commande ci-dessus.

Entraîner et enregistrer des modèles compatibles avec Unity Catalog

Autorisations requises : pour créer un modèle inscrit, vous avez besoin des privilèges CREATE MODEL et USE SCHEMA sur le schéma englobant et USE CATALOG sur le catalogue englobant. Pour créer de nouvelles versions de modèle sous un modèle inscrit, vous devez être le propriétaire du modèle inscrit et disposer des privilèges USE SCHEMA et USE CATALOG sur le schéma et le catalogue contenant le modèle.

Si vous rencontrez des problèmes d’autorisation lors de la tentative d’inscription d’un modèle, essayez de définir la variable d’environnement MLFLOW_USE_DATABRICKS_SDK_MODEL_ARTIFACTS_REPO_FOR_UC sur True. Cette approche ne peut pas être utilisée pour les modèles partagés avec le partage Delta qui utilisent le stockage par défaut. Consultez Spécifications.

Les nouvelles versions du modèle ML de l’UC doivent avoir une signature de modèle. Si vous n'enregistrez pas déjà les modèles MLflow avec des signatures dans vos tâches de formation de modèles, vous pouvez :

Utilisez la journalisation automatique Databricks, qui enregistre automatiquement les modèles avec des signatures pour de nombreuses infrastructures ML populaires. Consultez les infrastructures prises en charge dans la documentation MLflow.
Avec MLflow 2.5.0 et versions ultérieures, vous pouvez spécifier un exemple d’entrée dans votre appel mlflow.<flavor>.log_model, et la signature du modèle est inférée automatiquement. Pour plus d’informations, consultez la documentation MLflow.

Ensuite, transmettez le nom à trois niveaux du modèle aux API MLflow, sous la forme <catalog>.<schema>.<model>.

Les versions de modèle qui n’ont pas de signatures ont certaines limitations. Pour obtenir la liste de ces limitations et ajouter ou mettre à jour une signature pour une version de modèle existante, consultez Ajouter ou mettre à jour une signature pour une version de modèle existante.

Les exemples de cette section créent des modèles, et y accèdent, dans le schéma ml_team sous le catalogue prod.

Les exemples d’apprentissage de modèles de cette section créent une nouvelle version de modèle et l’enregistrent dans le catalogue prod. L’utilisation du catalogue prod ne signifie pas nécessairement que la version du modèle sert le trafic de production. Le catalogue, le schéma et le modèle inscrit qui entourent la version du modèle reflètent son environnement (prod) et les règles de gouvernance associées (par exemple, les privilèges peuvent être configurés pour que seuls les administrateurs puissent supprimer du catalogue prod), mais pas son état de déploiement. Pour gérer les états de déploiement, utilisez des alias de modèle.

Inscrire un modèle dans Unity Catalog à l’aide de la journalisation automatique

Pour inscrire un modèle, utilisez la méthode register_model() de l’API cliente MLflow. Consultez mlflow.register_model.

MLflow 3

from sklearn import datasets
from sklearn.ensemble import RandomForestClassifier

# Train a sklearn model on the iris dataset
X, y = datasets.load_iris(return_X_y=True, as_frame=True)
clf = RandomForestClassifier(max_depth=7)
clf.fit(X, y)

# Note that the UC model name follows the pattern
# <catalog_name>.<schema_name>.<model_name>, corresponding to
# the catalog, schema, and registered model name
# in Unity Catalog under which to create the version
# The registered model will be created if it doesn't already exist,
# and the model version will contain all parameters and metrics
# logged with the corresponding MLflow Logged Model.
logged_model = mlflow.last_logged_model()
mlflow.register_model(logged_model.model_uri, "prod.ml_team.iris_model")

MLflow 2.x

from sklearn import datasets
from sklearn.ensemble import RandomForestClassifier

# Train a sklearn model on the iris dataset
X, y = datasets.load_iris(return_X_y=True, as_frame=True)
clf = RandomForestClassifier(max_depth=7)
clf.fit(X, y)

# Note that the UC model name follows the pattern
# <catalog_name>.<schema_name>.<model_name>, corresponding to
# the catalog, schema, and registered model name
# in Unity Catalog under which to create the version
# The registered model will be created if it doesn't already exist
autolog_run = mlflow.last_active_run()
model_uri = "runs:/{}/model".format(autolog_run.info.run_id)
mlflow.register_model(model_uri, "prod.ml_team.iris_model")

Inscrire un modèle à l’aide de l’API

MLflow 3

mlflow.register_model(
  "models:/<model_id>", "prod.ml_team.iris_model"
)

MLflow 2.x

mlflow.register_model(
  "runs:/<run_id>/model", "prod.ml_team.iris_model"
)

Inscrire un modèle dans Unity Catalog avec une signature inférée automatiquement

La prise en charge des signatures inférées automatiquement est disponible dans MLflow 2.5.0 et versions ultérieures, et prise en charge dans Databricks Runtime 11.3 LTS ML et versions ultérieures. Pour utiliser automatiquement les signatures inférées, utilisez le code suivant pour installer le dernier client Python MLflow dans votre notebook :

%pip install --upgrade "mlflow-skinny[databricks]"
dbutils.library.restartPython()

Le code suivant montre un exemple de signature inférée automatiquement. Notez que l’utilisation registered_model_name dans l’appel log_model() inscrit le modèle dans le catalogue Unity. Vous devez donc fournir le nom complet de trois niveaux du modèle au format <catalog>.<schema>.<model>.

MLflow 3

from sklearn import datasets
from sklearn.ensemble import RandomForestClassifier

with mlflow.start_run():
    # Train a sklearn model on the iris dataset
    X, y = datasets.load_iris(return_X_y=True, as_frame=True)
    clf = RandomForestClassifier(max_depth=7)
    clf.fit(X, y)
    # Take the first row of the training dataset as the model input example.
    input_example = X.iloc[[0]]
    # Log the model and register it as a new version in UC.
    mlflow.sklearn.log_model(
        sk_model=clf,
        name="model",
        # The signature is automatically inferred from the input example and its predicted output.
        input_example=input_example,
        # Use three-level name to register model in Unity Catalog.
        registered_model_name="prod.ml_team.iris_model",
    )

MLflow 2.x

from sklearn import datasets
from sklearn.ensemble import RandomForestClassifier

with mlflow.start_run():
    # Train a sklearn model on the iris dataset
    X, y = datasets.load_iris(return_X_y=True, as_frame=True)
    clf = RandomForestClassifier(max_depth=7)
    clf.fit(X, y)
    # Take the first row of the training dataset as the model input example.
    input_example = X.iloc[[0]]
    # Log the model and register it as a new version in UC.
    mlflow.sklearn.log_model(
        sk_model=clf,
        artifact_path="model",
        # The signature is automatically inferred from the input example and its predicted output.
        input_example=input_example,
        # Use three-level name to register model in Unity Catalog.
        registered_model_name="prod.ml_team.iris_model",
    )

Inscrire un modèle à l’aide de l’interface utilisateur

Effectuez les étapes suivantes :

Dans la page d’exécution de l’expérience, cliquez sur Inscrire le modèle dans le coin supérieur droit de l’interface utilisateur.
Dans la boîte de dialogue, sélectionnez Unity Catalog, puis sélectionnez un modèle de destination dans la liste déroulante.
Cliquez sur S'inscrire.

L’inscription d’un modèle peut prendre du temps. Pour surveiller la progression, accédez au modèle de destination dans Unity Catalog et actualisez régulièrement la page.

Ajouter ou mettre à jour une signature pour une version de modèle existante

Les versions de modèle qui n’ont pas de signatures ont les limitations suivantes :

Si une signature est fournie, les entrées de modèle sont vérifiées à l’inférence et une erreur est signalée si les entrées ne correspondent pas à la signature. Sans signature, il n’existe aucune application automatique des entrées, et les modèles doivent être en mesure de gérer des entrées inattendues.
L’utilisation d’une version de modèle avec des fonctions IA nécessite la fourniture d’un schéma dans l’appel de fonction.
L’utilisation d’une version de modèle avec Model Serving ne génère pas automatiquement d’exemples d’entrée.

Pour ajouter ou mettre à jour une signature de version de modèle, consultez la documentation MLflow.

Utiliser des alias de modèle

Les alias de modèle vous permettent d’affecter une référence nommée mutable à une version particulière d’un modèle inscrit. Vous pouvez utiliser des alias pour indiquer l’état de déploiement d’une version de modèle. Par exemple, vous pouvez allouer un alias « Champion » à la version du modèle actuellement en production et cibler cet alias dans les charges de travail qui utilisent le modèle de production. Vous pouvez ensuite mettre à jour le modèle de production en réaffectant l’alias « Champion » à une autre version du modèle.

Définir et supprimer des alias sur les modèles

Autorisations requises : propriétaire du modèle inscrit, ainsi que les privilèges USE SCHEMA et USE CATALOG sur le schéma et le catalogue contenant le modèle.

Vous pouvez définir, mettre à jour et supprimer des alias pour les modèles dans le catalogue Unity à l’aide de l’Explorateur de catalogues. Consultez Afficher et gérer des modèles dans l’interface utilisateur.

Pour définir, mettre à jour et supprimer des alias à l’aide de l’API cliente MLflow, consultez les exemples ci-dessous :

from mlflow import MlflowClient
client = MlflowClient()

# create "Champion" alias for version 1 of model "prod.ml_team.iris_model"
client.set_registered_model_alias("prod.ml_team.iris_model", "Champion", 1)

# reassign the "Champion" alias to version 2
client.set_registered_model_alias("prod.ml_team.iris_model", "Champion", 2)

# get a model version by alias
client.get_model_version_by_alias("prod.ml_team.iris_model", "Champion")

# delete the alias
client.delete_registered_model_alias("prod.ml_team.iris_model", "Champion")

Pour plus d’informations sur les API clientes d’alias, consultez la documentation de l’API MLflow.

Charger une version du modèle par alias pour les tâches d’inférence

Autorisations requises : privilège EXECUTE sur le modèle inscrit, ainsi que les privilèges USE SCHEMAet USE CATALOG sur le schéma et le catalogue contenant le modèle.

Les charges de travail d’inférence par lots peuvent référencer une version de modèle par alias. L’extrait de code ci-dessous charge et applique la version du modèle « Champion » pour l’inférence par lots. Si la version « Champion » est mise à jour pour référencer une nouvelle version du modèle, la charge de travail d’inférence par lots la sélectionne automatiquement lors de sa prochaine exécution. Cela vous permet de dissocier les déploiements de modèles de vos charges de travail d’inférence par lots.

import mlflow.pyfunc
model_version_uri = "models:/prod.ml_team.iris_model@Champion"
champion_version = mlflow.pyfunc.load_model(model_version_uri)
champion_version.predict(test_x)

Les endpoints de service de modèle peuvent également référencer une version de modèle par alias. Vous pouvez écrire des flux de travail de déploiement pour obtenir une version de modèle par alias et mettre à jour un point de terminaison de service de modèle pour traiter cette version, à l’aide de l’API REST du modèle de service. Par exemple :

import mlflow
import requests
client = mlflow.tracking.MlflowClient()
champion_version = client.get_model_version_by_alias("prod.ml_team.iris_model", "Champion")
# Invoke the model serving REST API to update endpoint to serve the current "Champion" version
model_name = champion_version.name
model_version = champion_version.version
requests.request(...)

Charger une version du modèle par numéro de version pour les charges de travail d’inférence

Vous pouvez également charger des versions de modèle par numéro de version :

import mlflow.pyfunc
# Load version 1 of the model "prod.ml_team.iris_model"
model_version_uri = "models:/prod.ml_team.iris_model/1"
first_version = mlflow.pyfunc.load_model(model_version_uri)
first_version.predict(test_x)

Tant que vous disposez des privilèges appropriés, vous pouvez accéder aux modèles dans Unity Catalog à partir de n’importe quel espace de travail attaché au metastore contenant le modèle. Par exemple, vous pouvez accéder aux modèles à partir du catalogue prod dans un espace de travail de développement, pour faciliter la comparaison des modèles récemment développés avec la base de référence de production.

Pour collaborer avec d’autres utilisateurs (partager des privilèges d’écriture) sur un modèle inscrit que vous avez créé, vous devez accorder la propriété du modèle à un groupe contenant vous-même et les utilisateurs avec qui vous souhaitez collaborer. Les collaborateurs doivent également disposer des privilèges USE CATALOG et USE SCHEMA sur le catalogue et le schéma contenant le modèle. Pour plus d’informations, consultez les informations de référence sur les privilèges du catalogue Unity .

Pour partager des modèles avec des utilisateurs dans d’autres régions ou comptes, utilisez le flux de partage Databricks-à-Databricksde Delta Sharing. Consultez Ajouter des modèles à un partage (pour les fournisseurs) et Accéder au modèle Databricks-à-Databricks (pour les destinataires). En tant que destinataire, après votre création de catalogue à partir d’un partage, vous accédez à des modèles dans ce catalogue partagé de la même façon que tout autre modèle dans Unity Catalog.

Suivre la traçabilité des données d’un modèle dans Unity Catalog

Remarque

La prise en charge de la traçabilité des tables vers les modèles dans Unity Catalog est disponible dans MLflow 2.11.0 et ultérieur.

Quand vous effectuez l’apprentissage d’un modèle sur une table dans Unity Catalog, vous pouvez suivre la traçabilité du modèle vers le ou les jeux de données en amont sur lesquels il a effectué son apprentissage et a été évalué. Pour cela, utilisez mlflow.log_input. Ceci enregistre les informations des tables d’entrée avec l’exécution MLflow qui a généré le modèle. La traçabilité des données est également capturée automatiquement pour les modèles enregistrés en utilisant des API du magasin de fonctionnalités. Consultez Gouvernance et traçabilité des fonctionnalités.

Lorsque vous inscrivez le modèle dans le catalogue Unity, les informations de traçabilité sont automatiquement enregistrées et sont visibles dans l’onglet Traçabilité de la page de version du modèle dans l’Explorateur de catalogues. Consultez Afficher les informations de version du modèle et la traçabilité des modèles.

Le code ci-après présente un exemple.

MLflow 3

import mlflow
import pandas as pd
import pyspark.pandas as ps
from sklearn.datasets import load_iris
from sklearn.ensemble import RandomForestRegressor

# Write a table to Unity Catalog
iris = load_iris()
iris_df = pd.DataFrame(iris.data, columns=iris.feature_names)
iris_df.rename(
  columns = {
    'sepal length (cm)':'sepal_length',
    'sepal width (cm)':'sepal_width',
    'petal length (cm)':'petal_length',
    'petal width (cm)':'petal_width'},
  inplace = True
)
iris_df['species'] = iris.target
ps.from_pandas(iris_df).to_table("prod.ml_team.iris", mode="overwrite")

# Load a Unity Catalog table, train a model, and log the input table
dataset = mlflow.data.load_delta(table_name="prod.ml_team.iris", version="0")
pd_df = dataset.df.toPandas()
X = pd_df.drop("species", axis=1)
y = pd_df["species"]
with mlflow.start_run():
    clf = RandomForestRegressor(n_estimators=100)
    clf.fit(X, y)
    mlflow.log_input(dataset, "training")
    # Take the first row of the training dataset as the model input example.
    input_example = X.iloc[[0]]
    # Log the model and register it as a new version in UC.
    mlflow.sklearn.log_model(
        sk_model=clf,
        name="model",
        # The signature is automatically inferred from the input example and its predicted output.
        input_example=input_example,
        # Use three-level name to register model in Unity Catalog.
        registered_model_name="prod.ml_team.iris_classifier",
    )

MLflow 2.x

import mlflow
import pandas as pd
import pyspark.pandas as ps
from sklearn.datasets import load_iris
from sklearn.ensemble import RandomForestRegressor

# Write a table to Unity Catalog
iris = load_iris()
iris_df = pd.DataFrame(iris.data, columns=iris.feature_names)
iris_df.rename(
  columns = {
    'sepal length (cm)':'sepal_length',
    'sepal width (cm)':'sepal_width',
    'petal length (cm)':'petal_length',
    'petal width (cm)':'petal_width'},
  inplace = True
)
iris_df['species'] = iris.target
ps.from_pandas(iris_df).to_table("prod.ml_team.iris", mode="overwrite")

# Load a Unity Catalog table, train a model, and log the input table
dataset = mlflow.data.load_delta(table_name="prod.ml_team.iris", version="0")
pd_df = dataset.df.toPandas()
X = pd_df.drop("species", axis=1)
y = pd_df["species"]
with mlflow.start_run():
    clf = RandomForestRegressor(n_estimators=100)
    clf.fit(X, y)
    mlflow.log_input(dataset, "training")
    # Take the first row of the training dataset as the model input example.
    input_example = X.iloc[[0]]
    # Log the model and register it as a new version in UC.
    mlflow.sklearn.log_model(
        sk_model=clf,
        artifact_path="model",
        # The signature is automatically inferred from the input example and its predicted output.
        input_example=input_example,
        # Use three-level name to register model in Unity Catalog.
        registered_model_name="prod.ml_team.iris_classifier",
    )

Contrôler l’accès aux modèles

Dans Unity Catalog, les modèles inscrits sont un sous-type de l’objet sécurisable FUNCTION. Pour permettre d’accéder à un modèle inscrit dans Unity Catalog, vous devez utiliser GRANT ON FUNCTION. Vous pouvez également utiliser l’Explorateur de catalogue pour définir la propriété et les autorisations du modèle. Pour plus d’informations, consultez Gérer les privilèges dans le catalogue Unity et le modèle objet Catalogue Unity.

Vous pouvez configurer des autorisations de modèle par programmation à l’aide de l’API REST Grants. Lorsque vous configurez des autorisations de modèle, définissez securable_type sur "FUNCTION" dans les requêtes d’API REST. Par exemple, utilisez PATCH /api/2.1/unity-catalog/permissions/function/{full_name} pour mettre à jour les autorisations de modèle inscrites.

Afficher et gérer des modèles dans l’interface utilisateur

Autorisations requises : pour afficher un modèle inscrit et ses versions de modèle dans l’interface utilisateur, vous avez besoin du privilège EXECUTE sur le modèle inscrit, ainsi que des privilèges USE SCHEMA et USE CATALOG sur le schéma et le catalogue contenant le modèle

Vous pouvez afficher et gérer des modèles inscrits et des versions de modèle dans le catalogue Unity à l’aide de l’Explorateur de catalogues.

Afficher les informations sur le modèle

Pour afficher les modèles dans l’Explorateur de catalogues :

Cliquez sur Catalogue dans la barre latérale.
Sélectionnez une ressource de calcul dans la liste déroulante en haut à droite.
Dans l’arborescence de l’Explorateur de catalogues à gauche, ouvrez un catalogue et sélectionnez un schéma.
Si le schéma contient des modèles, ils apparaissent dans l’arborescence sous Modèles, comme indiqué.
Cliquez sur un modèle pour afficher plus d’informations. La page détails du modèle affiche une liste de versions de modèle avec des informations supplémentaires.

Définir des alias de modèle

Pour définir un alias de modèle à l’aide de l’interface utilisateur :

Sur la page des détails du modèle, pointez sur la ligne de la version du modèle à laquelle vous souhaitez ajouter un alias. Le bouton Ajouter un alias s’affiche.
Cliquez sur Ajouter un alias.
Entrez un alias ou sélectionnez-en un dans le menu déroulant. Vous pouvez ajouter plusieurs alias dans la boîte de dialogue.
Cliquez sur Enregistrer les alias.

Comment ajouter un alias à une version de modèle à partir de la page de détails du modèle.

Pour supprimer un alias :

Placez le curseur sur la ligne de la version du modèle, puis cliquez sur l’icône de crayon en regard de l’alias.
Dans la boîte de dialogue, cliquez sur l’alias X que vous souhaitez supprimer.
Cliquez sur Enregistrer les alias.

Comment supprimer un alias d’une version de modèle sur la page des détails du modèle.

Afficher les informations de version du modèle et la traçabilité des modèles

Pour afficher plus d’informations sur une version de modèle, cliquez sur son nom dans la liste des modèles. La page de version du modèle s’affiche. Cette page inclut un lien vers l’exécution source MLflow qui a créé la version. Dans MLflow 3, vous pouvez également afficher tous les paramètres et métriques enregistrés avec le modèle journalisé MLflow correspondant.

MLflow 3

Page de version du modèle MLflow 3

MLflow 2.x

Page de version du modèle MLflow 2.x

À partir de cette page, vous pouvez afficher la traçabilité du modèle comme suit :

Sélectionnez l’onglet Traçabilité . La barre latérale gauche affiche les composants qui ont été enregistrés avec le modèle.
Cliquez sur Afficher le graphique de traçabilité. Le graphe de filiation s’affiche. Pour plus d’informations sur l’exploration du graphique de traçabilité, consultez Capture et exploration de la traçabilité.
Pour fermer le graphique de traçabilité, cliquez sur dans le coin supérieur droit.

Renommer un modèle

Autorisations requises : propriétaire du modèle inscrit, privilège CREATE MODEL sur le schéma contenant le modèle inscrit ainsi que les privilèges USE SCHEMA et USE CATALOG sur le schéma et le catalogue contenant le modèle.

Pour renommer un modèle inscrit, utilisez la méthode d’API rename_registered_model() cliente MLflow, où <full-model-name> est le nom de niveau 3 complet du modèle et <new-model-name> le nom du modèle sans le catalogue ou le schéma.

client=MlflowClient()
client.rename_registered_model("<full-model-name>", "<new-model-name>")

Par exemple, le code suivant modifie le nom du modèle hello_world en hello.

client=MlflowClient()
client.rename_registered_model("docs.models.hello_world", "hello")

Copier une version de modèle

Vous pouvez copier une version de modèle d’un modèle à un autre dans Unity Catalog.

Copier un modèle de version à l’aide de l’interface utilisateur

Effectuez les étapes suivantes :

Depuis la page de version de modèle, cliquez sur Copier cette version dans le coin supérieur droit de l’interface utilisateur.
Sélectionnez un modèle de destination dans la liste déroulante, puis cliquez sur Copier.

La copie d’un modèle peut prendre du temps. Pour surveiller la progression, accédez au modèle de destination dans Unity Catalog et actualisez régulièrement la page.

Copier une version de modèle à l’aide de l’API

Pour copier une version de modèle, utilisez l’API Python copy_model_version() de MLflow :

client = MlflowClient()
client.copy_model_version(
  "models:/<source-model-name>/<source-model-version>",
  "<destination-model-name>",
)

Supprimer un modèle ou une version de modèle

Autorisations requises : propriétaire du modèle inscrit, ainsi que les privilèges USE SCHEMA et USE CATALOG sur le schéma et le catalogue contenant le modèle.

Vous pouvez supprimer un modèle inscrit ou une version de modèle au sein d’un modèle inscrit à l’aide de l’interface utilisateur ou de l’API.

Avertissement

Vous ne pouvez pas annuler cette action. Quand vous supprimez un modèle, tous les artefacts de modèle stockés par Unity Catalog sont supprimés, de même que toutes les métadonnées associées au modèle inscrit.

Supprimer une version de modèle ou un modèle à l’aide de l’interface utilisateur

Pour supprimer un modèle ou une version de modèle dans Unity Catalog, procédez comme suit.

Dans Catalog Explorer, sur la page du modèle ou celle de la version du modèle, cliquez sur le menu kebab dans le coin supérieur droit.

À partir de la page du modèle :

À partir de la page de version du modèle :
Sélectionnez Supprimer.
Une boîte de dialogue de confirmation s’affiche. Cliquez sur Delete (Supprimer) pour confirmer.

Supprimer une version de modèle ou un modèle à l’aide de l’API

Pour supprimer une version de modèle, utilisez la méthode delete_model_version() de l’API cliente MLflow :

# Delete versions 1,2, and 3 of the model
client = MlflowClient()
versions=[1, 2, 3]
for version in versions:
  client.delete_model_version(name="<model-name>", version=version)

Pour supprimer un modèle, utilisez la méthode delete_registered_model() de l’API cliente MLflow :

client = MlflowClient()
client.delete_registered_model(name="<model-name>")

Utiliser des balises sur les modèles

Les balises sont des paires clé-valeur que vous associez aux modèles inscrits et aux versions de modèle, ce qui vous permet de les étiqueter et de les classer par fonction ou état. Par exemple, vous pouvez appliquer une balise avec la clé "task" et la valeur "question-answering" (affichées dans l’interface utilisateur sous la forme task:question-answering) aux modèles inscrits destinés aux tâches de réponses aux questions. Au niveau de la version du modèle, vous pouvez affecter la balise validation_status:pending aux versions en cours de validation avant le déploiement et la balise validation_status:approved à celles qui sont approuvées pour le déploiement.

Autorisations requises : être propriétaire ou avoir le privilège APPLY TAG sur le modèle inscrit, ainsi que les privilèges USE SCHEMA et USE CATALOG sur le schéma et le catalogue contenant le modèle.

Consultez Appliquer des balises aux objets sécurisables du catalogue Unity pour savoir comment définir et supprimer des balises à l’aide de l’interface utilisateur.

Pour définir et supprimer des balises à l’aide de l’API cliente MLflow, consultez les exemples ci-dessous :

from mlflow import MlflowClient
client = MlflowClient()

# Set registered model tag
client.set_registered_model_tag("prod.ml_team.iris_model", "task", "classification")

# Delete registered model tag
client.delete_registered_model_tag("prod.ml_team.iris_model", "task")

# Set model version tag
client.set_model_version_tag("prod.ml_team.iris_model", "1", "validation_status", "approved")

# Delete model version tag
client.delete_model_version_tag("prod.ml_team.iris_model", "1", "validation_status")

Les balises de modèle inscrit et de version de modèle doivent respecter les contraintes à l’échelle de la plateforme.

Pour plus d’informations sur les API clientes de balise, consultez la documentation de l’API MLflow.

Ajouter ou mettre à jour la description (commentaires) d’un modèle ou d’une version de modèle

Autorisations requises : propriétaire du modèle inscrit, ainsi que les privilèges USE SCHEMA et USE CATALOG sur le schéma et le catalogue contenant le modèle.

Vous pouvez inclure une description textuelle pour tout modèle ou toute version de modèle dans Unity Catalog. Par exemple, vous pouvez fournir une vue d’ensemble du problème ou des informations sur la méthodologie et l’algorithme employés.

Pour les modèles, vous avez également l’option d’utiliser des commentaires générés par l’IA. Consultez Ajouter des commentaires générés par l’IA aux objets Unity Catalog.

Ajouter une description à un modèle avec l’interface utilisateur

Pour ajouter une description à un modèle, vous pouvez utiliser des commentaires générés par l’IA ou entrer vos propres commentaires. Vous pouvez modifier les commentaires générés par l’IA, si nécessaire.

Pour ajouter automatiquement des commentaires générés, cliquez sur le bouton Générer par IA.
Pour ajouter vos propres commentaires, cliquez sur Ajouter. Entrez vos commentaires dans la boîte de dialogue, puis cliquez sur Enregistrer.

Boutons de description du modèle UC

Ajouter une description à un modèle avec l’interface utilisateur

Pour ajouter une description à une version de modèle dans Unity Catalog, procédez comme suit :

Dans la page de la version de modèle, cliquez sur l’icône de crayon sous Description.
Entrez vos commentaires dans la boîte de dialogue, puis cliquez sur Enregistrer.

Ajouter une description à un modèle ou une version de modèle à l’aide de l’API

Pour mettre à jour la description du modèle enregistré, utilisez la méthode update_registered_model() de l’API cliente MLflow :

client = MlflowClient()
client.update_registered_model(
  name="<model-name>",
  description="<description>"
)

Pour mettre à jour la description d’une version de modèle, utilisez la méthode update_model_version() de l’API cliente MLflow :

client = MlflowClient()
client.update_model_version(
  name="<model-name>",
  version=<model-version>,
  description="<description>"
)

Modèles de liste et de recherche

Pour obtenir la liste des modèles inscrits dans le catalogue Unity, utilisez l’API Python search_registered_models() de MLflow :

mlflow.search_registered_models()

Pour rechercher un nom de modèle spécifique et obtenir des informations sur les versions de ce modèle, utilisez search_model_versions():

from pprint import pprint

[pprint(mv) for mv in mlflow.search_model_versions("name='<model-name>'")]

Remarque

Tous les champs et opérateurs de l’API de recherche ne sont pas pris en charge pour les modèles dans le catalogue Unity. Pour plus d’informations, consultez les Limitations .

Télécharger des fichiers de modèle (cas d’usage avancé)

Dans la plupart des cas, pour charger des modèles, vous devez utiliser des API MLflow comme mlflow.pyfunc.load_model ou mlflow.<flavor>.load_model (par exemple, mlflow.transformers.load_model pour les modèles HuggingFace).

Dans certains cas, vous devrez peut-être télécharger des fichiers de modèle pour déboguer les problèmes de comportement de modèle ou de chargement de modèle. Vous pouvez télécharger des fichiers de modèle à l’aide de mlflow.artifacts.download_artifacts, comme suit :

import mlflow
mlflow.set_registry_uri("databricks-uc")
model_uri = f"models:/{model_name}/{version}" # reference model by version or alias
destination_path = "/local_disk0/model"
mlflow.artifacts.download_artifacts(artifact_uri=model_uri, dst_path=destination_path)

Promouvoir un modèle dans plusieurs environnements

Databricks vous recommande de déployer les pipelines ML sous forme de code. Cela vous évite ainsi de promouvoir les modèles dans tous les environnements, car tous les modèles de production peuvent être produits par le biais de workflows de formation automatisés dans un environnement de production.

Toutefois, dans certains cas, il peut être trop coûteux de réentraîner des modèles dans différents environnements. Au lieu de cela, vous pouvez copier des versions de modèle sur des modèles inscrits dans Unity Catalog pour les promouvoir dans les environnements.

Vous avez besoin des privilèges suivants pour exécuter l’exemple de code ci-dessous :

USE CATALOG sur les catalogues staging et prod.
USE SCHEMA sur les schémas staging.ml_team et prod.ml_team.
EXECUTE sur staging.ml_team.fraud_detection.

En outre, vous devez être le propriétaire du modèle enregistré prod.ml_team.fraud_detection.

L’extrait de code suivant utilise l’ copy_model_versionAPI Client MLflow, disponible dans MLflow version 2.8.0 et ultérieure.

import mlflow
mlflow.set_registry_uri("databricks-uc")

client = mlflow.tracking.MlflowClient()
src_model_name = "staging.ml_team.fraud_detection"
src_model_version = "1"
src_model_uri = f"models:/{src_model_name}/{src_model_version}"
dst_model_name = "prod.ml_team.fraud_detection"
copied_model_version = client.copy_model_version(src_model_uri, dst_model_name)

Une fois la version du modèle dans l’environnement de production, vous pouvez effectuer toute validation préalable au déploiement nécessaire. Ensuite, vous pouvez marquer la version du modèle pour le déploiement en utilisant des alias.

client = mlflow.tracking.MlflowClient()
client.set_registered_model_alias(name="prod.ml_team.fraud_detection", alias="Champion", version=copied_model_version.version)

Dans l’exemple ci-dessus, seuls les utilisateurs qui peuvent lire à partir du modèle inscrit staging.ml_team.fraud_detection et écrire dans le modèle inscrit prod.ml_team.fraud_detection peuvent promouvoir des modèles intermédiaires dans l’environnement de production. Les mêmes utilisateurs peuvent également utiliser des alias pour gérer les versions de modèle déployées dans l’environnement de production. Vous n’avez pas besoin de configurer d’autres règles ou stratégies pour régir la promotion et le déploiement de modèles.

Vous pouvez personnaliser ce flux pour promouvoir la version du modèle dans plusieurs environnements qui correspondent à votre configuration, tels que dev, qa et prod. Le contrôle d’accès est appliqué comme configuré dans chaque environnement.

Exemple de notebook

Cet exemple de notebook montre comment utiliser les modèles dans les API Unity Catalog pour gérer les modèles dans Unity Catalog, notamment l’enregistrement de modèles et de versions de modèles, l’ajout de descriptions, le chargement et le déploiement de modèles, l’utilisation d’alias de modèles et la suppression de modèles et de versions de modèles.

MLflow 3

Modèles dans le notebook d'exemple d'Unity Catalog pour MLflow 3

Obtenir le notebook

MLflow 2.x

Modèles dans un exemple de notebook du Unity Catalog

Obtenir le notebook

Limites

Les étapes ne sont pas prises en charge pour les modèles dans Unity Catalog. Databricks recommande d’utiliser l’espace de noms à trois niveaux dans Unity Catalog pour exprimer l’environnement dans lequel se trouve un modèle et d’utiliser des alias pour promouvoir des modèles pour le déploiement. Pour plus d’informations, consultez Promouvoir un modèle dans plusieurs environnements.
Les webhooks ne sont pas pris en charge pour les modèles dans Unity Catalog. Consultez les alternatives suggérées dans le guide de mise à niveau.
Certains champs et opérateurs d’API de recherche ne sont pas pris en charge pour les modèles dans Unity Catalog. Vous pouvez atténuer ce problème en appelant les API de recherche à l’aide de filtres pris en charge et en analysant les résultats. Voici quelques exemples :
- Le paramètre order_by n’est pas pris en charge dans les API clientes search_model_versions ou search_registered_models.
- Les filtres basés sur des balises (tags.mykey = 'myvalue') ne sont pas pris en charge pour search_model_versions ou search_registered_models.
- Les opérateurs autres que l’égalité exacte (par exemple, LIKE, ILIKE, !=) ne sont pas pris en charge pour search_model_versions ou search_registered_models.
- La recherche de modèles inscrits par nom (par exemple, search_registered_models(filter_string="name='main.default.mymodel'") n’est pas prise en charge. Pour extraire un modèle inscrit particulier par son nom, utilisez get_registered_model.
Les notifications par e-mail et les threads de discussion de commentaires sur les modèles inscrits et les versions de modèle ne sont pas pris en charge dans Unity Catalog.
Le journal d’activité n’est pas pris en charge pour les modèles dans Unity Catalog. Pour suivre l’activité sur les modèles dans Unity Catalog, utilisez les journaux d’audit.
search_registered_models peut retourner des résultats obsolètes pour les modèles partagés via Delta Sharing. Pour garantir les résultats les plus récents, utilisez l’interface CLI Databricks ou le Kit de développement logiciel (SDK) pour répertorier les modèles dans un schéma.

Commentaires

Cette page a-t-elle été utile ?

Last updated on 2026-04-30

Gérer le cycle de vie des modèles dans Unity Catalog

Spécifications

Installer et configurer le client MLflow pour Unity Catalog

Installer le client Python MLflow

Configurer le client MLflow pour accéder aux modèles dans Unity Catalog

Entraîner et enregistrer des modèles compatibles avec Unity Catalog

Inscrire un modèle dans Unity Catalog à l’aide de la journalisation automatique

MLflow 3

MLflow 2.x

Inscrire un modèle à l’aide de l’API

MLflow 3

MLflow 2.x

Inscrire un modèle dans Unity Catalog avec une signature inférée automatiquement

MLflow 3

MLflow 2.x

Inscrire un modèle à l’aide de l’interface utilisateur

Ajouter ou mettre à jour une signature pour une version de modèle existante

Utiliser des alias de modèle

Définir et supprimer des alias sur les modèles

Charger une version du modèle par alias pour les tâches d’inférence

Charger une version du modèle par numéro de version pour les charges de travail d’inférence

Partager des modèles dans des espaces de travail

Partager des modèles avec des utilisateurs dans la même région

Partager des modèles avec des utilisateurs dans une autre région ou un autre compte

Suivre la traçabilité des données d’un modèle dans Unity Catalog

MLflow 3

MLflow 2.x

Contrôler l’accès aux modèles

Afficher et gérer des modèles dans l’interface utilisateur

Afficher les informations sur le modèle

Définir des alias de modèle

Afficher les informations de version du modèle et la traçabilité des modèles

MLflow 3

MLflow 2.x

Renommer un modèle

Copier une version de modèle

Copier un modèle de version à l’aide de l’interface utilisateur

Copier une version de modèle à l’aide de l’API

Supprimer un modèle ou une version de modèle

Supprimer une version de modèle ou un modèle à l’aide de l’interface utilisateur

Supprimer une version de modèle ou un modèle à l’aide de l’API

Utiliser des balises sur les modèles

Ajouter ou mettre à jour la description (commentaires) d’un modèle ou d’une version de modèle

Ajouter une description à un modèle avec l’interface utilisateur

Ajouter une description à un modèle avec l’interface utilisateur

Ajouter une description à un modèle ou une version de modèle à l’aide de l’API

Modèles de liste et de recherche

Télécharger des fichiers de modèle (cas d’usage avancé)

Promouvoir un modèle dans plusieurs environnements

Exemple de notebook

MLflow 3

Modèles dans le notebook d'exemple d'Unity Catalog pour MLflow 3

MLflow 2.x

Modèles dans un exemple de notebook du Unity Catalog

Limites

Commentaires

Ressources supplémentaires