在 Unity Catalog 中管理模型生命周期

重要

本页记录了 Unity Catalog 中的模型，Databricks 推荐使用这些模型进行管理和部署。如果未为工作区启用 Unity Catalog，则此页上的功能不可用。请改为参阅使用工作区模型注册表（旧版）管理模型生命周期。有关如何从工作区模型注册表升级到 Unity Catalog 的指南，请参阅将工作流和模型迁移到 Unity Catalog。
Unity 目录中的模型在 Azure 政府区域中不可用。

本文介绍如何使用 Unity Catalog 中的模型作为机器学习工作流的一部分来管理 ML 模型的整个生命周期。 Databricks 提供 Unity Catalog 中的 MLflow 模型注册表的托管版本。 Unity Catalog 中的模型将 Unity Catalog 的优势扩展到 ML 模型，包括跨工作区的集中访问控制、审核、世系和模型发现。 Unity Catalog 中的模型与开源 MLflow Python 客户端兼容。

有关模型注册表概念的概述，请参阅 Databricks 上的 MLflow。

MLflow 3 对 Unity 目录中的 MLflow 模型注册表进行了重大改进，使模型能够直接捕获参数和指标等数据，并使其在所有工作区和试验中可用。 MLflow 3 中的默认注册表 URI 是 databricks-uc，这意味着将使用 Unity 目录中的 MLflow 模型注册表。有关更多详细信息，请参阅使用 MLflow 3 开始模型构建和 MLflow 3 的模型注册表改进。

要求

必须在工作区中启用 Unity Catalog。若要创建 Unity Catalog 元存储、在工作区中启用它和创建目录，请参阅开始使用 Unity Catalog。如果未启用 Unity Catalog，请使用工作区模型注册表。
必须使用有权访问 Unity Catalog 的计算资源。对于 ML 工作负荷，这意味着计算的访问模式必须是专用（以前是单个用户）。有关详细信息，请参阅访问模式。借助 Databricks Runtime 15.4 LTS ML 及更高版本，还可以使用专用组访问模式。
若要创建新的已注册模型，需要以下权限：
- 对架构及其所属的目录具有 USE SCHEMA 和 USE CATALOG 特权。
- 对架构的 CREATE MODEL 或 CREATE FUNCTION 特权。若要授予权限，请使用目录资源管理器 UI 或 SQL GRANT 命令：
```
GRANT CREATE MODEL ON SCHEMA <schema-name> TO <principal>
```
如果在注册模型的过程中遇到授权问题，请将环境变量 MLFLOW_USE_DATABRICKS_SDK_MODEL_ARTIFACTS_REPO_FOR_UC 设置为 True。在你的笔记本中添加一个包含以下代码的单元格：
```
import os
os.environ['MLFLOW_USE_DATABRICKS_SDK_MODEL_ARTIFACTS_REPO_FOR_UC'] = 'True'
```
此方法不能用于与使用默认存储的 Delta Sharing 共享的模型。

注意

您的工作区必须连接到支持权限继承的 Unity Catalog 元存储库。这适用于在 2022 年 8 月 25 日之后创建的所有元存储。如果在更旧的元存储上运行，请按照文档进行升级。

为 Unity Catalog 安装和配置 MLflow 客户端

本部分包括有关为 Unity Catalog 安装和配置 MLflow 客户端的说明。

安装 MLflow Python 客户端

Unity Catalog 中的模型支持包含在 Databricks Runtime 13.2 ML 及更高版本中（Azure 中国 Databricks Runtime 15.0 ML 及更高版本）。

还可以在 Databricks Runtime 11.3 LTS 及更高版本中使用 Unity Catalog 中的模型，方法是在笔记本中使用以下代码安装最新版本的 MLflow Python 客户端。

%pip install --upgrade "mlflow-skinny[databricks]"
dbutils.library.restartPython()

配置 MLflow 客户端以访问 Unity Catalog 中的模型

如果工作区的默认目录位于 Unity 目录（而不是 hive_metastore），并且你使用的是 Databricks Runtime 13.3 LTS 或更高版本（Azure 中国区域中的 Databricks Runtime 15.0 或更高版本）或使用 MLflow 3 运行群集，则模型会自动在默认目录中创建并加载。

对于其他工作区，MLflow Python 客户端会在 Databricks 工作区模型注册表中创建模型。若要升级到 Unity Catalog 中的模型，请在笔记本中使用以下代码来配置 MLflow 客户端：

import mlflow
mlflow.set_registry_uri("databricks-uc")

对于少数工作区，如果默认目录在 2024 年 1 月之前配置为 Unity Catalog 中的目录，并且工作区模型注册表是在 2024 年 1 月之前使用的，则必须使用上面显示的命令手动将默认目录设置为 Unity Catalog。

训练和注册与 Unity Catalog 兼容的模型

所需的权限：若要创建新的已注册模型，需要对包含的架构具有 CREATE MODEL 和 USE SCHEMA 权限，对包含的目录具有 USE CATALOG 权限。若要在已注册的模型下创建新的模型版本，你必须是已注册模型的所有者，并且对包含该模型的架构和目录具有 USE SCHEMA 和 USE CATALOG 权限。

如果在注册模型的过程中遇到授权问题，请将环境变量 MLFLOW_USE_DATABRICKS_SDK_MODEL_ARTIFACTS_REPO_FOR_UC 设置为 True。此方法不能用于与使用默认存储的 Delta Sharing 共享的模型。请参阅要求。

UC 中的新 ML 模型版本必须具有模型签名。如果你还没有在模型训练工作负载中记录 MLflow 模型并附加签名，你可以：

使用 Databricks 自动记录功能，它会自动记录包含许多热门 ML 框架签名的模型。有关支持的框架，请参阅 MLflow 文档。
使用 MLflow 2.5.0 及更高版本时，可以在 mlflow.<flavor>.log_model 调用中指定一个输入示例，随即会自动推断模型签名。有关详细信息，请参阅 MLflow 文档。

然后，以 <catalog>.<schema>.<model> 的形式将模型的三级名称传递给 MLflow API。

没有签名的模型版本具有某些限制。有关这些限制的列表，以及添加或更新现有模型版本的签名，请参阅添加或更新现有模型版本的签名。

本部分中的示例在 ml_team 目录下的 prod 架构中创建和访问模型。

本部分中的模型训练示例创建了一个新的模型版本并将其注册到了 prod 目录中。使用 prod 目录并不一定意味着模型版本服务于生产流量。模型版本的封闭目录、架构和已注册模型反映了它的环境 (prod) 和关联的治理规则（例如，可以设置权限，以便只有管理员可以从 prod 目录中删除），但未反映其部署状态。要管理部署状态，请使用模型别名。

使用自动日志记录功能将模型注册到 Unity Catalog

若要注册模型，请使用 MLflow 客户端 API register_model() 方法。请参阅 mlflow.register_model。

MLflow 3

from sklearn import datasets
from sklearn.ensemble import RandomForestClassifier

# Train a sklearn model on the iris dataset
X, y = datasets.load_iris(return_X_y=True, as_frame=True)
clf = RandomForestClassifier(max_depth=7)
clf.fit(X, y)

# Note that the UC model name follows the pattern
# <catalog_name>.<schema_name>.<model_name>, corresponding to
# the catalog, schema, and registered model name
# in Unity Catalog under which to create the version
# The registered model will be created if it doesn't already exist,
# and the model version will contain all parameters and metrics
# logged with the corresponding MLflow Logged Model.
logged_model = mlflow.last_logged_model()
mlflow.register_model(logged_model.model_uri, "prod.ml_team.iris_model")

MLflow 2.x

from sklearn import datasets
from sklearn.ensemble import RandomForestClassifier

# Train a sklearn model on the iris dataset
X, y = datasets.load_iris(return_X_y=True, as_frame=True)
clf = RandomForestClassifier(max_depth=7)
clf.fit(X, y)

# Note that the UC model name follows the pattern
# <catalog_name>.<schema_name>.<model_name>, corresponding to
# the catalog, schema, and registered model name
# in Unity Catalog under which to create the version
# The registered model will be created if it doesn't already exist
autolog_run = mlflow.last_active_run()
model_uri = "runs:/{}/model".format(autolog_run.info.run_id)
mlflow.register_model(model_uri, "prod.ml_team.iris_model")

使用 API 注册模型

MLflow 3

mlflow.register_model(
  "models:/<model_id>", "prod.ml_team.iris_model"
)

MLflow 2.x

mlflow.register_model(
  "runs:/<run_id>/model", "prod.ml_team.iris_model"
)

使用自动推断的签名将模型注册到 Unity Catalog

MLflow 2.5.0 及更高版本支持自动推断的签名，Databricks Runtime 11.3 LTS ML 及更高版本也支持。若要使用自动推断的签名，请使用以下代码在笔记本中安装最新的 MLflow Python 客户端：

%pip install --upgrade "mlflow-skinny[databricks]"
dbutils.library.restartPython()

以下代码演示了自动推断的签名示例。请注意，使用registered_model_name在log_model()调用中注册模型到 Unity 目录，因此必须以<catalog>.<schema>.<model>格式提供模型的完整三级名称。

MLflow 3

from sklearn import datasets
from sklearn.ensemble import RandomForestClassifier

with mlflow.start_run():
    # Train a sklearn model on the iris dataset
    X, y = datasets.load_iris(return_X_y=True, as_frame=True)
    clf = RandomForestClassifier(max_depth=7)
    clf.fit(X, y)
    # Take the first row of the training dataset as the model input example.
    input_example = X.iloc[[0]]
    # Log the model and register it as a new version in UC.
    mlflow.sklearn.log_model(
        sk_model=clf,
        name="model",
        # The signature is automatically inferred from the input example and its predicted output.
        input_example=input_example,
        # Use three-level name to register model in Unity Catalog.
        registered_model_name="prod.ml_team.iris_model",
    )

MLflow 2.x

from sklearn import datasets
from sklearn.ensemble import RandomForestClassifier

with mlflow.start_run():
    # Train a sklearn model on the iris dataset
    X, y = datasets.load_iris(return_X_y=True, as_frame=True)
    clf = RandomForestClassifier(max_depth=7)
    clf.fit(X, y)
    # Take the first row of the training dataset as the model input example.
    input_example = X.iloc[[0]]
    # Log the model and register it as a new version in UC.
    mlflow.sklearn.log_model(
        sk_model=clf,
        artifact_path="model",
        # The signature is automatically inferred from the input example and its predicted output.
        input_example=input_example,
        # Use three-level name to register model in Unity Catalog.
        registered_model_name="prod.ml_team.iris_model",
    )

使用 UI 注册模型

执行以下步骤：

在试验运行页中，单击 UI 右上角的“注册模型”。
在对话框中，选择 Unity Catalog，并从下拉列表中选择一个目标模型。
单击“注册”。

注册模型可能需要一段时间。若要监视进度，请导航到 Unity Catalog 中的目标模型并定期刷新。

添加或更新现有模型版本的签名

没有签名的模型版本具有以下限制：

如果提供了签名，则模型输入在推理时进行检查，如果输入与签名不匹配，则会报告错误。如果没有签名，则没有自动输入强制，模型需要能够处理意外输入。
将模型版本与 AI 函数配合使用需要在函数调用中提供架构。
将模型版本与 Model Services 配合使用不会自动生成输入示例。

若要添加或更新模型版本签名，请参阅 MLflow 文档。

使用模型别名

模型别名让你能够将可变的命名引用分配给已注册的模型的特定版本。可以使用别名来指示模型版本的部署状态。例如，可以将“Champion”别名分配给当前在生产中的模型版本，并在使用该生产模型的工作负载中将此别名作为目标。然后，可以通过将“Champion”别名重新分配给其他模型版本来更新生产模型。

在模型上设置和删除别名

所需的权限：是已注册的模型的所有者，并且对包含该模型的架构和目录具有 USE SCHEMA 和 USE CATALOG 权限。

可以使用目录资源管理器在 Unity 目录中设置、更新和删除模型的别名。请参阅 UI 中的视图和管理模型。

要使用 MLflow 客户端 API 设置、更新和删除别名，请参阅以下示例：

from mlflow import MlflowClient
client = MlflowClient()

# create "Champion" alias for version 1 of model "prod.ml_team.iris_model"
client.set_registered_model_alias("prod.ml_team.iris_model", "Champion", 1)

# reassign the "Champion" alias to version 2
client.set_registered_model_alias("prod.ml_team.iris_model", "Champion", 2)

# get a model version by alias
client.get_model_version_by_alias("prod.ml_team.iris_model", "Champion")

# delete the alias
client.delete_registered_model_alias("prod.ml_team.iris_model", "Champion")

有关别名客户端 API 的更多详细信息，请参阅 MLflow API 文档。

通过别名加载用于推理工作负载的模型版本

所需的权限：在已注册的模型上拥有 EXECUTE 权限，并且对包含该模型的架构和目录具有 USE SCHEMA 和 USE CATALOG 权限。

批量推理工作负载可以按别名引用模型版本。下面的代码段加载并应用“冠军”模型版本进行批推理。如果“冠军”版本更新为引用新的模型版本，则批量推理工作负载会在下一次执行时自动采用它。这允许将模型部署与批推理工作负载分离。

import mlflow.pyfunc
model_version_uri = "models:/prod.ml_team.iris_model@Champion"
champion_version = mlflow.pyfunc.load_model(model_version_uri)
champion_version.predict(test_x)

模型服务终结点还可以通过别名引用模型版本。可以写入部署工作流以通过别名获取模型版本，并使用模型服务 REST API 更新模型服务端点以服务该版本。例如：

import mlflow
import requests
client = mlflow.tracking.MlflowClient()
champion_version = client.get_model_version_by_alias("prod.ml_team.iris_model", "Champion")
# Invoke the model serving REST API to update endpoint to serve the current "Champion" version
model_name = champion_version.name
model_version = champion_version.version
requests.request(...)

按版本号加载用于推理工作负载的模型版本

还可以按版本号加载模型版本：

import mlflow.pyfunc
# Load version 1 of the model "prod.ml_team.iris_model"
model_version_uri = "models:/prod.ml_team.iris_model/1"
first_version = mlflow.pyfunc.load_model(model_version_uri)
first_version.predict(test_x)

只要拥有适当的权限，就可以从任何工作区访问 Unity Catalog 中的模型，前提是该工作区附加到了包含该模型的元存储。例如，可以从开发工作区的 prod 目录中访问模型，以便于将新开发的模型与产品基线进行比较。

若要与其他用户协作处理你创建的已注册模型（拥有共享写入权限），你必须将模型的所有权授予包含你自己和你要与之协作的用户的组。协作者还必须对包含模型的目录和架构具有 USE CATALOG 和 USE SCHEMA 权限。有关详细信息，请参阅Unity Catalog 权限参考。

若要与其他区域或帐户中的用户共享模型，请使用增量共享 Databricks 到 Databricks 共享流。请参阅将模型添加到共享（面向提供方）和在 Databricks 到 Databricks 模型中获取访问权限（面向接收方）。作为接收方，基于共享创建目录后，可以像访问 Unity Catalog 中的任何其他模型一样访问该共享目录中的模型。

跟踪 Unity Catalog 中的模型的数据世系

注意

MLflow 2.11.0 及更高版本中提供了对 Unity Catalog 中的表到模型世系的支持。

在 Unity Catalog 中的表中训练模型时，可以将模型的世系跟踪到已对其进行训练和评估的上游数据集。为此，请使用 mlflow.log_input。这会将输入表信息与生成模型的 MLflow 运行一起保存。对于使用功能存储 API 记录的模型，也会自动捕获数据世系。请参阅功能治理和世系。

将模型注册到 Unity 目录时，世系信息会自动保存，并在目录资源管理器的“模型版本”页上的“ 世系 ”选项卡中可见。请参阅 “查看模型版本信息”和“模型世系”。

以下代码展示了一个示例。

MLflow 3

import mlflow
import pandas as pd
import pyspark.pandas as ps
from sklearn.datasets import load_iris
from sklearn.ensemble import RandomForestRegressor

# Write a table to Unity Catalog
iris = load_iris()
iris_df = pd.DataFrame(iris.data, columns=iris.feature_names)
iris_df.rename(
  columns = {
    'sepal length (cm)':'sepal_length',
    'sepal width (cm)':'sepal_width',
    'petal length (cm)':'petal_length',
    'petal width (cm)':'petal_width'},
  inplace = True
)
iris_df['species'] = iris.target
ps.from_pandas(iris_df).to_table("prod.ml_team.iris", mode="overwrite")

# Load a Unity Catalog table, train a model, and log the input table
dataset = mlflow.data.load_delta(table_name="prod.ml_team.iris", version="0")
pd_df = dataset.df.toPandas()
X = pd_df.drop("species", axis=1)
y = pd_df["species"]
with mlflow.start_run():
    clf = RandomForestRegressor(n_estimators=100)
    clf.fit(X, y)
    mlflow.log_input(dataset, "training")
    # Take the first row of the training dataset as the model input example.
    input_example = X.iloc[[0]]
    # Log the model and register it as a new version in UC.
    mlflow.sklearn.log_model(
        sk_model=clf,
        name="model",
        # The signature is automatically inferred from the input example and its predicted output.
        input_example=input_example,
        # Use three-level name to register model in Unity Catalog.
        registered_model_name="prod.ml_team.iris_classifier",
    )

MLflow 2.x

import mlflow
import pandas as pd
import pyspark.pandas as ps
from sklearn.datasets import load_iris
from sklearn.ensemble import RandomForestRegressor

# Write a table to Unity Catalog
iris = load_iris()
iris_df = pd.DataFrame(iris.data, columns=iris.feature_names)
iris_df.rename(
  columns = {
    'sepal length (cm)':'sepal_length',
    'sepal width (cm)':'sepal_width',
    'petal length (cm)':'petal_length',
    'petal width (cm)':'petal_width'},
  inplace = True
)
iris_df['species'] = iris.target
ps.from_pandas(iris_df).to_table("prod.ml_team.iris", mode="overwrite")

# Load a Unity Catalog table, train a model, and log the input table
dataset = mlflow.data.load_delta(table_name="prod.ml_team.iris", version="0")
pd_df = dataset.df.toPandas()
X = pd_df.drop("species", axis=1)
y = pd_df["species"]
with mlflow.start_run():
    clf = RandomForestRegressor(n_estimators=100)
    clf.fit(X, y)
    mlflow.log_input(dataset, "training")
    # Take the first row of the training dataset as the model input example.
    input_example = X.iloc[[0]]
    # Log the model and register it as a new version in UC.
    mlflow.sklearn.log_model(
        sk_model=clf,
        artifact_path="model",
        # The signature is automatically inferred from the input example and its predicted output.
        input_example=input_example,
        # Use three-level name to register model in Unity Catalog.
        registered_model_name="prod.ml_team.iris_classifier",
    )

控制对模型的访问

在 Unity Catalog 中，已注册的模型是 FUNCTION 安全对象的子类型。若要授予对 Unity Catalog 中注册的模型的访问权限，可以使用 GRANT ON FUNCTION。还可以使用目录资源管理器设置模型所有权和权限。有关详细信息，请参阅 “管理 Unity 目录 ”和 “Unity 目录”对象模型中的权限。

你可以使用授权 REST API 以编程方式配置模型权限。配置模型权限时，请在 REST API 请求中将 securable_type 设置为 "FUNCTION"。例如，使用 PATCH /api/2.1/unity-catalog/permissions/function/{full_name} 更新已注册的模型权限。

在 UI 中查看和管理模型

所需的权限：若要在 UI 中查看已注册的模型及其模型版本，你需要对已注册的模型具有 EXECUTE 权限，并对包含该模型的架构和目录具有 USE SCHEMA 和 USE CATALOG 权限

可以使用目录资源管理器在 Unity 目录中查看和管理已注册的模型和模型版本。

查看模型信息

在目录资源管理器中查看模型：

点击边栏中的目录。
从右上角的下拉列表中选择一个计算资源。
在左侧的目录资源管理器树中，打开目录并选择架构。
如果架构包含任何模型，它们将显示在模型下的树中，如下所示。
单击模型可查看详细信息。模型详细信息页显示包含其他信息的模型版本列表。

设置模型别名

若要使用 UI 设置模型别名，请执行以下作：

在模型详情页面上，将鼠标悬停在您要添加别名的模型版本所在的行上。此时会显示 “添加别名 ”按钮。
单击“ 添加别名”。
输入别名或从下拉菜单中选择一个别名。可以在对话框中添加多个别名。
单击“ 保存别名”。

如何从模型详细信息页将别名添加到模型版本。

删除别名：

将鼠标悬停在模型版本的行上，然后单击别名旁边的铅笔图标。
在对话框中，单击要删除的别名旁边的 X。
单击“ 保存别名”。

如何从模型详细信息页上的模型版本中删除别名。

查看模型版本信息和模型世系

若要查看有关模型版本的详细信息，请单击模型列表中的名称。此时会显示模型版本页。此页面包含指向创建版本的 MLflow 源运行的链接。在 MLflow 3 中，还可以查看使用相应的 MLflow 记录模型记录的所有参数和指标。

MLflow 3

MLflow 3 模型版本页

MLflow 2.x

MLflow 2.x 模型版本页

在此页中，可以查看模型的世系，如下所示：

选择流程选项卡。左侧边栏显示与模型一起记录的组件。

的模型页面上的“世系”选项卡
单击 查看世系图。将显示世系图。有关浏览世系图的详细信息，请参阅捕获和浏览世系。
若要关闭世系图，请单击右上角世系图关闭按钮。

重命名模型

所需的权限：拥有已注册模型的所有权，对包含该已注册模型的架构具有 CREATE MODEL 权限，并且对包含该模型的架构和目录具有 USE SCHEMA 和 USE CATALOG 权限。

若要重命名已注册的模型，请使用 MLflow 客户端 API rename_registered_model() 方法，其中 <full-model-name> 模型的完整 3 级名称，并且 <new-model-name> 是没有目录或架构的模型名称。

client=MlflowClient()
client.rename_registered_model("<full-model-name>", "<new-model-name>")

例如，以下代码将模型 hello_world 的名称更改为 hello。

client=MlflowClient()
client.rename_registered_model("docs.models.hello_world", "hello")

复制模型版本

可以在 Unity Catalog 中将模型版本从一个模型复制到另一个模型。

使用 UI 复制模型版本

执行以下步骤：

在模型版本页中，单击 UI 右上角的“复制此版本”。
从下拉列表中选择目标模型，然后单击“复制”。

复制模型可能需要一段时间。若要监视进度，请导航到 Unity Catalog 中的目标模型并定期刷新。

使用 API 复制模型版本

若要复制模型版本，请使用 MLflow 的 copy_model_version() Python API：

client = MlflowClient()
client.copy_model_version(
  "models:/<source-model-name>/<source-model-version>",
  "<destination-model-name>",
)

删除模型或模型版本

所需的权限：是已注册的模型的所有者，并且对包含该模型的架构和目录具有 USE SCHEMA 和 USE CATALOG 权限。

可以使用 UI 或 API 删除已注册的模型或模型版本。

警告

不能撤消此操作。删除模型时，会删除 Unity Catalog 存储的所有模型项目以及与该已注册模型关联的所有元数据。

使用 UI 删除模型版本或模型

若要删除 Unity Catalog 中的模型或模型版本，请按照以下步骤操作。

在目录资源管理器的模型页或模型版本页上，单击右上角的垂直三点菜单。

从模型页面：

从模型版本页面：
选择“删除”。
此时会出现确认对话框。单击“删除”进行确认。

使用 API 删除模型版本或模型

若要删除模型版本，请使用 MLflow 客户端 API delete_model_version() 方法：

# Delete versions 1,2, and 3 of the model
client = MlflowClient()
versions=[1, 2, 3]
for version in versions:
  client.delete_model_version(name="<model-name>", version=version)

若要删除模型，请使用 MLflow 客户端 API delete_registered_model() 方法：

client = MlflowClient()
client.delete_registered_model(name="<model-name>")

在模型上使用标记

标记是与已注册的模型和模型版本关联的键值对，它使你可按功能或状态标记和分类它们。例如，可以将带有键 "task" 和值 "question-answering" 的标记（在 UI 中显示为 task:question-answering）应用于用于问题解答任务的已注册模型。在模型版本级别，可以使用 validation_status:pending 标记正在进行部署前验证的版本，并使用 validation_status:approved 标记已经可以部署的版本。

所需的权限：是已注册的模型的所有者，或对其具有 APPLY TAG 权限，并且对包含该模型的架构和目录具有 USE SCHEMA 和 USE CATALOG 权限。

请参阅将标记应用于 Unity 目录安全对象，了解如何使用 UI 设置和删除标记。

要使用 MLflow 客户端 API 设置和删除标记，请参阅以下示例：

from mlflow import MlflowClient
client = MlflowClient()

# Set registered model tag
client.set_registered_model_tag("prod.ml_team.iris_model", "task", "classification")

# Delete registered model tag
client.delete_registered_model_tag("prod.ml_team.iris_model", "task")

# Set model version tag
client.set_model_version_tag("prod.ml_team.iris_model", "1", "validation_status", "approved")

# Delete model version tag
client.delete_model_version_tag("prod.ml_team.iris_model", "1", "validation_status")

已注册的模型和模型版本标记都必须满足平台范围的约束。

有关标记客户端 API 的更多详细信息，请参阅 MLflow API 文档。

为模型或模型版本添加说明（注释）

所需的权限：是已注册的模型的所有者，并且对包含该模型的架构和目录具有 USE SCHEMA 和 USE CATALOG 权限。

可以在 Unity Catalog 中包括任何模型或模型版本的文本说明。例如，你可以提供有关所用方法和算法的相关问题或信息的概述性介绍。

对于模型，还可以选择使用 AI 生成的注释。请参阅将 AI 生成的注释添加到 Unity Catalog 对象。

使用 UI 向模型添加说明

若要为模型添加说明，可以使用 AI 生成的注释，也可以输入自己的注释。可根据需要编辑 AI 生成的注释。

若要添加自动生成的注释，请单击“AI 生成”按钮。
若要添加自己的注释，请单击“添加”。在对话框中输入注释，然后单击“保存”。

uc 模型描述按钮

使用 UI 向模型版本添加说明

若要向 Unity Catalog 中的模型版本添加说明，请按照以下步骤操作：

在模型版本页上，单击“说明”下的铅笔图标。
在对话框中输入注释，然后单击“保存”。

使用 API 向模型或模型版本添加说明

若要更新注册模型的说明，请使用 MLflow 客户端 API update_registered_model() 方法。

client = MlflowClient()
client.update_registered_model(
  name="<model-name>",
  description="<description>"
)

若要更新模型版本说明，请使用 MLflow 客户端 API update_model_version() 方法：

client = MlflowClient()
client.update_model_version(
  name="<model-name>",
  version=<model-version>,
  description="<description>"
)

列出和搜索模型

若要获取 Unity Catalog 中已注册模型的列表，请使用 MLflow 的 search_registered_models() Python API：

mlflow.search_registered_models()

若要搜索特定模型名称并获取有关该模型版本的信息，请使用 search_model_versions()：

from pprint import pprint

[pprint(mv) for mv in mlflow.search_model_versions("name='<model-name>'")]

注意

不是所有搜索 API 字段和运算符都受 Unity Catalog 中的模型支持。有关详细信息，请参阅限制。

下载模型文件（高级用例）

在大多数情况下，若要加载模型，应使用 mlflow.pyfunc.load_model 或 mlflow.<flavor>.load_model 等 MLflow API（例如，对 HuggingFace 模型使用 mlflow.transformers.load_model）。

在某些情况下，可能需要下载模型文件来调试模型行为或模型加载问题。可以使用 mlflow.artifacts.download_artifacts 下载模型文件，如下所示：

import mlflow
mlflow.set_registry_uri("databricks-uc")
model_uri = f"models:/{model_name}/{version}" # reference model by version or alias
destination_path = "/local_disk0/model"
mlflow.artifacts.download_artifacts(artifact_uri=model_uri, dst_path=destination_path)

在不同环境中推广模型

Databricks 建议将机器学习管道以代码形式进行部署。这样就无需跨环境提升模型，因为所有生产模型都可以通过生产环境中的自动训练工作流生成。

但是，在某些情况下，跨环境重新训练模型可能过于昂贵。可以改为在 Unity Catalog 中跨已注册的模型复制模型版本，以便跨环境提升它们。

需要具有以下特权才能执行以下示例代码：

USE CATALOG 和 staging 目录上的 prod。
USE SCHEMA 和 staging.ml_team 架构上的 prod.ml_team。
EXECUTE 上的 staging.ml_team.fraud_detection。

另外，您必须是注册模型prod.ml_team.fraud_detection的所有者。

以下代码片段使用 copy_model_versionMLflow 客户端 API，在 MLflow 2.8.0 及更高版本中可用。

import mlflow
mlflow.set_registry_uri("databricks-uc")

client = mlflow.tracking.MlflowClient()
src_model_name = "staging.ml_team.fraud_detection"
src_model_version = "1"
src_model_uri = f"models:/{src_model_name}/{src_model_version}"
dst_model_name = "prod.ml_team.fraud_detection"
copied_model_version = client.copy_model_version(src_model_uri, dst_model_name)

模型版本进入生产环境中后，可以执行任何必要的部署前验证。然后，可以使用别名标记要部署的模型版本。

client = mlflow.tracking.MlflowClient()
client.set_registered_model_alias(name="prod.ml_team.fraud_detection", alias="Champion", version=copied_model_version.version)

在上面的示例中，只有能够从 staging.ml_team.fraud_detection 注册的模型读取和写入 prod.ml_team.fraud_detection 注册的模型的用户才能将暂存模型提升到生产环境。同一用户还可以使用别名来管理在生产环境中部署的模型版本。无需配置任何其他规则或策略即可管理模型提升和部署。

可以自定义此流，以跨与设置匹配的多个环境（例如 dev、qa 和 prod）提升模型版本。访问控制是按照每个环境中的配置强制实施的。

示例笔记本

此示例笔记本演示如何使用 Unity 目录 API 中的模型来管理 Unity 目录中的模型，包括注册模型和模型版本、添加说明、加载和部署模型、使用模型别名以及删除模型和模型版本。

MLflow 3

MLflow 3 的 Unity Catalog 示例笔记本中的模型

获取笔记本

MLflow 2.x

Unity Catalog 示例笔记本中的模型

获取笔记本

限制

Unity Catalog 中的模型不支持阶段。 Databricks 建议使用 Unity Catalog 中的三级命名空间来表达模型所处的环境，并使用别名来促进模型的部署。有关详细信息，请参阅跨环境推广模型。
Unity Catalog 中的模型不支持 Webhook。请参阅升级指南中建议的替代方案。
Unity Catalog 中的模型不支持某些搜索 API 字段和运算符。通过使用支持的筛选器调用搜索 API 并扫描结果，可以缓解这种情况。下面是一些示例：
- order_by 参数在 search_model_versions 或 search_registered_models 客户端 API 中不支持。
- 基于标记的筛选器 (tags.mykey = 'myvalue') 不支持 search_model_versions 或 search_registered_models。
- LIKE 或 ILIKE 不支持除完全相等以外的运算符（例如 !=、search_model_versions、search_registered_models）。
- 不支持按名称（例如 search_registered_models(filter_string="name='main.default.mymodel'")）搜索已注册的模型。若要按名称提取特定已注册模型，请使用 get_registered_model。
Unity Catalog 不支持有关已注册模型和模型版本的电子邮件通知和注释讨论线程。
Unity Catalog 中的模型不支持活动日志。若要跟踪 Unity Catalog 中模型的活动，请使用审核日志。
对于通过Delta Sharing共享的模型，search_registered_models 可能会返回过时的结果。若要确保返回最新结果，请使用 Databricks CLI 或 SDK 列出架构中的模型。

反馈

此页面是否有帮助？

Last updated on 2026-04-30

在 Unity Catalog 中管理模型生命周期

要求

为 Unity Catalog 安装和配置 MLflow 客户端

安装 MLflow Python 客户端

配置 MLflow 客户端以访问 Unity Catalog 中的模型

训练和注册与 Unity Catalog 兼容的模型

使用自动日志记录功能将模型注册到 Unity Catalog

MLflow 3

MLflow 2.x

使用 API 注册模型

MLflow 3

MLflow 2.x

使用自动推断的签名将模型注册到 Unity Catalog

MLflow 3

MLflow 2.x

使用 UI 注册模型

添加或更新现有模型版本的签名

使用模型别名

在模型上设置和删除别名

通过别名加载用于推理工作负载的模型版本

按版本号加载用于推理工作负载的模型版本

跨工作区共享模型

与同一区域中的用户共享模型

与其他区域或帐户中的用户共享模型

跟踪 Unity Catalog 中的模型的数据世系

MLflow 3

MLflow 2.x

控制对模型的访问

在 UI 中查看和管理模型

查看模型信息

设置模型别名

查看模型版本信息和模型世系

MLflow 3

MLflow 2.x

重命名模型

复制模型版本

使用 UI 复制模型版本

使用 API 复制模型版本

删除模型或模型版本

使用 UI 删除模型版本或模型

使用 API 删除模型版本或模型

在模型上使用标记

为模型或模型版本添加说明（注释）

使用 UI 向模型添加说明

使用 UI 向模型版本添加说明

使用 API 向模型或模型版本添加说明

列出和搜索模型

下载模型文件（高级用例）

在不同环境中推广模型

示例笔记本

MLflow 3

MLflow 3 的 Unity Catalog 示例笔记本中的模型

MLflow 2.x

Unity Catalog 示例笔记本中的模型

限制

反馈

其他资源