使用模型服务部署 Python 代码

本文介绍如何使用模型服务部署 Python 代码。

MLflow 的 Python 函数 pyfunc 提供了部署任何 Python 代码或任何 Python 模型的灵活性。 下面是你可能需要该指南的示例方案。

  • 你的模型需要预处理,然后才能将输入传递到模型的预测函数。
  • MLflow 本机不支持模型框架。
  • 你的应用程序需要对模型的原始输出进行后处理才能使用。
  • 模型本身具有按请求分支逻辑。
  • 你希望将完全自定义代码部署为模型。

构造自定义 MLflow Python 函数模型

MLflow 可以使用自定义 Python 模型格式记录 Python 代码。

使用 MLflow 打包任意 Python 代码时,需要两个函数:

  • load_context - 只需加载一次就能让模型运行的任何内容都应定义到此函数中。 这一点至关重要,因为这样系统才能最大程度地减少 predict 函数期间加载的工件数,从而加快推理速度。
  • predict - 此函数包含每次发出输入请求时运行的所有逻辑。

记录 Python 函数模型

即使使用自定义代码编写模型,也可以使用组织中的共享代码模块。 使用 code_path 参数,模型作者可以记录加载到路径中的完整代码引用,并且可从其他自定义 pyfunc 模型使用。

例如,如果模型通过此项记录:

mlflow.pyfunc.log_model(CustomModel(), "model", code_path = ["preprocessing_utils/"])

在模型已加载的上下文中,preprocessing_utils 中的代码可用。 下面是使用此代码的示例模型。

class CustomModel(mlflow.pyfunc.PythonModel):
    def load_context(self, context):
        self.model = torch.load(context.artifacts["model-weights"])
        from preprocessing_utils.my_custom_tokenizer import CustomTokenizer
        self.tokenizer = CustomTokenizer(context.artifacts["tokenizer_cache"])

    def format_inputs(self, model_input):
        # insert some code that formats your inputs
        pass

    def format_outputs(self, outputs):
        predictions = (torch.sigmoid(outputs)).data.numpy()
        return predictions

    def predict(self, context, model_input):
        model_input = self.format_inputs(model_input)
        outputs = self.model.predict(model_input)
        return self.format_outputs(outputs)

提供你的模型

记录自定义 pyfunc 模型后,可以将其注册到 Unity Catalog 或工作区注册表,并将该模型提供给模型服务终结点

笔记本示例

下面的笔记本示例演示了当需要对查询的模型的原始输出进行后处理以供使用时,如何自定义模型输出。

使用 MLflow PyFunc 笔记本自定义模型服务输出

获取笔记本