为 Vowpal Wabbit 版本 8 模型评分

重要

对机器学习工作室(经典)的支持将于 2024 年 8 月 31 日结束。 建议在该日期之前转换到 Azure 机器学习

从 2021 年 12 月 1 日开始,你将无法创建新的机器学习工作室(经典)资源。 在 2024 年 8 月 31 日之前,可继续使用现有的机器学习工作室(经典)资源。

ML 工作室(经典)文档即将停用,将来可能不会更新。

从命令行界面使用 Vowpal Wabbit 机器学习系统为数据评分

类别:文本分析

注意

适用于:机器学习 Studio (经典) 应用

可在 Azure 机器学习设计器中获取类似的拖放模块。

模块概述

本文介绍如何使用 机器学习 Studio (经典) 中的"评分 Vowpal Wabbit 版本 8 模型"模块,使用现有的已训练 Vowpal Wabbit 模型为一组输入数据生成分数。

本模块提供最新版本的 Vowpal Wabbit 框架版本 8。 使用此模块,借助以 VW 版本 8 格式保存的经过训练的模型对数据进行评分。

如果已有使用早期版本创建的现有模型,请使用以下模块:

如何配置 Vowpal Wabbit 模型 8 评分

  1. 将" 评分 Vowpal Wabbit 版本 8 模型" 模块添加到试验。

  2. 添加经过训练的 Vowpal Wabbit 模型,并将其连接到左侧输入端口。 可以使用在同一试验中创建的已训练模型,或在工作室的"已训练模型"组中查找已保存的模型 (经典) 左侧导航窗格中。 但是,该模型必须在 机器学习 Studio (经典) 中提供;不能直接从 Azure 存储加载模型。

    注意

    仅支持 Vowpal Wabbit 8 模型;无法连接使用其他算法训练的已保存模型,并且不能使用使用早期版本训练的模型。

  3. 在 VW 参数文本框中,键入一组有效的 Vowpal Wabbit 可执行文件命令行参数。

    有关这些参数中支持和不支持的 Vowpal Wabbit 参数机器学习请参阅技术说明部分。

  4. 单击 "指定数据类型",然后从列表中选择受支持的数据类型之一。

    评分需要一列与 VW 兼容的数据。

    如果有以 SVMLight 或 VW 格式创建的现有文件,可以将它作为以下格式之一的新数据集加载到 Azure ML 工作区:无标头的通用 CSV、不带标头的 TSV。

    VW 选项要求存在标签,但它不用于评分,但比较除外。

  5. 添加导入 数据模块 ,并连接到" 为 Vowpal Wabbit 版本 8 评分"的右侧输入端口。 配置 "导入数据 "以访问输入数据。

    评分的输入数据必须已提前准备好,采用支持的格式之一并存储在 Azure Blob 存储中。

  6. 如果要将标签与分数一起输出,请选择选项“包括含标签的额外列”。

    通常,在处理文本数据时,Vowpal Wabbit 不需要标签,并且仅返回每行数据的分数。

  7. 如果要将原始分数和结果与一起输出,请选择选项“包括含原始分数的额外列”。

    提示

    此选项是 Vowpal Wabbit 版本 8 的新增功能。

  8. 如果希望在满足 以下条件的情况下重新使用上一次运行的结果,请选择"使用缓存的结果"选项:

    • 上一次运行中存在有效的缓存。

    • 自上一次运行以来,模块的输入数据和参数设置未更改。

    否则,每次运行试验时,将重复导入过程。

  9. 运行试验。

结果

在训练完成后:

输出会显示一个标准化为 0 到 1 范围内数字的预测分数。

示例

有关 Vowpal Wabbit 如何在机器学习中使用的示例,请参阅以下 Azure AI 库

以下视频提供了 Vowpal Wabbit 的训练和评分过程的演练:

https://azure.microsoft.com/documentation/videos/text-analytics-and-vowpal-wabbit-in-azure-ml-studio/

技术说明

本部分包含实现详情、使用技巧和常见问题解答。

参数

Vowpal Wabbit 具有许多用于选择和优化算法的命令行选项。 这里不对这些选项做全面介绍;建议查看 Vowpal Wabbit wiki 页面

机器学习 Studio 经典 (不支持以下) 。

上述参数以外的其他所有参数都可以使用。

预期输入

名称 类型 说明
已训练模型 ILearner 接口 训练的学习器
数据集 数据表 要评分的数据集

模块参数

名称 范围 类型 默认 说明
指定数据类型 VW

SVMLight
数据类型 VW 指示文件类型是 SVMLight 还是 Vowpal Wabbit
VW 参数 any String 键入 Vowpal Wabbit 参数。 请勿包含 -i 或 -p 或 -t
包含带有标签的附加列 True/False Boolean false 指定压缩文件是否应在预测中包含标签
包含包含原始分数的额外列 True/False Boolean false 指定结果是否应包括包含与 -- (对应的原始分数的其他raw_predictions)

Outputs

名称 类型 说明
结果数据集 数据表 包含预测结果的数据集

例外

异常 描述
错误 0001 如果找不到数据集的一个或多个指定列,将出现异常。
错误 0003 如果一个或多个输入为 NULL 或为空,将出现异常。
错误 0004 如果参数小于或等于特定值,将出现异常。
错误 0017 如果一个或多个指定列具有当前模块不支持的类型,则会发生异常。

有关特定于工作室和经典 (模块) 的列表,请参阅机器学习代码

有关 API 异常的列表,请参阅机器学习 REST API代码

另请参阅

文本分析
特征哈希
命名实体识别
对 Vowpal Wabbit 7-4 模型评分
训练 Vowpal Wabbit 7-4 模型
训练 Vowpal Wabbit 8 模型
A-Z 模块列表