为 Vowpal Wabbit 版本 8 模型评分
重要
对机器学习工作室(经典)的支持将于 2024 年 8 月 31 日结束。 建议在该日期之前转换到 Azure 机器学习。
从 2021 年 12 月 1 日开始,你将无法创建新的机器学习工作室(经典)资源。 在 2024 年 8 月 31 日之前,可继续使用现有的机器学习工作室(经典)资源。
ML 工作室(经典)文档即将停用,将来可能不会更新。
从命令行界面使用 Vowpal Wabbit 机器学习系统为数据评分
类别:文本分析
模块概述
本文介绍如何使用 机器学习 Studio (经典) 中的"评分 Vowpal Wabbit 版本 8 模型"模块,使用现有的已训练 Vowpal Wabbit 模型为一组输入数据生成分数。
本模块提供最新版本的 Vowpal Wabbit 框架版本 8。 使用此模块,借助以 VW 版本 8 格式保存的经过训练的模型对数据进行评分。
如果已有使用早期版本创建的现有模型,请使用以下模块:
如何配置 Vowpal Wabbit 模型 8 评分
将" 评分 Vowpal Wabbit 版本 8 模型" 模块添加到试验。
添加经过训练的 Vowpal Wabbit 模型,并将其连接到左侧输入端口。 可以使用在同一试验中创建的已训练模型,或在工作室的"已训练模型"组中查找已保存的模型 (经典) 左侧导航窗格中。 但是,该模型必须在 机器学习 Studio (经典) 中提供;不能直接从 Azure 存储加载模型。
注意
仅支持 Vowpal Wabbit 8 模型;无法连接使用其他算法训练的已保存模型,并且不能使用使用早期版本训练的模型。
在 VW 参数文本框中,键入一组有效的 Vowpal Wabbit 可执行文件命令行参数。
有关这些参数中支持和不支持的 Vowpal Wabbit 参数机器学习请参阅技术说明部分。
单击 "指定数据类型",然后从列表中选择受支持的数据类型之一。
评分需要一列与 VW 兼容的数据。
如果有以 SVMLight 或 VW 格式创建的现有文件,可以将它作为以下格式之一的新数据集加载到 Azure ML 工作区:无标头的通用 CSV、不带标头的 TSV。
VW 选项要求存在标签,但它不用于评分,但比较除外。
添加导入 数据模块 ,并连接到" 为 Vowpal Wabbit 版本 8 评分"的右侧输入端口。 配置 "导入数据 "以访问输入数据。
评分的输入数据必须已提前准备好,采用支持的格式之一并存储在 Azure Blob 存储中。
如果要将标签与分数一起输出,请选择选项“包括含标签的额外列”。
通常,在处理文本数据时,Vowpal Wabbit 不需要标签,并且仅返回每行数据的分数。
如果要将原始分数和结果与一起输出,请选择选项“包括含原始分数的额外列”。
提示
此选项是 Vowpal Wabbit 版本 8 的新增功能。
如果希望在满足 以下条件的情况下重新使用上一次运行的结果,请选择"使用缓存的结果"选项:
上一次运行中存在有效的缓存。
自上一次运行以来,模块的输入数据和参数设置未更改。
否则,每次运行试验时,将重复导入过程。
运行试验。
结果
在训练完成后:
- 若要直观显示结果,请右键单击 "为 Vowpal Wabbit 版本 8 模型评分"模块 的输出。
输出会显示一个标准化为 0 到 1 范围内数字的预测分数。
示例
有关 Vowpal Wabbit 如何在机器学习中使用的示例,请参阅以下 Azure AI 库:
-
此实验演示了 VW 模型的数据准备、训练和操作化。
以下视频提供了 Vowpal Wabbit 的训练和评分过程的演练:
技术说明
本部分包含实现详情、使用技巧和常见问题解答。
参数
Vowpal Wabbit 具有许多用于选择和优化算法的命令行选项。 这里不对这些选项做全面介绍;建议查看 Vowpal Wabbit wiki 页面。
机器学习 Studio 经典 (不支持以下) 。
https://github.com/JohnLangford/vowpal_wabbit/wiki/Command-line-arguments 中指定的输入/输出选项
模块已自动配置这些属性。
此外,不允许任何生成多个输出或接受多个输入的选项。 其中包括
--cbt
、--lda
和--wap
。仅支持监督式学习算法。 无法使用这些选项:
–active
、--rank
、--search
等。
上述参数以外的其他所有参数都可以使用。
预期输入
名称 | 类型 | 说明 |
---|---|---|
已训练模型 | ILearner 接口 | 训练的学习器 |
数据集 | 数据表 | 要评分的数据集 |
模块参数
名称 | 范围 | 类型 | 默认 | 说明 |
---|---|---|---|---|
指定数据类型 | VW SVMLight |
数据类型 | VW | 指示文件类型是 SVMLight 还是 Vowpal Wabbit |
VW 参数 | any | String | 无 | 键入 Vowpal Wabbit 参数。 请勿包含 -i 或 -p 或 -t |
包含带有标签的附加列 | True/False | Boolean | false | 指定压缩文件是否应在预测中包含标签 |
包含包含原始分数的额外列 | True/False | Boolean | false | 指定结果是否应包括包含与 -- (对应的原始分数的其他raw_predictions) |
Outputs
名称 | 类型 | 说明 |
---|---|---|
结果数据集 | 数据表 | 包含预测结果的数据集 |
例外
异常 | 描述 |
---|---|
错误 0001 | 如果找不到数据集的一个或多个指定列,将出现异常。 |
错误 0003 | 如果一个或多个输入为 NULL 或为空,将出现异常。 |
错误 0004 | 如果参数小于或等于特定值,将出现异常。 |
错误 0017 | 如果一个或多个指定列具有当前模块不支持的类型,则会发生异常。 |
有关特定于工作室和经典 (模块) 的列表,请参阅机器学习代码。
有关 API 异常的列表,请参阅机器学习 REST API代码。
另请参阅
文本分析
特征哈希
命名实体识别
对 Vowpal Wabbit 7-4 模型评分
训练 Vowpal Wabbit 7-4 模型
训练 Vowpal Wabbit 8 模型
A-Z 模块列表