你当前正在访问 Microsoft Azure Global Edition 技术文档网站。 如果需要访问由世纪互联运营的 Microsoft Azure 中国技术文档网站,请访问 https://docs.azure.cn

配置个性化体验创建服务学习循环

重要

从 2023 年 9 月 20 日开始,将无法创建新的个性化体验创建服务资源。 个性化体验创建服务将于 2026 年 10 月 1 日停用。

服务配置包括服务处理奖励的方式、服务的探索频率、重新训练模型的频率,以及存储的数据量。

在 Azure 门户中的“配置”页上为个性化体验创建服务配置学习循环。

计划配置更改

由于某些配置更改会重置模型,因此应计划配置更改。

如果计划使用模式,请确保在切换到学徒模式之前查看个性化体验创建服务配置。

包括重置模型的设置

以下操作会使用最多过去 2 天可用的数据触发模型的重新训练。

  • 回报
  • 浏览

若要清除所有数据,请使用“模型和学习设置”页。

为反馈循环配置奖励

为学习循环使用奖励配置服务。 更改以下值会重置当前个性化体验创建服务模型,并使用过去 2 天的数据重新训练模型。

Configure the reward values for the feedback loop

目的
奖励等待时间 设置个性化体验创建服务收集排名调用奖励值的时间长短,从发生排名调用的那一刻开始算起。 此值是通过提出以下问题设置的:“个性化体验创建服务要等待奖励调用多长时间?”在此时间范围后抵达的任何奖励将被记录,但不用于学习。
默认奖励 如果个性化体验创建服务在“奖励等待时间”范围内未收到与排名调用关联的奖励调用,则个性化体验创建服务会分配默认奖励。 默认情况下(并且是大多数情况下),默认奖励为零 (0)。
奖励聚合 如果收到了同一排名 API 调用的多个奖励,则会使用此聚合方法:sumearliest。 Earliest 拾取收到的最早评分,丢弃剩余的评分。 如果希望在可能重复的调用之间保持唯一的奖励,则此方法很有用。

更改这些值后,请务必选择“保存”。

配置探索以允许学习循环适应

个性化功能可以发现新的模式,并通过探索备选项(而不是使用已训练的模型的预测)来不断适应用户的行为变化。 探索值确定要使用探索应答的排名调用百分比。

更改此值会重置当前个性化体验创建服务模型,并使用过去 2 天的数据重新训练模型。

The exploration value determines what percentage of Rank calls are answered with exploration

更改此值后,请务必选择“保存”。

配置模型训练的模型更新频率

模型更新频率用于设置训练模型的频率。

频率设置 用途
1 分钟 在使用个性化体验创建服务调试应用程序代码、进行演示或以交互方式测试机器学习方面时,一分钟的更新频率非常有用。
15 分钟 如果你希望密切跟踪用户行为变化,则高模型更新频率非常有用。 例如,涉及实时新闻、病毒内容或实时产品投标的站点。 在这些情况下,可以使用 15 分钟的频率。
1 小时 对于大多数用例,更低的更新频率是有效的。

Model update frequency sets how often a new Personalizer model is retrained.

更改此值后,请务必选择“保存”。

数据保留

“数据保留期”设置个性化体验创建服务要将数据日志保留多少天。 需要使用以往的数据日志来执行脱机评估。这些评估可以衡量个性化体验创建服务的有效性以及优化学习策略。

更改此值后,请务必选择“保存”。

后续步骤

了解如何管理模型