你当前正在访问 Microsoft Azure Global Edition 技术文档网站。如果需要访问由世纪互联运营的 Microsoft Azure 中国技术文档网站，请访问 https://docs.azure.cn。

配置个性化体验创建服务学习循环

重要

从 2023 年 9 月 20 日开始，将无法创建新的个性化体验创建服务资源。个性化体验创建服务将于 2026 年 10 月 1 日停用。

服务配置包括服务处理奖励的方式、服务的探索频率、重新训练模型的频率，以及存储的数据量。

在 Azure 门户中的“配置”页上为个性化体验创建服务配置学习循环。

计划配置更改

由于某些配置更改会重置模型，因此应计划配置更改。

如果计划使用模式，请确保在切换到学徒模式之前查看个性化体验创建服务配置。

以下操作会使用最多过去 2 天可用的数据触发模型的重新训练。

若要清除所有数据，请使用“模型和学习设置”页。

为学习循环使用奖励配置服务。更改以下值会重置当前个性化体验创建服务模型，并使用过去 2 天的数据重新训练模型。

Configure the reward values for the feedback loop

值	目的
奖励等待时间	设置个性化体验创建服务收集排名调用奖励值的时间长短，从发生排名调用的那一刻开始算起。此值是通过提出以下问题设置的：“个性化体验创建服务要等待奖励调用多长时间？”在此时间范围后抵达的任何奖励将被记录，但不用于学习。
默认奖励	如果个性化体验创建服务在“奖励等待时间”范围内未收到与排名调用关联的奖励调用，则个性化体验创建服务会分配默认奖励。默认情况下（并且是大多数情况下），默认奖励为零 (0)。
奖励聚合	如果收到了同一排名 API 调用的多个奖励，则会使用此聚合方法：sum 或 earliest。 Earliest 拾取收到的最早评分，丢弃剩余的评分。如果希望在可能重复的调用之间保持唯一的奖励，则此方法很有用。

更改这些值后，请务必选择“保存”。

个性化功能可以发现新的模式，并通过探索备选项（而不是使用已训练的模型的预测）来不断适应用户的行为变化。探索值确定要使用探索应答的排名调用百分比。

更改此值会重置当前个性化体验创建服务模型，并使用过去 2 天的数据重新训练模型。

The exploration value determines what percentage of Rank calls are answered with exploration

更改此值后，请务必选择“保存”。

模型更新频率用于设置训练模型的频率。

频率设置	用途
1 分钟	在使用个性化体验创建服务调试应用程序代码、进行演示或以交互方式测试机器学习方面时，一分钟的更新频率非常有用。
15 分钟	如果你希望密切跟踪用户行为变化，则高模型更新频率非常有用。例如，涉及实时新闻、病毒内容或实时产品投标的站点。在这些情况下，可以使用 15 分钟的频率。
1 小时	对于大多数用例，更低的更新频率是有效的。

Model update frequency sets how often a new Personalizer model is retrained.

更改此值后，请务必选择“保存”。

“数据保留期”设置个性化体验创建服务要将数据日志保留多少天。需要使用以往的数据日志来执行脱机评估。这些评估可以衡量个性化体验创建服务的有效性以及优化学习策略。

更改此值后，请务必选择“保存”。