個人化工具的運作方式

文章
09/04/2024

重要

從 2023 年 9 月 20 日起，您將無法建立新的個人化工具資源。個人化工具服務將於 2026 年 10 月 1 日淘汰。

個人化工具資源 (您的「學習迴圈」) 會使用機器學習來建置模型，以預測內容的最佳動作。模型會根據您使用 [排名] 和 [獎勵] 呼叫為其傳送的資料，以獨佔方式加以定型。每個迴圈彼此完全無關。

排名和獎勵 API 會影響模型

您會將「具有特徵和內容特徵的動作」傳送給排名 API。排名 API 會決定使用：

「利用」：目前的模型，其會根據過去的資料來決定最佳動作。
「探索」：選取不同的動作，而非最佳動作。您可以在 Azure 入口網站中，為個人化工具資源設定此百分比。

您可以決定獎勵分數，並將該分數傳送給獎勵 API。報酬 API：

會收集資料，藉由記錄每個排名呼叫的特性和報酬分數來將模型定型。
使用該資料，根據「學習原則」中指定的設定來更新模型。

您的系統會呼叫個人化工具

下圖顯示排名和報酬呼叫的呼叫架構流程：

替代文字

您會將「具有特徵和內容特徵的動作」傳送給排名 API。
- 個人化工具會決定要利用目前的模型，還是探索新的模型選項。
- 排名結果傳送至事件中樞。
最高排名會傳回給您的系統，以作為「獎勵動作識別碼」。您的系統會呈現該內容，並根據您自己的商務規則來決定獎勵分數。
您的系統會將獎勵分數傳回給學習迴圈。
- 當個人化工具收到報酬時，報酬會傳送至事件中樞。
- 排名與獎勵相互關聯。
- AI 模型會根據相互關聯結果進行更新。
- 推斷引擎會使用新模型進行更新。

個人化工具會將您的模型重新定型

個人化工具會根據您在 Azure 入口網站中，個人化工具資源上的模型頻率更新設定，來將模型重新定型。

個人化工具會根據您在 Azure 入口網站中，個人化工具資源上的資料保留期設定 (天數)，使用目前保留的所有資料。

個人化工具背後的研究

個人化工具的依據是增強式學習領域的尖端科學和研究，包括論文、研究活動和 Microsoft Research 中正在進行的探索領域。

下一步

了解個人化工具的熱門案例