個人化工具的運作方式

發行項
01/19/2024

重要

從 2023 年 9 月 20 日起，您將無法建立新的個人化工具資源。個人化工具服務將于 2026 年 10 月 1 日淘汰。

個人化工具資源您的 學習迴圈 會使用機器學習來建置模型，以預測您內容的最高動作。此模型會以您傳送給 模型的資料，透過排名 和獎勵呼叫來專門定型。每個迴圈完全獨立。

排名和獎勵 API 會影響模型

您可以將具有功能和 內容功能的 動作傳送至排名 API。排名 API 決定使用下列其中一項：

惡意探索 ：根據過去資料決定最佳動作的目前模型。
探索：選取不同的動作，而不是頂端動作。您可以在 Azure 入口網站中為個人化工具資源設定此百分比。

您可以判斷獎勵分數，並將該分數傳送至 Reward API。獎勵 API：

藉由記錄每個排名呼叫的功能和獎勵分數，收集資料以定型模型。
使用該資料根據學習 原則中指定的 組態來更新模型。

您的系統呼叫個人化工具

下圖顯示呼叫排名和獎勵呼叫的架構流程：

alt text

您可以將具有功能和 內容功能的 動作傳送至排名 API。
- 個人化工具決定要利用目前的模型，還是探索模型的新選擇。
- 排名結果會傳送至 EventHub。
最高排名會以獎勵動作識別碼 的形式傳回您的系統 。您的系統會呈現該內容，並根據您自己的商務規則來決定獎勵分數。
您的系統會將獎勵分數傳回至學習迴圈。
- 當個人化工具收到獎勵時，獎勵會傳送至 EventHub。
- 排名與獎勵相互關聯。
- AI 模型會根據相互關聯結果進行更新。
- 推斷引擎會使用新模型進行更新。

個人化工具會重新定型您的模型

個人化工具會根據 Azure 入口網站中個人化工具資源上的模型頻率更新 設定，重新定型您的模型。

個人化工具會根據 個人化工具資源在Azure 入口網站中天數內的資料保留 設定，使用目前保留的所有資料。

個人化工具背後的研究

個人化工具是以增強式學習領域的尖端科學研究為基礎，包括論文、研究活動和 Microsoft Research 中正在進行的探索領域。

下一步

瞭解個人化工具的熱門案例