個人化工具的運作方式

重要

從 2023 年 9 月 20 日起,您將無法建立新的個人化工具資源。 個人化工具服務將于 2026 年 10 月 1 日淘汰。

個人化工具資源您的 學習迴圈 會使用機器學習來建置模型,以預測您內容的最高動作。 此模型會以您傳送給 模型的資料,透過排名 獎勵 呼叫來專門定型。 每個迴圈完全獨立。

排名和獎勵 API 會影響模型

您可以將具有功能和 內容功能的 動作傳送 至排名 API。 排名 API 決定使用下列其中一項:

您可以判斷獎勵分數,並將該分數傳送至 Reward API。 獎勵 API:

  • 藉由記錄每個排名呼叫的功能和獎勵分數,收集資料以定型模型。
  • 使用該資料根據學習 原則中指定的 組態來更新模型。

您的系統呼叫個人化工具

下圖顯示呼叫排名和獎勵呼叫的架構流程:

alt text

  1. 您可以將具有功能和 內容功能的 動作傳送 至排名 API。

    • 個人化工具決定要利用目前的模型,還是探索模型的新選擇。
    • 排名結果會傳送至 EventHub。
  2. 最高排名會以獎勵動作識別碼 的形式傳回您的系統 。 您的系統會呈現該內容,並根據您自己的商務規則來決定獎勵分數。

  3. 您的系統會將獎勵分數傳回至學習迴圈。

    • 當個人化工具收到獎勵時,獎勵會傳送至 EventHub。
    • 排名與獎勵相互關聯。
    • AI 模型會根據相互關聯結果進行更新。
    • 推斷引擎會使用新模型進行更新。

個人化工具會重新定型您的模型

個人化工具會根據 Azure 入口網站中個人化工具資源上的模型頻率更新 設定,重新定型您的模型。

個人化工具會根據 個人化工具資源在Azure 入口網站中天數內的資料保留 設定,使用目前保留的所有資料。

個人化工具背後的研究

個人化工具是以增強式學習 領域的 尖端科學研究為基礎,包括論文、研究活動和 Microsoft Research 中正在進行的探索領域。

下一步

瞭解 個人化工具的熱門案例