分享方式:


個人化工具的運作方式

重要

從 2023 年 9 月 20 日起,您將無法建立新的個人化工具資源。 個人化工具服務將於 2026 年 10 月 1 日淘汰。

個人化工具資源 (您的「學習迴圈」) 會使用機器學習來建置模型,以預測內容的最佳動作。 模型會根據您使用 [排名] 和 [獎勵] 呼叫為其傳送的資料,以獨佔方式加以定型。 每個迴圈彼此完全無關。

排名和獎勵 API 會影響模型

您會將「具有特徵和內容特徵的動作」傳送給排名 API。 排名 API 會決定使用:

  • 「利用」:目前的模型,其會根據過去的資料來決定最佳動作。
  • 「探索」:選取不同的動作,而非最佳動作。 您可以在 Azure 入口網站中,為個人化工具資源設定此百分比

您可以決定獎勵分數,並將該分數傳送給獎勵 API。 報酬 API:

  • 會收集資料,藉由記錄每個排名呼叫的特性和報酬分數來將模型定型。
  • 使用該資料,根據「學習原則」中指定的設定來更新模型。

您的系統會呼叫個人化工具

下圖顯示排名和報酬呼叫的呼叫架構流程:

替代文字

  1. 您會將「具有特徵和內容特徵的動作」傳送給排名 API。

    • 個人化工具會決定要利用目前的模型,還是探索新的模型選項。
    • 排名結果傳送至事件中樞。
  2. 最高排名會傳回給您的系統,以作為「獎勵動作識別碼」。 您的系統會呈現該內容,並根據您自己的商務規則來決定獎勵分數。

  3. 您的系統會將獎勵分數傳回給學習迴圈。

    • 當個人化工具收到報酬時,報酬會傳送至事件中樞。
    • 排名與獎勵相互關聯。
    • AI 模型會根據相互關聯結果進行更新。
    • 推斷引擎會使用新模型進行更新。

個人化工具會將您的模型重新定型

個人化工具會根據您在 Azure 入口網站中,個人化工具資源上的模型頻率更新設定,來將模型重新定型。

個人化工具會根據您在 Azure 入口網站中,個人化工具資源上的資料保留期設定 (天數),使用目前保留的所有資料。

個人化工具背後的研究

個人化工具的依據是增強式學習領域的尖端科學和研究,包括論文、研究活動和 Microsoft Research 中正在進行的探索領域。

下一步

了解個人化工具的熱門案例