個人化工具的運作方式
重要
從 2023 年 9 月 20 日起,您將無法建立新的個人化工具資源。 個人化工具服務將于 2026 年 10 月 1 日淘汰。
個人化工具資源您的 學習迴圈 會使用機器學習來建置模型,以預測您內容的最高動作。 此模型會以您傳送給 模型的資料,透過排名 和 獎勵 呼叫來專門定型。 每個迴圈完全獨立。
排名和獎勵 API 會影響模型
您可以將具有功能和 內容功能的 動作傳送 至排名 API。 排名 API 決定使用下列其中一項:
- 惡意探索 :根據過去資料決定最佳動作的目前模型。
- 探索 :選取不同的動作,而不是頂端動作。 您可以在 Azure 入口網站中為個人化工具資源設定此百分比 。
您可以判斷獎勵分數,並將該分數傳送至 Reward API。 獎勵 API:
- 藉由記錄每個排名呼叫的功能和獎勵分數,收集資料以定型模型。
- 使用該資料根據學習 原則中指定的 組態來更新模型。
您的系統呼叫個人化工具
下圖顯示呼叫排名和獎勵呼叫的架構流程:
您可以將具有功能和 內容功能的 動作傳送 至排名 API。
- 個人化工具決定要利用目前的模型,還是探索模型的新選擇。
- 排名結果會傳送至 EventHub。
最高排名會以獎勵動作識別碼 的形式傳回您的系統 。 您的系統會呈現該內容,並根據您自己的商務規則來決定獎勵分數。
您的系統會將獎勵分數傳回至學習迴圈。
- 當個人化工具收到獎勵時,獎勵會傳送至 EventHub。
- 排名與獎勵相互關聯。
- AI 模型會根據相互關聯結果進行更新。
- 推斷引擎會使用新模型進行更新。
個人化工具會重新定型您的模型
個人化工具會根據 Azure 入口網站中個人化工具資源上的模型頻率更新 設定,重新定型您的模型。
個人化工具會根據 個人化工具資源在Azure 入口網站中天數內的資料保留 設定,使用目前保留的所有資料。
個人化工具背後的研究
個人化工具是以增強式學習 領域的 尖端科學研究為基礎,包括論文、研究活動和 Microsoft Research 中正在進行的探索領域。
下一步
瞭解 個人化工具的熱門案例