個人化工具自動優化 (預覽)

重要

從 2023 年 9 月 20 日起,您將無法建立新的個人化工具資源。 個人化工具服務將于 2026 年 10 月 1 日淘汰。

簡介

個人化工具自動優化可自動搜尋改良的 Learning 設定,藉以將個人化工具迴圈保持在最佳機器學習效能,以節省手動工作。 個人化工具有嚴格的準則來套用新的學習設定以確保改善不太可能造成獎勵損失。

個人化工具自動優化處於公開預覽狀態,功能、方法和程式會根據使用者意見反應而變更。

使用自動優化時機

在大部分情況下,最佳選項是開啟自動優化。 新的個人化工具迴圈預設為 [ 自動優化 ]。

在下列情況下,自動優化可能有助於:

  • 您可以建置許多租使用者所使用的應用程式,且每個應用程式都會取得自己的個人化工具迴圈:例如,如果您裝載多個電子商務網站。 自動優化可讓您避免手動調整大量個人化工具迴圈的學習設定。
  • 您已部署個人化工具,並驗證其運作良好、獲得良好的獎勵,而且您已確定您的功能中沒有任何錯誤或問題。

注意

自動優化會定期覆寫個人化工具學習設定。 如果您的使用案例或產業需要模型和設定的稽核和封存,或如果您需要先前設定的備份,您可以使用個人化工具 API 來擷取 Learning 設定,或透過Azure 入口網站下載。

如何啟用和停用自動優化

若要啟用自動優化,請使用Azure 入口網站中 [模型和學習設定] 刀鋒視窗中的切換開關。

或者,您可以使用個人化工具 /configurations/service API 來啟用自動優化。

若要停用自動優化,請關閉切換開關。

自動優化報表

在 [模型與學習設定] 刀鋒視窗中,您可以看到自動優化執行的歷程記錄,以及每個執行動作的歷程記錄。

下表顯示:

  • 發生自動優化執行時,
  • 包含哪些資料視窗,
  • 線上、基準和最佳學習設定的獎勵效能為何,
  • 採取動作:如果學習設定已更新或未更新。

每個自動優化歷程記錄資料列中不同學習設定的獎勵效能會顯示在絕對數位中,並以相對於基準效能的百分比顯示。

範例 :如果您的基準平均獎勵估計為 0.20,且線上個人化工具行為達到 0.30,則會分別顯示為 100% 和 150%。 如果自動優化發現能夠達到 0.40 平均獎勵的學習設定,則會顯示為 200% (0.40 是 0.20%) 。 假設信賴邊界允許,則會套用新的設定,然後這些設定會驅動個人化工具作為線上設定,直到下一次執行為止。

最多保留 24 個先前自動優化執行的歷程記錄,以供分析使用。 您可以針對每個專案尋找有關這些離線評估與報表的更多詳細資料。 此外,報告包含此歷程記錄中的任何 Learning 設定,您可以找到並下載或套用。

運作方式

個人化工具會持續根據獎勵來定型其使用的 AI 模型。 此定型會遵循一些 Learning 設定 ,其中包含定型程式中所使用的超參數和其他值。 這些學習設定可以「微調」到您的特定個人化工具實例。

個人化工具也能夠執行 離線評估 。 離線評估會查看過去的資料,並可以產生個人化工具可能達到之不同演算法和模型的平均獎勵統計估計。 在此程式中,個人化工具也會搜尋更好的學習設定,並估計他們在過去一段時間內的績效(會獲得多少獎勵)。

自動優化頻率

自動優化會定期執行,並根據過去的資料執行自動優化

  • 如果您的應用程式在過去兩周內傳送至個人化工具超過 20 Mb 的資料,則會使用過去兩周的資料。
  • 如果您的應用程式傳送的資料量小於此數量,個人化工具會新增資料,直到有足夠的資料進行優化,或到達儲存的最早資料(最多資料保留天數)。

自動優化執行是由個人化工具服務決定的確切時間與天數,而且會隨著時間變動。

更新學習設定的準則

個人化工具會使用這些獎勵估計來決定是否變更其他人目前的 Learning 設定。 每個估計都是分佈曲線,上下 95% 信賴範圍。 個人化工具只有在下列條件時才套用新的 Learning 設定:

  • 他們在評估期間顯示較高的平均獎勵, AND
  • 其下限為 95% 信賴區間, 高於線上學習設定 95% 信賴區間的下限。 此準則可最大化獎勵改善,同時嘗試消除未來獎勵遺失的機率是由個人化工具管理,並從 Seldonian 演算法 和 AI 安全性的研究 中抽出。

自動優化的限制

個人化工具自動優化仰賴過去一段時間的評估,以估計未來效能。 由於世界上的外部因素、您的應用程式和使用者,這些過去期間個人化工具模型的相關估計和預測並不代表未來。

已啟用多重位置個人化 API 預覽功能的個人化工具迴圈無法使用自動優化預覽。

下一步