探索

重要

從 2023 年 9 月 20 日起,您將無法建立新的個人化工具資源。 個人化工具服務將于 2026 年 10 月 1 日淘汰。

透過探索,個人化工具能夠持續提供良好的結果,即使使用者行為變更也一樣。

當個人化工具收到排名呼叫時,它會傳回下列其中一項的 RewardActionID:

  • 使用已知的相關性,根據目前的機器學習模型來比對最可能的使用者行為。
  • 使用探索,這與排名中機率最高的動作不符。

個人化工具目前使用稱為 epsilon 貪婪 的演算法來探索。

選擇探索設定

您可以在個人化工具Azure 入口網站的 [組態 ] 頁面中,設定要用於探索的流量百分比。 此設定會決定執行探索的 Rank 呼叫百分比。

個人化工具會決定要探索或使用模型在每個排名呼叫上最有可能的動作。 這與某些 A/B 架構中鎖定特定使用者識別碼之處理的行為不同。

選擇探索設定的最佳做法

選擇探索設定是一項商務決策,說明要與使用者互動的流覽比例,以改善模型。

零的設定會否定個人化工具的許多優點。 使用此設定時,個人化工具不會使用任何使用者互動來探索更好的使用者互動。 這會導致模型停滯、漂移,最終降低效能。

過高的設定會否定從使用者行為學習的優點。 將它設定為 100% 表示常數隨機化,且使用者學習到的任何行為都不會影響結果。

請務必不要根據您是否看到個人化工具正在探索或使用學習到的最佳動作來變更應用程式行為。 這會導致學習偏差最終會降低潛在效能。

下一步

增強式學習