共用方式為


探索

重要

從 2023 年 9 月 20 日起,您將無法建立新的個人化工具資源。 個人化工具服務將於 2026 年 10 月 1 日淘汰。

透過探索,即便使用者行為變更,個人化工具還是能夠繼續提供良好的結果。

當個人化工具收到排序呼叫時,其傳回的 RewardActionID 可能是:

  • 使用已知相關性來根據目前的機器學習模型,以最可能的使用者行為做比對。
  • 使用「探索」,不以排名中機率最高的動作最比對。

個人化工具目前使用稱為 "epsilon greedy" 的演算法來進行探索。

選擇探索設定

在 Azure 入口網站的個人化工具 [設定] 頁面中,您可以設定要用於探索的流量百分比。 此設定會決定執行探索的排名呼叫百分比。

個人化工具會判斷是否要在每個排名呼叫上探索或使用模型的最可能動作。 這有別於某些 A/B 架構中的行為,也就是鎖定特定使用者識別碼上的處理方式。

選擇探索設定的最佳做法

選擇探索設定是一項業務決策,用來決定要探索多少比例的使用者互動,才能改善模型。

若設定為零,則會否定許多個人化工具的優點。 透過此設定,個人化工具不會使用使用者互動來探索更好的使用者互動。 這會導致模型停滯、漂移,並在最終造成較低的效能。

設定過高的值會不利於使用者行為的學習。 將其設定為 100% 表示不斷隨機選取,而任何從使用者身上學到的行為皆不會影響結果。

無論您是否看到個人化工具正在探索或使用學到的最佳動作,請絕對不要隨之變更應用程式行為。 這會導致學習偏差,最終將會降低潛在效能。

下一步

增強式學習