Konfigurace chování učení personalizace

Důležité

Od 20. září 2023 nebudete moct vytvářet nové prostředky personalizace. Služba Personalizace se vyřadí z provozu 1. října 2026.

Apprentice mode vám dává důvěru a důvěru ve službě Personalizace a jeho schopnostech strojového učení a poskytuje záruku, že služba je odesílána informace, ze které se dají získat – bez rizika online provozu.

Konfigurace režimu Výuka

  1. Přihlaste se k webu Azure Portal pro prostředek Personalizace.

  2. Na stránce Nastavení na kartě Nastavení modelu vyberte RežimRentice a pak vyberte Uložit.

Screenshot of configuring apprentice mode learning behavior in Azure portal

Změny existující aplikace

Vaše stávající aplikace by neměla měnit způsob, jakým aktuálně vybírá akce, které se mají zobrazit nebo jak aplikace určuje hodnotu, odměnu této akce. Jedinou změnou aplikace může být pořadí akcí odesílaných do rozhraní API personalizace pořadí. Akce, která se aktuálně zobrazuje, se odešle jako první akce v seznamu akcí. Rozhraní Rank API používá tuto první akci k trénování modelu Personalizace.

Konfigurace aplikace pro volání rozhraní Rank API

Pokud chcete do aplikace přidat personalizaci, musíte volat rozhraní API pro pořadí a odměnu.

  1. Přidejte volání rozhraní Rank API za bod v existující logice aplikace, kde určíte seznam akcí a jejich funkcí. První akcí v seznamu akcí musí být akce vybraná vaší stávající logikou.

  2. Nakonfigurujte kód tak, aby zobrazil akci přidruženou k ID akce odměny rozhraní API pro hodnocení.

Konfigurace aplikace pro volání rozhraní Rewards API

Poznámka:

Volání rozhraní API pro odměny nemají vliv na trénování v režimu Výuka. Služba se učí tím, že odpovídá aktuální logice vaší aplikace nebo výchozím akcím. Implementace volání odměn v této fázi ale pomáhá zajistit hladký přechod do online režimu později pomocí jednoduchého přepínače na webu Azure Portal. Kromě toho se odměny zaprotokolují a umožní vám analyzovat, jak dobře aktuální logika funguje a kolik odměn se dostává.

  1. Použijte existující obchodní logiku k výpočtu odměny zobrazené akce. Hodnota musí být v rozsahu od 0 do 1. Pošlete tuto odměnu personalizaci pomocí rozhraní API odměny. Hodnota odměny se neočekává okamžitě a může být zpožděna v průběhu časového období – v závislosti na obchodní logice.

  2. Pokud odměnu nevrátíte v rámci nakonfigurované doby čekání na odměnu, výchozí odměna se místo toho zaprotokoluje.

Vyhodnocení režimu vyučujícího

Na webu Azure Portal na stránce Monitorování vašeho prostředku Personalizace zkontrolujte odpovídající výkon.

Screenshot of reviewing evaluation of apprentice mode learning behavior in Azure portal

Režim učňů poskytuje následující metriky vyhodnocení:

  • Směrný plán – průměrná odměna: Průměrné odměny výchozího nastavení aplikace (směrný plán).
  • Personalizace – průměrná odměna: Průměr celkové odměny Personalizace odměn by potenciálně dosáhl.
  • Poměr dosažených odměn za posledních 1 000 událostí: Poměr odměny podle směrného plánu a personalizace – normalizován v posledních 1 000 událostech.

Přepnutí chování do režimu Online

Když zjistíte, že personalizace se vytrénuje průměrem 75–85 % klouzavého průměru, model je připravený přepnout do režimu Online.

Na webu Azure Portal pro prostředek Personalizace vyberte na stránce Nastavení na kartě Nastavení modelu možnost *Online režim a pak vyberte Uložit.

Nemusíte provádět žádné změny volání rozhraní Rank and Rewards API.

Další kroky