Konfigurace výukové smyčky personalizace

Důležité

Od 20. září 2023 nebudete moct vytvářet nové prostředky personalizace. Služba Personalizace se vyřadí z provozu 1. října 2026.

Konfigurace služby zahrnuje způsob, jakým služba zachází s odměnami, jak často služba zkoumá, jak často se model přetrénuje a kolik dat se ukládá.

Nakonfigurujte smyčku učení na stránce Konfigurace na webu Azure Portal pro daný prostředek Personalizace.

Plánování změn konfigurace

Vzhledem k tomu, že některé změny konfigurace resetuje model, měli byste naplánovat změny konfigurace.

Pokud máte v plánu používat režim Apprentice, nezapomeňte před přepnutím do režimu Apprentice zkontrolovat konfiguraci personalizace.

Nastavení, které zahrnují resetování modelu

Následující akce aktivují opětovné trénování modelu pomocí dat dostupných až do posledních 2 dnů.

  • Odměna
  • Průzkum

Pokud chcete vymazat všechna data, použijte stránku Nastavení modelu a učení.

Konfigurace odměn pro smyčku zpětné vazby

Nakonfigurujte službu pro používání programu Rewards ve vaší výukové smyčce. Změny následujících hodnot resetují aktuální model Personalizace a znovu ho natrénují s daty za posledních 2 dny.

Configure the reward values for the feedback loop

Hodnota Účel
Doba čekání na odměnu Nastaví dobu, během které personalizace bude shromažďovat hodnoty odměny pro volání pořadí, počínaje okamžikem, kdy dojde k volání pořadí. Tato hodnota je nastavena dotazem: "How long should Personalr wait for rewards calls?" (Jak dlouho má personalizace čekat na hovory v programu Rewards? Všechny odměny přicházející po tomto okně se zaprotokolují, ale nebudou použity pro výuku.
Výchozí odměna Pokud personalizace neobdrží žádný bonusový hovor během okna doba čekání na odměnu přidruženou k volání pořadí, personalizace přiřadí výchozí odměnu. Ve většině scénářů je výchozí odměna nula (0).
Agregace odměn Pokud se pro stejné volání rozhraní API pořadí přijme více odměn, použije se tato metoda agregace: součet nebo nejstarší. Nejstarší vybere nejstarší přijaté skóre a zahodí zbytek. To je užitečné, pokud chcete jedinečnou odměnu mezi potenciálně duplicitními hovory.

Po změně těchto hodnot nezapomeňte vybrat Uložit.

Konfigurace zkoumání umožňující přizpůsobení smyčky učení

Přizpůsobení je schopno zjistit nové vzory a přizpůsobit se změnám chování uživatelů v průběhu času prozkoumáním alternativ namísto použití predikce vytrénovaného modelu. Hodnota Zkoumání určuje, jaké procento volání pořadí odpovídá průzkum.

Změny této hodnoty resetují aktuální model Personalizace a přetrénují ho s daty za posledních 2 dny.

The exploration value determines what percentage of Rank calls are answered with exploration

Po změně této hodnoty nezapomeňte vybrat Uložit.

Konfigurace frekvence aktualizace modelu pro trénování modelu

Frekvence aktualizace modelu nastavuje, jak často se model trénuje.

Nastavení frekvence Účel
1 minuta Frekvence aktualizace na jednu minutu jsou užitečné při ladění kódu aplikace pomocí personalizace, provádění ukázek nebo interaktivního testování aspektů strojového učení.
15 minut Frekvence aktualizací vysokého modelu jsou užitečné v situacích, kdy chcete pečlivě sledovat změny chování uživatelů. Mezi příklady patří weby, které běží na živých zprávách, virálním obsahu nebo nabízení živých produktů. V těchto scénářích můžete použít 15minutovou frekvenci.
1 hod U většiny případů použití je efektivní nižší frekvence aktualizací.

Model update frequency sets how often a new Personalizer model is retrained.

Po změně této hodnoty nezapomeňte vybrat Uložit.

Uchovávání dat

Doba uchovávání dat určuje, kolik dní personalizace uchovává protokoly dat. K provádění offline vyhodnocení se vyžadují protokoly minulých dat, které slouží k měření efektivity personalizace a optimalizace Učení zásad.

Po změně této hodnoty nezapomeňte vybrat Uložit.

Další kroky

Informace o správě modelu