Konfigurace výukové smyčky personalizace
Důležité
Od 20. září 2023 nebudete moct vytvářet nové prostředky personalizace. Služba Personalizace se vyřadí z provozu 1. října 2026.
Konfigurace služby zahrnuje způsob, jakým služba zachází s odměnami, jak často služba zkoumá, jak často se model přetrénuje a kolik dat se ukládá.
Nakonfigurujte smyčku učení na stránce Konfigurace na webu Azure Portal pro daný prostředek Personalizace.
Plánování změn konfigurace
Vzhledem k tomu, že některé změny konfigurace resetuje model, měli byste naplánovat změny konfigurace.
Pokud máte v plánu používat režim Apprentice, nezapomeňte před přepnutím do režimu Apprentice zkontrolovat konfiguraci personalizace.
Nastavení, která zahrnují resetování modelu
Následující akce aktivují opětovné trénování modelu pomocí dat dostupných až do posledních 2 dnů.
- Odměna
- Průzkum
Pokud chcete vymazat všechna data, použijte stránku Nastavení modelu a učení.
Konfigurace odměn pro smyčku zpětné vazby
Nakonfigurujte službu pro používání programu Rewards ve vaší výukové smyčce. Změny následujících hodnot resetují aktuální model Personalizace a znovu ho natrénují s daty za posledních 2 dny.
Hodnota | Účel |
---|---|
Doba čekání na odměnu | Nastaví dobu, během které personalizace bude shromažďovat hodnoty odměny pro volání pořadí, počínaje okamžikem, kdy dojde k volání pořadí. Tato hodnota je nastavena dotazem: "How long should Personalr wait for rewards calls?" (Jak dlouho má personalizace čekat na hovory v programu Rewards? Všechny odměny přicházející po tomto okně se zaprotokolují, ale nebudou použity pro výuku. |
Výchozí odměna | Pokud personalizace neobdrží žádný bonusový hovor během okna doba čekání na odměnu přidruženou k volání pořadí, personalizace přiřadí výchozí odměnu. Ve většině scénářů je výchozí odměna nula (0). |
Agregace odměn | Pokud se pro stejné volání rozhraní API pořadí přijme více odměn, použije se tato metoda agregace: součet nebo nejstarší. Nejstarší vybere nejstarší přijaté skóre a zahodí zbytek. To je užitečné, pokud chcete jedinečnou odměnu mezi potenciálně duplicitními hovory. |
Po změně těchto hodnot nezapomeňte vybrat Uložit.
Konfigurace zkoumání umožňující přizpůsobení smyčky učení
Přizpůsobení je schopno zjistit nové vzory a přizpůsobit se změnám chování uživatelů v průběhu času prozkoumáním alternativ namísto použití predikce vytrénovaného modelu. Hodnota Zkoumání určuje, jaké procento volání pořadí odpovídá průzkum.
Změny této hodnoty resetují aktuální model Personalizace a přetrénují ho s daty za posledních 2 dny.
Po změně této hodnoty nezapomeňte vybrat Uložit.
Konfigurace frekvence aktualizace modelu pro trénování modelu
Frekvence aktualizace modelu nastavuje, jak často se model trénuje.
Nastavení frekvence | Účel |
---|---|
1 min. | Frekvence aktualizace na jednu minutu jsou užitečné při ladění kódu aplikace pomocí personalizace, provádění ukázek nebo interaktivního testování aspektů strojového učení. |
15 minut | Frekvence aktualizací vysokého modelu jsou užitečné v situacích, kdy chcete pečlivě sledovat změny chování uživatelů. Mezi příklady patří weby, které běží na živých zprávách, virálním obsahu nebo nabízení živých produktů. V těchto scénářích můžete použít 15minutovou frekvenci. |
1 hodina | U většiny případů použití je efektivní nižší frekvence aktualizací. |
Po změně této hodnoty nezapomeňte vybrat Uložit.
Uchovávání dat
Doba uchovávání dat určuje, kolik dní personalizace uchovává protokoly dat. K provádění offline vyhodnocení se vyžadují předchozí datové protokoly, které slouží k měření efektivity personalizace a optimalizace zásad výuky.
Po změně této hodnoty nezapomeňte vybrat Uložit.