Co je služba Personalizace?

Článek
09/02/2024

Důležité

Od 20. září 2023 nebudete moct vytvářet nové prostředky personalizace. Služba Personalizace se vyřadí z provozu 1. října 2026.

Azure AI Personalizace je služba AI, kterou vaše aplikace přizpůsobily chytřejším rozhodováním ve velkém s využitím učení o posílení. Personalizace zpracovává informace o stavu aplikace, scénáře a/nebo uživatelů (kontexty) a sadě možných rozhodnutí a souvisejících atributů (akcí) k určení nejlepšího rozhodnutí. Zpětná vazba z vaší aplikace (odměny) je odeslána službě Personalizace, aby se dozvěděla, jak zlepšit svou rozhodovací schopnost téměř v reálném čase.

Personalizace může určit nejlepší akce, které se mají provést v různých scénářích:

Elektronické obchodování: Jaký produkt by se měl zákazníkům ukázat, aby se maximalizovala pravděpodobnost nákupu?
Doporučení k obsahu: Jaký článek by se měl zobrazit, aby se zvýšila míra prokliku?
Návrh obsahu: Kde by se měla reklama umístit za účelem optimalizace zapojení uživatelů na webu?
Komunikace: Kdy a jak má být oznámení odesláno, aby se maximalizovala šance na odpověď?

Pokud chcete začít s personalizacemi, postupujte podle úvodní příručky nebo vyzkoušejte personalizaci v prohlížeči pomocí této interaktivní ukázky.

Tato dokumentace obsahuje následující typy článků:

Rychlé starty poskytují podrobné pokyny, které vás provedou nastavením a vzorovým kódem, abyste mohli začít provádět požadavky rozhraní API na službu.
Návody obsahují pokyny pro používání funkcí personalizace a pokročilých možností.
Ukázky kódu demonstrují, jak používat Personalizace a jak snadno komunikovat s aplikací se službou.
Kurzy jsou delší návody, které implementují personalizaci jako součást širšího obchodního řešení.
Koncepty poskytují další podrobnosti o funkcích, možnostech a základech personalizace.

Jak personalizace funguje?

Personalizace využívá učení se znovazebním učením k výběru nejlepší akce pro daný kontext napříč všemi uživateli, aby se maximalizovala průměrná odměna.

Kontext: Informace, které popisují stav vaší aplikace, scénáře nebo uživatele, které můžou být relevantní pro rozhodování.
- Příklad: Umístění, typ zařízení, věk a oblíbená témata uživatelů, kteří navštíví web.
Akce: Samostatná sada položek, které lze zvolit, spolu s atributy popisující každou položku.
- Příklad: Sada článků o novinkách a témata, která jsou popsána v jednotlivých článcích.
Odměna: Číselné skóre mezi 0 a 1, které označuje, jestli bylo rozhodnutí špatné (0), nebo dobré (1)
- Příklad: "1" označuje, že uživatel kliknul na navrhovaný článek, zatímco "0" označuje, že uživatel ne.

Rozhraní API pro hodnocení a odměnu

Personalizace vám umožňuje využít výhod možností a flexibility učení se ztěžování pomocí pouhých dvou primárních rozhraní API.

Rozhraní Rank API je volána vaší aplikací pokaždé, když dojde k rozhodnutí. Aplikace odešle JSON obsahující sadu akcí, funkce, které popisují jednotlivé akce, a funkce, které popisují aktuální kontext. Každé volání rozhraní API pořadí se označuje jako událost a je zaznamenáno s jedinečným ID události. Personalizace pak vrátí ID nejlepší akce, která maximalizuje celkovou průměrnou odměnu určenou základním modelem.

Rozhraní API odměny volá vaše aplikace pokaždé, když se zobrazí zpětná vazba, která může personalizaci pomoct zjistit, jestli id akce vrácené v zadané hodnotě volání pořadí. Pokud například uživatel kliknul na navrhovaný článek nebo dokončil nákup navrhovaného produktu. Volání rozhraní API pro odměnu může být v reálném čase (těsně po provedení volání pořadí) nebo zpožděné, aby lépe vyhovovalo potřebám scénáře. Skóre odměny určuje vaše obchodní metriky a cíle a můžou být generovány algoritmem nebo pravidly ve vaší aplikaci. Skóre je reálné číslo mezi 0 a 1.

Režimy výuky

Apprentice mode Similar to how anrentice learn a craft from observing an expert, Apprentice mode enables Personalr to learn by observing your application's current decision logic. To pomáhá zmírnit problém s tzv. "studeným startem" u nového nevytrénovaného modelu a umožňuje ověřit akce a kontextové funkce, které se odesílají do personalizace. V režimu Apprentice vrátí každé volání rozhraní Rank API akci směrného plánu nebo výchozí akci, která je akce , kterou aplikace podnikla bez použití personalizace. Aplikace ji odešle do personalizace v rozhraní Rank API jako první položku v sadě možných akcí.
Přizpůsobení online režimu vrátí nejlepší akci vzhledem k kontextu určenému podkladovým modelem RL a prozkoumá další možné akce, které můžou zlepšit výkon. Personalizace se učí z zpětné vazby poskytnuté ve voláních do rozhraní API odměny.

Mějte na paměti, že personalizace používá kolektivní informace napříč všemi uživateli k získání nejlepších akcí na základě aktuálního kontextu. Služba:

Uchování a správa informací o profilu uživatele Jedinečné ID uživatelů by se nemělo posílat do personalizace.
Protokolování předvoleb nebo historických dat jednotlivých uživatelů

Ukázkové scénáře

Tady je několik příkladů, ve kterých lze personalizaci použít k výběru nejlepšího obsahu, který se má uživateli vykreslit.

Typ obsahu	Akce {features}	Kontextové funkce	Vrácené ID akce odměny (zobrazit tento obsah)
Články o novinkách	a. `The president...`, {national, politics, [text]} b. `Premier League ...` {global, sports, [text, image, video]} c. `Hurricane in the ...` {regional, weather, [text,image]}	Country='USA', Recent_Topics=('politics', 'business'), Month='October'	a `The president...`
Filmy	1. `Star Wars` {1977, [akce, dobrodružství, fantazie], George Lucas} 2. `Hoop Dreams` {1994, [dokument, sport], Steve James} 3. `Casablanca` {1942, [romantika, drama, válka], Michael Curtiz}	Device='smart TV', Screen_Size='large', Favorite_Genre='classics'	3. `Casablanca`
Produkty elektronického obchodování	i. `Product A` {3 kg, $$$$, dodávka za 1 den} ii. `Product B` {20 kg, $$, dodávky za 7 dní} iii. `Product C` {3 kg, $$$, doručení za 2 dny}	Device='iPhone', Spending_Tier='low', Month='June'	ii. `Product B`

Požadavky na scénář

Personalizace použijte v případě, že váš scénář obsahuje:

Omezená sada akcí nebo položek, ze které se mají vybrat v každé události přizpůsobení. V každém volání rozhraní API pořadí doporučujeme maximálně ~50 akcí. Pokud máte větší sadu možných akcí, doporučujeme použít modul doporučení nebo jiný mechanismus, který omezí seznam akcí před voláním rozhraní Rank API.
Informace popisující akce (funkce akcí).
Informace popisující aktuální kontext (kontextové funkce).
Dostatek objemu dat, aby se personalizace mohla učit. Obecně doporučujeme minimálně přibližně 1 000 událostí za den, aby se personalizace mohla efektivně učit. Pokud Personalizace neobdrží dostatek dat, služba bude trvat déle, než určí nejlepší akce.

Zodpovědné používání AI

V Microsoftu jsme se zavázali k pokroku umělé inteligence řízeného principy, které lidem dávají přednost. Modely umělé inteligence, jako jsou modely dostupné ve službě Personalizace, mají významné potenciální výhody, ale bez pečlivého návrhu a promyšleného zmírnění rizik mají tyto modely potenciál generovat nesprávný nebo dokonce škodlivý obsah. Společnost Microsoft významně investovala do ochrany před zneužitím a nezamýšleným poškozením, včetně principů Microsoftu pro zodpovědné použití umělé inteligence, vytváření filtrů obsahu pro podporu zákazníků a poskytování zodpovědných pokynů k implementaci AI pro onboardované zákazníky. Podívejte se na dokumentaci zodpovědné umělé inteligence pro personalizaci.

Integrace personalizace do aplikace

Navrhujte a naplánujte akce a kontext. Určete, jak interpretovat zpětnou vazbu jako skóre odměny .

Každý prostředek personalizace, který vytvoříte, je definován jako jedna smyčka výuky. Smyčka obdrží volání Rank i Rewards pro daný obsah nebo uživatelské prostředí a vytrénuje základní model RL. K dispozici jsou

Typ prostředku	Účel
Režim učňů - `E0`	Vytrénujte personalizaci tak, aby napodobil aktuální rozhodovací logiku, aniž by to mělo vliv na stávající aplikaci, než použijete online režim , abyste se naučili lepší zásady v produkčním prostředí.
Online režim - Standard, `S0`	Personalizace používá RL k určení nejlepších akcí v produkčním prostředí.
Online režim - Zdarma, `F0`	Vyzkoušejte personalizaci v omezeném neprodukčním prostředí.

Přidání personalizace do aplikace, webu nebo systému:

Přidejte do aplikace, webu nebo systému volání Rank a určete tak nejlepší akci.
Použijte nejlepší akci, jak je uvedeno jako ID akce odměny ve vašem scénáři.

Použijte obchodní logiku na chování uživatelů nebo data zpětné vazby k určení skóre odměny . Příklad:

Chování	Počítané skóre odměny
Uživatel vybral příspěvek navrhovaný personalizátorem	1
Uživatel vybral příspěvek , který nenavrhuje personalizace	0
Uživatel váhal vybrat příspěvek, posouvat se kolem nedecisivní a nakonec vybral článek o novinkách navržený personalistou.	0.5

Přidání bonusového hovoru s odesláním skóre odměny mezi 0 a 1
- Okamžitě po přijetí zpětné vazby.
- Nebo někdy později ve scénářích, kdy se očekává zpožděná zpětná vazba.
Vyhodnoťte smyčku s offline vyhodnocením po určité době, kdy personalizace obdržela důležitá data pro online rozhodnutí. Offline vyhodnocení umožňuje otestovat a posoudit efektivitu služby Personalizace beze změn kódu nebo dopadu na uživatele.

Další kroky

Rychlý start personalizace

Sdílet prostřednictvím