Mi a Personalizer?
Fontos
2023. szeptember 20-tól nem hozhat létre új Personalizer-erőforrásokat. A Personalizer szolgáltatás 2026. október 1-jén megszűnik.
Az Azure AI Personalizer egy olyan AI-szolgáltatás, amely az alkalmazások a megerősítési tanulás használatával intelligensebb döntéseket hoz nagy léptékben. A Personalizer feldolgozza az alkalmazás, a forgatókönyv és/vagy a felhasználók (környezetek) állapotával kapcsolatos információkat, valamint a lehetséges döntéseket és a kapcsolódó attribútumokat (műveleteket) a legjobb döntés meghatározásához. A rendszer visszajelzést küld az alkalmazástól (jutalmak) a Personalizernek, hogy megtudja, hogyan fejlesztheti döntéshozatali képességét közel valós időben.
A Personalizer számos forgatókönyvben meghatározhatja a legjobb műveleteket:
- E-kereskedelem: Milyen terméket kell megjeleníteni az ügyfeleknek a vásárlás valószínűségének maximalizálása érdekében?
- Tartalomjavaslat: Melyik cikknek kell megjelennie az átkattintási arány növeléséhez?
- Tartalomtervezés: Hol kell elhelyezni egy hirdetést a felhasználói előjegyzés optimalizálásához egy webhelyen?
- Kommunikáció: Mikor és hogyan kell értesítést küldeni a válasz esélyének maximalizálása érdekében?
A Personalizer használatának megkezdéséhez kövesse a rövid útmutatót, vagy próbálja ki a Personalizert a böngészőben ezzel az interaktív bemutatóval.
Ez a dokumentáció a következő típusú cikkeket tartalmazza:
- A rövid útmutatók lépésről lépésre útmutatást nyújtanak a beállítás és a mintakód végigvezetéséhez az API-kérések szolgáltatáshoz való indításához.
- Az útmutatók útmutatást tartalmaznak a Personalizer funkcióinak és speciális képességeinek használatához.
- A kódminták bemutatják, hogyan használható a Personalizer, és hogyan lehet könnyen illeszteni az alkalmazást a szolgáltatással.
- Az oktatóanyagok hosszabb útmutatók, amelyek egy szélesebb körű üzleti megoldás részeként implementálják a Personalizert.
- Az alapfogalmak további részleteket nyújtanak a Personalizer funkcióiról, képességeiről és alapjairól.
Hogyan működik a Personalizer?
A Personalizer megerősítési tanulással választja ki a legjobb műveletet egy adott környezethez az összes felhasználó számára az átlagos jutalom maximalizálása érdekében.
- Környezet: Az alkalmazás, a forgatókönyv vagy a felhasználó döntéshez kapcsolódó állapotát leíró információk.
- Példa: A webhelyet látogató felhasználók helye, eszköztípusa, kora és kedvenc témakörei.
- Műveletek: Választható elemek különálló készlete, valamint az egyes elemeket leíró attribútumok.
- Példa: Hírcikkek és az egyes cikkekben tárgyalt témakörök.
- Jutalom: 0 és 1 közötti numerikus pontszám, amely azt jelzi, hogy a döntés rossz (0) vagy jó (1)
- Például: Az "1" azt jelzi, hogy egy felhasználó a javasolt cikkre kattintott, míg a "0" azt jelzi, hogy a felhasználó nem.
Rang- és reward API-k
A Personalizer lehetővé teszi, hogy csak két elsődleges API használatával kihasználja a megerősítési tanulás erejét és rugalmasságát.
A Rank API-t az alkalmazás minden alkalommal meghívja, amikor döntést kell hoznia. Az alkalmazás egy JSON-t küld, amely a műveletek egy készletét, az egyes műveleteket leíró funkciókat és az aktuális környezetet leíró funkciókat tartalmazza. Minden Rank API-hívás eseményként ismert, és egyedi eseményazonosítóval van feljegyzve. A Personalizer ezután visszaadja a legjobb művelet azonosítóját, amely maximalizálja a mögöttes modell által meghatározott teljes átlagos jutalmat.
A Reward API-t az alkalmazás minden olyan visszajelzéskor meghívja, amely segíthet a Personalizernek megtudni, hogy a rank hívás által visszaadott műveletazonosító visszaadott-e értéket. Ha például egy felhasználó a javasolt hírcikkre kattintott, vagy befejezte a javasolt termék megvásárlását. A Reward API hívása valós időben (a Rang hívás után) vagy késleltetve lehet, hogy jobban megfeleljen a forgatókönyv igényeinek. A jutalompontszámot az üzleti metrikák és célkitűzések határozzák meg, és az alkalmazás algoritmusa vagy szabályai hozhatják létre. A pontszám egy valós értékű szám 0 és 1 között.
Tanulási módok
Tanonc mód Ahhoz hasonlóan, ahogyan egy tanuló megtanulja a mesterséget egy szakértő megfigyeléséből, a Tanulószerződéses mód lehetővé teszi a Personalizer számára, hogy tanuljon az alkalmazás aktuális döntési logikájának megfigyelésével. Ez segít enyhíteni az új, nem betanított modellekkel kapcsolatos úgynevezett "hidegindítási" problémát, és lehetővé teszi a Personalizernek küldött művelet- és környezetfunkciók érvényesítését. Tanulói módban a Rank API minden hívása azt az alapműveletet vagy alapértelmezett műveletet adja vissza, amelyet az alkalmazás a Personalizer használata nélkül hajtott volna végre. Ezt az alkalmazás elküldi a Rank API-ban található Personalizernek a lehetséges műveletek első elemeként.
Az online módú Personalizer a kontextusnak megfelelően a legjobb műveletet adja vissza az alapul szolgáló RL-modell alapján, és megvizsgálja az egyéb lehetséges műveleteket, amelyek javíthatják a teljesítményt. A Personalizer a Reward API-nak küldött hívásokban kapott visszajelzésekből tanul.
Vegye figyelembe, hogy a Personalizer az összes felhasználó közös információit használja a legjobb műveletek megismeréséhez az aktuális környezet alapján. A szolgáltatás nem:
- A felhasználói profil adatainak megőrzése és kezelése. Az egyedi felhasználói azonosítókat nem szabad elküldeni a Personalizernek.
- Naplózza az egyes felhasználók beállításait vagy előzményadatait.
Példaforgatókönyvek
Íme néhány példa arra, hogy a Personalizer segítségével kiválaszthatja a legjobban megjelenítendő tartalmat a felhasználó számára.
Tartalomtípus | Műveletek {features} | Környezeti funkciók | Visszaadott jutalomművelet azonosítója (a tartalom megjelenítése) |
---|---|---|---|
Hírcikkek | a. The president... , {national, politics, [text]}b. Premier League ... {global, sports, [text, image, video]}c. Hurricane in the ... {regional, weather, [text,image]} |
Country='USA', Recent_Topics=('politika', 'üzleti'), Month='October' |
egy The president... |
Filmek | 1. Star Wars {1977, [akció, kaland, fantasy], George Lucas}2. Hoop Dreams {1994, [dokumentumfilm, sport], Steve James}3. Casablanca {1942, [romantika, dráma, háború], Michael Curtiz} |
Device='smart TV', Screen_Size='nagy', Favorite_Genre='klasszikusok' |
3. Casablanca |
E-kereskedelmi termékek | i. Product A {3 kg, $$$$, szállítás 1 nap alatt}ii. Product B {20 kg, $$, szállítás 7 nap alatt}iii. Product C {3 kg, $$$, szállítás 2 nap alatt} |
Device='iPhone', Spending_Tier='low', Month='June' |
ii. Product B |
Forgatókönyv követelményei
A Personalizer használata, ha a forgatókönyv a következő:
- Az egyes személyre szabási eseményekben kiválasztható műveletek vagy elemek korlátozott készlete. Minden Rank API-hívásban legfeljebb ~50 művelet javasolt. Ha több lehetséges művelettel rendelkezik, javasoljuk , hogy a Rank API meghívása előtt használjon javaslatmotort vagy egy másik mechanizmust a műveletek listájának csökkentésére.
- A műveleteket leíró információk (műveleti funkciók).
- Az aktuális környezetet leíró információk (környezeti funkciók).
- Elegendő adatmennyiség ahhoz, hogy a Personalizer tanulhasson. Általában naponta legalább ~1000 eseményt ajánlunk, hogy a Personalizer hatékonyan tanulhasson. Ha a Personalizer nem kap elegendő adatot, a szolgáltatás tovább tart a legjobb műveletek meghatározásához.
Az MI felelős használata
A Microsoftnál elkötelezettek vagyunk a mesterséges intelligencia fejlődése mellett, amelyet az emberek elé helyező alapelvek vezérelnek. Az olyan AI-modellek, mint amilyenek a Personalizer szolgáltatásban érhetők el, jelentős potenciális előnyökkel járnak, de gondos tervezés és átgondolt megoldások nélkül az ilyen modellek helytelen vagy akár káros tartalmakat is eredményezhetnek. A Microsoft jelentős beruházásokat hajtott végre a visszaélések és a nem szándékos károk elleni védelem érdekében, a Microsoft felelősségteljes AI-használatra vonatkozó alapelveinek beépítésével, az ügyfeleket támogató tartalomszűrők létrehozásával, valamint felelős AI-megvalósítási útmutatóval az előkészített ügyfelek számára. Tekintse meg a Personalizer felelős AI-dokumentációit.
A Personalizer integrálása egy alkalmazásba
A műveletek és a környezet tervezése és megtervezése. Határozza meg, hogyan értelmezze a visszajelzést jutalompontként.
Minden létrehozott Személyre szabó erőforrás egy tanulási ciklusként van definiálva. A hurok megkapja az adott tartalomra vagy felhasználói élményre vonatkozó Rang- és Reward-hívásokat, és betanított egy mögöttes RL-modellt. Vannak
Erőforrás típusa Cél Tanulói mód - E0
Betaníthatja a Personalizert, hogy a meglévő alkalmazás befolyásolása nélkül utánozza a jelenlegi döntéshozatali logikát, mielőtt online mód használatával jobb szabályzatokat tanulhat egy éles környezetben. Online mód – Standard, S0
A Personalizer az RL használatával határozza meg a legjobb műveleteket az éles környezetben. Online mód – Ingyenes, F0
Próbálja ki a Personalizert korlátozott, nem éles környezetben. A Personalizer hozzáadása az alkalmazáshoz, webhelyhez vagy rendszerhez:
A legjobb művelet meghatározásához adjon ranghívást a Personalizerhez az alkalmazásban, a webhelyen vagy a rendszerben.
Használja a legjobb műveletet a forgatókönyvben jutalomművelet-azonosítóként megadott módon.
Üzleti logika alkalmazása a felhasználói viselkedésre vagy visszajelzési adatokra a jutalompontszám meghatározásához. Példa:
Működés Kiszámított jutalompontszám A felhasználó kiválasztott egy, a Personalizer által javasolt hírcikket 1 A felhasználó kiválasztott egy olyan hírcikket , amelyet a Personalizer nem javasolt 0 A felhasználó habozott, hogy válasszon ki egy hírcikket, körülgörgetett a meghatározhatatlanul, és végül kiválasztotta a hír cikket által javasolt Personalizer 0.5 Jutalomhívás hozzáadása 0 és 1 közötti jutalompontot küldve
- Közvetlenül a visszajelzés beérkezés után.
- Vagy valamikor később olyan helyzetekben, ahol késleltetett visszajelzés várható.
Értékelje ki a ciklust offline értékeléssel egy olyan időszak után, amikor a Personalizer jelentős adatokat kapott az online döntések meghozatalához. Az offline kiértékeléssel kódmódosítások és felhasználói hatások nélkül tesztelheti és értékelheti a Personalizer szolgáltatás hatékonyságát.