Megosztás a következőn keresztül:


Mi a Personalizer?

Fontos

2023. szeptember 20-tól nem hozhat létre új Personalizer-erőforrásokat. A Personalizer szolgáltatás 2026. október 1-jén megszűnik.

Az Azure AI Personalizer egy olyan AI-szolgáltatás, amely az alkalmazások a megerősítési tanulás használatával intelligensebb döntéseket hoz nagy léptékben. A Personalizer feldolgozza az alkalmazás, a forgatókönyv és/vagy a felhasználók (környezetek) állapotával kapcsolatos információkat, valamint a lehetséges döntéseket és a kapcsolódó attribútumokat (műveleteket) a legjobb döntés meghatározásához. A rendszer visszajelzést küld az alkalmazástól (jutalmak) a Personalizernek, hogy megtudja, hogyan fejlesztheti döntéshozatali képességét közel valós időben.

A Personalizer számos forgatókönyvben meghatározhatja a legjobb műveleteket:

  • E-kereskedelem: Milyen terméket kell megjeleníteni az ügyfeleknek a vásárlás valószínűségének maximalizálása érdekében?
  • Tartalomjavaslat: Melyik cikknek kell megjelennie az átkattintási arány növeléséhez?
  • Tartalomtervezés: Hol kell elhelyezni egy hirdetést a felhasználói előjegyzés optimalizálásához egy webhelyen?
  • Kommunikáció: Mikor és hogyan kell értesítést küldeni a válasz esélyének maximalizálása érdekében?

A Personalizer használatának megkezdéséhez kövesse a rövid útmutatót, vagy próbálja ki a Personalizert a böngészőben ezzel az interaktív bemutatóval.

Ez a dokumentáció a következő típusú cikkeket tartalmazza:

  • A rövid útmutatók lépésről lépésre útmutatást nyújtanak a beállítás és a mintakód végigvezetéséhez az API-kérések szolgáltatáshoz való indításához.
  • Az útmutatók útmutatást tartalmaznak a Personalizer funkcióinak és speciális képességeinek használatához.
  • A kódminták bemutatják, hogyan használható a Personalizer, és hogyan lehet könnyen illeszteni az alkalmazást a szolgáltatással.
  • Az oktatóanyagok hosszabb útmutatók, amelyek egy szélesebb körű üzleti megoldás részeként implementálják a Personalizert.
  • Az alapfogalmak további részleteket nyújtanak a Personalizer funkcióiról, képességeiről és alapjairól.

Hogyan működik a Personalizer?

A Personalizer megerősítési tanulással választja ki a legjobb műveletet egy adott környezethez az összes felhasználó számára az átlagos jutalom maximalizálása érdekében.

  • Környezet: Az alkalmazás, a forgatókönyv vagy a felhasználó döntéshez kapcsolódó állapotát leíró információk.
    • Példa: A webhelyet látogató felhasználók helye, eszköztípusa, kora és kedvenc témakörei.
  • Műveletek: Választható elemek különálló készlete, valamint az egyes elemeket leíró attribútumok.
    • Példa: Hírcikkek és az egyes cikkekben tárgyalt témakörök.
  • Jutalom: 0 és 1 közötti numerikus pontszám, amely azt jelzi, hogy a döntés rossz (0) vagy (1)
    • Például: Az "1" azt jelzi, hogy egy felhasználó a javasolt cikkre kattintott, míg a "0" azt jelzi, hogy a felhasználó nem.

Rang- és reward API-k

A Personalizer lehetővé teszi, hogy csak két elsődleges API használatával kihasználja a megerősítési tanulás erejét és rugalmasságát.

A Rank API-t az alkalmazás minden alkalommal meghívja, amikor döntést kell hoznia. Az alkalmazás egy JSON-t küld, amely a műveletek egy készletét, az egyes műveleteket leíró funkciókat és az aktuális környezetet leíró funkciókat tartalmazza. Minden Rank API-hívás eseményként ismert, és egyedi eseményazonosítóval van feljegyzve. A Personalizer ezután visszaadja a legjobb művelet azonosítóját, amely maximalizálja a mögöttes modell által meghatározott teljes átlagos jutalmat.

A Reward API-t az alkalmazás minden olyan visszajelzéskor meghívja, amely segíthet a Personalizernek megtudni, hogy a rank hívás által visszaadott műveletazonosító visszaadott-e értéket. Ha például egy felhasználó a javasolt hírcikkre kattintott, vagy befejezte a javasolt termék megvásárlását. A Reward API hívása valós időben (a Rang hívás után) vagy késleltetve lehet, hogy jobban megfeleljen a forgatókönyv igényeinek. A jutalompontszámot az üzleti metrikák és célkitűzések határozzák meg, és az alkalmazás algoritmusa vagy szabályai hozhatják létre. A pontszám egy valós értékű szám 0 és 1 között.

Tanulási módok

  • Tanonc mód Ahhoz hasonlóan, ahogyan egy tanuló megtanulja a mesterséget egy szakértő megfigyeléséből, a Tanulószerződéses mód lehetővé teszi a Personalizer számára, hogy tanuljon az alkalmazás aktuális döntési logikájának megfigyelésével. Ez segít enyhíteni az új, nem betanított modellekkel kapcsolatos úgynevezett "hidegindítási" problémát, és lehetővé teszi a Personalizernek küldött művelet- és környezetfunkciók érvényesítését. Tanulói módban a Rank API minden hívása azt az alapműveletet vagy alapértelmezett műveletet adja vissza, amelyet az alkalmazás a Personalizer használata nélkül hajtott volna végre. Ezt az alkalmazás elküldi a Rank API-ban található Personalizernek a lehetséges műveletek első elemeként.

  • Az online módú Personalizer a kontextusnak megfelelően a legjobb műveletet adja vissza az alapul szolgáló RL-modell alapján, és megvizsgálja az egyéb lehetséges műveleteket, amelyek javíthatják a teljesítményt. A Personalizer a Reward API-nak küldött hívásokban kapott visszajelzésekből tanul.

Vegye figyelembe, hogy a Personalizer az összes felhasználó közös információit használja a legjobb műveletek megismeréséhez az aktuális környezet alapján. A szolgáltatás nem:

  • A felhasználói profil adatainak megőrzése és kezelése. Az egyedi felhasználói azonosítókat nem szabad elküldeni a Personalizernek.
  • Naplózza az egyes felhasználók beállításait vagy előzményadatait.

Példaforgatókönyvek

Íme néhány példa arra, hogy a Personalizer segítségével kiválaszthatja a legjobban megjelenítendő tartalmat a felhasználó számára.

Tartalomtípus Műveletek {features} Környezeti funkciók Visszaadott jutalomművelet azonosítója
(a tartalom megjelenítése)
Hírcikkek a. The president..., {national, politics, [text]}
b. Premier League ... {global, sports, [text, image, video]}
c. Hurricane in the ... {regional, weather, [text,image]}
Country='USA',
Recent_Topics=('politika', 'üzleti'),
Month='October'
egy The president...
Filmek 1. Star Wars {1977, [akció, kaland, fantasy], George Lucas}
2. Hoop Dreams {1994, [dokumentumfilm, sport], Steve James}
3. Casablanca {1942, [romantika, dráma, háború], Michael Curtiz}
Device='smart TV',
Screen_Size='nagy',
Favorite_Genre='klasszikusok'
3. Casablanca
E-kereskedelmi termékek i. Product A {3 kg, $$$$, szállítás 1 nap alatt}
ii. Product B {20 kg, $$, szállítás 7 nap alatt}
iii. Product C {3 kg, $$$, szállítás 2 nap alatt}
Device='iPhone',
Spending_Tier='low',
Month='June'
ii. Product B

Forgatókönyv követelményei

A Personalizer használata, ha a forgatókönyv a következő:

  • Az egyes személyre szabási eseményekben kiválasztható műveletek vagy elemek korlátozott készlete. Minden Rank API-hívásban legfeljebb ~50 művelet javasolt. Ha több lehetséges művelettel rendelkezik, javasoljuk , hogy a Rank API meghívása előtt használjon javaslatmotort vagy egy másik mechanizmust a műveletek listájának csökkentésére.
  • A műveleteket leíró információk (műveleti funkciók).
  • Az aktuális környezetet leíró információk (környezeti funkciók).
  • Elegendő adatmennyiség ahhoz, hogy a Personalizer tanulhasson. Általában naponta legalább ~1000 eseményt ajánlunk, hogy a Personalizer hatékonyan tanulhasson. Ha a Personalizer nem kap elegendő adatot, a szolgáltatás tovább tart a legjobb műveletek meghatározásához.

Az MI felelős használata

A Microsoftnál elkötelezettek vagyunk a mesterséges intelligencia fejlődése mellett, amelyet az emberek elé helyező alapelvek vezérelnek. Az olyan AI-modellek, mint amilyenek a Personalizer szolgáltatásban érhetők el, jelentős potenciális előnyökkel járnak, de gondos tervezés és átgondolt megoldások nélkül az ilyen modellek helytelen vagy akár káros tartalmakat is eredményezhetnek. A Microsoft jelentős beruházásokat hajtott végre a visszaélések és a nem szándékos károk elleni védelem érdekében, a Microsoft felelősségteljes AI-használatra vonatkozó alapelveinek beépítésével, az ügyfeleket támogató tartalomszűrők létrehozásával, valamint felelős AI-megvalósítási útmutatóval az előkészített ügyfelek számára. Tekintse meg a Personalizer felelős AI-dokumentációit.

A Personalizer integrálása egy alkalmazásba

  1. A műveletek és a környezet tervezése és megtervezése. Határozza meg, hogyan értelmezze a visszajelzést jutalompontként.

  2. Minden létrehozott Személyre szabó erőforrás egy tanulási ciklusként van definiálva. A hurok megkapja az adott tartalomra vagy felhasználói élményre vonatkozó Rang- és Reward-hívásokat, és betanított egy mögöttes RL-modellt. Vannak

    Erőforrás típusa Cél
    Tanulói mód - E0 Betaníthatja a Personalizert, hogy a meglévő alkalmazás befolyásolása nélkül utánozza a jelenlegi döntéshozatali logikát, mielőtt online mód használatával jobb szabályzatokat tanulhat egy éles környezetben.
    Online mód – Standard, S0 A Personalizer az RL használatával határozza meg a legjobb műveleteket az éles környezetben.
    Online mód – Ingyenes, F0 Próbálja ki a Personalizert korlátozott, nem éles környezetben.
  3. A Personalizer hozzáadása az alkalmazáshoz, webhelyhez vagy rendszerhez:

    1. A legjobb művelet meghatározásához adjon ranghívást a Personalizerhez az alkalmazásban, a webhelyen vagy a rendszerben.

    2. Használja a legjobb műveletet a forgatókönyvben jutalomművelet-azonosítóként megadott módon.

    3. Üzleti logika alkalmazása a felhasználói viselkedésre vagy visszajelzési adatokra a jutalompontszám meghatározásához. Példa:

      Működés Kiszámított jutalompontszám
      A felhasználó kiválasztott egy, a Personalizer által javasolt hírcikket 1
      A felhasználó kiválasztott egy olyan hírcikket , amelyet a Personalizer nem javasolt 0
      A felhasználó habozott, hogy válasszon ki egy hírcikket, körülgörgetett a meghatározhatatlanul, és végül kiválasztotta a hír cikket által javasolt Personalizer 0.5
    4. Jutalomhívás hozzáadása 0 és 1 közötti jutalompontot küldve

      • Közvetlenül a visszajelzés beérkezés után.
      • Vagy valamikor később olyan helyzetekben, ahol késleltetett visszajelzés várható.
    5. Értékelje ki a ciklust offline értékeléssel egy olyan időszak után, amikor a Personalizer jelentős adatokat kapott az online döntések meghozatalához. Az offline kiértékeléssel kódmódosítások és felhasználói hatások nélkül tesztelheti és értékelheti a Personalizer szolgáltatás hatékonyságát.

Következő lépések