A Personalizer tanulási viselkedésének konfigurálása

A Gyakornok mód megbízhatóságot és megbízhatóságot biztosít a Personalizer szolgáltatásban és annak gépi tanulási képességeiben, és biztosítja, hogy a szolgáltatás olyan információkat kap, amelyekből tanulható – anélkül, hogy az online forgalmat kockáztatja.

Gyakornoki mód konfigurálása

  1. Jelentkezzen be a Azure Portal a Personalizer-erőforráshoz.

  2. A Beállítás lap Modellbeállítások lapján válassza a Tanulói mód lehetőséget, majd válassza a Mentés lehetőséget.

Képernyőkép a tanulói módú tanulási viselkedés konfigurálásáról a Azure Portal

A meglévő alkalmazás módosításai

A meglévő alkalmazás nem módosíthatja, hogy jelenleg hogyan választja ki a megjelenítendő műveleteket, vagy hogy az alkalmazás hogyan határozza meg a művelet értékét, jutalmát . Az alkalmazás egyetlen módosítása lehet a Personalizer Rank API-nak küldött műveletek sorrendje. Az alkalmazás által jelenleg megjelenített művelet lesz elküldve a műveletlista első műveleteként . A Rank API ezt az első műveletet használja a Personalizer-modell betanítása érdekében.

Az alkalmazás konfigurálása a Rank API meghívására

A Personalizer alkalmazáshoz való hozzáadásához meg kell hívnia a Rank és a Reward API-kat.

  1. Adja hozzá a Rank API-hívást a meglévő alkalmazáslogika azon pontja után, ahol meghatározza a műveletek listáját és funkcióit. A műveletek listájának első műveletének a meglévő logika által kiválasztott műveletnek kell lennie.

  2. Konfigurálja a kódot a Rank API-válasz Reward Action ID azonosítójához társított művelet megjelenítéséhez.

Az alkalmazás konfigurálása a Reward API meghívására

Megjegyzés

A Reward API-hívások nem befolyásolják a betanítást gyakornoki módban. A szolgáltatás az alkalmazás aktuális logikájának vagy alapértelmezett műveleteinek egyeztetésével tanul. A Reward-hívások ezen a szakaszon történő implementálása azonban segít a későbbi online módra való zökkenőmentes áttérésben egy egyszerű kapcsolóval a Azure Portal. Emellett a rendszer naplózza a jutalmakat, így elemezheti, hogy a jelenlegi logika milyen jól teljesít, és hogy mennyi jutalom érkezik.

  1. A megjelenített művelet jutalomának kiszámításához használja a meglévő üzleti logikát. Az értéknek 0 és 1 közötti tartományban kell lennie. Küldje el ezt a jutalmat a Personalizernek a Reward API használatával. A jutalom értéke nem várható azonnal, és az üzleti logikától függően késleltethető egy adott időszakban.

  2. Ha nem adja vissza a jutalmakat a konfigurált reward várakozási időn belül, az alapértelmezett jutalom lesz naplózva.

Gyakornoki mód kiértékelése

A Azure Portal a Personalizer-erőforrás Monitorozás lapján tekintse át az Egyeztetési teljesítményt.

Képernyőkép a tanulói módú tanulási viselkedés értékelésének áttekintéséről a Azure Portal

A Tanulói mód a következő értékelési metrikákat biztosítja:

  • Alapterv – átlagos jutalom: Az alkalmazás alapértelmezett (alapkonfiguráció) átlagos jutalmai.
  • Personalizer – átlagos jutalom: A Személyreszabó által esetleg elért összes jutalom átlaga.
  • Reward achievement ratio over recent 1000 events: Ratio of Baseline and Personalizer reward – normalizálva a legutóbbi 1000 eseményhez képest.

Viselkedés váltása Online módra

Ha úgy dönt, hogy a Personalizer betanítása átlagosan 75–85%-os gördülési átlaggal történik, a modell készen áll az online módra való váltásra.

A Személyre szabó erőforrás Azure Portal Beállítás lapján, a Modellbeállítások lapon válassza a *Online mód, majd a Mentés lehetőséget.

Nem kell módosítania a Rank és Reward API-hívásokat.

Következő lépések