A Personalizer tanulási viselkedésének konfigurálása
A Gyakornok mód megbízhatóságot és megbízhatóságot biztosít a Personalizer szolgáltatásban és annak gépi tanulási képességeiben, és biztosítja, hogy a szolgáltatás olyan információkat kap, amelyekből tanulható – anélkül, hogy az online forgalmat kockáztatja.
Gyakornoki mód konfigurálása
Jelentkezzen be a Azure Portal a Personalizer-erőforráshoz.
A Beállítás lap Modellbeállítások lapján válassza a Tanulói mód lehetőséget, majd válassza a Mentés lehetőséget.
A meglévő alkalmazás módosításai
A meglévő alkalmazás nem módosíthatja, hogy jelenleg hogyan választja ki a megjelenítendő műveleteket, vagy hogy az alkalmazás hogyan határozza meg a művelet értékét, jutalmát . Az alkalmazás egyetlen módosítása lehet a Personalizer Rank API-nak küldött műveletek sorrendje. Az alkalmazás által jelenleg megjelenített művelet lesz elküldve a műveletlista első műveleteként . A Rank API ezt az első műveletet használja a Personalizer-modell betanítása érdekében.
Az alkalmazás konfigurálása a Rank API meghívására
A Personalizer alkalmazáshoz való hozzáadásához meg kell hívnia a Rank és a Reward API-kat.
Adja hozzá a Rank API-hívást a meglévő alkalmazáslogika azon pontja után, ahol meghatározza a műveletek listáját és funkcióit. A műveletek listájának első műveletének a meglévő logika által kiválasztott műveletnek kell lennie.
Konfigurálja a kódot a Rank API-válasz Reward Action ID azonosítójához társított művelet megjelenítéséhez.
Az alkalmazás konfigurálása a Reward API meghívására
Megjegyzés
A Reward API-hívások nem befolyásolják a betanítást gyakornoki módban. A szolgáltatás az alkalmazás aktuális logikájának vagy alapértelmezett műveleteinek egyeztetésével tanul. A Reward-hívások ezen a szakaszon történő implementálása azonban segít a későbbi online módra való zökkenőmentes áttérésben egy egyszerű kapcsolóval a Azure Portal. Emellett a rendszer naplózza a jutalmakat, így elemezheti, hogy a jelenlegi logika milyen jól teljesít, és hogy mennyi jutalom érkezik.
A megjelenített művelet jutalomának kiszámításához használja a meglévő üzleti logikát. Az értéknek 0 és 1 közötti tartományban kell lennie. Küldje el ezt a jutalmat a Personalizernek a Reward API használatával. A jutalom értéke nem várható azonnal, és az üzleti logikától függően késleltethető egy adott időszakban.
Ha nem adja vissza a jutalmakat a konfigurált reward várakozási időn belül, az alapértelmezett jutalom lesz naplózva.
Gyakornoki mód kiértékelése
A Azure Portal a Personalizer-erőforrás Monitorozás lapján tekintse át az Egyeztetési teljesítményt.
A Tanulói mód a következő értékelési metrikákat biztosítja:
- Alapterv – átlagos jutalom: Az alkalmazás alapértelmezett (alapkonfiguráció) átlagos jutalmai.
- Personalizer – átlagos jutalom: A Személyreszabó által esetleg elért összes jutalom átlaga.
- Reward achievement ratio over recent 1000 events: Ratio of Baseline and Personalizer reward – normalizálva a legutóbbi 1000 eseményhez képest.
Viselkedés váltása Online módra
Ha úgy dönt, hogy a Personalizer betanítása átlagosan 75–85%-os gördülési átlaggal történik, a modell készen áll az online módra való váltásra.
A Személyre szabó erőforrás Azure Portal Beállítás lapján, a Modellbeállítások lapon válassza a *Online mód, majd a Mentés lehetőséget.
Nem kell módosítania a Rank és Reward API-hívásokat.