Het leergedrag van Personalizer configureren
Belangrijk
Vanaf 20 september 2023 kunt u geen nieuwe Personalizer-resources maken. De Personalizer-service wordt op 1 oktober 2026 buiten gebruik gesteld.
De apprentice-modus geeft u vertrouwen en vertrouwen in de Personalizer-service en de mogelijkheden voor machine learning, en biedt zekerheid dat de service informatie ontvangt die kan worden geleerd van – zonder risico's voor onlineverkeer.
Apprentice-modus configureren
Meld u aan bij Azure Portal voor uw Personalizer-resource.
Selecteer op de pagina Setup op het tabblad Modelinstellingen de modus Apprentice en selecteer Opslaan.
Wijzigingen in de bestaande toepassing
Uw bestaande toepassing mag niet wijzigen hoe deze momenteel acties selecteert om weer te geven of hoe de toepassing de waarde, beloning van die actie bepaalt. De enige wijziging in de toepassing is mogelijk de volgorde van de acties die naar de Personalizer Rank-API worden verzonden. De actie die uw toepassing momenteel weergeeft, wordt verzonden als de eerste actie in de actielijst. De Rank-API gebruikt deze eerste actie om uw Personalizer-model te trainen.
Uw toepassing configureren om de Rank-API aan te roepen
Als u Personalizer wilt toevoegen aan uw toepassing, moet u de Rank- en Reward-API's aanroepen.
Voeg de Rank API-aanroep toe na het punt in uw bestaande toepassingslogica, waar u de lijst met acties en hun functies bepaalt. De eerste actie in de lijst met acties moet de actie zijn die door uw bestaande logica is geselecteerd.
Configureer uw code om de actie weer te geven die is gekoppeld aan de beloningsactie-id van het Rank API-antwoord.
Uw toepassing configureren om reward-API aan te roepen
Notitie
Reward-API-aanroepen hebben geen invloed op training in de app-modus. De service leert door de huidige logica of standaardacties van uw toepassing te vergelijken. Het implementeren van Reward-aanroepen in deze fase zorgt er echter voor dat de onlinemodus soepel verloopt met een eenvoudige switch in Azure Portal. Daarnaast worden de beloningen geregistreerd, zodat u kunt analyseren hoe goed de huidige logica presteert en hoeveel beloning er wordt ontvangen.
Gebruik uw bestaande bedrijfslogica om de beloning van de weergegeven actie te berekenen. De waarde moet tussen 0 en 1 liggen. Verzend deze beloning naar Personalizer met behulp van de Reward-API. De beloningswaarde wordt niet onmiddellijk verwacht en kan gedurende een bepaalde periode worden vertraagd, afhankelijk van uw bedrijfslogica.
Als u de beloning niet binnen de geconfigureerde beloningswachttijd retourneert, wordt de standaardbeloning geregistreerd.
Apprentice-modus evalueren
Controleer in Azure Portal op de pagina Monitor voor uw Personalizer-resource de overeenkomende prestaties.
De leerlingmodus biedt de volgende metrische evaluatiegegevens:
- Basislijn – gemiddelde beloning: Gemiddelde beloningen van de standaardwaarde (basislijn) van de toepassing.
- Personalizer – gemiddelde beloning: Het gemiddelde van de totale beloningen die Personalizer mogelijk heeft bereikt.
- Beloningsprestatieverhouding ten opzichte van de meest recente 1000 gebeurtenissen: Verhouding van basislijn- en Personalizer-beloning– genormaliseerd ten opzichte van de meest recente 1000 gebeurtenissen.
Gedrag overschakelen naar de onlinemodus
Wanneer u bepaalt dat Personalizer wordt getraind met een gemiddelde van 75-85% rolling gemiddelde, is het model klaar om over te schakelen naar de onlinemodus.
Selecteer in Azure Portal voor uw Personalizer-resource op de pagina Setup op het tabblad Modelinstellingen de optie *Onlinemodus en selecteer Opslaan.
U hoeft geen wijzigingen aan te brengen in de Rank- en Reward-API-aanroepen.