Delen via


Verkennen

Belangrijk

Vanaf 20 september 2023 kunt u geen nieuwe Personalizer-resources maken. De Personalizer-service wordt op 1 oktober 2026 buiten gebruik gesteld.

Met verkenning kan Personalizer continu goede resultaten leveren, zelfs als het gedrag van gebruikers verandert.

Wanneer Personalizer een Rank-aanroep ontvangt, wordt een RewardActionID geretourneerd die:

  • Gebruikt bekende relevantie om het meest waarschijnlijke gebruikersgedrag te vinden op basis van het huidige machine learning-model.
  • Maakt gebruik van verkenning, die niet overeenkomt met de actie die de hoogste waarschijnlijkheid in de rang heeft.

Personalizer gebruikt momenteel een algoritme met de naam epsilon greedy om te verkennen.

Een verkenningsinstelling kiezen

U configureert het percentage verkeer dat moet worden gebruikt voor verkenning op de configuratiepagina van Azure Portal voor Personalizer. Deze instelling bepaalt het percentage Rank-aanroepen dat verkenningen uitvoert.

Personalizer bepaalt of de meest waarschijnlijke actie van het model voor elke rank-aanroep moet worden verkend of gebruikt. Dit verschilt van het gedrag in sommige A/B-frameworks die een behandeling vergrendelen op specifieke gebruikers-id's.

Aanbevolen procedures voor het kiezen van een verkenningsinstelling

Het kiezen van een verkenningsinstelling is een zakelijke beslissing over het aandeel gebruikersinteracties waarmee u wilt verkennen om het model te verbeteren.

Een instelling van nul zal veel van de voordelen van Personalizer ontleden. Met deze instelling gebruikt Personalizer geen gebruikersinteracties om betere gebruikersinteracties te ontdekken. Dit leidt tot modelfasering, drift en uiteindelijk lagere prestaties.

Een instelling die te hoog is, leidt tot de voordelen van het leren van gebruikersgedrag. Het instellen op 100% impliceert een constante randomisatie en elk geleerd gedrag van gebruikers heeft geen invloed op het resultaat.

Het is belangrijk dat u het gedrag van de toepassing niet wijzigt op basis van of Personalizer de beste actie verkent of gebruikt. Dit zou leiden tot leervooroordelen die uiteindelijk de potentiƫle prestaties zouden verminderen.

Volgende stappen

Versterking leren