Partager via


Configurer le comportement d'apprentissage de Personalizer

Important

À compter du 20 septembre 2023, vous ne pourrez pas créer de ressources Personalizer. Le service Personalizer est mis hors service le 1er octobre 2026.

Le mode Apprenti vous permet de vous appuyer sur le service Personalizer et ses fonctionnalités d'apprentissage automatique. Il fournit également l'assurance que le service reçoit des informations dont il peut tirer parti dans le cadre de son apprentissage - sans mettre en péril le trafic en ligne.

Configurer le mode Apprenti

  1. Connectez-vous au portail Azure pour accéder à votre ressource Personalizer.

  2. Dans la page Configuration, sous l’onglet Paramètres du modèle, sélectionnez Mode Apprenti, puis Enregistrer.

Capture d’écran de la configuration du comportement d’apprentissage en mode Apprenti sur le portail Azure

Modifications apportées à l'application existante

L'application existante ne doit pas modifier la façon dont elle sélectionne les actions à afficher ni la façon dont elle détermine la valeur, la récompense de l'action. La seule modification apportée à l'application peut être l'ordre des actions envoyées à l'API Rank de Personalizer. L'action affichée par votre application est envoyée en tant que première action dans la liste des actions. L'API Rank utilise cette première action pour effectuer l'apprentissage de votre modèle Personalizer.

Configurer votre application pour appeler l'API Rank

Pour ajouter Personalizer à votre application, vous devez appeler les API Rank et Reward.

  1. Ajoutez l'appel de l'API ​​Rank après le point dans la logique d'application où vous déterminez la liste des actions et leurs caractéristiques. La première action de la liste des actions doit être l'action sélectionnée par la logique existante.

  2. Configurez votre code pour afficher l'action associée à l'ID de l'action récompensée de la réponse de l'API Rank.

Configurer votre application pour appeler l'API Reward

Notes

Les appels d’API Reward n’affectent pas l’entraînement en mode Apprenti. Le service apprend en correspondant à la logique actuelle de votre application ou aux actions par défaut. Toutefois, l’implémentation d’appels Reward à ce stade permet de garantir une transition fluide vers le mode en ligne ultérieurement avec un commutateur simple dans le portail Azure. En outre, les récompenses seront journalisées, ce qui vous permet d’analyser la performance de la logique actuelle et la quantité de récompense reçue.

  1. Utilisez la logique métier existante pour calculer la récompense de l'action affichée. La valeur doit être comprise entre 0 et 1. Envoyez cette récompense à Personalizer à l'aide de l'API Reward. La valeur de la récompense n'est pas attendue immédiatement et elle peut être retardée - en fonction de votre logique métier.

  2. Si vous ne renvoyez pas la récompense avant la fin du délai d’attente de récompense configuré, la récompense par défaut sera journalisée à la place.

Évaluer le mode d'apprentissage

Sur le portail Azure, accédez à la page Moniteur de votre ressource Personalizer et examinez les performances de correspondance.

Capture d’écran de l’examen de l’évaluation du comportement d’apprentissage en mode Apprenti sur le portail Azure

Le mode Apprenti fournit les mesures d'évaluation suivantes :

  • Ligne de base – récompense moyenne : Récompenses moyennes de l’action par défaut (ligne de base) de l’application.
  • Personalizer - récompense moyenne : Moyenne des récompenses totales que Personalizer aurait pu atteindre.
  • Taux de récompense sur les 1 000 événements les plus récents : Rapport récompense de référence/récompense Personalizer - normalisé sur les 1 000 événements les plus récents.

Passer en mode En ligne

Lorsque vous déterminez que l'apprentissage de Personalizer a atteint une moyenne mobile de 75 à 85 %, le modèle est prêt à passer en mode En ligne.

Sur le portail Azure pour votre ressource Personalizer, dans la page Configuration, sous l’onglet Paramètres du modèle, sélectionnez *Mode en ligne, puis Enregistrer.

Il n'est pas nécessaire de modifier les appels des API Rank et Reward.

Étapes suivantes