Durchsuchen
Wichtig
Ab dem 20. September 2023 können Sie keine neuen Personalisierungsressourcen mehr erstellen. Der Personalisierungsdienst wird am 1. Oktober 2026 eingestellt.
Durch das Sondieren kann die Personalisierung auch dann fortlaufend gute Ergebnisse liefern, wenn sich das Benutzerverhalten ändert.
Wenn die Personalisierung einen Aufruf zum Zuweisen eines Rangs empfängt, gibt sie eine RewardActionID zurück, für die eine der beiden folgenden Aussagen gilt:
- Das wahrscheinlichste Benutzerverhalten wird ausgehend vom aktuellen Machine Learning-Modell durch die bekannte Relevanz ermittelt.
- Das Verhalten wird durch Sondieren ermittelt. Dabei wird nicht zwangsläufig die Aktion gefunden, deren Rang die höchste Wahrscheinlichkeit aufweist.
Die Personalisierung verwendet für das Sondieren derzeit den Epsilon-Greedy-Algorithmus.
Auswählen einer Sondierungseinstellung
Sie konfigurieren den Prozentsatz des Datenverkehrs für die Sondierung im Azure-Portal auf der Seite Konfiguration für die Personalisierung. Diese Einstellung bestimmt den Prozentsatz von Rangaufrufen, bei denen eine Sondierung erfolgt.
Die Personalisierung bestimmt, ob für jeden Rangaufruf die wahrscheinlichste Aktion des Modells untersucht oder verwendet werden soll. Dies unterscheidet sich vom Verhalten bei einigen A/B-Frameworks, in denen eine Vorgehensweise für bestimmte Benutzer-IDs festgelegt ist.
Best Practices für das Auswählen einer Sondierungseinstellung
Die Auswahl der Einstellung für das Sondieren ist eine geschäftliche Entscheidung über den Anteil der Benutzerinteraktionen für die Untersuchung, um das Modell zu verbessern.
Mit der Einstellung 0 (null) gehen viele Vorteile der Personalisierung verloren. Mit dieser Einstellung verwendet die Personalisierung keine Benutzerinteraktionen, um bessere Benutzerinteraktionen zu ermitteln. Dies führt zu Stagnation, Abweichung (Concept Drift) und letztlich zu einer geringeren Leistung des Modells.
Eine zu hohe Einstellung negiert die Vorteile des Lernens vom Benutzerverhalten. Die Festlegung auf 100 % bedeutet eine konstante Randomisierung, sodass gelerntes Verhalten von Benutzern keinen Einfluss auf das Ergebnis mehr hat.
Es ist wichtig, das Verhalten der Anwendung nicht zu ändern, wenn Sie erkennen, dass die Personalisierung die gelernte beste Aktion sondiert oder einsetzt. Dies würde zu einer Beeinflussung des Lernens führen und damit letztendlich die potenzielle Leistung verringern.