Share via


Terminologie zur Personalisierung

Wichtig

Ab dem 20. September 2023 können Sie keine neuen Personalisierungsressourcen mehr erstellen. Der Personalisierungsdienst wird am 1. Oktober 2026 eingestellt.

Die Personalisierung verwendet Terminologie aus dem vertiefenden Lernen. Diese Begriffe werden im Azure-Portal und in den APIs verwendet.

Konzeptionelle Terminologie

  • Lernschleife: Sie erstellen eine Personalisierungsressource, eine sogenannte Lernschleife, für jeden Teil Ihrer Anwendung, der von der Personalisierung profitieren kann. Wenn Sie mehr als eine zu personalisierende Erfahrung haben, erstellen Sie für jede eine Schleife.

  • Modell: Ein Personalisierungsmodell erfasst alle Daten, die über Benutzerverhalten gelernt wurden, erhält Trainingsdaten aus der Kombination der Argumente, die Sie an die Rangfolge- und Relevanzaufrufe senden, und besitzt ein Trainingsverhalten, das von der Lernrichtlinie bestimmt wird.

  • Onlinemodus: Das standardmäßige Lernverhalten für die Personalisierung, bei dem Ihre Lernschleife maschinelles Lernen verwendet, um das Modell zu erstellen, das die Top-Aktion für Ihre Inhalte vorhersagt.

  • Ausbildungsmodus: Ein Lernverhalten, das beim Warmstart eines Personalisierungsmodels beim Training hilft, ohne die Ergebnisse und Aktionen der Anwendung zu beeinflussen.

Lernverhalten:

  • Onlinemodus: Gibt die beste Aktion zurück. Ihr Modell antwortet auf Rangaufrufe mit der besten Aktion und verwendet Relevanzsaufrufe, um zu lernen und die Auswahl im Lauf der Zeit zu verbessern.
  • Ausbildungsmodus : Lernen Sie im Ausbildungsmodus. Ihr Modell lernt, indem es das Verhalten Ihres bestehenden Systems beobachtet. Rangfolgeaufrufe geben immer die Standardaktion (Baseline) der Anwendung zurück.

Personalisierungskonfiguration

Die Personalisierung wird über das Azure-Portal konfiguriert.

  • Relevanzen: Konfigurieren Sie die Standardwerte für die Wartezeit für Relevanz, die Standardrelevanz und die Relevanzaggregationsrichtlinie.

  • Erkundung: Konfigurieren Sie den Prozentsatz der Rangaufrufe, die für die Erkundung verwendet werden sollen

  • Häufigkeit der Modellaktualisierung: Wie oft das Modell neu trainiert wird.

  • Datenaufbewahrung: Wie viele Tage an Daten zu speichern sind. Dies kann sich auf Offlineauswertungen auswirken, die zur Verbesserung Ihrer Lernschleife verwendet werden.

Verwenden von Rang- und Relevanz-APIs

  • Rang: In Anbetracht der Aktionen mit Features und der Kontextfeatures verwenden Sie „explore“ (erkunden) oder „exploit“ (nutzen), um die oberste Aktion (Inhaltselement) zurückzugeben.

    • Aktionen: Aktionen sind die Inhaltselemente, z. B. Produkte oder Werbeaktionen, unter denen ausgewählt wird. Die Personalisierung wählt die Top-Aktion (zurückgegebene Relevanzaktions-ID) aus, die Ihren Benutzern über die Rang-API angezeigt werden soll.

    • Context: Um eine genauere Rangfolge bereitzustellen, geben Sie Informationen zu Ihrem Kontext an, beispielsweise:

      • Ihre Benutzer.
      • Das Gerät, das sie verwenden.
      • Die aktuelle Zeit.
      • Andere Daten über die aktuelle Situation.
      • Vergangene Daten über den Benutzer oder Kontext.

      Ihre spezifische Anwendung kann abweichende Kontextinformationen haben.

    • Merkmale : Eine Einheit von Informationen über ein Inhaltselement oder einen Benutzerkontext. Stellen Sie sicher, dass Sie nur aggregierte Features verwenden. Verwenden Sie keine bestimmten Zeiten, Benutzer-IDs oder andere nicht aggregierte Daten als Features.

      • Ein Aktionsfeature sind Metadaten über den Inhalt.
      • Ein Kontextfeature sind Metadaten über den Kontext, in dem der Inhalt angezeigt wird.
  • Exploration (Erkunden): Der Personalisierungsdienst erkundet, wenn er, anstatt die beste Aktion zurückzugeben, eine andere Aktion für den Benutzer auswählt. Der Personalisierungsdienst kann durch Erkunden Verschiebungen und Stagnation vermeiden sowie sich an laufendes Benutzerverhalten anpassen.

  • Erlernte bewährte Vorgehensweise: Der Personalisierungsdienst verwendet das aktuelle Modell, um auf der Grundlage früherer Daten die bewährte Vorgehensweise auszuwählen.

  • Experimentdauer: Die Zeitspanne, die der Personalisierungsdienst auf eine Relevanz wartet, beginnend ab dem Zeitpunkt, zu dem der Rangfolgeaufruf für dieses Ereignis erfolgte.

  • Inaktive Ereignisse: Ein inaktives Ereignis ist eines, für das Sie die Rangfolge aufgerufen haben, sich aber nicht sicher sind, ob der Benutzer jemals das Ergebnis sehen wird, weil dies Entscheidungen der Clientanwendung unterliegt. Inaktive Ereignisse ermöglichen es Ihnen, Personalisierungsergebnisse zu erstellen und zu speichern und dann zu entscheiden, sie später zu verwerfen, ohne dass dies das Machine Learning-Modell beeinträchtigt.

  • Relevanz: Ein Maß dafür, wie der Benutzer auf die von der Rang-API zurückgegebene Relevanzaktions-ID reagiert hat, als eine Bewertung zwischen 0 und 1. Der Wert von 0 bis 1 wird von Ihrer Geschäftslogik festgelegt, basierend darauf, wie die Auswahl dabei geholfen hat, Ihre geschäftlichen Ziele der Personalisierung zu erreichen. Die Lernschleife speichert diese Relevanz nicht als individuellen Benutzerverlauf.

Auswertungen

Offlineauswertungen

  • Auswertung: Eine Offlineauswertung ermittelt die beste Lernrichtlinie für Ihre Schleife auf der Grundlage der Daten Ihrer Anwendung.

  • Lernrichtlinie: Die Art und Weise, wie die Personalisierung ein Modell bei jedem Ereignis trainiert, wird durch einige Parameter bestimmt, die die Funktionsweise des Machine Learning-Algorithmus beeinflussen. Eine neue Lernschleife beginnt mit einer standardmäßigen Lernrichtlinie, die eine moderate Leistung erzielen kann. Im Zuge von Auswertungen erstellt die Personalisierung neue Lernrichtlinien, die speziell für die Anwendungsfälle Ihrer Schleife optimiert sind. Mit Richtlinien, die im Zuge der Auswertung generiert und für die einzelnen spezifischen Schleifen optimiert wurden, verbessert sich die Leistung der Personalisierung erheblich. Die Lernrichtlinie wird im Bereich der Modell- und Lerneinstellungen für die Personalisierungsressource im Azure-Portal als Lerneinstellungen bezeichnet.

Auswertungen im Ausbildungsmodus

Der Ausbildungsmodus bietet die folgenden Auswertungsmetriken:

  • Baseline – durchschnittliche Relevanz: Durchschnittliche Relevanzen für die Standardwerte der Anwendung (Baseline)
  • Personalisierung – durchschnittliche Relevanz: Durchschnitt der gesamten Relevanzen, die Personalisierungsprogramme potenziell erreicht hätten.
  • Durchschnittliche gleitende Relevanz: Verhältnis von Baseline und Personalisierungsrelevanz – normalisiert über die letzten 1000 Ereignisse.

Nächste Schritte