Delen via


Schaalbaarheid en prestaties

Belangrijk

Vanaf 20 september 2023 kunt u geen nieuwe Personalizer-resources maken. De Personalizer-service wordt op 1 oktober 2026 buiten gebruik gesteld.

Websites en toepassingen met hoge prestaties en toepassingen met hoge prestaties hebben twee belangrijke factoren om rekening mee te houden met Personalizer voor schaalbaarheid en prestaties:

  • Lage latentie behouden bij het maken van Rank API-aanroepen
  • Controleren of de doorvoer van de training bijhoudt met gebeurtenisinvoer

Persoonlijke instellingen kunnen snel een rangschikking retourneren, waarbij de meeste aanroepduur is toegewezen aan communicatie via de REST API. Azure schaalt automatisch de mogelijkheid om snel te reageren op aanvragen.

Scenario's met lage latentie

Voor sommige toepassingen zijn lage latenties vereist bij het retourneren van een rangschikking. Lage latenties zijn nodig:

  • Om te voorkomen dat de gebruiker een merkbare hoeveelheid tijd wacht voordat de gerangschikte inhoud wordt weergegeven.
  • Om een server te helpen die extreem verkeer ondervindt, voorkomt u dat er schaarse rekentijd en netwerkverbindingen worden gekoppeld.

Schaalbaarheid en trainingsdoorvoer

Personalizer werkt door een model bij te werken dat opnieuw wordt getraind op basis van berichten die asynchroon door Personalizer worden verzonden na Rank- en Reward-API's. Deze berichten worden verzonden met behulp van een Azure EventHub voor de toepassing.

Het is onwaarschijnlijk dat de meeste toepassingen de maximale deelname- en trainingsdoorvoer van Personalizer bereiken. Hoewel het bereiken van dit maximum de toepassing niet vertraagt, betekent dit dat event hub-wachtrijen intern worden gevuld dan ze kunnen worden opgeschoond.

Uw doorvoervereisten schatten

  • Maak een schatting van het gemiddelde aantal bytes per classificatie-gebeurtenis, waarbij de lengte van de context- en actie-JSON-documenten wordt toegevoegd.
  • Deel 20 MB per seconde door dit geschatte gemiddelde aantal bytes.

Als uw gemiddelde nettolading bijvoorbeeld 500 functies heeft en elk een geschatte 20 tekens is, is elke gebeurtenis ongeveer 10 kB. Met deze schattingen bedraagt 20.000.000 / 10.000 = 2.000 gebeurtenissen per seconde, ongeveer 173 miljoen gebeurtenissen per dag.

Als u deze limieten bereikt, neemt u contact op met ons ondersteuningsteam voor architectuuradvies.

Volgende stappen

Personalizer maken en configureren.