Scalabilità e prestazioni

Importante

A partire dal 20 settembre 2023 non sarà possibile creare nuove risorse di Personalizza esperienze. Il servizio Personalizza esperienze viene ritirato il 1° ottobre 2026.

Nei siti Web e nelle applicazioni ad alte prestazioni e con traffico elevato è necessario tenere in considerazione due fattori principali in merito alla scalabilità e alle prestazioni di Personalizza esperienze:

  • Mantenere bassa la latenza quando si effettuano chiamate alle API di classificazione
  • Assicurarsi che la velocità effettiva di training stia al passo con l'input di eventi

La personalizzazione può restituire rapidamente una classificazione, con la maggior parte della durata della chiamata dedicata alla comunicazione tramite l'API REST. La scalabilità automatica di Azure consentirà di rispondere rapidamente alle richieste.

Scenari a bassa latenza

Alcune applicazioni richiedono bassi livelli di latenza quando restituiscono una classificazione. Sono necessarie latenze basse:

  • Evitare che l'utente resti in attesa per molto tempo prima che venga visualizzato il contenuto classificato.
  • Evitare che un server con molto traffico occupi tempo di elaborazione o connessioni di rete disponibili in quantità limitata.

Scalabilità e velocità effettiva di training

Il funzionamento di Personalizza esperienze si basa sull'aggiornamento di un modello di cui è stato nuovamente eseguito il training in base ai messaggi inviati in modo asincrono da Personalizza esperienze in seguito all'applicazione delle API di classificazione e ricompensa. Questi messaggi vengono inviati tramite un hub eventi di Azure per l'applicazione.

È improbabile che la maggior parte delle applicazioni raggiunga la velocità effettiva massima di join e training di Personalizza esperienze. Mentre raggiunge questo valore massimo non rallenta l'applicazione, implica che le code dell'hub eventi vengono riempite internamente più velocemente di quanto possano essere pulite.

Come stimare i requisiti di velocità effettiva

  • Per stimare il numero medio di byte per ogni evento di classificazione, aggiungere le lunghezze dei documenti JSON di contesto e azione.
  • Dividere 20 MB/sec per il numero medio di byte stimato.

Ad esempio, se il payload medio ha 500 funzionalità e ognuna è di 20 caratteri stimata, ogni evento è di circa 10 kb. Con queste stime, 20.000.000 / 10.000 = 2.000 eventi al secondo, ovvero circa 173 milioni di eventi al giorno.

Se si raggiungono questi limiti, contattare il team di supporto per ottenere consigli per l'architettura.

Passaggi successivi

Creare e configurare Personalizza esperienze.