Condividi tramite


Funzionamento di Personalizza esperienze

Importante

A partire dal 20 settembre 2023 non sarà possibile creare nuove risorse di Personalizza esperienze. Il servizio Personalizza esperienze verrà ritirato il 1° ottobre 2026.

La risorsa di personalizza esperienze, il ciclo di apprendimento, usa l'apprendimento automatico per compilare il modello che prevede l'azione principale per il contenuto. Il training del modello viene eseguito esclusivamente sui dati inviati con le chiamate alle API Classifica e Ricompensa. Ogni ciclo è completamente indipendente.

Le API Classifica e Ricompensa influiscono sul modello

È possibile inviare azioni con funzionalità e funzionalità di contesto all'API Classifica. L'API Classifica decide di usare:

  • Sfrutta: il modello corrente decide l'azione migliore in base ai dati passati.
  • Esplora: seleziona un'azione diversa anziché l'azione principale. Configurare questa percentuale per la risorsa di personalizza esperienze nel portale di Azure.

Determinare il punteggio di ricompensa e inviare tale punteggio all'API Ricompensa. l'API Ricompensa:

  • Raccoglie i dati per eseguire il training del modello registrando le caratteristiche e i punteggi di ricompensa di ogni chiamata a Classifica.
  • L’API usa tali dati per aggiornare il modello in base alla configurazione specificata nel criterio di apprendimento.

Il sistema chiama personalizza esperienze

L'immagine seguente mostra il flusso architetturale delle chiamate a Classifica e Ricompensa:

testo alternativo

  1. È possibile inviare azioni con funzionalità e funzionalità di contesto all'API Classifica.

    • Personalizza esperienze decide se sfruttare il modello corrente o esplorare nuove scelte per il modello.
    • Il risultato della classificazione viene inviato all'hub eventi.
  2. La classificazione superiore viene restituita al sistema come ID di azione ricompensa. Il sistema presenta il contenuto e determina un punteggio di ricompensa in base alle regole di business.

  3. Il sistema restituisce il punteggio di ricompensa al ciclo di apprendimento.

    • Quando Personalizza esperienze riceve la ricompensa, la invia all'hub eventi.
    • La classifica e la ricompensa sono correlate.
    • Il modello di intelligenza artificiale viene aggiornato in base ai risultati della correlazione.
    • Il motore di inferenza viene aggiornato con il nuovo modello.

Personalizza esperienze ripete il training del modello

Personalizza esperienze ripete il training del modello in base all'impostazione di aggiornamento della frequenza del modello nella risorsa di personalizza esperienze nel portale di Azure.

Personalizza esperienze usa tutti i dati attualmente conservati, in base all'impostazione di conservazione dei dati in numero di giorni nella risorsa di personalizza esperienze nel portale di Azure.

Ricerca alla base di Personalizza esperienze

Personalizza esperienze si basa su dati scientifici e ricerche nel campo dell'apprendimento per rinforzo, tra cui documenti, attività di ricerca e aree di studio in corso in Microsoft Research.

Passaggi successivi

Informazioni sugli scenari principali per personalizza esperienze