Informazioni su Personalizza esperienze
Importante
A partire dal 20 settembre 2023 non sarà possibile creare nuove risorse di Personalizza esperienze. Il servizio Personalizza esperienze verrà ritirato il 1° ottobre 2026.
Personalizza esperienze di Azure AI è un servizio di intelligenza artificiale che aiuta le applicazioni a prendere decisioni più intelligenti su larga scala usando l'apprendimento per rinforzo. Personalizza esperienze elabora le informazioni sullo stato dell'applicazione, dello scenario e/o degli utenti (contesti) e produce un set di possibili decisioni e attributi correlati (azioni) per determinare la decisione migliore da prendere. Il feedback dell'applicazione (ricompense) viene inviato a Personalizza esperienze affinché impari a migliorare la propria capacità decisionale quasi in tempo reale.
Personalizza esperienze può determinare le azioni migliori da intraprendere in diversi scenari:
- E-commerce: quale prodotto deve essere mostrato ai clienti per massimizzare le probabilità di acquisto?
- Raccomandazione sui contenuti: quale articolo deve essere mostrato per aumentare il tasso di clic?
- Progettazione dei contenuti: dove deve essere posizionato un annuncio per ottimizzare il coinvolgimento degli utenti su un sito web?
- Comunicazione: quando e come deve essere inviata una notifica per massimizzare le possibilità di risposta?
Per iniziare a usare Personalizza esperienze, seguire la guida di avvio rapido oppure provare Personalizza esperienze nel browser con questa demo interattiva.
Questa documentazione contiene i tipi di articoli seguenti:
- Guide di avvio rapido: forniscono istruzioni dettagliate per la configurazione, oltre a codice di esempio per iniziare a inviare richieste API al servizio.
- Guide pratiche: contengono istruzioni per l'uso della caratteristiche e delle funzionalità avanzate di Personalizza esperienze.
- Esempi di codice:mostrano come usare Personalizza esperienze e consentono di interfacciare facilmente l'applicazione con il servizio.
- Esercitazioni: si tratta di procedure dettagliate più lunghe che implementano Personalizza esperienze nell'ambito di una soluzione aziendale più ampia.
- Concetti: forniscono ulteriori dettagli sulle caratteristiche, le funzionalità e i concetti fondamentali di Personalizza esperienze.
Come funziona Personalizza esperienze?
Personalizza esperienze usa l'apprendimento per rinforzo per selezionare la migliore azione per un determinato contesto per tutti gli utenti al fine di massimizzare una ricompensa media.
- Contesto: informazioni che descrivono lo stato dell'applicazione, dello scenario o dell'utente che possono essere rilevanti per prendere una decisione.
- Esempio: l'ubicazione, il tipo di dispositivo, l'età e gli argomenti preferiti degli utenti che visitano un sito Web.
- Azioni: un insieme discreto di elementi tra cui è possibile scegliere, insieme agli attributi che descrivono ogni elemento.
- Esempio: un insieme di articoli di notizie e gli argomenti illustrati in ogni articolo.
- Ricompensa: punteggio numerico compreso tra 0 e 1 che indica se la decisione è stata cattiva (0) o buona (1).
- Esempio: "1" indica che un utente ha fatto clic sull'articolo suggerito, mentre "0" indica che l'utente non lo ha fatto.
API Classificazione e Ricompensa
Personalizza esperienze consente di sfruttare la potenza e la flessibilità dell'apprendimento per rinforzo usando solo due API principali.
L'API Classificazione viene chiamata dall'applicazione ogni volta che è necessario prendere una decisione. L'applicazione invia un codice JSON contenente un insieme di azioni, funzionalità che descrivono ogni azione e funzionalità che descrivono il contesto corrente. Ogni chiamata all'API Classificazione è nota come evento e annotata con un ID evento univoco. Personalizza esperienze restituisce quindi l'ID dell'azione migliore che massimizza la ricompensa media totale come determinato dal modello sottostante.
L'API Ricompensa viene chiamata dall'applicazione in presenza di feedback che può aiutare Personalizza esperienze a determinare se l'ID azione restituito nella chiamata all'API Classificazione ha fornito un valore. Ad esempio, se un utente ha fatto clic sull'articolo di notizie suggerito o ha completato l'acquisto di un prodotto suggerito. Una chiamata all'API Ricompensa può essere eseguita in tempo reale (subito dopo l'esecuzione della chiamata all'API Classificazione) o ritardata per soddisfare meglio le esigenze dello scenario. Il punteggio di ricompensa è determinato dalle metriche e dagli obiettivi aziendali e può essere generato da un algoritmo o da determinate regole nell'applicazione. Il punteggio è un numero con valore reale compreso tra 0 e 1.
Modalità di apprendimento
Modalità apprendista Analogamente a come un apprendista impara un mestiere osservando un esperto, la modalità apprendista consente a Personalizza esperienze di apprendere osservando la logica decisionale corrente dell'applicazione. Questo permette di attenuare il cosiddetto problema di avvio a freddo con un nuovo modello non sottoposto a training e consente di convalidare le funzionalità di azione e contesto inviate a Personalizza esperienze. In modalità apprendista ogni chiamata all'API Classificazione restituisce l'azione di base o l'azione predefinita, ovvero l'azione che l'applicazione avrebbe eseguito senza usare Personalizza esperienze. Questa azione viene inviata dall'applicazione a Personalizza esperienze nell'API Classificazione come primo elemento nell'insieme di azioni possibili.
Modalità online Personalizza esperienze restituisce l'azione migliore in base al contesto, come determinato dal modello di apprendimento per rinforzo sottostante, ed esplora altre possibili azioni che potrebbero migliorare le prestazioni. Personalizza esperienze apprende dal feedback fornito nelle chiamate all'API Ricompensa.
Tenere presente che Personalizza esperienze usa informazioni collettive di tutti gli utenti per apprendere le azioni migliori in base al contesto corrente. Il servizio non si occupa di:
- Gestire e rendere persistenti le informazioni del profilo utente. Non devono essere inviati ID utente univoci a Personalizza esperienze.
- Registrare le preferenze o i dati cronologici dei singoli utenti.
Scenari di esempio
Ecco alcuni esempi in cui è possibile usare Personalizza esperienze per selezionare il contenuto migliore da presentare a un utente.
Content type | Azioni {funzionalità} | Caratteristiche del contesto | ID azione ricompensa restituito (visualizza questo contenuto) |
---|---|---|---|
Articoli di notizie | a. The president... , {nazionale, politica, [testo]}b. Premier League ... , {internazionale, sport, [testo, immagine, video]}c. Hurricane in the ... , {locale, meteo, [testo, immagine]} |
Country='USA', Recent_Topics=('politica', 'affari'), Month='Ottobre' |
a The president... |
Film | 1. Star Wars {1977, [azione, avventura, fantasy], George Lucas}2. Hoop Dreams {1994, [documentario, sport], Steve James}3. Casablanca {1942, [commedia, genere drammatico, guerra], Michael Curtiz} |
Device='smart TV', Screen_Size='grande', Favorite_Genre='classici' |
3. Casablanca |
Prodotti di e-commerce | i. Product A {3 kg, €€€€, consegna in 1 giorno}ii. Product B {20 kg, €€€€, consegna in 7 giorni}iii. Product C {3 kg, €€€€, consegna in 2 giorni} |
Device='iPhone', Spending_Tier='basso', Month='Giugno' |
ii. Product B |
Requisiti dello scenario
Usare Personalizza esperienze quando lo scenario ha:
- Un insieme limitato di azioni o elementi tra cui scegliere in ogni evento di personalizzazione. È consigliabile non superare 50 azioni in ogni chiamata all'API Classificazione. In presenza di un insieme più ampio di azioni possibili, è consigliabile usare un motore di raccomandazioni o un altro meccanismo per ridurre l'elenco di azioni prima di chiamare l'API Classificazione.
- Informazioni che descrivono le azioni (funzionalità dell'azione).
- Informazioni che descrivono il contesto corrente (funzionalità contestuali).
- Un volume di dati sufficiente per consentire a Personalizza esperienze di apprendere. In generale, si consiglia un minimo di 1.000 eventi al giorno per consentire a Personalizza esperienze di apprendere in modo efficace. Se Personalizza esperienze non riceve dati sufficienti, il servizio impiega più tempo per determinare le azioni migliori.
Uso responsabile dell'IA
Microsoft si impegna costantemente a migliorare l'IA basandosi su principi che pongano al primo posto le persone. I modelli di IA come quelli disponibili nel servizio Personalizza esperienze hanno notevoli vantaggi potenziali, ma senza un'attenta progettazione e una ponderata mitigazione, tali modelli rischiano di generare contenuti errati o addirittura dannosi. Microsoft ha investito molto per evitare abusi e danni involontari, incorporando i principi di Microsoft per l'uso responsabile dell'IA, creando filtri per i contenuti a supporto dei clienti e fornendo una guida all'implementazione dell'IA responsabile ai clienti già acquisiti. Vedere la documentazione sull'IA responsabile per Personalizza esperienze.
Integrare Personalizza esperienze in un'applicazione
Progettare e pianificare le azioni e il contesto. Determinare come interpretare il feedback come punteggio di ricompensa.
Ogni risorsa di Personalizza esperienze creata viene definita ciclo di apprendimento. Il ciclo riceverà le chiamate alle API Classificazione e Ricompensa per tale contenuto o esperienza utente ed eseguirà il training di un modello di apprendimento per rinforzo sottostante. Sono disponibili tre modalità:
Tipo di risorsa Scopo Modalità apprendista - E0
Eseguire il training di Personalizza esperienze per simulare la logica decisionale corrente senza influire sull'applicazione esistente, prima di usare la modalità online per apprendere criteri migliori in un ambiente di produzione. Modalità online - Standard, S0
Personalizza esperienze usa l'apprendimento per rinforzo per determinare le azioni migliori in ambiente di produzione. Modalità online - Gratuita, F0
Provare Personalizza esperienze in un ambiente non di produzione limitato. Aggiungere Personalizza esperienze all'applicazione, al sito Web o al sistema:
Aggiungere una chiamata dell'API Classificazione a Personalizza esperienze nell'applicazione, nel sito Web o nel sistema per determinare l'azione migliore.
Usare l'azione migliore, specificata come ID azione di ricompensa nello scenario.
Applicare la logica di business al comportamento o ai dati di feedback degli utenti per determinare il punteggio di ricompensa. Ad esempio:
Comportamento Punteggio di ricompensa calcolato L'utente ha selezionato un articolo di notizie suggerito da Personalizza esperienze 1 L'utente ha selezionato un articolo di notizie non suggerito da Personalizza esperienze 0 L'utente ha esitato a selezionare un articolo di notizie, scorrendo la pagina con indecisione, e infine ha selezionato l'articolo di notizie suggerito da Personalizza esperienze 0,5 Aggiungere una chiamata Reward per l'invio di un punteggio di ricompensa compreso tra 0 e 1
- Subito dopo la ricezione del feedback.
- In un momento successivo in scenari in cui è previsto un feedback ritardato.
Valutare il ciclo con una valutazione offline dopo un periodo di tempo in cui Personalizza esperienze ha ricevuto dati significativi per prendere decisioni online. La valutazione offline consente di testare e valutare l'efficacia del servizio Personalizza esperienze senza modifiche al codice e senza alcun impatto sull'esperienza utente.
Passaggi successivi
- Funzionamento di Personalizza esperienze
- Vedere le informazioni su cos'è l'apprendimento per rinforzo