Che cos'è il riepilogo?

Articolo
07/08/2024

Importante

La nostra area di anteprima, Svezia centrale, presenta le nostre tecniche di ottimizzazione LLM più recenti e in continua evoluzione basate su modelli GPT. Si è invitati a provarli con una risorsa Lingua nell'area Svezia centrale.

Il riepilogo delle conversazioni è disponibile solo usando:

REST API
Python
C#

Il riepilogo è una funzionalità offerta da Lingua di Azure AI, che è una combinazione di modelli di linguaggio di grandi dimensioni generativi e modelli di codificatore ottimizzati per le attività che offrono soluzioni di riepilogo di qualità superiore, un'efficienza dei costi e una latenza inferiore. Usare questo articolo per altre informazioni su questa funzionalità e su come usarla nelle applicazioni.

Il servizio offre soluzioni di riepilogo per tre tipi di genere, testi semplici, conversazioni e documenti nativi. Il riepilogo del testo accetta solo blocchi di testo normale e il riepilogo conversazioni accetta input di conversazione, inclusi vari segnali audio vocali per consentire al modello di segmentare e riepilogare in modo efficace, e il documento nativo può riepilogare direttamente i documenti nei formati nativi, ad esempio Parole, PDF e così via.

Questa documentazione contiene i tipi di articoli seguenti:

Argomenti di avvio rapido, ovvero istruzioni introduttive che guidano nell'esecuzione di richieste al servizio.
Le guide pratiche contengono istruzioni per usare il servizio con modalità più specifiche o personalizzate.

Queste funzionalità sono progettate per abbreviare un contenuto che potrebbe essere considerato troppo lungo da leggere.

Funzionalità principali per il riepilogo del testo

Il riepilogo del testo usa tecniche di elaborazione del linguaggio naturale per generare un riepilogo di testi semplici, che possono essere da un documento o una conversazione o da qualsiasi testo. Questa API offre due approcci di riepilogo:

Riepilogo estrattivo: produce un riepilogo estraendo frasi salienti all'interno del documento, insieme alle informazioni di posizionamento di queste frasi.
- Più frasi estratte: queste frasi incarnano collettivamente l'idea principale del documento. Sono frasi originali estratte dal contenuto del documento di input.
- Punteggio di classificazione: il punteggio di classificazione indica la rilevanza di una frase per l'argomento principale. Il riepilogo del testo classifica le frasi estratte, per determinare se vengono restituite nell'ordine in cui vengono visualizzate o in base alla classificazione. Ad esempio, se si richiede un riepilogo a tre frasi, il riepilogo estrattivo restituisce le tre frasi con punteggio più alto.
- Informazioni sulla posizione: posizione iniziale e lunghezza delle frasi estratte.
Riepilogo astrattivo: genera un riepilogo con frasi o parole concise e coerenti che non sono semplicemente estratti di frasi fittizie dal documento originale.
- Testi di riepilogo: il riepilogo astrattivo restituisce un riepilogo per ogni intervallo di input contestuale. Un input lungo può essere segmentato in modo da poter restituire più gruppi di testi di riepilogo con il relativo intervallo di input contestuale.
- Intervallo di input contestuale: intervallo di input usato per generare il testo di riepilogo.

Si consideri, ad esempio, il paragrafo di testo seguente:

"Microsoft sta cercando di sviluppare l'IA oltre le tecniche esistenti, adottando un approccio all'apprendimento e alla comprensione più olistico e incentrato sull'uomo. In qualità di Chief Technology Officer di Servizi di Azure AI per intelligenza artificiale, ho lavorato con un team di scienziati e ingegneri straordinari per trasformare questa ricerca in una realtà. Nel mio ruolo, godo di una prospettiva unica nella visualizzazione della relazione tra tre attributi della conoscenza umana: testo monolingua (X), segnali sensoriali audiovisivi (Y) e multilingue (Z). All'intersezione di tutti e tre, avviene la magia, ovvero quello che chiamiamo codice XYZ come illustrato nella figura 1: una rappresentazione congiunta per creare un'intelligenza artificiale più potente in grado di parlare, ascoltare, vedere e comprendere meglio gli esseri umani. Crediamo che il codice XYZ ci consentirà di soddisfare la nostra visione a lungo termine: apprendimento induttivo tra domini, modalità di spanning e linguaggi. L'obiettivo è quello di avere modelli con training preliminare in grado di apprendere congiuntamente le rappresentazioni per supportare un'ampia gamma di attività di IA a valle, analogamente a come gli esseri umani fanno oggi. Negli ultimi cinque anni, abbiamo ottenuto prestazioni umane sui benchmark nel riconoscimento vocale conversazionale, nella traduzione automatica, nella risposta alle domande conversazionali, nella comprensione della lettura automatica e nella didascalia delle immagini. Queste cinque innovazioni ci hanno fornito segnali incoraggianti verso le nostre aspirazioni più ambiziose: raggiungere un salto nelle capacità di IA, ottenendo un apprendimento multisensoriale e multilingue più vicino al modo in cui gli esseri umani imparano e comprendono. Credo che il codice XYZ congiunto sia una componente fondamentale di questa aspirazione, se basato su fonti di conoscenza esterne nelle attività di IA a valle."

La richiesta API di riepilogo del testo viene elaborata al ricevimento della richiesta creando un processo per il back-end dell'API. Se il processo ha avuto esito positivo, viene restituito l'output dell'API. L'output è disponibile per il recupero per 24 ore. Oltre questo periodo, l'output viene eliminato. A causa del supporto multilingue e emoji, la risposta può contenere offset di testo. Per altre informazioni, vedere come elaborare gli offset.

Se si usa l'esempio precedente, l'API potrebbe restituire questi riepiloghi:

Riepilogo estrattivo:

"Microsoft sta cercando di sviluppare l'IA oltre le tecniche esistenti, adottando un approccio all'apprendimento e alla comprensione più olistico e incentrato sull'uomo".
"Crediamo che il codice XYZ ci consentirà di soddisfare la nostra visione a lungo termine: apprendimento induttivo tra domini, modalità di spanning e linguaggi".
"L'obiettivo è quello di avere modelli con training preliminare in grado di apprendere congiuntamente le rappresentazioni per supportare un'ampia gamma di attività di IA a valle, analogamente a come gli esseri umani fanno oggi".

Riepilogo astrattivo:

"Microsoft sta adottando un approccio alla comprensione e all'apprendimento più olistico e incentrato sull'uomo. Crediamo che il codice XYZ ci consentirà di soddisfare la nostra visione a lungo termine: apprendimento induttivo tra domini, modalità di spanning e linguaggi. Negli ultimi cinque anni abbiamo raggiunto le prestazioni umane sui benchmark".

Questa documentazione contiene i tipi di articoli seguenti:

Argomenti di avvio rapido, ovvero istruzioni introduttive che guidano nell'esecuzione di richieste al servizio.
Le guide pratiche contengono istruzioni per usare il servizio con modalità più specifiche o personalizzate.

Funzionalità principali per il riepilogo delle conversazioni

La funzionalità di riepilogo conversazioni supporta le funzionalità seguenti:

Riepiloga: riepiloga una conversazione in un breve paragrafo.
Riepilogo di problemi/risoluzione: funzionalità specifica del call center che fornisce un riepilogo dei problemi e delle soluzioni nelle conversazioni tra gli agenti del servizio clienti e i clienti.
Riepilogo del titolo del capitolo: segmenta una conversazione in capitoli in base agli argomenti illustrati nella conversazione e fornisce titoli di capitolo suggeriti della conversazione di input.
Riepilogo narrativo: genera note dettagliate sulle chiamate, note sulla riunione o riepiloghi di chat della conversazione di input.

Si consideri la conversazione di esempio seguente:

Agente: "Ciao, stai chattando con Rene. Come posso aiutarti?"

Cliente: "Ciao, ho provato a configurare la connessione Wi-Fi per la macchina per espresso Smart Brew 300, ma non ci sono riuscito."

Agente: "Mi dispiace. Vediamo cosa possiamo fare per risolvere questo problema. Tieni premuto il pulsante di connessione Wi-Fi per 3 secondi, quindi fammi sapere se la spia sta lampeggiando lentamente"

Cliente: "Sì, ho premuto il pulsante di connessione Wi-Fi e ora la spia sta lampeggiando lentamente."

Agente: "Ottimo. Grazie! A questo punto, consulta l'app Contoso Coffee. Ti richiede di connetterti alla macchina?"

Cliente: "No. Non è successo niente."

Agente: "Capisco. Grazie. Prova se un ripristino alle impostazioni di fabbrica può risolvere il problema. Tieni premuto il pulsante centrale per 5 secondi per avviare il ripristino alle impostazioni di fabbrica".

Cliente: "Ho provato il ripristino alle impostazioni di fabbrica e ho seguito di nuovo i passaggi precedenti, ma non ha funzionato."

Agente: "Mi dispiace molto. Vediamo se c'è un altro modo per risolvere il problema. Tieni premuto il pulsante per un minuto".

La funzionalità di riepilogo della conversazione semplifica il testo nel modo seguente:

Riepilogo dell'esempio	Commento	Aspetto della conversazione
Il cliente non è in grado di configurare la connessione Wi-Fi per la macchina per espresso Smart Brew 300	un problema del cliente in una conversazione con il cliente e l'agente	problema
L'agente ha suggerito diversi passaggi per la risoluzione dei problemi, tra cui la verifica della connessione Wi-Fi, il controllo dell'app Contoso Coffee e l'esecuzione di un ripristino delle impostazioni predefinite. Tuttavia, nessuno di questi passaggi ha risolto il problema. L'agente ha quindi messo in attesa il cliente per cercare un'altra soluzione.	soluzioni provate in una conversazione con il cliente e l'agente	resolution
Il cliente ha contattato l'agente per assistenza nella configurazione di una connessione Wi-Fi per la macchina per espresso Smart Brew 300. L'agente ha guidato il cliente attraverso diversi passaggi per la risoluzione dei problemi, tra cui un controllo della connessione Wi-Fi, la verifica della luce elettrica e un ripristino delle impostazioni predefinite. Nonostante questi passaggi, il problema persiste. L'agente ha quindi deciso di esplorare altre possibili soluzioni	Riepiloga una conversazione in un paragrafo	riepilogo
Risoluzione dei problemi relativi alla macchina per espresso Smart Brew 300	Segmenta una conversazione e genera un titolo per ogni segmento, di solito in collaborazione con aspetto `narrative`	chapterTitle
Il cliente ha difficoltà a configurare una connessione Wi-Fi per la macchina per espresso Smart Brew 300. L'agente suggerisce diverse soluzioni, tra cui un ripristino delle impostazioni predefinite, ma il problema persiste.	Segmenta una conversazione e genera un riepilogo per ogni segmento; di solito in collaborazione con aspetto `chapterTitle`	intelligente

Questa documentazione contiene i tipi di articoli seguenti:

Argomenti di avvio rapido, ovvero istruzioni introduttive che guidano nell'esecuzione di richieste al servizio.
Guide pratiche che contengono istruzioni per l'uso del servizio in modi più specifici o personalizzati.

Il riepilogo dei documenti usa tecniche di elaborazione del linguaggio naturale per generare un riepilogo per i documenti.

Un documento nativo fa riferimento al formato di file usato per creare il documento originale, ad esempio Microsoft Word (docx) o un file di documento portatile (pdf). Il supporto di documenti nativi elimina la necessità di pre-elaborazione del testo prima dell'uso delle funzionalità delle risorse di Lingua di Azure AI. Al momento, il supporto dei documenti nativi è disponibile per due tipi di riepilogo:

Riepilogo estrattivo: produce un riepilogo estraendo frasi salienti all'interno del documento, insieme alle informazioni di posizionamento di queste frasi.
- Più frasi estratte: queste frasi incarnano collettivamente l'idea principale del documento. Sono frasi originali estratte dal contenuto del documento di input.
- Punteggio di classificazione: il punteggio di classificazione indica la rilevanza di una frase per l'argomento principale. Il riepilogo del testo classifica le frasi estratte, per determinare se vengono restituite nell'ordine in cui vengono visualizzate o in base alla classificazione. Ad esempio, se si richiede un riepilogo a tre frasi, il riepilogo estrattivo restituisce le tre frasi con punteggio più alto.
- Informazioni sulla posizione: posizione iniziale e lunghezza delle frasi estratte.
Riepilogo astrattivo: genera un riepilogo con frasi o parole concise e coerenti che non sono semplicemente frasi estratte testualmente dal documento originale.
- Testi di riepilogo: il riepilogo astrattivo restituisce un riepilogo per ogni intervallo di input contestuale. Un input lungo può essere segmentato in modo da poter restituire più gruppi di testi di riepilogo con il relativo intervallo di input contestuale.
- Intervallo di input contestuale: intervallo di input usato per generare il testo di riepilogo.

Al momento il Riepilogo del documento supporta i formati di documento nativi seguenti:

Tipo di file	Estensione di file	Descrizione
Testo	`.txt`	Documento di testo non formattato.
Adobe PDF	`.pdf`	Documento formattato con file di documento portatile.
Microsoft Word	`.docx`	File di documento Microsoft Word.

Per altre informazioni, vedere Usare i documenti nativi per l'elaborazione della lingua

Introduzione al riepilogo

Per usare il riepilogo, inviare testo per l'analisi e gestire l'output dell'API nell'applicazione. L'analisi viene eseguita così come è, senza alcuna personalizzazione del modello usato nei dati. Esistono due modi per usare il riepilogo:

Opzione di sviluppo	Descrizione
Language Studio	Language Studio è una piattaforma basata sul Web che consente di provare a collegare entità con esempi di testo senza un account Azure e usando i propri dati quando si effettua l'iscrizione. Per altre informazioni, vedere il sito Web di Language Studio o la guida introduttiva di Language Studio.
API REST o libreria client (SDK di Azure)	Integrare il riepilogo del testo nelle applicazioni usando l'API REST o la libreria client disponibile in varie lingue. Per altre informazioni, vedere la guida introduttiva al riepilogo.

Opzione di sviluppo	Descrizione	Collegamenti
REST API	Integrare il riepilogo delle conversazioni nelle applicazioni usando l'API REST.	Guida introduttiva: Usare il riepilogo delle conversazioni

Il riepilogo personalizzato consente agli utenti di creare modelli di intelligenza artificiale personalizzati per riepilogare testo non strutturato, ad esempio contratti o romanzi. Creando un progetto di riconoscimento di riepilogo personalizzato, gli sviluppatori possono etichettare in modo iterativo i dati, eseguire il training, valutare un modello e migliorarne le prestazioni prima di renderlo disponibile all'uso. La qualità dei dati etichettati influisce notevolmente sulle prestazioni del modello. Per semplificare la compilazione e la personalizzazione del modello, il servizio offre un portale Web personalizzato accessibile tramite Language Studio. È possibile iniziare facilmente a usare il servizio seguendo la procedura descritta in queste istruzioni di avvio rapido.

Opzione di sviluppo	Descrizione
Language Studio	Language Studio è una piattaforma basata sul Web che consente di provare a collegare entità con esempi di testo senza un account Azure e usando i propri dati quando si effettua l'iscrizione. Per altre informazioni, vedere il sito Web di Language Studio o la guida introduttiva di Language Studio.
API REST o libreria client (SDK di Azure)	Integrare il riepilogo del testo nelle applicazioni usando l'API REST o la libreria client disponibile in varie lingue. Per altre informazioni, vedere la guida introduttiva al riepilogo.

Requisiti di input e limiti del servizio

Il riepilogo accetta testo per l'analisi. Per altre informazioni, vedere Limiti di dati e servizi nella guida pratica.
Il riepilogo funziona con varie lingue scritte. Per ulteriori informazioni, vedere Supporto per le lingue.

Documentazione di riferimento ed esempi di codice

Quando si usa il riepilogo testo nelle applicazioni, consultare la documentazione di riferimento e gli esempi seguenti per Lingua di Azure AI:

Lingua / opzione di sviluppo	Documentazione di riferimento	Esempi
C#	Documentazione di C#	Esempi per C#
Java	Documentazione di Java	Esempi di Java
JavaScript	Documentazione di JavaScript	Esempi JavaScript
Python	Documentazione di Python	Esempi per Python

Intelligenza artificiale responsabile

Un sistema di intelligenza artificiale include non solo la tecnologia, ma anche le persone che lo usano, le persone interessate e l'ambiente di distribuzione. Leggere le note sulla trasparenza per il riepilogo, per informazioni sull'uso e sulla distribuzione di intelligenza artificiale responsabile nei sistemi. Per altre informazioni, vedere gli articoli seguenti:

Condividi tramite

Che cos'è il riepilogo?

Funzionalità principali per il riepilogo del testo

Funzionalità principali per il riepilogo delle conversazioni

Introduzione al riepilogo

Requisiti di input e limiti del servizio

Documentazione di riferimento ed esempi di codice

Intelligenza artificiale responsabile

Commenti e suggerimenti

Commenti e suggerimenti

Risorse aggiuntive