Share via


Che cos'è il riepilogo?

Importante

La nostra area di anteprima, Svezia centrale, presenta le nostre tecniche di ottimizzazione LLM più recenti e in continua evoluzione basate su modelli GPT. Si è invitati a provarli con una risorsa Lingua nell'area Svezia centrale.

Il riepilogo delle conversazioni è disponibile solo usando:

  • REST API
  • Python
  • C#

Il riepilogo è una delle funzionalità offerte da Lingua di Azure AI, una raccolta di algoritmi di apprendimento automatico e intelligenza artificiale nel cloud per lo sviluppo di applicazioni intelligenti relative alla lingua scritta. Usare questo articolo per altre informazioni su questa funzionalità e su come usarla nelle applicazioni.

Anche se i servizi sono etichettati per il riepilogo di documenti e conversazioni, il riepilogo del testo accetta solo blocchi di testo normale e il riepilogo della conversazione accetta vari artefatti vocali per consentire al modello di ottenere altre informazioni. Se si vuole elaborare una conversazione, ma interessa solo il testo, è possibile usare il riepilogo del testo per tale scenario.

Questa documentazione contiene i tipi di articoli seguenti:

  • Argomenti di avvio rapido, ovvero istruzioni introduttive che guidano nell'esecuzione di richieste al servizio.
  • Le guide pratiche contengono istruzioni per usare il servizio con modalità più specifiche o personalizzate.

Il riepilogo del testo usa tecniche di elaborazione del linguaggio naturale per generare un riepilogo per i documenti. Esistono due approcci API supportati per il riepilogo automatico: estrazione e astrazione.

Il riepilogo estrattivo estrae frasi che rappresentano collettivamente le informazioni più importanti o rilevanti all'interno del contenuto originale. Il riepilogo astrattivo genera un riepilogo con frasi o parole concise e coerenti che non sono semplicemente estratti di frasi fittizie dal documento originale. Queste funzionalità sono progettate per abbreviare un contenuto che potrebbe essere considerato troppo lungo da leggere.

Funzionalità principali per il riepilogo del testo

Questa API offre due aspetti del riepilogo del testo:

  • Riepilogo estrattivo: genera un riepilogo estraendo le frasi salienti all'interno di un documento.

    • Più frasi estratte: queste frasi incarnano collettivamente l'idea principale del documento. Sono frasi originali estratte dal contenuto del documento di input.
    • Punteggio di classificazione: il punteggio di classificazione indica la rilevanza di una frase per l'argomento principale di un documento. Il riepilogo del testo classifica le frasi estratte, per determinare se vengono restituite nell'ordine in cui vengono visualizzate o in base alla classificazione.
    • Più frasi restituite: determinare il numero massimo di frasi da restituire. Ad esempio, se si richiede un riepilogo a tre frasi, il riepilogo estrattivo restituisce le tre frasi con punteggio più alto.
    • Informazioni sulla posizione: posizione iniziale e lunghezza delle frasi estratte.
  • Riepilogo astrattivo: genera un riepilogo che non usa le stesse parole del documento, ma acquisisce l'idea principale.

    • Testi di riepilogo: il riepilogo astrattivo restituisce un riepilogo per ogni intervallo di input contestuale all'interno del documento. Un documento lungo può essere segmentato in modo da poter restituire più gruppi di testi di riepilogo con il relativo intervallo di input contestuale.
    • Intervallo di input contestuale: intervallo all'interno del documento di input usato per generare il testo di riepilogo.

Si consideri, ad esempio, il paragrafo di testo seguente:

"Microsoft sta cercando di sviluppare l'IA oltre le tecniche esistenti, adottando un approccio all'apprendimento e alla comprensione più olistico e incentrato sull'uomo. In qualità di Chief Technology Officer di Servizi di Azure AI per intelligenza artificiale, ho lavorato con un team di scienziati e ingegneri straordinari per trasformare questa ricerca in una realtà. Nel mio ruolo, godo di una prospettiva unica nella visualizzazione della relazione tra tre attributi della conoscenza umana: testo monolingua (X), segnali sensoriali audiovisivi (Y) e multilingue (Z). All'intersezione di tutti e tre, avviene la magia, ovvero quello che chiamiamo codice XYZ come illustrato nella figura 1: una rappresentazione congiunta per creare un'intelligenza artificiale più potente in grado di parlare, ascoltare, vedere e comprendere meglio gli esseri umani. Crediamo che il codice XYZ ci consentirà di soddisfare la nostra visione a lungo termine: apprendimento induttivo tra domini, modalità di spanning e linguaggi. L'obiettivo è quello di avere modelli con training preliminare in grado di apprendere congiuntamente le rappresentazioni per supportare un'ampia gamma di attività di IA a valle, analogamente a come gli esseri umani fanno oggi. Negli ultimi cinque anni, abbiamo ottenuto prestazioni umane sui benchmark nel riconoscimento vocale conversazionale, nella traduzione automatica, nella risposta alle domande conversazionali, nella comprensione della lettura automatica e nella didascalia delle immagini. Queste cinque innovazioni ci hanno fornito segnali incoraggianti verso le nostre aspirazioni più ambiziose: raggiungere un salto nelle capacità di IA, ottenendo un apprendimento multisensoriale e multilingue più vicino al modo in cui gli esseri umani imparano e comprendono. Credo che il codice XYZ congiunto sia una componente fondamentale di questa aspirazione, se basato su fonti di conoscenza esterne nelle attività di IA a valle."

La richiesta API di riepilogo del testo viene elaborata al ricevimento della richiesta creando un processo per il back-end dell'API. Se il processo ha avuto esito positivo, viene restituito l'output dell'API. L'output è disponibile per il recupero per 24 ore. Oltre questo periodo, l'output viene eliminato. A causa del supporto multilingue e emoji, la risposta può contenere offset di testo. Per altre informazioni, vedere come elaborare gli offset.

Se si usa l'esempio precedente, l'API potrebbe restituire queste frasi riepilogate:

Riepilogo estrattivo:

  • "Microsoft sta cercando di sviluppare l'IA oltre le tecniche esistenti, adottando un approccio all'apprendimento e alla comprensione più olistico e incentrato sull'uomo".
  • "Crediamo che il codice XYZ ci consentirà di soddisfare la nostra visione a lungo termine: apprendimento induttivo tra domini, modalità di spanning e linguaggi".
  • "L'obiettivo è quello di avere modelli con training preliminare in grado di apprendere congiuntamente le rappresentazioni per supportare un'ampia gamma di attività di IA a valle, analogamente a come gli esseri umani fanno oggi".

Riepilogo astrattivo:

  • "Microsoft sta adottando un approccio alla comprensione e all'apprendimento più olistico e incentrato sull'uomo. Crediamo che il codice XYZ ci consentirà di soddisfare la nostra visione a lungo termine: apprendimento induttivo tra domini, modalità di spanning e linguaggi. Negli ultimi cinque anni abbiamo raggiunto le prestazioni umane sui benchmark".

Un documento nativo fa riferimento al formato di file usato per creare il documento originale, ad esempio Microsoft Word (docx) o un file di documento portatile (pdf). Il supporto di documenti nativi elimina la necessità di pre-elaborazione del testo prima dell'uso delle funzionalità delle risorse di Lingua di Azure AI. Attualmente, il supporto nativo dei documenti è disponibile sia per la funzionalità AbstractiveSummarization che per la funzionalità ExtractiveSummarization.

Attualmente il riepilogo del testo supporta i formati di documento nativi seguenti:

Tipo di file Estensione di file Descrizione
Testo .txt Documento di testo non formattato.
Adobe PDF .pdf Documento formattato con file di documento portatile.
Microsoft Word .docx File di documento Microsoft Word.

Per altre informazioni, vedereUsare i documenti nativi per l'elaborazione della lingua

Funzionalità principali per il riepilogo delle conversazioni

La funzionalità di riepilogo conversazioni supporta le funzionalità seguenti:

  • Riepilogo di problemi/risoluzione: funzionalità specifica del call center che fornisce un riepilogo dei problemi e delle soluzioni nelle conversazioni tra gli agenti del servizio clienti e i clienti.
  • Riepilogo del titolo del capitolo: segmenta una conversazione in capitoli in base agli argomenti illustrati nella conversazione e fornisce titoli di capitolo suggeriti della conversazione di input.
  • Riepiloga: riepiloga una conversazione in un breve paragrafo.
  • Riepilogo narrativo: genera note dettagliate sulle chiamate, note sulla riunione o riepiloghi di chat della conversazione di input.
  • Attività di completamento: offre un elenco di attività di completamento descritte nella conversazione di input.

Quando usare il riepilogo di problemi e risoluzione

  • Quando sono presenti aspetti di un "problema" e della sua"risoluzione", ad esempio:
    • Motivo di una chat/chiamata al servizio (problema).
    • La risoluzione del problema.
  • Si desidera ricevere solo un riepilogo incentrato sulle informazioni correlate su problemi e soluzioni.
  • Quando ci sono due partecipanti alla conversazione e si vuole riepilogare ciò che ognuno aveva detto.

Si consideri la conversazione di esempio seguente:

Agente: "Ciao, stai chattando con Rene. Come posso aiutarti?"

Cliente: "Ciao, ho provato a configurare la connessione Wi-Fi per la macchina per espresso Smart Brew 300, ma non ci sono riuscito."

Agente: "Mi dispiace. Vediamo cosa possiamo fare per risolvere questo problema. Tieni premuto il pulsante di connessione Wi-Fi per 3 secondi, quindi fammi sapere se la spia sta lampeggiando lentamente"

Cliente: "Sì, ho premuto il pulsante di connessione Wi-Fi e ora la spia sta lampeggiando lentamente."

Agente: "Ottimo. Grazie! A questo punto, consulta l'app Contoso Coffee. Ti richiede di connetterti alla macchina?"

Cliente: "No. Non è successo niente."

Agente: "Capisco. Grazie. Prova se un ripristino alle impostazioni di fabbrica può risolvere il problema. Tieni premuto il pulsante centrale per 5 secondi per avviare il ripristino alle impostazioni di fabbrica".

Cliente: "Ho provato il ripristino alle impostazioni di fabbrica e ho seguito di nuovo i passaggi precedenti, ma non ha funzionato."

Agente: "Mi dispiace molto. Vediamo se c'è un altro modo per risolvere il problema. Tieni premuto il pulsante per un minuto".

La funzionalità di riepilogo della conversazione semplifica il testo nel modo seguente:

Riepilogo dell'esempio Formato Aspetto della conversazione
Il cliente vuole usare la connessione Wi-Fi sul proprio Smart Brew 300. Ma non funzionava. Una o due frasi problema
Ha controllato se la spia lampeggiava lentamente. Ha controllato l'app Contoso Coffee. Non presentava alcuna richiesta. Ha tentato di eseguire un ripristino alle impostazioni di fabbrica. Una o più frasi generate da più righe della trascrizione. resolution

Introduzione al riepilogo

Per usare il riepilogo, inviare testo per l'analisi e gestire l'output dell'API nell'applicazione. L'analisi viene eseguita così come è, senza alcuna personalizzazione del modello usato nei dati. Esistono due modi per usare il riepilogo:

Opzione di sviluppo Descrizione
Language Studio Language Studio è una piattaforma basata sul Web che consente di provare a collegare entità con esempi di testo senza un account Azure e usando i propri dati quando si effettua l'iscrizione. Per altre informazioni, vedere il sito Web di Language Studio o la guida introduttiva di Language Studio.
API REST o libreria client (SDK di Azure) Integrare il riepilogo del testo nelle applicazioni usando l'API REST o la libreria client disponibile in varie lingue. Per altre informazioni, vedere la guida introduttiva al riepilogo.

Requisiti di input e limiti del servizio

Documentazione di riferimento ed esempi di codice

Quando si usa il riepilogo testo nelle applicazioni, consultare la documentazione di riferimento e gli esempi seguenti per Lingua di Azure AI:

Lingua / opzione di sviluppo Documentazione di riferimento Esempi
C# Documentazione di C# Esempi per C#
Java Documentazione di Java Esempi di Java
JavaScript Documentazione di JavaScript Esempi JavaScript
Python Documentazione di Python Esempi per Python

Intelligenza artificiale responsabile

Un sistema di intelligenza artificiale include non solo la tecnologia, ma anche le persone che lo usano, le persone interessate e l'ambiente di distribuzione. Leggere le note sulla trasparenza per il riepilogo, per informazioni sull'uso e sulla distribuzione di intelligenza artificiale responsabile nei sistemi. Per altre informazioni, vedere gli articoli seguenti: