Che cos'è il riepilogo di documenti e conversazioni?

Importante

La nostra area di anteprima, Svezia centrale, presenta le nostre tecniche di ottimizzazione LLM più recenti e in continua evoluzione basate su modelli GPT. Si è invitati a provarli con una risorsa lingua nell'area centrale della Svezia.

Il riepilogo della conversazione è disponibile solo usando:

  • REST API
  • Python
  • C#

Il riepilogo è una delle funzionalità offerte dal linguaggio di intelligenza artificiale di Azure, una raccolta di algoritmi di Machine Learning e intelligenza artificiale nel cloud per lo sviluppo di applicazioni intelligenti che coinvolgono il linguaggio scritto. Usare questo articolo per altre informazioni su questa funzionalità e su come usarla nelle applicazioni.

Anche se i servizi sono etichettati per il riepilogo di documenti e conversazioni, il riepilogo dei documenti accetta solo blocchi di testo normale e il riepilogo della conversazione accetta vari artefatti vocali per consentire al modello di ottenere altre informazioni. Se si vuole elaborare una conversazione, ma solo il testo, è possibile usare il riepilogo dei documenti per tale scenario.

Riepilogo personalizzato consente agli utenti di creare modelli di intelligenza artificiale personalizzati per riepilogare testo non strutturato, ad esempio contratti o romanzi. Creando un progetto di riepilogo personalizzato, gli sviluppatori possono etichettare in modo iterativo i dati, eseguire il training, valutare e migliorare le prestazioni del modello prima di renderli disponibili per l'utilizzo. La qualità dei dati etichettati influisce notevolmente sulle prestazioni del modello. Per semplificare la compilazione e la personalizzazione del modello, il servizio offre un portale Web personalizzato accessibile tramite Language Studio. È possibile iniziare facilmente a usare il servizio seguendo la procedura descritta in questa guida introduttiva.

Questa documentazione contiene i tipi di articolo seguenti:

Il riepilogo dei documenti usa tecniche di elaborazione del linguaggio naturale per generare un riepilogo per i documenti. Esistono due approcci API supportati per il riepilogo automatico: estrazione e astrazione.

Il riepilogo estrae frasi che rappresentano collettivamente le informazioni più importanti o rilevanti all'interno del contenuto originale. Il riepilogo astrattivo genera un riepilogo con frasi o parole concise, coerenti che non sono frasi di estrazione verbatim dal documento originale. Queste funzionalità sono progettate per abbreviare il contenuto che potrebbe essere considerato troppo lungo da leggere.

Supporto per documenti nativi

Un documento nativo fa riferimento al formato di file usato per creare il documento originale, ad esempio Microsoft Word (docx) o un file di documento portatile (pdf). Il supporto di documenti nativi elimina la necessità di pre-elaborazione del testo prima di usare le funzionalità delle risorse del linguaggio di intelligenza artificiale di Azure. Attualmente, il supporto dei documenti nativi è disponibile sia per le funzionalità AbstractiveSummarization che ExtractiveSummarization.

Attualmente Document Summarization supporta i formati di documento nativi seguenti:

Tipo di file Estensione di file Descrizione
Testo .txt Documento di testo non formattato.
Adobe PDF .pdf Documento formattato con file di documento portabile.
Microsoft Word .docx Un file di documento di Microsoft Word.

Per altre informazioni, vedereUsare documenti nativi per l'elaborazione della lingua

Funzionalità chiave

Questa API offre due tipi di riepilogo dei documenti:

  • Riepilogo estrativo: produce un riepilogo estraendo frasi salienti all'interno del documento.

    • Più frasi estratte: queste frasi trasmettono collettivamente l'idea principale del documento. Sono frasi originali estratte dal contenuto del documento di input.
    • Punteggio di classificazione: il punteggio di classificazione indica la rilevanza di una frase per l'argomento principale di un documento. Il riepilogo dei documenti classifica le frasi estratte ed è possibile determinare se vengono restituite nell'ordine in cui vengono visualizzate o in base alla classificazione.
    • Più frasi restituite: determinare il numero massimo di frasi da restituire. Ad esempio, se si richiede un riepilogo di riepilogo a tre frasi, restituisce le tre frasi con punteggio più alto.
    • Informazioni posizionali: posizione iniziale e lunghezza delle frasi estratte.
  • Riepilogo astrazione: genera un riepilogo che non usa le stesse parole del documento, ma acquisisce l'idea principale.

    • Testi di riepilogo: riepilogo astratto restituisce un riepilogo per ogni intervallo di input contestuale all'interno del documento. Un documento lungo può essere segmentato in modo da poter restituire più gruppi di testi di riepilogo con il relativo intervallo di input contestuale.
    • Intervallo di input contestuale: intervallo all'interno del documento di input usato per generare il testo di riepilogo.

Si consideri ad esempio il paragrafo di testo seguente:

"Microsoft sta cercando di promuovere l'IA oltre le tecniche esistenti, adottando un approccio più olistico e incentrato sull'uomo per imparare e comprendere. Come Chief Technology Officer dei servizi di intelligenza artificiale di Azure, ho lavorato con un team di scienziati e ingegneri incredibili per trasformare questa ricerca in una realtà. Nel mio ruolo, godo di una prospettiva unica nella visualizzazione della relazione tra tre attributi della conoscenza umana: testo monolinguale (X), segnali sensoriali audio o visivi, (Y) e multilingue (Z). All'intersezione di tutti e tre, c'è la magia, ovvero quello che chiamiamo XYZ-code come illustrato nella figura 1, una rappresentazione congiunta per creare un'intelligenza artificiale più potente in grado di parlare, ascoltare, vedere e comprendere meglio gli esseri umani. Crediamo che XYZ-code ci consenta di soddisfare la nostra visione a lungo termine: apprendimento tra domini di trasferimento, spanning modalità e linguaggi. L'obiettivo è avere modelli con training preliminare in grado di apprendere congiuntamente le rappresentazioni per supportare un'ampia gamma di attività di IA downstream, molto nel modo in cui gli esseri umani fanno oggi. Negli ultimi cinque anni, si ottengono prestazioni umane sui benchmark del riconoscimento vocale conversazionale, traduzione automatica, risposte alle domande conversazionali, comprensione della lettura automatica e didascalia delle immagini. Queste cinque innovazioni ci hanno fornito segnali forti verso le nostre aspirazioni più ambiziose di produrre un salto nelle capacità di IA, ottenendo apprendimento multisensoriale e multilingue più vicino in linea con il modo in cui gli esseri umani imparano e comprendono. Credo che il codice XYZ congiunto sia una componente fondamentale di questa aspirazione, se basata su fonti di conoscenza esterne nelle attività di IA downstream".

La richiesta API di riepilogo del documento viene elaborata al ricevimento della richiesta creando un processo per il back-end dell'API. Se il processo ha avuto esito positivo, viene restituito l'output dell'API. L'output è disponibile per il recupero per 24 ore. Dopo questa volta, l'output viene eliminato. A causa del supporto multilingue ed emoji, la risposta può contenere offset di testo. Per altre informazioni, vedere come elaborare gli offset.

Se si usa l'esempio precedente, l'API potrebbe restituire queste frasi riepilogate:

Riepilogo estrativo:

  • "Microsoft sta cercando di promuovere l'IA oltre le tecniche esistenti, adottando un approccio più olistico e incentrato sull'uomo per imparare e comprendere".
  • "Crediamo che XYZ-code ci consenta di soddisfare la nostra visione a lungo termine: apprendimento tra domini di trasferimento, spanning modalità e linguaggi."
  • "L'obiettivo è avere modelli con training preliminare in grado di apprendere congiuntamente le rappresentazioni per supportare un'ampia gamma di attività di IA downstream, molto nel modo in cui gli esseri umani fanno oggi".

Riepilogo astratto:

  • "Microsoft sta prendendo un approccio più olistico e incentrato sull'uomo per imparare e comprendere. Crediamo che XYZ-code ci consenta di soddisfare la nostra visione a lungo termine: apprendimento tra domini di trasferimento, spanning modalità e linguaggi. Negli ultimi cinque anni, abbiamo ottenuto prestazioni umane sui benchmark nel riconoscimento vocale conversazionale".

Introduzione al riepilogo

Per usare il riepilogo, inviare per l'analisi e gestire l'output dell'API nell'applicazione. L'analisi viene eseguita così come è, senza alcuna personalizzazione aggiunta al modello usato nei dati. Esistono due modi per usare il riepilogo:

Opzione di sviluppo Descrizione
Language Studio Language Studio è una piattaforma basata sul Web che consente di provare il collegamento di entità con esempi di testo senza un account Azure e i propri dati quando si effettua l'iscrizione. Per altre informazioni, vedere il sito Web di Language Studio o la guida introduttiva di Language Studio.
API REST o libreria client (Azure SDK) Integrare il riepilogo dei documenti nelle applicazioni usando l'API REST o la libreria client disponibile in varie lingue. Per altre informazioni, vedere la guida introduttiva di riepilogo.

Requisiti di input e limiti del servizio

Documentazione di riferimento ed esempi di codice

Quando si usa il riepilogo dei documenti nelle applicazioni, vedere la documentazione di riferimento e gli esempi seguenti per il linguaggio di intelligenza artificiale di Azure:

Opzione di sviluppo/linguaggio Documentazione di riferimento Esempi
C# Documentazione di C# Esempi di C#
Java Documentazione di Java Esempi di Java
JavaScript Documentazione di JavaScript Esempi JavaScript
Python Documentazione di Python Esempi per Python

Intelligenza artificiale responsabile

Un sistema di intelligenza artificiale include non solo la tecnologia, ma anche le persone che lo usano, le persone interessate e l'ambiente di distribuzione. Leggere la nota sulla trasparenza per riepilogare per informazioni sull'uso e sulla distribuzione di intelligenza artificiale responsabili nei sistemi. Per altre informazioni, vedere gli articoli seguenti: