Condividi tramite


Che cos'è il riepilogo?

Importante

La nostra area di anteprima, Svezia centrale, presenta le nostre tecniche di ottimizzazione LLM più recenti e in continua evoluzione basate su modelli GPT. Si è invitati a provarli con una risorsa Lingua nell'area Svezia centrale.

Il riepilogo delle conversazioni è disponibile solo usando:

  • REST API
  • Python
  • C#

Il riepilogo è una delle funzionalità offerte da Lingua di Azure AI, una raccolta di algoritmi di apprendimento automatico e intelligenza artificiale nel cloud per lo sviluppo di applicazioni intelligenti relative alla lingua scritta. Usare questo articolo per altre informazioni su questa funzionalità e su come usarla nelle applicazioni.

Anche se i servizi sono etichettati per il riepilogo di documenti e conversazioni, il riepilogo del testo accetta solo blocchi di testo normale e il riepilogo della conversazione accetta vari artefatti vocali per consentire al modello di ottenere altre informazioni. Se si vuole elaborare una conversazione, ma interessa solo il testo, è possibile usare il riepilogo del testo per tale scenario.

Questa documentazione contiene i tipi di articoli seguenti:

  • Argomenti di avvio rapido, ovvero istruzioni introduttive che guidano nell'esecuzione di richieste al servizio.
  • Le guide pratiche contengono istruzioni per usare il servizio con modalità più specifiche o personalizzate.

Il riepilogo del testo usa tecniche di elaborazione del linguaggio naturale per generare un riepilogo per i documenti. Esistono due approcci API supportati per il riepilogo automatico: estrazione e astrazione.

Il riepilogo estrattivo estrae frasi che rappresentano collettivamente le informazioni più importanti o rilevanti all'interno del contenuto originale. Il riepilogo astrattivo genera un riepilogo con frasi o parole concise e coerenti che non sono semplicemente estratti di frasi fittizie dal documento originale. Queste funzionalità sono progettate per abbreviare un contenuto che potrebbe essere considerato troppo lungo da leggere.

Funzionalità principali per il riepilogo del testo

Questa API offre due aspetti del riepilogo del testo:

  • Riepilogo estrattivo: genera un riepilogo estraendo le frasi salienti all'interno di un documento.

    • Più frasi estratte: queste frasi incarnano collettivamente l'idea principale del documento. Sono frasi originali estratte dal contenuto del documento di input.
    • Punteggio di classificazione: il punteggio di classificazione indica la rilevanza di una frase per l'argomento principale di un documento. Il riepilogo del testo classifica le frasi estratte, per determinare se vengono restituite nell'ordine in cui vengono visualizzate o in base alla classificazione.
    • Più frasi restituite: determinare il numero massimo di frasi da restituire. Ad esempio, se si richiede un riepilogo a tre frasi, il riepilogo estrattivo restituisce le tre frasi con punteggio più alto.
    • Informazioni sulla posizione: posizione iniziale e lunghezza delle frasi estratte.
  • Riepilogo astrattivo: genera un riepilogo che non usa le stesse parole del documento, ma acquisisce l'idea principale.

    • Testi di riepilogo: il riepilogo astrattivo restituisce un riepilogo per ogni intervallo di input contestuale all'interno del documento. Un documento lungo può essere segmentato in modo da poter restituire più gruppi di testi di riepilogo con il relativo intervallo di input contestuale.
    • Intervallo di input contestuale: intervallo all'interno del documento di input usato per generare il testo di riepilogo.

Si consideri, ad esempio, il paragrafo di testo seguente:

"Microsoft sta cercando di sviluppare l'IA oltre le tecniche esistenti, adottando un approccio all'apprendimento e alla comprensione più olistico e incentrato sull'uomo. In qualità di Chief Technology Officer di Servizi di Azure AI per intelligenza artificiale, ho lavorato con un team di scienziati e ingegneri straordinari per trasformare questa ricerca in una realtà. Nel mio ruolo, godo di una prospettiva unica nella visualizzazione della relazione tra tre attributi della conoscenza umana: testo monolingua (X), segnali sensoriali audiovisivi (Y) e multilingue (Z). All'intersezione di tutti e tre, avviene la magia, ovvero quello che chiamiamo codice XYZ come illustrato nella figura 1: una rappresentazione congiunta per creare un'intelligenza artificiale più potente in grado di parlare, ascoltare, vedere e comprendere meglio gli esseri umani. Crediamo che il codice XYZ ci consentirà di soddisfare la nostra visione a lungo termine: apprendimento induttivo tra domini, modalità di spanning e linguaggi. L'obiettivo è quello di avere modelli con training preliminare in grado di apprendere congiuntamente le rappresentazioni per supportare un'ampia gamma di attività di IA a valle, analogamente a come gli esseri umani fanno oggi. Negli ultimi cinque anni, abbiamo ottenuto prestazioni umane sui benchmark nel riconoscimento vocale conversazionale, nella traduzione automatica, nella risposta alle domande conversazionali, nella comprensione della lettura automatica e nella didascalia delle immagini. Queste cinque innovazioni ci hanno fornito segnali incoraggianti verso le nostre aspirazioni più ambiziose: raggiungere un salto nelle capacità di IA, ottenendo un apprendimento multisensoriale e multilingue più vicino al modo in cui gli esseri umani imparano e comprendono. Credo che il codice XYZ congiunto sia una componente fondamentale di questa aspirazione, se basato su fonti di conoscenza esterne nelle attività di IA a valle."

La richiesta API di riepilogo del testo viene elaborata al ricevimento della richiesta creando un processo per il back-end dell'API. Se il processo ha avuto esito positivo, viene restituito l'output dell'API. L'output è disponibile per il recupero per 24 ore. Oltre questo periodo, l'output viene eliminato. A causa del supporto multilingue e emoji, la risposta può contenere offset di testo. Per altre informazioni, vedere come elaborare gli offset.

Se si usa l'esempio precedente, l'API potrebbe restituire queste frasi riepilogate:

Riepilogo estrattivo:

  • "Microsoft sta cercando di sviluppare l'IA oltre le tecniche esistenti, adottando un approccio all'apprendimento e alla comprensione più olistico e incentrato sull'uomo".
  • "Crediamo che il codice XYZ ci consentirà di soddisfare la nostra visione a lungo termine: apprendimento induttivo tra domini, modalità di spanning e linguaggi".
  • "L'obiettivo è quello di avere modelli con training preliminare in grado di apprendere congiuntamente le rappresentazioni per supportare un'ampia gamma di attività di IA a valle, analogamente a come gli esseri umani fanno oggi".

Riepilogo astrattivo:

  • "Microsoft sta adottando un approccio alla comprensione e all'apprendimento più olistico e incentrato sull'uomo. Crediamo che il codice XYZ ci consentirà di soddisfare la nostra visione a lungo termine: apprendimento induttivo tra domini, modalità di spanning e linguaggi. Negli ultimi cinque anni abbiamo raggiunto le prestazioni umane sui benchmark".

Introduzione al riepilogo

Per usare il riepilogo, inviare testo per l'analisi e gestire l'output dell'API nell'applicazione. L'analisi viene eseguita così come è, senza alcuna personalizzazione del modello usato nei dati. Esistono due modi per usare il riepilogo:

Opzione di sviluppo Descrizione
Language Studio Language Studio è una piattaforma basata sul Web che consente di provare a collegare entità con esempi di testo senza un account Azure e usando i propri dati quando si effettua l'iscrizione. Per altre informazioni, vedere il sito Web di Language Studio o la guida introduttiva di Language Studio.
API REST o libreria client (SDK di Azure) Integrare il riepilogo del testo nelle applicazioni usando l'API REST o la libreria client disponibile in varie lingue. Per altre informazioni, vedere la guida introduttiva al riepilogo.

Requisiti di input e limiti del servizio

Documentazione di riferimento ed esempi di codice

Quando si usa il riepilogo testo nelle applicazioni, consultare la documentazione di riferimento e gli esempi seguenti per Lingua di Azure AI:

Lingua / opzione di sviluppo Documentazione di riferimento Esempi
C# Documentazione di C# Esempi per C#
Java Documentazione di Java Esempi di Java
JavaScript Documentazione di JavaScript Esempi JavaScript
Python Documentazione di Python Esempi per Python

Intelligenza artificiale responsabile

Un sistema di intelligenza artificiale include non solo la tecnologia, ma anche le persone che lo usano, le persone interessate e l'ambiente di distribuzione. Leggere le note sulla trasparenza per il riepilogo, per informazioni sull'uso e sulla distribuzione di intelligenza artificiale responsabile nei sistemi. Per altre informazioni, vedere gli articoli seguenti: