Condividi tramite


Che cos'è il riepilogo?

Importante

La nostra area di anteprima, Svezia centrale, presenta le nostre tecniche di ottimizzazione LLM più recenti e in continua evoluzione basate su modelli GPT. Si è invitati a provarli con una risorsa Lingua nell'area Svezia centrale.

Il riepilogo delle conversazioni è disponibile solo usando:

  • REST API
  • Python
  • C#

Il riepilogo è una funzionalità offerta da Lingua di Azure AI, che è una combinazione di modelli di linguaggio di grandi dimensioni generativi e modelli di codificatore ottimizzati per le attività che offrono soluzioni di riepilogo di qualità superiore, un'efficienza dei costi e una latenza inferiore. Usare questo articolo per altre informazioni su questa funzionalità e su come usarla nelle applicazioni.

Il servizio offre soluzioni di riepilogo per tre tipi di genere, testi semplici, conversazioni e documenti nativi. Il riepilogo del testo accetta solo blocchi di testo normale e il riepilogo conversazioni accetta input di conversazione, inclusi vari segnali audio vocali per consentire al modello di segmentare e riepilogare in modo efficace, e il documento nativo può riepilogare direttamente i documenti nei formati nativi, ad esempio Parole, PDF e così via.

Questa documentazione contiene i tipi di articoli seguenti:

  • Argomenti di avvio rapido, ovvero istruzioni introduttive che guidano nell'esecuzione di richieste al servizio.
  • Le guide pratiche contengono istruzioni per usare il servizio con modalità più specifiche o personalizzate.

Queste funzionalità sono progettate per abbreviare un contenuto che potrebbe essere considerato troppo lungo da leggere.

Funzionalità principali per il riepilogo del testo

Il riepilogo del testo usa tecniche di elaborazione del linguaggio naturale per generare un riepilogo di testi semplici, che possono essere da un documento o una conversazione o da qualsiasi testo. Questa API offre due approcci di riepilogo:

  • Riepilogo estrattivo: produce un riepilogo estraendo frasi salienti all'interno del documento, insieme alle informazioni di posizionamento di queste frasi.

    • Più frasi estratte: queste frasi incarnano collettivamente l'idea principale del documento. Sono frasi originali estratte dal contenuto del documento di input.
    • Punteggio di classificazione: il punteggio di classificazione indica la rilevanza di una frase per l'argomento principale. Il riepilogo del testo classifica le frasi estratte, per determinare se vengono restituite nell'ordine in cui vengono visualizzate o in base alla classificazione. Ad esempio, se si richiede un riepilogo a tre frasi, il riepilogo estrattivo restituisce le tre frasi con punteggio più alto.
    • Informazioni sulla posizione: posizione iniziale e lunghezza delle frasi estratte.
  • Riepilogo astrattivo: genera un riepilogo con frasi o parole concise e coerenti che non sono semplicemente estratti di frasi fittizie dal documento originale.

    • Testi di riepilogo: il riepilogo astrattivo restituisce un riepilogo per ogni intervallo di input contestuale. Un input lungo può essere segmentato in modo da poter restituire più gruppi di testi di riepilogo con il relativo intervallo di input contestuale.
    • Intervallo di input contestuale: intervallo di input usato per generare il testo di riepilogo.

Si consideri, ad esempio, il paragrafo di testo seguente:

"Microsoft sta cercando di sviluppare l'IA oltre le tecniche esistenti, adottando un approccio all'apprendimento e alla comprensione più olistico e incentrato sull'uomo. In qualità di Chief Technology Officer di Servizi di Azure AI per intelligenza artificiale, ho lavorato con un team di scienziati e ingegneri straordinari per trasformare questa ricerca in una realtà. Nel mio ruolo, godo di una prospettiva unica nella visualizzazione della relazione tra tre attributi della conoscenza umana: testo monolingua (X), segnali sensoriali audiovisivi (Y) e multilingue (Z). All'intersezione di tutti e tre, avviene la magia, ovvero quello che chiamiamo codice XYZ come illustrato nella figura 1: una rappresentazione congiunta per creare un'intelligenza artificiale più potente in grado di parlare, ascoltare, vedere e comprendere meglio gli esseri umani. Crediamo che il codice XYZ ci consentirà di soddisfare la nostra visione a lungo termine: apprendimento induttivo tra domini, modalità di spanning e linguaggi. L'obiettivo è quello di avere modelli con training preliminare in grado di apprendere congiuntamente le rappresentazioni per supportare un'ampia gamma di attività di IA a valle, analogamente a come gli esseri umani fanno oggi. Negli ultimi cinque anni, abbiamo ottenuto prestazioni umane sui benchmark nel riconoscimento vocale conversazionale, nella traduzione automatica, nella risposta alle domande conversazionali, nella comprensione della lettura automatica e nella didascalia delle immagini. Queste cinque innovazioni ci hanno fornito segnali incoraggianti verso le nostre aspirazioni più ambiziose: raggiungere un salto nelle capacità di IA, ottenendo un apprendimento multisensoriale e multilingue più vicino al modo in cui gli esseri umani imparano e comprendono. Credo che il codice XYZ congiunto sia una componente fondamentale di questa aspirazione, se basato su fonti di conoscenza esterne nelle attività di IA a valle."

La richiesta API di riepilogo del testo viene elaborata al ricevimento della richiesta creando un processo per il back-end dell'API. Se il processo ha avuto esito positivo, viene restituito l'output dell'API. L'output è disponibile per il recupero per 24 ore. Oltre questo periodo, l'output viene eliminato. A causa del supporto multilingue e emoji, la risposta può contenere offset di testo. Per altre informazioni, vedere come elaborare gli offset.

Se si usa l'esempio precedente, l'API potrebbe restituire questi riepiloghi:

Riepilogo estrattivo:

  • "Microsoft sta cercando di sviluppare l'IA oltre le tecniche esistenti, adottando un approccio all'apprendimento e alla comprensione più olistico e incentrato sull'uomo".
  • "Crediamo che il codice XYZ ci consentirà di soddisfare la nostra visione a lungo termine: apprendimento induttivo tra domini, modalità di spanning e linguaggi".
  • "L'obiettivo è quello di avere modelli con training preliminare in grado di apprendere congiuntamente le rappresentazioni per supportare un'ampia gamma di attività di IA a valle, analogamente a come gli esseri umani fanno oggi".

Riepilogo astrattivo:

  • "Microsoft sta adottando un approccio alla comprensione e all'apprendimento più olistico e incentrato sull'uomo. Crediamo che il codice XYZ ci consentirà di soddisfare la nostra visione a lungo termine: apprendimento induttivo tra domini, modalità di spanning e linguaggi. Negli ultimi cinque anni abbiamo raggiunto le prestazioni umane sui benchmark".

Introduzione al riepilogo

Per usare il riepilogo, inviare testo per l'analisi e gestire l'output dell'API nell'applicazione. L'analisi viene eseguita così come è, senza alcuna personalizzazione del modello usato nei dati. Esistono due modi per usare il riepilogo:

Opzione di sviluppo Descrizione
Language Studio Language Studio è una piattaforma basata sul Web che consente di provare a collegare entità con esempi di testo senza un account Azure e usando i propri dati quando si effettua l'iscrizione. Per altre informazioni, vedere il sito Web di Language Studio o la guida introduttiva di Language Studio.
API REST o libreria client (SDK di Azure) Integrare il riepilogo del testo nelle applicazioni usando l'API REST o la libreria client disponibile in varie lingue. Per altre informazioni, vedere la guida introduttiva al riepilogo.

Requisiti di input e limiti del servizio

Documentazione di riferimento ed esempi di codice

Quando si usa il riepilogo testo nelle applicazioni, consultare la documentazione di riferimento e gli esempi seguenti per Lingua di Azure AI:

Lingua / opzione di sviluppo Documentazione di riferimento Esempi
C# Documentazione di C# Esempi per C#
Java Documentazione di Java Esempi di Java
JavaScript Documentazione di JavaScript Esempi JavaScript
Python Documentazione di Python Esempi per Python

Intelligenza artificiale responsabile

Un sistema di intelligenza artificiale include non solo la tecnologia, ma anche le persone che lo usano, le persone interessate e l'ambiente di distribuzione. Leggere le note sulla trasparenza per il riepilogo, per informazioni sull'uso e sulla distribuzione di intelligenza artificiale responsabile nei sistemi. Per altre informazioni, vedere gli articoli seguenti: