Spiegazione del riepilogo estrattivo
Il riepilogo estrativo produce un riepilogo estraendo frasi essenziali direttamente dal testo originale. Anziché generare nuovo testo, usa tecniche di elaborazione del linguaggio naturale per individuare le frasi che collettivamente trasmettono l'idea o il contesto principale di un documento.
L'estrazione del riepilogo viene eseguita usando la funzione summarize_extractive() disponibile nello schema azure_cognitive dell'estensione azure_ai. Lo schema azure_cognitive contiene tre overload della funzione summarize_extractive(). L'elenco degli argomenti previsti dai tre overload di funzione include:
| Argomentazione | TIPO | Impostazione predefinita | Descrizione |
|---|---|---|---|
| testo |
text o text[] |
Testo di cui devono essere generati i riepiloghi. | |
| language_text |
text o text[] |
Codice linguistico (o matrice di codici linguistici) che rappresenta la lingua del testo da riepilogare. Esaminare l'elenco delle lingue supportate per recuperare i codici di lingua necessari. | |
| sentence_count | integer |
3 | Numero delle frasi di riepilogo da generare. |
| ordina_per | text |
'offset' | Ordinamento per le frasi di riepilogo generate. I valori accettabili sono "offset" e "rank", con offset che rappresenta la posizione iniziale di ogni frase estratta all'interno del contenuto originale e la classificazione è un indicatore generato dall'intelligenza artificiale del modo in cui una frase è rilevante per l'idea principale del contenuto. |
| batch_size | integer |
25 | Solo per i due overload che prevedono un input di text[]. Specifica il numero dei record da elaborare alla volta. |
| disable_service_logs | boolean |
falso | Flag che indica se disattivare i log del servizio. |
| timeout_ms | integer |
NULLO | Timeout in millisecondi dopo il quale l'operazione viene arrestata. |
| throw_on_error | boolean |
true | Flag che indica se la funzione deve, in caso di errore, generare un'eccezione, generando un rollback delle transazioni di wrapping. |
| max_attempts | integer |
1 | Numero di tentativi di ripetizione della chiamata a Foundry Tools in caso di errore. |
| retry_delay_ms | integer |
1000 | Periodo di tempo, in millisecondi, da attendere prima di tentare di ripetere la chiamata all'endpoint di Foundry Tools. |
Ogni funzione restituisce una matrice di frasi estratte e un punteggio di rango per ognuno di essi, usando il tipo composito azure_cognitive.sentence, come illustrato nella tabella seguente:
Composite type "azure_cognitive.sentence"
Column | Type | Collation | Nullable | Default | Storage | Description
------------+------------------+-----------+----------+---------+----------+-------------
text | text | | | | extended |
rank_score | double precision | | | | plain |
azure_cognitive.sentence è un tipo composito contenente il testo di una frase estrattiva e un punteggio di rango per ogni frase. Il punteggio di classificazione, un valore compreso tra 0 e 1 (inclusi), indica quanto sia rilevante una frase per l'idea principale del documento originale. Il riepilogo dei documenti classifica le frasi estratte ed è possibile determinare se vengono restituite nell'ordine in cui vengono visualizzate o in base alla classificazione usando il parametro sort_by della funzione.
Generare riepiloghi estrattivi per le descrizioni delle proprietà
In qualità di sviluppatore per Margie's Travel, si vuole valutare la tecnica di riepilogo estratto accessibile tramite l'estensione azure_ai e gli strumenti Foundry e valutare la possibilità del metodo di generare riepiloghi concisi e in linguaggio naturale di descrizioni di proprietà lunghe, ad esempio questa descrizione dal primo elenco nel database:
“Sentiti a casa vostra in questo affascinante appartamento con una camera da letto, situato in posizione centrale sul lato ovest di Queen Anne Hill. Questo appartamento privato con arredi eleganti (unità inferiore di un duplex) dispone di una planimetria aperta con pavimenti in bambù, cucina completamente attrezzata, televisione, lettore DVD, cavo di base e una confortevole camera da letto con letto queen-size. L'unità può ospitare quattro persone (due nella camera da letto e due sul comodo divano letto apribile, biancheria inclusa) e include WiFi gratuito e lavanderia. L'appartamento si apre su una terrazza privata, completa di barbecue, con vista su un giardino e una foresta di bambù nero. L'appartamento si trova in una posizione perfetta, a un solo isolato dalle linee degli autobus, dove è possibile prendere un autobus e raggiungere il centro di Seattle in 15 minuti o il centro storico di Ballard in 10 minuti. Con una breve passeggiata di cinque minuti si raggiungono un negozio di alimentari naturali e delle caffetterie. Oppure basta fare una passeggiata di quindici minuti fino alla cima della Queen Anne Hill, dove si trovano vari negozi eclettici, bar e ristoranti".
È necessario richiedere un riepilogo a due frasi della descrizione della proprietà precedente usando la query seguente:
SELECT
azure_cognitive.summarize_extractive(description, 'en', 2) AS extractive_summary
FROM listings
WHERE id = 1;
Il riepilogo estrattivo restituisce le due frasi con punteggio più alto del testo originale, insieme al punteggio di classificazione per ognuna:
{
"("Make your self at home in this charming one-bedroom apartment, centrally-located on the west side of Queen Anne hill.",1)",
"("This elegantly-decorated, completely private apartment (bottom unit of a duplex) has an open floor plan, bamboo floors, a fully equipped kitchen, a TV, DVD player, basic cable, and a very cozy bedroom with a queen-size bed.",0.49)"
}