Förklara extraktiv sammanfattning
Extraktiv sammanfattning skapar en sammanfattning genom att direkt extrahera viktiga meningar från originaltexten. I stället för att generera ny text använder den bearbetningstekniker för naturligt språk för att hitta meningar som tillsammans förmedlar ett dokuments primära idé eller kontext.
Extraherande sammanfattning utförs med hjälp av funktionen summarize_extractive() som finns i azure_cognitive schemat för azure_ai-tillägget. Schemat azure_cognitive innehåller tre överlagringar av funktionen summarize_extractive(). Listan med argument som de tre funktionsöverbelastningarna förväntar sig är:
| Argumentation | Typ | Standardinställning | Beskrivning |
|---|---|---|---|
| text |
text eller text[] |
De text(er) som sammanfattningar ska genereras för. | |
| language_text |
text eller text[] |
Språkkod (eller matris med språkkoder) som representerar språket i texten som ska sammanfattas. Granska lista över språk som stöds för att hämta nödvändiga språkkoder. | |
| sentence_count | integer |
3 | Antalet sammanfattnings meningar som ska genereras. |
| sortera_efter | text |
förskjutning | Sorteringsordningen för de genererade sammanfattnings meningarna. Acceptabla värden är "offset" och "rank", med förskjutning som representerar startpositionen för varje extraherad mening i det ursprungliga innehållet och rangordningen är en AI-genererad indikator på hur relevant en mening är för huvudtanken med innehållet. |
| batchstorlek | integer |
25 | Endast för de två överlagringar som förväntar sig indata av text[]. Anger hur många poster som ska bearbetas åt gången. |
| inaktivera tjänsteloggar | boolean |
falskt | Flagga som anger om tjänstloggar ska stängas av. |
| timeout_ms | integer |
NOLL | Timeout i millisekunder varefter åtgärden stoppas. |
| throw_on_error | boolean |
sann | Flagga som anger om funktionen vid fel ska utlösa ett undantag som resulterar i en återställning av omslutningstransaktionen. |
| max_försök | integer |
1 | Antal gånger som anropet till Foundry Tools ska utföras igen i händelse av ett fel. |
| återförsök_fördröjning_ms | integer |
1 000 | Hur länge du ska vänta i millisekunder innan du försöker att åter anropa Foundry Tools-slutpunkten. |
Varje funktion returnerar en matris med extraherade meningar och en rankningspoäng för var och en med hjälp av den azure_cognitive.sentence sammansatta typen, enligt tabellen nedan:
Composite type "azure_cognitive.sentence"
Column | Type | Collation | Nullable | Default | Storage | Description
------------+------------------+-----------+----------+---------+----------+-------------
text | text | | | | extended |
rank_score | double precision | | | | plain |
azure_cognitive.sentence är en sammansatt typ som innehåller texten i en extraherande mening och en rangpoäng för varje mening. Rankningspoängen, ett värde mellan 0 och 1 (inklusive), anger hur relevant en mening är för huvudidén i det ursprungliga dokumentet. Dokumentsammanfattning rangordnar extraherade meningar och du kan avgöra om de returneras i den ordning de visas eller enligt deras rangordning med hjälp av parametern sort_by för funktionen.
Generera extraheringssammanfattningar för egenskapsbeskrivningar
Som utvecklare för Margie's Travel vill du utvärdera den extraheringsteknik som är tillgänglig via azure_ai tillägget och Foundry Tools och utvärdera metodens förmåga att generera koncisa sammanfattningar av långa egenskapsbeskrivningar på naturligt språk, till exempel den här beskrivningen från den första listan i databasen:
"Gör dig hemmastadd i denna charmiga lägenhet med ett sovrum, centralt beläget på västra sidan av Queen Anne Hill. Denna elegant inredda, privata lägenhet (nedre delen av en duplex) har en öppen planlösning, bambugolv, ett fullt utrustat kök, en TV, DVD-spelare, grundläggande kabel och ett mysigt sovrum med en queen size-säng. Enheten sover upp till fyra (två i sovrummet och två på den bekväma utfällbara soffan, sängkläder ingår) och innehåller gratis Wi-Fi och tvätt. Lägenheten vetter mot ett privat däck, komplett med egen grill, med utsikt över en trädgård och en skog av svart bambu. Lägenheten är perfekt beläget bara ett kvarter från busslinjerna där du kan ta en buss och vara i centrala Seattle på 15 minuter eller historiska Ballard i 10. En snabb fem minuters promenad tar dig till en naturlig livsmedelsbutik och kaféer. Eller bara ta en femton minuters promenad till toppen av Queen Anne Hill där du hittar olika eklektiska butiker, barer och restauranger."
Du begär en sammanfattning med två meningar av egenskapsbeskrivningen ovan med hjälp av följande fråga:
SELECT
azure_cognitive.summarize_extractive(description, 'en', 2) AS extractive_summary
FROM listings
WHERE id = 1;
Extraheringssammanfattning returnerar de två meningarna med högst poäng från den ursprungliga texten, tillsammans med rangpoängen för var och en:
{
"("Make your self at home in this charming one-bedroom apartment, centrally-located on the west side of Queen Anne hill.",1)",
"("This elegantly-decorated, completely private apartment (bottom unit of a duplex) has an open floor plan, bamboo floors, a fully equipped kitchen, a TV, DVD player, basic cable, and a very cozy bedroom with a queen-size bed.",0.49)"
}