Kivonatoló összegzés magyarázata

Befejeződött

A kivonatoló összegzés úgy hoz létre összegzést, hogy az alapvető mondatokat közvetlenül az eredeti szövegből nyeri ki. Új szöveg létrehozása helyett természetes nyelvi feldolgozási technikákat használ a dokumentum elsődleges gondolatát vagy kontextusát együttesen átadó mondatok megkeresésére.

A kivonatoló összegzés a summarize_extractive() bővítmény azure_cognitive sémájában található azure_ai függvénnyel történik. A azure_cognitive séma a summarize_extractive() függvény három túlterhelését tartalmazza. A három függvény túlterhelése által várt argumentumok listája a következők:

érvelés Típus Alapértelmezett Leírás
SMS text vagy text[] Azok a szöveg(ek), amelyekhez összefoglalókat kell létrehozni.
nyelvi szöveg text vagy text[] Az összegzendő szöveg nyelvét képviselő nyelvi kód (vagy nyelvkódok tömbje). Tekintse át a támogatott nyelvek listáját a szükséges nyelvkódok lekéréséhez.
mondatszám integer 3 A létrehozandó összefoglaló mondatok száma.
rendezés_alapján text "eltolás" A létrehozott összefoglaló mondatok rendezési sorrendje. Az elfogadható értékek az "eltolás" és a "rang", az eltolás az egyes kinyert mondatok kezdőpozícióját jelöli az eredeti tartalomban, a rang pedig egy AI által generált mutató, amely azt jelzi, hogy egy mondat mennyire releváns a tartalom fő gondolatához.
köteg_méret integer 25 Csak a két túlterhelés várt bemenete text[]. Megadja az adott időpontban feldolgozandó rekordok számát.
szolgáltatásnaplók letiltása boolean hamis A szolgáltatásnaplók kikapcsolását jelző jelző.
időkorlát_ms integer NULLA Időtúllépés ezredmásodpercben, amely után a művelet leáll.
hiba esetén dob boolean igaz Jelző, amely jelzi, hogy a függvény hiba esetén kivételt jelez-e, ami a körbefuttatási tranzakció visszaállítását eredményezi.
max_kísérletek integer 1 Hányszor kell újrapróbálkoznia az Foundry Tools hívásának sikertelensége esetén.
retry_delay_ms integer 1000 Ezredmásodpercben ennyi időt kell várnia, mielőtt megpróbálna újra meghívni az Foundry Tools végpontját.

Minden függvény kinyert mondatok tömbjének és rangsorpontszámának értékét adja vissza az azure_cognitive.sentence összetett típus használatával, az alábbi táblázatban látható módon:

            Composite type "azure_cognitive.sentence"
    Column  |       Type       | Collation | Nullable | Default | Storage  | Description 
------------+------------------+-----------+----------+---------+----------+-------------
 text       | text             |           |          |         | extended | 
 rank_score | double precision |           |          |         | plain    |

A azure_cognitive.sentence egy összetett típus, amely egy kivonatoló mondat szövegét és az egyes mondatok rangsorolási pontszámát tartalmazza. A rangsor pontszáma, a 0 és 1 közötti érték (beleértve) azt jelzi, hogy egy mondat mennyire releváns az eredeti dokumentum alapgondolatához. A dokumentumösszesítés rangsorolja a kinyert mondatokat, és a függvény sort_by paraméterével meghatározhatja, hogy azok a megjelenésük sorrendjében vagy a rangjuknak megfelelően lettek-e visszaadva.

Kinyerő összegzések létrehozása a tulajdonságleírásokhoz

A Margie's Travel fejlesztőjeként ki szeretné értékelni a bővítmény és az Foundry Tools segítségével azure_ai elérhető kivonatoló összegzési technikát, és értékelni szeretné a módszer azon képességét, hogy tömör, természetes nyelvű összefoglalókat hozzon létre a hosszú tulajdonságleírásokról, például az adatbázis első listából származó leírásból:

"Legyen otthon ebben a bájos, egy hálószobás apartmanban, központi helyen, Anne Hill királynő nyugati oldalán. Ez az elegánsan berendezett, privát apartman (a duplex alsó egysége) nyitott alaprajzú, bambusz padlóval, teljesen felszerelt konyhával, TV-vel, DVD-lejátszóval, alapkábellel és hangulatos hálószobával rendelkezik, királynő méretű ágykal. Az egység legfeljebb négy (kettő a hálószobában és kettő a kényelmes kihajtható kanapén, ágyneműk) alszik, és ingyenes Wi-Fi és mosodát tartalmaz. Az apartman egy privát fedélzetre nyílik, saját grillezéssel kiegészítve, kilátással egy kertre és egy fekete bambuszerdőre. Az apartman tökéletesen található, csak egy háztömbnyire a buszvonalak, ahol lehet elkapni egy buszt, és belvárosában Seattle 15 perc alatt, vagy történelmi Ballard 10. Egy gyors öt perces sétával eljuthat egy természetes élelmiszerboltba és kávézóba. Vagy csak tegyen egy tizenöt perces sétát a Queen Anne Hill tetejére, ahol különféle eklektikus üzleteket, bárokat és éttermeket talál."

A fenti tulajdonságleírás két mondatos összegzését az alábbi lekérdezéssel kérheti le:

SELECT
  azure_cognitive.summarize_extractive(description, 'en', 2) AS extractive_summary
FROM listings
WHERE id = 1;

A kivonatoló összegzés az eredeti szöveg két legmagasabb pontszámú mondatát adja vissza, valamint az egyes mondatok rangpontszámát:

{
  "("Make your self at home in this charming one-bedroom apartment, centrally-located on the west side of Queen Anne hill.",1)",
  "("This elegantly-decorated, completely private apartment (bottom unit of a duplex) has an open floor plan, bamboo floors, a fully equipped kitchen, a TV, DVD player, basic cable, and a very cozy bedroom with a queen-size bed.",0.49)"
}