Dokumentumösszesítés használata
A dokumentumösszesítés célja, hogy lerövidítse azokat a tartalmakat, amelyeket a felhasználók túl hosszúnak tartanak az olvasáshoz. A kivonatoló és az absztraktív összegzés is a legfontosabb mondatokig tömöríti a cikkeket, a dokumentumokat vagy a dokumentumokat.
Kivonatoló összegzés: Összegzést hoz létre olyan mondatok kinyerésével, amelyek együttesen képviselik az eredeti tartalom legfontosabb vagy releváns információit.
Absztraktív összegzés: Összegzést hoz létre úgy, hogy összegzett mondatokat hoz létre a dokumentumból, amelyek rögzítik a fő gondolatot.
Az API által használt AI-modelleket a szolgáltatás biztosítja, csak elemzés céljából kell tartalmat küldenie.
Funkciók
Tipp
Ha el szeretné kezdeni ezeket a funkciókat, az első lépésekhez kövesse a rövid útmutatót . Példakéréseket is végrehajthat a Language Studióval anélkül, hogy kódot kellene írnia.
A kivonatoló összegzési API természetes nyelvi feldolgozási technikákat használ a kulcsmondatok strukturálatlan szöveges dokumentumokban való megkereséséhez. Ezek a mondatok együttesen közvetítik a dokumentum fő gondolatát.
A kivonatoló összegzés a rendszerválasz részeként egy rangpontszámot ad vissza a kinyert mondatokkal és az eredeti dokumentumokban elfoglalt pozíciójukkal együtt. A rangpontszám azt jelzi, hogy egy mondat mennyire releváns a dokumentum fő gondolatához. A modell 0 és 1 közötti pontszámot ad (a mondatokat is beleértve), és kérésenként a legmagasabb pontszámot adja vissza. Ha például három mondatos összegzést kér, a szolgáltatás a három legmagasabb pontszámú mondatot adja vissza.
Az Azure AI Language egy másik funkciója, a kulcskifejezések kinyerése, amely képes kinyerni a kulcsadatokat. Amikor a kulcskifejezések kinyerése és a kivonatoló összegzés között dönt, vegye figyelembe a következőket:
- A kulcskifejezések kinyerése kifejezéseket ad vissza, míg a kivonatos összegzés mondatokat ad vissza.
- A kivonatoló összegzés a mondatokat és a rangpontszámot adja vissza, a legmagasabb rangsorolt mondatok pedig kérésenként lesznek visszaadva.
- A kivonatoló összegzés a következő pozícióadatokat is visszaadja:
- Eltolás: Az egyes kinyert mondatok kezdőpozíciója.
- Hossz: Az egyes kinyert mondatok hossza.
Az adatok feldolgozásának meghatározása (nem kötelező)
Adatok elküldése
A dokumentumokat szöveges sztringekként küldi el az API-nak. Az elemzés a kérelem megkapásakor történik meg. Mivel az API aszinkron, előfordulhat, hogy egy API-kérés küldése és az eredmények fogadása között késés tapasztalható.
A funkció használatakor az API-eredmények a kérés betöltésétől számítva 24 órán át érhetők el, és a válasz jelzi. Ezt az időtartamot követően az eredmények törlődnek, és már nem érhetők el lekérésre.
Dokumentumösszesítési eredmények lekérése
A nyelvfelismerés eredményeinek lekérése után streamelheti az eredményeket egy alkalmazásba, vagy mentheti a kimenetet egy fájlba a helyi rendszeren.
Az alábbiakban egy példát mutatunk be az összegzésre beküldhető tartalmakra, amelyeket a Microsoft A holisztikus ábrázolása az integratív AI felé című blogcikkével nyerünk ki. Ez a cikk csak egy példa, az API sokkal hosszabb bemeneti szöveget tud elfogadni. További információért tekintse meg az adatkorlátokat ismertető szakaszt.
"A Microsoftnál azon dolgozunk, hogy a mesterséges intelligenciát a meglévő technikákon túlmutató módon, holisztikusabb, emberközpontúbb megközelítéssel közelítsük meg a tanulást és a megértést. Az Azure AI-szolgáltatások technológiai igazgatójaként csodálatos tudósokból és mérnökökből álló csapattal dolgozom, hogy valósággá alakítsam ezt a küldetést. Szerepkörömben az emberi megismerés három attribútuma közötti kapcsolatot tekintem meg: egynyelvű szöveg (X), hang- vagy vizuális érzékszervi jelek, (Y) és többnyelvű (Z). Mind a három metszéspontján van egy varázslat – amit XYZ-kódnak nevezünk az 1. ábrán látható módon – egy közös ábrázolás, amely erősebb mesterséges intelligenciát hoz létre, amely jobban tud beszélni, hallani, látni és megérteni az embereket. Úgy gondoljuk, hogy a XYZ-code lehetővé teszi számunkra, hogy megvalósítsuk a hosszú távú elképzeléseinket: a tartományok közötti átvitel tanulását, a modalitások és nyelvek átfogó használatát. A cél az előre betanított modellek használata, amelyek közösen tanulnak meg reprezentációkat az alsóbb rétegbeli AI-feladatok széles körének támogatásához, ami sokban hasonlít az emberek mai gyakorlatára. Az elmúlt öt évben emberi teljesítményt nyújtottunk a beszédfelismerés, a gépi fordítás, a beszélgetési kérdések megválaszolása, a gépi olvasásértés és a képfeliratok terén. Ez az öt áttörés erős jelzéseket adott számunkra a mi ambiciózusabb törekvésünk felé, hogy ugrást hozzunk létre az AI-képességek terén, és olyan többérzékelős és többnyelvű tanulást érjünk el, amely közelebb áll az emberek tanulásához és megértéséhez. Úgy gondolom, hogy a közös XYZ-kód ennek a törekvésnek az alapja, ha az alsóbb rétegbeli AI-feladatokban külső tudásbázisokkal van alapozva."
A dokumentumösszesítési API-kérés feldolgozása a kérelem beérkezésekor történik, és létrehoz egy feladatot az API háttérrendszeréhez. Ha a feladat sikeres volt, a rendszer visszaadja az API kimenetét. A kimenet 24 órán keresztül lesz elérhető lekérésre. Ezután a kimenet törlődik. A többnyelvű és emoji támogatás miatt a válasz szövegeltolásokat tartalmazhat. További információért tekintse meg az eltolások feldolgozásának módját.
A fenti példában az API a következő összegzett mondatokat adja vissza:
Kivonatoló összegzés:
- "A Microsoftnál a mesterséges intelligenciát a meglévő technikákon túlmutató, holisztikusabb, emberközpontú megközelítéssel igyekeztünk előrelépni a tanuláshoz és a megértéshez."
- "Úgy gondoljuk, hogy a XYZ-code lehetővé teszi számunkra, hogy teljesítsük a hosszú távú elképzelésünket: tartományközi átadási tanulást, a modalitásokra és nyelvekre kiterjedően."
- "A cél az, hogy olyan előre betanított modelleket használjanak, amelyek közösen tanulnak meg reprezentációkat az alsóbb rétegbeli AI-feladatok széles körének támogatásához, sokban az emberek ma is."
Absztraktív összegzés:
- "A Microsoft holisztikusabb, emberközpontúbb megközelítést alkalmaz a tanuláshoz és a megértéshez. Úgy gondoljuk, hogy a XYZ-code lehetővé teszi számunkra, hogy megvalósítsuk a hosszú távú elképzeléseinket: a tartományok közötti átvitel tanulását, a modalitások és nyelvek átfogó használatát. Az elmúlt öt évben elértük a teljesítménytesztek emberi teljesítményét."
Dokumentumkivonat-összegzés kipróbálása
A dokumentumok kivonatos összegzésével cikkek, dokumentumok vagy dokumentumok összegzését is lekérheti. Egy példa megtekintéséhez tekintse meg a rövid útmutatót ismertető cikket.
A paraméterrel sentenceCount
megtudhatja, hogy hány mondat lesz visszaadva az alapértelmezett értékként 3
. A tartomány 1 és 20 között van.
A paraméterrel sortby
azt is megadhatja, hogy a kinyert mondatok milyen sorrendben lesznek visszaadva – vagy Offset
Rank
az alapértelmezett sorrendben Offset
.
paraméter értéke | Description |
---|---|
Sorszám | A mondatokat a szolgáltatás által meghatározott módon rendezze el a bemeneti dokumentumhoz való relevanciájuknak megfelelően. |
Eltolás | Megtartja az eredeti sorrendet, amelyben a mondatok megjelennek a bemeneti dokumentumban. |
A dokumentum absztraktív összegzésének kipróbálása
Az alábbi példában megismerkedhet a dokumentum absztraktív összegzésével:
- Másolja az alábbi parancsot egy szövegszerkesztőbe. A BASH-példa a sor folytatási karakterét
\
használja. Ha a konzol vagy a terminál egy másik sorfolytatási karaktert használ, használja inkább ezt a karaktert.
curl -i -X POST https://<your-language-resource-endpoint>/language/analyze-text/jobs?api-version=2022-10-01-preview \
-H "Content-Type: application/json" \
-H "Ocp-Apim-Subscription-Key: <your-language-resource-key>" \
-d \
'
{
"displayName": "Document Abstractive Summarization Task Example",
"analysisInput": {
"documents": [
{
"id": "1",
"language": "en",
"text": "At Microsoft, we have been on a quest to advance AI beyond existing techniques, by taking a more holistic, human-centric approach to learning and understanding. As Chief Technology Officer of Azure AI services, I have been working with a team of amazing scientists and engineers to turn this quest into a reality. In my role, I enjoy a unique perspective in viewing the relationship among three attributes of human cognition: monolingual text (X), audio or visual sensory signals, (Y) and multilingual (Z). At the intersection of all three, there’s magic—what we call XYZ-code as illustrated in Figure 1—a joint representation to create more powerful AI that can speak, hear, see, and understand humans better. We believe XYZ-code will enable us to fulfill our long-term vision: cross-domain transfer learning, spanning modalities and languages. The goal is to have pre-trained models that can jointly learn representations to support a broad range of downstream AI tasks, much in the way humans do today. Over the past five years, we have achieved human performance on benchmarks in conversational speech recognition, machine translation, conversational question answering, machine reading comprehension, and image captioning. These five breakthroughs provided us with strong signals toward our more ambitious aspiration to produce a leap in AI capabilities, achieving multi-sensory and multilingual learning that is closer in line with how humans learn and understand. I believe the joint XYZ-code is a foundational component of this aspiration, if grounded with external knowledge sources in the downstream AI tasks."
}
]
},
"tasks": [
{
"kind": "AbstractiveSummarization",
"taskName": "Document Abstractive Summarization Task 1",
"parameters": {
"sentenceCount": 1
}
}
]
}
'
Ha nem adja meg a értéket sentenceCount
, a modell határozza meg az összegzés hosszát. Vegye figyelembe, hogy sentenceCount
a kimeneti összegzés mondatszámának közelítése, tartomány: 1–20.
- Hajtsa végre a következő módosításokat a parancs megfelelő területein:
- Cserélje le az értéket
your-language-resource-key
a kulcsra. - Cserélje le a kérelem URL-címének
your-language-resource-endpoint
első részét a végpont URL-címére.
Nyisson meg egy parancssori ablakot (például: BASH).
Illessze be a parancsot a szövegszerkesztőből a parancssor ablakába, majd futtassa a parancsot.
Kérje le a
operation-location
választ a fejlécből. Az érték a következő URL-címhez hasonlóan fog kinézni:
https://<your-language-resource-endpoint>/language/analyze-text/jobs/12345678-1234-1234-1234-12345678?api-version=2022-10-01-preview
- A kérés eredményeinek lekéréséhez használja az alábbi cURL-parancsot. Mindenképpen cserélje le a helyére
<my-job-id>
az előzőoperation-location
válaszfejlécből kapott numerikus azonosítót:
curl -X GET https://<your-language-resource-endpoint>/language/analyze-text/jobs/<my-job-id>?api-version=2022-10-01-preview \
-H "Content-Type: application/json" \
-H "Ocp-Apim-Subscription-Key: <your-language-resource-key>"
Absztraktív dokumentumösszesítési példa JSON-válaszra
{
"jobId": "cd6418fe-db86-4350-aec1-f0d7c91442a6",
"lastUpdateDateTime": "2022-09-08T16:45:14Z",
"createdDateTime": "2022-09-08T16:44:53Z",
"expirationDateTime": "2022-09-09T16:44:53Z",
"status": "succeeded",
"errors": [],
"displayName": "Document Abstractive Summarization Task Example",
"tasks": {
"completed": 1,
"failed": 0,
"inProgress": 0,
"total": 1,
"items": [
{
"kind": "AbstractiveSummarizationLROResults",
"taskName": "Document Abstractive Summarization Task 1",
"lastUpdateDateTime": "2022-09-08T16:45:14.0717206Z",
"status": "succeeded",
"results": {
"documents": [
{
"summaries": [
{
"text": "Microsoft is taking a more holistic, human-centric approach to AI. We've developed a joint representation to create more powerful AI that can speak, hear, see, and understand humans better. We've achieved human performance on benchmarks in conversational speech recognition, machine translation, ...... and image captions.",
"contexts": [
{
"offset": 0,
"length": 247
}
]
}
],
"id": "1"
}
],
"errors": [],
"modelVersion": "latest"
}
}
]
}
}
parameter | Description |
---|---|
-X POST <endpoint> |
Megadja a végpontot az API eléréséhez. |
-H Content-Type: application/json |
A JSON-adatok küldéséhez használt tartalomtípus. |
-H "Ocp-Apim-Subscription-Key:<key> |
Megadja az API eléréséhez szükséges kulcsot. |
-d <documents> |
A küldeni kívánt dokumentumokat tartalmazó JSON. |
A rendszer a következő cURL-parancsokat hajtja végre egy BASH-rendszerhéjból. Szerkessze ezeket a parancsokat a saját erőforrásnevével, erőforráskulcsával és JSON-értékeivel.
Szolgáltatási és adatkorlátok
A percenként és másodpercenként küldhető kérések méretéről és számáról a szolgáltatási korlátokról szóló cikkben talál további információt.