Share via


Mi az a dokumentum- és beszélgetés-összegzés?

Fontos

Az előzetes verziójú régiónk, a Svédország középső régiója bemutatja a legújabb és folyamatosan fejlődő LLM finomhangolási technikákat GPT-modellek alapján. Szívesen kipróbálja őket egy nyelvi erőforrással a svédországi középső régióban.

A beszélgetések összegzése csak a következő használatával érhető el:

  • REST API
  • Python
  • C#

A summarization az Azure AI Language egyik funkciója, amely gépi tanulási és AI-algoritmusok gyűjteménye a felhőben az írott nyelvet használó intelligens alkalmazások fejlesztéséhez. Ebből a cikkből többet is megtudhat erről a funkcióról, és arról, hogyan használhatja azt az alkalmazásokban.

Bár a szolgáltatások dokumentum- és beszélgetésösszesítésként vannak megjelölve, a dokumentumösszesítés csak egyszerű szövegblokkokat fogad el, a beszélgetések összegzése pedig különböző beszédösszetevőket fogad el, hogy a modell többet tudjon meg. Ha egy beszélgetést szeretne feldolgozni, de csak a szöveg érdekli, használhat dokumentumösszesítést ehhez a forgatókönyvhöz.

Ez a dokumentáció a következő cikktípusokat tartalmazza:

  • A rövid útmutatók első lépések, amelyek végigvezetik a szolgáltatás kéréseinek teljesítésén.
  • Az útmutatók konkrétabb vagy testre szabottabb módon tartalmazzák a szolgáltatás használatára vonatkozó utasításokat.

A dokumentumösszesítés természetes nyelvi feldolgozási technikákkal készít összegzést a dokumentumokhoz. Az automatikus összegzésnek három támogatott API-megközelítése van: kinyerő, absztraktív és lekérdezésközpontú.

A kivonatoló összegzés olyan mondatokat nyer ki, amelyek együttesen képviselik az eredeti tartalom legfontosabb vagy releváns információit. Az absztraktív összegzés tömör, koherens mondatokat vagy szavakat tartalmazó összegzést hoz létre, amely nem szó szerint nyer ki mondatokat az eredeti dokumentumból. Ezek a funkciók úgy lettek kialakítva, hogy lerövidítse azokat a tartalmakat, amelyek túl hosszúnak tekinthetők az olvasáshoz.

Natív dokumentumtámogatás

A natív dokumentumok az eredeti dokumentum, például a Microsoft Word (docx) vagy egy hordozható dokumentumfájl (pdf) létrehozásához használt fájlformátumra utalnak. A natív dokumentumok támogatása szükségtelenné teszi a szöveg előfeldolgozását az Azure AI Language erőforrás-képességeinek használata előtt. Jelenleg a natív dokumentumtámogatás az AbstractiveSummarization és az ExtractiveSummarization képességekhez is elérhető.

A Dokumentumösszesítés jelenleg a következő natív dokumentumformátumokat támogatja:

Fájltípus Fájlkiterjesztés Leírás
Szöveges .txt Formázatlan szöveges dokumentum.
Adobe PDF .pdf Egy hordozható dokumentumfájl formázott dokumentuma.
Microsoft Word .docx Egy Microsoft Word-dokumentumfájl.

További információ: Natív dokumentumok használata nyelvfeldolgozáshoz

Legfontosabb funkciók

Az API a dokumentumok összegzésének szempontjait tartalmazza:

  • Kivonatoló összegzés: Összegzést hoz létre a dokumentumon belüli hasznos mondatok kinyerésével.

    • Több kinyert mondat: Ezek a mondatok együttesen közvetítik a dokumentum fő gondolatát. Ezek a bemeneti dokumentum tartalmából kinyert eredeti mondatok.
    • Rangpontszám: A rangsor pontszáma azt jelzi, hogy egy mondat mennyire releváns egy dokumentum fő témaköréhez. A dokumentumösszesítés rangsorolja a kinyert mondatokat, és meghatározhatja, hogy a visszaadott mondatok a megjelenésük sorrendjében vagy a rangsoruk szerint vannak-e visszaadva.
    • Több visszaadott mondat: Határozza meg a visszaadandó mondatok maximális számát. Ha például három mondatos összefoglaló összegzést kér, a három legmagasabb pontszámú mondatot adja vissza.
    • Pozícióadatok: A kinyert mondatok kezdőpozíciója és hossza.
  • Absztraktív összegzés: Olyan összegzést hoz létre, amely nem ugyanazokat a szavakat használja, mint a dokumentumban, hanem rögzíti a fő gondolatot.

    • Összefoglaló szövegek: Az absztraktív összegzés a dokumentumon belüli minden környezeti bemeneti tartomány összegzését adja vissza. A hosszú dokumentumok szegmentáltak, így több összefoglaló szövegcsoport is visszaadható a környezetfüggő bemeneti tartományukkal.
    • Környezetfüggő bemeneti tartomány: Az összefoglaló szöveg létrehozásához használt bemeneti dokumentum tartománya.
  • Lekérdezésre összpontosító összegzés: Lekérdezés alapján hoz létre összegzést

Vegyük például a következő szöveg bekezdését:

"A Microsoftnál azon vagyunk, hogy a meglévő technikákon túlmutató mivoltunkkal holisztikusabb, emberközpontúbb megközelítést alkalmazzunk a tanuláshoz és a megértéshez. Az Azure AI-szolgáltatások technológiai igazgatójaként csodálatos tudósokból és mérnökökből álló csapattal dolgoztam, hogy ezt a küldetést valósággá alakítsam. Az én szerepkörömben az emberi megismerés három attribútuma közötti kapcsolatot tekinthetem meg: egynyelvű szöveg (X), hang- vagy vizuális érzékszervi jelek, (Y) és többnyelvű (Z). Mindhárom metszéspontjában van egy varázslat – amit XYZ-kódnak hívunk az 1. ábrán látható módon – egy közös ábrázolás, amely erősebb mesterséges intelligenciát hoz létre, amely jobban tud beszélni, hallani, látni és megérteni az embereket. Úgy gondoljuk, hogy az XYZ-kód lehetővé teszi számunkra, hogy megvalósítsuk hosszú távú elképzeléseinket: a tartományok közötti átvitel tanulását, a modalitásokon és nyelveken. A cél olyan előre betanított modellek használata, amelyek közösen tanulják meg a reprezentációkat az alsóbb rétegbeli AI-feladatok széles skálájának támogatásához, sok olyan módon, ahogyan az emberek ma. Az elmúlt öt évben emberi teljesítményt értünk el a beszédfelismerés, a gépi fordítás, a beszélgetési kérdések megválaszolása, a gépi olvasás megértése és a képi képaláírás terén. Ez az öt áttörés erős jelzéseket adott számunkra a mi ambiciózusabb törekvésünk felé, hogy ugrást érjünk el a mesterséges intelligenciával kapcsolatos képességek terén, és olyan többérzékelős és többnyelvű tanulást érjünk el, amely közelebb áll az emberek tanulásához és megértéséhez. Úgy gondolom, hogy a közös XYZ-kód ennek a törekvésnek az alapja, ha az alsóbb rétegbeli AI-feladatokban külső tudásforrásokkal van alapozva."

A dokumentumösszesítési API-kérés feldolgozása a kérelem beérkezésekor történik, és létrehoz egy feladatot az API háttérrendszeréhez. Ha a feladat sikeres volt, a függvény visszaadja az API kimenetét. A kimenet 24 órán keresztül kérhető le. Ezután a kimenet törlődik. A többnyelvű és emoji támogatás miatt a válasz szövegeltolásokat tartalmazhat. További információ: eltolások feldolgozása.

Ha a fenti példát használjuk, az API az alábbi összegzett mondatokat adja vissza:

Kivonatoló összegzés:

  • "A Microsoftnál azon dolgozunk, hogy a meglévő technikákon túlmutató mivoltunkkal holisztikusabb, emberközpontúbb megközelítést alkalmazzunk a tanuláshoz és a megértéshez."
  • "Úgy gondoljuk, hogy az XYZ-kód lehetővé teszi számunkra, hogy megvalósítsuk a hosszú távú elképzeléseinket: a tartományok közötti átvitel tanulását, a modalitásokon és nyelveken."
  • "A cél az, hogy olyan előre betanított modellekkel rendelkezzenek, amelyek közösen tanulhatnak ábrázolásokat az alsóbb rétegbeli AI-feladatok széles skálájának támogatásához, sok olyan módon, ahogyan az emberek ma."

Absztraktív összegzés:

  • "A Microsoft holisztikusabb, emberközpontúbb megközelítést alkalmaz a tanuláshoz és a megértéshez. Úgy gondoljuk, hogy az XYZ-kód lehetővé teszi számunkra, hogy megvalósítsuk hosszú távú elképzeléseinket: a tartományok közötti átvitel tanulását, a modalitásokon és nyelveken. Az elmúlt öt évben emberi teljesítményt értünk el a beszélgetési beszédfelismerési teljesítményteszteken."

Első lépések az összegzésben

Az összegzés használatához elemzésre kell küldenie, és kezelnie kell az api-kimenetet az alkalmazásban. Az elemzés az adott módon történik, és nincs hozzá további testreszabás az adatokhoz használt modellhez. Az összegzés kétféleképpen használható:

Fejlesztési lehetőség Leírás
Language Studio A Language Studio egy webes platform, amellyel azure-fiók nélkül próbálhatja ki a szöveges példákkal összekapcsolt entitásokat, valamint a regisztrációkor a saját adatait. További információt a Language Studio webhelyén vagy a Language Studio rövid útmutatójában talál.
REST API vagy ügyfélkódtár (Azure SDK) A REST API vagy a különböző nyelveken elérhető ügyfélkódtár használatával integrálhatja a dokumentumösszesítést az alkalmazásokba. További információkért tekintse meg az összefoglaló rövid útmutatót.

Bemeneti követelmények és szolgáltatási korlátok

Referenciadokumentáció és kódminták

Amikor dokumentum-összegzést használ az alkalmazásokban, tekintse meg a következő referenciadokumentációt és -mintákat az Azure AI-nyelvhez:

Fejlesztési lehetőség / nyelv Referenciadokumentáció Minták
C# C#-dokumentáció C#-minták
Java Java-dokumentáció Java-minták
JavaScript A JavaScript dokumentációja JavaScript-minták
Python Python-dokumentáció Python-példák

Felelős AI

Az AI-rendszerek nem csak a technológiát, hanem az azt használó személyeket, az érintett személyeket és az üzembe helyezési környezetet is magukban foglalják. A rendszerek felelősségteljes AI-használatának és üzembe helyezésének megismeréséhez olvassa el az átláthatósági megjegyzést. További információért tekintse át az alábbi cikkeket: