Mi az összegzés?

Cikk
05/21/2024

Fontos

Az előzetes verziójú régiónk, a Svédország középső régiója bemutatja a legújabb és folyamatosan fejlődő LLM finomhangolási technikákat GPT-modellek alapján. Szívesen kipróbálja őket egy nyelvi erőforrással a svédországi középső régióban.

A beszélgetések összegzése csak a következő használatával érhető el:

REST API
Python
C#

A summarization az Azure AI Language egyik funkciója, amely gépi tanulási és AI-algoritmusok gyűjteménye a felhőben az írott nyelvet használó intelligens alkalmazások fejlesztéséhez. Ebből a cikkből többet is megtudhat erről a funkcióról, és arról, hogyan használhatja azt az alkalmazásokban.

Bár a szolgáltatások dokumentum- és beszélgetésösszesítésként vannak megjelölve, a szövegösszesítés csak egyszerű szövegblokkokat fogad el, a beszélgetések összegzése pedig különböző beszédösszetevőket fogad el, hogy a modell többet tudjon meg. Ha egy beszélgetést szeretne feldolgozni, de csak a szöveg érdekli, akkor ehhez a forgatókönyvhöz használhat szövegösszesítést.

Ez a dokumentáció a következő cikktípusokat tartalmazza:

A rövid útmutatók első lépések, amelyek végigvezetik a szolgáltatás kéréseinek teljesítésén.
Az útmutatók konkrétabb vagy testre szabottabb módon tartalmazzák a szolgáltatás használatára vonatkozó utasításokat.

A szövegösszesítés természetes nyelvi feldolgozási technikákkal készít összegzést a dokumentumokhoz. Az automatikus összegzésnek két támogatott API-megközelítése van: kivonatoló és absztraktív.

A kivonatoló összegzés olyan mondatokat nyer ki, amelyek együttesen képviselik az eredeti tartalom legfontosabb vagy releváns információit. Az absztraktív összegzés tömör, koherens mondatokat vagy szavakat tartalmazó összegzést hoz létre, amely nem szó szerint nyer ki mondatokat az eredeti dokumentumból. Ezek a funkciók úgy lettek kialakítva, hogy lerövidítse azokat a tartalmakat, amelyek túl hosszúnak tekinthetők az olvasáshoz.

A szövegösszesítés főbb funkciói

Az API kétféleképpen foglalja össze a szövegösszesítést:

Kivonatoló összegzés: Összegzést hoz létre a dokumentumon belüli hasznos mondatok kinyerésével.
- Több kinyert mondat: Ezek a mondatok együttesen közvetítik a dokumentum fő gondolatát. Ezek a bemeneti dokumentum tartalmából kinyert eredeti mondatok.
- Rangpontszám: A rangsor pontszáma azt jelzi, hogy egy mondat mennyire releváns egy dokumentum fő témaköréhez. A szövegösszesítés rangsorolja a kinyert mondatokat, és meghatározhatja, hogy a visszaadott mondatok a megjelenésük sorrendjében vagy a sorrendjüknek megfelelően jelennek-e meg.
- Több visszaadott mondat: Határozza meg a visszaadandó mondatok maximális számát. Ha például három mondatos összefoglaló összegzést kér, a három legmagasabb pontszámú mondatot adja vissza.
- Pozícióadatok: A kinyert mondatok kezdőpozíciója és hossza.
Absztraktív összegzés: Olyan összegzést hoz létre, amely nem ugyanazokat a szavakat használja, mint a dokumentumban, hanem rögzíti a fő gondolatot.
- Összefoglaló szövegek: Az absztraktív összegzés a dokumentumon belüli minden környezeti bemeneti tartomány összegzését adja vissza. A hosszú dokumentumok szegmentáltak, így több összefoglaló szövegcsoport is visszaadható a környezetfüggő bemeneti tartományukkal.
- Környezetfüggő bemeneti tartomány: Az összefoglaló szöveg létrehozásához használt bemeneti dokumentum tartománya.

Vegyük például a következő szöveg bekezdését:

"A Microsoftnál azon vagyunk, hogy a meglévő technikákon túlmutató mivoltunkkal holisztikusabb, emberközpontúbb megközelítést alkalmazzunk a tanuláshoz és a megértéshez. Az Azure AI-szolgáltatások technológiai igazgatójaként csodálatos tudósokból és mérnökökből álló csapattal dolgoztam, hogy ezt a küldetést valósággá alakítsam. Az én szerepkörömben az emberi megismerés három attribútuma közötti kapcsolatot tekinthetem meg: egynyelvű szöveg (X), hang- vagy vizuális érzékszervi jelek, (Y) és többnyelvű (Z). Mindhárom metszéspontjában van egy varázslat – amit XYZ-kódnak hívunk az 1. ábrán látható módon – egy közös ábrázolás, amely erősebb mesterséges intelligenciát hoz létre, amely jobban tud beszélni, hallani, látni és megérteni az embereket. Úgy gondoljuk, hogy az XYZ-kód lehetővé teszi számunkra, hogy megvalósítsuk hosszú távú elképzeléseinket: a tartományok közötti átvitel tanulását, a modalitásokon és nyelveken. A cél olyan előre betanított modellek használata, amelyek közösen tanulják meg a reprezentációkat az alsóbb rétegbeli AI-feladatok széles skálájának támogatásához, sok olyan módon, ahogyan az emberek ma. Az elmúlt öt évben emberi teljesítményt értünk el a beszédfelismerés, a gépi fordítás, a beszélgetési kérdések megválaszolása, a gépi olvasás megértése és a képi képaláírás terén. Ez az öt áttörés erős jelzéseket adott számunkra a mi ambiciózusabb törekvésünk felé, hogy ugrást érjünk el a mesterséges intelligenciával kapcsolatos képességek terén, és olyan többérzékelős és többnyelvű tanulást érjünk el, amely közelebb áll az emberek tanulásához és megértéséhez. Úgy gondolom, hogy a közös XYZ-kód ennek a törekvésnek az alapja, ha az alsóbb rétegbeli AI-feladatokban külső tudásforrásokkal van alapozva."

A szövegösszesítési API-kérés feldolgozása a kérelem beérkezésekor történik, és létrehoz egy feladatot az API háttérrendszeréhez. Ha a feladat sikeres volt, a függvény visszaadja az API kimenetét. A kimenet 24 órán keresztül kérhető le. Ezután a kimenet törlődik. A többnyelvű és emoji támogatás miatt a válasz szövegeltolásokat tartalmazhat. További információ: eltolások feldolgozása.

Ha a fenti példát használjuk, az API az alábbi összegzett mondatokat adja vissza:

Kivonatoló összegzés:

"A Microsoftnál azon dolgozunk, hogy a meglévő technikákon túlmutató mivoltunkkal holisztikusabb, emberközpontúbb megközelítést alkalmazzunk a tanuláshoz és a megértéshez."
"Úgy gondoljuk, hogy az XYZ-kód lehetővé teszi számunkra, hogy megvalósítsuk a hosszú távú elképzeléseinket: a tartományok közötti átvitel tanulását, a modalitásokon és nyelveken."
"A cél az, hogy olyan előre betanított modellekkel rendelkezzenek, amelyek közösen tanulhatnak ábrázolásokat az alsóbb rétegbeli AI-feladatok széles skálájának támogatásához, sok olyan módon, ahogyan az emberek ma."

Absztraktív összegzés:

"A Microsoft holisztikusabb, emberközpontúbb megközelítést alkalmaz a tanuláshoz és a megértéshez. Úgy gondoljuk, hogy az XYZ-kód lehetővé teszi számunkra, hogy megvalósítsuk hosszú távú elképzeléseinket: a tartományok közötti átvitel tanulását, a modalitásokon és nyelveken. Az elmúlt öt évben emberi teljesítményt értünk el a beszélgetési beszédfelismerési teljesítményteszteken."

A natív dokumentumok az eredeti dokumentum, például a Microsoft Word (docx) vagy egy hordozható dokumentumfájl (pdf) létrehozásához használt fájlformátumra utalnak. A natív dokumentumok támogatása szükségtelenné teszi a szöveg előfeldolgozását az Azure AI Language erőforrás-képességeinek használata előtt. Jelenleg a natív dokumentumtámogatás az AbstractiveSummarization és az ExtractiveSummarization képességekhez is elérhető.

A szövegösszesítés jelenleg a következő natív dokumentumformátumokat támogatja:

Fájltípus	Fájlkiterjesztés	Leírás
Szöveges	`.txt`	Formázatlan szöveges dokumentum.
Adobe PDF	`.pdf`	Egy hordozható dokumentumfájl formázott dokumentuma.
Microsoft Word	`.docx`	Egy Microsoft Word-dokumentumfájl.

További információ: Natív dokumentumok használata nyelvfeldolgozáshoz

A beszélgetések összegzésének főbb funkciói

A beszélgetések összegzése a következő funkciókat támogatja:

Probléma/megoldás összegzése: Egy call center-specifikus funkció, amely összefoglalja az ügyfélszolgálati ügynökök és az ügyfelek közötti beszélgetésekben előforduló problémákat és megoldásokat.
Fejezetcím összegzése: A beszélgetéseket fejezetekre bontja a beszélgetésben tárgyalt témakörök alapján, és a bemeneti beszélgetés javasolt fejezetcímeit adja meg.
Összegzés: Egy beszélgetés összegzése egy rövid bekezdésbe.
Narratív összegzés: Részletes hívásjegyzeteket, értekezletjegyzeteket vagy csevegési összefoglalókat hoz létre a bemeneti beszélgetésről.
Követő tevékenységek: A bemeneti beszélgetésben tárgyalt nyomon követési feladatok listáját tartalmazza.

Mikor érdemes probléma- és megoldási összegzést használni?

Ha a "probléma" és a "megoldás" aspektusai vannak, például:
- A szolgáltatáscsevegés/-hívás oka (a probléma).
- A probléma megoldása.
Csak olyan összefoglalót szeretne, amely a problémákra és a megoldásra vonatkozó kapcsolódó információkra összpontosít.
Ha két résztvevője van a beszélgetésnek, és szeretné összefoglalni, hogy mit mondtak.

Vegyük például a következő példabeszélgetést:

Ügynök: "Helló, Rene-nel cseveg. Hogyan segíthetek?"

Ügyfél: "Szia, megpróbáltam wifi kapcsolatot beállítani a Smart Brew 300 kávéfőzőhöz, de nem működött."

Ügynök: "Sajnálom, hogy ezt hallom. Lássuk, mit tehetünk a probléma megoldásához. Le tudná nyomni a wifi kapcsolat gombot, tartsa lenyomva 3 másodpercig, majd tudassa velem, hogy a villanyfény lassan villog-e?"

Ügyfél: "Igen, leküldtem a wifi kapcsolat gombot, és most a villanyfény lassan villog."

Ügynök: "Nagyszerű. Köszönöm! Most jelentkezzen be a Contoso Coffee alkalmazásba. Kéri, hogy csatlakozzon a géphez?"

Ügyfél: "Nem. Semmi sem történt."

Ügynök: "Látom. Kösz. Próbáljuk meg, hogy egy gyári visszaállítás meg tudja-e oldani a problémát. A gyári visszaállítás elindításához nyomja le és tartsa lenyomva a középső gombot 5 másodpercig."

Ügyfél: "Megpróbáltam a gyári visszaállítást, és követtem a fenti lépéseket, de még mindig nem működött."

Ügynök: "Nagyon sajnálom, hogy ezt hallottam. Hadd lássam, van-e más módszer a probléma megoldására. Kérem, tartsa meg egy percig."

A beszélgetések összegzése a következőképpen egyszerűsítené a szöveget:

Példa összegzése	Formátum	Beszélgetési szempont
Az ügyfél a Wifi-kapcsolatot szeretné használni a Smart Brew 300-on. De nem működött.	Egy vagy két mondat	Kérdés
Ellenőrizte, hogy a villanyfény lassan villog-e. Ellenőrizte a Contoso kávéalkalmazást. Nem volt rá kérése. Megpróbálták visszaállítani a gyári beállításokat.	Egy vagy több mondat, amely az átirat több sorából jön létre.	Felbontás

Első lépések az összegzésben

Az összegzés használatához elemzésre kell küldenie, és kezelnie kell az api-kimenetet az alkalmazásban. Az elemzés az adott módon történik, és nincs hozzá további testreszabás az adatokhoz használt modellhez. Az összegzés kétféleképpen használható:

Fejlesztési lehetőség	Leírás
Language Studio	A Language Studio egy webes platform, amellyel azure-fiók nélkül próbálhatja ki a szöveges példákkal összekapcsolt entitásokat, valamint a regisztrációkor a saját adatait. További információt a Language Studio webhelyén vagy a Language Studio rövid útmutatójában talál.
REST API vagy ügyfélkódtár (Azure SDK)	Szövegösszesítés integrálása az alkalmazásokba a REST API vagy a különböző nyelveken elérhető ügyfélkódtár használatával. További információkért tekintse meg az összefoglaló rövid útmutatót.

Fejlesztési lehetőség	Leírás	Hivatkozások
REST API	Integrálhatja a beszélgetések összegzését az alkalmazásokba a REST API használatával.	Rövid útmutató: Beszélgetések összegzésének használata

Az egyéni összegzés lehetővé teszi, hogy a felhasználók egyéni AI-modelleket készítsenek strukturálatlan szövegek, például szerződések vagy regények összegzéséhez. Egyéni összegzési projekt létrehozásával a fejlesztők iteratív módon címkézhetik meg az adatokat, betanítást, kiértékelhetnek és javíthatnak a modell teljesítményének, mielőtt elérhetővé tennék azt felhasználás céljából. A címkézett adatok minősége nagyban befolyásolja a modell teljesítményét. A modell létrehozásának és testreszabásának egyszerűsítése érdekében a szolgáltatás egy egyéni webportált kínál, amely a Language Studióban érhető el. A gyorsútmutató lépéseit követve egyszerűen megkezdheti a szolgáltatást.

Fejlesztési lehetőség	Leírás
Language Studio	A Language Studio egy webes platform, amellyel azure-fiók nélkül próbálhatja ki a szöveges példákkal összekapcsolt entitásokat, valamint a regisztrációkor a saját adatait. További információt a Language Studio webhelyén vagy a Language Studio rövid útmutatójában talál.
REST API vagy ügyfélkódtár (Azure SDK)	Szövegösszesítés integrálása az alkalmazásokba a REST API vagy a különböző nyelveken elérhető ügyfélkódtár használatával. További információkért tekintse meg az összefoglaló rövid útmutatót.

Bemeneti követelmények és szolgáltatási korlátok

Az összegzés szövegeket vesz igénybe az elemzéshez. További információ: Az adatok és a szolgáltatások korlátai az útmutatóban.
Az összegzés különböző írott nyelvekkel működik. További információ: nyelvi támogatás.

Referenciadokumentáció és kódminták

Amikor az alkalmazásokban szövegösszesítést használ, tekintse meg a következő referenciadokumentációt és -mintákat az Azure AI-nyelvhez:

Fejlesztési lehetőség / nyelv	Referenciadokumentáció	Példák
C#	C#-dokumentáció	C#-minták
Java	Java-dokumentáció	Java-minták
JavaScript	A JavaScript dokumentációja	JavaScript-minták
Python	Python-dokumentáció	Python-példák

Felelős AI

Az AI-rendszerek nem csak a technológiát, hanem az azt használó személyeket, az érintett személyeket és az üzembe helyezési környezetet is magukban foglalják. A rendszerek felelősségteljes AI-használatának és üzembe helyezésének megismeréséhez olvassa el az átláthatósági megjegyzést. További információért tekintse át az alábbi cikkeket:

Share via