Mi az összegzés?

Cikk
09/01/2024

Fontos

Az előzetes verziójú régiónk, a Svédország középső régiója bemutatja a legújabb és folyamatosan fejlődő LLM finomhangolási technikákat GPT-modellek alapján. Szívesen kipróbálja őket egy nyelvi erőforrással a svédországi középső régióban.

A beszélgetések összegzése csak a következő használatával érhető el:

REST API
Python
C#

A summarization az Azure AI Language egyik funkciója, amely a generatív nagy nyelvi modellek és a feladatoptimalizált kódoló modellek kombinációja, amelyek magasabb minőségű, költséghatékony és kisebb késésű összefoglaló megoldásokat kínálnak. Ebből a cikkből többet is megtudhat erről a funkcióról, és arról, hogyan használhatja azt az alkalmazásokban.

A szolgáltatás három műfajtípushoz, egyszerű szövegekhez, beszélgetésekhez és natív dokumentumokhoz kínál összegzési megoldásokat. A szövegösszesítés csak egyszerű szövegblokkokat fogad el, a beszélgetések összegzése pedig beszélgetési bemenetet fogad el, beleértve a különböző beszédhangjeleket is annak érdekében, hogy a modell hatékonyan szegmentálhassa és összegezze a szöveget, a natív dokumentumok pedig közvetlenül összegezhetik a dokumentumokat natív formátumukban, például Szavak, PDF stb.

Ez a dokumentáció a következő cikktípusokat tartalmazza:

A rövid útmutatók első lépések, amelyek végigvezetik a szolgáltatás kéréseinek teljesítésén.
Az útmutatók konkrétabb vagy testre szabottabb módon tartalmazzák a szolgáltatás használatára vonatkozó utasításokat.

Ezek a funkciók úgy lettek kialakítva, hogy lerövidítse azokat a tartalmakat, amelyek túl hosszúnak tekinthetők az olvasáshoz.

A szövegösszesítés főbb funkciói

A szövegösszesítés természetes nyelvi feldolgozási technikákkal készít összegzést egyszerű szövegekhez, amelyek dokumentumból, beszélgetésből vagy bármilyen szövegből származhatnak. Az API kétféleképpen foglalja össze az api-t:

Kivonatoló összegzés: Összegzést hoz létre a dokumentumon belüli hasznos mondatok kinyerésével, valamint a mondatok helymeghatározási információinak összeadásával.
- Több kinyert mondat: Ezek a mondatok együttesen közvetítik a dokumentum fő gondolatát. Ezek a bemeneti dokumentum tartalmából kinyert eredeti mondatok.
- Rangpontszám: A rangsor pontszáma azt jelzi, hogy egy mondat mennyire releváns a fő témakörhöz. A szövegösszesítés rangsorolja a kinyert mondatokat, és meghatározhatja, hogy a visszaadott mondatok a megjelenésük sorrendjében vagy a sorrendjüknek megfelelően jelennek-e meg. Ha például három mondatos összefoglaló összegzést kér, a három legmagasabb pontszámú mondatot adja vissza.
- Pozícióadatok: A kinyert mondatok kezdőpozíciója és hossza.
Absztraktív összegzés: Összegzést hoz létre tömör, koherens mondatokkal vagy szavakkal, amelyek nem szó szerint nyernek ki mondatokat az eredeti dokumentumból.
- Összefoglaló szövegek: Az absztraktív összegzés minden környezeti bemeneti tartomány összegzését adja vissza. A hosszú bemenetek szegmentáltak, így több összefoglaló szövegcsoport is visszaadható a környezetfüggő bemeneti tartományukkal.
- Környezetfüggő bemeneti tartomány: Az összegző szöveg létrehozásához használt bemeneten belüli tartomány.

Vegyük például a következő szöveg bekezdését:

"A Microsoftnál azon vagyunk, hogy a meglévő technikákon túlmutató mivoltunkkal holisztikusabb, emberközpontúbb megközelítést alkalmazzunk a tanuláshoz és a megértéshez. Az Azure AI-szolgáltatások technológiai igazgatójaként csodálatos tudósokból és mérnökökből álló csapattal dolgoztam, hogy ezt a küldetést valósággá alakítsam. Az én szerepkörömben az emberi megismerés három attribútuma közötti kapcsolatot tekinthetem meg: egynyelvű szöveg (X), hang- vagy vizuális érzékszervi jelek, (Y) és többnyelvű (Z). Mindhárom metszéspontjában van egy varázslat – amit XYZ-kódnak hívunk az 1. ábrán látható módon – egy közös ábrázolás, amely erősebb mesterséges intelligenciát hoz létre, amely jobban tud beszélni, hallani, látni és megérteni az embereket. Úgy gondoljuk, hogy az XYZ-kód lehetővé teszi számunkra, hogy megvalósítsuk hosszú távú elképzeléseinket: a tartományok közötti átvitel tanulását, a modalitásokon és nyelveken. A cél olyan előre betanított modellek használata, amelyek közösen tanulják meg a reprezentációkat az alsóbb rétegbeli AI-feladatok széles skálájának támogatásához, sok olyan módon, ahogyan az emberek ma. Az elmúlt öt évben emberi teljesítményt érhetünk el a beszédfelismerés, a gépi fordítás, a beszélgetési kérdések megválaszolása, a gépi olvasás megértése és a képfeliratok terén. Ez az öt áttörés erős jelzéseket adott számunkra a mi ambiciózusabb törekvésünk felé, hogy ugrást érjünk el a mesterséges intelligenciával kapcsolatos képességek terén, és olyan többérzékelős és többnyelvű tanulást érjünk el, amely közelebb áll az emberek tanulásához és megértéséhez. Úgy gondolom, hogy a közös XYZ-kód ennek a törekvésnek az alapja, ha az alsóbb rétegbeli AI-feladatokban külső tudásforrásokkal van alapozva."

A szövegösszesítési API-kérés feldolgozása a kérelem beérkezésekor történik, és létrehoz egy feladatot az API háttérrendszeréhez. Ha a feladat sikeres volt, a függvény visszaadja az API kimenetét. A kimenet 24 órán keresztül kérhető le. Ezután a kimenet törlődik. A többnyelvű és emoji támogatás miatt a válasz szövegeltolásokat tartalmazhat. További információ: eltolások feldolgozása.

Ha a fenti példát használjuk, az API a következő összegzéseket adja vissza:

Kivonatoló összegzés:

"A Microsoftnál azon dolgozunk, hogy a meglévő technikákon túlmutató mivoltunkkal holisztikusabb, emberközpontúbb megközelítést alkalmazzunk a tanuláshoz és a megértéshez."
"Úgy gondoljuk, hogy az XYZ-kód lehetővé teszi számunkra, hogy megvalósítsuk a hosszú távú elképzeléseinket: a tartományok közötti átvitel tanulását, a modalitásokon és nyelveken."
"A cél az, hogy olyan előre betanított modellekkel rendelkezzenek, amelyek közösen tanulhatnak ábrázolásokat az alsóbb rétegbeli AI-feladatok széles skálájának támogatásához, sok olyan módon, ahogyan az emberek ma."

Absztraktív összegzés:

"A Microsoft holisztikusabb, emberközpontúbb megközelítést alkalmaz a tanuláshoz és a megértéshez. Úgy gondoljuk, hogy az XYZ-kód lehetővé teszi számunkra, hogy megvalósítsuk hosszú távú elképzeléseinket: a tartományok közötti átvitel tanulását, a modalitásokon és nyelveken. Az elmúlt öt évben emberi teljesítményt értünk el a beszélgetési beszédfelismerési teljesítményteszteken."

Ez a dokumentáció a következő cikktípusokat tartalmazza:

A rövid útmutatók első lépések, amelyek végigvezetik a szolgáltatás kéréseinek teljesítésén.
Az útmutatók konkrétabb vagy testre szabottabb módon tartalmazzák a szolgáltatás használatára vonatkozó utasításokat.

A beszélgetések összegzésének főbb funkciói

A beszélgetések összegzése a következő funkciókat támogatja:

Összegzés: Egy beszélgetés összegzése egy rövid bekezdésbe.
Probléma/megoldás összegzése: A call center-specifikus funkciók, amelyek összefoglalják az ügyfélszolgálati ügynökök és az ügyfelek közötti beszélgetésekben előforduló problémákat és megoldásokat.
Fejezetcím összegzése: A beszélgetéseket fejezetekre bontja a beszélgetésben tárgyalt témakörök alapján, és a bemeneti beszélgetés javasolt fejezetcímeit adja meg.
Narratív összegzés: Részletes hívásjegyzeteket, értekezletjegyzeteket vagy csevegési összefoglalókat hoz létre a bemeneti beszélgetésről.

Vegyük például a következő példabeszélgetést:

Ügynök: "Helló, Rene-nel cseveg. Hogyan segíthetek?"

Ügyfél: "Szia, megpróbáltam wifi kapcsolatot beállítani a Smart Brew 300 kávéfőzőhöz, de nem működött."

Ügynök: "Sajnálom, hogy ezt hallom. Lássuk, mit tehetünk a probléma megoldásához. Le tudná nyomni a wifi kapcsolat gombot, tartsa lenyomva 3 másodpercig, majd tudassa velem, hogy a villanyfény lassan villog-e?"

Ügyfél: "Igen, leküldtem a wifi kapcsolat gombot, és most a villanyfény lassan villog."

Ügynök: "Nagyszerű. Köszönöm! Most jelentkezzen be a Contoso Coffee alkalmazásba. Kéri, hogy csatlakozzon a géphez?"

Ügyfél: "Nem. Semmi sem történt."

Ügynök: "Látom. Kösz. Próbáljuk meg, hogy egy gyári visszaállítás meg tudja-e oldani a problémát. A gyári visszaállítás elindításához nyomja le és tartsa lenyomva a középső gombot 5 másodpercig."

Ügyfél: "Megpróbáltam a gyári visszaállítást, és követtem a fenti lépéseket, de még mindig nem működött."

Ügynök: "Nagyon sajnálom, hogy ezt hallottam. Hadd lássam, van-e más módszer a probléma megoldására. Kérem, tartsa meg egy percig."

A beszélgetések összegzése a következőképpen egyszerűsítené a szöveget:

Példa összegzése	Megjegyzés	Beszélgetési szempont
Az ügyfél nem tudja beállítani a Wifi-kapcsolatot a Smart Brew 300 espresso géphez	ügyfél-ügynök beszélgetés során felmerült ügyfélproblémák	kiad
Az ügynök számos hibaelhárítási lépést javasolt, többek között a wifi-kapcsolat ellenőrzését, a Contoso Coffee alkalmazás ellenőrzését és a gyári beállítások visszaállítását. A fenti lépések egyike sem oldotta meg a problémát. Az ügynök ezután visszatartja az ügyfelet egy másik megoldás kereséséhez.	ügyfél-ügynök beszélgetés során kipróbált megoldások	felbontás
Az ügyfél segítséget kért az ügynökhöz a Smart Brew 300 eszpresszógép wifi-kapcsolatának beállításához. Az ügynök számos hibaelhárítási lépésen végigvezette az ügyfelet, beleértve a wifi-kapcsolat ellenőrzését, az áramellátás ellenőrzését és a gyári beállítások visszaállítását. Annak ellenére, hogy követte ezeket a lépéseket, a probléma továbbra is fennállt. Az ügynök ezután úgy döntött, hogy vizsgálja meg más lehetséges megoldásokat	Egy beszélgetés összegzése egy bekezdésbe	Emlékeztető
SmartBrew 300 Espresso Machine hibaelhárítása	A beszélgetések szegmentálása és az egyes szegmensek címének létrehozása; általában együtt dolgozik a `narrative` szempont	chapterTitle
Az ügyfél nem tud wifi kapcsolatot létesíteni a Smart Brew 300 kávéfőzőhöz. Az ügynök számos megoldást javasol, beleértve a gyári visszaállítást is, de a probléma továbbra is fennáll.	A beszélgetés szegmentálása és az egyes szegmensek összegzése, általában a szempontokkal való `chapterTitle` együttműködés	elbeszélő

Ez a dokumentáció a következő cikktípusokat tartalmazza:

A rövid útmutatók első lépések, amelyek végigvezetik a szolgáltatás kéréseinek teljesítésén.
Az útmutatók konkrétabb vagy testre szabottabb módon tartalmazzák a szolgáltatás használatára vonatkozó utasításokat.

A dokumentumösszesítés természetes nyelvi feldolgozási technikákkal készít összegzést a dokumentumokhoz.

A natív dokumentumok az eredeti dokumentum, például a Microsoft Word (docx) vagy egy hordozható dokumentumfájl (pdf) létrehozásához használt fájlformátumra utalnak. A natív dokumentumok támogatása szükségtelenné teszi a szöveg előfeldolgozását az Azure AI Language erőforrás-képességeinek használata előtt. Jelenleg a natív dokumentumtámogatás kétféle összegzéshez érhető el:

Kivonatoló összegzés: Összegzést hoz létre a dokumentumon belüli hasznos mondatok kinyerésével, valamint a mondatok helymeghatározási információinak összeadásával.
- Több kinyert mondat: Ezek a mondatok együttesen közvetítik a dokumentum fő gondolatát. Ezek a bemeneti dokumentum tartalmából kinyert eredeti mondatok.
- Rangpontszám: A rangsor pontszáma azt jelzi, hogy egy mondat mennyire releváns a fő témakörhöz. A szövegösszesítés rangsorolja a kinyert mondatokat, és meghatározhatja, hogy a visszaadott mondatok a megjelenésük sorrendjében vagy a sorrendjüknek megfelelően jelennek-e meg. Ha például három mondatos összefoglaló összegzést kér, a három legmagasabb pontszámú mondatot adja vissza.
- Pozícióadatok: A kinyert mondatok kezdőpozíciója és hossza.
Absztraktív összegzés: Összegzést hoz létre tömör, koherens mondatokkal vagy szavakkal, amelyek nem szó szerint nyernek ki mondatokat az eredeti dokumentumból.
- Összefoglaló szövegek: Az absztraktív összegzés minden környezeti bemeneti tartomány összegzését adja vissza. A hosszú bemenetek szegmentáltak, így több összefoglaló szövegcsoport is visszaadható a környezetfüggő bemeneti tartományukkal.
- Környezetfüggő bemeneti tartomány: Az összegző szöveg létrehozásához használt bemeneten belüli tartomány.

A Dokumentumösszesítés jelenleg a következő natív dokumentumformátumokat támogatja:

Fájltípus	Fájlkiterjesztés	Leírás
Szöveges	`.txt`	Formázatlan szöveges dokumentum.
Adobe PDF	`.pdf`	Egy hordozható dokumentumfájl formázott dokumentuma.
Microsoft Word	`.docx`	Egy Microsoft Word-dokumentumfájl.

További információ: Natív dokumentumok használata nyelvfeldolgozáshoz

Első lépések az összegzésben

Az összegzés használatához elemzésre kell küldenie, és kezelnie kell az api-kimenetet az alkalmazásban. Az elemzés az adott módon történik, és nincs hozzá további testreszabás az adatokhoz használt modellhez. Az összegzés kétféleképpen használható:

Fejlesztési lehetőség	Leírás
Language Studio	A Language Studio egy webes platform, amellyel azure-fiók nélkül próbálhatja ki a szöveges példákkal összekapcsolt entitásokat, valamint a regisztrációkor a saját adatait. További információt a Language Studio webhelyén vagy a Language Studio rövid útmutatójában talál.
REST API vagy ügyfélkódtár (Azure SDK)	Szövegösszesítés integrálása az alkalmazásokba a REST API vagy a különböző nyelveken elérhető ügyfélkódtár használatával. További információkért tekintse meg az összefoglaló rövid útmutatót.

Fejlesztési lehetőség	Leírás	Hivatkozások
REST API	Integrálhatja a beszélgetések összegzését az alkalmazásokba a REST API használatával.	Rövid útmutató: Beszélgetések összegzésének használata

Fejlesztési lehetőség	Leírás
Language Studio	A Language Studio egy webes platform, amellyel azure-fiók nélkül próbálhatja ki a szöveges példákkal összekapcsolt entitásokat, valamint a regisztrációkor a saját adatait. További információt a Language Studio webhelyén vagy a Language Studio rövid útmutatójában talál.
REST API vagy ügyfélkódtár (Azure SDK)	Szövegösszesítés integrálása az alkalmazásokba a REST API vagy a különböző nyelveken elérhető ügyfélkódtár használatával. További információkért tekintse meg az összefoglaló rövid útmutatót.

Bemeneti követelmények és szolgáltatási korlátok

Az összegzés szövegeket vesz igénybe az elemzéshez. További információ: Az adatok és a szolgáltatások korlátai az útmutatóban.
Az összegzés különböző írott nyelvekkel működik. További információ: nyelvi támogatás.

Referenciadokumentáció és kódminták

Amikor az alkalmazásokban szövegösszesítést használ, tekintse meg a következő referenciadokumentációt és -mintákat az Azure AI-nyelvhez:

Fejlesztési lehetőség / nyelv	Referenciadokumentáció	Példák
C#	C#-dokumentáció	C#-minták
Java	Java-dokumentáció	Java-minták
JavaScript	A JavaScript dokumentációja	JavaScript-minták
Python	Python-dokumentáció	Python-példák

Felelős AI

Az AI-rendszerek nem csak a technológiát, hanem az azt használó személyeket, az érintett személyeket és az üzembe helyezési környezetet is magukban foglalják. A rendszerek felelősségteljes AI-használatának és üzembe helyezésének megismeréséhez olvassa el az átláthatósági megjegyzést. További információért tekintse át az alábbi cikkeket:

Megosztás a következőn keresztül:

Mi az összegzés?

A szövegösszesítés főbb funkciói

A beszélgetések összegzésének főbb funkciói

Első lépések az összegzésben

Bemeneti követelmények és szolgáltatási korlátok

Referenciadokumentáció és kódminták

Felelős AI

Visszajelzés

További források