Megosztás a következőn keresztül:


Mi az összegzés?

Fontos

Az előzetes verziójú régiónk, a Svédország középső régiója bemutatja a legújabb és folyamatosan fejlődő LLM finomhangolási technikákat GPT-modellek alapján. Szívesen kipróbálja őket egy nyelvi erőforrással a svédországi középső régióban.

A beszélgetések összegzése csak a következő használatával érhető el:

  • REST API
  • Python
  • C#

A summarization az Azure AI Language egyik funkciója, amely a generatív nagy nyelvi modellek és a feladatoptimalizált kódoló modellek kombinációja, amelyek magasabb minőségű, költséghatékony és kisebb késésű összefoglaló megoldásokat kínálnak. Ebből a cikkből többet is megtudhat erről a funkcióról, és arról, hogyan használhatja azt az alkalmazásokban.

A szolgáltatás három műfajtípushoz, egyszerű szövegekhez, beszélgetésekhez és natív dokumentumokhoz kínál összegzési megoldásokat. A szövegösszesítés csak egyszerű szövegblokkokat fogad el, a beszélgetések összegzése pedig beszélgetési bemenetet fogad el, beleértve a különböző beszédhangjeleket is annak érdekében, hogy a modell hatékonyan szegmentálhassa és összegezze a szöveget, a natív dokumentumok pedig közvetlenül összegezhetik a dokumentumokat natív formátumukban, például Szavak, PDF stb.

Ez a dokumentáció a következő cikktípusokat tartalmazza:

  • A rövid útmutatók első lépések, amelyek végigvezetik a szolgáltatás kéréseinek teljesítésén.
  • Az útmutatók konkrétabb vagy testre szabottabb módon tartalmazzák a szolgáltatás használatára vonatkozó utasításokat.

Ezek a funkciók úgy lettek kialakítva, hogy lerövidítse azokat a tartalmakat, amelyek túl hosszúnak tekinthetők az olvasáshoz.

A szövegösszesítés főbb funkciói

A szövegösszesítés természetes nyelvi feldolgozási technikákkal készít összegzést egyszerű szövegekhez, amelyek dokumentumból, beszélgetésből vagy bármilyen szövegből származhatnak. Az API kétféleképpen foglalja össze az api-t:

  • Kivonatoló összegzés: Összegzést hoz létre a dokumentumon belüli hasznos mondatok kinyerésével, valamint a mondatok helymeghatározási információinak összeadásával.

    • Több kinyert mondat: Ezek a mondatok együttesen közvetítik a dokumentum fő gondolatát. Ezek a bemeneti dokumentum tartalmából kinyert eredeti mondatok.
    • Rangpontszám: A rangsor pontszáma azt jelzi, hogy egy mondat mennyire releváns a fő témakörhöz. A szövegösszesítés rangsorolja a kinyert mondatokat, és meghatározhatja, hogy a visszaadott mondatok a megjelenésük sorrendjében vagy a sorrendjüknek megfelelően jelennek-e meg. Ha például három mondatos összefoglaló összegzést kér, a három legmagasabb pontszámú mondatot adja vissza.
    • Pozícióadatok: A kinyert mondatok kezdőpozíciója és hossza.
  • Absztraktív összegzés: Összegzést hoz létre tömör, koherens mondatokkal vagy szavakkal, amelyek nem szó szerint nyernek ki mondatokat az eredeti dokumentumból.

    • Összefoglaló szövegek: Az absztraktív összegzés minden környezeti bemeneti tartomány összegzését adja vissza. A hosszú bemenetek szegmentáltak, így több összefoglaló szövegcsoport is visszaadható a környezetfüggő bemeneti tartományukkal.
    • Környezetfüggő bemeneti tartomány: Az összegző szöveg létrehozásához használt bemeneten belüli tartomány.

Vegyük például a következő szöveg bekezdését:

"A Microsoftnál azon vagyunk, hogy a meglévő technikákon túlmutató mivoltunkkal holisztikusabb, emberközpontúbb megközelítést alkalmazzunk a tanuláshoz és a megértéshez. Az Azure AI-szolgáltatások technológiai igazgatójaként csodálatos tudósokból és mérnökökből álló csapattal dolgoztam, hogy ezt a küldetést valósággá alakítsam. Az én szerepkörömben az emberi megismerés három attribútuma közötti kapcsolatot tekinthetem meg: egynyelvű szöveg (X), hang- vagy vizuális érzékszervi jelek, (Y) és többnyelvű (Z). Mindhárom metszéspontjában van egy varázslat – amit XYZ-kódnak hívunk az 1. ábrán látható módon – egy közös ábrázolás, amely erősebb mesterséges intelligenciát hoz létre, amely jobban tud beszélni, hallani, látni és megérteni az embereket. Úgy gondoljuk, hogy az XYZ-kód lehetővé teszi számunkra, hogy megvalósítsuk hosszú távú elképzeléseinket: a tartományok közötti átvitel tanulását, a modalitásokon és nyelveken. A cél olyan előre betanított modellek használata, amelyek közösen tanulják meg a reprezentációkat az alsóbb rétegbeli AI-feladatok széles skálájának támogatásához, sok olyan módon, ahogyan az emberek ma. Az elmúlt öt évben emberi teljesítményt érhetünk el a beszédfelismerés, a gépi fordítás, a beszélgetési kérdések megválaszolása, a gépi olvasás megértése és a képfeliratok terén. Ez az öt áttörés erős jelzéseket adott számunkra a mi ambiciózusabb törekvésünk felé, hogy ugrást érjünk el a mesterséges intelligenciával kapcsolatos képességek terén, és olyan többérzékelős és többnyelvű tanulást érjünk el, amely közelebb áll az emberek tanulásához és megértéséhez. Úgy gondolom, hogy a közös XYZ-kód ennek a törekvésnek az alapja, ha az alsóbb rétegbeli AI-feladatokban külső tudásforrásokkal van alapozva."

A szövegösszesítési API-kérés feldolgozása a kérelem beérkezésekor történik, és létrehoz egy feladatot az API háttérrendszeréhez. Ha a feladat sikeres volt, a függvény visszaadja az API kimenetét. A kimenet 24 órán keresztül kérhető le. Ezután a kimenet törlődik. A többnyelvű és emoji támogatás miatt a válasz szövegeltolásokat tartalmazhat. További információ: eltolások feldolgozása.

Ha a fenti példát használjuk, az API a következő összegzéseket adja vissza:

Kivonatoló összegzés:

  • "A Microsoftnál azon dolgozunk, hogy a meglévő technikákon túlmutató mivoltunkkal holisztikusabb, emberközpontúbb megközelítést alkalmazzunk a tanuláshoz és a megértéshez."
  • "Úgy gondoljuk, hogy az XYZ-kód lehetővé teszi számunkra, hogy megvalósítsuk a hosszú távú elképzeléseinket: a tartományok közötti átvitel tanulását, a modalitásokon és nyelveken."
  • "A cél az, hogy olyan előre betanított modellekkel rendelkezzenek, amelyek közösen tanulhatnak ábrázolásokat az alsóbb rétegbeli AI-feladatok széles skálájának támogatásához, sok olyan módon, ahogyan az emberek ma."

Absztraktív összegzés:

  • "A Microsoft holisztikusabb, emberközpontúbb megközelítést alkalmaz a tanuláshoz és a megértéshez. Úgy gondoljuk, hogy az XYZ-kód lehetővé teszi számunkra, hogy megvalósítsuk hosszú távú elképzeléseinket: a tartományok közötti átvitel tanulását, a modalitásokon és nyelveken. Az elmúlt öt évben emberi teljesítményt értünk el a beszélgetési beszédfelismerési teljesítményteszteken."

Első lépések az összegzésben

Az összegzés használatához elemzésre kell küldenie, és kezelnie kell az api-kimenetet az alkalmazásban. Az elemzés az adott módon történik, és nincs hozzá további testreszabás az adatokhoz használt modellhez. Az összegzés kétféleképpen használható:

Fejlesztési lehetőség Leírás
Language Studio A Language Studio egy webes platform, amellyel azure-fiók nélkül próbálhatja ki a szöveges példákkal összekapcsolt entitásokat, valamint a regisztrációkor a saját adatait. További információt a Language Studio webhelyén vagy a Language Studio rövid útmutatójában talál.
REST API vagy ügyfélkódtár (Azure SDK) Szövegösszesítés integrálása az alkalmazásokba a REST API vagy a különböző nyelveken elérhető ügyfélkódtár használatával. További információkért tekintse meg az összefoglaló rövid útmutatót.

Bemeneti követelmények és szolgáltatási korlátok

Referenciadokumentáció és kódminták

Amikor az alkalmazásokban szövegösszesítést használ, tekintse meg a következő referenciadokumentációt és -mintákat az Azure AI-nyelvhez:

Fejlesztési lehetőség / nyelv Referenciadokumentáció Példák
C# C#-dokumentáció C#-minták
Java Java-dokumentáció Java-minták
JavaScript A JavaScript dokumentációja JavaScript-minták
Python Python-dokumentáció Python-példák

Felelős AI

Az AI-rendszerek nem csak a technológiát, hanem az azt használó személyeket, az érintett személyeket és az üzembe helyezési környezetet is magukban foglalják. A rendszerek felelősségteljes AI-használatának és üzembe helyezésének megismeréséhez olvassa el az átláthatósági megjegyzést. További információért tekintse át az alábbi cikkeket: