Mi az összegzés?
Fontos
Az előzetes verziójú régiónk, a Svédország középső régiója bemutatja a legújabb és folyamatosan fejlődő LLM finomhangolási technikákat GPT-modellek alapján. Szívesen kipróbálja őket egy nyelvi erőforrással a svédországi középső régióban.
A beszélgetések összegzése csak a következő használatával érhető el:
- REST API
- Python
- C#
A summarization az Azure AI Language egyik funkciója, amely a generatív nagy nyelvi modellek és a feladatoptimalizált kódoló modellek kombinációja, amelyek magasabb minőségű, költséghatékony és kisebb késésű összefoglaló megoldásokat kínálnak. Ebből a cikkből többet is megtudhat erről a funkcióról, és arról, hogyan használhatja azt az alkalmazásokban.
A szolgáltatás három műfajtípushoz, egyszerű szövegekhez, beszélgetésekhez és natív dokumentumokhoz kínál összegzési megoldásokat. A szövegösszesítés csak egyszerű szövegblokkokat fogad el, a beszélgetések összegzése pedig beszélgetési bemenetet fogad el, beleértve a különböző beszédhangjeleket is annak érdekében, hogy a modell hatékonyan szegmentálhassa és összegezze a szöveget, a natív dokumentumok pedig közvetlenül összegezhetik a dokumentumokat natív formátumukban, például Szavak, PDF stb.
Ez a dokumentáció a következő cikktípusokat tartalmazza:
- A rövid útmutatók első lépések, amelyek végigvezetik a szolgáltatás kéréseinek teljesítésén.
- Az útmutatók konkrétabb vagy testre szabottabb módon tartalmazzák a szolgáltatás használatára vonatkozó utasításokat.
Ezek a funkciók úgy lettek kialakítva, hogy lerövidítse azokat a tartalmakat, amelyek túl hosszúnak tekinthetők az olvasáshoz.
A szövegösszesítés főbb funkciói
A szövegösszesítés természetes nyelvi feldolgozási technikákkal készít összegzést egyszerű szövegekhez, amelyek dokumentumból, beszélgetésből vagy bármilyen szövegből származhatnak. Az API kétféleképpen foglalja össze az api-t:
Kivonatoló összegzés: Összegzést hoz létre a dokumentumon belüli hasznos mondatok kinyerésével, valamint a mondatok helymeghatározási információinak összeadásával.
- Több kinyert mondat: Ezek a mondatok együttesen közvetítik a dokumentum fő gondolatát. Ezek a bemeneti dokumentum tartalmából kinyert eredeti mondatok.
- Rangpontszám: A rangsor pontszáma azt jelzi, hogy egy mondat mennyire releváns a fő témakörhöz. A szövegösszesítés rangsorolja a kinyert mondatokat, és meghatározhatja, hogy a visszaadott mondatok a megjelenésük sorrendjében vagy a sorrendjüknek megfelelően jelennek-e meg. Ha például három mondatos összefoglaló összegzést kér, a három legmagasabb pontszámú mondatot adja vissza.
- Pozícióadatok: A kinyert mondatok kezdőpozíciója és hossza.
Absztraktív összegzés: Összegzést hoz létre tömör, koherens mondatokkal vagy szavakkal, amelyek nem szó szerint nyernek ki mondatokat az eredeti dokumentumból.
- Összefoglaló szövegek: Az absztraktív összegzés minden környezeti bemeneti tartomány összegzését adja vissza. A hosszú bemenetek szegmentáltak, így több összefoglaló szövegcsoport is visszaadható a környezetfüggő bemeneti tartományukkal.
- Környezetfüggő bemeneti tartomány: Az összegző szöveg létrehozásához használt bemeneten belüli tartomány.
Vegyük például a következő szöveg bekezdését:
"A Microsoftnál azon vagyunk, hogy a meglévő technikákon túlmutató mivoltunkkal holisztikusabb, emberközpontúbb megközelítést alkalmazzunk a tanuláshoz és a megértéshez. Az Azure AI-szolgáltatások technológiai igazgatójaként csodálatos tudósokból és mérnökökből álló csapattal dolgoztam, hogy ezt a küldetést valósággá alakítsam. Az én szerepkörömben az emberi megismerés három attribútuma közötti kapcsolatot tekinthetem meg: egynyelvű szöveg (X), hang- vagy vizuális érzékszervi jelek, (Y) és többnyelvű (Z). Mindhárom metszéspontjában van egy varázslat – amit XYZ-kódnak hívunk az 1. ábrán látható módon – egy közös ábrázolás, amely erősebb mesterséges intelligenciát hoz létre, amely jobban tud beszélni, hallani, látni és megérteni az embereket. Úgy gondoljuk, hogy az XYZ-kód lehetővé teszi számunkra, hogy megvalósítsuk hosszú távú elképzeléseinket: a tartományok közötti átvitel tanulását, a modalitásokon és nyelveken. A cél olyan előre betanított modellek használata, amelyek közösen tanulják meg a reprezentációkat az alsóbb rétegbeli AI-feladatok széles skálájának támogatásához, sok olyan módon, ahogyan az emberek ma. Az elmúlt öt évben emberi teljesítményt érhetünk el a beszédfelismerés, a gépi fordítás, a beszélgetési kérdések megválaszolása, a gépi olvasás megértése és a képfeliratok terén. Ez az öt áttörés erős jelzéseket adott számunkra a mi ambiciózusabb törekvésünk felé, hogy ugrást érjünk el a mesterséges intelligenciával kapcsolatos képességek terén, és olyan többérzékelős és többnyelvű tanulást érjünk el, amely közelebb áll az emberek tanulásához és megértéséhez. Úgy gondolom, hogy a közös XYZ-kód ennek a törekvésnek az alapja, ha az alsóbb rétegbeli AI-feladatokban külső tudásforrásokkal van alapozva."
A szövegösszesítési API-kérés feldolgozása a kérelem beérkezésekor történik, és létrehoz egy feladatot az API háttérrendszeréhez. Ha a feladat sikeres volt, a függvény visszaadja az API kimenetét. A kimenet 24 órán keresztül kérhető le. Ezután a kimenet törlődik. A többnyelvű és emoji támogatás miatt a válasz szövegeltolásokat tartalmazhat. További információ: eltolások feldolgozása.
Ha a fenti példát használjuk, az API a következő összegzéseket adja vissza:
Kivonatoló összegzés:
- "A Microsoftnál azon dolgozunk, hogy a meglévő technikákon túlmutató mivoltunkkal holisztikusabb, emberközpontúbb megközelítést alkalmazzunk a tanuláshoz és a megértéshez."
- "Úgy gondoljuk, hogy az XYZ-kód lehetővé teszi számunkra, hogy megvalósítsuk a hosszú távú elképzeléseinket: a tartományok közötti átvitel tanulását, a modalitásokon és nyelveken."
- "A cél az, hogy olyan előre betanított modellekkel rendelkezzenek, amelyek közösen tanulhatnak ábrázolásokat az alsóbb rétegbeli AI-feladatok széles skálájának támogatásához, sok olyan módon, ahogyan az emberek ma."
Absztraktív összegzés:
- "A Microsoft holisztikusabb, emberközpontúbb megközelítést alkalmaz a tanuláshoz és a megértéshez. Úgy gondoljuk, hogy az XYZ-kód lehetővé teszi számunkra, hogy megvalósítsuk hosszú távú elképzeléseinket: a tartományok közötti átvitel tanulását, a modalitásokon és nyelveken. Az elmúlt öt évben emberi teljesítményt értünk el a beszélgetési beszédfelismerési teljesítményteszteken."
Első lépések az összegzésben
Az összegzés használatához elemzésre kell küldenie, és kezelnie kell az api-kimenetet az alkalmazásban. Az elemzés az adott módon történik, és nincs hozzá további testreszabás az adatokhoz használt modellhez. Az összegzés kétféleképpen használható:
Fejlesztési lehetőség | Leírás |
---|---|
Language Studio | A Language Studio egy webes platform, amellyel azure-fiók nélkül próbálhatja ki a szöveges példákkal összekapcsolt entitásokat, valamint a regisztrációkor a saját adatait. További információt a Language Studio webhelyén vagy a Language Studio rövid útmutatójában talál. |
REST API vagy ügyfélkódtár (Azure SDK) | Szövegösszesítés integrálása az alkalmazásokba a REST API vagy a különböző nyelveken elérhető ügyfélkódtár használatával. További információkért tekintse meg az összefoglaló rövid útmutatót. |
Bemeneti követelmények és szolgáltatási korlátok
- Az összegzés szövegeket vesz igénybe az elemzéshez. További információ: Az adatok és a szolgáltatások korlátai az útmutatóban.
- Az összegzés különböző írott nyelvekkel működik. További információ: nyelvi támogatás.
Referenciadokumentáció és kódminták
Amikor az alkalmazásokban szövegösszesítést használ, tekintse meg a következő referenciadokumentációt és -mintákat az Azure AI-nyelvhez:
Fejlesztési lehetőség / nyelv | Referenciadokumentáció | Példák |
---|---|---|
C# | C#-dokumentáció | C#-minták |
Java | Java-dokumentáció | Java-minták |
JavaScript | A JavaScript dokumentációja | JavaScript-minták |
Python | Python-dokumentáció | Python-példák |
Felelős AI
Az AI-rendszerek nem csak a technológiát, hanem az azt használó személyeket, az érintett személyeket és az üzembe helyezési környezetet is magukban foglalják. A rendszerek felelősségteljes AI-használatának és üzembe helyezésének megismeréséhez olvassa el az átláthatósági megjegyzést. További információért tekintse át az alábbi cikkeket: