Mi az a dokumentum- és beszélgetés-összegzés?
Fontos
Egy előzetes verziójú régió, a Svédország középső régiója bemutatja a legújabb és folyamatosan fejlődő LLM finomhangolási technikákat, ahol minden összegző képesség elérhető. Üdvözöljük ügyfeleinket, hogy csatlakozzanak korai örökbefogadó közösségünkhöz a hozzáférési kérelem űrlapjának kitöltésével. Értékes visszajelzése elengedhetetlen a folyamatos fejlesztéshez.
A beszélgetések összegzése csak a következő használatával érhető el:
- REST API
- Python
- C#
A summarization az Azure AI Language egyik funkciója, amely gépi tanulási és AI-algoritmusok gyűjteménye a felhőben az írott nyelvet használó intelligens alkalmazások fejlesztéséhez. Ebből a cikkből többet is megtudhat erről a funkcióról, és arról, hogyan használhatja azt az alkalmazásokban.
Vegye figyelembe, hogy bár a szolgáltatások dokumentum- és beszélgetésösszesítésként vannak megjelölve, a dokumentumösszesítés csak egyszerű szövegblokkokat fogad el, a beszélgetések összegzése pedig különböző beszédösszetevőket fogad el, hogy a modell többet tudjon meg. Ha egy beszélgetést szeretne feldolgozni, de csak a szöveg érdekli, használhat dokumentumösszesítést ehhez a forgatókönyvhöz.
Az egyéni összegzés lehetővé teszi, hogy a felhasználók egyéni AI-modelleket készítsenek strukturálatlan szövegek, például szerződések vagy regények összegzéséhez. Egyéni összegzési projekt létrehozásával a fejlesztők iteratív módon címkézhetik meg az adatokat, betanítást, kiértékelhetnek és javíthatnak a modell teljesítményének, mielőtt elérhetővé tennék azt felhasználás céljából. A címkézett adatok minősége nagyban befolyásolja a modell teljesítményét. A modell létrehozásának és testreszabásának egyszerűsítése érdekében a szolgáltatás egy egyéni webportált kínál, amely a Language Studióban érhető el. A gyorsútmutató lépéseit követve egyszerűen megkezdheti a szolgáltatást.
Ez a dokumentáció a következő cikktípusokat tartalmazza:
- A rövid útmutatók első lépések, amelyek végigvezetik a szolgáltatás kéréseinek teljesítésén.
- Az útmutatók konkrétabb vagy testre szabottabb módon tartalmazzák a szolgáltatás használatára vonatkozó utasításokat.
A dokumentumösszesítés természetes nyelvi feldolgozási technikákkal készít összegzést a dokumentumokhoz. Az automatikus összegzésnek két általános megközelítése van, mindkettőt az API támogatja: kivonatoló és absztraktív.
A kivonatoló összegzés olyan mondatokat nyer ki, amelyek együttesen képviselik az eredeti tartalom legfontosabb vagy releváns információit. Az absztraktív összegzés tömör, koherens mondatokat vagy szavakat tartalmazó összegzést hoz létre, amely nem egyszerűen kinyeri a mondatokat az eredeti dokumentumból. Ezek a funkciók úgy lettek kialakítva, hogy lerövidítse azokat a tartalmakat, amelyek túl hosszúnak tekinthetők az olvasáshoz.
Legfontosabb funkciók
Az API kétféle dokumentumösszesítést biztosít:
- Kivonatoló összegzés: Összegzést hoz létre a dokumentumon belüli hasznos mondatok kinyerésével.
- Több kinyert mondat: Ezek a mondatok együttesen közvetítik a dokumentum fő gondolatát. Ezek a bemeneti dokumentum tartalmából kinyert eredeti mondatok.
- Rangpontszám: A rangsor pontszáma azt jelzi, hogy egy mondat mennyire releváns egy dokumentum fő témaköréhez. A dokumentumösszesítés rangsorolja a kinyert mondatokat, és meghatározhatja, hogy a visszaadott mondatok a megjelenésük sorrendjében vagy a rangsoruk szerint vannak-e visszaadva.
- Több visszaadott mondat: Határozza meg a visszaadandó mondatok maximális számát. Ha például három mondatos összefoglaló összegzést kér, a három legmagasabb pontszámú mondatot adja vissza.
- Pozícióadatok: A kinyert mondatok kezdőpozíciója és hossza.
- Absztraktív összegzés: Olyan összegzést hoz létre, amely nem ugyanazokat a szavakat használja, mint a dokumentumban, de rögzíti a fő gondolatot.
- Összefoglaló szövegek: Az absztraktív összegzés a dokumentumon belüli minden környezeti bemeneti tartomány összegzését adja vissza. A hosszú dokumentumok szegmentáltak lehetnek, így több összefoglaló szövegcsoportot is visszaadhatnak a környezetfüggő bemeneti tartományukkal.
- Környezetfüggő bemeneti tartomány: Az összefoglaló szöveg létrehozásához használt bemeneti dokumentum tartománya.
Vegyük például a következő szöveg bekezdését:
"A Microsoftnál arra a küldetésre jutottunk, hogy a meglévő technikákon túlmutató mivoltunkkal holisztikusabb, emberközpontúbb megközelítést alkalmazzunk a tanuláshoz és a megértéshez. Az Azure AI-szolgáltatások technológiai igazgatójaként csodálatos tudósokból és mérnökökből álló csapattal dolgoztam, hogy ezt a küldetést valósággá alakítsam. Az én szerepkörömben az emberi megismerés három attribútuma közötti kapcsolatot tekinthetem meg: egynyelvű szöveg (X), hang- vagy vizuális érzékszervi jelek, (Y) és többnyelvű (Z). Mindhárom metszéspontjában van egy varázslat – amit XYZ-kódnak hívunk az 1. ábrán látható módon – egy közös ábrázolás, amely erősebb mesterséges intelligenciát hoz létre, amely jobban tud beszélni, hallani, látni és megérteni az embereket. Úgy gondoljuk, hogy az XYZ-code lehetővé teszi számunkra, hogy megvalósítsuk hosszú távú elképzeléseinket: a tartományok közötti átvitel tanulását, a modalitásokon és nyelveken. A cél az előre betanított modellek használata, amelyek közösen tanulják meg a reprezentációkat az alsóbb rétegbeli AI-feladatok széles körének támogatásához, sok olyan módon, ahogyan az emberek ma. Az elmúlt öt évben emberi teljesítményt nyújtottunk a beszédfelismerés, a gépi fordítás, a beszélgetési kérdések megválaszolása, a gépi olvasás megértése és a képi képaláírás terén. Ez az öt áttörés erős jelzéseket adott számunkra a mi ambiciózusabb törekvésünk felé, hogy ugrást érjünk el a mesterséges intelligenciával kapcsolatos képességek terén, és olyan többérzékelős és többnyelvű tanulást érjünk el, amely közelebb áll az emberek tanulásához és megértéséhez. Úgy gondolom, hogy a közös XYZ-kód ennek a törekvésnek az alapja, ha az alsóbb rétegbeli AI-feladatokban külső tudásforrásokkal van alapozva."
A dokumentumösszesítési API-kérés feldolgozása a kérelem beérkezésekor történik, és létrehoz egy feladatot az API háttérrendszeréhez. Ha a feladat sikeres volt, a rendszer visszaadja az API kimenetét. A kimenet 24 órán keresztül lesz elérhető a lekéréshez. Ezután a kimenet törlődik. A többnyelvű és emoji támogatás miatt a válasz szövegeltolásokat tartalmazhat. További információkért tekintse meg az eltolások feldolgozásának módját.
A fenti példában az API a következő összegzett mondatokat adja vissza:
Kivonatoló összegzés:
- "A Microsoftnál arra a küldetésre jutottunk, hogy a meglévő technikákon túlmutató mivoltunkkal holisztikusabb, emberközpontúbb megközelítést alkalmazzunk a tanuláshoz és a megértéshez."
- "Úgy gondoljuk, hogy az XYZ-kód lehetővé teszi számunkra, hogy megvalósítsuk a hosszú távú elképzeléseinket: a tartományok közötti átvitel tanulását, a modalitásokon és nyelveken."
- "A cél az előre betanított modellek használata, amelyek közösen tanulják meg a reprezentációkat az alsóbb rétegbeli AI-feladatok széles körének támogatásához, sok olyan módon, ahogyan az emberek ma."
Absztraktív összegzés:
- "A Microsoft holisztikusabb, emberközpontúbb megközelítést alkalmaz a tanuláshoz és a megértéshez. Úgy gondoljuk, hogy az XYZ-code lehetővé teszi számunkra, hogy megvalósítsuk hosszú távú elképzeléseinket: a tartományok közötti átvitel tanulását, a modalitásokon és nyelveken. Az elmúlt öt évben emberi teljesítményt értünk el a teljesítményteszteken."
Első lépések az összegzésben
Az összegzés használatához nyers strukturálatlan szöveget kell küldenie elemzéshez, és kezelnie kell az api-kimenetet az alkalmazásban. Az elemzés az adott módon történik, az adatokon használt modell további testreszabása nélkül. Az összegzés kétféleképpen használható:
Fejlesztési lehetőség | Leírás |
---|---|
Language Studio | A Language Studio egy webes platform, amellyel azure-fiók nélkül próbálhatja ki a szöveges példákkal összekapcsolt entitásokat, valamint a regisztrációkor a saját adatait. További információt a Language Studio webhelyén vagy a Language Studio rövid útmutatójában talál. |
REST API vagy ügyfélkódtár (Azure SDK) | A REST API vagy a különböző nyelveken elérhető ügyfélkódtár használatával integrálhatja a dokumentumösszesítést az alkalmazásokba. További információkért tekintse meg az összefoglaló rövid útmutatót. |
Bemeneti követelmények és szolgáltatási korlátok
- Az összegzés nyers strukturálatlan szöveget vesz igénybe az elemzéshez. További információért tekintse meg az adatok és szolgáltatások korlátait az útmutatóban.
- Az összegzés számos különböző írott nyelvvel működik. További információt a nyelvi támogatásban talál.
Referenciadokumentáció és kódminták
Amikor dokumentum-összegzést használ az alkalmazásokban, tekintse meg a következő referenciadokumentációt és -mintákat az Azure AI-nyelvhez:
Fejlesztési lehetőség / nyelv | Reference documentation | Samples |
---|---|---|
C# | C#-dokumentáció | C#-minták |
Java | Java-dokumentáció | Java-minták |
JavaScript | A JavaScript dokumentációja | JavaScript-minták |
Python | Python-dokumentáció | Python-példák |
Felelős AI
Az AI-rendszerek nem csak a technológiát, hanem a felhasználókat is magukban foglalják, azokat, akiket érint majd, és a környezet, amelyben üzembe helyezték. A rendszerek felelősségteljes AI-használatának és üzembe helyezésének megismeréséhez olvassa el az átláthatósági megjegyzést. További információért az alábbi cikkeket is megtekintheti: