Dokumentumintelligencia-összeállítású egyéni modellek

Cikk
09/02/2024

Fontos

A Document Intelligence nyilvános előzetes verziójú kiadásai korai hozzáférést biztosítanak az aktív fejlesztés alatt lévő funkciókhoz. A funkciók, a megközelítések és a folyamatok az általános rendelkezésre állás (GA) előtt változhatnak a felhasználói visszajelzések alapján.
A Document Intelligence ügyfélkódtárak nyilvános előzetes verziója alapértelmezés szerint a REST API 2024-07-31-preview verziója.
A nyilvános előzetes verzió 2024-07-31 előzetes verziója jelenleg csak a következő Azure-régiókban érhető el. Vegye figyelembe, hogy az AI Studio egyéni generatív (dokumentummező-kinyerési) modellje csak az USA északi középső régiójában érhető el:
- USA keleti régiója
- USA2 nyugati régiója
- Nyugat-Európa
- USA északi középső régiója

Ez a tartalom a következőre vonatkozik: v4.0 (előzetes verzió) | Korábbi verziók: v3.1 (GA) v3.0 (GA) v2.1 (GA)

Ez a tartalom a következőre vonatkozik: v3.1 (GA) | Legújabb verzió: v4.0 (előzetes verzió) | Korábbi verziók: v3.0 v2.1

Ez a tartalom a következőre vonatkozik: v3.0 (GA) | Legújabb verziók: v4.0 (előzetes verzió) v3.1 | Korábbi verzió: 2.1-es verzió

Ez a tartalom a következőre vonatkozik: v2.1 | Legújabb verzió: 4.0-s verzió (előzetes verzió)

Fontos

A model compose művelet viselkedése az api-version=2024-07-31-preview verzióról változik. A model compose v4.0-s és újabb művelet explicit módon betanított osztályozót ad hozzá az elemzéshez szükséges implicit osztályozó helyett. Az előző komponált modellverzióhoz lásd a 3.1-es egyéni modelleket. Ha jelenleg komponált modelleket használ, fontolja meg a legújabb implementációra való frissítést.

Mi az a komponált modell?

A komponált modellekkel több egyéni modellt is csoportosíthat egy egyetlen modellazonosítóval rendelkező, komponált modellbe. Az összeállított modell például tartalmazhat olyan egyéni modelleket, amelyek betanítottak a kínálat, a berendezések és a bútorvásárlási rendelések elemzésére. Ahelyett, hogy manuálisan próbálná kiválasztani a megfelelő modellt, egy összeállított modell használatával meghatározhatja az egyes elemzésekhez és kinyeréshez megfelelő egyéni modellt.

Egyes forgatókönyvek esetében először a dokumentumot kell besorolni, majd elemezni kell a modellt a mezőinek a modellből való kinyeréséhez leginkább megfelelő modellel. Ilyen forgatókönyvek lehetnek azok, amelyekben a felhasználó feltölt egy dokumentumot, de a dokumentum típusa nem ismert explicit módon. Egy másik forgatókönyv az lehet, ha több dokumentumot vizsgál egy fájlba, és a fájl feldolgozásra kerül. Az alkalmazásnak ezután azonosítania kell az összetevők dokumentumait, és ki kell választania az egyes dokumentumokhoz legmegfelelőbb modellt.

A korábbi verziókban a model compose művelet implicit besorolást hajtott végre, hogy eldöntse, melyik egyéni modell felel meg a legjobban az elküldött dokumentumnak. A 2024-07-31-preview művelet megvalósítása model compose a korábbi verziók implicit besorolását explicit besorolási lépésre cseréli, és feltételes útválasztást ad hozzá.

Az új modellírási művelet előnyei

Az új model compose művelet megköveteli egy explicit osztályozó betanítását, és számos előnnyel jár.

Folyamatos növekményes fejlesztés. Az osztályozó minőségét folyamatosan javíthatja további minták hozzáadásával és a besorolás fokozatos javításával. Ez a finomhangolás biztosítja, hogy a dokumentumok mindig a megfelelő modellre legyenek irányítva a kinyeréshez.
Teljes vezérlés az útválasztás felett. A megbízhatósági alapú útválasztás hozzáadásával megadhatja a dokumentumtípusra és a besorolási válaszra vonatkozó megbízhatósági küszöbértéket.
A művelet során hagyja figyelmen kívül a dokumentumspecifikus dokumentumtípusokat. A művelet korábbi implementációi a model compose megbízhatósági pontszám alapján a legjobb elemzési modellt választották ki a kinyeréshez, még akkor is, ha a legmagasabb megbízhatósági pontszámok viszonylag alacsonyak voltak. Ha megbízhatósági küszöbértéket ad meg, vagy kifejezetten nem megfeleltet egy ismert dokumentumtípust a besorolásból a kinyerési modellbe, figyelmen kívül hagyhat bizonyos dokumentumtípusokat.
Elemezzen több azonos dokumentumtípusú példányt. Az osztályozó beállításával splitMode párosítva a model compose művelet képes észlelni ugyanazon dokumentum több példányát egy fájlban, és felosztani a fájlt az egyes dokumentumok egymástól függetlenül történő feldolgozásához. A használat splitMode lehetővé teszi egy dokumentum több példányának egyetlen kérelemben történő feldolgozását.
A funkciók hozzáadásának támogatása. Az elemzési modell paramétereinek részeként is megadható olyan funkciók hozzáadása, mint a lekérdezésmezők vagy a vonalkódok.
A hozzárendelt egyéni modell maximális kibontva 500-ra. A művelet új implementációja model compose lehetővé teszi, hogy legfeljebb 500 betanított egyéni modellt rendeljen egyetlen összeállított modellhez.

Modellírás használata

Először gyűjtsön mintákat az összes szükséges dokumentumból, beleértve a kinyerni vagy figyelmen kívül hagyandó információkat tartalmazó mintákat is.
Osztályozó betanításához olyan mappákba rendezheti a dokumentumokat, amelyekben a mappanevek azok a dokumentumtípusok, amelyeket használni kíván a komponált modelldefinícióban.
Végül taníts be egy kinyerési modellt minden használni kívánt dokumentumtípushoz.
A besorolási és kinyerési modellek betanítása után használja a Document Intelligence Studiót, az ügyfélkódtárakat vagy a REST API-t a besorolási és kinyerési modellek összeállításához.

A paraméter használatával splitMode szabályozhatja a fájlmegosztás viselkedését:

Nincs. A rendszer a teljes fájlt egyetlen dokumentumként kezeli.
perPage. A fájl minden lapját külön dokumentumként kezeli a rendszer.
automatikusan. A fájl automatikusan dokumentumokra lesz felosztva.

Számlázás és árképzés

A összeállított modellek számlázása megegyezik az egyéni modellekkel. A díjszabás az alsóbb rétegbeli elemzési modell által elemzett lapok számán alapul. A számlázás az extrakciós modellhez irányított lapok extrakciós árán alapul. Az explicit besorolási díjak hozzáadásával a bemeneti fájl összes lapjának besorolása díjjal jár. További információt a Dokumentumintelligencia díjszabási oldalán talál.

Modellírás használata

Először hozzon létre egy listát az összes modellazonosítóról, amelyet egyetlen modellbe szeretne írni.
A modellek írása egyetlen modellazonosítóba a Studio, a REST API vagy az ügyfélkódtárak használatával.
A dokumentumok elemzéséhez használja az összeállított modellazonosítót.

Számlázás

A összeállított modellek számlázása megegyezik az egyéni modellekkel. A díjszabás az elemzett lapok számán alapul. A számlázás az extrakciós modellhez irányított lapok extrakciós árán alapul. További információt a Dokumentumintelligencia díjszabási oldalán talál.

A dokumentumok egyéni vagy összeállított egyéni modellel történő elemzésének díjszabása nem változik.

A modellekhez készült funkciók

Custom template és custom neural a modellek egyetlen, több API-verzióból álló modellbe is összeállíthatók.
A válasz tartalmaz egy tulajdonságot docType , amely azt jelzi, hogy a dokumentum elemzéséhez a rendszer a összeállított modellek közül melyiket használta.
Modellek esetében custom template az összeállított modell egyéni sablon vagy különböző űrlaptípusok változatainak használatával hozható létre. Ez a művelet akkor hasznos, ha a bejövő űrlapok több sablon egyikéhez tartoznak.
Modellek esetében custom neural az ajánlott eljárás az, ha egyetlen dokumentumtípus összes különböző változatát egyetlen betanítási adatkészletbe alakítja, és egyéni neurális modellen tanítja be. A model compose művelet akkor ideális, ha különböző típusú dokumentumokat küld elemzésre.

Modellkorlátok összeállítása

model compose A művelettel legfeljebb 500 modellt rendelhet egyetlen modellazonosítóhoz. Ha a összeállítani kívánt modellek száma meghaladja az összeállított modellek felső korlátját, az alábbi alternatívák egyikét használhatja:
- Az egyéni modell meghívása előtt osztályozza a dokumentumokat. Használhatja az olvasási modellt , és a dokumentumokból és bizonyos kifejezésekből kinyert szöveg alapján hozhat létre besorolást olyan források használatával, mint a kód, a reguláris kifejezések vagy a keresés.
- Ha ugyanazokat a mezőket szeretné kinyerni különböző strukturált, részben strukturált és strukturálatlan dokumentumokból, fontolja meg a mélytanulási egyéni neurális modell használatát. További információ az egyéni sablonmodell és az egyéni neurális modell közötti különbségekről.
A dokumentumok összetett modellek használatával történő elemzése megegyezik egy dokumentum egyetlen modellel történő elemzésével. Az Analyze Document eredmény egy docType tulajdonságot ad vissza, amely jelzi, hogy melyik összetevőmodellt választotta a dokumentum elemzéséhez.
A model compose művelet jelenleg csak címkékkel betanított egyéni modellekhez érhető el.

A modellkompatibilitás összeállítása

Egyéni modell típusa	A 2.1-s és a 2.0-s verzióval betanított modellek	Egyéni sablon és neurális modellek v3.1 és v3.0	Egyéni sablon és neurális modellek 4.0-s előzetes verzió	Egyéni Generatív modellek 4.0-s előzetes verzió
A 2.1-es és a 2.0-s verzióval betanított modellek	Nem támogatott	Nem támogatott	Nem támogatott	Nem támogatott
Egyéni sablon és neurális modellek v3.0 és v3.1	Nem támogatott	Támogatott	Támogatott	Nem támogatott
Egyéni sablon és neurális modellek 4.0-s előzetes verzió	Nem támogatott	Támogatott	Támogatott	Nem támogatott
Egyéni generatív modellek v4.0 előzetes verzió	Nem támogatott	Nem támogatott	Nem támogatott	Nem támogatott

Az API korábbi (2.1-es vagy korábbi) verziójával betanított modell írásához betanítsa a modellt a v3.0 API-val ugyanazzal a címkézett adatkészlettel. Ez a kiegészítés biztosítja, hogy a v2.1 modell más modellekkel is összeállítható legyen.
Az API 2.1-es verziójával készült modellek továbbra is támogatottak, és nem igényelnek frissítéseket.

Fejlesztési lehetőségek

A Document Intelligence v4.0:2024-07-31 előzetes verziója a következő eszközöket, alkalmazásokat és kódtárakat támogatja:

Szolgáltatás	Források
Egyéni modell	• Document Intelligence Studio • REST API • C# SDK • Java SDK • JavaScript SDK • Python SDK
Összeállított modell	• Document Intelligence Studio • REST API • C# SDK • Java SDK • JavaScript SDK • Python SDK

A Document Intelligence v3.1:2023-07-31 (GA) a következő eszközöket, alkalmazásokat és kódtárakat támogatja:

Szolgáltatás	Források
Egyéni modell	• Document Intelligence Studio • REST API • C# SDK • Java SDK • JavaScript SDK • Python SDK
Összeállított modell	• Document Intelligence Studio • REST API • C# SDK • Java SDK • JavaScript SDK • Python SDK

A Document Intelligence v3.0:2022-08-31 (GA) a következő eszközöket, alkalmazásokat és kódtárakat támogatja:

Szolgáltatás	Források
Egyéni modell	• Document Intelligence Studio • REST API • C# SDK • Java SDK • JavaScript SDK • Python SDK
Összeállított modell	• Document Intelligence Studio • REST API • C# SDK • Java SDK • JavaScript SDK • Python SDK

A Document Intelligence v2.1 a következő erőforrásokat támogatja:

Szolgáltatás	Források
Egyéni modell	• Dokumentumintelligencia-címkézési eszköz • REST API • Ügyfélkódtár SDK • Dokumentumintelligencia Docker-tároló
Összeállított modell	• Dokumentumintelligencia-címkézési eszköz • REST API • C# SDK • Java SDK • JavaScript SDK • Python SDK

Következő lépések

Ismerje meg, hogyan hozhat létre és írhat egyéni modelleket:

Egyéni modellösszeállítása Egyéni modellek összeállítása

Megosztás a következőn keresztül:

Dokumentumintelligencia-összeállítású egyéni modellek

Mi az a komponált modell?

Az új modellírási művelet előnyei

Modellírás használata

Számlázás és árképzés

Modellírás használata

Számlázás

A modellekhez készült funkciók

Modellkorlátok összeállítása

A modellkompatibilitás összeállítása

Fejlesztési lehetőségek

Következő lépések

Visszajelzés

További források