Dokumentumintelligencia-összeállítású egyéni modellek
Fontos
- A Document Intelligence nyilvános előzetes verziójú kiadásai korai hozzáférést biztosítanak az aktív fejlesztés alatt lévő funkciókhoz. A funkciók, a megközelítések és a folyamatok az általános rendelkezésre állás (GA) előtt változhatnak a felhasználói visszajelzések alapján.
- A Document Intelligence ügyfélkódtárak nyilvános előzetes verziója alapértelmezés szerint a REST API 2024-07-31-preview verziója.
- A nyilvános előzetes verzió 2024-07-31 előzetes verziója jelenleg csak a következő Azure-régiókban érhető el. Vegye figyelembe, hogy az AI Studio egyéni generatív (dokumentummező-kinyerési) modellje csak az USA északi középső régiójában érhető el:
- USA keleti régiója
- USA2 nyugati régiója
- Nyugat-Európa
- USA északi középső régiója
Ez a tartalom a következőre vonatkozik: v4.0 (előzetes verzió) | Korábbi verziók: v3.1 (GA) v3.0 (GA) v2.1 (GA)
Ez a tartalom a következőre vonatkozik: v3.1 (GA) | Legújabb verzió: v4.0 (előzetes verzió) | Korábbi verziók: v3.0 v2.1
Ez a tartalom a következőre vonatkozik: v3.0 (GA) | Legújabb verziók: v4.0 (előzetes verzió) v3.1 | Korábbi verzió: 2.1-es verzió
Ez a tartalom a következőre vonatkozik: v2.1 | Legújabb verzió: 4.0-s verzió (előzetes verzió)
Fontos
A model compose
művelet viselkedése az api-version=2024-07-31-preview verzióról változik. A model compose
v4.0-s és újabb művelet explicit módon betanított osztályozót ad hozzá az elemzéshez szükséges implicit osztályozó helyett. Az előző komponált modellverzióhoz lásd a 3.1-es egyéni modelleket. Ha jelenleg komponált modelleket használ, fontolja meg a legújabb implementációra való frissítést.
Mi az a komponált modell?
A komponált modellekkel több egyéni modellt is csoportosíthat egy egyetlen modellazonosítóval rendelkező, komponált modellbe. Az összeállított modell például tartalmazhat olyan egyéni modelleket, amelyek betanítottak a kínálat, a berendezések és a bútorvásárlási rendelések elemzésére. Ahelyett, hogy manuálisan próbálná kiválasztani a megfelelő modellt, egy összeállított modell használatával meghatározhatja az egyes elemzésekhez és kinyeréshez megfelelő egyéni modellt.
Egyes forgatókönyvek esetében először a dokumentumot kell besorolni, majd elemezni kell a modellt a mezőinek a modellből való kinyeréséhez leginkább megfelelő modellel. Ilyen forgatókönyvek lehetnek azok, amelyekben a felhasználó feltölt egy dokumentumot, de a dokumentum típusa nem ismert explicit módon. Egy másik forgatókönyv az lehet, ha több dokumentumot vizsgál egy fájlba, és a fájl feldolgozásra kerül. Az alkalmazásnak ezután azonosítania kell az összetevők dokumentumait, és ki kell választania az egyes dokumentumokhoz legmegfelelőbb modellt.
A korábbi verziókban a model compose
művelet implicit besorolást hajtott végre, hogy eldöntse, melyik egyéni modell felel meg a legjobban az elküldött dokumentumnak. A 2024-07-31-preview
művelet megvalósítása model compose
a korábbi verziók implicit besorolását explicit besorolási lépésre cseréli, és feltételes útválasztást ad hozzá.
Az új modellírási művelet előnyei
Az új model compose
művelet megköveteli egy explicit osztályozó betanítását, és számos előnnyel jár.
Folyamatos növekményes fejlesztés. Az osztályozó minőségét folyamatosan javíthatja további minták hozzáadásával és a besorolás fokozatos javításával. Ez a finomhangolás biztosítja, hogy a dokumentumok mindig a megfelelő modellre legyenek irányítva a kinyeréshez.
Teljes vezérlés az útválasztás felett. A megbízhatósági alapú útválasztás hozzáadásával megadhatja a dokumentumtípusra és a besorolási válaszra vonatkozó megbízhatósági küszöbértéket.
A művelet során hagyja figyelmen kívül a dokumentumspecifikus dokumentumtípusokat. A művelet korábbi implementációi a
model compose
megbízhatósági pontszám alapján a legjobb elemzési modellt választották ki a kinyeréshez, még akkor is, ha a legmagasabb megbízhatósági pontszámok viszonylag alacsonyak voltak. Ha megbízhatósági küszöbértéket ad meg, vagy kifejezetten nem megfeleltet egy ismert dokumentumtípust a besorolásból a kinyerési modellbe, figyelmen kívül hagyhat bizonyos dokumentumtípusokat.Elemezzen több azonos dokumentumtípusú példányt. Az osztályozó beállításával
splitMode
párosítva amodel compose
művelet képes észlelni ugyanazon dokumentum több példányát egy fájlban, és felosztani a fájlt az egyes dokumentumok egymástól függetlenül történő feldolgozásához. A használatsplitMode
lehetővé teszi egy dokumentum több példányának egyetlen kérelemben történő feldolgozását.A funkciók hozzáadásának támogatása. Az elemzési modell paramétereinek részeként is megadható olyan funkciók hozzáadása, mint a lekérdezésmezők vagy a vonalkódok.
A hozzárendelt egyéni modell maximális kibontva 500-ra. A művelet új implementációja
model compose
lehetővé teszi, hogy legfeljebb 500 betanított egyéni modellt rendeljen egyetlen összeállított modellhez.
Modellírás használata
Először gyűjtsön mintákat az összes szükséges dokumentumból, beleértve a kinyerni vagy figyelmen kívül hagyandó információkat tartalmazó mintákat is.
Osztályozó betanításához olyan mappákba rendezheti a dokumentumokat, amelyekben a mappanevek azok a dokumentumtípusok, amelyeket használni kíván a komponált modelldefinícióban.
Végül taníts be egy kinyerési modellt minden használni kívánt dokumentumtípushoz.
A besorolási és kinyerési modellek betanítása után használja a Document Intelligence Studiót, az ügyfélkódtárakat vagy a REST API-t a besorolási és kinyerési modellek összeállításához.
A paraméter használatával splitMode
szabályozhatja a fájlmegosztás viselkedését:
- Nincs. A rendszer a teljes fájlt egyetlen dokumentumként kezeli.
- perPage. A fájl minden lapját külön dokumentumként kezeli a rendszer.
- automatikusan. A fájl automatikusan dokumentumokra lesz felosztva.
Számlázás és árképzés
A összeállított modellek számlázása megegyezik az egyéni modellekkel. A díjszabás az alsóbb rétegbeli elemzési modell által elemzett lapok számán alapul. A számlázás az extrakciós modellhez irányított lapok extrakciós árán alapul. Az explicit besorolási díjak hozzáadásával a bemeneti fájl összes lapjának besorolása díjjal jár. További információt a Dokumentumintelligencia díjszabási oldalán talál.
A modellírási művelet használata
Először hozzon létre egy listát az összes modellazonosítóról, amelyet egyetlen modellbe szeretne írni.
A modellek írása egyetlen modellazonosítóba a Studio, a REST API vagy az ügyfélkódtárak használatával.
A dokumentumok elemzéséhez használja az összeállított modellazonosítót.
Számlázás
A összeállított modellek számlázása megegyezik az egyéni modellekkel. A díjszabás az elemzett lapok számán alapul. A számlázás az extrakciós modellhez irányított lapok extrakciós árán alapul. További információt a Dokumentumintelligencia díjszabási oldalán talál.
- A dokumentumok egyéni vagy összeállított egyéni modellel történő elemzésének díjszabása nem változik.
A modellekhez készült funkciók
Custom template
éscustom neural
a modellek egyetlen, több API-verzióból álló modellbe is összeállíthatók.A válasz tartalmaz egy tulajdonságot
docType
, amely azt jelzi, hogy a dokumentum elemzéséhez a rendszer a összeállított modellek közül melyiket használta.Modellek esetében
custom template
az összeállított modell egyéni sablon vagy különböző űrlaptípusok változatainak használatával hozható létre. Ez a művelet akkor hasznos, ha a bejövő űrlapok több sablon egyikéhez tartoznak.Modellek esetében
custom neural
az ajánlott eljárás az, ha egyetlen dokumentumtípus összes különböző változatát egyetlen betanítási adatkészletbe alakítja, és egyéni neurális modellen tanítja be. Amodel compose
művelet akkor ideális, ha különböző típusú dokumentumokat küld elemzésre.
Modellkorlátok összeállítása
model compose
A művelettel legfeljebb 500 modellt rendelhet egyetlen modellazonosítóhoz. Ha a összeállítani kívánt modellek száma meghaladja az összeállított modellek felső korlátját, az alábbi alternatívák egyikét használhatja:Az egyéni modell meghívása előtt osztályozza a dokumentumokat. Használhatja az olvasási modellt , és a dokumentumokból és bizonyos kifejezésekből kinyert szöveg alapján hozhat létre besorolást olyan források használatával, mint a kód, a reguláris kifejezések vagy a keresés.
Ha ugyanazokat a mezőket szeretné kinyerni különböző strukturált, részben strukturált és strukturálatlan dokumentumokból, fontolja meg a mélytanulási egyéni neurális modell használatát. További információ az egyéni sablonmodell és az egyéni neurális modell közötti különbségekről.
A dokumentumok összetett modellek használatával történő elemzése megegyezik egy dokumentum egyetlen modellel történő elemzésével. Az
Analyze Document
eredmény egydocType
tulajdonságot ad vissza, amely jelzi, hogy melyik összetevőmodellt választotta a dokumentum elemzéséhez.A
model compose
művelet jelenleg csak címkékkel betanított egyéni modellekhez érhető el.
A modellkompatibilitás összeállítása
Egyéni modell típusa | A 2.1-s és a 2.0-s verzióval betanított modellek | Egyéni sablon és neurális modellek v3.1 és v3.0 | Egyéni sablon és neurális modellek 4.0-s előzetes verzió | Egyéni Generatív modellek 4.0-s előzetes verzió |
---|---|---|---|---|
A 2.1-es és a 2.0-s verzióval betanított modellek | Nem támogatott | Nem támogatott | Nem támogatott | Nem támogatott |
Egyéni sablon és neurális modellek v3.0 és v3.1 | Nem támogatott | Támogatott | Támogatott | Nem támogatott |
Egyéni sablon és neurális modellek 4.0-s előzetes verzió | Nem támogatott | Támogatott | Támogatott | Nem támogatott |
Egyéni generatív modellek v4.0 előzetes verzió | Nem támogatott | Nem támogatott | Nem támogatott | Nem támogatott |
Az API korábbi (2.1-es vagy korábbi) verziójával betanított modell írásához betanítsa a modellt a v3.0 API-val ugyanazzal a címkézett adatkészlettel. Ez a kiegészítés biztosítja, hogy a v2.1 modell más modellekkel is összeállítható legyen.
Az API 2.1-es verziójával készült modellek továbbra is támogatottak, és nem igényelnek frissítéseket.
Fejlesztési lehetőségek
A Document Intelligence v4.0:2024-07-31 előzetes verziója a következő eszközöket, alkalmazásokat és kódtárakat támogatja:
Szolgáltatás | Források |
---|---|
Egyéni modell | • Document Intelligence Studio • REST API • C# SDK • Java SDK • JavaScript SDK • Python SDK |
Összeállított modell | • Document Intelligence Studio • REST API • C# SDK • Java SDK • JavaScript SDK • Python SDK |
A Document Intelligence v3.1:2023-07-31 (GA) a következő eszközöket, alkalmazásokat és kódtárakat támogatja:
Szolgáltatás | Források |
---|---|
Egyéni modell | • Document Intelligence Studio • REST API • C# SDK • Java SDK • JavaScript SDK • Python SDK |
Összeállított modell | • Document Intelligence Studio • REST API • C# SDK • Java SDK • JavaScript SDK • Python SDK |
A Document Intelligence v3.0:2022-08-31 (GA) a következő eszközöket, alkalmazásokat és kódtárakat támogatja:
Szolgáltatás | Források |
---|---|
Egyéni modell | • Document Intelligence Studio • REST API • C# SDK • Java SDK • JavaScript SDK • Python SDK |
Összeállított modell | • Document Intelligence Studio • REST API • C# SDK • Java SDK • JavaScript SDK • Python SDK |
A Document Intelligence v2.1 a következő erőforrásokat támogatja:
Szolgáltatás | Források |
---|---|
Egyéni modell | • Dokumentumintelligencia-címkézési eszköz • REST API • Ügyfélkódtár SDK • Dokumentumintelligencia Docker-tároló |
Összeállított modell | • Dokumentumintelligencia-címkézési eszköz • REST API • C# SDK • Java SDK • JavaScript SDK • Python SDK |
Következő lépések
Ismerje meg, hogyan hozhat létre és írhat egyéni modelleket: