A Dokumentumintelligencia általános dokumentummodellje
Fontos
A Document Intelligence 2024-02-29-preview, 2023-10-31 előzetes verziójától kezdve az általános dokumentummodell (előre összeállított dokumentum) elavult. Kulcs-érték párok, kijelölési jelek, szöveg, táblázatok és struktúra dokumentumokból való kinyeréséhez használja az alábbi modelleket:
Szolgáltatás | Verzió | Modellazonosító |
---|---|---|
Layout modell, amelyen engedélyezve van az opcionális lekérdezési sztringparaméter features=keyValuePairs . |
• v4:2024-02-29-preview • v3.1:2023-07-31 (GA) |
prebuilt-layout |
Általános dokumentummodell | • v3.1:2023-07-31 (GA) • v3.0:2022-08-31 (GA) • v2.1 (GA) |
prebuilt-document |
Ez a tartalom a következőre vonatkozik::v3.1 (GA) | Legújabb verzió:v4.0 (előzetes verzió) | Előző verzió:v3.0
Ez a tartalom a következőre vonatkozik::v3.0 (GA) | Legújabb verziók:v4.0 (előzetes verzió)v3.1
Az általános dokumentummodell a hatékony optikai karakterfelismerési (OCR) képességeket a mélytanulási modellekkel kombinálva kulcs-érték párokat, táblázatokat és kijelölési jeleket nyer ki a dokumentumokból. Az általános dokumentum a 3.1-s és a 3.0-s verziójú API-kkal érhető el. További információt a migrálási útmutatónkban talál.
Általános dokumentumfunkciók
Az általános dokumentummodell egy előre betanított modell; nem igényel címkéket vagy betanítást.
Egyetlen API kulcs-érték párokat, kijelölési jeleket, szöveget, táblázatokat és szerkezeteket nyer ki a dokumentumokból.
Az általános dokumentummodell támogatja a strukturált, félig strukturált és strukturálatlan dokumentumokat.
A kijelölési jelek olyan mezőkként vannak azonosítva, amelyek értéke vagy
:unselected:
értéke:selected:
.
A Document Intelligence Studióban feldolgozott mintadokumentum
Kulcs-érték pár kinyerése
Az általános dokumentum API támogatja a legtöbb űrlaptípust, elemzi a dokumentumokat, és kinyeri a kulcsokat és a kapcsolódó értékeket. Ideális a közös kulcs-érték párok dokumentumokból való kinyeréhez. Az általános dokumentummodellt használhatja az egyéni modellek címkék nélküli betanítására.
Fejlesztési lehetőségek
A Document Intelligence v3.1 a következő eszközöket, alkalmazásokat és kódtárakat támogatja:
Szolgáltatás | Források | Modellazonosító |
---|---|---|
Általános dokumentummodell | • Document Intelligence Studio • REST API • C# SDK • Python SDK • Java SDK • JavaScript SDK |
előre összeállított dokumentum |
A Document Intelligence 3.0-s verzió a következő eszközöket, alkalmazásokat és kódtárakat támogatja:
Szolgáltatás | Források | Modellazonosító |
---|---|---|
Általános dokumentummodell | • Document Intelligence Studio • REST API • C# SDK • Python SDK • Java SDK • JavaScript SDK |
előre összeállított dokumentum |
Bemeneti követelmények
A legjobb eredmény érdekében dokumentumonként egy tiszta fényképet vagy kiváló minőségű vizsgálatot biztosít.
Támogatott fájlformátumok:
Modell PDF Kép:
JPEG/JPG, PNG, BMP, TIFF, HEIFMicrosoft Office:
Word (DOCX), Excel (XLSX), PowerPoint (PPTX) és HTMLOlvasás ✔ ✔ ✔ Elrendezés ✔ ✔ ✔ (2024-02-29-preview, 2023-10-31-preview) Általános dokumentum ✔ ✔ Előre összeállított ✔ ✔ Egyéni kinyerés ✔ ✔ Egyéni besorolás ✔ ✔ ✔ (2024-02-29-preview) PDF és TIFF esetén legfeljebb 2000 oldal dolgozható fel (ingyenes szintű előfizetéssel csak az első két oldal dolgozható fel).
A dokumentumok elemzéséhez használt fájlméret 500 MB a fizetős (S0) és 4 MB az ingyenes (F0) szint esetén.
A képméreteknek 50 x 50 képpont és 10 000 képpont x 10 000 képpont között kell lenniük.
Ha a PDF-eket jelszó védi, akkor beküldés előtt el kell távolítania a védelmet.
A kinyerni kívánt szöveg minimális magassága 12 képpont egy 1024 x 768 képpontos képhez. Ez a dimenzió körülbelül
8
150 pont/hüvelyk (DPI) pont szövegnek felel meg.Egyéni modell betanítása esetén a betanítási adatok oldalainak maximális száma az egyéni sablonmodell esetében 500, az egyéni neurális modell esetében pedig 50 000.
Egyéni extrakciós modell betanítása esetén a betanítási adatok teljes mérete sablonmodell esetén 50 MB, a neurális modell esetében pedig 1G-MB.
Egyéni besorolási modell betanítása esetén a betanítási adatok
1GB
teljes mérete legfeljebb 10 000 oldal lehet.
Általános dokumentummodell-adatkinyerés
Próbáljon meg adatokat kinyerni űrlapokból és dokumentumokból a Document Intelligence Studióval.
A következő erőforrásokra van szüksége:
Azure-előfizetés – ingyenesen létrehozhat egyet.
Dokumentumintelligencia-példány az Azure Portalon. A szolgáltatás kipróbálásához használhatja az ingyenes tarifacsomagot (
F0
). Az erőforrás üzembe helyezése után válassza az Ugrás az erőforráshoz lehetőséget a kulcs és a végpont lekéréséhez.
Feljegyzés
A Document Intelligence Studio és az általános dokumentummodell a v3.0 API-val érhető el.
A Document Intelligence Studio kezdőlapján válassza az Általános dokumentumok lehetőséget.
Elemezheti a mintadokumentumot, vagy feltöltheti saját fájljait.
Válassza az Elemzés futtatása gombot, és szükség esetén konfigurálja az Elemzési beállításokat:
Kulcs-érték párok
A kulcs-érték párok a dokumentum azon meghatározott tartományai, amelyek azonosítják a címkét vagy kulcsot, valamint a hozzá tartozó választ vagy értéket. Strukturált formában ezek a párok lehetnek az adott mezőhöz megadott címke és érték. Strukturálatlan dokumentumokban a szerződés végrehajtásának dátuma lehet egy bekezdés szövege alapján. Az AI-modell betanítása az azonosítható kulcsok és értékek kinyerésére a dokumentumtípusok, formátumok és struktúrák széles választéka alapján történik.
A kulcsok külön is létezhetnek, ha a modell észleli, hogy egy kulcs létezik, nincs hozzárendelt érték, vagy ha nem kötelező mezőket dolgoz fel. Előfordulhat például, hogy egy középső név mező üresen hagyható egy űrlapon egyes példányokban. A kulcs-érték párok a dokumentumban található szövegtartományok. Azokban a dokumentumokban, ahol ugyanazt az értéket különböző módokon írják le, például ügyfél/felhasználó, a társított kulcs ügyfél vagy felhasználó (környezet alapján).
Adatkinyerés
Modell | Szöveg kinyerése | Kulcs-érték párok | Kijelölési jelek | Táblák | Köznapi nevek |
---|---|---|---|---|---|
Általános dokumentum | ✓ | ✓ | ✓ | ✓ | ✓* |
✓* – Csak a 2023-07-31
(v3.1 GA) és újabb API-verziókban érhető el.
Támogatott nyelvek és területi beállítások
A támogatott nyelvek teljes listáját a Nyelvi támogatás – dokumentumelemzési modellek oldalon találja.
Megfontolások
Mivel a kulcsok a dokumentumból kinyert szövegtartományok, a félig strukturált dokumentumok esetében a kulcsokat le kell képezni egy meglévő kulcsszótárra.
Kulcs-érték párok várhatók egy kulccsal, de érték nélkül. Például ha egy felhasználó úgy döntött, hogy nem ad meg e-mail-címet az űrlapon.