A Dokumentumintelligencia általános dokumentummodellje
Fontos
A Document Intelligence 2024-02-29-preview, 2023-10-31 előzetes verziójától kezdve az általános dokumentummodell (előre összeállított dokumentum) elavult. Kulcs-érték párok, kijelölési jelek, szöveg, táblázatok és struktúra dokumentumokból való kinyeréséhez használja az alábbi modelleket:
Szolgáltatás | Verzió | Modellazonosító |
---|---|---|
Layout modell, amelyen engedélyezve van az opcionális lekérdezési sztringparaméter features=keyValuePairs . |
• v4:2024-02-29-preview • v3.1:2023-07-31 (GA) |
prebuilt-layout |
Általános dokumentummodell | • v3.1:2023-07-31 (GA) • v3.0:2022-08-31 (GA) • v2.1 (GA) |
prebuilt-document |
Ez a tartalom a következőre vonatkozik: v3.1 (GA) | Legújabb verzió: v4.0 (előzetes verzió) | Korábbi verzió: v3.0
Ez a tartalom a következő verziókra vonatkozik: v3.0 (GA) | Legújabb verziók: v4.0 (előzetes verzió) v3.1
Az általános dokumentummodell a hatékony optikai karakterfelismerési (OCR) képességeket a mélytanulási modellekkel kombinálva kulcs-érték párokat, táblázatokat és kijelölési jeleket nyer ki a dokumentumokból. Az általános dokumentum a 3.1-s és a 3.0-s verziójú API-kkal érhető el. További információt a migrálási útmutatónkban talál.
Általános dokumentumfunkciók
Az általános dokumentummodell egy előre betanított modell; nem igényel címkéket vagy betanítást.
Egyetlen API kulcs-érték párokat, kijelölési jeleket, szöveget, táblázatokat és szerkezeteket nyer ki a dokumentumokból.
Az általános dokumentummodell támogatja a strukturált, félig strukturált és strukturálatlan dokumentumokat.
A kijelölési jelek olyan mezőkként vannak azonosítva, amelyek értéke vagy
:unselected:
értéke:selected:
.
A Document Intelligence Studióban feldolgozott mintadokumentum
Kulcs-érték pár kinyerése
Az általános dokumentum API támogatja a legtöbb űrlaptípust, elemzi a dokumentumokat, és kinyeri a kulcsokat és a kapcsolódó értékeket. Ideális a közös kulcs-érték párok dokumentumokból való kinyeréhez. Az általános dokumentummodellt használhatja az egyéni modellek címkék nélküli betanítására.
Fejlesztési lehetőségek
A Document Intelligence v3.1 a következő eszközöket, alkalmazásokat és kódtárakat támogatja:
Szolgáltatás | Források | Modellazonosító |
---|---|---|
Általános dokumentummodell | • Document Intelligence Studio • REST API • C# SDK • Python SDK • Java SDK • JavaScript SDK |
előre összeállított dokumentum |
A Document Intelligence 3.0-s verzió a következő eszközöket, alkalmazásokat és kódtárakat támogatja:
Szolgáltatás | Források | Modellazonosító |
---|---|---|
Általános dokumentummodell | • Document Intelligence Studio • REST API • C# SDK • Python SDK • Java SDK • JavaScript SDK |
előre összeállított dokumentum |
Bemeneti követelmények
Támogatott fájlformátumok:
Modell PDF Kép: JPEG/JPG
,PNG
,BMP
,TIFF
HEIF
Microsoft Office:
Word (DOCX
), Excel (XLSX
), PowerPoint (PPTX
), HTMLOlvasás ✔ ✔ ✔ Elrendezés ✔ ✔ ✔ (2024-07-31-preview, 2024-02-29-preview, 2023-10-31-preview) Általános dokumentum ✔ ✔ Előre összeállított ✔ ✔ Egyéni kinyerés ✔ ✔ Egyéni besorolás ✔ ✔ ✔ (2024-07-31-preview, 2024-02-29-preview) A legjobb eredmény érdekében dokumentumonként egy tiszta fényképet vagy kiváló minőségű vizsgálatot biztosít.
PDF és TIFF esetén legfeljebb 2000 oldal dolgozható fel (ingyenes szintű előfizetéssel csak az első két oldal dolgozható fel).
A dokumentumok elemzéséhez használt fájlméret 500 MB a fizetős (S0) szint, az
4
ingyenes (F0) szint esetén pedig MB.A képméreteknek 50 képpont x 50 képpont és 10 000 képpont x 10 000 képpont között kell lenniük.
Ha a PDF-eket jelszó védi, akkor beküldés előtt el kell távolítania a védelmet.
A kinyerni kívánt szöveg minimális magassága 12 képpont egy 1024 x 768 képpontos képhez. Ez a dimenzió körülbelül
8
150 pont/hüvelyk (DPI) pontszövegnek felel meg.Egyéni modell betanítása esetén a betanítási adatok oldalainak maximális száma az egyéni sablonmodell esetében 500, az egyéni neurális modell esetében pedig 50 000.
Egyéni extrakciós modell betanítása esetén a betanítási adatok teljes mérete 50 MB a sablonmodellhez, a neurális modellhez pedig
1
GB.Egyéni besorolási modell betanítása esetén a betanítási adatok
1
teljes mérete GB, legfeljebb 10 000 oldal. A 2024-07-31-es és újabb verziókban a betanítási adatok2
teljes mérete GB, legfeljebb 10 000 oldal.
Általános dokumentummodell-adatkinyerés
Próbáljon meg adatokat kinyerni űrlapokból és dokumentumokból a Document Intelligence Studióval.
A következő erőforrásokra van szüksége:
Azure-előfizetés – ingyenesen létrehozhat egyet.
Dokumentumintelligencia-példány az Azure Portalon. A szolgáltatás kipróbálásához használhatja az ingyenes tarifacsomagot (
F0
). Az erőforrás üzembe helyezése után válassza az Ugrás az erőforráshoz lehetőséget a kulcs és a végpont lekéréséhez.
Feljegyzés
A Document Intelligence Studio és az általános dokumentummodell a v3.0 API-val érhető el.
A Document Intelligence Studio kezdőlapján válassza az Általános dokumentumok lehetőséget.
Elemezheti a mintadokumentumot, vagy feltöltheti saját fájljait.
Válassza az Elemzés futtatása gombot, és szükség esetén konfigurálja az Elemzési beállításokat:
Kulcs-érték párok
A kulcs-érték párok a dokumentum azon meghatározott tartományai, amelyek azonosítják a címkét vagy kulcsot, valamint a hozzá tartozó választ vagy értéket. Strukturált formában ezek a párok lehetnek az adott mezőhöz megadott címke és érték. Strukturálatlan dokumentumokban a szerződés végrehajtásának dátuma lehet egy bekezdés szövege alapján. Az AI-modell betanítása az azonosítható kulcsok és értékek kinyerésére a dokumentumtípusok, formátumok és struktúrák széles választéka alapján történik.
A kulcsok külön is létezhetnek, ha a modell észleli, hogy egy kulcs létezik, nincs hozzárendelt érték, vagy ha nem kötelező mezőket dolgoz fel. Előfordulhat például, hogy egy középső név mező üresen hagyható egy űrlapon egyes példányokban. A kulcs-érték párok a dokumentumban található szövegtartományok. Azokban a dokumentumokban, ahol ugyanazt az értéket különböző módokon írják le, például ügyfél/felhasználó, a társított kulcs ügyfél vagy felhasználó (környezet alapján).
Adatkinyerés
Modell | Szöveg kinyerése | Kulcs-érték párok | Kijelölési jelek | Táblák | Köznapi nevek |
---|---|---|---|---|---|
Általános dokumentum | ✓ | ✓ | ✓ | ✓ | ✓* |
✓* – Csak a 2023-07-31
(v3.1 GA) és újabb API-verziókban érhető el.
Támogatott nyelvek és területi beállítások
A támogatott nyelvek teljes listáját a Nyelvi támogatás – dokumentumelemzési modellek oldalon találja.
Megfontolások
Mivel a kulcsok a dokumentumból kinyert szövegtartományok, a félig strukturált dokumentumok esetében a kulcsokat le kell képezni egy meglévő kulcsszótárra.
Kulcs-érték párok várhatók egy kulccsal, de érték nélkül. Például ha egy felhasználó úgy döntött, hogy nem ad meg e-mail-címet az űrlapon.