Megosztás a következőn keresztül:


A Dokumentumintelligencia általános dokumentummodellje

Fontos

A Document Intelligence 2024-02-29-preview, 2023-10-31 előzetes verziójától kezdve az általános dokumentummodell (előre összeállított dokumentum) elavult. Kulcs-érték párok, kijelölési jelek, szöveg, táblázatok és struktúra dokumentumokból való kinyeréséhez használja az alábbi modelleket:

Szolgáltatás Verzió Modellazonosító
Layout modell, amelyen engedélyezve van az opcionális lekérdezési sztringparaméter features=keyValuePairs . • v4:2024-02-29-preview
• v3.1:2023-07-31 (GA)
prebuilt-layout
Általános dokumentummodell • v3.1:2023-07-31 (GA)
• v3.0:2022-08-31 (GA)
• v2.1 (GA)
prebuilt-document

Ez a tartalom a következőre vonatkozik: Sakk v3.1 (GA) | Legújabb verzió:lila pipa v4.0 (előzetes verzió) | Korábbi verzió: kék pipa v3.0

Ez a tartalom a következő verziókra vonatkozik: Sakk v3.0 (GA) | Legújabb verziók: lila pipa v4.0 (előzetes verzió)lila pipa v3.1

Az általános dokumentummodell a hatékony optikai karakterfelismerési (OCR) képességeket a mélytanulási modellekkel kombinálva kulcs-érték párokat, táblázatokat és kijelölési jeleket nyer ki a dokumentumokból. Az általános dokumentum a 3.1-s és a 3.0-s verziójú API-kkal érhető el. További információt a migrálási útmutatónkban talál.

Általános dokumentumfunkciók

  • Az általános dokumentummodell egy előre betanított modell; nem igényel címkéket vagy betanítást.

  • Egyetlen API kulcs-érték párokat, kijelölési jeleket, szöveget, táblázatokat és szerkezeteket nyer ki a dokumentumokból.

  • Az általános dokumentummodell támogatja a strukturált, félig strukturált és strukturálatlan dokumentumokat.

  • A kijelölési jelek olyan mezőkként vannak azonosítva, amelyek értéke vagy :unselected:értéke :selected: .

A Document Intelligence Studióban feldolgozott mintadokumentum

Képernyőkép a Document Intelligence Studióban található általános dokumentumelemzésről.

Kulcs-érték pár kinyerése

Az általános dokumentum API támogatja a legtöbb űrlaptípust, elemzi a dokumentumokat, és kinyeri a kulcsokat és a kapcsolódó értékeket. Ideális a közös kulcs-érték párok dokumentumokból való kinyeréhez. Az általános dokumentummodellt használhatja az egyéni modellek címkék nélküli betanítására.

Fejlesztési lehetőségek

A Document Intelligence v3.1 a következő eszközöket, alkalmazásokat és kódtárakat támogatja:

Szolgáltatás Források Modellazonosító
Általános dokumentummodell Document Intelligence Studio
REST API
C# SDK
Python SDK
Java SDK
JavaScript SDK
előre összeállított dokumentum

A Document Intelligence 3.0-s verzió a következő eszközöket, alkalmazásokat és kódtárakat támogatja:

Szolgáltatás Források Modellazonosító
Általános dokumentummodell Document Intelligence Studio
REST API
C# SDK
Python SDK
Java SDK
JavaScript SDK
előre összeállított dokumentum

Bemeneti követelmények

  • Támogatott fájlformátumok:

    Modell PDF Kép:
    JPEG/JPG, PNG, BMP, TIFFHEIF
    Microsoft Office:
    Word (DOCX), Excel (XLSX), PowerPoint (PPTX), HTML
    Olvasás
    Elrendezés ✔ (2024-07-31-preview, 2024-02-29-preview, 2023-10-31-preview)
    Általános dokumentum
    Előre összeállított
    Egyéni kinyerés
    Egyéni besorolás ✔ (2024-07-31-preview, 2024-02-29-preview)
  • A legjobb eredmény érdekében dokumentumonként egy tiszta fényképet vagy kiváló minőségű vizsgálatot biztosít.

  • PDF és TIFF esetén legfeljebb 2000 oldal dolgozható fel (ingyenes szintű előfizetéssel csak az első két oldal dolgozható fel).

  • A dokumentumok elemzéséhez használt fájlméret 500 MB a fizetős (S0) szint, az 4 ingyenes (F0) szint esetén pedig MB.

  • A képméreteknek 50 képpont x 50 képpont és 10 000 képpont x 10 000 képpont között kell lenniük.

  • Ha a PDF-eket jelszó védi, akkor beküldés előtt el kell távolítania a védelmet.

  • A kinyerni kívánt szöveg minimális magassága 12 képpont egy 1024 x 768 képpontos képhez. Ez a dimenzió körülbelül 8 150 pont/hüvelyk (DPI) pontszövegnek felel meg.

  • Egyéni modell betanítása esetén a betanítási adatok oldalainak maximális száma az egyéni sablonmodell esetében 500, az egyéni neurális modell esetében pedig 50 000.

    • Egyéni extrakciós modell betanítása esetén a betanítási adatok teljes mérete 50 MB a sablonmodellhez, a neurális modellhez pedig 1 GB.

    • Egyéni besorolási modell betanítása esetén a betanítási adatok 1 teljes mérete GB, legfeljebb 10 000 oldal. A 2024-07-31-es és újabb verziókban a betanítási adatok 2 teljes mérete GB, legfeljebb 10 000 oldal.

Általános dokumentummodell-adatkinyerés

Próbáljon meg adatokat kinyerni űrlapokból és dokumentumokból a Document Intelligence Studióval.

A következő erőforrásokra van szüksége:

  • Azure-előfizetés – ingyenesen létrehozhat egyet.

  • Dokumentumintelligencia-példány az Azure Portalon. A szolgáltatás kipróbálásához használhatja az ingyenes tarifacsomagot (F0). Az erőforrás üzembe helyezése után válassza az Ugrás az erőforráshoz lehetőséget a kulcs és a végpont lekéréséhez.

Képernyőkép a kulcsok és a végpontok helyéről az Azure Portalon.

Feljegyzés

A Document Intelligence Studio és az általános dokumentummodell a v3.0 API-val érhető el.

  1. A Document Intelligence Studio kezdőlapján válassza az Általános dokumentumok lehetőséget.

  2. Elemezheti a mintadokumentumot, vagy feltöltheti saját fájljait.

  3. Válassza az Elemzés futtatása gombot, és szükség esetén konfigurálja az Elemzési beállításokat:

    Képernyőkép a Document Intelligence Studio Elemzés és elemzés beállításai gombjairól.

Kulcs-érték párok

A kulcs-érték párok a dokumentum azon meghatározott tartományai, amelyek azonosítják a címkét vagy kulcsot, valamint a hozzá tartozó választ vagy értéket. Strukturált formában ezek a párok lehetnek az adott mezőhöz megadott címke és érték. Strukturálatlan dokumentumokban a szerződés végrehajtásának dátuma lehet egy bekezdés szövege alapján. Az AI-modell betanítása az azonosítható kulcsok és értékek kinyerésére a dokumentumtípusok, formátumok és struktúrák széles választéka alapján történik.

A kulcsok külön is létezhetnek, ha a modell észleli, hogy egy kulcs létezik, nincs hozzárendelt érték, vagy ha nem kötelező mezőket dolgoz fel. Előfordulhat például, hogy egy középső név mező üresen hagyható egy űrlapon egyes példányokban. A kulcs-érték párok a dokumentumban található szövegtartományok. Azokban a dokumentumokban, ahol ugyanazt az értéket különböző módokon írják le, például ügyfél/felhasználó, a társított kulcs ügyfél vagy felhasználó (környezet alapján).

Adatkinyerés

Modell Szöveg kinyerése Kulcs-érték párok Kijelölési jelek Táblák Köznapi nevek
Általános dokumentum ✓*

✓* – Csak a 2023-07-31 (v3.1 GA) és újabb API-verziókban érhető el.

Támogatott nyelvek és területi beállítások

A támogatott nyelvek teljes listáját a Nyelvi támogatás – dokumentumelemzési modellek oldalon találja.

Megfontolások

  • Mivel a kulcsok a dokumentumból kinyert szövegtartományok, a félig strukturált dokumentumok esetében a kulcsokat le kell képezni egy meglévő kulcsszótárra.

  • Kulcs-érték párok várhatók egy kulccsal, de érték nélkül. Például ha egy felhasználó úgy döntött, hogy nem ad meg e-mail-címet az űrlapon.

Következő lépések

  • Kövesse a Document Intelligence v3.1 migrálási útmutatóját, amelyből megtudhatja, hogyan használhatja a v3.1-es verziót az alkalmazásokban és munkafolyamatokban.

  • Ismerkedjen meg a REST API-val.