Dokumentumintelligencia-szerződés modellje

Fontos

  • A Document Intelligence nyilvános előzetes verziójú kiadásai korai hozzáférést biztosítanak az aktív fejlesztés alatt lévő funkciókhoz.
  • A funkciók, a megközelítések és a folyamatok az általános rendelkezésre állás (GA) előtt változhatnak a felhasználói visszajelzések alapján.
  • A Document Intelligence ügyfélkódtárak nyilvános előzetes verziója alapértelmezés szerint a REST API 2024-02-29-preview verziója.
  • A nyilvános előzetes verzió 2024-02-29 előzetes verziója jelenleg csak a következő Azure-régiókban érhető el:
  • USA keleti régiója
  • USA2 nyugati régiója
  • Nyugat-Európa

Ez a tartalom a következőre vonatkozik::Sakkv4.0 (előzetes verzió) | Korábbi verzió:kék pipav3.1 (GA)

Ez a tartalom a következőre vonatkozik::Sakkv3.1 (GA) | Legújabb verzió:lila pipav4.0 (előzetes verzió)

A dokumentumintelligencia-szerződésmodell hatékony optikai karakterfelismerési (OCR) képességeket használ a fontos szerződéses entitások kiválasztott csoportjából származó kulcsmezők és sorelemek elemzésére és kinyerésére. A szerződések különböző formátumúak és minőségűek lehetnek, beleértve a telefonon rögzített képeket, a beolvasott dokumentumokat és a digitális PDF-eket. Az API elemzi a dokumentum szövegét; kinyeri az olyan kulcsfontosságú információkat, mint a felek, a joghatóságok, a szerződés azonosítója és a cím; és strukturált JSON-adatábrázolást ad vissza. A modell jelenleg támogatja az angol nyelvű dokumentumformátumokat.

Automatizált szerződésfeldolgozás

Az automatizált szerződésfeldolgozás a kulcsfontosságú szerződésmezők dokumentumokból való kinyerésének folyamata. A szerződéselemzési folyamatot korábban manuálisan, tehát nagyon időigényesen érik el. A kulcsadatok szerződésekből való pontos kinyerése általában a szerződésautomatizálási folyamat első és egyik legkritikusabb lépése.

Fejlesztési lehetőségek

A Document Intelligence v4.0 (2024-02-29-preview) a következő eszközöket, alkalmazásokat és kódtárakat támogatja:

Szolgáltatás Források Modellazonosító
Szerződési modell Document Intelligence Studio
REST API
C# SDK
Python SDK
Java SDK
JavaScript SDK
előre összeállított szerződés

A Document Intelligence v3.1 a következő eszközöket, alkalmazásokat és kódtárakat támogatja:

Szolgáltatás Források Modellazonosító
Szerződési modell Document Intelligence Studio
REST API
C# SDK
Python SDK
Java SDK
JavaScript SDK
előre összeállított szerződés

A Document Intelligence 3.0-s verzió a következő eszközöket, alkalmazásokat és kódtárakat támogatja:

Szolgáltatás Források Modellazonosító
Szerződési modell Document Intelligence Studio
REST API
C# SDK
Python SDK
Java SDK
JavaScript SDK
előre összeállított szerződés

Bemeneti követelmények

  • A legjobb eredmény érdekében dokumentumonként egy tiszta fényképet vagy kiváló minőségű vizsgálatot biztosít.

  • Támogatott fájlformátumok:

    Modell PDF Kép:
    JPEG/JPG, PNG, BMP, TIFF, HEIF
    Microsoft Office:
    Word (DOCX), Excel (XLSX), PowerPoint (PPTX) és HTML
    Olvasás
    Elrendezés ✔ (2024-02-29-preview, 2023-10-31-preview)
    Általános dokumentum
    Előre összeállított
    Egyéni kinyerés
    Egyéni besorolás ✔ (2024-02-29-preview)
  • PDF és TIFF esetén legfeljebb 2000 oldal dolgozható fel (ingyenes szintű előfizetéssel csak az első két oldal dolgozható fel).

  • A dokumentumok elemzéséhez használt fájlméret 500 MB a fizetős (S0) és 4 MB az ingyenes (F0) szint esetén.

  • A képméreteknek 50 x 50 képpont és 10 000 képpont x 10 000 képpont között kell lenniük.

  • Ha a PDF-eket jelszó védi, akkor beküldés előtt el kell távolítania a védelmet.

  • A kinyerni kívánt szöveg minimális magassága 12 képpont egy 1024 x 768 képpontos képhez. Ez a dimenzió körülbelül 8150 pont/hüvelyk (DPI) pont szövegnek felel meg.

  • Egyéni modell betanítása esetén a betanítási adatok oldalainak maximális száma az egyéni sablonmodell esetében 500, az egyéni neurális modell esetében pedig 50 000.

    • Egyéni extrakciós modell betanítása esetén a betanítási adatok teljes mérete sablonmodell esetén 50 MB, a neurális modell esetében pedig 1G-MB.

    • Egyéni besorolási modell betanítása esetén a betanítási adatok 1GB teljes mérete legfeljebb 10 000 oldal lehet.

Szerződésdokumentumok adatkinyerésének kipróbálása

Megtudhatja, hogyan nyerik ki az adatokat, beleértve az ügyféladatokat, a szállító adatait és a sorelemeket a szerződésekből. A következő erőforrásokra van szüksége:

  • Azure-előfizetés – ingyenesen létrehozhat egyet.

  • Dokumentumintelligencia-példány az Azure Portalon. A szolgáltatás kipróbálásához használhatja az ingyenes tarifacsomagot (F0). Az erőforrás üzembe helyezése után válassza az Ugrás az erőforráshoz lehetőséget a kulcs és a végpont lekéréséhez.

Képernyőkép a kulcsok és a végpontok helyéről az Azure Portalon.

Document Intelligence Studio

  1. A Document Intelligence Studio kezdőlapján válassza az Adódokumentumok lehetőséget.

  2. Elemezheti a mintául szolgáló adódokumentumokat, vagy feltöltheti saját fájljait.

  3. Válassza az Elemzés futtatása gombot, és szükség esetén konfigurálja az Elemzési beállításokat:

    Képernyőkép a Document Intelligence Studio Elemzés és elemzés beállításai gombjairól.

Támogatott nyelvek és területi beállítások

A támogatott nyelvek teljes listájáért tekintse meg a Nyelvi támogatás – előre összeállított modellek lapját.

Mező kinyerése

A JSON kimeneti válaszában a szerződésből kinyert mezők a következők.

Név Típus Leírás Példakimenet
Cím Sztring Szerződés címe Szolgáltatási szerződés
ContractId Sztring Szerződés címe AB12956
Felek Tömb Jogi személyek listája
ExecutionDate Dátum A megállapodás teljes aláírásának és az összes fél általi elfogadásának dátuma On this twenty-third day of February two thousand and twenty two
ExpirationDate Dátum A szerződés érvénybe lépésének dátuma Egy év
RenewalDate Dátum A szerződés megújításának dátuma On this twenty-third day of February two thousand and twenty two
Jogrendszerben Tömb Joghatóságok listája

A kicsomagolt szerződéskulcs-érték párok és sorelemek a documentResults JSON-kimenet szakaszában találhatók.

Következő lépések