Dokumentumintelligencia-azonosító dokumentummodellje

Cikk
10/17/2024

Fontos

A Document Intelligence nyilvános előzetes verziójú kiadásai korai hozzáférést biztosítanak az aktív fejlesztés alatt lévő funkciókhoz. A funkciók, a megközelítések és a folyamatok az általános rendelkezésre állás (GA) előtt változhatnak a felhasználói visszajelzések alapján.
A Document Intelligence ügyfélkódtárak nyilvános előzetes verziója alapértelmezés szerint a REST API 2024-07-31-preview verziója.
A nyilvános előzetes verzió 2024-07-31 előzetes verziója jelenleg csak a következő Azure-régiókban érhető el. Vegye figyelembe, hogy az AI Studio egyéni generatív (dokumentummező-kinyerési) modellje csak az USA északi középső régiójában érhető el:
- USA keleti régiója
- USA2 nyugati régiója
- Nyugat-Európa
- USA északi középső régiója

Ez a tartalom a következőre vonatkozik: v4.0 (előzetes verzió) | Korábbi verziók: v3.1 (GA) v3.0 (GA) v2.1 (GA)

Ez a tartalom a következőre vonatkozik: v3.1 (GA) | Legújabb verzió: v4.0 (előzetes verzió) | Korábbi verziók: v3.0 v2.1

Ez a tartalom a következőre vonatkozik: v3.0 (GA) | Legújabb verziók: v4.0 (előzetes verzió) v3.1 | Korábbi verzió: 2.1-es verzió

Ez a tartalom a következőre vonatkozik: v2.1 | Legújabb verzió: 4.0-s verzió (előzetes verzió)

A Dokumentumintelligencia-identitás (ID) modell az optikai karakterfelismerést (OCR) és a mélytanulási modelleket kombinálva elemzi és kinyeri a kulcsadatokat az identitásdokumentumokból. Az API elemzi az identitásdokumentumokat (beleértve a következőket is), és strukturált JSON-adatreprezentációt ad vissza:

Passport book, passport card worldwide
Jogosítvány Egyesült Államok, Európa, India, Kanada és Ausztrália területén
Egyesült Államok azonosító kártyák, tartózkodási engedély (zöld kártya), társadalombiztosítási kártya, katonai azonosító
Európai azonosító kártyák, tartózkodási engedélyek
India PAN kártya, Aadhaar kártya
Kanada azonosító kártyái, tartózkodási engedély (juharkártya)
Ausztrália fényképkártya, kulcs-pass azonosító (beleértve a digitális verziót is)

A Dokumentumintelligencia képes elemezni és kinyerni a kormányzati azonosítókból származó információkat az előre összeállított azonosítómodell használatával. Egyesíti a hatékony optikai karakterfelismerési (OCR) képességeinket az azonosító-felismerési képességekkel, hogy kulcsadatokat nyerjen ki a Worldwide Passports és az amerikai illesztőprogram licenceiből (mind az 50 államból és a D.C.-ből). Az IDs API kulcsadatokat nyer ki ezekből az identitásdokumentumokból, például vezetéknév, vezetéknév, születési dátum, dokumentumszám stb. Ez az API a Document Intelligence 2.1-es verzióban érhető el felhőszolgáltatásként.

Identitásdokumentum feldolgozása

Az identitásdokumentum-feldolgozás magában foglalja az adatok kinyerését az identitásdokumentumokból manuálisan vagy OCR-alapú technológiával. Az azonosítódokumentum-feldolgozás fontos lépés minden olyan üzleti műveletben, amely identitásigazolást igényel. Ilyenek például a bankok és más pénzintézetek ügyfél-ellenőrzése, jelzálogkérelmek, orvosi látogatások, jogcímfeldolgozás, vendéglátás stb. Az egyének jogosítványokkal, útlevélekkel és más hasonló dokumentumokkal igazolják személyazonosságukat, hogy a vállalkozás hatékonyan ellenőrizhesse őket a szolgáltatások és előnyök biztosítása előtt.

A Document Intelligence Studióval feldolgozott amerikai illesztőprogram-licencminta

Egy mintaillesztő licencének képe.

Adatkinyerés

Az előre összeállított azonosítók szolgáltatás kinyeri a kulcsértékeket a világútlevelekből és az amerikai jogosítványokból, és rendszerezett, strukturált JSON-válaszban adja vissza őket.

Példa az illesztőprogram licencére

Mintaillesztő-licenc

Passport-példa

Passport-minta

Fejlesztési lehetőségek

A Document Intelligence v4.0 (2024-07-31-preview) a következő eszközöket, alkalmazásokat és kódtárakat támogatja:

Szolgáltatás	Források	Modellazonosító
Azonosító dokumentummodell	• Document Intelligence Studio • REST API • C# SDK • Python SDK • Java SDK • JavaScript SDK	előre összeállított-idDocument

A Document Intelligence v3.1 a következő eszközöket, alkalmazásokat és kódtárakat támogatja:

Szolgáltatás	Források	Modellazonosító
Azonosító dokumentummodell	• Document Intelligence Studio • REST API • C# SDK • Python SDK • Java SDK • JavaScript SDK	előre összeállított-idDocument

A Document Intelligence 3.0-s verzió a következő eszközöket, alkalmazásokat és kódtárakat támogatja:

Szolgáltatás	Források	Modellazonosító
Azonosító dokumentummodell	• Document Intelligence Studio • REST API • C# SDK • Python SDK • Java SDK • JavaScript SDK	előre összeállított-idDocument

A Document Intelligence v2.1 a következő eszközöket, alkalmazásokat és kódtárakat támogatja:

Szolgáltatás	Források
Azonosító dokumentummodell	• Dokumentumintelligencia-címkézési eszköz • REST API • Ügyfélkódtár SDK • Dokumentumintelligencia Docker-tároló

Bemeneti követelmények

Támogatott fájlformátumok:

Modell	PDF	Kép: `JPEG/JPG`, `PNG`, `BMP`, `TIFFHEIF`	Microsoft Office: Word (`DOCX`), Excel (`XLSX`), PowerPoint (`PPTX`), HTML
Olvasás	✔	✔	✔
Elrendezés	✔	✔	✔ (2024-07-31-preview, 2024-02-29-preview, 2023-10-31-preview)
Általános dokumentum	✔	✔
Előre összeállított	✔	✔
Egyéni kinyerés	✔	✔
Egyéni besorolás	✔	✔	✔ (2024-07-31-preview, 2024-02-29-preview)

A legjobb eredmény érdekében dokumentumonként egy tiszta fényképet vagy kiváló minőségű vizsgálatot biztosít.
PDF és TIFF esetén legfeljebb 2000 oldal dolgozható fel (ingyenes szintű előfizetéssel csak az első két oldal dolgozható fel).
A dokumentumok elemzéséhez használt fájlméret 500 MB a fizetős (S0) szint, az 4 ingyenes (F0) szint esetén pedig MB.
A képméreteknek 50 képpont x 50 képpont és 10 000 képpont x 10 000 képpont között kell lenniük.
Ha a PDF-eket jelszó védi, akkor beküldés előtt el kell távolítania a védelmet.
A kinyerni kívánt szöveg minimális magassága 12 képpont egy 1024 x 768 képpontos képhez. Ez a dimenzió körülbelül 8 150 pont/hüvelyk (DPI) pontszövegnek felel meg.
Egyéni modell betanítása esetén a betanítási adatok oldalainak maximális száma az egyéni sablonmodell esetében 500, az egyéni neurális modell esetében pedig 50 000.
- Egyéni extrakciós modell betanítása esetén a betanítási adatok teljes mérete 50 MB a sablonmodellhez, a neurális modellhez pedig 1 GB.
- Egyéni besorolási modell betanítása esetén a betanítási adatok 1 teljes mérete GB, legfeljebb 10 000 oldal. A 2024-07-31-es és újabb verziókban a betanítási adatok 2 teljes mérete GB, legfeljebb 10 000 oldal.

Támogatott fájlformátumok: JPEG, PNG, PDF és TIFF.
A PDF- és TIFF-fájlok oldalainak támogatott száma: legfeljebb 2000 oldal, vagy csak az első két oldal az ingyenes szintű előfizetők számára.
Támogatott fájlméret: kevesebb, mint 50 MB ÖSSZESEN; minimális képpontok: 50 x 50 px; maximális képpontméret 10 000 x 10 000 px.

Azonosító dokumentummodell adatainak kinyerése

Adatokat nyer ki, beleértve a nevet, a születési dátumot és a lejárati dátumot az azonosító dokumentumokból. A következő erőforrásokra van szüksége:

Azure-előfizetés – ingyenesen létrehozhat egyet.
Dokumentumintelligencia-példány az Azure Portalon. A szolgáltatás kipróbálásához használhatja az ingyenes tarifacsomagot (F0). Az erőforrás üzembe helyezése után válassza az Ugrás az erőforráshoz lehetőséget a kulcs és a végpont lekéréséhez.

Képernyőkép a kulcsok és a végpontok helyéről az Azure Portalon.

Feljegyzés

A Document Intelligence Studio 3.1-s és 3.0-s verziójú API-kkal és újabb verziókkal érhető el.

A Document Intelligence Studio kezdőlapján válassza az Identitásdokumentumok lehetőséget.
Elemezheti a mintául szolgáló számlát, vagy feltöltheti saját fájljait.
Válassza az Elemzés futtatása gombot, és szükség esetén konfigurálja az Elemzési beállításokat:

Próbálja ki a Document Intelligence Studiót.

Dokumentumintelligencia-mintacímkéző eszköz

Lépjen a dokumentumintelligencia-mintaeszközre.
A mintaeszköz kezdőlapján válassza az Előre összeállított modell használata lehetőséget az adatcsempék lekéréséhez.
Válassza ki az elemezni kívánt űrlaptípust a legördülő menüből.
Válassza ki az elemezni kívánt fájl URL-címét az alábbi lehetőségek közül:
A Forrás mezőben válassza az URL-címet a legördülő menüből, illessze be a kijelölt URL-címet, és válassza a Beolvasás gombot.
A Dokumentumintelligencia szolgáltatás végpont mezőjébe illessze be a Dokumentumintelligencia-előfizetéssel beszerzett végpontot.
A kulcsmezőbe illessze be a Dokumentumintelligencia-erőforrásból beszerzett kulcsot.
Válassza a Futtatás elemzése lehetőséget. A dokumentumintelligencia-mintacímkézési eszköz meghívja az Analyze Prebuilt API-t, és elemzi a dokumentumot.
Az eredmények megtekintése – megtekintheti a kinyert kulcs-érték párokat, a sorelemeket, a kibontott kiemelt szöveget és a táblákat.
Töltse le a JSON kimeneti fájlt a részletes eredmények megtekintéséhez.
- A "readResults" csomópont minden olyan szövegsort tartalmaz, amelyen a megfelelő határolókeret található az oldalon.
- A "selectionMarks" csomópont megjeleníti az összes kijelölési jelet (jelölőnégyzet, választójel), valamint azt, hogy az állapota ki van-e jelölve , vagy nincs bejelölve.
- A "pageResults" szakasz tartalmazza a kinyert táblákat. A Dokumentumintelligencia minden táblához kinyeri a szöveget, a sor- és oszlopindexet, a sor- és oszlopfedést, a határolókeretet és egyebeket.
- A "documentResults" mező a dokumentum legrelevánsabb részeire vonatkozó kulcs-/értékpár-információkat és sorelemek adatait tartalmazza.

Feljegyzés

A Mintacímke eszköz nem támogatja a BMP fájlformátumot. Ez nem a Dokumentumintelligencia-szolgáltatás, hanem az eszköz korlátozása.

Támogatott dokumentumtípusok

Régió	Dokumentumtípusok
Világszerte	Passport Book, Passport Card
Egyesült Államok	Jogosítvány, azonosító kártya, tartózkodási engedély (zöld kártya), társadalombiztosítási kártya, katonai azonosító
Európa	Jogosítvány, azonosító kártya, tartózkodási engedély
India	Jogosítvány, PAN kártya, Aadhaar Kártya
Kanada	Jogosítvány, azonosító kártya, tartózkodási engedély (juharkártya)
Ausztrália	Jogosítvány, fényképkártya, kulcsigazolvány azonosítója (beleértve a digitális verziót is)

Mezőkinyerések

A támogatott dokumentumkinyerési mezőkért tekintse meg az azonosító dokumentummodell sémalapját a GitHub-mintaadattárban.

Támogatott dokumentumtípusok

Az azonosító okmánymodell jelenleg támogatja az egyesült államokbeli jogosítványokat és az életrajzi oldalt a nemzetközi útlevelekből (a vízum és egyéb úti okmányok kivételével).

Kinyert mezők

Név	Típus	Leírás	Érték
Ország	Ország	Az ISO 3166 szabványnak megfelelő országkód	"USA"
DateOfBirth	dátum:	DOB YYYY-MM-DD formátumban	"1980-01-01"
DateOfExpiration	dátum:	Lejárati dátum YYYY-MM-DD formátumban	"2019-05-05"
DocumentNumber	húr	Megfelelő útlevélszám, jogosítványszám stb.	"340020013"
FirstName	húr	Kinyert utónév és középső kezdőbetű, ha van	"JENNIFER"
LastName	húr	Kinyert vezetéknév	"BROOKS"
Állampolgárság	Ország	Az ISO 3166 szabványnak megfelelő országkód	"USA"
Nem	nem	Lehetséges kinyert értékek: "M" "F" "X"	"F"
MachineReadableZone	object	Kinyert útlevél `MRZ` , amely két 44 karakterből álló sort tartalmaz	"P<USABROOKS<<JENNIFER<<<<<<<<<<<<<<<<<<<<<<< 3400200135USA8001014F1905054710000307<715816"
DocumentType	húr	Dokumentum típusa, például Passport, Driver's License	"útlevél"
Cím	húr	Kinyert cím (csak az illesztőprogram licence)	"123 STREET ADDRESS YOUR CITY WA 99999-1234"
Régió	húr	Kinyert régió, állam, tartomány stb. (csak jogosítvány)	"Washington"

Migrálási útmutató

Kövesse a Document Intelligence v3.1 migrálási útmutatóját, amelyből megtudhatja, hogyan használhatja a v3.0-s verziót az alkalmazásokban és munkafolyamatokban.

Következő lépések

Próbálja meg feldolgozni saját űrlapjait és dokumentumait a Document Intelligence Studióval.
Végezze el a Dokumentumintelligencia rövid útmutatóját , és kezdje el létrehozni egy dokumentumfeldolgozó alkalmazást a választott fejlesztési nyelven.

További példákat találhat a GitHubon.

További példákat találhat a GitHubon.

Próbálja meg feldolgozni saját űrlapjait és dokumentumait a Dokumentumintelligencia mintacímkéző eszközzel.
Végezze el a Dokumentumintelligencia rövid útmutatóját , és kezdje el létrehozni egy dokumentumfeldolgozó alkalmazást a választott fejlesztési nyelven.

Megosztás a következőn keresztül:

Dokumentumintelligencia-azonosító dokumentummodellje

Identitásdokumentum feldolgozása

Adatkinyerés

Példa az illesztőprogram licencére

Passport-példa

Fejlesztési lehetőségek

Bemeneti követelmények

Azonosító dokumentummodell adatainak kinyerése

Dokumentumintelligencia-mintacímkéző eszköz

Támogatott dokumentumtípusok

Mezőkinyerések

Támogatott dokumentumtípusok

Kinyert mezők

Migrálási útmutató

Következő lépések

Visszajelzés

További források