Dokumentumintelligencia-azonosító dokumentummodellje

Fontos

  • A Document Intelligence nyilvános előzetes verziójú kiadásai korai hozzáférést biztosítanak az aktív fejlesztés alatt lévő funkciókhoz.
  • A funkciók, a megközelítések és a folyamatok az általános rendelkezésre állás (GA) előtt változhatnak a felhasználói visszajelzések alapján.
  • A Document Intelligence ügyfélkódtárak nyilvános előzetes verziója alapértelmezés szerint a REST API 2024-02-29-preview verziója.
  • A nyilvános előzetes verzió 2024-02-29 előzetes verziója jelenleg csak a következő Azure-régiókban érhető el:
  • USA keleti régiója
  • USA2 nyugati régiója
  • Nyugat-Európa

Ez a tartalom a következőre vonatkozik::Sakkv4.0 (előzetes verzió) | Korábbi verziók:kék pipav3.1 (GA)kék pipav3.0 (GA)kék pipav2.1 (GA)

Ez a tartalom a következőre vonatkozik::Sakkv3.1 (GA) | Legújabb verzió:lila pipav4.0 (előzetes verzió) | Korábbi verziók:kék pipav3.0kék pipav2.1

Ez a tartalom a következőre vonatkozik::Sakkv3.0 (GA) | Legújabb verziók:lila pipav4.0 (előzetes verzió)lila pipav3.1 | Korábbi verzió:kék pipav2.1

Ez a tartalom a következőre vonatkozik::Sakkv2.1 | Legújabb verzió:kék pipav4.0 (előzetes verzió)

A Dokumentumintelligencia-identitás (ID) modell az optikai karakterfelismerést (OCR) és a mélytanulási modelleket kombinálva elemzi és kinyeri a kulcsadatokat az identitásdokumentumokból. Az API elemzi az identitásdokumentumokat (beleértve a következőket is), és strukturált JSON-adatreprezentációt ad vissza:

  • Passport book, passport card worldwide
  • Jogosítvány Egyesült Államok, Európa, India, Kanada és Ausztrália területén
  • Egyesült Államok azonosító kártyák, tartózkodási engedély (zöld kártya), társadalombiztosítási kártya, katonai azonosító
  • Európai azonosító kártyák, tartózkodási engedélyek
  • India PAN kártya, Aadhaar kártya
  • Kanada azonosító kártyái, tartózkodási engedély (juharkártya)
  • Ausztrália fényképkártya, kulcs-pass azonosító (beleértve a digitális verziót is)

A Dokumentumintelligencia képes elemezni és kinyerni a kormányzati azonosítókból származó információkat az előre összeállított azonosítómodell használatával. Egyesíti a hatékony optikai karakterfelismerési (OCR) képességeinket az azonosító-felismerési képességekkel, hogy kulcsadatokat nyerjen ki a Worldwide Passports és az amerikai illesztőprogram licenceiből (mind az 50 államból és a D.C.-ből). Az IDs API kulcsadatokat nyer ki ezekből az identitásdokumentumokból, például vezetéknév, vezetéknév, születési dátum, dokumentumszám stb. Ez az API a Document Intelligence 2.1-es verzióban érhető el felhőszolgáltatásként.

Identitásdokumentum feldolgozása

Az identitásdokumentum-feldolgozás magában foglalja az adatok kinyerését az identitásdokumentumokból manuálisan vagy OCR-alapú technológiával. Az azonosítódokumentum-feldolgozás fontos lépés minden olyan üzleti műveletben, amely identitásigazolást igényel. Ilyenek például a bankok és más pénzintézetek ügyfél-ellenőrzése, jelzálogkérelmek, orvosi látogatások, jogcímfeldolgozás, vendéglátás stb. Az egyének jogosítványokkal, útlevélekkel és más hasonló dokumentumokkal igazolják személyazonosságukat, hogy a vállalkozás hatékonyan ellenőrizhesse őket a szolgáltatások és előnyök biztosítása előtt.

A Document Intelligence Studióval feldolgozott amerikai illesztőprogram-licencminta

Egy mintaillesztő licencének képe.

Adatkinyerés

Az előre összeállított azonosítók szolgáltatás kinyeri a kulcsértékeket a világútlevelekből és az amerikai jogosítványokból, és rendszerezett, strukturált JSON-válaszban adja vissza őket.

Példa az illesztőprogram licencére

Mintaillesztő-licenc

Passport-példa

Passport-minta

Fejlesztési lehetőségek

A Document Intelligence v4.0 (2024-02-29-preview, 2023-10-31-preview) a következő eszközöket, alkalmazásokat és kódtárakat támogatja:

Szolgáltatás Források Modellazonosító
Azonosító dokumentummodell Document Intelligence Studio
REST API
C# SDK
Python SDK
Java SDK
JavaScript SDK
előre összeállított-idDocument

A Document Intelligence v3.1 a következő eszközöket, alkalmazásokat és kódtárakat támogatja:

Szolgáltatás Források Modellazonosító
Azonosító dokumentummodell Document Intelligence Studio
REST API
C# SDK
Python SDK
Java SDK
JavaScript SDK
előre összeállított-idDocument

A Document Intelligence 3.0-s verzió a következő eszközöket, alkalmazásokat és kódtárakat támogatja:

Szolgáltatás Források Modellazonosító
Azonosító dokumentummodell Document Intelligence Studio
REST API
C# SDK
Python SDK
Java SDK
JavaScript SDK
előre összeállított-idDocument

A Document Intelligence v2.1 a következő eszközöket, alkalmazásokat és kódtárakat támogatja:

Szolgáltatás Források
Azonosító dokumentummodell Dokumentumintelligencia-címkézési eszköz
REST API
Ügyfélkódtár SDK
Dokumentumintelligencia Docker-tároló

Bemeneti követelmények

  • A legjobb eredmény érdekében dokumentumonként egy tiszta fényképet vagy kiváló minőségű vizsgálatot biztosít.

  • Támogatott fájlformátumok:

    Modell PDF Kép:
    JPEG/JPG, PNG, BMP, TIFF, HEIF
    Microsoft Office:
    Word (DOCX), Excel (XLSX), PowerPoint (PPTX) és HTML
    Olvasás
    Elrendezés ✔ (2024-02-29-preview, 2023-10-31-preview)
    Általános dokumentum
    Előre összeállított
    Egyéni kinyerés
    Egyéni besorolás ✔ (2024-02-29-preview)
  • PDF és TIFF esetén legfeljebb 2000 oldal dolgozható fel (ingyenes szintű előfizetéssel csak az első két oldal dolgozható fel).

  • A dokumentumok elemzéséhez használt fájlméret 500 MB a fizetős (S0) és 4 MB az ingyenes (F0) szint esetén.

  • A képméreteknek 50 x 50 képpont és 10 000 képpont x 10 000 képpont között kell lenniük.

  • Ha a PDF-eket jelszó védi, akkor beküldés előtt el kell távolítania a védelmet.

  • A kinyerni kívánt szöveg minimális magassága 12 képpont egy 1024 x 768 képpontos képhez. Ez a dimenzió körülbelül 8150 pont/hüvelyk (DPI) pont szövegnek felel meg.

  • Egyéni modell betanítása esetén a betanítási adatok oldalainak maximális száma az egyéni sablonmodell esetében 500, az egyéni neurális modell esetében pedig 50 000.

    • Egyéni extrakciós modell betanítása esetén a betanítási adatok teljes mérete sablonmodell esetén 50 MB, a neurális modell esetében pedig 1G-MB.

    • Egyéni besorolási modell betanítása esetén a betanítási adatok 1GB teljes mérete legfeljebb 10 000 oldal lehet.

  • Támogatott fájlformátumok: JPEG, PNG, PDF és TIFF.

  • A PDF- és TIFF-fájlok oldalainak támogatott száma: legfeljebb 2000 oldal, vagy csak az első két oldal az ingyenes szintű előfizetők számára.

  • Támogatott fájlméret: kevesebb, mint 50 MB ÖSSZESEN; minimális képpontok: 50 x 50 px; maximális képpontméret 10 000 x 10 000 px.

Azonosító dokumentummodell adatainak kinyerése

Adatokat nyer ki, beleértve a nevet, a születési dátumot és a lejárati dátumot az azonosító dokumentumokból. A következő erőforrásokra van szüksége:

  • Azure-előfizetés – ingyenesen létrehozhat egyet.

  • Dokumentumintelligencia-példány az Azure Portalon. A szolgáltatás kipróbálásához használhatja az ingyenes tarifacsomagot (F0). Az erőforrás üzembe helyezése után válassza az Ugrás az erőforráshoz lehetőséget a kulcs és a végpont lekéréséhez.

Képernyőkép a kulcsok és a végpontok helyéről az Azure Portalon.

Feljegyzés

A Document Intelligence Studio 3.1-s és 3.0-s verziójú API-kkal és újabb verziókkal érhető el.

  1. A Document Intelligence Studio kezdőlapján válassza az Identitásdokumentumok lehetőséget.

  2. Elemezheti a mintául szolgáló számlát, vagy feltöltheti saját fájljait.

  3. Válassza az Elemzés futtatása gombot, és szükség esetén konfigurálja az Elemzési beállításokat:

    Képernyőkép a Document Intelligence Studio Elemzés és elemzés beállításai gombjairól.

Dokumentumintelligencia-mintacímkéző eszköz

  1. Lépjen a dokumentumintelligencia-mintaeszközre.

  2. A mintaeszköz kezdőlapján válassza az Előre összeállított modell használata lehetőséget az adatcsempék lekéréséhez.

    Képernyőkép az elrendezési modell eredményelemzési műveletéről.

  3. Válassza ki az elemezni kívánt űrlaptípust a legördülő menüből.

  4. Válassza ki az elemezni kívánt fájl URL-címét az alábbi lehetőségek közül:

  5. A Forrás mezőben válassza az URL-címet a legördülő menüből, illessze be a kijelölt URL-címet, és válassza a Beolvasás gombot.

    Képernyőkép a forráshely legördülő menüről.

  6. A Dokumentumintelligencia szolgáltatás végpont mezőjébe illessze be a Dokumentumintelligencia-előfizetéssel beszerzett végpontot.

  7. A kulcsmezőbe illessze be a Dokumentumintelligencia-erőforrásból beszerzett kulcsot.

    Képernyőkép a dokumentumtípus kiválasztása legördülő menüről.

  8. Válassza a Futtatás elemzése lehetőséget. A dokumentumintelligencia-mintacímkézési eszköz meghívja az Analyze Prebuilt API-t, és elemzi a dokumentumot.

  9. Az eredmények megtekintése – megtekintheti a kinyert kulcs-érték párokat, a sorelemeket, a kibontott kiemelt szöveget és a táblákat.

    Képernyőkép az identitásmodell eredményelemzési műveletéről.

  10. Töltse le a JSON kimeneti fájlt a részletes eredmények megtekintéséhez.

    • A "readResults" csomópont minden olyan szövegsort tartalmaz, amelyen a megfelelő határolókeret található az oldalon.
    • A "selectionMarks" csomópont megjeleníti az összes kijelölési jelet (jelölőnégyzet, választójel), valamint azt, hogy az állapota ki van-e jelölve , vagy nincs bejelölve.
    • A "pageResults" szakasz tartalmazza a kinyert táblákat. A Dokumentumintelligencia minden táblához kinyeri a szöveget, a sor- és oszlopindexet, a sor- és oszlopfedést, a határolókeretet és egyebeket.
    • A "documentResults" mező a dokumentum legrelevánsabb részeire vonatkozó kulcs-/értékpár-információkat és sorelemek adatait tartalmazza.

Feljegyzés

A Mintacímke eszköz nem támogatja a BMP fájlformátumot. Ez nem a Dokumentumintelligencia-szolgáltatás, hanem az eszköz korlátozása.

Támogatott dokumentumtípusok

Régió Dokumentumtípusok
Világszerte Passport Book, Passport Card
Egyesült Államok Jogosítvány, azonosító kártya, tartózkodási engedély (zöld kártya), társadalombiztosítási kártya, katonai azonosító
Európa Jogosítvány, azonosító kártya, tartózkodási engedély
India Jogosítvány, PAN kártya, Aadhaar Kártya
Kanada Jogosítvány, azonosító kártya, tartózkodási engedély (juharkártya)
Ausztrália Jogosítvány, fényképkártya, kulcsigazolvány azonosítója (beleértve a digitális verziót is)

Mezőkinyerések

Az alábbiakban a dokumentumtípusonként kinyert mezőket írjuk ki. A Dokumentumintelligencia-azonosító modell prebuilt-idDocument a következő mezőket nyeri ki a documents.*.fields. A json-kimenet tartalmazza a dokumentumokban, szavakban, vonalakban és stílusokban kinyert összes szöveget.

idDocument.driverLicense

Mező Típus Leírás Példa
CountryRegion countryRegion Ország vagy régió kódja USA
Region string Állam vagy tartomány Washington
DocumentNumber string Illesztőprogram-licenc száma WDLABCD456DG
DocumentDiscriminator string Jogosítványlicenc-dokumentum diszkriminatív 12645646464554646456464544
FirstName string Adott név és középső kezdőbetű, ha van LIAM R.
LastName string Vezetéknév TALBOT
Address address Cím 123 STR ENTERPRISE KIADÁS T ADDRESS YOUR CITY WA 99999-1234
DateOfBirth date Születési dátum 01/06/1958
DateOfExpiration date Lejárat dátuma 08/12/2020
DateOfIssue date A probléma dátuma 08/12/2012
EyeColor string Szemszín Kék
HairColor string Hajszín Barna
Height string Magasság 5'11"
Weight string Betűvastagság 185LB
Sex string Nem H
Endorsements string Jóváhagyások L
Restrictions string Korlátozások h
VehicleClassifications string Járműbesorolás T

idDocument.passport

Mező Típus Leírás Példa
DocumentNumber string Útlevélszám 340020013
FirstName string Adott név és középső kezdőbetű, ha van JENNIFER
MiddleName string Név a keresztnév és a vezetéknév között REYES
LastName string Vezetéknév BROOKS
Aliases array
Aliases.* string Néven MAT LIN
DateOfBirth date Születési dátum 1980-01-01
DateOfExpiration date Lejárat dátuma 2019-05-05
DateOfIssue date A probléma dátuma 2014-05-06
Sex string Nem F
CountryRegion countryRegion Kibocsátó ország vagy szervezet USA
DocumentType string Dokumentumtípusok P
Nationality countryRegion Állampolgárság USA
PlaceOfBirth string Születési hely MASSACHU Standard kiadás TTS, Amerikai Egyesült Államok
PlaceOfIssue string A probléma helye LISSZABONI
IssuingAuthority string Kibocsátó hatóság Egyesült Államok Külügyminisztérium
PersonalNumber string Személyes azonosító. Szám A234567893
MachineReadableZone object Géppel olvasható zóna (MRZ) P<USABROOKS<<JENNIFER<<<<<<<<<<<<<<<<<<<<<<< 3400200135USA8001014F1905054710000307<715816
MachineReadableZone.FirstName string Adott név és középső kezdőbetű, ha van JENNIFER
MachineReadableZone.LastName string Vezetéknév BROOKS
MachineReadableZone.DocumentNumber string Útlevélszám 340020013
MachineReadableZone.CountryRegion countryRegion Kibocsátó ország vagy szervezet USA
MachineReadableZone.Nationality countryRegion Állampolgárság USA
MachineReadableZone.DateOfBirth date Születési dátum 1980-01-01
MachineReadableZone.DateOfExpiration date Lejárat dátuma 2019-05-05
MachineReadableZone.Sex string Nem F

idDocument.nationalIdentityCard

Mező Típus Leírás Példa
CountryRegion countryRegion Ország vagy régió kódja USA
Region string Állam vagy tartomány Washington
DocumentNumber string Nemzeti személyazonosító igazolvány száma WDLABCD456DG
DocumentDiscriminator string Nemzeti személyazonossági kártya dokumentum diszkriminatív 12645646464554646456464544
FirstName string Adott név és középső kezdőbetű, ha van LIAM R.
LastName string Vezetéknév TALBOT
Address address Cím 123 STR ENTERPRISE KIADÁS T ADDRESS YOUR CITY WA 99999-1234
DateOfBirth date Születési dátum 01/06/1958
DateOfExpiration date Lejárat dátuma 08/12/2020
DateOfIssue date A probléma dátuma 08/12/2012
EyeColor string Szemszín KÉK
HairColor string Hajszín BARNA
Height string Magasság 5'11"
Weight string Betűvastagság 185LB
Sex string Nem H

idDocument.residencePermit

Mező Típus Leírás Példa
CountryRegion countryRegion Ország vagy régió kódja USA
DocumentNumber string Tartózkodási engedély száma WDLABCD456DG
FirstName string Adott név és középső kezdőbetű, ha van LIAM R.
LastName string Vezetéknév TALBOT
DateOfBirth date Születési dátum 01/06/1958
DateOfExpiration date Lejárat dátuma 08/12/2020
DateOfIssue date A probléma dátuma 08/12/2012
Sex string Nem H
PlaceOfBirth string Születési hely Németország
Category string Engedélykategória DV2
Address string Cím 123 STR ENTERPRISE KIADÁS T ADDRESS YOUR CITY WA 99999-1234

idDocument.usSocialSecurityCard

Mező Típus Leírás Példa
DocumentNumber string Társadalombiztosítási kártya száma WDLABCD456DG
FirstName string Adott név és középső kezdőbetű, ha van LIAM R.
LastName string Vezetéknév TALBOT
DateOfIssue date A probléma dátuma 08/12/2012

idDocument

Mező Típus Leírás Példa
Address address Cím 123 STR ENTERPRISE KIADÁS T ADDRESS YOUR CITY WA 99999-1234
DocumentNumber string Illesztőprogram-licenc száma WDLABCD456DG
FirstName string Adott név és középső kezdőbetű, ha van LIAM R.
LastName string Vezetéknév TALBOT
DateOfBirth date Születési dátum 01/06/1958
DateOfExpiration date Lejárat dátuma 08/12/2020

Támogatott dokumentumtípusok

Az azonosító okmánymodell jelenleg támogatja az egyesült államokbeli jogosítványokat és az életrajzi oldalt a nemzetközi útlevelekből (a vízum és egyéb úti okmányok kivételével).

Kinyert mezők

Név Típus Leírás Érték
Ország Ország Az ISO 3166 szabványnak megfelelő országkód "USA"
DateOfBirth dátum: DOB YYYY-MM-DD formátumban "1980-01-01"
DateOfExpiration dátum: Lejárati dátum YYYY-MM-DD formátumban "2019-05-05"
DocumentNumber húr Megfelelő útlevélszám, jogosítványszám stb. "340020013"
FirstName húr Kinyert utónév és középső kezdőbetű, ha van "JENNIFER"
LastName húr Kinyert vezetéknév "BROOKS"
Állampolgárság Ország Az ISO 3166 szabványnak megfelelő országkód "USA"
Nem nem Lehetséges kinyert értékek: "M" "F" "X" "F"
MachineReadableZone object Kinyert Passport MRZ, amely egyenként két 44 karakterből álló sorból áll "P<USABROOKS<<JENNIFER<<<<<<<<<<<<<<<<<<<<<<< 3400200135USA8001014F1905054710000307<715816"
DocumentType húr Dokumentum típusa, például Passport, Driver's License "útlevél"
Cím húr Kinyert cím (csak az illesztőprogram licence) "123 STR Enterprise kiadás T ADDRESS YOUR CITY WA 99999-1234"
Régió húr Kinyert régió, állam, tartomány stb. (csak jogosítvány) "Washington"

Migrálási útmutató

  • Kövesse a Document Intelligence v3.1 migrálási útmutatóját, amelyből megtudhatja, hogyan használhatja a v3.0-s verziót az alkalmazásokban és munkafolyamatokban.

Következő lépések