Model dokumentu ID funkce Document Intelligence

Důležité

  • Verze Document Intelligence ve verzi Public Preview poskytují dřívější přístup k funkcím, které jsou aktivní ve vývoji.
  • Funkce, přístupy a procesy se můžou před obecnou dostupností (GA) změnit na základě zpětné vazby uživatelů.
  • Verze Public Preview klientských knihoven Document Intelligence ve výchozím nastavení je rest API verze 2024-02-29-preview.
  • Verze Public Preview 2024-02-29-preview je aktuálně dostupná jenom v následujících oblastech Azure:
  • USA – východ
  • USA – západ 2
  • Západní Evropa

Tento obsah se vztahuje na:Zaškrtnutív4.0 (Preview) | Předchozí verze:modrá značka zaškrtnutív3.1 (GA)modrá značka zaškrtnutív3.0 (GA)modrá značka zaškrtnutív2.1 (GA)

Tento obsah se vztahuje na:Zaškrtnutív3.1 (GA) | Nejnovější verze:nachová značka zaškrtnutív4.0 (Preview) | Předchozí verze:modrá značka zaškrtnutív3.0modrá značka zaškrtnutív2.1

Tento obsah se vztahuje na:Zaškrtnutív3.0 (GA) | Nejnovější verze:nachová značka zaškrtnutív4.0 (Preview)nachová značka zaškrtnutív3.1 | Předchozí verze:modrá značka zaškrtnutív2.1

Tento obsah se vztahuje na:Zaškrtnutív2.1 | Nejnovější verze:modrá značka zaškrtnutív4.0 (Preview)

Model dokumentu Document Intelligence Identity (ID) kombinuje optické rozpoznávání znaků (OCR) s modely hloubkového učení za účelem analýzy a extrakce klíčových informací z dokumentů identit. Rozhraní API analyzuje dokumenty identit (včetně následujících) a vrací strukturovanou reprezentaci dat JSON:

  • Cestovní pas, cestovní karta po celém světě
  • Řidičská licence z USA, Evropy, Indie, Kanady a Austrálie
  • USA identifikační karty, povolení k pobytu (zelená karta), karta sociálního pojištění, vojenské ID
  • Evropské identifikační karty, povolení k pobytu
  • Karta PAN Indie, karta Aadhaar
  • Identifikační karty Kanady, povolení k pobytu (maple card)
  • Austrálie fotokarta, klíč-pass ID (včetně digitální verze)

Funkce Document Intelligence dokáže analyzovat a extrahovat informace z identifikačních dokumentů vydaných státní správou pomocí předem vytvořeného modelu ID. Kombinuje naše výkonné funkce optického rozpoznávání znaků (OCR) s funkcemi rozpoznávání ID k extrakci klíčových informací z globálních pasů a uživatelských licencí (všech 50 států a D.C.). Rozhraní API ID extrahuje klíčové informace z těchto dokumentů identity, jako je jméno, příjmení, datum narození, číslo dokumentu a další. Toto rozhraní API je k dispozici ve funkci Document Intelligence verze 2.1 jako cloudová služba.

Zpracování dokumentů identit

Zpracování dokumentů identity zahrnuje extrakci dat z dokumentů identity buď ručně, nebo pomocí technologie založené na technologii OCR. Zpracování dokumentu ID je důležitým krokem v každé obchodní operaci, která vyžaduje doklad o identitě. Mezi příklady patří ověření zákazníků v bankách a dalších finančních institucích, hypotékách, lékařských návštěvách, zpracování nároků, pohostinství a další. Jednotlivci poskytují doklad o své totožnosti prostřednictvím řidičských licencí, pasů a dalších podobných dokumentů, aby je firma mohla efektivně ověřit před poskytováním služeb a výhod.

Ukázková licence ovladače pro USA zpracovaná pomocí nástroje Document Intelligence Studio

Obrázek licence ukázkového řidiče

Extrakce dat

Předem připravená služba ID extrahuje klíčové hodnoty z globálních pasů a licencí obchodních faktorů USA a vrací je v uspořádané strukturované odpovědi JSON.

Příklad řidičského průkazu

Vzorová řidičská licence

Příklad passportu

Ukázkový passport

Možnosti vývoje

Document Intelligence v4.0 (2024-02-02-29-preview, 2023-10-31-preview) podporuje následující nástroje, aplikace a knihovny:

Funkce Zdroje informací ID modelu
Model dokumentu ID Document Intelligence Studio
REST API
C# SDK
Python SDK• Java SDK
• JavaScript SDK• JavaScript SDK
prebuilt-idDocument

Document Intelligence v3.1 podporuje následující nástroje, aplikace a knihovny:

Funkce Zdroje informací ID modelu
Model dokumentu ID Document Intelligence Studio
REST API
C# SDK
Python SDK• Java SDK
• JavaScript SDK• JavaScript SDK
prebuilt-idDocument

Document Intelligence v3.0 podporuje následující nástroje, aplikace a knihovny:

Funkce Zdroje informací ID modelu
Model dokumentu ID Document Intelligence Studio
REST API
C# SDK
Python SDK• Java SDK
• JavaScript SDK• JavaScript SDK
prebuilt-idDocument

Document Intelligence v2.1 podporuje následující nástroje, aplikace a knihovny:

Funkce Zdroje informací
Model dokumentu ID Nástroj pro
popisování document intelligence• REST API
sada SDK
klientské knihovny• Kontejner Document Intelligence Dockeru

Požadavky na vstup

  • Nejlepšíchvýsledkůch

  • Podporované formáty souborů:

    Model PDF Obrázek:
    JPEG/JPG, PNG, BMP, TIFF, HEIF
    systém Microsoft Office:
    Word (DOCX), Excel (XLSX), PowerPoint (PPTX) a HTML
    Čteno
    Rozložení ✔ (2024-02-29-preview, 2023-10-31-preview)
    Obecný dokument
    Předpřipravený
    Vlastní extrakce
    Vlastní klasifikace ✔ (29. 2024. 2024)
  • U SOUBORŮ PDF a TIFF je možné zpracovat až 2000 stránek (s předplatným úrovně Free se zpracovávají pouze první dvě stránky).

  • Velikost souboru pro analýzu dokumentů je 500 MB pro placenou úroveň (S0) a 4 MB pro bezplatnou úroveň (F0).

  • Rozměry obrázku musí být mezi 50 x 50 pixelů a 10 000 px x 10 000 pixelů.

  • Pokud jsou soubory PDF uzamčené heslem, musíte před odesláním toto uzamčení odebrat.

  • Minimální výška extrahovaného textu je 12 pixelů pro obrázek o velikosti 1024 x 768 pixelů. Tato dimenze odpovídá 8150 bodům na palec (DPI).

  • Pro trénování vlastního modelu je maximální počet stránek pro trénovací data 500 pro vlastní model šablony a 50 000 pro vlastní neurální model.

    • Pro trénování vlastního modelu extrakce je celková velikost trénovacích dat 50 MB pro model šablony a 1G MB pro neurální model.

    • Pro trénování modelu vlastní klasifikace je 1GB celková velikost trénovacích dat s maximálně 10 000 stránkami.

  • Podporované formáty souborů: JPEG, PNG, PDF a TIFF.

  • Podporovaný počet stránek pro soubory PDF a TIFF: až 2 000 stránek nebo pouze prvních dvou stránek pro předplatitele úrovně Free.

  • Podporovaná velikost souboru: méně než 50 MB TOTAL; minimální pixely: 50 x 50 px; maximálně 10 000 × 10 000 pixelů.

Extrakce dat modelu dokumentů ID

Extrahujte data, včetně jména, data narození a data vypršení platnosti, z dokumentů s ID. Potřebujete následující zdroje informací:

  • Předplatné Azure – můžete si ho zdarma vytvořit.

  • Instance Document Intelligence na webu Azure Portal K vyzkoušení služby můžete použít cenovou úroveň Free (F0). Po nasazení prostředku vyberte Přejít k prostředku a získejte klíč a koncový bod.

Snímek obrazovky s klíči a umístěním koncového bodu na webu Azure Portal

Poznámka:

Document Intelligence Studio je k dispozici s rozhraními API v3.1 a v3.0 a novějšími verzemi.

  1. Na domovské stránce nástroje Document Intelligence Studio vyberte Dokumenty identity.

  2. Ukázkovou fakturu můžete analyzovat nebo nahrát vlastní soubory.

  3. Vyberte tlačítko Spustit analýzu a v případě potřeby nakonfigurujte možnosti Analyzovat:

    Snímek obrazovky s tlačítky Možnosti Spustit analýzu a Analýza v nástroji Document Intelligence Studio

Nástroj Document Intelligence Sample Labeling

  1. Přejděte k nástroji Ukázka funkce Document Intelligence.

  2. Na domovské stránce ukázkového nástroje vyberte k získání dlaždice s daty předem vytvořený model.

    Snímek obrazovky s operací analýzy výsledků modelu rozložení

  3. V rozevírací nabídce vyberte typ formuláře, který chcete analyzovat.

  4. Vyberte adresu URL souboru, který chcete analyzovat, z následujících možností:

  5. V poli Zdroj vyberte adresu URL z rozevírací nabídky, vložte vybranou adresu URL a vyberte tlačítko Načíst.

    Snímek obrazovky s rozevírací nabídkou umístění zdroje

  6. Do pole koncový bod služby Document Intelligence vložte koncový bod, který jste získali s předplatným Document Intelligence.

  7. Do pole s klíčem vložte klíč, který jste získali z prostředku Document Intelligence.

    Snímek obrazovky s rozevírací nabídkou pro výběr typu dokumentu

  8. Vyberte Spustit analýzu. Nástroj Document Intelligence Sample Labeling volá předem připravené rozhraní API pro analýzu a analyzuje dokument.

  9. Prohlédněte si výsledky – prohlédněte si páry klíč-hodnota extrahované, řádkové položky, zvýrazněný text extrahovaný a zjištěné tabulky.

    Snímek obrazovky s operací analýzy výsledků modelu identit

  10. Stáhněte si výstupní soubor JSON a prohlédněte si podrobné výsledky.

    • Uzel ReadResults obsahuje každý řádek textu s příslušným umístěním ohraničujícího pole na stránce.
    • Uzel SelectionMarks zobrazuje všechny značky výběru (zaškrtávací políčko, přepínač) a informace o tom, jestli je jeho stav vybrán nebo nevybraný.
    • Oddíl pageResults obsahuje extrahované tabulky. U každé tabulky funkce Document Intelligence extrahuje text, řádek a index sloupců, řádky a sloupce, které pokrývají, ohraničující pole a další.
    • Pole DocumentResults obsahuje informace o párech klíč/hodnota a informace o položkách řádků pro nejrelevavantnější části dokumentu.

Poznámka:

Nástroj Sample Labeling nepodporuje formát souboru BMP. Jedná se o omezení nástroje, nikoli služby Document Intelligence.

Podporované typy dokumentů

Oblast Typy dokumentů
Celosvětově Passport Book, Passport Card
USA Řidičské průkazy, identifikační karta, povolení rezidence (zelená karta), karta sociálního pojištění, vojenské ID
Evropě Řidičské průkazy, identifikační karta, povolení k pobytu
Indie Řidičské licence, KARTA PAN, Aadhaar Card
Kanada Řidičské průkazy, identifikační karta, povolení rezidence (maple card)
Austrálie Řidič licence, fotokarta, ID klíče-pass (včetně digitální verze)

Extrakce polí

Následuje pole extrahovaná podle typu dokumentu. Model prebuilt-idDocument ID funkce Document Intelligence extrahuje následující pole v objektu documents.*.fields. Výstup JSON obsahuje veškerý extrahovaný text v dokumentech, slova, řádky a styly.

idDocument.driverLicense

Pole Typ Popis Příklad
CountryRegion countryRegion Kód země nebo oblasti USA
Region string Kraj Washington
DocumentNumber string Číslo řidičského průkazu WDLABCD456DG
DocumentDiscriminator string Diskriminátor dokumentu o řidičské licenci 12645646464554646456464544
FirstName string Křestní jméno a střední iniciála, pokud je k dispozici LIAM R.
LastName string Surname TALBOT
Address address Adresa 123 STREET ADDRESS YOUR CITY WA 99999-1234
DateOfBirth date Datum narození 01/06/1958
DateOfExpiration date Datum vypršení platnosti 08/12/2020
DateOfIssue date Datum vydání 08/12/2012
EyeColor string Barva oka Modrý
HairColor string Barva vlasů Červenohnědá
Height string Height 5'11"
Weight string Hmotnost 185LB
Sex string Pohlaví M
Endorsements string Doporučení L
Restrictions string Omezení T
VehicleClassifications string Klasifikace vozidel D

idDocument.passport

Pole Typ Popis Příklad
DocumentNumber string Číslo cestovního pasu 340020013
FirstName string Křestní jméno a střední iniciála, pokud je k dispozici JENNIFER
MiddleName string Jméno mezi zadaným jménem a příjmením REYES
LastName string Surname BROOKS
Aliases array
Aliases.* string Označuje se také jako MAT LIN
DateOfBirth date Datum narození 1. 1. 1980
DateOfExpiration date Datum vypršení platnosti 2019-05-05
DateOfIssue date Datum vydání 2014-05-06
Sex string Pohlaví F
CountryRegion countryRegion Vydávající země nebo organizace USA
DocumentType string Typ dokumentu P
Nationality countryRegion Státní příslušnost USA
PlaceOfBirth string Místo narození MASSACHUSETTS, USA
PlaceOfIssue string Místo problému LISABONSKÉ
IssuingAuthority string Vydávající autorita USA department of State
PersonalNumber string Osobní ID. Ne. A234567893
MachineReadableZone object Zóna čitelné pro stroj (MRZ) P<USABROOKS<<JENNIFER<<<<<<<<<<<<<<<<<<<<<<< 3400200135USA8001014F1905054710000307<715816
MachineReadableZone.FirstName string Křestní jméno a střední iniciála, pokud je k dispozici JENNIFER
MachineReadableZone.LastName string Surname BROOKS
MachineReadableZone.DocumentNumber string Číslo cestovního pasu 340020013
MachineReadableZone.CountryRegion countryRegion Vydávající země nebo organizace USA
MachineReadableZone.Nationality countryRegion Státní příslušnost USA
MachineReadableZone.DateOfBirth date Datum narození 1. 1. 1980
MachineReadableZone.DateOfExpiration date Datum vypršení platnosti 2019-05-05
MachineReadableZone.Sex string Pohlaví F

idDocument.nationalIdentityCard

Pole Typ Popis Příklad
CountryRegion countryRegion Kód země nebo oblasti USA
Region string Kraj Washington
DocumentNumber string Číslo národní průkazu totožnosti WDLABCD456DG
DocumentDiscriminator string Vnitrostátní doklad o průkazu totožnosti – diskriminátor 12645646464554646456464544
FirstName string Křestní jméno a střední iniciála, pokud je k dispozici LIAM R.
LastName string Surname TALBOT
Address address Adresa 123 STREET ADDRESS YOUR CITY WA 99999-1234
DateOfBirth date Datum narození 01/06/1958
DateOfExpiration date Datum vypršení platnosti 08/12/2020
DateOfIssue date Datum vydání 08/12/2012
EyeColor string Barva oka MODRÉ
HairColor string Barva vlasů BROWN
Height string Height 5'11"
Weight string Hmotnost 185LB
Sex string Pohlaví M

idDocument.residencePermit

Pole Typ Popis Příklad
CountryRegion countryRegion Kód země nebo oblasti USA
DocumentNumber string Číslo povolení k pobytu WDLABCD456DG
FirstName string Křestní jméno a střední iniciála, pokud je k dispozici LIAM R.
LastName string Surname TALBOT
DateOfBirth date Datum narození 01/06/1958
DateOfExpiration date Datum vypršení platnosti 08/12/2020
DateOfIssue date Datum vydání 08/12/2012
Sex string Pohlaví M
PlaceOfBirth string Místo narození Německo
Category string Kategorie povolení DV2
Address string Adresa 123 STREET ADDRESS YOUR CITY WA 99999-1234

idDocument.usSocialSecurityCard

Pole Typ Popis Příklad
DocumentNumber string Číslo karty sociálního pojištění WDLABCD456DG
FirstName string Křestní jméno a střední iniciála, pokud je k dispozici LIAM R.
LastName string Surname TALBOT
DateOfIssue date Datum vydání 08/12/2012

idDocument

Pole Typ Popis Příklad
Address address Adresa 123 STREET ADDRESS YOUR CITY WA 99999-1234
DocumentNumber string Číslo řidičského průkazu WDLABCD456DG
FirstName string Křestní jméno a střední iniciála, pokud je k dispozici LIAM R.
LastName string Surname TALBOT
DateOfBirth date Datum narození 01/06/1958
DateOfExpiration date Datum vypršení platnosti 08/12/2020

Podporované typy dokumentů

Model dokumentů ID v současné době podporuje licence na řidiče USA a životopisnou stránku z mezinárodních pasů (s výjimkou víza a dalších cestovních dokladů).

Extrahovaná pole

Name Typ Popis Hodnota
Country country Kód země vyhovující standardu ISO 3166 "USA"
DateOfBirth datum DOB ve formátu RRRR-MM-DD "1980-01-01"
DateOfExpiration datum Datum vypršení platnosti ve formátu RRRR-MM-DD "2019-05-05"
DocumentNumber string Příslušné číslo pasu, číslo řidičského průkazu atd. "340020013"
FirstName string Extrahovaný zadaný název a prostřední iniciála v případě potřeby "JENNIFER"
LastName string Extrahované příjmení "BROOKS"
Státní příslušnost country Kód země vyhovující standardu ISO 3166 "USA"
Pohlaví pohlaví Možné extrahované hodnoty zahrnují "M" "F" "X" "F"
MachineReadableZone objekt Extrahovaný Passport MRZ obsahující dva řádky o 44 znacích "P<USABROOKS<<JENNIFER<<<<<<<<<<<<<<<<<<<<<<< 3400200135USA8001014F1905054710000307<715816"
DocumentType string Typ dokumentu, například Passport, Řidičská licence "passport"
Adresa string Extrahovaná adresa (pouze licence řidiče) "123 STREET ADDRESS YOUR CITY WA 99999-1234"
Oblast string Extrahovaná oblast, stát, provincie atd. (pouze řidičská licence) "Washington"

Průvodce migrací

  • Postupujte podle našeho průvodce migrací Document Intelligence v3.1 a zjistěte, jak používat verzi v3.0 ve vašich aplikacích a pracovních postupech.

Další kroky

  • Zkuste zpracovat vlastní formuláře a dokumenty pomocí nástroje Document Intelligence Sample Labeling.

  • Dokončete rychlý start s funkcí Document Intelligence a začněte vytvářet aplikaci pro zpracování dokumentů ve zvoleném vývojovém jazyce.