Sdílet prostřednictvím


Model dokumentu ID funkce Document Intelligence

Důležité

  • Verze Document Intelligence ve verzi Public Preview poskytují dřívější přístup k funkcím, které jsou aktivní ve vývoji. Funkce, přístupy a procesy se můžou před obecnou dostupností (GA) změnit na základě zpětné vazby uživatelů.
  • Verze Public Preview klientských knihoven Document Intelligence je výchozí pro rozhraní REST API verze 2024-07-31-preview.
  • Verze Public Preview 2024-07-31-preview je aktuálně dostupná jenom v následujících oblastech Azure. Všimněte si, že vlastní model generování (extrakce polí dokumentu) v AI Studiu je k dispozici pouze v oblasti USA – středosever:
    • USA – východ
    • USA – západ 2
    • Západní Evropa
    • USA – středosever

Tento obsah se vztahuje na: Zaškrtnutí v4.0 (Preview) | Předchozí verze: modrá značka zaškrtnutí v3.1 (GA) v3.0 (GA) modrá značka zaškrtnutí modrá značka zaškrtnutí v2.1 (GA)

Tento obsah se vztahuje na: Zaškrtnutí v3.1 (GA) | Nejnovější verze: nachová značka zaškrtnutí v4.0 (Preview) | Předchozí verze: modrá značka zaškrtnutí v3.0modrá značka zaškrtnutí v2.1

Tento obsah se vztahuje na:Zaškrtnutí v3.0 (GA) | Nejnovější verze: nachová značka zaškrtnutí v4.0 (Preview) nachová značka zaškrtnutív3.1 | Předchozí verze: modrá značka zaškrtnutí v2.1

Tento obsah se vztahuje na: Zaškrtnutí v2.1 | Nejnovější verze: modrá značka zaškrtnutí v4.0 (Preview)

Model dokumentu Document Intelligence Identity (ID) kombinuje optické rozpoznávání znaků (OCR) s modely hloubkového učení za účelem analýzy a extrakce klíčových informací z dokumentů identit. Rozhraní API analyzuje dokumenty identit (včetně následujících) a vrací strukturovanou reprezentaci dat JSON:

  • Cestovní pas, cestovní karta po celém světě
  • Řidičská licence z USA, Evropy, Indie, Kanady a Austrálie
  • USA identifikační karty, povolení k pobytu (zelená karta), karta sociálního pojištění, vojenské ID
  • Evropské identifikační karty, povolení k pobytu
  • Karta PAN Indie, karta Aadhaar
  • Identifikační karty Kanady, povolení k pobytu (maple card)
  • Austrálie fotokarta, klíč-pass ID (včetně digitální verze)

Funkce Document Intelligence dokáže analyzovat a extrahovat informace z identifikačních dokumentů vydaných státní správou pomocí předem vytvořeného modelu ID. Kombinuje naše výkonné funkce optického rozpoznávání znaků (OCR) s funkcemi rozpoznávání ID k extrakci klíčových informací z globálních pasů a uživatelských licencí (všech 50 států a D.C.). Rozhraní API ID extrahuje klíčové informace z těchto dokumentů identity, jako je jméno, příjmení, datum narození, číslo dokumentu a další. Toto rozhraní API je k dispozici ve funkci Document Intelligence verze 2.1 jako cloudová služba.

Zpracování dokumentů identit

Zpracování dokumentů identity zahrnuje extrakci dat z dokumentů identity buď ručně, nebo pomocí technologie založené na technologii OCR. Zpracování dokumentu ID je důležitým krokem v každé obchodní operaci, která vyžaduje doklad o identitě. Mezi příklady patří ověření zákazníků v bankách a dalších finančních institucích, hypotékách, lékařských návštěvách, zpracování nároků, pohostinství a další. Jednotlivci poskytují doklad o své totožnosti prostřednictvím řidičských licencí, pasů a dalších podobných dokumentů, aby je firma mohla efektivně ověřit před poskytováním služeb a výhod.

Ukázková licence ovladače pro USA zpracovaná pomocí nástroje Document Intelligence Studio

Obrázek licence ukázkového řidiče

Extrakce dat

Předem připravená služba ID extrahuje klíčové hodnoty z globálních pasů a licencí obchodních faktorů USA a vrací je v uspořádané strukturované odpovědi JSON.

Příklad řidičského průkazu

Vzorová řidičská licence

Příklad passportu

Ukázkový passport

Možnosti vývoje

Document Intelligence v4.0 (2024-07-07-31-preview) podporuje následující nástroje, aplikace a knihovny:

Funkce Zdroje informací ID modelu
Model dokumentu ID Document Intelligence Studio
REST API
C# SDK
Python SDK• Java SDK
• JavaScript SDK• JavaScript SDK
prebuilt-idDocument

Document Intelligence v3.1 podporuje následující nástroje, aplikace a knihovny:

Funkce Zdroje informací ID modelu
Model dokumentu ID Document Intelligence Studio
REST API
C# SDK
Python SDK• Java SDK
• JavaScript SDK• JavaScript SDK
prebuilt-idDocument

Document Intelligence v3.0 podporuje následující nástroje, aplikace a knihovny:

Funkce Zdroje informací ID modelu
Model dokumentu ID Document Intelligence Studio
REST API
C# SDK
Python SDK• Java SDK
• JavaScript SDK• JavaScript SDK
prebuilt-idDocument

Document Intelligence v2.1 podporuje následující nástroje, aplikace a knihovny:

Funkce Zdroje informací
Model dokumentu ID Nástroj pro
popisování document intelligence• REST API
sada SDK
klientské knihovny• Kontejner Document Intelligence Dockeru

Požadavky na vstup

  • Podporované formáty souborů:

    Model PDF Obrázek:
    JPEG/JPG, PNG, BMP, TIFF, HEIF
    systém Microsoft Office:
    Word (DOCX), Excel (XLSX), PowerPoint (PPTX), HTML
    Čteno
    Rozložení ✔ (2024-07-31-preview, 2024-02-29-preview, 2023-10-31-preview)
    Obecný dokument
    Předpřipravený
    Vlastní extrakce
    Vlastní klasifikace ✔ (31. 7. 2024, 2024-02-29-preview)
  • Nejlepšíchvýsledkůch

  • U SOUBORŮ PDF a TIFF je možné zpracovat až 2 000 stránek (s předplatným úrovně Free se zpracuje pouze první dvě stránky).

  • Velikost souboru pro analýzu dokumentů je 500 MB pro placenou úroveň (S0) a 4 MB pro bezplatnou úroveň (F0).

  • Rozměry obrázku musí být mezi 50 pixely x 50 pixelů a 10 000 pixelů x 10 000 pixelů.

  • Pokud jsou soubory PDF uzamčené heslem, musíte před odesláním toto uzamčení odebrat.

  • Minimální výška extrahovaného textu je 12 pixelů pro obrázek o velikosti 1024 x 768 pixelů. Tato dimenze odpovídá 8 bodě textu na 150 bodů na palec (DPI).

  • Pro trénování vlastního modelu je maximální počet stránek pro trénovací data 500 pro vlastní model šablony a 50 000 pro vlastní neurální model.

    • Pro trénování vlastního modelu extrakce je celková velikost trénovacích dat 50 MB pro model šablony a 1 GB pro neurální model.

    • Pro trénování modelu vlastní klasifikace je 1 celková velikost trénovacích dat GB s maximálně 10 000 stránkami. Pro verzi 2024-07-31-preview a novější je 2 celková velikost trénovacích dat GB s maximálně 10 000 stránkami.

  • Podporované formáty souborů: JPEG, PNG, PDF a TIFF.

  • Podporovaný počet stránek pro soubory PDF a TIFF: až 2 000 stránek nebo pouze prvních dvou stránek pro předplatitele úrovně Free.

  • Podporovaná velikost souboru: méně než 50 MB TOTAL; minimální pixely: 50 x 50 px; maximálně 10 000 × 10 000 pixelů.

Extrakce dat modelu dokumentů ID

Extrahujte data, včetně jména, data narození a data vypršení platnosti, z dokumentů s ID. Potřebujete následující zdroje informací:

  • Předplatné Azure – můžete si ho zdarma vytvořit.

  • Instance Document Intelligence na webu Azure Portal K vyzkoušení služby můžete použít cenovou úroveň Free (F0). Po nasazení prostředku vyberte Přejít k prostředku a získejte klíč a koncový bod.

Snímek obrazovky s klíči a umístěním koncového bodu na webu Azure Portal

Poznámka:

Document Intelligence Studio je k dispozici s rozhraními API v3.1 a v3.0 a novějšími verzemi.

  1. Na domovské stránce nástroje Document Intelligence Studio vyberte Dokumenty identity.

  2. Ukázkovou fakturu můžete analyzovat nebo nahrát vlastní soubory.

  3. Vyberte tlačítko Spustit analýzu a v případě potřeby nakonfigurujte možnosti Analyzovat:

    Snímek obrazovky s tlačítky Možnosti Spustit analýzu a Analýza v nástroji Document Intelligence Studio

Nástroj Document Intelligence Sample Labeling

  1. Přejděte k nástroji Ukázka funkce Document Intelligence.

  2. Na domovské stránce ukázkového nástroje vyberte k získání dlaždice s daty předem vytvořený model.

    Snímek obrazovky s operací analýzy výsledků modelu rozložení

  3. V rozevírací nabídce vyberte typ formuláře, který chcete analyzovat.

  4. Vyberte adresu URL souboru, který chcete analyzovat, z následujících možností:

  5. V poli Zdroj vyberte adresu URL z rozevírací nabídky, vložte vybranou adresu URL a vyberte tlačítko Načíst.

    Snímek obrazovky s rozevírací nabídkou umístění zdroje

  6. Do pole koncový bod služby Document Intelligence vložte koncový bod, který jste získali s předplatným Document Intelligence.

  7. Do pole s klíčem vložte klíč, který jste získali z prostředku Document Intelligence.

    Snímek obrazovky s rozevírací nabídkou pro výběr typu dokumentu

  8. Vyberte Spustit analýzu. Nástroj Document Intelligence Sample Labeling volá předem připravené rozhraní API pro analýzu a analyzuje dokument.

  9. Prohlédněte si výsledky – prohlédněte si páry klíč-hodnota extrahované, řádkové položky, zvýrazněný text extrahovaný a zjištěné tabulky.

    Snímek obrazovky s operací analýzy výsledků modelu identit

  10. Stáhněte si výstupní soubor JSON a prohlédněte si podrobné výsledky.

    • Uzel ReadResults obsahuje každý řádek textu s příslušným umístěním ohraničujícího pole na stránce.
    • Uzel SelectionMarks zobrazuje všechny značky výběru (zaškrtávací políčko, přepínač) a informace o tom, jestli je jeho stav vybrán nebo nevybraný.
    • Oddíl pageResults obsahuje extrahované tabulky. U každé tabulky funkce Document Intelligence extrahuje text, řádek a index sloupců, řádky a sloupce, které pokrývají, ohraničující pole a další.
    • Pole DocumentResults obsahuje informace o párech klíč/hodnota a informace o položkách řádků pro nejrelevavantnější části dokumentu.

Poznámka:

Nástroj Sample Labeling nepodporuje formát souboru BMP. Jedná se o omezení nástroje, nikoli služby Document Intelligence.

Podporované typy dokumentů

Oblast Typy dokumentů
Celosvětově Passport Book, Passport Card
USA Řidičské průkazy, identifikační karta, povolení rezidence (zelená karta), karta sociálního pojištění, vojenské ID
Evropě Řidičské průkazy, identifikační karta, povolení k pobytu
Indie Řidičské licence, KARTA PAN, Aadhaar Card
Kanada Řidičské průkazy, identifikační karta, povolení rezidence (maple card)
Austrálie Řidič licence, fotokarta, ID klíče-pass (včetně digitální verze)

Extrakce polí

Podporovaná pole pro extrakci dokumentů najdete na stránce schématu modelu dokumentu ID v našem ukázkovém úložišti GitHubu.

Podporované typy dokumentů

Model dokumentů ID v současné době podporuje licence na řidiče USA a životopisnou stránku z mezinárodních pasů (s výjimkou víza a dalších cestovních dokladů).

Extrahovaná pole

Name Typ Popis Hodnota
Country country Kód země vyhovující standardu ISO 3166 "USA"
DateOfBirth datum DOB ve formátu RRRR-MM-DD "1980-01-01"
DateOfExpiration datum Datum vypršení platnosti ve formátu RRRR-MM-DD "2019-05-05"
DocumentNumber string Příslušné číslo pasu, číslo řidičského průkazu atd. "340020013"
FirstName string Extrahovaný zadaný název a prostřední iniciála v případě potřeby "JENNIFER"
LastName string Extrahované příjmení "BROOKS"
Státní příslušnost country Kód země vyhovující standardu ISO 3166 "USA"
Pohlaví pohlaví Možné extrahované hodnoty zahrnují "M" "F" "X" "F"
MachineReadableZone objekt Extrahovaný Passport MRZ obsahující dva řádky o 44 znacích "P<USABROOKS<<JENNIFER<<<<<<<<<<<<<<<<<<<<<<< 3400200135USA8001014F1905054710000307<715816"
DocumentType string Typ dokumentu, například Passport, Řidičská licence "passport"
Adresa string Extrahovaná adresa (pouze licence řidiče) "123 STREET ADDRESS YOUR CITY WA 99999-1234"
Oblast string Extrahovaná oblast, stát, provincie atd. (pouze řidičská licence) "Washington"

Průvodce migrací

  • Postupujte podle našeho průvodce migrací Document Intelligence v3.1 a zjistěte, jak používat verzi v3.0 ve vašich aplikacích a pracovních postupech.

Další kroky

  • Zkuste zpracovat vlastní formuláře a dokumenty pomocí nástroje Document Intelligence Sample Labeling.

  • Dokončete rychlý start s funkcí Document Intelligence a začněte vytvářet aplikaci pro zpracování dokumentů ve zvoleném vývojovém jazyce.