Model dokumentu ID funkce Document Intelligence
Důležité
- Verze Document Intelligence ve verzi Public Preview poskytují dřívější přístup k funkcím, které jsou aktivní ve vývoji. Funkce, přístupy a procesy se můžou před obecnou dostupností (GA) změnit na základě zpětné vazby uživatelů.
- Verze Public Preview klientských knihoven Document Intelligence je výchozí pro rozhraní REST API verze 2024-07-31-preview.
- Verze Public Preview 2024-07-31-preview je aktuálně dostupná jenom v následujících oblastech Azure. Všimněte si, že vlastní model generování (extrakce polí dokumentu) v AI Studiu je k dispozici pouze v oblasti USA – středosever:
- USA – východ
- USA – západ 2
- Západní Evropa
- USA – středosever
Tento obsah se vztahuje na: v4.0 (Preview) | Předchozí verze: v3.1 (GA) v3.0 (GA) v2.1 (GA)
Tento obsah se vztahuje na: v3.1 (GA) | Nejnovější verze: v4.0 (Preview) | Předchozí verze: v3.0 v2.1
Tento obsah se vztahuje na: v3.0 (GA) | Nejnovější verze: v4.0 (Preview) v3.1 | Předchozí verze: v2.1
Tento obsah se vztahuje na: v2.1 | Nejnovější verze: v4.0 (Preview)
Model dokumentu Document Intelligence Identity (ID) kombinuje optické rozpoznávání znaků (OCR) s modely hloubkového učení za účelem analýzy a extrakce klíčových informací z dokumentů identit. Rozhraní API analyzuje dokumenty identit (včetně následujících) a vrací strukturovanou reprezentaci dat JSON:
- Cestovní pas, cestovní karta po celém světě
- Řidičská licence z USA, Evropy, Indie, Kanady a Austrálie
- USA identifikační karty, povolení k pobytu (zelená karta), karta sociálního pojištění, vojenské ID
- Evropské identifikační karty, povolení k pobytu
- Karta PAN Indie, karta Aadhaar
- Identifikační karty Kanady, povolení k pobytu (maple card)
- Austrálie fotokarta, klíč-pass ID (včetně digitální verze)
Funkce Document Intelligence dokáže analyzovat a extrahovat informace z identifikačních dokumentů vydaných státní správou pomocí předem vytvořeného modelu ID. Kombinuje naše výkonné funkce optického rozpoznávání znaků (OCR) s funkcemi rozpoznávání ID k extrakci klíčových informací z globálních pasů a uživatelských licencí (všech 50 států a D.C.). Rozhraní API ID extrahuje klíčové informace z těchto dokumentů identity, jako je jméno, příjmení, datum narození, číslo dokumentu a další. Toto rozhraní API je k dispozici ve funkci Document Intelligence verze 2.1 jako cloudová služba.
Zpracování dokumentů identit
Zpracování dokumentů identity zahrnuje extrakci dat z dokumentů identity buď ručně, nebo pomocí technologie založené na technologii OCR. Zpracování dokumentu ID je důležitým krokem v každé obchodní operaci, která vyžaduje doklad o identitě. Mezi příklady patří ověření zákazníků v bankách a dalších finančních institucích, hypotékách, lékařských návštěvách, zpracování nároků, pohostinství a další. Jednotlivci poskytují doklad o své totožnosti prostřednictvím řidičských licencí, pasů a dalších podobných dokumentů, aby je firma mohla efektivně ověřit před poskytováním služeb a výhod.
Ukázková licence ovladače pro USA zpracovaná pomocí nástroje Document Intelligence Studio
Extrakce dat
Předem připravená služba ID extrahuje klíčové hodnoty z globálních pasů a licencí obchodních faktorů USA a vrací je v uspořádané strukturované odpovědi JSON.
Příklad řidičského průkazu
Příklad passportu
Možnosti vývoje
Document Intelligence v4.0 (2024-07-07-31-preview) podporuje následující nástroje, aplikace a knihovny:
Funkce | Zdroje informací | ID modelu |
---|---|---|
Model dokumentu ID | • Document Intelligence Studio • REST API • C# SDK • Python SDK• Java SDK • JavaScript SDK• JavaScript SDK |
prebuilt-idDocument |
Document Intelligence v3.1 podporuje následující nástroje, aplikace a knihovny:
Funkce | Zdroje informací | ID modelu |
---|---|---|
Model dokumentu ID | • Document Intelligence Studio • REST API • C# SDK • Python SDK• Java SDK • JavaScript SDK• JavaScript SDK |
prebuilt-idDocument |
Document Intelligence v3.0 podporuje následující nástroje, aplikace a knihovny:
Funkce | Zdroje informací | ID modelu |
---|---|---|
Model dokumentu ID | • Document Intelligence Studio • REST API • C# SDK • Python SDK• Java SDK • JavaScript SDK• JavaScript SDK |
prebuilt-idDocument |
Document Intelligence v2.1 podporuje následující nástroje, aplikace a knihovny:
Funkce | Zdroje informací |
---|---|
Model dokumentu ID | • Nástroj pro popisování document intelligence• REST API • sada SDK klientské knihovny• Kontejner Document Intelligence Dockeru |
Požadavky na vstup
Podporované formáty souborů:
Model PDF Obrázek: JPEG/JPG
,PNG
,BMP
,TIFF
,HEIF
systém Microsoft Office:
Word (DOCX
), Excel (XLSX
), PowerPoint (PPTX
), HTMLČteno ✔ ✔ ✔ Rozložení ✔ ✔ ✔ (2024-07-31-preview, 2024-02-29-preview, 2023-10-31-preview) Obecný dokument ✔ ✔ Předpřipravený ✔ ✔ Vlastní extrakce ✔ ✔ Vlastní klasifikace ✔ ✔ ✔ (31. 7. 2024, 2024-02-29-preview) Nejlepšíchvýsledkůch
U SOUBORŮ PDF a TIFF je možné zpracovat až 2 000 stránek (s předplatným úrovně Free se zpracuje pouze první dvě stránky).
Velikost souboru pro analýzu dokumentů je 500 MB pro placenou úroveň (S0) a
4
MB pro bezplatnou úroveň (F0).Rozměry obrázku musí být mezi 50 pixely x 50 pixelů a 10 000 pixelů x 10 000 pixelů.
Pokud jsou soubory PDF uzamčené heslem, musíte před odesláním toto uzamčení odebrat.
Minimální výška extrahovaného textu je 12 pixelů pro obrázek o velikosti 1024 x 768 pixelů. Tato dimenze odpovídá
8
bodě textu na 150 bodů na palec (DPI).Pro trénování vlastního modelu je maximální počet stránek pro trénovací data 500 pro vlastní model šablony a 50 000 pro vlastní neurální model.
Pro trénování vlastního modelu extrakce je celková velikost trénovacích dat 50 MB pro model šablony a
1
GB pro neurální model.Pro trénování modelu vlastní klasifikace je
1
celková velikost trénovacích dat GB s maximálně 10 000 stránkami. Pro verzi 2024-07-31-preview a novější je2
celková velikost trénovacích dat GB s maximálně 10 000 stránkami.
Podporované formáty souborů: JPEG, PNG, PDF a TIFF.
Podporovaný počet stránek pro soubory PDF a TIFF: až 2 000 stránek nebo pouze prvních dvou stránek pro předplatitele úrovně Free.
Podporovaná velikost souboru: méně než 50 MB TOTAL; minimální pixely: 50 x 50 px; maximálně 10 000 × 10 000 pixelů.
Extrakce dat modelu dokumentů ID
Extrahujte data, včetně jména, data narození a data vypršení platnosti, z dokumentů s ID. Potřebujete následující zdroje informací:
Předplatné Azure – můžete si ho zdarma vytvořit.
Instance Document Intelligence na webu Azure Portal K vyzkoušení služby můžete použít cenovou úroveň Free (
F0
). Po nasazení prostředku vyberte Přejít k prostředku a získejte klíč a koncový bod.
Poznámka:
Document Intelligence Studio je k dispozici s rozhraními API v3.1 a v3.0 a novějšími verzemi.
Na domovské stránce nástroje Document Intelligence Studio vyberte Dokumenty identity.
Ukázkovou fakturu můžete analyzovat nebo nahrát vlastní soubory.
Vyberte tlačítko Spustit analýzu a v případě potřeby nakonfigurujte možnosti Analyzovat:
Nástroj Document Intelligence Sample Labeling
Přejděte k nástroji Ukázka funkce Document Intelligence.
Na domovské stránce ukázkového nástroje vyberte k získání dlaždice s daty předem vytvořený model.
V rozevírací nabídce vyberte typ formuláře, který chcete analyzovat.
Vyberte adresu URL souboru, který chcete analyzovat, z následujících možností:
- Ukázkový dokument faktury
- Ukázkový dokument s ID
- Ukázkový obrázek potvrzení
- Ukázkový obrázek vizitky
V poli Zdroj vyberte adresu URL z rozevírací nabídky, vložte vybranou adresu URL a vyberte tlačítko Načíst.
Do pole koncový bod služby Document Intelligence vložte koncový bod, který jste získali s předplatným Document Intelligence.
Do pole s klíčem vložte klíč, který jste získali z prostředku Document Intelligence.
Vyberte Spustit analýzu. Nástroj Document Intelligence Sample Labeling volá předem připravené rozhraní API pro analýzu a analyzuje dokument.
Prohlédněte si výsledky – prohlédněte si páry klíč-hodnota extrahované, řádkové položky, zvýrazněný text extrahovaný a zjištěné tabulky.
Stáhněte si výstupní soubor JSON a prohlédněte si podrobné výsledky.
- Uzel ReadResults obsahuje každý řádek textu s příslušným umístěním ohraničujícího pole na stránce.
- Uzel SelectionMarks zobrazuje všechny značky výběru (zaškrtávací políčko, přepínač) a informace o tom, jestli je jeho stav vybrán nebo nevybraný.
- Oddíl pageResults obsahuje extrahované tabulky. U každé tabulky funkce Document Intelligence extrahuje text, řádek a index sloupců, řádky a sloupce, které pokrývají, ohraničující pole a další.
- Pole DocumentResults obsahuje informace o párech klíč/hodnota a informace o položkách řádků pro nejrelevavantnější části dokumentu.
Poznámka:
Nástroj Sample Labeling nepodporuje formát souboru BMP. Jedná se o omezení nástroje, nikoli služby Document Intelligence.
Podporované typy dokumentů
Oblast | Typy dokumentů |
---|---|
Celosvětově | Passport Book, Passport Card |
USA | Řidičské průkazy, identifikační karta, povolení rezidence (zelená karta), karta sociálního pojištění, vojenské ID |
Evropě | Řidičské průkazy, identifikační karta, povolení k pobytu |
Indie | Řidičské licence, KARTA PAN, Aadhaar Card |
Kanada | Řidičské průkazy, identifikační karta, povolení rezidence (maple card) |
Austrálie | Řidič licence, fotokarta, ID klíče-pass (včetně digitální verze) |
Extrakce polí
Podporovaná pole pro extrakci dokumentů najdete na stránce schématu modelu dokumentu ID v našem ukázkovém úložišti GitHubu.
Podporované typy dokumentů
Model dokumentů ID v současné době podporuje licence na řidiče USA a životopisnou stránku z mezinárodních pasů (s výjimkou víza a dalších cestovních dokladů).
Extrahovaná pole
Name | Typ | Popis | Hodnota |
---|---|---|---|
Country | country | Kód země vyhovující standardu ISO 3166 | "USA" |
DateOfBirth | datum | DOB ve formátu RRRR-MM-DD | "1980-01-01" |
DateOfExpiration | datum | Datum vypršení platnosti ve formátu RRRR-MM-DD | "2019-05-05" |
DocumentNumber | string | Příslušné číslo pasu, číslo řidičského průkazu atd. | "340020013" |
FirstName | string | Extrahovaný zadaný název a prostřední iniciála v případě potřeby | "JENNIFER" |
LastName | string | Extrahované příjmení | "BROOKS" |
Státní příslušnost | country | Kód země vyhovující standardu ISO 3166 | "USA" |
Pohlaví | pohlaví | Možné extrahované hodnoty zahrnují "M" "F" "X" | "F" |
MachineReadableZone | objekt | Extrahovaný Passport MRZ obsahující dva řádky o 44 znacích |
"P<USABROOKS<<JENNIFER<<<<<<<<<<<<<<<<<<<<<<< 3400200135USA8001014F1905054710000307<715816" |
DocumentType | string | Typ dokumentu, například Passport, Řidičská licence | "passport" |
Adresa | string | Extrahovaná adresa (pouze licence řidiče) | "123 STREET ADDRESS YOUR CITY WA 99999-1234" |
Oblast | string | Extrahovaná oblast, stát, provincie atd. (pouze řidičská licence) | "Washington" |
Průvodce migrací
- Postupujte podle našeho průvodce migrací Document Intelligence v3.1 a zjistěte, jak používat verzi v3.0 ve vašich aplikacích a pracovních postupech.
Další kroky
Zkuste pomocí nástroje Document Intelligence Studio zpracovat vlastní formuláře a dokumenty.
Dokončete rychlý start s funkcí Document Intelligence a začněte vytvářet aplikaci pro zpracování dokumentů ve zvoleném vývojovém jazyce.
Zkuste zpracovat vlastní formuláře a dokumenty pomocí nástroje Document Intelligence Sample Labeling.
Dokončete rychlý start s funkcí Document Intelligence a začněte vytvářet aplikaci pro zpracování dokumentů ve zvoleném vývojovém jazyce.