Model certifikátu manželství document intelligence
Tento obsah se vztahuje na: v4.0 (Preview)
Model certifikátu OCR (Document Intelligence Marriage Certificate) používá výkonné funkce optického rozpoznávání znaků (OCR) k analýze a extrakci klíčových polí z manželství certifikátů. Certifikáty manželství můžou mít různé formáty a kvalitu, včetně obrázků zachycených telefonem, naskenovaných dokumentů a digitálních souborů PDF. Rozhraní API analyzuje text dokumentu; extrahuje klíčové informace, jako jsou jména manžela, datum emise a místo manželství; a vrátí strukturovanou reprezentaci dat JSON. Model v současné době podporuje formáty dokumentů v angličtině.
Automatizované zpracování certifikátů manželství
Automatizované zpracování certifikátů manželství je proces extrakce klíčových polí z manželství certifikátů. V minulosti se proces analýzy certifikátu manželství dosahuje ručně, a proto je velmi časově náročný. Přesná extrakce klíčových dat z manželství certifikátů je obvykle prvním a jedním z nejdůležitějších kroků v procesu automatizace certifikátu manželství.
Možnosti vývoje
Document Intelligence v4.0 (2024-07-07-31-preview) podporuje následující nástroje, aplikace a knihovny:
Funkce | Zdroje informací | ID modelu |
---|---|---|
prebuilt-marriageCertificate.us | • Document Intelligence Studio • REST API • C# SDK • Python SDK• Java SDK • JavaScript SDK• JavaScript SDK |
prebuilt-marriageCertificate.us |
Požadavky na vstup
Podporované formáty souborů:
Model PDF Obrázek: JPEG/JPG
,PNG
,BMP
,TIFF
,HEIF
systém Microsoft Office:
Word (DOCX
), Excel (XLSX
), PowerPoint (PPTX
), HTMLČteno ✔ ✔ ✔ Rozložení ✔ ✔ ✔ (2024-07-31-preview, 2024-02-29-preview, 2023-10-31-preview) Obecný dokument ✔ ✔ Předpřipravený ✔ ✔ Vlastní extrakce ✔ ✔ Vlastní klasifikace ✔ ✔ ✔ (31. 7. 2024, 2024-02-29-preview) Nejlepšíchvýsledkůch
U SOUBORŮ PDF a TIFF je možné zpracovat až 2 000 stránek (s předplatným úrovně Free se zpracuje pouze první dvě stránky).
Velikost souboru pro analýzu dokumentů je 500 MB pro placenou úroveň (S0) a
4
MB pro bezplatnou úroveň (F0).Rozměry obrázku musí být mezi 50 pixely x 50 pixelů a 10 000 pixelů x 10 000 pixelů.
Pokud jsou soubory PDF uzamčené heslem, musíte před odesláním toto uzamčení odebrat.
Minimální výška extrahovaného textu je 12 pixelů pro obrázek o velikosti 1024 x 768 pixelů. Tato dimenze odpovídá
8
bodě textu na 150 bodů na palec (DPI).Pro trénování vlastního modelu je maximální počet stránek pro trénovací data 500 pro vlastní model šablony a 50 000 pro vlastní neurální model.
Pro trénování vlastního modelu extrakce je celková velikost trénovacích dat 50 MB pro model šablony a
1
GB pro neurální model.Pro trénování modelu vlastní klasifikace je
1
celková velikost trénovacích dat GB s maximálně 10 000 stránkami. Pro verzi 2024-07-31-preview a novější je2
celková velikost trénovacích dat GB s maximálně 10 000 stránkami.
Vyzkoušení extrakce údajů o dokumentech s certifikátem manželství
Pokud chcete zjistit, jak extrakce dat funguje ve službě karet manželství, potřebujete následující zdroje informací:
Předplatné Azure – můžete si ho zdarma vytvořit.
Instance Document Intelligence na webu Azure Portal K vyzkoušení služby můžete použít cenovou úroveň Free (
F0
). Po nasazení prostředku vyberte Přejít k prostředku a získejte klíč a koncový bod.
Document Intelligence Studio
Na domovské stránce nástroje Document Intelligence Studio vyberte Certifikát manželství.
Můžete analyzovat ukázkové certifikáty manželství nebo nahrát vlastní soubory.
Vyberte tlačítko Spustit analýzu a v případě potřeby nakonfigurujte možnosti Analyzovat:
Podporované jazyky a národní prostředí
Úplný seznam podporovaných jazyků najdete na stránce podpory jazyků – předem připravená stránka modelů .
Extrakce polí
Následuje pole extrahovaná z manželství certifikátu ve výstupní odpovědi JSON.
Name | Typ | Popis | Příklad výstupu |
---|---|---|---|
Spouse1FirstName |
String | Jméno manžela 1 | Wesley |
Spouse1MiddleName |
String | Křestní jméno manžela 1 | M. |
Spouse1LastName |
String | Příjmení manžela 1 | Hruškový mošt |
Spouse1Age |
Celé číslo | Věk manžela 1 | 26 |
Spouse1BirthDate |
Datum | Datum narození manžela 1 | 16. listopadu 1997 |
Spouse1Address |
Adresa | Adresa manžela 1 | 4292 Don Jackson Lane, Bloomfield Township, Michigan 48302 |
Spouse1BirthPlace |
String | Rodný místo manžela 1 | Michigan |
Spouse2FirstName |
String | Jméno manžela 2 | Beth |
Spouse2MiddleName |
String | Křestní jméno manžela 2 | R. |
Spouse2LastName |
String | Příjmení manžela 2 | Zedník |
Spouse2Age |
Celé číslo | Věk manžela 2 | 23 |
Spouse2BirthDate |
Datum | Datum narození manžela 2 | 22. července 2000 |
Spouse2Address |
Adresa | Adresa manžela 2 | 2671 Comfort Court, Madison, Wisconsin 53704 |
Spouse2BirthPlace |
String | Rodný místo manžela 2 | Wisconsin |
DocumentNumber |
String | Číslo dokumentu | 01976/202 |
IssueDate |
Datum | Datum vydání certifikátu | 10. října 2023 |
IssuePlace |
String | Místo vystavení certifikátu | 2398 Echo Lane, Hastings, Michigan 49058 |
MarriageDate |
Datum | Datum manželství | 10. října 2023 |
MarriagePlace |
String | Místo manželství | 105 Coal Street, Galloway, Wisconsin 54432 |
Páry klíč-hodnota certifikátu manželství a řádkové položky extrahované jsou v documentResults
části výstupu JSON.
Další kroky
Zkuste pomocí nástroje Document Intelligence Studio zpracovat vlastní formuláře a dokumenty.
Dokončete rychlý start s funkcí Document Intelligence a začněte vytvářet aplikaci pro zpracování dokumentů ve zvoleném vývojovém jazyce.