Model certifikátu manželství document intelligence

Tento obsah se vztahuje na:Zaškrtnutív4.0 (Preview)Zaškrtnutí

Model certifikátu OCR (Document Intelligence Marriage Certificate) používá výkonné funkce optického rozpoznávání znaků (OCR) k analýze a extrakci klíčových polí z manželství certifikátů. Certifikáty manželství můžou mít různé formáty a kvalitu, včetně obrázků zachycených telefonem, naskenovaných dokumentů a digitálních souborů PDF. Rozhraní API analyzuje text dokumentu; extrahuje klíčové informace, jako jsou jména manžela, datum emise a místo manželství; a vrátí strukturovanou reprezentaci dat JSON. Model v současné době podporuje formáty dokumentů v angličtině.

Automatizované zpracování certifikátů manželství

Automatizované zpracování certifikátů manželství je proces extrakce klíčových polí z manželství certifikátů. V minulosti se proces analýzy certifikátu manželství dosahuje ručně, a proto je velmi časově náročný. Přesná extrakce klíčových dat z manželství certifikátů je obvykle prvním a jedním z nejdůležitějších kroků v procesu automatizace certifikátu manželství.

Možnosti vývoje

Document Intelligence v4.0 (2024-02-02-29-preview) podporuje následující nástroje, aplikace a knihovny:

Funkce Zdroje informací ID modelu
prebuilt-marriageCertificate.us Document Intelligence Studio
REST API
C# SDK
Python SDK• Java SDK
• JavaScript SDK• JavaScript SDK
prebuilt-marriageCertificate.us

Požadavky na vstup

  • Nejlepšíchvýsledkůch

  • Podporované formáty souborů:

    Model PDF Obrázek:
    JPEG/JPG, PNG, BMP, TIFF, HEIF
    systém Microsoft Office:
    Word (DOCX), Excel (XLSX), PowerPoint (PPTX) a HTML
    Čteno
    Rozložení ✔ (2024-02-29-preview, 2023-10-31-preview)
    Obecný dokument
    Předpřipravený
    Vlastní extrakce
    Vlastní klasifikace ✔ (29. 2024. 2024)
  • U SOUBORŮ PDF a TIFF je možné zpracovat až 2000 stránek (s předplatným úrovně Free se zpracovávají pouze první dvě stránky).

  • Velikost souboru pro analýzu dokumentů je 500 MB pro placenou úroveň (S0) a 4 MB pro bezplatnou úroveň (F0).

  • Rozměry obrázku musí být mezi 50 x 50 pixelů a 10 000 px x 10 000 pixelů.

  • Pokud jsou soubory PDF uzamčené heslem, musíte před odesláním toto uzamčení odebrat.

  • Minimální výška extrahovaného textu je 12 pixelů pro obrázek o velikosti 1024 x 768 pixelů. Tato dimenze odpovídá 8150 bodům na palec (DPI).

  • Pro trénování vlastního modelu je maximální počet stránek pro trénovací data 500 pro vlastní model šablony a 50 000 pro vlastní neurální model.

    • Pro trénování vlastního modelu extrakce je celková velikost trénovacích dat 50 MB pro model šablony a 1G MB pro neurální model.

    • Pro trénování modelu vlastní klasifikace je 1GB celková velikost trénovacích dat s maximálně 10 000 stránkami.

Vyzkoušení extrakce údajů o dokumentech s certifikátem manželství

Pokud chcete zjistit, jak extrakce dat funguje ve službě karet manželství, potřebujete následující zdroje informací:

  • Předplatné Azure – můžete si ho zdarma vytvořit.

  • Instance Document Intelligence na webu Azure Portal K vyzkoušení služby můžete použít cenovou úroveň Free (F0). Po nasazení prostředku vyberte Přejít k prostředku a získejte klíč a koncový bod.

Snímek obrazovky s klíči a umístěním koncového bodu na webu Azure Portal

Document Intelligence Studio

  1. Na domovské stránce nástroje Document Intelligence Studio vyberte Certifikát manželství.

  2. Můžete analyzovat ukázkové certifikáty manželství nebo nahrát vlastní soubory.

  3. Vyberte tlačítko Spustit analýzu a v případě potřeby nakonfigurujte možnosti Analyzovat:

    Snímek obrazovky s tlačítky Možnosti Spustit analýzu a Analýza v nástroji Document Intelligence Studio

Podporované jazyky a národní prostředí

Úplný seznam podporovaných jazyků najdete na stránce podpory jazyků – předem připravená stránka modelů .

Extrakce polí

Následuje pole extrahovaná z manželství certifikátu ve výstupní odpovědi JSON.

Name Typ Popis Příklad výstupu
Spouse1FirstName String Jméno manžela 1 Wesley
Spouse1MiddleName String Křestní jméno manžela 1 M.
Spouse1LastName String Příjmení manžela 1 Perry
Spouse1Age Celé číslo Věk manžela 1 26
Spouse1BirthDate Datum Datum narození manžela 1 16. listopadu 1997
Spouse1Address Adresa Adresa manžela 1 4292 Don Jackson Lane, Bloomfield Township, Michigan 48302
Spouse1BirthPlace String Rodný místo manžela 1 Michigan
Spouse2FirstName String Jméno manžela 2 Beth
Spouse2MiddleName String Křestní jméno manžela 2 R.
Spouse2LastName String Příjmení manžela 2 Mason
Spouse2Age Celé číslo Věk manžela 2 23
Spouse2BirthDate Datum Datum narození manžela 2 22. července 2000
Spouse2Address Adresa Adresa manžela 2 2671 Comfort Court, Madison, Wisconsin 53704
Spouse2BirthPlace String Rodný místo manžela 2 Wisconsin
DocumentNumber String Číslo dokumentu 01976/202
IssueDate Datum Datum vydání certifikátu 10. října 2023
IssuePlace String Místo vystavení certifikátu 2398 Echo Lane, Hastings, Michigan 49058
MarriageDate Datum Datum manželství 10. října 2023
MarriagePlace String Místo manželství 105 Coal Street, Galloway, Wisconsin 54432

Páry klíč-hodnota certifikátu manželství a řádkové položky extrahované jsou v documentResults části výstupu JSON.

Další kroky