Dela via


Modell för äktenskapscertifikat för dokumentinformation

Det här innehållet gäller för:Bockmarkeringv4.0 (förhandsversion)Bockmarkering

Modellen för äktenskapscertifikat för dokumentinformation använder kraftfulla OCR-funktioner (Optisk teckenigenkänning) för att analysera och extrahera nyckelfält från äktenskapscertifikat. Äktenskapscertifikat kan ha olika format och kvalitet, inklusive telefonbilder, skannade dokument och digitala PDF-filer. API:et analyserar dokumenttext; extraherar viktig information som namn på make/maka, utfärdandedatum och äktenskapsplats; och returnerar en strukturerad JSON-datarepresentation. Modellen stöder för närvarande engelskspråkiga dokumentformat.

Automatiserad bearbetning av äktenskapscertifikat

Automatiserad bearbetning av äktenskapscertifikat är processen för att extrahera nyckelfält från äktenskapscertifikat. Historiskt sett sker processen för analys av äktenskapscertifikat manuellt och därmed mycket tidskrävande. Korrekt extrahering av viktiga data från äktenskapscertifikat är vanligtvis det första och ett av de mest kritiska stegen i processen för automatisering av äktenskapscertifikat.

Utvecklingsalternativ

Document Intelligence v4.0 (2024-02-29-preview) stöder följande verktyg, program och bibliotek:

Funktion Resurser Model ID
prebuilt-marriageCertificate.us Document Intelligence Studio
REST API
C# SDK
Python SDK
Java SDK
JavaScript SDK
prebuilt-marriageCertificate.us

Indatakrav

  • För bästa resultat anger du ett tydligt foto eller en genomsökning av hög kvalitet per dokument.

  • Filformat som stöds:

    Modell PDF Bild:
    JPEG/JPG, PNG, BMP, TIFF, HEIF
    Microsoft Office:
    Word (DOCX), Excel (XLSX), PowerPoint (PPTX) och HTML
    Lästa
    Layout ✔ (2024-02-29-preview, 2023-10-31-preview)
    Allmänt dokument
    Inbyggda
    Anpassad extrahering
    Anpassad klassificering ✔ (2024-02-29-preview)
  • För PDF och TIFF kan upp till 2 000 sidor bearbetas (med en kostnadsfri nivåprenumeration bearbetas endast de två första sidorna).

  • Filstorleken för att analysera dokument är 500 MB för den betalda nivån (S0) och 4 MB för den kostnadsfria nivån (F0).

  • Bilddimensionerna måste vara mellan 50 x 50 bildpunkter och 10 000 px x 10 000 bildpunkter.

  • Om dina PDF-filer är låsta med lösenord måste du ta bort låset innan du skickar filerna.

  • Den minsta höjden på texten som ska extraheras är 12 bildpunkter för en bild på 1 024 x 768 bildpunkter. Den här dimensionen motsvarar ungefär 8-punkttext vid 150 punkter per tum (DPI).

  • För anpassad modellträning är det maximala antalet sidor för träningsdata 500 för den anpassade mallmodellen och 50 000 för den anpassade neurala modellen.

    • För anpassad extraheringsmodellträning är den totala storleken på träningsdata 50 MB för mallmodellen och 1G-MB för den neurala modellen.

    • För anpassad klassificeringsmodellträning är 1GB den totala storleken på träningsdata med högst 10 000 sidor.

Prova extrahering av dokumentdata för äktenskapscertifikat

Om du vill se hur dataextrahering fungerar för tjänsten för äktenskapscertifikatkort behöver du följande resurser:

  • En Azure-prenumeration – du kan skapa en kostnadsfritt.

  • En instans av dokumentinformation i Azure-portalen. Du kan använda den kostnadsfria prisnivån (F0) för att prova tjänsten. När resursen har distribuerats väljer du Gå till resurs för att hämta din nyckel och slutpunkt.

Skärmbild av nycklar och slutpunktsplats i Azure-portalen.

Document Intelligence Studio

  1. På startsidan för Document Intelligence Studio väljer du Äktenskapscertifikat.

  2. Du kan analysera exempel på äktenskapscertifikat eller ladda upp dina egna filer.

  3. Välj knappen Kör analys och konfigurera vid behov alternativen Analysera:

    Skärmbild av knapparna Kör analys och Analysera alternativ i Document Intelligence Studio.

Språk och nationella inställningar som stöds

Se sidan Språkstöd – fördefinierade modeller för en fullständig lista över språk som stöds.

Fältextrahering

Följande är fälten som extraheras från ett äktenskapscertifikat i JSON-utdatasvaret.

Namn Type Beskrivning Exempel på utdata
Spouse1FirstName String Make/maka 1:s förnamn Wesley
Spouse1MiddleName String Make/maka 1:s mellannamn M.
Spouse1LastName String Make/maka 1s efternamn Perry
Spouse1Age Integer Make/maka 1:s ålder 26
Spouse1BirthDate Datum Make/maka 1:s födelsedatum 16 november 1997
Spouse1Address Adress Make/maka 1-adress 4292 Don Jackson Lane, Bloomfield Township, Michigan 48302
Spouse1BirthPlace String Make/maka 1:s födelseort Michigan
Spouse2FirstName String Make/maka 2:s förnamn Beth
Spouse2MiddleName String Make/maka 2:s mellannamn R.
Spouse2LastName String Make/maka 2s efternamn Mason
Spouse2Age Integer Make/maka 2-ålder 23
Spouse2BirthDate Datum Make/maka 2:s födelsedatum 22 juli 2000
Spouse2Address Adress Make/maka 2-adress 2671 Comfort Court, Madison, Wisconsin 53704
Spouse2BirthPlace String Make/maka 2:s födelseplats Wisconsin
DocumentNumber String Dokumentnummer 01976/202
IssueDate Datum Certifikatets utfärdandedatum 10 okt 2023
IssuePlace String Utfärdarplats för certifikatet 2398 Echo Lane, Hastings, Michigan 49058
MarriageDate Datum Äktenskapsdatum 10 okt 2023
MarriagePlace String Äktenskapsplats 105 Coal Street, Galloway, Wisconsin 54432

Nyckel/värde-par för äktenskapscertifikat och radobjekt som extraheras finns i documentResults avsnittet i JSON-utdata.

Nästa steg

  • Prova att bearbeta dina egna formulär och dokument med Document Intelligence Studio.

  • Slutför en snabbstart för dokumentinformation och kom igång med att skapa en app för dokumentbearbetning på valfritt utvecklingsspråk.