Modell för äktenskapscertifikat för dokumentinformation
Det här innehållet gäller för: v4.0 (förhandsversion)
Modellen för äktenskapscertifikat för dokumentinformation använder kraftfulla OCR-funktioner (Optisk teckenigenkänning) för att analysera och extrahera nyckelfält från äktenskapscertifikat. Äktenskapscertifikat kan ha olika format och kvalitet, inklusive telefonbilder, skannade dokument och digitala PDF-filer. API:et analyserar dokumenttext; extraherar viktig information som namn på make/maka, utfärdandedatum och äktenskapsplats; och returnerar en strukturerad JSON-datarepresentation. Modellen stöder för närvarande engelskspråkiga dokumentformat.
Automatiserad bearbetning av äktenskapscertifikat
Automatiserad bearbetning av äktenskapscertifikat är processen för att extrahera nyckelfält från äktenskapscertifikat. Historiskt sett sker processen för analys av äktenskapscertifikat manuellt och därmed mycket tidskrävande. Korrekt extrahering av viktiga data från äktenskapscertifikat är vanligtvis det första och ett av de mest kritiska stegen i processen för automatisering av äktenskapscertifikat.
Utvecklingsalternativ
Document Intelligence v4.0 (2024-07-31-preview) stöder följande verktyg, program och bibliotek:
Funktion | Resurser | Model ID |
---|---|---|
prebuilt-marriageCertificate.us | • Document Intelligence Studio • REST API • C# SDK • Python SDK • Java SDK • JavaScript SDK |
prebuilt-marriageCertificate.us |
Indatakrav
Filformat som stöds:
Modell PDF Bild: JPEG/JPG
,PNG
,BMP
, ,TIFF
HEIF
Microsoft Office:
Word (DOCX
), Excel (XLSX
), PowerPoint (PPTX
), HTMLLästa ✔ ✔ ✔ Layout ✔ ✔ ✔ (2024-07-31-preview, 2024-02-29-preview, 2023-10-31-preview) Allmänt dokument ✔ ✔ Inbyggda ✔ ✔ Anpassad extrahering ✔ ✔ Anpassad klassificering ✔ ✔ ✔ (2024-07-31-preview, 2024-02-29-preview) För bästa resultat anger du ett tydligt foto eller en genomsökning av hög kvalitet per dokument.
För PDF och TIFF kan upp till 2 000 sidor bearbetas (med en prenumeration på den kostnadsfria nivån bearbetas endast de två första sidorna).
Filstorleken för att analysera dokument är 500 MB för betald (S0) nivå och
4
MB för den kostnadsfria nivån (F0).Bilddimensioner måste vara mellan 50 bildpunkter x 50 bildpunkter och 10 000 bildpunkter x 10 000 bildpunkter.
Om dina PDF-filer är låsta med lösenord måste du ta bort låset innan du skickar filerna.
Den minsta höjden på texten som ska extraheras är 12 bildpunkter för en bild på 1 024 x 768 bildpunkter. Den här dimensionen motsvarar om
8
punkttext vid 150 punkter per tum (DPI).För anpassad modellträning är det maximala antalet sidor för träningsdata 500 för den anpassade mallmodellen och 50 000 för den anpassade neurala modellen.
För anpassad extraheringsmodellträning är den totala storleken på träningsdata 50 MB för mallmodellen och
1
GB för den neurala modellen.För anpassad klassificeringsmodellträning är
1
den totala storleken på träningsdata GB med högst 10 000 sidor. För förhandsversionen 2024-07-31 och senare är2
den totala storleken på träningsdata GB med högst 10 000 sidor.
Prova extrahering av dokumentdata för äktenskapscertifikat
Om du vill se hur dataextrahering fungerar för tjänsten för äktenskapscertifikatkort behöver du följande resurser:
En Azure-prenumeration – du kan skapa en kostnadsfritt.
En instans av dokumentinformation i Azure Portal. Du kan använda den kostnadsfria prisnivån (
F0
) för att prova tjänsten. När resursen har distribuerats väljer du Gå till resurs för att hämta din nyckel och slutpunkt.
Document Intelligence Studio
På startsidan för Document Intelligence Studio väljer du Äktenskapscertifikat.
Du kan analysera exempel på äktenskapscertifikat eller ladda upp dina egna filer.
Välj knappen Kör analys och konfigurera vid behov alternativen Analysera:
Språk och nationella inställningar som stöds
En fullständig lista över språk som stöds finns på vår fördefinierade supportsida för modellspråk.
Fältextrahering
Information om vilka dokumentextraheringsfält som stöds finns på schemasidan för modellschemat för äktenskapscertifikat på vår GitHub-exempellagringsplats.
Nyckel/värde-par för äktenskapscertifikat och radobjekt som extraheras finns i
documentResults
avsnittet i JSON-utdata.
Nästa steg
Prova att bearbeta dina egna formulär och dokument med Document Intelligence Studio.
Slutför en snabbstart för dokumentinformation och kom igång med att skapa en app för dokumentbearbetning på valfritt utvecklingsspråk.