Document Intelligence-huwelijkscertificaatmodel
Deze inhoud is van toepassing op:v4.0 (preview)
Het Document Intelligence-huwelijkscertificaatmodel maakt gebruik van krachtige OCR-mogelijkheden (Optical Character Recognition) om belangrijke velden uit huwelijkscertificaten te analyseren en te extraheren. Huwelijkscertificaten kunnen verschillende indelingen en kwaliteit hebben, waaronder door de telefoon vastgelegde afbeeldingen, gescande documenten en digitale PDF-bestanden. De API analyseert documenttekst; extraheert belangrijke informatie zoals namen van echtgenoten, uitgiftedatum en huwelijksplaats; en retourneert een gestructureerde JSON-gegevensweergave. Het model ondersteunt momenteel engelse documentindelingen.
Geautomatiseerde verwerking van huwelijksakte
Geautomatiseerde verwerking van huwelijkscertificaten is het proces van het extraheren van sleutelvelden uit huwelijkscertificaten. In het verleden wordt het proces voor het analyseren van het huwelijkscertificaat handmatig bereikt en dus zeer tijdrovend. Nauwkeurige extractie van belangrijke gegevens uit huwelijkscertificaten is doorgaans de eerste en een van de meest kritieke stappen in het automatiseringsproces van het huwelijkscertificaat.
Ontwikkelingsopties
Document Intelligence v4.0 (2024-02-29-preview) ondersteunt de volgende hulpprogramma's, toepassingen en bibliotheken:
Functie | Resources | Model-id |
---|---|---|
prebuilt-marriageCertificate.us | • Document Intelligence Studio • REST API • C# SDK • Python SDK • Java SDK • JavaScript SDK |
prebuilt-marriageCertificate.us |
Vereisten voor invoer
Geef voor de beste resultaten één duidelijke foto of een hoogwaardige scan per document op.
Ondersteunde bestandsindelingen:
Model PDF Afbeelding:
JPEG/JPG, PNG, BMP, TIFF, HEIFMicrosoft Office:
Word (DOCX), Excel (XLSX), PowerPoint (PPTX) en HTMLRead ✔ ✔ ✔ Indeling ✔ ✔ ✔ (2024-02-29-preview, 2023-10-31-preview) Algemeen document ✔ ✔ Vooraf gebouwd ✔ ✔ Aangepaste extractie ✔ ✔ Aangepaste classificatie ✔ ✔ ✔ (2024-02-29-preview) Voor PDF en TIFF kunnen maximaal 2000 pagina's worden verwerkt (met een abonnement op de gratis laag worden alleen de eerste twee pagina's verwerkt).
De bestandsgrootte voor het analyseren van documenten is 500 MB voor betaalde (S0) laag en 4 MB gratis (F0).
De afmetingen van de afbeelding moeten tussen 50 x 50 pixels en 10.000 pixels x 10.000 pixels zijn.
Als uw PDF's zijn vergrendeld met een wachtwoord, moet u de vergrendeling verwijderen voordat u ze indient.
De minimale hoogte van de tekst die moet worden geëxtraheerd, is 12 pixels voor een afbeelding van 1024 x 768 pixels. Deze dimensie komt overeen met ongeveer
8
-punttekst op 150 punten per inch (DPI).Voor aangepaste modeltraining is het maximum aantal pagina's voor trainingsgegevens 500 voor het aangepaste sjabloonmodel en 50.000 voor het aangepaste neurale model.
Voor het trainen van aangepaste extractiemodellen is de totale grootte van trainingsgegevens 50 MB voor het sjabloonmodel en 1G-MB voor het neurale model.
Voor het trainen van aangepast classificatiemodel is
1GB
de totale grootte van trainingsgegevens maximaal 10.000 pagina's.
Documentextractie van huwelijkscertificaat proberen
Als u wilt zien hoe gegevensextractie werkt voor de kaartservice voor huwelijkscertificaten, hebt u de volgende bronnen nodig:
Een Azure-abonnement: u kunt er gratis een maken.
Een Document Intelligence-exemplaar in Azure Portal. U kunt de gratis prijscategorie (
F0
) gebruiken om de service te proberen. Nadat uw resource is geïmplementeerd, selecteert u Ga naar de resource om uw sleutel en eindpunt op te halen.
Document Intelligence Studio
Selecteer op de startpagina van Document Intelligence Studio de optie Huwelijkscertificaat.
U kunt de voorbeeldcertificaten van het huwelijk analyseren of uw eigen bestanden uploaden.
Selecteer de knop Analyse uitvoeren en configureer indien nodig de opties analyseren:
Ondersteunde talen en landinstellingen
Zie onze pagina met vooraf samengestelde modellen voor een volledige lijst met ondersteunde talen.
Veldextractie
Hier volgen de velden die zijn geëxtraheerd uit een huwelijkscertificaat in het JSON-uitvoerantwoord.
Name | Type | Description | Voorbeelduitvoer |
---|---|---|---|
Spouse1FirstName |
String | Voornaam van echtgenoot 1 | Wesley |
Spouse1MiddleName |
String | De middelste naam van echtgenoot 1 | M. |
Spouse1LastName |
String | Achternaam van echtgenoot 1 | Perry |
Spouse1Age |
Geheel getal | Leeftijd van echtgenoot 1 | 26 |
Spouse1BirthDate |
Datum | Geboortedatum van echtgenoot 1 | 16 november 1997 |
Spouse1Address |
Adres | Adres van echtgenoot 1 | 4292 Don Jackson Lane, Bloomfield Town, Michigan 48302 |
Spouse1BirthPlace |
String | Geboortedatum van echtgenoot 1 | Michigan |
Spouse2FirstName |
String | Voornaam van echtgenoot 2 | Beth |
Spouse2MiddleName |
String | De middelste naam van echtgenoot 2 | R. |
Spouse2LastName |
String | Achternaam van echtgenoot 2 | Mason |
Spouse2Age |
Geheel getal | Leeftijd van echtgenoot 2 | 23 |
Spouse2BirthDate |
Datum | Geboortedatum van echtgenoot 2 | 22 juli 2000 |
Spouse2Address |
Adres | Adres van echtgenoot 2 | 2671 Comfort Court, Madison, Oregonin 53704 |
Spouse2BirthPlace |
String | Geboortedatum van echtgenoot 2 | Wisconsin |
DocumentNumber |
String | Documentnummer | 01976/202 |
IssueDate |
Datum | Uitgiftedatum van het certificaat | 10 oktober 2023 |
IssuePlace |
String | Plaats van het certificaat uitgeven | 2398 Echo Lane, Hastings, Michigan 49058 |
MarriageDate |
Datum | Huwelijksdatum | 10 oktober 2023 |
MarriagePlace |
String | Huwelijksplaats | 105 Coal Street, Galloway, Wisconsin 54432 |
De sleutel-waardeparen van het huwelijkscertificaat en regelitems die zijn geëxtraheerd, bevinden zich in de documentResults
sectie van de JSON-uitvoer.
Volgende stappen
Probeer uw eigen formulieren en documenten te verwerken met Document Intelligence Studio.
Voltooi een quickstart voor Document Intelligence en ga aan de slag met het maken van een app voor documentverwerking in de ontwikkeltaal van uw keuze.
Feedback
https://aka.ms/ContentUserFeedback.
Binnenkort beschikbaar: In de loop van 2024 zullen we GitHub-problemen geleidelijk uitfaseren als het feedbackmechanisme voor inhoud en deze vervangen door een nieuw feedbacksysteem. Zie voor meer informatie:Feedback verzenden en weergeven voor