Modelo de certidão de casamento Document Intelligence
Este conteúdo aplica-se a: v4.0 (pré-visualização)
O modelo de Certidão de Casamento com Inteligência Documental usa poderosos recursos de Reconhecimento Ótico de Caracteres (OCR) para analisar e extrair campos-chave das Certidão de Casamento. As certidões de casamento podem ser de vários formatos e qualidade, incluindo imagens capturadas por telefone, documentos digitalizados e PDFs digitais. A API analisa o texto do documento; extrai informações importantes, como nomes de cônjuges, data de emissão e local de casamento; e retorna uma representação de dados JSON estruturada. Atualmente, o modelo suporta formatos de documentos em inglês.
Processamento automatizado de certidões de casamento
O processamento automatizado de certidões de casamento é o processo de extração de campos-chave das certidões de casamento. Historicamente, o processo de análise da certidão de casamento é feito manualmente e, portanto, muito demorado. A extração precisa de dados-chave das certidões de casamento é normalmente a primeira e uma das etapas mais críticas no processo de automação da certidão de casamento.
Opções de desenvolvimento
O Document Intelligence v4.0 (2024-02-29-preview) suporta as seguintes ferramentas, aplicações e bibliotecas:
Caraterística | Recursos | Model ID |
---|---|---|
prebuilt-marriageCertificate.us | • Document Intelligence Studio • API REST • C# SDK • Python SDK • Java SDK • JavaScript SDK |
prebuilt-marriageCertificate.us |
Requisitos de entrada
Para obter melhores resultados, forneça uma foto nítida ou uma digitalização de alta qualidade por documento.
Formatos de ficheiro suportados:
Modelo PDF Imagem:
JPEG/JPG, PNG, BMP, TIFF, HEIFMicrosoft Office:
Word (DOCX), Excel (XLSX), PowerPoint (PPTX) e HTMLLida ✔ ✔ ✔ Esquema ✔ ✔ ✔ (2024-02-29-pré-visualização, 2023-10-31-pré-visualização) Documento Geral ✔ ✔ Pré-criado ✔ ✔ Extração personalizada ✔ ✔ Classificação personalizada ✔ ✔ ✔ (2024-02-29-pré-visualização) Para PDF e TIFF, até 2000 páginas podem ser processadas (com uma assinatura de nível gratuito, apenas as duas primeiras páginas são processadas).
O tamanho do arquivo para analisar documentos é de 500 MB para a camada paga (S0) e 4 MB para a camada gratuita (F0).
As dimensões da imagem devem estar entre 50 x 50 pixels e 10.000 px x 10.000 pixels.
Se os seus PDFs forem bloqueados por uma palavra-passe, terá de remover o bloqueio antes da submetê-los.
A altura mínima do texto a ser extraído é de 12 pixels para uma imagem de 1024 x 768 pixels. Esta dimensão corresponde a texto de cerca
8
de -ponto a 150 pontos por polegada (DPI).Para treinamento de modelo personalizado, o número máximo de páginas para dados de treinamento é 500 para o modelo de modelo personalizado e 50.000 para o modelo neural personalizado.
Para treinamento de modelo de extração personalizado, o tamanho total dos dados de treinamento é de 50 MB para o modelo de modelo e 1G-MB para o modelo neural.
Para treinamento de modelo de classificação personalizado, o tamanho total dos dados de treinamento é
1GB
de no máximo 10.000 páginas.
Experimente a extração de dados do documento da certidão de casamento
Para ver como funciona a extração de dados para o serviço de cartão de certidão de casamento, você precisa dos seguintes recursos:
Uma assinatura do Azure — você pode criar uma gratuitamente.
Uma instância de Document Intelligence no portal do Azure. Você pode usar o nível de preço gratuito (
F0
) para experimentar o serviço. Depois que o recurso for implantado, selecione Ir para o recurso para obter sua chave e o ponto de extremidade.
Estúdio de Inteligência de Documentação
Na página inicial do Document Intelligence Studio, selecione Certidão de Casamento.
Você pode analisar a amostra de certidões de casamento ou fazer upload de seus próprios arquivos.
Selecione o botão Executar análise e, se necessário, configure as opções Analisar:
Idiomas e localidades suportados
Consulte a nossa página Suporte a idiomas — modelos pré-construídos para obter uma lista completa dos idiomas suportados.
Extração de campo
A seguir estão os campos extraídos de uma certidão de casamento na resposta de saída JSON.
Nome | Tipo | Description | Exemplo de saída |
---|---|---|---|
Spouse1FirstName |
String | Nome próprio do cônjuge 1 | Wesley |
Spouse1MiddleName |
String | Nome do meio do cônjuge 1 | M. |
Spouse1LastName |
String | Apelido do cônjuge 1 | Edgar |
Spouse1Age |
Número inteiro | Idade do cônjuge 1 | 26 |
Spouse1BirthDate |
Date | Data de nascimento do cônjuge 1 | 16 de novembro de 1997 |
Spouse1Address |
Endereço | Endereço do cônjuge 1 | 4292 Don Jackson Lane, Bloomfield Township, Michigan 48302 |
Spouse1BirthPlace |
String | Local de nascimento do cônjuge 1 | Michigan |
Spouse2FirstName |
String | Nome próprio do cônjuge 2 | Beth |
Spouse2MiddleName |
String | Nome do meio do cônjuge 2 | R. |
Spouse2LastName |
String | Apelido do cônjuge 2 | Pedreiro |
Spouse2Age |
Número inteiro | Idade do cônjuge 2 | 23 |
Spouse2BirthDate |
Date | Data de nascimento do cônjuge 2 | 22 de julho de 2000 |
Spouse2Address |
Endereço | Endereço do cônjuge 2 | 2671 Comfort Court, Madison, Wisconsin 53704 |
Spouse2BirthPlace |
String | Local de nascimento do cônjuge 2 | Wisconsin |
DocumentNumber |
String | Número do documento | 01976/202 |
IssueDate |
Date | Data de emissão do certificado | 10 de outubro de 2023 |
IssuePlace |
String | Local de emissão do certificado | 2398 Echo Lane, Hastings, Michigan, 49058 |
MarriageDate |
Date | Data do casamento | 10 de outubro de 2023 |
MarriagePlace |
String | Local de casamento | 105 Coal Street, Galloway, Wisconsin 54432 |
Os pares chave-valor da certidão de casamento e os itens de linha extraídos estão na documentResults
seção da saída JSON.
Próximos passos
Tente processar seus próprios formulários e documentos com o Document Intelligence Studio.
Conclua um início rápido do Document Intelligence e comece a criar um aplicativo de processamento de documentos na linguagem de desenvolvimento de sua escolha.
Comentários
https://aka.ms/ContentUserFeedback.
Brevemente: Ao longo de 2024, vamos descontinuar progressivamente o GitHub Issues como mecanismo de feedback para conteúdos e substituí-lo por um novo sistema de feedback. Para obter mais informações, veja:Submeter e ver comentários