Compartilhar via


Modelo de certidão de casamento de Informação de Documentos

Este conteúdo se aplica a:marca de seleçãov4.0 (versão prévia)marca de seleção

O modelo de certidão de casamento de Informação de Documentos usa recursos poderosos de reconhecimento óptico de caracteres (OCR) para analisar e extrair campos-chave de certidões de casamento. As certidões de casamento podem ter vários formatos e qualidades, incluindo imagens capturadas por telefone, documentos digitalizados e PDFs digitais. A API analisa o texto do documento; extrai informações importantes, como nomes dos cônjuges, data de emissão e local de casamento; e retorna uma representação estruturada de dados JSON. Atualmente, o modelo dá suporte a formatos de documento em inglês.

Processamento automatizado de certidão de casamento

O processamento automatizado de certidões de casamento é o processo de extração de campos-chave das certidões de casamento. Historicamente, o processo de análise da certidão de casamento é feito manualmente e, portanto, muito demorado. A extração precisa de dados importantes de certidões de casamento é normalmente a primeira e uma das etapas mais críticas no processo de automação de certidões de casamento.

Opções de desenvolvimento

Informação de Documentos v4.0 (versão prévia de 29/02/2024) oferece suporte às seguintes ferramentas, aplicativos e bibliotecas:

Recurso Recursos ID do Modelo
prebuilt-marriageCertificate.us Estúdio da Informação de Documentos
API REST
SDK do C#
SDK do Python
SDK do Java
SDK do JavaScript
prebuilt-marriageCertificate.us

Requisitos de entrada

  • Para ter melhores resultados, forneça uma foto clara ou uma digitalização de alta qualidade por documento.

  • Formatos de arquivo com suporte:

    Modelar PDF Imagem:
    JPEG/JPG, PNG, BMP, TIFF, HEIF
    Microsoft Office:
    Word (DOCX), Excel (XLSX), PowerPoint (PPTX) e HTML
    Ler
    Layout ✔ (2024-02-29-preview, 2023-10-31-preview)
    Documento geral
    Predefinida
    Extração personalizada
    Classificação personalizada ✔ (2024-02-29-preview)
  • Para PDF e TIFF, até 2000 páginas podem ser processadas (com uma assinatura de camada gratuita, somente as duas primeiras páginas são processadas).

  • O tamanho do arquivo para análise de documentos é 500 MB para a camada paga (S0) e 4 MB para a camada gratuita (F0).

  • As dimensões da imagem devem estar entre 50 x 50 pixels e 10.000 px x 10.000 pixels.

  • Se os PDFs estiverem com bloqueio de senha, você deverá remover o bloqueio antes do envio.

  • A altura mínima do texto a ser extraído é de 12 pixels para uma imagem de 1.024 x 768 pixels. Essa dimensão corresponde a um texto de cerca de 8 pontos a 150 pontos por polegada (DPI).

  • Para treinamento de modelo personalizado, o número máximo de páginas para dados de treinamento é 500 para o modelo de modelo personalizado e 50.000 para o modelo neural personalizado.

    • Para treinamento de modelo de extração personalizado, o tamanho total dos dados de treinamento é de 50 MB para o modelo e 1G-MB para o modelo neural.

    • Para treinamento de modelo de classificação personalizado, o tamanho total dos dados de treinamento é 1GB com no máximo 10.000 páginas.

Experimente a extração de dados de documentos de certidão de casamento

Para ver como funciona a extração de dados para o serviço de cartão de certidão de casamento, você precisa dos seguintes recursos:

Captura de tela da localização das chaves e do ponto de extremidade no portal do Azure.

Estúdio de Informação de Documentos

  1. Na página inicial do Informação de Documentos Studio, selecione Certidão de Casamento.

  2. Você pode analisar os exemplos de certidões de casamento ou fazer upload de seus próprios arquivos.

  3. Selecione o botão Executar análise e, se necessário, configure as opções Analisar :

    Captura de tela dos botões de opções Executar análise e Analisar no Document Intelligence Studio.

Idiomas e localidades com suporte

Confira nossa página Suporte ao idioma – modelos predefinidos, para obter uma lista completa dos idiomas compatíveis.

Extração de campo

A seguir estão os campos extraídos de uma certidão de casamento na resposta de saída JSON.

Nome Tipo Descrição Saída de exemplo
Spouse1FirstName String Nome do cônjuge 1 Wesley
Spouse1MiddleName String Nome do meio do cônjuge 1 M.
Spouse1LastName String Sobrenome do cônjuge 1 Perry
Spouse1Age Inteiro Idade do cônjuge 1 26
Spouse1BirthDate Data Data de nascimento do cônjuge 1 16 de novembro de 1997
Spouse1Address Address Endereço do cônjuge 1 4292 Don Jackson Lane, Bloomfield Township, Michigan 48302
Spouse1BirthPlace String Local de nascimento do cônjuge 1 Michigan
Spouse2FirstName String Nome do cônjuge 2 Beth
Spouse2MiddleName String Nome do meio do cônjuge 2 R.
Spouse2LastName String Sobrenome do cônjuge 2 Julio
Spouse2Age Inteiro Idade do cônjuge 2 23
Spouse2BirthDate Data Data de nascimento do cônjuge 2 Jul. 22, 2000
Spouse2Address Address Endereço do cônjuge 2 2671 Comfort Court, Madison, Wisconsin 53704
Spouse2BirthPlace String Local de nascimento do cônjuge 2 Wisconsin
DocumentNumber String Número do documento 01976/202
IssueDate Data Data de emissão do certificado 10 de outubro de 2023
IssuePlace String Local de emissão do certificado 2398 Echo Lane, Hastings, Michigan 49058
MarriageDate Data Data do casamento 10 de outubro de 2023
MarriagePlace String Lugar do casamento 105 Coal Street, Galloway, Wisconsin 54432

Os pares de valores-chave da certidão de casamento e os itens de linha extraídos estão na seção documentResults da saída JSON.

Próximas etapas