Partilhar via


Modelo de certidão de casamento Document Intelligence

Este conteúdo aplica-se a:marca de verificaçãov4.0 (pré-visualização)marca de verificação

O modelo de Certidão de Casamento com Inteligência Documental usa poderosos recursos de Reconhecimento Ótico de Caracteres (OCR) para analisar e extrair campos-chave das Certidão de Casamento. As certidões de casamento podem ser de vários formatos e qualidade, incluindo imagens capturadas por telefone, documentos digitalizados e PDFs digitais. A API analisa o texto do documento; extrai informações importantes, como nomes de cônjuges, data de emissão e local de casamento; e retorna uma representação de dados JSON estruturada. Atualmente, o modelo suporta formatos de documentos em inglês.

Processamento automatizado de certidões de casamento

O processamento automatizado de certidões de casamento é o processo de extração de campos-chave das certidões de casamento. Historicamente, o processo de análise da certidão de casamento é feito manualmente e, portanto, muito demorado. A extração precisa de dados-chave das certidões de casamento é normalmente a primeira e uma das etapas mais críticas no processo de automação da certidão de casamento.

Opções de desenvolvimento

O Document Intelligence v4.0 (2024-02-29-preview) suporta as seguintes ferramentas, aplicações e bibliotecas:

Caraterística Recursos Model ID
prebuilt-marriageCertificate.us • Document Intelligence Studio
API REST
C# SDK
Python SDK
Java SDK
JavaScript SDK
prebuilt-marriageCertificate.us

Requisitos de entrada

  • Para obter melhores resultados, forneça uma foto nítida ou uma digitalização de alta qualidade por documento.

  • Formatos de ficheiro suportados:

    Modelo PDF Imagem:
    JPEG/JPG, PNG, BMP, TIFF, HEIF
    Microsoft Office:
    Word (DOCX), Excel (XLSX), PowerPoint (PPTX) e HTML
    Lida
    Esquema ✔ (2024-02-29-pré-visualização, 2023-10-31-pré-visualização)
    Documento Geral
    Pré-criado
    Extração personalizada
    Classificação personalizada ✔ (2024-02-29-pré-visualização)
  • Para PDF e TIFF, até 2000 páginas podem ser processadas (com uma assinatura de nível gratuito, apenas as duas primeiras páginas são processadas).

  • O tamanho do arquivo para analisar documentos é de 500 MB para a camada paga (S0) e 4 MB para a camada gratuita (F0).

  • As dimensões da imagem devem estar entre 50 x 50 pixels e 10.000 px x 10.000 pixels.

  • Se os seus PDFs forem bloqueados por uma palavra-passe, terá de remover o bloqueio antes da submetê-los.

  • A altura mínima do texto a ser extraído é de 12 pixels para uma imagem de 1024 x 768 pixels. Esta dimensão corresponde a texto de cerca 8de -ponto a 150 pontos por polegada (DPI).

  • Para treinamento de modelo personalizado, o número máximo de páginas para dados de treinamento é 500 para o modelo de modelo personalizado e 50.000 para o modelo neural personalizado.

    • Para treinamento de modelo de extração personalizado, o tamanho total dos dados de treinamento é de 50 MB para o modelo de modelo e 1G-MB para o modelo neural.

    • Para treinamento de modelo de classificação personalizado, o tamanho total dos dados de treinamento é 1GB de no máximo 10.000 páginas.

Experimente a extração de dados do documento da certidão de casamento

Para ver como funciona a extração de dados para o serviço de cartão de certidão de casamento, você precisa dos seguintes recursos:

  • Uma assinatura do Azure — você pode criar uma gratuitamente.

  • Uma instância de Document Intelligence no portal do Azure. Você pode usar o nível de preço gratuito (F0) para experimentar o serviço. Depois que o recurso for implantado, selecione Ir para o recurso para obter sua chave e o ponto de extremidade.

Captura de ecrã das chaves e da localização do ponto de extremidade no portal do Azure.

Estúdio de Inteligência de Documentação

  1. Na página inicial do Document Intelligence Studio, selecione Certidão de Casamento.

  2. Você pode analisar a amostra de certidões de casamento ou fazer upload de seus próprios arquivos.

  3. Selecione o botão Executar análise e, se necessário, configure as opções Analisar:

    Captura de tela dos botões Executar análise e Analisar opções no Document Intelligence Studio.

Idiomas e localidades suportados

Consulte a nossa página Suporte a idiomas — modelos pré-construídos para obter uma lista completa dos idiomas suportados.

Extração de campo

A seguir estão os campos extraídos de uma certidão de casamento na resposta de saída JSON.

Nome Tipo Description Exemplo de saída
Spouse1FirstName String Nome próprio do cônjuge 1 Wesley
Spouse1MiddleName String Nome do meio do cônjuge 1 M.
Spouse1LastName String Apelido do cônjuge 1 Edgar
Spouse1Age Número inteiro Idade do cônjuge 1 26
Spouse1BirthDate Date Data de nascimento do cônjuge 1 16 de novembro de 1997
Spouse1Address Endereço Endereço do cônjuge 1 4292 Don Jackson Lane, Bloomfield Township, Michigan 48302
Spouse1BirthPlace String Local de nascimento do cônjuge 1 Michigan
Spouse2FirstName String Nome próprio do cônjuge 2 Beth
Spouse2MiddleName String Nome do meio do cônjuge 2 R.
Spouse2LastName String Apelido do cônjuge 2 Pedreiro
Spouse2Age Número inteiro Idade do cônjuge 2 23
Spouse2BirthDate Date Data de nascimento do cônjuge 2 22 de julho de 2000
Spouse2Address Endereço Endereço do cônjuge 2 2671 Comfort Court, Madison, Wisconsin 53704
Spouse2BirthPlace String Local de nascimento do cônjuge 2 Wisconsin
DocumentNumber String Número do documento 01976/202
IssueDate Date Data de emissão do certificado 10 de outubro de 2023
IssuePlace String Local de emissão do certificado 2398 Echo Lane, Hastings, Michigan, 49058
MarriageDate Date Data do casamento 10 de outubro de 2023
MarriagePlace String Local de casamento 105 Coal Street, Galloway, Wisconsin 54432

Os pares chave-valor da certidão de casamento e os itens de linha extraídos estão na documentResults seção da saída JSON.

Próximos passos