Partilhar via


Modelos de documentos hipotecários de inteligência documental

Este conteúdo aplica-se a:marca de verificaçãov4.0 (pré-visualização)marca de verificação

Os modelos de Hipoteca de Inteligência Documental usam poderosos recursos de Reconhecimento Ótico de Caracteres (OCR) e modelos de aprendizado profundo para analisar e extrair campos-chave de documentos de hipoteca. Os documentos de hipoteca podem ser de vários formatos e qualidade. A API analisa documentos de hipoteca e retorna uma representação de dados JSON estruturada. Atualmente, os modelos suportam apenas documentos em inglês.

Tipos de documentos suportados:

  • Pedido de Empréstimo Residencial Uniforme (Formulário 1003)
  • Subscrição Uniforme e Resumo de Transmissão (Formulário 1008)
  • Formulário de Divulgação de Encerramento

Opções de desenvolvimento

O Document Intelligence v4.0 (2024-02-29-preview) suporta as seguintes ferramentas, aplicações e bibliotecas:

Caraterística Recursos Model ID
Modelo de hipoteca • Document Intelligence Studio
API REST
C# SDK
Python SDK
Java SDK
JavaScript SDK
• prebuilt-mortgage.us.1003
• prebuilt-mortgage.us.1008
• prebuilt-mortgage.us.closingDivulgação

Requisitos de entrada

  • Para obter melhores resultados, forneça uma foto nítida ou uma digitalização de alta qualidade por documento.

  • Formatos de ficheiro suportados:

    Modelo PDF Imagem:
    JPEG/JPG, PNG, BMP, TIFF, HEIF
    Microsoft Office:
    Word (DOCX), Excel (XLSX), PowerPoint (PPTX) e HTML
    Lida
    Esquema ✔ (2024-02-29-pré-visualização, 2023-10-31-pré-visualização)
    Documento Geral
    Pré-criado
    Extração personalizada
    Classificação personalizada ✔ (2024-02-29-pré-visualização)
  • Para PDF e TIFF, até 2000 páginas podem ser processadas (com uma assinatura de nível gratuito, apenas as duas primeiras páginas são processadas).

  • O tamanho do arquivo para analisar documentos é de 500 MB para a camada paga (S0) e 4 MB para a camada gratuita (F0).

  • As dimensões da imagem devem estar entre 50 x 50 pixels e 10.000 px x 10.000 pixels.

  • Se os seus PDFs forem bloqueados por uma palavra-passe, terá de remover o bloqueio antes da submetê-los.

  • A altura mínima do texto a ser extraído é de 12 pixels para uma imagem de 1024 x 768 pixels. Esta dimensão corresponde a texto de cerca 8de -ponto a 150 pontos por polegada (DPI).

  • Para treinamento de modelo personalizado, o número máximo de páginas para dados de treinamento é 500 para o modelo de modelo personalizado e 50.000 para o modelo neural personalizado.

    • Para treinamento de modelo de extração personalizado, o tamanho total dos dados de treinamento é de 50 MB para o modelo de modelo e 1G-MB para o modelo neural.

    • Para treinamento de modelo de classificação personalizado, o tamanho total dos dados de treinamento é 1GB de no máximo 10.000 páginas.

Experimente a extração de dados de documentos hipotecários

Para ver como funciona a extração de dados para o serviço de documentos de hipoteca, você precisa dos seguintes recursos:

  • Uma assinatura do Azure — você pode criar uma gratuitamente.

  • Uma instância de Document Intelligence no portal do Azure. Você pode usar o nível de preço gratuito (F0) para experimentar o serviço. Depois que o recurso for implantado, selecione Ir para o recurso para obter sua chave e o ponto de extremidade.

Captura de ecrã das chaves e da localização do ponto de extremidade no portal do Azure.

Estúdio de Inteligência de Documentação

  1. Na página inicial do Document Intelligence Studio, selecione hipoteca.

  2. Você pode analisar os documentos de hipoteca de amostra ou fazer upload de seus próprios arquivos.

  3. Selecione o botão Executar análise e, se necessário, configure as opções Analisar:

    Captura de tela dos botões Executar análise e Analisar opções no Document Intelligence Studio.

Idiomas e localidades suportados

Consulte a nossa página Suporte a idiomas — modelos pré-construídos para obter uma lista completa dos idiomas suportados.

Extração de campo 1003 Pedido Uniforme de Empréstimo Residencial (URLA)

A seguir estão os campos extraídos de um formulário 1003 URLA na resposta de saída JSON.

Nome Tipo Description Exemplo de saída
LenderLoanNumber String Número do empréstimo do mutuante ou identificador universal do empréstimo 10Bx939c5543TqA1144M999143X38
AgênciaCaseNumber String Número do processo da agência 115894
Mutuário Object Um objeto que contém os marcadores de identidade do mutuário, como nome, SSN, data de nascimento.
Co-mutuário Object Um objeto que contém os nomes do Co-Mutuário e a data assinada.
CurrentEmployment Object Um Objeto que contém informações sobre o emprego atual, incluindo: Nome do empregador, Número de telefone do empregador, Endereço do empregador.
Empréstimo Object Um objeto que contém informações de empréstimo, incluindo: montante, tipo de finalidade, tipo de refinanciamento.
Property objeto Um objeto que contém informações sobre a propriedade, incluindo: endereço, número de unidades, valor.

Os pares chave-valor 1003 URLA e os itens de linha extraídos estão na documentResults seção da saída JSON.

Extração de campo 1008 Subscrição uniforme e resumo de transmissão

A seguir estão os campos extraídos de um formulário 1008 na resposta de saída JSON.

Nome Tipo Description Exemplo de saída
Mutuário Object Um objeto que contém informações sobre o mutuário, incluindo: nome e número de mutuários.
Property Object Um objeto que contém informações sobre a propriedade, incluindo: endereço, status de ocupação, preço de venda.
Hipoteca Object Um objeto que contém informações sobre a hipoteca, incluindo: Tipo de empréstimo, tipo de amortização, tipo de finalidade do empréstimo.
Subscrição Object Um objeto que contém informações sobre as informações de subscrição, incluindo: nome do subscritor, nome do avaliador, rendimento do mutuário.
Vendedor Object Um objeto que contém informações sobre o vendedor, incluindo: Nome, endereço, número.

Os pares chave-valor do formulário 1008 e os itens de linha extraídos estão na documentResults seção da saída JSON.

Divulgação de fechamento de hipoteca de extração de campo

A seguir estão os campos extraídos de um formulário de divulgação de fechamento de hipoteca na resposta de saída JSON.

Nome Tipo Description Exemplo de saída
Fechar Object Um objeto que contém informações sobre as informações de fechamento, incluindo: Data de emissão, Data de encerramento, Data de desembolso.
Transação Object Um objeto que contém informações sobre as informações da transação, incluindo: nome do mutuário, endereço do mutuário, nome do vendedor.
Empréstimo Object Um objeto que contém informações de empréstimo, incluindo: prazo, finalidade, produto.

Os pares chave-valor de divulgação de fechamento de hipoteca documentResults e itens de linha extraídos estão na seção da saída JSON.

Próximos passos