Modelos de documentos hipotecários de Inteligência de Documentos
Esse conteúdo se aplica a: v4.0 (versão prévia)
Os modelos de hipoteca de inteligência documental usam recursos poderosos de reconhecimento óptico de caracteres (OCR) e modelos de aprendizagem profunda para analisar e extrair campos-chave de documentos hipotecários. Os documentos hipotecários podem ter vários formatos e qualidades. A API analisa documentos hipotecários e retorna uma representação estruturada de dados JSON. Atualmente, os modelos suportam apenas documentos em inglês.
Tipos de documento com suporte:
- Solicitação Uniforme de Empréstimo Residencial (Formulário 1003)
- Resumo de Subscrição e Transmissão Uniforme (Formulário 1008)
- Formulário de divulgação de fechamento
Opções de desenvolvimento
Informação de Documentos v4.0 (versão prévia de 29/02/2024) oferece suporte às seguintes ferramentas, aplicativos e bibliotecas:
Recurso | Recursos | ID do Modelo |
---|---|---|
Modelo hipotecário | • Estúdio da Informação de Documentos • API REST • SDK do C# • SDK do Python • SDK do Java • SDK do JavaScript |
• prebuilt-mortgage.us.1003 • prebuilt-mortgage.us.1008 • prebuilt-mortgage.us.closingDisclosure |
Requisitos de entrada
Para ter melhores resultados, forneça uma foto clara ou uma digitalização de alta qualidade por documento.
Formatos de arquivo com suporte:
Modelar PDF Imagem:
JPEG/JPG, PNG, BMP, TIFF, HEIFMicrosoft Office:
Word (DOCX), Excel (XLSX), PowerPoint (PPTX) e HTMLLer ✔ ✔ ✔ Layout ✔ ✔ ✔ (2024-02-29-preview, 2023-10-31-preview) Documento geral ✔ ✔ Predefinida ✔ ✔ Extração personalizada ✔ ✔ Classificação personalizada ✔ ✔ ✔ (2024-02-29-preview) Para PDF e TIFF, até 2000 páginas podem ser processadas (com uma assinatura de camada gratuita, somente as duas primeiras páginas são processadas).
O tamanho do arquivo para análise de documentos é 500 MB para a camada paga (S0) e 4 MB para a camada gratuita (F0).
As dimensões da imagem devem estar entre 50 x 50 pixels e 10.000 px x 10.000 pixels.
Se os PDFs estiverem com bloqueio de senha, você deverá remover o bloqueio antes do envio.
A altura mínima do texto a ser extraído é de 12 pixels para uma imagem de 1.024 x 768 pixels. Essa dimensão corresponde a um texto de cerca de
8
pontos a 150 pontos por polegada (DPI).Para treinamento de modelo personalizado, o número máximo de páginas para dados de treinamento é 500 para o modelo de modelo personalizado e 50.000 para o modelo neural personalizado.
Para treinamento de modelo de extração personalizado, o tamanho total dos dados de treinamento é de 50 MB para o modelo e 1G-MB para o modelo neural.
Para treinamento de modelo de classificação personalizado, o tamanho total dos dados de treinamento é
1GB
com no máximo 10.000 páginas.
Experimente a extração de dados de documentos hipotecários
Para ver como funciona a extração de dados do serviço de documentos hipotecários, você precisará dos seguintes recursos:
Uma assinatura do Azure: você pode criar uma gratuitamente.
Uma instância da Informação de Documentos no portal do Azure. Você pode usar o tipo de preço gratuito (
F0
) para experimentar o serviço. Depois que o recurso for implantado, selecione Ir para o recurso para obter a chave e o ponto de extremidade.
Estúdio de Informação de Documentos
Na página inicial do Estúdio da Informação de Documentos, selecione hipoteca.
Você pode analisar os documentos hipotecários de exemplo ou carregar seus próprios arquivos.
Selecione o botão Executar análise e, se necessário, configure as opções Analisar :
Idiomas e localidades com suporte
Confira nossa página Suporte ao idioma – modelos predefinidos, para obter uma lista completa dos idiomas compatíveis.
Extração de campo 1003 URLA (Solicitação Uniforme de Empréstimo Residencial)
A seguir estão os campos extraídos de um formulário do 1003 URLA na resposta de saída JSON.
Nome | Tipo | Descrição | Saída de exemplo |
---|---|---|---|
LenderLoanNumber | String | Número do empréstimo do credor ou do identificador universal do empréstimo | 10Bx939c5543TqA1144M999143X38 |
AgencyCaseNumber | String | Número do caso da agência | 115894 |
Devedor | Objeto | Um objeto que contém os marcadores de identidade do mutuário, como nome, SSN e data de nascimento. | |
Co-mutuário | Objeto | Um objeto que contém os nomes do Co-mutuário e a data de assinatura. | |
CurrentEmployment | Objeto | Um objeto que contém informações sobre o emprego atual, incluindo: nome do empregador, número de telefone do empregador, endereço do empregador. | |
Empréstimo | Objeto | Um objeto que contém informações de empréstimo, incluindo: valor, tipo de finalidade, tipo de refinanciamento. | |
Propriedade | objeto | Um objeto que contém informações sobre a propriedade, incluindo: endereço, número de unidades, valor. |
Os pares valor-chave e os itens de linha do 1003 URLA extraídos estão na seção documentResults
da saída JSON.
Extração de campo 1008 Resumo de Subscrição e Transmissão Uniforme
A seguir estão os campos extraídos de um formulário 1008 na resposta de saída JSON.
Nome | Tipo | Descrição | Saída de exemplo |
---|---|---|---|
Devedor | Objeto | Um objeto que contém informações sobre o mutuário, incluindo: nome e número de mutuários. | |
Propriedade | Objeto | Um objeto que contém informações sobre o imóvel, incluindo: endereço, status de ocupação, preço de venda. | |
Hipoteca | Objeto | Um objeto que contém informações sobre a hipoteca, incluindo: tipo de empréstimo, tipo de amortização, tipo de finalidade do empréstimo. | |
Subscrição | Objeto | Um objeto que contém informações sobre as informações de subscrição, incluindo: nome do segurador, nome do avaliador, renda do mutuário. | |
Vendedor | Objeto | Um objeto que contém informações sobre o vendedor, incluindo: nome, endereço, número. |
Os pares valor-chave do formulário 1008 e os itens de linha extraídos estão na seção documentResults
da saída JSON.
Divulgação de fechamento de hipoteca de extração de campo
A seguir estão os campos extraídos de um formulário de divulgação de fechamento de hipoteca na resposta de saída JSON.
Nome | Tipo | Descrição | Saída de exemplo |
---|---|---|---|
Fechamento | Objeto | Um objeto que contém informações sobre as informações de fechamento, incluindo: Data de emissão, Data de fechamento, Data de pagamento. | |
Transação | Objeto | Um objeto que contém informações sobre as informações da transação, incluindo: Nome do mutuário, Endereço do mutuário, Nome do vendedor. | |
Empréstimo | Objeto | Um objeto que contém informações sobre o empréstimo, incluindo: prazo, finalidade, produto. |
Os pares valor-chave de divulgação do fechamento da hipoteca e os itens de linha extraídos estão na seção documentResults
da saída JSON.
Próximas etapas
Experimente processar seus próprios formulários e documentos com o Estúdio da Informação de Documentos.
Execute um início rápido do serviço Informação de Documentos e comece a criar um aplicativo de processamento de documentos na linguagem de desenvolvimento de sua escolha.
Comentários
https://aka.ms/ContentUserFeedback.
Em breve: Ao longo de 2024, eliminaremos os problemas do GitHub como o mecanismo de comentários para conteúdo e o substituiremos por um novo sistema de comentários. Para obter mais informações, consulteEnviar e exibir comentários de