Partilhar via


Extrair datas e números de documentos

Apesar de muitos campos a serem extraídos serem simples, existem casos em que as informações a extrair são uma data ou um número, incluindo montantes.

A importação deste dados para um sistema de destino pode ser um trabalho pesado, o que necessita de lógica de conversão personalizada significativa. A maioria dos conectores de importação e APIs só aceita datas normalizadas no formato ISO 8601, como YYYY-MM-DD. Também aceitam apenas números usando ponto (.) como separador decimal sem um separador de milhares como NNN.DD.

Para saber mais sobre o formato de data, aceda a Formato de data e hora ISO 8601.

Adicionámos a capacidade de declarar este tipo durante o passo de criação de campos do assistente e escolher uma convenção de data ou número (equivalente a uma região).

Convenções de datas

O exemplo seguinte mostra uma declaração de hipoteca com um campo de data.

Captura de ecrã do

O exemplo seguinte mostra formatos de campo de data.

Captura de ecrã dos formatos

Formatos de data suportados

Quando definir o campo, escolha entre Ano, Mês, Dia; Mês, Dia, Ano ou Dia, Mês, Ano.

Os seguintes caracteres podem ser utilizados como delimitadores de data: ,-/.\. O espaço branco não pode ser utilizado como delimitador. Por exemplo:

  • 01,01,2020
  • 01-01-2020
  • 01/01/2020

Cada dia e mês podem ser escritos com um ou dois dígitos, podendo o ano ser de dois ou quatro dígitos:

  • 1-1-2020
  • 1-01-20

Se uma cadeia de data tiver oito dígitos, o delimitador é opcional:

  • 01012020
  • 01 01 2020

O mês também pode ser escrito com o nome completo ou curto. Se o nome for utilizado, os caracteres delimitadores são opcionais. No entanto, este formato pode ser reconhecido de forma menos precisa que os outros.

  • 01/Jan/2020
  • 01Jan2020
  • 1 de janeiro de 2020

Convenções numéricas

O exemplo seguinte mostra uma declaração de hipoteca com campos de número.

Captura de ecrã do

O exemplo seguinte mostra formatos de campo de número.

Captura de ecrã dos formatos

Nota

Para cada campo, só é permitida uma convenção para um determinado campo para todas as coleções deste modelo. Por exemplo, se extrair um montante do campo selecionando Utilizar vírgula (,) como separador decimal, o texto seguinte 1234,56 ou 1 234,56 é convertido em 1234.56. Os montantes com o formato 1.234.576,78 ou 1.234,56 não são convertidos.

Durante a extração, o texto converte-se automaticamente de acordo com a convenção fornecida. Este valor convertido pode ser obtido utilizando o resultado YOURFIELDNAME value. Este valor está vazio se a conversão não for possível. O texto original pode ser recuperado utilizando o resultado YOURFIELDNAME text.

Formatos de números suportados

Ao definir o campo, escolha Utilizar ponto (.) como separador decimal ou Utilizar vírgula (,) como separador decimal.

Quando o separador decimal é um ponto (.), os separadores de milhares podem ser omitidos e uma vírgula (,) ou espaço em branco pode ser usado. Por exemplo:

  • 1234,56
  • 1.234,56
  • 1 234,56

Quando o separador decimal é uma vírgula (,), podem ser omitidos os separadores de milhares ou o espaço em branco. Por exemplo:

  • 1234,56
  • 1 234.56

Próximo passo

Preparar e publicar o modelo de processamento de documentos

Preparação: Processar documentos personalizados com o AI Builder (módulo)