Extrair datas e números de documentos
Apesar de muitos campos a serem extraídos serem simples, existem casos em que as informações a extrair são uma data ou um número, incluindo montantes.
A importação deste dados para um sistema de destino pode ser um trabalho pesado, o que necessita de lógica de conversão personalizada significativa. A maioria dos conectores de importação e APIs só aceita datas normalizadas no formato ISO 8601, como YYYY-MM-DD
. Também aceitam apenas números usando ponto (.
) como separador decimal sem um separador de milhares como NNN.DD
.
Para saber mais sobre o formato de data, aceda a Formato de data e hora ISO 8601.
Adicionámos a capacidade de declarar este tipo durante o passo de criação de campos do assistente e escolher uma convenção de data ou número (equivalente a uma região).
Convenções de datas
O exemplo seguinte mostra uma declaração de hipoteca com um campo de data.
O exemplo seguinte mostra formatos de campo de data.
Formatos de data suportados
Quando definir o campo, escolha entre Ano, Mês, Dia; Mês, Dia, Ano ou Dia, Mês, Ano.
Os seguintes caracteres podem ser utilizados como delimitadores de data: ,
-
/
.
\
. O espaço branco não pode ser utilizado como delimitador. Por exemplo:
- 01,01,2020
- 01-01-2020
- 01/01/2020
Cada dia e mês podem ser escritos com um ou dois dígitos, podendo o ano ser de dois ou quatro dígitos:
- 1-1-2020
- 1-01-20
Se uma cadeia de data tiver oito dígitos, o delimitador é opcional:
- 01012020
- 01 01 2020
O mês também pode ser escrito com o nome completo ou curto. Se o nome for utilizado, os caracteres delimitadores são opcionais. No entanto, este formato pode ser reconhecido de forma menos precisa que os outros.
- 01/Jan/2020
- 01Jan2020
- 1 de janeiro de 2020
Convenções numéricas
O exemplo seguinte mostra uma declaração de hipoteca com campos de número.
O exemplo seguinte mostra formatos de campo de número.
Nota
Para cada campo, só é permitida uma convenção para um determinado campo para todas as coleções deste modelo. Por exemplo, se extrair um montante do campo selecionando Utilizar vírgula (,) como separador decimal, o texto seguinte 1234,56 ou 1 234,56 é convertido em 1234.56. Os montantes com o formato 1.234.576,78 ou 1.234,56 não são convertidos.
Durante a extração, o texto converte-se automaticamente de acordo com a convenção fornecida. Este valor convertido pode ser obtido utilizando o resultado YOURFIELDNAME value
. Este valor está vazio se a conversão não for possível. O texto original pode ser recuperado utilizando o resultado YOURFIELDNAME text
.
Formatos de números suportados
Ao definir o campo, escolha Utilizar ponto (.) como separador decimal ou Utilizar vírgula (,) como separador decimal.
Quando o separador decimal é um ponto (.
), os separadores de milhares podem ser omitidos e uma vírgula (,
) ou espaço em branco pode ser usado. Por exemplo:
- 1234,56
- 1.234,56
- 1 234,56
Quando o separador decimal é uma vírgula (,
), podem ser omitidos os separadores de milhares ou o espaço em branco. Por exemplo:
- 1234,56
- 1 234.56
Próximo passo
Preparar e publicar o modelo de processamento de documentos
Informações relacionadas
Preparação: Processar documentos personalizados com o AI Builder (módulo)