Partajați prin


Extragerea datelor și numerelor din documente

Deși multe câmpuri care trebuie extrase sunt texte simple, există cazuri în care informațiile de extras sunt o dată sau un număr care include sume.

Importul acestor date într-un sistem țintă poate fi dificil, necesitând o logică de conversie personalizată semnificativă. Majoritatea conectorilor și API-urilor de import acceptă doar date normalizate în format ISO 8601, cum ar fi YYYY-MM-DD. De asemenea, acceptă doar numere care folosesc punct (.) ca separator zecimal, fără un separator de mii, cum ar fi NNN.DD.

Pentru a afla mai multe despre formatul datei, accesați Formatul datei și orei ISO 8601.

Am adăugat posibilitatea de a declara acest tip în timpul etapei de creare a câmpului din expert și de a alege o convenție de dată sau număr (echivalentă cu o setare regională).

Convenții de dată

Următorul exemplu prezintă o declarație de credit ipotecar cu un câmp de dată.

Captură de ecran a „Câmpului Dată” din „Prezentare generală”.

Următorul exemplu prezintă formate de câmpuri de dată.

Captură de ecran a formatelor „Câmp de dată”.

Formate de dată acceptate

La definirea câmpului, alegeți dintre An, Lună, Zi; Lună, Zi, An; sau Zi, Lună, An.

Următoarele caractere pot fi folosite ca delimitatori de dată: ,-/.\. Spațiile albe nu pot fi folosite ca delimitator. De exemplu:

  • 01,01,2020
  • 01-01-2020
  • 01/01/2020

Ziua și luna pot fi scrise fiecare cu una sau două cifre, iar anul poate avea două sau patru cifre:

  • 1-1-2020
  • 1-01-2020

Dacă un șir de date are opt cifre, delimitatorul este opțional:

  • 01012020
  • 01 01 2020

Luna poate fi scrisă și ca nume complet sau scurt. Dacă se folosește numele, caracterele delimitatoare sunt opționale. Totuși, acest format poate fi recunoscut mai puțin precis decât altele.

  • 01/Ian/2020
  • 01 ian. 2020
  • 01 ian. 2020

Convenții numerice

Următorul exemplu prezintă o declarație de credit ipotecar cu câmpuri numerice.

Captură de ecran a „Câmpului Număr” din „Prezentare generală”.

Următorul exemplu prezintă formate de câmpuri numerice.

Captură de ecran a formatelor „Câmp numeric”.

Notă

Pentru fiecare câmp, este permisă o singură convenție pentru un anumit câmp pentru toate colecțiile acestui model. De exemplu, dacă extrageți o valoare a unui câmp selectând Utilizați virgula (,) ca separator zecimal, următorul text 1234,56 sau 1 234,56 este convertit în 1234,56. Sumele cu formatul 12,34,576.78 sau 1.234,56 nu sunt convertite.

În timpul extragerii, textul se convertește automat conform convenției furnizate. Această valoare convertită poate fi recuperată folosind rezultatul YOURFIELDNAME value . Această valoare este goală dacă conversia nu este posibilă. Textul original poate fi recuperat folosind rezultatul YOURFIELDNAME text .

Formate numerice acceptate

Când definiți câmpul, alegeți fie Utilizați punct (.) ca separator zecimal , fie Utilizați virgulă (,) ca separator zecimal.

Când separatorul zecimal este un punct (.), separatorii de mii pot fi omiși și se poate folosi o virgulă (,) sau un spațiu alb. De exemplu:

  • 1234.56
  • 1,234.56
  • 1 234.56

Când separatorul zecimal este o virgulă (,), separatorii de mii sau spațiile albe pot fi omiși. De exemplu:

  • 1234,56
  • 1 234.56

Pasul următor

Antrenează și publică modelul tău de procesare a documentelor

Instruire: Procesarea documentelor personalizate cu AI Builder (modul)