Jagamisviis:


Kuupäevade ja numbrite väljavõte dokumentidest

Kuigi paljud ekstraktitavad väljad on lihtsad tekstid, on juhtumeid, kus ekstraktitav teave on kuupäev või arv, mis sisaldab summasid.

Nende andmete importimine sihtsüsteemi võib olla tülikas, nõudes märkimisväärset kohandatud teisendusloogikat. Enamik impordikonnektoreid ja API-sid aktsepteerivad ainult normaliseeritud kuupäevi ISO 8601 vormingus, näiteks YYYY-MM-DD. Samuti aktsepteerivad nad ainult numbreid, mis kasutavad kümnendkoha eraldajana punkti (.), ilma tuhandete eraldajata NNN.DD.

Lisateavet kuupäevavormingu kohta leiate jaotisest ISO 8601 Kuupäeva ja kellaaja vorming.

Lisasime võimaluse deklareerida seda tüüpi viisardi välja loomise etapis ja valida kuupäeva või numbri konventsioon (samaväärne lokaadiga).

Kuupäeva kokkulepped

Järgmises näites on kujutatud hüpoteegi väljavõte koos kuupäevaväljaga.

Kuvatõmmis

Järgmises näites on näidatud kuupäevavälja vormingud.

Kuvatõmmis kuupäevavälja vormingutest.

Toetatud kuupäevavormingud

Välja määratlemisel valige Aasta , Kuu, Päev; Kuu, päev, aasta; või päev, kuu, aasta.

Kuupäeva eraldajatena saab kasutada järgmisi märke: ,-/.\. Tühikuid ei saa kasutada eraldajana. Näiteks:

  • 01,01,2020
  • 01-01-2020
  • 01/01/2020

Päeva ja kuu võib kirjutada ühe või kahe numbrina ning aasta võib olla kahe- või neljakohaline:

  • 1-1-2020
  • 1-01-20

Kui kuupäevastringil on kaheksa numbrit, on eraldaja valikuline.

  • 01012020
  • 01 01 2020

Kuu võib kirjutada ka täis- või lühinimena. Kui nime kasutatakse, on eraldamismärgid valikulised. Seda vormingut võidakse siiski vähem täpselt ära tunda kui teisi.

  • 01/jaan/2020
  • 01jaan2020
  • 01 jaan 2020

Arvulised kokkulepped

Järgmises näites on kujutatud hüpoteegi väljavõtte numbriväljadega.

Kuvatõmmis

Järgmises näites on näidatud arvuväljade vormingud.

Kuvatõmmis

Märkus.

Iga välja jaoks on antud välja jaoks lubatud ainult üks konventsioon kõigi selle mudeli kogude jaoks. Näiteks kui ekstraktite välja summa, valides käsu Kasuta koma (,) kümnendkoha eraldajana, teisendatakse järgmine tekst 1234,56 või 1 234,56 väärtuseks 1234,56. Summasid vormingus 12,34,576.78 või 1 234,56 ei teisendata.

Ekstraheerimise ajal teisendatakse tekst automaatselt vastavalt pakutavale kokkuleppele. Seda teisendatud väärtust saab tulemi abil YOURFIELDNAME value tuua. See väärtus on tühi, kui teisendamine pole võimalik. Algteksti saab tulemuse YOURFIELDNAME text abil kätte saada.

Toetatud arvuvormingud

Välja määratlemisel valige kas Kasuta kümnendkoha eraldajana punkti (.) või Kasuta koma (,) kümnendkoha eraldajana.

Kui kümnendkoha eraldaja on punkt (),. võib tuhande eraldaja ära jätta ja kasutada koma (,) või tühikut. Näiteks:

  • 1234.56
  • 1,234.56
  • 1 234.56

Kui kümnendkoha eraldaja on koma (,), võib tuhande eraldaja või tühiku ära jätta. Näiteks:

  • 1234,56
  • 1 234.56

Järgmine etapp

Dokumenditöötlusmudeli koolitamine ja avaldamine

Koolitus: Kohandatud dokumentide töötlemine mooduliga AI Builder