Aracılığıyla paylaş


Belgelerdeki tarihleri ve sayıları ayıklama

Ayıklanacak çoğu alan basit metin olmakla birlikte ayıklanacak bilgilerin tarih ve tutarlar dahil sayı olduğu bazı durumlar vardır.

Bu verilerin bir hedef sisteme aktarılması çok hantal olabilir ve özel bir dönüştürme mantığı gerektirir. İçeri aktarma bağlayıcılarının ve API'lerin çoğu yalnızca YYYY-MM-DD gibi ISO 8601 formatında normalleştirilmiş tarihleri kabul eder. Ayrıca, NNN.DD gibi binlik ayırıcısı olmadan onluk ayırıcısı olarak nokta (.) kullanılan sayıları kabul eder.

Tarih biçimi hakkında daha fazla bilgi için ISO 8601 Tarih ve saat biçimine gidin.

Sihirbazın alan oluşturma adımı sırasında bu türü bildirme yeteneğini ve bir tarih veya sayı kuralı (yerel ayara eşdeğer) seçme yeteneğini ekledik.

Tarih kuralları

Aşağıdaki örnekte, tarih alanı olan bir konut kredisi bildirimi gösterilmektedir.

Aşağıdaki örnekte, tarih alanı biçimleri gösterilmektedir.

Desteklenen tarih biçimleri

Alanı tanımlarken Yıl, Ay, Gün; Ay, Gün, Yıl veya Gün, Ay, Yıl arasından seçim yapın.

Aşağıdaki karakterler tarih sınırlandırıcısı olarak kullanılabilir: ,-/.\. Boşluk, sınırlayıcı olarak kullanılamaz. Örneğin:

  • Kategori 01,01,2020
  • 01-01-2020
  • 01/01/2020

Gün ve ay her biri bir veya iki basamak olarak yazılabilir ve yıl iki veya dört basamaklı olabilir:

  • 1-1-2020
  • 1-01-20

Tarih dizesinin sekiz basamağı varsa ayırıcı isteğe bağlıdır:

  • Kategori 01012020
  • 01 01 2020

Ay, tam veya kısa ad olarak da yazılabilir. Ad kullanılırsa, sınırlayıcı karakterler isteğe bağlıdır. Ancak, bu biçim diğerlerinden daha az doğru olarak tanınabilir.

  • 01/Oca/2020
  • 01Oca2020
  • 01 Oca 2020

Sayı kuralları

Aşağıdaki örnekte, sayı alanları olan bir konut kredisi bildirimi gösterilmektedir.

Aşağıdaki örnekte, sayı alanı biçimleri gösterilmektedir.

Not

Her bir alan için, bu modelin tüm koleksiyonlarında belirli bir alan için yalnızca bir kurala izin verilir. Örneğin, Ondalık ayırıcı olarak virgül (,) kullan seçerek bir alan ayıklarsanız aşağıdaki metin 1234,56 veya 1 234,56 öğesi 1234.56'ya dönüştürülür. 12,34,576.78 veya 1,234.56 biçimine sahip tutarlar dönüştürülmez.

Çıkarma sırasında, metin sağlanan kurala göre otomatik olarak dönüştürülür. Bu dönüştürülen değer, YOURFIELDNAME value sonucu kullanılarak alınabilir. Dönüştürme mümkün değilse bu değer boş olur. Özgün metin YOURFIELDNAME text sonucu kullanılarak alınabilir.

Desteklenen sayı biçimleri

Alanı tanımlarken, Ondalık ayırıcı olarak (.) kullan veya Ondalık ayırıcı olarak virgül (,) kullan'ı seçin.

Ondalık ayırıcı nokta (.) olduğunda binlik ayırıcılar atlanabilir ve virgül (,) veya boşluk kullanılabilir. Örneğin:

  • Kategori 1234.56
  • Kategori 1,234.56
  • 1 234.56

Ondalık ayırıcı bir virgül (,) olduğunda, binler ayırıcıları veya boşluk atlanabilir. Örneğin:

  • Kategori 1234,56
  • 1 234.56

Sonraki adım

Belge işleme modelinizi eğitme ve yayımlama

Eğitim: AI Builder ile özel belgeleri işleme (modül)