Bagikan melalui


Ekstrak tanggal dan nomor dari dokumen

Meskipun banyak bidang yang akan diekstraksi adalah teks sederhana, ada beberapa kasus di mana informasi yang akan diekstraksi adalah tanggal atau angka termasuk jumlah.

Mengimpor data ini ke sistem target bisa jadi rumit dan memerlukan logika konversi khusus yang signifikan. Sebagian besar konektor impor dan API hanya menerima tanggal yang dinormalisasi dalam format ISO 8601 seperti YYYY-MM-DD. Mereka juga hanya menerima angka yang menggunakan titik (.) sebagai pemisah desimal tanpa pemisah ribuan seperti NNN.DD.

Untuk mempelajari lebih lanjut tentang format tanggal, kunjungi Format tanggal dan waktu ISO 8601.

Kami telah menambahkan kemampuan untuk mendeklarasikan jenis ini selama langkah pembuatan bidang panduan, dan untuk memilih konvensi tanggal atau angka (setara dengan lokal).

Konvensi tanggal

Contoh berikut menunjukkan laporan hipotek dengan kolom tanggal.

Tangkapan layar 'Bidang tanggal' di 'Ringkasan'.

Contoh berikut memperlihatkan format bidang tanggal.

Tangkapan layar format 'Bidang tanggal'.

Format tanggal yang didukung

Saat menentukan bidang, pilih di antara Tahun, Bulan, Tanggal; Bulan, Tanggal, Tahun; atau Tanggal, Bulan, Tahun.

Karakter berikut dapat digunakan sebagai pembatas tanggal: ,-/.\. Ruang kosong tidak dapat digunakan sebagai pemisah. Contoh:

  • 01,01,2020
  • 01-01-2020
  • Tanggal: 01/01/2020

Hari dan bulan masing-masing dapat ditulis sebagai satu atau dua digit, dan tahun dapat ditulis sebagai dua atau empat digit:

  • 1-1-2020
  • Tanggal 01-01-20

Jika rangkaian tanggal memiliki delapan digit, pemisah bersifat opsional:

  • 01012020
  • 01 01 2020

Bulan juga dapat ditulis sebagai nama lengkap atau pendeknya. Jika nama digunakan, karakter pembatas bersifat opsional. Namun, format ini mungkin dikenali kurang akurat dibandingkan format lainnya.

  • 01/Januari/2020
  • 01 Januari 2020
  • 01 Januari 2020

Konvensi angka

Contoh berikut menunjukkan pernyataan hipotek dengan bidang nomor.

Tangkapan layar 'Bidang angka' di 'Ringkasan'.

Contoh berikut memperlihatkan format bidang angka.

Tangkapan layar format 'Bidang angka'.

Catatan

Untuk setiap bidang, hanya satu konvensi yang diizinkan untuk bidang tertentu untuk semua koleksi model ini. Misalnya, jika Anda mengekstrak jumlah bidang dengan memilih Gunakan koma (,) sebagai pemisah desimal, teks berikut 1234,56 atau 1 234,56 diubah menjadi 1234,56. Jumlah dengan format 12,34,576.78 atau 1.234,56 tidak dikonversi.

Selama ekstraksi, teks secara otomatis dikonversi sesuai dengan konvensi yang diberikan. Nilai yang dikonversi ini dapat diambil menggunakan YOURFIELDNAME value hasil. Nilai ini kosong jika konversi tidak memungkinkan. Teks asli dapat diambil menggunakan YOURFIELDNAME text hasil.

Format angka yang didukung

Saat menentukan bidang, pilih Gunakan titik (.) sebagai pemisah desimal atau Gunakan koma (,) sebagai pemisah desimal.

Jika pemisah desimal berupa titik (.), pemisah ribuan dapat dihilangkan, dan koma (,) atau spasi dapat digunakan. Contoh:

  • 1234.56
  • 1,234.56
  • 1 234.56

Jika pemisah desimal adalah koma (,), pemisah ribuan atau spasi dapat dihilangkan. Contoh:

  • 1234,56
  • 1 234.56

Langkah selanjutnya

Melatih dan menerbitkan model pemrosesan dokumen Anda

Pelatihan: Memproses dokumen khusus dengan AI Builder (modul)