Bagikan melalui


Tandai dokumen

Dengan menandai dokumen yang telah Anda unggah, Anda mengajarkan model Anda AI Builder untuk mengekstrak bidang dan tabel yang telah Anda tentukan.

Untuk mulai memberi tag, pilih salah satu koleksi di panel kanan.

Bidang tag

Untuk menandai bidang, gambar persegi panjang di sekitar bidang yang Anda minati dan pilih nama bidang yang sesuai dengannya.

Animasi bidang penandaan dalam dokumen.

Kapan saja, Anda dapat mengubah ukuran untuk menyesuaikan pilihan Anda.

Jika kolom berakhir pada satu baris dan dimulai pada baris lain, Anda dapat menandainya menggunakan opsi 'Lanjutkan penandaan' .

Animasi menandai beberapa kata dan jeda baris.

Anda juga dapat menggunakan tombol Control di Windows atau Command ⌘ di macOS untuk menandai beberapa kata sekaligus. Anda juga dapat menggunakan tombol Shift untuk memilih kata pertama dan terakhir untuk menandai semua kata di antara keduanya.

Saat Anda mengarahkan kursor ke kata-kata di dokumen, kotak biru muda mungkin muncul. Ini menunjukkan bahwa Anda dapat menggambar persegi panjang di sekitar kata-kata tersebut untuk memilih bidang.

Tangkapan layar memilih bidang dari jarak dekat.

Hanya untuk model Faktur kustom

Anda dapat mengganti perilaku bidang default dengan menggambar ulang kotak pembatas yang ada.

Cuplikan layar perilaku penggantian bidang default.

Bidang default faktur yang tidak terdeteksi secara otomatis dalam dokumen Anda ditandai sebagai "Tidak ada dalam dokumen". Anda dapat mengubahnya menjadi Tersedia di dokumen dan menandainya secara manual jika ada.

Tangkapan layar bidang yang tersedia di dokumen.

Saat memberi tag, pilih Kustom untuk menampilkan daftar bidang yang tidak diberi tag yang telah Anda tambahkan, dan pilih Default untuk menampilkan bidang default yang tidak diberi tag yang ditandai sebagai 'Tersedia di dokumen'.

Tangkapan layar tampilan default.

Tabel tag

  1. Gambar persegi panjang di sekitar tabel dalam dokumen yang Anda minati, lalu pilih nama tabel yang sesuai dengannya. Isi panel di sebelah kanan berubah.

  2. Gambar baris dengan mengklik kiri di antara pemisah baris.

  3. Gambar kolom dengan menekan Ctrl + klik kiri.

  4. Setelah baris dan kolom diatur, tetapkan header untuk diekstrak dengan memilih kolom header dan memetakannya ke kolom yang diinginkan.

  5. Pratinjau tentang bagaimana tabel akan diekstraksi muncul di panel di sebelah kanan.

  6. Jika header tabel telah diberi tag, pilih Abaikan baris pertama sehingga header tabel tidak diekstraksi sebagai konten tabel.

Animasi berikut mengilustrasikan prosesnya:

Animasi menandai tabel dalam dokumen.

Cara alternatif untuk menentukan baris dan kolom untuk tabel adalah dengan memilih Batasi baris dan kolom di bagian atas layar.

Tangkapan layar batas baris dan kolom.

Menggunakan mode pemberian tag lanjutan

Mode penandaan lanjutan memungkinkan Anda menandai tabel di tingkat sel. Gunakan mode ini untuk tabel kompleks seperti:

  • Tabel yang miring, di mana pemberian tag dengan kisi tidak dimungkinkan.
  • Saat Anda perlu mengekstrak item berlapis, seperti item dalam sel.

Mengingat tabel dari contoh berikut, untuk mengekstrak harga satuan, kita akan mendefinisikannya sebagai kolom terpisah pada langkah Pilihinformasi untuk diekstrak. Kami mendefinisikan Deskripsi, Harga satuan , Kuantitas , danJumlah masing-masing sebagai kolom tabel dan menandainya sesuai dengan mode penandaan lanjutan. Lihat animasi di bawah ini.

Animasi baris dan kolom yang dibatasi.

Anda dapat mulai memberi tag dalam mode default untuk menangkap semua baris dan kolom dengan cepat. Kemudian beralih ke mode lanjutan untuk menyesuaikan setiap sel dan menandai item berlapis.

Item berlapis dalam tabel

Anda dapat menandai item yang bersarang dalam baris dengan mendefinisikannya sebagai kolom. Mengingat tabel dari contoh di bawah ini, untuk mengekstrak harga satuan, tentukan sebagai kolom terpisah pada langkah Pilih informasi untuk diekstrak sebelumnya dalam topik ini. Tentukan Deskripsi, Harga satuan, Kuantitas , dan Jumlah masing-masing sebagai kolom tabel dan kemudian tandai sesuai dengan itu.

Cuplikan layar menandai item berlapis dalam tabel.

Tabel multihalaman

Jika tabel mencakup lebih dari satu halaman, pastikan Anda menandainya di semua halaman. Setelah Anda selesai menandai tabel pada satu halaman, pilih Tabel ini berlanjut di halaman berikutnya dan lanjutkan memberi tag pada tabel di halaman berikutnya. Dengan melakukan ini, Anda akan mengajarkan model bahwa tabel dapat menjangkau beberapa halaman.

Screenshot menunjukkan untuk memilih opsi 'Tabel ini berlanjut di halaman berikutnya' untuk melanjutkan menandai tabel yang mencakup beberapa halaman.

Setelah Anda menandai semua halaman di mana tabel ada. Pilih Selesai untuk menandai tabel sebagai ditandai sepenuhnya.

Anda dapat memberi tag pada tabel kompleks yang memiliki sel gabungan, item berlapis, batas atau tanpa batas, atau bahkan elemen yang tidak terduga seperti noda kopi, seperti yang ditunjukkan dalam contoh berikut.

Tangkapan layar menunjukkan untuk memilih opsi 'Selesai' setelah tabel ditandai di semua halaman.

Tip

Sebagai praktik terbaik, pastikan Anda mengunggah dokumen untuk pelatihan dengan variasi yang diharapkan. Misalnya, sertakan sampel di mana seluruh tabel berada pada satu halaman dan di mana tabel mencakup dua halaman atau lebih.

Kotak centang tag

Untuk menandai kotak centang, gambar persegi panjang di sekitar kotak centang yang ingin Anda ekstrak dan pilih nama kotak centang yang sesuai dengannya.

Animasi menandai kotak centang.

Jika kualitas dokumen rendah, AI Builder mungkin tidak dapat mendeteksi kotak centang. Jika Anda tidak dapat menandai kotak centang, lakukan hal berikut:

  1. Pada panel di sebelah kanan, pilih tiga titik di sebelah kotak centang yang ingin Anda ekstraksi.

  2. Pilih Tidak tersedia dalam dokumen.

AI Builder Mendukung deteksi dan ekstraksi tanda pilihan seperti kotak centang dan tombol radio, dengan penanda berbeda untuk menunjukkan apakah pilihan ditandai atau tidak.

Bidang, kotak centang, tabel, tidak ada dalam dokumen atau tidak dalam koleksi

Jika bidang, kotak centang, atau tabel tidak ada di salah satu dokumen atau dalam koleksi yang telah Anda unggah untuk pelatihan, pilih Tidak tersedia dalam dokumen atau Tidak tersedia dalam koleksi pada panel di sebelah kanan, di samping bidang, kotak centang, atau tabel.

Animasi bidang atau tabel tidak ada dalam dokumen atau tidak dalam koleksi.

Menandai semua dokumen di semua koleksi

Semua dokumen yang telah Anda unggah disajikan untuk Anda tandai. Jika Anda telah membuat beberapa koleksi, tandai semua dokumen di semua koleksi.

Jika bidang tidak dapat ditandai dalam dokumen Anda, buka Bidang tidak dapat dimuat untuk dokumen ini untuk kemungkinan resolusi.

Langkah selanjutnya

Ekstrak tanggal dan angka

Pelatihan: Memproses dokumen khusus dengan AI Builder (modul)