Bagikan melalui


Tanya Jawab Umum tentang pemrosesan dokumen

Artikel ini terdiri dari pertanyaan umum tentang model pemrosesan dokumen di AI Builder. Jika Anda tidak menemukan pertanyaan Anda di sini, tinjau Ringkasan model AI pemrosesan dokumen atau kirimkan pertanyaan Anda ke Power Automate Komunitas AI Builder.

Fungsi

Apa yang dapat saya lakukan dengan pemrosesan dokumen?

Dengan pemrosesan dokumen, Anda dapat membangun model AI khusus untuk mengekstrak informasi dari berbagai jenis dokumen.

  • Opsi Dokumen templat tetap sangat ideal jika elemen dokumen Anda dapat ditemukan di tempat yang sama. Biasanya terjadi pada faktur, pesanan pembelian, pesanan pengiriman, dan formulir pajak.
  • Opsi dokumen umum sangat ideal untuk semua jenis dokumen, termasuk yang didukung oleh opsi pertama tetapi juga kontrak, pernyataan kerja, surat, dan lain-lain. Opsi ini bisa lebih kuat untuk mengekstrak data, tetapi membutuhkan waktu pelatihan yang lebih lama.

Pelajari selengkapnya di Gambaran umum model pemrosesan dokumen.

Jenis dokumen apa yang dapat ditangani oleh pemrosesan dokumen?

Jenis file yang didukung adalah PDF, JPG, dan PNG.

Data apa yang dapat saya ekstrak dari dokumen dengan menggunakan pemrosesan dokumen?

Pemrosesan dokumen dapat mengekstrak bidang, tabel, dan kotak centang dari dokumen.

Pelajari lebih lanjut di Menentukan informasi yang akan diekstrak.

Bisakah saya mengekstrak teks tulisan tangan dari dokumen?

Ya. Pemrosesan dokumen dapat mengekstrak teks cetak dan tulisan tangan dari dokumen Anda.

Berapa banyak sampel yang saya perlukan untuk melatih model pemrosesan dokumen?

Untuk dokumen berkualitas tinggi yang menggunakan tata letak yang sama, lima dokumen sampel harus cukup. Untuk dokumen berkualitas rendah (misalnya, pemindaian dengan kualitas buruk), lebih banyak dokumen sampel mungkin diperlukan. Untuk meningkatkan hasil, gunakan 15 hingga 20 dokumen sampel.

Praktik terbaik

  • Untuk dokumen templat

    • Satu (1) tata letak per koleksi.
    • Tata letak harus identik dalam koleksi yang sama.
    • Minimal lima (5) dan maksimal 20 dokumen per koleksi (jangan melebihi batas ini).
  • Untuk dokumen umum

    • Buat satu model untuk semua variasi jenis dokumen, termasuk dokumen terstruktur dan tidak terstruktur.

    • Beri label bidang yang relevan dengan nilainya untuk akurasi ekstraksi yang lebih baik.

      Misalnya, gunakan "supplier_id" untuk ID pemasok. Nama bidang harus cocok dengan bahasa dokumen.

    • Minimal lima (5) dan maksimal 20 dokumen per koleksi (jangan melebihi batas ini).

Model saya saat ini diterbitkan di v3.1 (GA), dan saya berencana untuk melatihnya ulang menggunakan v4.0 (GA). Apakah perlu menandai ulang semua dokumen saya?

Kecuali Anda menambahkan kolom baru, kotak centang, tabel, tanda tangan untuk ekstraksi data, atau dokumen baru ke koleksi, Anda tidak perlu menandai ulang semua dokumen.

Sebelum menerbitkan model Anda, disarankan untuk menguji model Anda dengan cepat menggunakan satu atau beberapa sampel untuk memverifikasi dan memastikan semua bidang yang Anda inginkan diekstrak dengan benar.

Bisakah saya beralih dari satu jenis dokumen ke jenis dokumen lainnya?

Ya, saat mengedit model Anda, Anda dapat beralih antara jenis dokumen templat tetap dan jenis dokumen umum. Namun, pengalihan ini tidak didukung untuk faktur.

Dapatkah satu model pemrosesan formulir mengekstrak informasi dari dokumen yang memiliki tata letak atau templat yang berbeda?

Ya. Dengan menggunakan fitur koleksi, Anda melatih satu model pemrosesan formulir untuk menangani dokumen yang memiliki tata letak yang berbeda.

Pelajari lebih lanjut di Kelompokkan dokumen menurut koleksi.

Bisakah pemrosesan dokumen menangani beberapa formulir dalam satu dokumen?

Setiap formulir harus dalam file terpisah. Misalnya, jika Anda memiliki dokumen PDF dengan beberapa faktur di dalamnya, buat file terpisah untuk setiap faktur sebelum Anda mengirimkannya ke model pemrosesan dokumen.

Anda juga dapat menentukan halaman untuk ditangani oleh model pemrosesan dokumen. Dengan cara ini Anda dapat memanfaatkan fungsionalitas model untuk mengulang halaman demi halaman, dan memproses satu formulir pada satu waktu.

Pelajari lebih lanjut di Rentang halaman.

Saya melatih model pemrosesan dokumen, tetapi saya tidak mendapatkan hasil yang baik dalam hal data yang diekstraksi. Bagaimana saya bisa meningkatkan model?

Jika model Anda menampilkan hasil yang buruk setelah Anda melatihnya, edit model dan berikan lebih banyak sampel untuk pelatihan. Semakin banyak sampel yang Anda berikan, semakin banyak model AI mempelajari cara mengekstrak data dari dokumen Anda.

Pelajari selengkapnya di Meningkatkan performa model pemrosesan dokumen Anda.

Pembatasan

Berapa jumlah maksimum dokumen yang dapat saya proses?

Anda dapat memproses hingga 360 dokumen per lingkungan, setiap 60 detik.

Mengapa beberapa karakter salah dikenali?

  • Bisa terjadi bahwa beberapa karakter menjadi bingung: 0 (angka) dan O (huruf), 1 (angka) dan l (huruf), 4 (angka) dan A (huruf), dan banyak lagi.
  • Bisa terjadi bahwa beberapa karakter di atas atau dekat dengan yang lain salah dikenali: O (huruf) di atas garis vertikal menjadi 0 (angka), 5 (angka) di atas baris menjadi $ (tanda dolar Amerika), l_ (huruf kecil, garis bawah) menjadi L (huruf besar), dan banyak lagi.
  • Bisa terjadi bahwa beberapa karakter pada dokumen berkualitas buruk tidak dikenali dengan benar, atau tidak sama sekali.

Dalam kasus sebelumnya, tidak ada yang bisa dilakukan untuk AI Builder meningkatkan pengakuan. Kami merekomendasikan untuk meningkatkan kualitas dan tata letak dokumen sumber untuk memecahkan masalah serupa.

Catatan

Microsoft terus meningkatkan teknologi pengenalan karakter optik (OCR) untuk mendeteksi karakter, sehingga masalah seperti itu lebih jarang terjadi.

Bisakah saya membuat model dengan banyak koleksi?

Anda dapat membuat hingga 200 koleksi per model. Namun, melatih model dokumen umum dengan puluhan koleksi dapat memakan waktu beberapa jam dan—dalam kesempatan yang jarang terjadi—waktu habis. Jika model Anda memiliki jumlah koleksi yang tinggi, perkirakan untuk menunggu hingga 24 jam hingga pelatihan model selesai.

Bisakah saya membuat model dalam solusi?

Saat ini, tidak mungkin membuat model dalam solusi.

Bisakah saya menggunakan kontrak dan surat dalam model pemrosesan dokumen saya?

Ya, dokumen tidak terstruktur seperti kontrak dan surat didukung oleh pemrosesan dokumen, menggunakan opsi Dokumen umum.

Perbandingan

Apa perbedaan antara pemrosesan dokumen, pemrosesan faktur, pemrosesan tanda terima, pembaca dokumen identitas, pembaca kartu nama, dan pengenalan teks?

Tergantung pada situasi Anda, Anda mungkin perlu menggunakan model tertentu atau kombinasinya.

Gunakan pengenalan teks saat Anda ingin mengekstrak semua teks yang ada dalam gambar atau PDF. Anda kemudian, misalnya, dapat mencari kata kunci dalam teks yang diekstrak, atau membuat beberapa aturan tetap untuk mengekstrak item tertentu.

Jika Anda ingin mengekstrak informasi dari faktur, tanda terima, paspor, SIM, atau kartu nama, mulailah dengan model bawaan yang sesuai:

Anda dapat segera menggunakan model bawaan ini, tanpa harus membuat model baru. Model-model ini dapat mengekstrak informasi umum yang ditemukan dalam jenis dokumen yang sesuai.

Untuk jenis dokumen lainnya, Anda dapat membuat model pemrosesan dokumen kustom untuk mengekstrak bidang dan tabel yang Anda butuhkan. Ini juga berlaku jika Anda memerlukan informasi tambahan yang tidak disediakan oleh model bawaan.

Pelajari selengkapnya di Model pemrosesan dokumen kustom.

Apa perbedaan antara AI Builder pemrosesan dokumen dan Azure Form Recognizer?

AI Builder pemrosesan dokumen dibangun di atas Azure Form Recognizer. Ini memberi kedua produk kemajuan terbaru dalam Microsoft AI.

  • AI Builder adalah bagian dari Microsoft Power Platform. Hal ini memungkinkan siapa saja untuk menambahkan AI ke dalam aplikasi dan otomatisasi dengan antarmuka yang mudah digunakan. Anda tidak perlu menjadi pengembang atau ilmuwan data.

  • Azure Form Recognizer ditargetkan untuk pengembang profesional. Mereka dapat menggunakan REST API sederhana untuk menambahkan kemampuan AI ke solusi kode kustom mereka.

Opsi biaya

Berapa AI Builder biaya pemrosesan dokumen?

Anda dapat mulai mencoba pemrosesan dokumen secara gratis dengan memulai uji coba. Setelah Anda mengevaluasinya, Anda perlu membeli AI Builder kredit untuk menggunakan pemrosesan dokumen. Setiap halaman yang Anda proses dengan pemrosesan dokumen menggunakan AI Builder kredit, meskipun halaman tersebut tidak berisi data untuk diekstrak. AI Builder Kredit dapat dibeli melalui AI Builder add-on.

Pelajari lebih lanjut tentang AI Builder lisensi.