Ambil perhatian
Akses ke halaman ini memerlukan kebenaran. Anda boleh cuba log masuk atau menukar direktori.
Akses ke halaman ini memerlukan kebenaran. Anda boleh cuba menukar direktori.
Artikel ini terdiri daripada soalan lazim tentang model pemprosesan dokumen dalam AI Builder. Jika anda tidak menemui soalan anda di sini, semak Gambaran Keseluruhan model AI pemprosesan dokumen atau serahkan soalan anda kepada Power Automate Komuniti AI Builder.
Fungsi
Apakah yang boleh saya lakukan dengan pemprosesan dokumen?
Dengan pemprosesan dokumen, anda boleh membina model AI tersuai untuk mengekstrak maklumat daripada pelbagai jenis dokumen.
- Pilihan Dokumen templat tetap sesuai jika elemen dokumen anda boleh didapati di tempat yang serupa. Ia biasanya berlaku untuk invois, pesanan pembelian, pesanan penghantaran dan borang cukai.
- Pilihan dokumen am sesuai untuk sebarang jenis dokumen, termasuk yang disokong oleh pilihan pertama tetapi juga kontrak, pernyataan kerja, surat dan lain-lain. Pilihan ini boleh menjadi lebih berkuasa untuk mengekstrak data, tetapi memerlukan masa latihan yang lebih lama.
Ketahui lebih lanjut dalam Gambaran keseluruhan model pemprosesan dokumen.
Apakah jenis dokumen yang boleh dikendalikan oleh pemprosesan dokumen?
Jenis fail yang disokong ialah PDF, JPG dan PNG.
Apakah data yang boleh saya ekstrak daripada dokumen dengan menggunakan pemprosesan dokumen?
Pemprosesan dokumen boleh mengekstrak medan, jadual dan kotak semak daripada dokumen.
Ketahui lebih lanjut dalam Takrifkan maklumat untuk diekstrak.
Bolehkah saya mengekstrak teks tulisan tangan daripada dokumen?
Ya. Pemprosesan dokumen boleh mengekstrak teks bercetak dan tulisan tangan daripada dokumen anda.
Berapa banyak sampel yang saya perlukan untuk melatih model pemprosesan dokumen?
Untuk dokumen berkualiti tinggi yang menggunakan susun atur yang sama, lima dokumen sampel sepatutnya mencukupi. Untuk dokumen berkualiti rendah (contohnya, imbasan berkualiti rendah), lebih banyak dokumen sampel mungkin diperlukan. Untuk meningkatkan keputusan, gunakan 15 hingga 20 dokumen sampel.
Amalan terbaik
Untuk dokumen templat
- Satu (1) susun atur bagi setiap koleksi.
- Susun atur mestilah sama dalam koleksi yang sama.
- Sekurang-kurangnya lima (5) dan maksimum 20 dokumen setiap koleksi (jangan melebihi had ini).
Untuk dokumen am
Cipta satu model untuk semua variasi jenis dokumen termasuk kedua-dua dokumen berstruktur dan tidak berstruktur.
Label medan yang berkaitan dengan nilainya untuk ketepatan pengekstrakan yang lebih baik.
Contohnya, gunakan "supplier_id" untuk ID pembekal. Nama medan hendaklah sepadan dengan bahasa dokumen.
Sekurang-kurangnya lima (5) dan maksimum 20 dokumen setiap koleksi (jangan melebihi had ini).
Model saya kini diterbitkan dalam v3.1 (GA), dan saya merancang untuk melatihnya semula menggunakan v4.0 (GA). Adakah perlu untuk menandakan semula semua dokumen saya?
Melainkan anda menambah medan baharu, kotak semak, jadual, tandatangan untuk pengekstrakan data atau dokumen baharu pada koleksi, anda tidak perlu mengetag semula semua dokumen.
Sebelum menerbitkan model anda, anda disyorkan untuk menguji model anda dengan pantas menggunakan satu atau lebih sampel untuk mengesahkan dan memastikan semua medan yang anda inginkan diekstrak dengan betul.
Bolehkah saya bertukar daripada satu jenis dokumen kepada jenis dokumen yang lain?
Ya, apabila mengedit model anda, anda boleh bertukar antara jenis dokumen templat tetap dan jenis dokumen umum. Walau bagaimanapun, suis ini tidak disokong untuk invois.
Bolehkah model pemprosesan borang tunggal mengekstrak maklumat daripada dokumen yang mempunyai reka letak atau templat yang berbeza?
Ya. Dengan menggunakan ciri koleksi, anda melatih model pemprosesan borang tunggal untuk mengendalikan dokumen yang mempunyai reka letak yang berbeza.
Ketahui lebih lanjut dalam Kumpulkan dokumen mengikut koleksi.
Bolehkah pemprosesan dokumen mengendalikan berbilang borang dalam satu dokumen?
Setiap borang perlu berada dalam fail yang berasingan. Contohnya, jika anda mempunyai dokumen PDF dengan berbilang invois di dalamnya, cipta fail berasingan untuk setiap invois sebelum anda menghantarnya ke model pemprosesan dokumen.
Anda juga boleh menentukan halaman untuk model pemprosesan dokumen untuk dikendalikan. Dengan cara ini anda boleh memanfaatkan fungsi model untuk menggelung halaman demi halaman dan memproses satu borang pada satu masa.
Ketahui lebih lanjut dalam julat halaman.
Saya melatih model pemprosesan dokumen, tetapi saya tidak mendapat hasil yang baik apabila ia berkaitan dengan data yang diekstrak. Bagaimanakah saya boleh menambah baik model?
Jika model anda mengembalikan hasil yang buruk selepas anda melatihnya, edit model dan berikan lebih banyak sampel untuk latihan. Lebih banyak sampel yang anda berikan, lebih banyak model AI belajar cara mengekstrak data daripada dokumen anda.
Ketahui lebih lanjut dalam Tingkatkan prestasi model pemprosesan dokumen anda.
Batasan
Berapakah bilangan maksimum dokumen yang boleh saya proses?
Anda boleh memproses sehingga 360 dokumen setiap persekitaran, setiap 60 saat.
Mengapa sesetengah watak diiktiraf secara tidak betul?
- Ia boleh berlaku bahawa sesetengah aksara menjadi keliru: 0 (nombor) dan O (huruf), 1 (nombor) dan l (huruf), 4 (nombor) dan A (huruf), dan banyak lagi.
- Ia boleh berlaku bahawa sesetengah aksara di atas atau dekat dengan yang lain dikenali dengan tidak betul: O (huruf) di atas garis menegak menjadi 0 (nombor), 5 (nombor) di atas garis menjadi $ (tanda dolar Amerika), l_ (huruf kecil, garis bawah) menjadi L (huruf besar), dan banyak lagi.
- Ia boleh berlaku bahawa sesetengah aksara pada dokumen berkualiti rendah diiktiraf dengan tidak betul, atau tidak sama sekali.
Dalam kes sebelumnya, tiada apa yang boleh dilakukan untuk AI Builder meningkatkan pengiktirafan. Kami mengesyorkan untuk meningkatkan kualiti dan susun atur dokumen sumber untuk menyelesaikan isu yang serupa.
Nota
Microsoft sentiasa menambah baik teknologi pengecaman aksara optik (OCR) untuk mengesan aksara, jadi isu sedemikian kurang kerap berlaku.
Bolehkah saya membuat model dengan banyak koleksi?
Anda boleh membuat sehingga 200 koleksi setiap model. Walau bagaimanapun, latihan model dokumen umum dengan puluhan koleksi boleh mengambil masa beberapa jam dan—dalam keadaan yang jarang berlaku—tamat masa. Jika model anda mempunyai bilangan koleksi yang tinggi, jangkakan untuk menunggu sehingga 24 jam untuk latihan model selesai.
Bolehkah saya mencipta model dalam penyelesaian?
Pada masa ini, tidak mungkin untuk mencipta model dalam penyelesaian.
Bolehkah saya menggunakan kontrak dan surat dalam model pemprosesan dokumen saya?
Ya, dokumen tidak berstruktur seperti kontrak dan surat disokong oleh pemprosesan dokumen, menggunakan pilihan Dokumen Umum.
Perbandingan
Apakah perbezaan antara pemprosesan dokumen, pemprosesan invois, pemprosesan resit, pembaca dokumen pengenalan, pembaca kad perniagaan dan pengecaman teks?
Bergantung pada situasi anda, anda mungkin perlu menggunakan model tertentu atau gabungan daripadanya.
Gunakan pengecaman teks apabila anda ingin mengekstrak semua teks yang terdapat dalam imej atau PDF. Anda kemudiannya boleh, sebagai contoh, mencari kata kunci dalam teks yang diekstrak atau membina beberapa peraturan tetap untuk mengekstrak item tertentu.
Jika anda ingin mengekstrak maklumat daripada invois, resit, pasport, lesen memandu atau kad perniagaan, mulakan dengan model prabina yang sepadan:
- Pemprosesan invois
- Pemprosesan resit
- Pembaca dokumen pengenalan diri (pasport dan lesen memandu)
- Pembaca kad perniagaan
Anda boleh menggunakan model prabina ini dengan segera, tanpa perlu membuat model baharu. Model ini boleh mengekstrak maklumat biasa yang terdapat dalam jenis dokumen yang sepadan.
Untuk mana-mana jenis dokumen lain, anda boleh mencipta model pemprosesan dokumen tersuai untuk mengekstrak medan dan jadual yang anda perlukan. Ini juga terpakai jika anda memerlukan maklumat tambahan yang tidak disediakan oleh model prabina.
Ketahui lebih lanjut dalam Model pemprosesan dokumen tersuai.
Apakah perbezaan antara AI Builder pemprosesan dokumen dan Azure Form Recognizer?
AI Builder pemprosesan dokumen dibina di atas Azure Form Recognizer. Ini menyediakan kedua-dua produk dengan kemajuan terkini dalam Microsoft AI.
AI Builder adalah sebahagian daripada Microsoft Power Platform. Ini membolehkan sesiapa sahaja menambah AI ke dalam apl dan automasi dengan antara muka yang mudah digunakan. Anda tidak perlu menjadi pembangun atau saintis data.
Azure Form Recognizer disasarkan kepada pembangun profesional. Mereka boleh menggunakan API REST mudah untuk menambah keupayaan AI pada penyelesaian kod tersuai mereka.
Pilihan kos
Berapakah AI Builder kos pemprosesan dokumen?
Anda boleh mula mencuba pemprosesan dokumen secara percuma dengan memulakan percubaan. Selepas anda menilainya, anda perlu membeli AI Builder kredit untuk menggunakan pemprosesan dokumen. Setiap halaman yang anda proses dengan pemprosesan dokumen menggunakan AI Builder kredit, walaupun halaman tersebut tidak mengandungi data untuk diekstrak. AI Builder Kredit boleh dibeli melalui AI Builder alat tambah.
Ketahui lebih lanjut dalam AI Builder pelesenan.