Catatan
Akses ke halaman ini memerlukan otorisasi. Anda dapat mencoba masuk atau mengubah direktori.
Akses ke halaman ini memerlukan otorisasi. Anda dapat mencoba mengubah direktori.
Konten ini berlaku untuk:v4.0 (GA) | Versi sebelumnya:
v3.1 (GA)
v3.0 (GA)
v2.1 (GA)
::: moniker-end
Konten ini berlaku untuk:v2.1 | Versi terbaru:
v4.0 (GA)
Model faktur Kecerdasan Dokumen menggunakan kemampuan Pengenalan Karakter Optik (OCR) yang kuat untuk menganalisis dan mengekstrak bidang kunci dan item baris dari faktur penjualan, tagihan utilitas, dan pesanan pembelian. Dokumen dapat memiliki berbagai format dan kualitas, termasuk gambar yang diambil dengan ponsel, dokumen yang dipindai, dan PDF digital. API menganalisis teks faktur; mengekstrak informasi penting seperti nama pelanggan, alamat penagihan, tanggal jatuh tempo, dan jumlah yang jatuh tempo; dan menghasilkan representasi data JSON terstruktur. Model saat ini mendukung faktur dalam 27 bahasa.
Jenis dokumen yang didukung:
- Faktur
- Tagihan utilitas
- Pesanan penjualan
- Pesanan pembelian
Pemrosesan faktur otomatis
Pemrosesan faktur otomatis adalah proses mengekstrak bidang kunci accounts payable
dari dokumen akun penagihan. Data yang diekstrak mencakup item baris dari faktur yang terintegrasi dengan alur kerja utang akun (AP) Anda untuk ulasan dan pembayaran. Secara historis, proses utang akun dilakukan secara manual dan, karenanya, sangat memakan waktu. Ekstraksi data kunci yang akurat dari faktur biasanya merupakan langkah pertama dan salah satu langkah paling penting dalam proses otomatisasi faktur.
Contoh faktur yang diproses dengan Document Intelligence Studio:
Contoh faktur yang diproses dengan alat Pelabelan Sampel Kecerdasan Dokumen:
Opsi pengembangan
Kecerdasan Dokumen v4.0: 2024-11-30 (GA) mendukung alat, aplikasi, dan pustaka berikut:
Fitur | Sumber | ID Model |
---|---|---|
Model faktur | • Document Intelligence Studio • REST API • C# SDK • Python SDK • Java SDK • JavaScript SDK |
Faktur Bawaan |
Kecerdasan Dokumen v3.1 mendukung alat, aplikasi, dan pustaka berikut:
Fitur | Sumber | ID Model |
---|---|---|
Model faktur | • Document Intelligence Studio • REST API • C# SDK • Python SDK • Java SDK • JavaScript SDK |
Faktur Bawaan |
Kecerdasan Dokumen v3.0 mendukung alat, aplikasi, dan pustaka berikut:
Fitur | Sumber | ID Model |
---|---|---|
Model faktur | • Document Intelligence Studio • REST API • C# SDK • Python SDK • Java SDK • JavaScript SDK |
Faktur Bawaan |
Kecerdasan Dokumen v2.1 mendukung alat, aplikasi, dan pustaka berikut:
Fitur | Sumber |
---|---|
Model faktur | • Alat pelabelan Kecerdasan Dokumen• REST API • SDK pustaka klien• Kontainer Docker Kecerdasan Dokumen |
Persyaratan input
Format file yang didukung:
Model | Gambar: JPEG/JPG , , BMP PNG , TIFF , ,HEIF |
Microsoft Office: Word ( DOCX ), Excel (XLSX ), PowerPoint (PPTX ), HTML |
|
---|---|---|---|
Read | ✔ | ✔ | ✔ |
Tata letak | ✔ | ✔ | ✔ |
Dokumen Umum | ✔ | ✔ | |
Bawaan | ✔ | ✔ | |
Ekstraksi kustom | ✔ | ✔ | |
Klasifikasi kustom | ✔ | ✔ | ✔ |
Untuk hasil terbaik, berikan satu foto yang jelas atau pemindaian berkualitas tinggi per dokumen.
Untuk PDF dan TIFF, hingga 2.000 halaman dapat diproses (dengan langganan tingkat gratis, hanya dua halaman pertama yang diproses).
Ukuran file untuk menganalisis dokumen adalah 500 MB untuk tingkat berbayar (S0) dan
4
MB secara gratis (F0).Dimensi gambar harus antara 50 piksel x 50 piksel dan 10.000 piksel x 10.000 piksel.
Jika PDF Anda dikunci dengan kata sandi, Anda harus menghapus kunci sebelum pengiriman.
Tinggi minimum teks yang akan diekstrak adalah 12 piksel untuk gambar piksel 1024 x 768. Dimensi ini sesuai dengan tentang
8
teks titik pada 150 titik per inci (DPI).Untuk pelatihan model kustom, jumlah maksimum halaman untuk data pelatihan adalah 500 untuk model template kustom dan 50.000 untuk model neural kustom.
Untuk pelatihan model ekstraksi kustom, ukuran total data pelatihan adalah 50 MB untuk model templat dan
1
GB untuk model neural.Untuk pelatihan model klasifikasi kustom, ukuran total data pelatihan adalah
1
GB dengan maksimum 10.000 halaman. Untuk 2024-11-30 (GA), ukuran total data pelatihan adalah2
GB dengan maksimum 10.000 halaman.
- Format file yang didukung: JPEG, PNG, PDF, dan TIFF.
- PDF dan TIFF yang didukung, hingga 2.000 halaman diproses. Untuk pelanggan level gratis, hanya dua halaman pertama yang diproses.
- Ukuran file yang didukung harus kurang dari 50 MB dan dimensi minimal 50 x 50 piksel dan paling banyak 10.000 x 10.000 piksel.
Ekstraksi data model faktur
Lihat bagaimana data, termasuk informasi pelanggan, detail vendor, dan item baris, diekstrak dari faktur. Anda membutuhkan sumber daya berikut:
Langganan Azure—Anda dapat membuatnya secara gratis.
Instans Kecerdasan Dokumen di portal Azure. Anda dapat menggunakan tingkat harga gratis (
F0
) untuk mencoba layanan. Setelah sumber daya Anda disebarkan, pilih Buka sumber daya untuk mendapatkan kunci dan titik akhir Anda.
Alat Pelabelan Sampel Kecerdasan Dokumen
Navigasikan ke Alat Sampel Kecerdasan Dokumen.
Pada beranda alat sampel, pilih gunakan model bawaan untuk mendapatkan petak data .
Pilih Jenis Formulir untuk dianalisis dari menu dropdown.
Pilih URL untuk {i>file
Pada bidang Sumber, pilih URL dari menu drop down, tempel URL yang dipilih, dan pilih tombol Ambil.
Di bidang titik akhir layanan Inteligensi Dokumen, tempelkan titik akhir yang Anda peroleh dengan langganan Kecerdasan Dokumen Anda.
Di bidang kunci, tempelkan kunci yang Anda peroleh dari sumber daya Kecerdasan Dokumen Anda.
Pilih Jalankan analisis. Alat Pelabelan Sampel Kecerdasan Dokumen memanggil API Analisis Bawaan dan menganalisis dokumen.
Lihat hasilnya - lihat pasangan kunci-nilai yang diekstrak, item baris, teks yang disorot diekstrak, dan tabel terdeteksi.
Catatan
Alat pelabelan sampel tidak mendukung format file BMP. Ini adalah batasan alat bukan Document Intelligence Service.
Bahasa dan lokal yang didukung
Untuk daftar lengkap bahasa yang didukung, lihat halaman dukungan bahasa model bawaan kami.
Ekstraksi lapangan
Untuk bidang ekstraksi dokumen yang didukung, lihathalaman skema model faktur di repositori sampel GitHub kami.
Pasangan kunci-nilai faktur dan item baris yang diekstrak berada di bagian
documentResults
output JSON.
Pasangan kunci-nilai
Model faktur bawaan mendukung pengembalian opsional pasangan kunci-nilai. Secara default, pengembalian pasangan kunci-nilai dinonaktifkan. Pasangan kunci nilai adalah rentang tertentu dalam dokumen yang mengidentifikasi label atau kunci dan respons atau nilai terkaitnya. Dalam faktur, pasangan ini bisa menjadi label dan nilai yang dimasukkan pengguna untuk bidang atau nomor telepon tersebut. Model AI dilatih untuk mengekstrak kunci dan nilai yang dapat diidentifikasi berdasarkan berbagai jenis, format, dan struktur dokumen.
Kunci juga dapat ada dalam isolasi ketika model mendeteksi bahwa ada kunci, tanpa nilai terkait atau saat memproses bidang opsional. Misalnya, bidang nama tengah dapat dibiarkan kosong pada formulir dalam beberapa instans. Pasangan kunci-nilai selalu mencakup teks yang terkandung dalam dokumen. Untuk dokumen di mana nilai yang sama dijelaskan dengan cara yang berbeda, misalnya, pelanggan/pengguna, kunci terkait adalah pelanggan atau pengguna (berdasarkan konteks).
Output JSON
Output JSON memiliki tiga bagian:
-
"readResults"
simpul berisi semua teks dan tanda pilihan yang dikenali. Teks diatur melalui halaman, lalu menurut baris, lalu dengan kata-kata individual. -
"pageResults"
node berisi tabel dan sel yang diekstrak dengan kotak pembatas, keyakinan, dan referensi ke baris dan kata di readResults. - Simpul
"documentResults"
berisi nilai spesifik faktur dan item baris yang ditemukan oleh model. Di sinilah untuk menemukan semua bidang dari faktur seperti ID faktur, pengiriman ke, tagihan ke, pelanggan, total, item baris, dan banyak lagi.
Panduan migrasi
- Ikuti panduan migrasi Kecerdasan Dokumen v3.1 kami untuk mempelajari cara menggunakan versi v3.0 di aplikasi dan alur kerja Anda.
::: moniker-end