Model tanda terima Kecerdasan Dokumen
Penting
- Rilis pratinjau publik Kecerdasan Dokumen menyediakan akses awal ke fitur yang sedang dalam pengembangan aktif. Fitur, pendekatan, dan proses dapat berubah, sebelum Ketersediaan Umum (GA), berdasarkan umpan balik pengguna.
- Versi pratinjau publik pustaka klien Kecerdasan Dokumen default ke REST API versi 2024-07-31-preview.
- Pratinjau publik versi 2024-07-31-preview saat ini hanya tersedia di wilayah Azure berikut. Perhatikan bahwa model generatif kustom (ekstraksi bidang dokumen) di AI Studio hanya tersedia di wilayah US Tengah Utara:
- US Timur
- US Barat2
- Eropa Barat
- US Tengah Utara
Konten ini berlaku untuk: v4.0 (pratinjau) | Versi sebelumnya: v3.1 (GA) v3.0 (GA) v2.1 (GA)
Konten ini berlaku untuk: v3.1 (GA) | Versi terbaru: v4.0 (pratinjau) | Versi sebelumnya: v3.0 v2.1
Konten ini berlaku untuk: v3.0 (GA) | Versi terbaru: v4.0 (pratinjau) v3.1 | Versi sebelumnya: v2.1
Konten ini berlaku untuk: v2.1 | Versi terbaru: v4.0 (pratinjau)
Model tanda terima Kecerdasan Dokumen menggabungkan kemampuan Pengenalan Karakter Optik (OCR) yang kuat dengan model pembelajaran mendalam untuk menganalisis dan mengekstrak informasi utama dari tanda terima penjualan. Tanda terima dapat menggunakan berbagai format dan kualitas, termasuk tanda terima cetak dan tulisan tangan. API mengekstrak informasi penting seperti nama pedagang, nomor telepon pedagang, tanggal transaksi, pajak, serta total transaksi dan menampilkan data JSON terstruktur.
Jenis tanda terima yang didukung:
- Termal
- Kartu Kredit
- Gas
- Parkir
- Hotel
- Transportasi
- Komunikasi
- Hiburan
- Penerbangan
- Pelatihan
- Farmasi/Medis
Ekstraksi data tanda terima
Digitalisasi tanda terima mencakup transformasi berbagai jenis tanda terima, termasuk salinan yang dipindai, difoto, dan dicetak, ke dalam format digital untuk pemrosesan hilir yang disederhanakan. Contohnya termasuk manajemen pengeluaran, analisis perilaku konsumen, otomatisasi pajak, dll. Menggunakan Kecerdasan Dokumen dengan teknologi OCR (Pengenalan Karakter Optik) dapat mengekstrak dan menginterpretasikan data dari berbagai format tanda terima ini. Pemrosesan Kecerdasan Dokumen menyederhanakan proses konversi tetapi juga secara signifikan mengurangi waktu dan upaya yang diperlukan, sehingga memfasilitasi manajemen data yang efisien, dan pengambilan.
Sampel tanda terima yang diproses dengan Document Intelligence Studio:
Sampel tanda terima diproses dengan alat Pelabelan Sampel Kecerdasan Dokumen:
Opsi pengembangan
Kecerdasan Dokumen v4.0 (pratinjau 2024-07-31) mendukung alat, aplikasi, dan pustaka berikut:
Fitur | Sumber | ID Model |
---|---|---|
Model tanda terima | • Document Intelligence Studio • REST API • C# SDK • Python SDK • Java SDK • JavaScript SDK |
tanda terima bawaan |
Kecerdasan Dokumen v3.1 mendukung alat, aplikasi, dan pustaka berikut:
Fitur | Sumber | ID Model |
---|---|---|
Model tanda terima | • Document Intelligence Studio • REST API • C# SDK • Python SDK • Java SDK • JavaScript SDK |
tanda terima bawaan |
Kecerdasan Dokumen v3.0 mendukung alat, aplikasi, dan pustaka berikut:
Fitur | Sumber | ID Model |
---|---|---|
Model tanda terima | • Document Intelligence Studio • REST API • C# SDK • Python SDK • Java SDK • JavaScript SDK |
tanda terima bawaan |
Kecerdasan Dokumen v2.1 mendukung alat, aplikasi, dan pustaka berikut:
Fitur | Sumber |
---|---|
Model tanda terima | • Alat pelabelan Kecerdasan Dokumen• REST API • SDK pustaka klien• Kontainer Docker Kecerdasan Dokumen |
Persyaratan input
Format file yang didukung:
Model PDF Gambar: JPEG/JPG
, ,BMP
PNG
,TIFF
, ,HEIF
Microsoft Office:
Word (DOCX
), Excel (XLSX
), PowerPoint (PPTX
), HTMLRead ✔ ✔ ✔ Tata letak ✔ ✔ ✔ (2024-07-31-preview, 2024-02-29-preview, 2023-10-31-preview) Dokumen Umum ✔ ✔ Bawaan ✔ ✔ Ekstraksi kustom ✔ ✔ Klasifikasi kustom ✔ ✔ ✔ (2024-07-31-preview, 2024-02-29-preview) Untuk hasil terbaik, berikan satu foto yang jelas atau pemindaian berkualitas tinggi per dokumen.
Untuk PDF dan TIFF, hingga 2.000 halaman dapat diproses (dengan langganan tingkat gratis, hanya dua halaman pertama yang diproses).
Ukuran file untuk menganalisis dokumen adalah 500 MB untuk tingkat berbayar (S0) dan
4
MB secara gratis (F0).Dimensi gambar harus antara 50 piksel x 50 piksel dan 10.000 piksel x 10.000 piksel.
Jika PDF Anda dikunci dengan kata sandi, Anda harus menghapus kunci sebelum pengiriman.
Tinggi minimum teks yang akan diekstrak adalah 12 piksel untuk gambar piksel 1024 x 768. Dimensi ini sesuai dengan tentang
8
teks titik pada 150 titik per inci (DPI).Untuk pelatihan model kustom, jumlah maksimum halaman untuk data pelatihan adalah 500 untuk model template kustom dan 50.000 untuk model neural kustom.
Untuk pelatihan model ekstraksi kustom, ukuran total data pelatihan adalah 50 MB untuk model templat dan
1
GB untuk model neural.Untuk pelatihan model klasifikasi kustom, ukuran total data pelatihan adalah
1
GB dengan maksimum 10.000 halaman. Untuk pratinjau 2024-07-31 dan yang lebih baru, ukuran total data pelatihan adalah2
GB dengan maksimum 10.000 halaman.
- Format file yang didukung: JPEG, PNG, PDF, dan TIFF.
- Jatah halaman yang didukung untuk PDF dan TIFF: Kecerdasan Dokumen dapat memproses hingga 2.000 halaman untuk pelanggan tingkat standar atau hanya dua halaman pertama untuk pelanggan tingkat gratis.
- Ukuran file yang didukung: kurang dari 50 MB; piksel minimum 50 x 50 px; piksel maksimum 10.000 x 10.000 px.
Ekstraksi data model tanda terima
Lihat bagaimana Kecerdasan Dokumen mengekstrak data, termasuk waktu dan tanggal transaksi, informasi pedagang, dan jumlah total dari tanda terima. Anda membutuhkan sumber daya berikut:
Langganan Azure—Anda dapat membuatnya secara gratis.
Instans Kecerdasan Dokumen di portal Azure. Anda dapat menggunakan tingkat harga gratis (
F0
) untuk mencoba layanan. Setelah sumber daya Anda disebarkan, pilih Buka sumber daya untuk mendapatkan kunci dan titik akhir Anda.
Catatan
Document Intelligence Studio tersedia dengan API v3.1 dan v3.0 dan versi yang lebih baru.
Anda dapat menganalisis tanda terima sampel atau mengunggah file Anda sendiri.
Pilih tombol Jalankan analisis dan, jika perlu, konfigurasikan opsi Analisis:
Coba Studio Kecerdasan Dokumen.
Alat Pelabelan Sampel Kecerdasan Dokumen
Navigasikan ke Alat Sampel Kecerdasan Dokumen.
Pada beranda alat sampel, pilih gunakan model bawaan untuk mendapatkan petak data .
Pilih Jenis Formulir untuk dianalisis dari menu dropdown.
Pilih URL untuk {i>file
Pada bidang Sumber, pilih URL dari menu drop down, tempel URL yang dipilih, dan pilih tombol Ambil.
Di bidang titik akhir layanan Inteligensi Dokumen, tempelkan titik akhir yang Anda peroleh dengan langganan Kecerdasan Dokumen Anda.
Di bidang kunci, tempelkan kunci yang Anda peroleh dari sumber daya Kecerdasan Dokumen Anda.
Pilih Jalankan analisis. Alat Pelabelan Sampel Kecerdasan Dokumen memanggil API Analisis Bawaan dan menganalisis dokumen.
Lihat hasilnya - lihat pasangan kunci-nilai yang diekstrak, item baris, teks yang disorot diekstrak, dan tabel terdeteksi.
Catatan
Alat pelabelan sampel tidak mendukung format file BMP. Ini adalah batasan alat bukan Document Intelligence Service.
Bahasa dan lokal yang didukung
Untuk daftar lengkap bahasa yang didukung, lihat halaman dukungan bahasa model bawaan kami.
Ekstraksi lapangan
Nama | Tipe | Deskripsi | Output standar |
---|---|---|---|
ReceiptType | String | Jenis tanda terima penjualan | Di-item |
MerchantName | String | Nama pedagang yang mengeluarkan tanda terima | |
MerchantPhoneNumber | Nomor telepon | Nomor telepon pedagang yang terdaftar | +1 xxx xxx xxxx |
MerchantAddress | String | Alamat merchant yang terdaftar | |
TransactionDate | Tanggal | Tanggal tanda terima dikeluarkan | hh-bb-tttt |
TransactionTime | Waktu | Waktu tanda terima dikeluarkan | hh-mm-ss (24 jam) |
Total | Jumlah (USD) | Total transaksi penuh tanda terima | Float dua desimal |
Subtotal | Jumlah (USD) | Subtotal penerimaan, seringkali sebelum pajak diterapkan | Float dua desimal |
Pajak | Jumlah (USD) | Total pajak penerimaan (seringkali pajak penjualan, atau setara). Mengganti nama menjadi "TotalTax" dalam versi 2022-06-30. | Float dua desimal |
Tip | Jumlah (USD) | Tip yang disertakan oleh pembeli | Float dua desimal |
Item | Array objek | Item baris yang diekstrak, dengan nama, kuantitas, harga satuan, dan total harga yang diekstrak | |
Nama | String | Deskripsi item. Mengganti nama menjadi "Description" dalam versi 2022-06-30. | |
Quantity | Number | Kuantitas setiap item | Float dua desimal |
Harga | Number | Harga dari setiap unit item | Float dua desimal |
TotalPrice | Number | Total harga item baris | Float dua desimal |
Untuk bidang ekstraksi dokumen yang didukung, lihat halaman skema model tanda terima di repositori sampel GitHub kami.
Panduan migrasi dan REST API v3.1
- Ikuti panduan migrasi Kecerdasan Dokumen v3.1 kami untuk mempelajari cara menggunakan versi v3.1 di aplikasi dan alur kerja Anda.