Bagikan melalui


Model tanda terima Kecerdasan Dokumen

Penting

  • Rilis pratinjau publik Kecerdasan Dokumen menyediakan akses awal ke fitur yang sedang dalam pengembangan aktif. Fitur, pendekatan, dan proses dapat berubah, sebelum Ketersediaan Umum (GA), berdasarkan umpan balik pengguna.
  • Versi pratinjau publik pustaka klien Kecerdasan Dokumen default ke REST API versi 2024-07-31-preview.
  • Pratinjau publik versi 2024-07-31-preview saat ini hanya tersedia di wilayah Azure berikut. Perhatikan bahwa model generatif kustom (ekstraksi bidang dokumen) di AI Studio hanya tersedia di wilayah US Tengah Utara:
    • US Timur
    • US Barat2
    • Eropa Barat
    • US Tengah Utara

Konten ini berlaku untuk: tanda centang v4.0 (pratinjau) | Versi sebelumnya: tanda centang biru v3.1 (GA) tanda centang biru v3.0 (GA)tanda centang biru v2.1 (GA)

Konten ini berlaku untuk: tanda centang v3.1 (GA) | Versi terbaru:tanda centang ungu v4.0 (pratinjau) | Versi sebelumnya: tanda centang biru v3.0tanda centang biru v2.1

Konten ini berlaku untuk: tanda centang v3.0 (GA) | Versi terbaru: tanda centang ungu v4.0 (pratinjau) tanda centang unguv3.1 | Versi sebelumnya: tanda centang biru v2.1

Konten ini berlaku untuk: tanda centang v2.1 | Versi terbaru: tanda centang biru v4.0 (pratinjau)

Model tanda terima Kecerdasan Dokumen menggabungkan kemampuan Pengenalan Karakter Optik (OCR) yang kuat dengan model pembelajaran mendalam untuk menganalisis dan mengekstrak informasi utama dari tanda terima penjualan. Tanda terima dapat menggunakan berbagai format dan kualitas, termasuk tanda terima cetak dan tulisan tangan. API mengekstrak informasi penting seperti nama pedagang, nomor telepon pedagang, tanggal transaksi, pajak, serta total transaksi dan menampilkan data JSON terstruktur.

Jenis tanda terima yang didukung:

  • Termal
  • Kartu Kredit
  • Gas
  • Parkir
  • Hotel
  • Transportasi
  • Komunikasi
  • Hiburan
  • Penerbangan
  • Pelatihan
  • Farmasi/Medis

Ekstraksi data tanda terima

Digitalisasi tanda terima mencakup transformasi berbagai jenis tanda terima, termasuk salinan yang dipindai, difoto, dan dicetak, ke dalam format digital untuk pemrosesan hilir yang disederhanakan. Contohnya termasuk manajemen pengeluaran, analisis perilaku konsumen, otomatisasi pajak, dll. Menggunakan Kecerdasan Dokumen dengan teknologi OCR (Pengenalan Karakter Optik) dapat mengekstrak dan menginterpretasikan data dari berbagai format tanda terima ini. Pemrosesan Kecerdasan Dokumen menyederhanakan proses konversi tetapi juga secara signifikan mengurangi waktu dan upaya yang diperlukan, sehingga memfasilitasi manajemen data yang efisien, dan pengambilan.

Sampel tanda terima yang diproses dengan Document Intelligence Studio:

Cuplikan layar sampel tanda terima yang diproses di Studio Kecerdasan Dokumen.

Sampel tanda terima diproses dengan alat Pelabelan Sampel Kecerdasan Dokumen:

Cuplikan layar sampel tanda terima yang diproses dengan alat Pelabelan Sampel Formulir.

Opsi pengembangan

Kecerdasan Dokumen v4.0 (pratinjau 2024-07-31) mendukung alat, aplikasi, dan pustaka berikut:

Fitur Sumber ID Model
Model tanda terima Document Intelligence Studio
REST API
C# SDK
Python SDK
Java SDK
JavaScript SDK
tanda terima bawaan

Kecerdasan Dokumen v3.1 mendukung alat, aplikasi, dan pustaka berikut:

Fitur Sumber ID Model
Model tanda terima Document Intelligence Studio
REST API
C# SDK
Python SDK
Java SDK
JavaScript SDK
tanda terima bawaan

Kecerdasan Dokumen v3.0 mendukung alat, aplikasi, dan pustaka berikut:

Fitur Sumber ID Model
Model tanda terima Document Intelligence Studio
REST API
C# SDK
Python SDK
Java SDK
JavaScript SDK
tanda terima bawaan

Kecerdasan Dokumen v2.1 mendukung alat, aplikasi, dan pustaka berikut:

Fitur Sumber
Model tanda terima Alat
pelabelan Kecerdasan Dokumen• REST API
SDK
pustaka klien• Kontainer Docker Kecerdasan Dokumen

Persyaratan input

  • Format file yang didukung:

    Model PDF Gambar:
    JPEG/JPG, , BMPPNG, TIFF, ,HEIF
    Microsoft Office:
    Word (DOCX), Excel (XLSX), PowerPoint (PPTX), HTML
    Read
    Tata letak ✔ (2024-07-31-preview, 2024-02-29-preview, 2023-10-31-preview)
    Dokumen Umum
    Bawaan
    Ekstraksi kustom
    Klasifikasi kustom ✔ (2024-07-31-preview, 2024-02-29-preview)
  • Untuk hasil terbaik, berikan satu foto yang jelas atau pemindaian berkualitas tinggi per dokumen.

  • Untuk PDF dan TIFF, hingga 2.000 halaman dapat diproses (dengan langganan tingkat gratis, hanya dua halaman pertama yang diproses).

  • Ukuran file untuk menganalisis dokumen adalah 500 MB untuk tingkat berbayar (S0) dan 4 MB secara gratis (F0).

  • Dimensi gambar harus antara 50 piksel x 50 piksel dan 10.000 piksel x 10.000 piksel.

  • Jika PDF Anda dikunci dengan kata sandi, Anda harus menghapus kunci sebelum pengiriman.

  • Tinggi minimum teks yang akan diekstrak adalah 12 piksel untuk gambar piksel 1024 x 768. Dimensi ini sesuai dengan tentang 8 teks titik pada 150 titik per inci (DPI).

  • Untuk pelatihan model kustom, jumlah maksimum halaman untuk data pelatihan adalah 500 untuk model template kustom dan 50.000 untuk model neural kustom.

    • Untuk pelatihan model ekstraksi kustom, ukuran total data pelatihan adalah 50 MB untuk model templat dan 1 GB untuk model neural.

    • Untuk pelatihan model klasifikasi kustom, ukuran total data pelatihan adalah 1 GB dengan maksimum 10.000 halaman. Untuk pratinjau 2024-07-31 dan yang lebih baru, ukuran total data pelatihan adalah 2 GB dengan maksimum 10.000 halaman.

  • Format file yang didukung: JPEG, PNG, PDF, dan TIFF.
  • Jatah halaman yang didukung untuk PDF dan TIFF: Kecerdasan Dokumen dapat memproses hingga 2.000 halaman untuk pelanggan tingkat standar atau hanya dua halaman pertama untuk pelanggan tingkat gratis.
  • Ukuran file yang didukung: kurang dari 50 MB; piksel minimum 50 x 50 px; piksel maksimum 10.000 x 10.000 px.

Ekstraksi data model tanda terima

Lihat bagaimana Kecerdasan Dokumen mengekstrak data, termasuk waktu dan tanggal transaksi, informasi pedagang, dan jumlah total dari tanda terima. Anda membutuhkan sumber daya berikut:

  • Langganan Azure—Anda dapat membuatnya secara gratis.

  • Instans Kecerdasan Dokumen di portal Azure. Anda dapat menggunakan tingkat harga gratis (F0) untuk mencoba layanan. Setelah sumber daya Anda disebarkan, pilih Buka sumber daya untuk mendapatkan kunci dan titik akhir Anda.

Cuplikan layar di titik akhir di portal Azure.

Catatan

Document Intelligence Studio tersedia dengan API v3.1 dan v3.0 dan versi yang lebih baru.

  1. Pada beranda Studio Kecerdasan Dokumen, pilih Tanda Terima.

  2. Anda dapat menganalisis tanda terima sampel atau mengunggah file Anda sendiri.

  3. Pilih tombol Jalankan analisis dan, jika perlu, konfigurasikan opsi Analisis:

    Cuplikan layar tombol Jalankan analisis dan Analisis opsi di Studio Kecerdasan Dokumen.

    Coba Studio Kecerdasan Dokumen.

Alat Pelabelan Sampel Kecerdasan Dokumen

  1. Navigasikan ke Alat Sampel Kecerdasan Dokumen.

  2. Pada beranda alat sampel, pilih gunakan model bawaan untuk mendapatkan petak data .

    Cuplikan layar model tata letak menganalisis proses hasil.

  3. Pilih Jenis Formulir untuk dianalisis dari menu dropdown.

  4. Pilih URL untuk {i>file

  5. Pada bidang Sumber, pilih URL dari menu drop down, tempel URL yang dipilih, dan pilih tombol Ambil.

    Cuplikan layar menu dropdown lokasi sumber.

  6. Di bidang titik akhir layanan Inteligensi Dokumen, tempelkan titik akhir yang Anda peroleh dengan langganan Kecerdasan Dokumen Anda.

  7. Di bidang kunci, tempelkan kunci yang Anda peroleh dari sumber daya Kecerdasan Dokumen Anda.

    Cuplikan layar menu dropdown pilih jenis formulir.

  8. Pilih Jalankan analisis. Alat Pelabelan Sampel Kecerdasan Dokumen memanggil API Analisis Bawaan dan menganalisis dokumen.

  9. Lihat hasilnya - lihat pasangan kunci-nilai yang diekstrak, item baris, teks yang disorot diekstrak, dan tabel terdeteksi.

    Cuplikan layar model tata letak menganalisis operasi hasil.

Catatan

Alat pelabelan sampel tidak mendukung format file BMP. Ini adalah batasan alat bukan Document Intelligence Service.

Bahasa dan lokal yang didukung

Untuk daftar lengkap bahasa yang didukung, lihat halaman dukungan bahasa model bawaan kami.

Ekstraksi lapangan

Nama Tipe Deskripsi Output standar
ReceiptType String Jenis tanda terima penjualan Di-item
MerchantName String Nama pedagang yang mengeluarkan tanda terima
MerchantPhoneNumber Nomor telepon Nomor telepon pedagang yang terdaftar +1 xxx xxx xxxx
MerchantAddress String Alamat merchant yang terdaftar
TransactionDate Tanggal Tanggal tanda terima dikeluarkan hh-bb-tttt
TransactionTime Waktu Waktu tanda terima dikeluarkan hh-mm-ss (24 jam)
Total Jumlah (USD) Total transaksi penuh tanda terima Float dua desimal
Subtotal Jumlah (USD) Subtotal penerimaan, seringkali sebelum pajak diterapkan Float dua desimal
Pajak Jumlah (USD) Total pajak penerimaan (seringkali pajak penjualan, atau setara). Mengganti nama menjadi "TotalTax" dalam versi 2022-06-30. Float dua desimal
Tip Jumlah (USD) Tip yang disertakan oleh pembeli Float dua desimal
Item Array objek Item baris yang diekstrak, dengan nama, kuantitas, harga satuan, dan total harga yang diekstrak
Nama String Deskripsi item. Mengganti nama menjadi "Description" dalam versi 2022-06-30.
Quantity Number Kuantitas setiap item Float dua desimal
Harga Number Harga dari setiap unit item Float dua desimal
TotalPrice Number Total harga item baris Float dua desimal

Untuk bidang ekstraksi dokumen yang didukung, lihat halaman skema model tanda terima di repositori sampel GitHub kami.

Panduan migrasi dan REST API v3.1

Langkah berikutnya

  • Coba pemrosesan formulir dan dokumen Anda sendiri dengan Studio Kecerdasan Dokumen.

  • Selesaikan mulai cepat Kecerdasan Dokumen dan mulai membuat aplikasi pemrosesan dokumen dalam bahasa pengembangan pilihan Anda.

  • Coba pemrosesan formulir dan dokumen Anda sendiri dengan alat Pelabelan Sampel Kecerdasan Dokumen.

  • Selesaikan mulai cepat Kecerdasan Dokumen dan mulai membuat aplikasi pemrosesan dokumen dalam bahasa pengembangan pilihan Anda.