Model payStub Kecerdasan Dokumen

Artikel
10/17/2024

Model payStub Kecerdasan Dokumen menggabungkan kemampuan Pengenalan Karakter Optik (OCR) yang kuat dengan model pembelajaran mendalam untuk menganalisis dan mengekstrak data kompensasi dan penghasilan dari slip bayar. API menganalisis dokumen dan file dengan informasi terkait penggajian; mengekstrak informasi utama dan mengembalikan representasi data JSON terstruktur.

Fitur	version	ID Model
model payStub	• v4.0:2024-07-31 (pratinjau)	`prebuilt-payStub.us`

Coba ekstraksi data payStub

Stub pembayaran adalah dokumen penting yang dikeluarkan oleh pengusaha kepada karyawan, memberikan penghasilan, pengurangan, dan informasi pembayaran bersih untuk periode pembayaran tertentu. Lihat bagaimana data diekstrak menggunakan prebuilt-payStub.us model. Anda membutuhkan sumber daya berikut:

Langganan Azure—Anda dapat membuat langganan gratis
Instans Kecerdasan Dokumen di portal Azure. Anda dapat menggunakan tingkat harga gratis (F0) untuk mencoba layanan. Setelah sumber daya Anda disebarkan, pilih Buka sumber daya untuk mendapatkan kunci dan titik akhir Anda.

Studio Kecerdasan Dokumen

Pada beranda Studio Kecerdasan Dokumen, pilih payStub.
Anda dapat menganalisis sampel stub bayar atau mengunggah file Anda sendiri.
Pilih tombol Jalankan analisis dan, jika perlu, konfigurasikan opsi Analisis :

Persyaratan input

Format file yang didukung:

Model	PDF	Gambar: `JPEG/JPG`, , `BMPPNG`, `TIFF`, ,`HEIF`	Microsoft Office: Word (`DOCX`), Excel (`XLSX`), PowerPoint (`PPTX`), HTML
Read	✔	✔	✔
Tata letak	✔	✔	✔ (2024-07-31-preview, 2024-02-29-preview, 2023-10-31-preview)
Dokumen Umum	✔	✔
Bawaan	✔	✔
Ekstraksi kustom	✔	✔
Klasifikasi kustom	✔	✔	✔ (2024-07-31-preview, 2024-02-29-preview)

Untuk hasil terbaik, berikan satu foto yang jelas atau pemindaian berkualitas tinggi per dokumen.
Untuk PDF dan TIFF, hingga 2.000 halaman dapat diproses (dengan langganan tingkat gratis, hanya dua halaman pertama yang diproses).
Ukuran file untuk menganalisis dokumen adalah 500 MB untuk tingkat berbayar (S0) dan 4 MB secara gratis (F0).
Dimensi gambar harus antara 50 piksel x 50 piksel dan 10.000 piksel x 10.000 piksel.
Jika PDF Anda dikunci dengan kata sandi, Anda harus menghapus kunci sebelum pengiriman.
Tinggi minimum teks yang akan diekstrak adalah 12 piksel untuk gambar piksel 1024 x 768. Dimensi ini sesuai dengan tentang 8 teks titik pada 150 titik per inci (DPI).
Untuk pelatihan model kustom, jumlah maksimum halaman untuk data pelatihan adalah 500 untuk model template kustom dan 50.000 untuk model neural kustom.
- Untuk pelatihan model ekstraksi kustom, ukuran total data pelatihan adalah 50 MB untuk model templat dan 1 GB untuk model neural.
- Untuk pelatihan model klasifikasi kustom, ukuran total data pelatihan adalah 1 GB dengan maksimum 10.000 halaman. Untuk pratinjau 2024-07-31 dan yang lebih baru, ukuran total data pelatihan adalah 2 GB dengan maksimum 10.000 halaman.

Bahasa dan lokal yang didukung

Untuk daftar lengkap bahasa yang didukung, lihat halaman dukungan bahasa model bawaan kami.

Ekstraksi bidang

Untuk bidang ekstraksi dokumen yang didukung, lihat halaman skema model payStub di repositori sampel GitHub kami.

Lokal yang didukung

Pratinjau prebuilt-payStub.us versi 2027-07-31 mendukung lokal en-us .

Langkah berikutnya

Coba memproses formulir dan dokumen Anda sendiri dengan Studio Kecerdasan Dokumen
Selesaikan mulai cepat Kecerdasan Dokumen dan mulai membuat aplikasi pemrosesan dokumen dalam bahasa pengembangan pilihan Anda.

Bagikan melalui