Model dokumen umum Kecerdasan Dokumen
Penting
Dimulai dengan pratinjau Kecerdasan Dokumen versi 2024-02-29, pratinjau 2023-10-31 dan ke depannya, model dokumen umum (dokumen bawaan) tidak digunakan lagi. Untuk mengekstrak pasangan kunci-nilai, tanda pilihan, teks, tabel, dan struktur dari dokumen, gunakan model berikut:
Fitur | version | ID Model |
---|---|---|
Layout model dengan parameter features=keyValuePairs string kueri opsional diaktifkan. |
• v4:2024-02-29-preview • v3.1:2023-07-31 (GA) |
prebuilt-layout |
Model dokumen umum | • v3.1:2023-07-31 (GA) • v3.0:2022-08-31 (GA) • v2.1 (GA) |
prebuilt-document |
Konten ini berlaku untuk: v3.1 (GA) | Versi terbaru: v4.0 (pratinjau) | Versi sebelumnya: v3.0
Konten ini berlaku untuk: v3.0 (GA) | Versi terbaru: v4.0 (pratinjau) v3.1
Model dokumen Umum menggabungkan kemampuan Pengenalan Karakter Optik (OCR) yang kuat dengan model pembelajaran mendalam untuk mengekstrak pasangan kunci-nilai, tabel, dan tanda pilihan dari dokumen. Dokumen umum tersedia dengan API v3.1 dan v3.0. Untuk informasi selengkapnya, lihat panduan migrasi kami.
Fitur dokumen umum
Model dokumen umum adalah model yang telah dilatih sebelumnya; tidak memerlukan label atau pelatihan.
API tunggal mengekstrak pasangan kunci-nilai, tanda pilihan, entitas, teks, tabel, dan struktur dari dokumen.
Model dokumen umum mendukung dokumen terstruktur, semi terstruktur, dan tidak terstruktur.
Tanda pilihan diidentifikasi sebagai bidang dengan nilai
:selected:
atau:unselected:
.
Contoh dokumen yang diproses di Studio Kecerdasan Dokumen
Ekstraksi pasangan nilai kunci
API dokumen umum mendukung sebagian besar jenis formulir dan menganalisis dokumen Anda dan mengekstrak kunci dan nilai terkait. Model ini sangat ideal untuk mengekstrak pasangan kunci-nilai umum dari dokumen. Anda dapat menggunakan model dokumen umum sebagai alternatif untuk melatih model kustom tanpa label.
Opsi pengembangan
Kecerdasan Dokumen v3.1 mendukung alat, aplikasi, dan pustaka berikut:
Fitur | Sumber | ID Model |
---|---|---|
Model dokumen umum | • Document Intelligence Studio • REST API • C# SDK • Python SDK • Java SDK • JavaScript SDK |
dokumen bawaan |
Kecerdasan Dokumen v3.0 mendukung alat, aplikasi, dan pustaka berikut:
Fitur | Sumber | ID Model |
---|---|---|
Model dokumen umum | • Document Intelligence Studio • REST API • C# SDK • Python SDK • Java SDK • JavaScript SDK |
dokumen bawaan |
Persyaratan input
Format file yang didukung:
Model PDF Gambar: JPEG/JPG
, ,BMP
PNG
,TIFF
, ,HEIF
Microsoft Office:
Word (DOCX
), Excel (XLSX
), PowerPoint (PPTX
), HTMLRead ✔ ✔ ✔ Tata letak ✔ ✔ ✔ (2024-07-31-preview, 2024-02-29-preview, 2023-10-31-preview) Dokumen Umum ✔ ✔ Bawaan ✔ ✔ Ekstraksi kustom ✔ ✔ Klasifikasi kustom ✔ ✔ ✔ (2024-07-31-preview, 2024-02-29-preview) Untuk hasil terbaik, berikan satu foto yang jelas atau pemindaian berkualitas tinggi per dokumen.
Untuk PDF dan TIFF, hingga 2.000 halaman dapat diproses (dengan langganan tingkat gratis, hanya dua halaman pertama yang diproses).
Ukuran file untuk menganalisis dokumen adalah 500 MB untuk tingkat berbayar (S0) dan
4
MB secara gratis (F0).Dimensi gambar harus antara 50 piksel x 50 piksel dan 10.000 piksel x 10.000 piksel.
Jika PDF Anda dikunci dengan kata sandi, Anda harus menghapus kunci sebelum pengiriman.
Tinggi minimum teks yang akan diekstrak adalah 12 piksel untuk gambar piksel 1024 x 768. Dimensi ini sesuai dengan tentang
8
teks titik pada 150 titik per inci (DPI).Untuk pelatihan model kustom, jumlah maksimum halaman untuk data pelatihan adalah 500 untuk model template kustom dan 50.000 untuk model neural kustom.
Untuk pelatihan model ekstraksi kustom, ukuran total data pelatihan adalah 50 MB untuk model templat dan
1
GB untuk model neural.Untuk pelatihan model klasifikasi kustom, ukuran total data pelatihan adalah
1
GB dengan maksimum 10.000 halaman. Untuk pratinjau 2024-07-31 dan yang lebih baru, ukuran total data pelatihan adalah2
GB dengan maksimum 10.000 halaman.
Ekstraksi data model dokumen umum
Coba ekstrak data dari formulir dan dokumen menggunakan Studio Kecerdasan Dokumen.
Anda membutuhkan sumber daya berikut:
Langganan Azure—Anda dapat membuatnya secara gratis.
Instans Kecerdasan Dokumen di portal Azure. Anda dapat menggunakan tingkat harga gratis (
F0
) untuk mencoba layanan. Setelah sumber daya Anda disebarkan, pilih Buka sumber daya untuk mendapatkan kunci dan titik akhir Anda.
Catatan
Document Intelligence Studio dan model dokumen umum tersedia dengan API v3.0.
Anda dapat menganalisis contoh dokumen atau mengunggah file Anda sendiri.
Pilih tombol Jalankan analisis dan, jika perlu, konfigurasikan opsi Analisis:
Coba Studio Kecerdasan Dokumen.
Pasangan kunci-nilai
Pasangan kunci-nilai adalah rentang tertentu dalam dokumen yang mengidentifikasi label atau kunci dan respons atau nilai terkaitnya. Dalam bentuk terstruktur, pasangan ini dapat menjadi label dan nilai yang dimasukkan pengguna untuk bidang tersebut. Dalam dokumen tidak terstruktur, pasangan ini dapat menjadi tanggal kontrak dieksekusi berdasarkan teks dalam paragraf. Model AI dilatih untuk mengekstrak kunci dan nilai yang dapat diidentifikasi berdasarkan berbagai jenis, format, dan struktur dokumen.
Kunci juga dapat ada dalam isolasi ketika model mendeteksi bahwa ada kunci, tanpa nilai terkait atau saat memproses bidang opsional. Misalnya, bidang nama tengah dapat dibiarkan kosong pada formulir dalam beberapa instans. Pasangan kunci-nilai adalah rentang teks yang terkandung dalam dokumen. Untuk dokumen di mana nilai yang sama dijelaskan dengan cara yang berbeda, misalnya, pelanggan/pengguna, kunci terkait adalah pelanggan atau pengguna (berdasarkan konteks).
Ekstraksi data
Model | Ekstraksi teks | Pasangan Kunci-Nilai | Tanda Pilihan | Tabel | Nama Umum |
---|---|---|---|---|---|
Dokumen umum | ✓ | ✓ | ✓ | ✓ | ✓* |
✓* - Hanya tersedia di 2023-07-31
(GA v3.1) dan versi API yang lebih baru.
Bahasa dan lokal yang didukung
Lihat halaman Dukungan Bahasa—model analisis dokumen untuk daftar lengkap bahasa yang didukung.
Pertimbangan
Karena kunci adalah rentang teks yang diekstrak dari dokumen, untuk dokumen semi terstruktur, kunci perlu dipetakan ke kamus kunci yang ada.
Diharapkan melihat pasangan kunci nilai dengan kunci, tetapi tidak ada nilai. Misalnya, jika pengguna memilih untuk tidak memberikan alamat email pada formulir.
Langkah berikutnya
Ikuti panduan migrasi Kecerdasan Dokumen v3.1 kami untuk mempelajari cara menggunakan versi v3.1 di aplikasi dan alur kerja Anda.
Jelajahi REST API kami.