Model kustom Kecerdasan Dokumen

Artikel
03/12/2024

Penting

Rilis pratinjau publik Kecerdasan Dokumen menyediakan akses awal ke fitur yang sedang dalam pengembangan aktif.
Fitur, pendekatan, dan proses dapat berubah, sebelum Ketersediaan Umum (GA), berdasarkan umpan balik pengguna.
Versi pratinjau publik pustaka klien Kecerdasan Dokumen default ke REST API versi 2024-02-29-preview.
Pratinjau publik versi 2024-02-29-preview saat ini hanya tersedia di wilayah Azure berikut:
US Timur
US Barat2
Eropa Barat

Konten ini berlaku untuk:v4.0 (pratinjau) | Versi sebelumnya:v3.1 (GA)v3.0 (GA)v2.1 (GA)

Konten ini berlaku untuk:v3.1 (GA) | Versi terbaru:v4.0 (pratinjau) | Versi sebelumnya:v3.0v2.1

Konten ini berlaku untuk:v3.0 (GA) | Versi terbaru:v4.0 (pratinjau)v3.1 | Versi sebelumnya:v2.1

Konten ini berlaku untuk:v2.1 | Versi terbaru:v4.0 (pratinjau)

Kecerdasan Dokumen menggunakan teknologi pembelajaran mesin canggih untuk mengidentifikasi dokumen, mendeteksi dan mengekstrak informasi dari formulir dan dokumen, dan mengembalikan data yang diekstrak dalam output JSON terstruktur. Dengan Kecerdasan Dokumen, Anda dapat menggunakan model analisis dokumen, model kustom mandiri bawaan/terlatih, atau model kustom mandiri terlatih Anda.

Model kustom sekarang menyertakan model klasifikasi kustom untuk skenario di mana Anda perlu mengidentifikasi jenis dokumen sebelum memanggil model ekstraksi. Model pengklasifikasi tersedia dimulai dengan 2023-07-31 (GA) API. Model klasifikasi dapat dipasangkan dengan model ekstraksi kustom untuk menganalisis dan mengekstrak bidang dari formulir dan dokumen khusus untuk bisnis Anda untuk membuat solusi pemrosesan dokumen. Model ekstraksi kustom mandiri dapat dikombinasikan untuk membuat model yang disusun.

Jenis model dokumen kustom

Model dokumen kustom dapat berupa salah satu dari dua jenis, templat kustom atau formulir kustom dan model dokumen kustom atau neural kustom. Proses pelabelan dan pelatihan untuk kedua model identik, tetapi modelnya berbeda sebagai berikut:

Model ekstraksi kustom

Untuk membuat model ekstraksi kustom, beri label himpunan data dokumen dengan nilai yang ingin Anda ekstrak dan latih model pada himpunan data berlabel. Anda hanya memerlukan lima contoh jenis formulir yang sama untuk memulai.

Model neural kustom

Penting

Dimulai dengan VERSI 4.0 — API pratinjau 2024-02-29, model neural kustom sekarang mendukung bidang dan tabel, baris, dan tingkat sel yang tumpang tindih.

Model neural (dokumen kustom) kustom menggunakan model pembelajaran mendalam dan model dasar yang dilatih pada banyak koleksi dokumen. Model ini kemudian disesuaikan atau disesuaikan dengan data Anda saat Anda melatih model dengan himpunan data berlabel. Model neural kustom mendukung dokumen terstruktur, semi-terstruktur, dan tidak terstruktur untuk mengekstrak bidang. Model neural kustom saat ini mendukung dokumen berbahasa Inggris. Ketika Anda memilih antara dua jenis model, mulailah dengan model neural jika memenuhi kebutuhan fungsional Anda. Lihat model neural untuk mempelajari lebih lanjut tentang model dokumen kustom.

Model template kustom

Templat kustom atau model formulir kustom bergantung pada templat visual yang konsisten untuk mengekstrak data berlabel. Varians dalam struktur visual dokumen Anda memengaruhi akurasi model Anda. Bentuk terstruktur seperti kuesioner atau aplikasi adalah contoh templat visual yang konsisten.

Set pelatihan Anda terdiri dari dokumen terstruktur di mana pemformatan dan tata letak statis dan konstanta dari satu instans dokumen ke instans dokumen berikutnya. Model templat kustom mendukung pasangan nilai kunci, tanda pilihan, tabel, bidang tanda tangan, dan wilayah. Model templat dan dapat dilatih pada dokumen dalam salah satu bahasa yang didukung. Untuk informasi selengkapnya, lihatmodel templat kustom.

Jika bahasa dokumen dan skenario ekstraksi Anda mendukung model neural kustom, kami sarankan Anda menggunakan model neural kustom melalui model templat untuk akurasi yang lebih tinggi.

Tip

Untuk mengonfirmasi bahwa dokumen pelatihan Anda menyajikan templat visual yang konsisten, hapus semua data yang dimasukkan pengguna dari setiap formulir dalam set. Jika bentuk kosong identik dalam penampilan, mereka mewakili templat visual yang konsisten.

Untuk informasi selengkapnya, lihatInterpret dan tingkatkan akurasi dan kepercayaan diri untuk model kustom.

Persyaratan input

Untuk hasil terbaik, berikan satu foto yang jelas atau pemindaian berkualitas tinggi per dokumen.

Format file yang didukung:

Model	PDF	Gambar: jpeg/jpg, png, bmp, tiff, heif	Microsoft Office: Word (docx), Excel (xlsx), PowerPoint (pptx)
Read	✔	✔	✔
Tata letak	✔	✔	✔ (2024-02-29-preview, 2023-10-31-preview, dan yang lebih baru)
Dokumen Umum	✔	✔
Bawaan	✔	✔
Ekstraksi kustom	✔	✔
Klasifikasi kustom	✔	✔	✔

✱ File Microsoft Office saat ini tidak didukung untuk model atau versi lain.

Untuk PDF dan TIFF, hingga 2.000 halaman dapat diproses (dengan langganan tingkat gratis, hanya dua halaman pertama yang diproses).
Ukuran file untuk menganalisis dokumen adalah 500 MB untuk tingkat berbayar (S0) dan 4 MB secara gratis (F0).
Dimensi gambar harus antara 50 x 50 piksel dan 10.000 piksel x 10.000 piksel.
Jika PDF Anda dikunci dengan kata sandi, Anda harus menghapus kunci sebelum pengiriman.
Tinggi minimum teks yang akan diekstrak adalah 12 piksel untuk gambar piksel 1024 x 768. Dimensi ini sesuai dengan teks sekitar 8-point pada 150 titik per inci.
Untuk pelatihan model kustom, jumlah maksimum halaman untuk data pelatihan adalah 500 untuk model template kustom dan 50.000 untuk model neural kustom.
Untuk pelatihan model ekstraksi kustom, ukuran total data pelatihan adalah 50 MB untuk model templat dan 1G-MB untuk model neural.
Untuk pelatihan model klasifikasi kustom, ukuran total data pelatihan adalah 1GB dengan maksimum 10.000 halaman.

Mode build

Operasi model kustom build menambahkan dukungan untuk templat dan model kustom neural . Versi REST API dan pustaka klien sebelumnya hanya mendukung mode build tunggal yang sekarang dikenal sebagai mode templat .

Model templat hanya menerima dokumen yang memiliki struktur halaman dasar yang sama — tampilan visual yang seragam — atau posisi relatif elemen yang sama dalam dokumen.
Model neural mendukung dokumen yang memiliki informasi yang sama, tetapi struktur halaman yang berbeda. Contoh dokumen-dokumen ini termasuk Amerika Serikat formulir W2, yang berbagi informasi yang sama, tetapi bervariasi dalam penampilan di seluruh perusahaan. Model neural saat ini hanya mendukung teks bahasa Inggris.

Tabel ini menyediakan tautan ke referensi SDK bahasa pemrograman mode build dan sampel kode di GitHub:

Bahasa pemrograman	Referensi SDK	Sampel kode
C#/.NET	DocumentBuildMode Struct	Sample_BuildCustomModelAsync.cs
Java	Kelas DocumentBuildMode	BuildModel.java
JavaScript	Tipe DocumentBuildMode	buildModel.js
Python	DocumentBuildMode Enum	sample_build_model.py

Membandingkan fitur model

Tabel berikut membandingkan templat kustom dan fitur neural kustom:

Fitur	Templat kustom (formulir)	Neural kustom (dokumen)
Struktur dokumen	Templat, formulir, dan terstruktur	Terstruktur, semi-terstruktur, dan tidak terstruktur
Waktu Pelatihan	1 hingga 5 menit	20 menit hingga 1 jam
Ekstraksi data	Pasangan nilai kunci, tabel, tanda pilihan, koordinat, dan tanda tangan	Pasangan kunci-nilai, tanda pilihan, dan tabel
Bidang yang tumpang tindih	Tidak didukung	Didukung
Variasi dokumen	Memerlukan model per setiap variasi	Menggunakan satu model untuk semua variasi
Dukungan bahasa	Dukungan berbagai bahasa	Inggris, dengan dukungan pratinjau untuk dukungan bahasa Spanyol, Prancis, Jerman, Italia, dan Belanda

Model klasifikasi kustom

Klasifikasi dokumen adalah skenario baru yang didukung oleh Kecerdasan Dokumen dengan 2023-07-31 API (v3.1 GA). API pengklasifikasi dokumen mendukung skenario klasifikasi dan pemisahan. Latih model klasifikasi untuk mengidentifikasi berbagai jenis dokumen yang didukung aplikasi Anda. File input untuk model klasifikasi dapat berisi beberapa dokumen dan mengklasifikasikan setiap dokumen dalam rentang halaman terkait. Untuk mempelajari selengkapnya, lihatmodel klasifikasi kustom.

Catatan

Dimulai dengan klasifikasi 2024-02-29-preview dokumen versi API sekarang mendukung jenis dokumen Office untuk klasifikasi. Versi API ini juga memperkenalkan pelatihan inkremental untuk model klasifikasi.

Alat model kustom

Model Kecerdasan Dokumen v3.1 dan yang lebih baru mendukung alat, aplikasi, dan pustaka, program, dan pustaka berikut:

Fitur	Sumber	ID Model
Model kustom	• Studio Kecerdasan Dokumen• REST API • C# SDK • Python SDK	custom-model-id

Kecerdasan Dokumen v2.1 mendukung alat, aplikasi, dan pustaka berikut:

Catatan

Jenis model kustom neural kustom dan templat kustom tersedia dengan Api v3.1 dan v3.0 versi Kecerdasan Dokumen.

Fitur	Sumber
Model kustom	• Alat pelabelan Kecerdasan Dokumen• REST API • Pustaka klien SDK • Kontainer Docker Kecerdasan Dokumen

Membangun model kustom

Ekstrak data dari dokumen spesifik atau unik Anda menggunakan model kustom. Anda membutuhkan sumber daya berikut:

Langganan Azure. Anda dapat membuatnya secara gratis.
Instans Kecerdasan Dokumen di portal Azure. Anda dapat menggunakan tingkat harga gratis (F0) untuk mencoba layanan. Setelah sumber daya Anda disebarkan, pilih Buka sumber daya untuk mendapatkan kunci dan titik akhir Anda.

Alat pelabelan sampel

Tip

Untuk pengalaman yang ditingkatkan dan kualitas model tingkat lanjut, coba Document Intelligence v3.0 Studio.
Studio v3.0 mendukung model apa pun yang dilatih dengan data berlabel v2.1.
Anda dapat mengacu ke panduan migrasi API untuk mendapatkan detail informasi tentang migrasi dari v2.1 ke v3.0.
Lihat mulai cepat REST API atau C#, Java, JavaScript, atau Python SDK untuk memulai versi v3.0.

Alat Pelabelan Sampel Kecerdasan Dokumen adalah alat sumber terbuka yang memungkinkan Anda menguji fitur terbaru fitur Kecerdasan Dokumen dan Pengenalan Karakter Optik (OCR).
Coba mulai cepat alat Pelabelan Sampel untuk mulai membangun dan menggunakan model kustom.

Studio Kecerdasan Dokumen

Catatan

Document Intelligence Studio tersedia dengan API v3.1 dan v3.0.

Pada beranda Studio Kecerdasan Dokumen, pilih Model ekstraksi kustom.
Di bagian Proyek Saya, pilih Buat proyek.
Lengkapi bidang detail proyek.
Konfigurasikan sumber daya layanan dengan menambahkan akun Storage dan kontainer Blob anda untuk Koneksi sumber data pelatihan anda.
Meninjau dan membuat proyek Anda.
Tambahkan dokumen sampel Anda untuk memberi label, membangun, dan menguji model kustom Anda.

Coba Studio Kecerdasan Dokumen

Untuk panduan terperinci untuk membuat model ekstraksi kustom pertama Anda, lihatCara membuat model ekstraksi kustom.

Ringkasan ekstraksi model kustom

Tabel ini membandingkan area ekstraksi data yang didukung:

Model	Bidang formulir	Tanda pilihan	Bidang terstruktur (Tabel)	Tanda Tangan	Pelabelan wilayah	Bidang yang tumpang tindih
Templat kustom	✔	✔	✔	✔	✔	n/a
Neural kustom	✔	✔	✔	n/a	*	✔ (Pratinjau 2024-02-29)

Simbol tabel:
✔ —Didukung
**n/a—Saat ini tidak tersedia;
*-Berulah berbeda tergantung pada model. Dengan model templat, data sintetis dihasilkan pada waktu pelatihan. Dengan model neural, keluar dari teks yang dikenali di wilayah dipilih.

Tip

Saat memilih di antara dua jenis model, mulailah dengan model neural khusus jika memenuhi kebutuhan fungsional Anda. Lihat neural kustom untuk mempelajari lebih lanjut tentang model neural kustom.

Opsi pengembangan model kustom

Tabel berikut ini menjelaskan fitur yang tersedia dengan alat dan pustaka klien terkait. Sebagai praktik terbaik, pastikan Anda menggunakan alat yang kompatibel yang tercantum di sini.

Jenis dokumen	REST API	SDK	Model Label dan Uji
Templat kustom v 4.0 v3.1 v3.0	Kecerdasan Dokumen 3.1	SDK Kecerdasan Dokumen	Studio Kecerdasan Dokumen
Neural kustom v4.0 v3.1 v3.0	Kecerdasan Dokumen 3.1	SDK Kecerdasan Dokumen	Studio Kecerdasan Dokumen
Formulir kustom v2.1	API GA Kecerdasan Dokumen 2.1	SDK Kecerdasan Dokumen	Alat pelabelan sampel

Catatan

Model templat kustom yang dilatih dengan API 3.0 akan memiliki beberapa peningkatan atas API 2.1 yang berasal dari peningkatan mesin OCR. Himpunan data yang digunakan untuk melatih model templat kustom menggunakan API 2.1 masih dapat digunakan untuk melatih model baru menggunakan API 3.0.

Untuk hasil terbaik, berikan satu foto yang jelas atau pemindaian berkualitas tinggi per dokumen.
Format file yang didukung adalah JPEG/JPG, PNG, BMP, TIFF, dan PDF (teks tersemat atau dipindai). PDF dengan teks tertanam adalah yang terbaik dalam mengeliminasi kemungkinan kesalahan dalam ekstraksi dan lokasi karakter.
Untuk file PDF dan TIFF, hingga 2.000 halaman dapat diproses. Dengan langganan tingkat gratis, hanya dua halaman pertama yang diproses.
Ukuran file harus kurang dari 500 MB untuk tingkat berbayar (S0) dan 4 MB untuk tingkat gratis (F0).
Dimensi gambar harus antara 50 x 50 piksel dan 10.000 x 10.000 piksel.
Dimensi PDF hingga 17 x 17 inci, sesuai dengan ukuran kertas Legal atau A3, atau lebih kecil.
Ukuran total data pelatihan adalah 500 halaman atau kurang.
Jika PDF Anda dikunci dengan kata sandi, Anda harus menghapus kunci sebelum pengiriman.
Tip

Data pelatihan:
- Jika memungkinkan, gunakan dokumen PDF berbasis teks daripada dokumen berbasis gambar. PDF yang dipindai ditangani sebagai gambar.
- Harap sediakan hanya satu instans formulir per dokumen.
- Untuk formulir yang diisi, gunakan contoh yang semua bidangnya telah terisi.
- Gunakan formulir dengan nilai berbeda di setiap bidang.
- Jika gambar formulir Anda memiliki kualitas yang lebih rendah, gunakan kumpulan data yang lebih besar. Misalnya, gunakan 10 hingga 15 gambar.

Bahasa dan lokal yang didukung

Lihat halaman Dukungan Bahasa—model kustom untuk daftar lengkap bahasa yang didukung.

Langkah berikutnya

Coba pemrosesan formulir dan dokumen Anda sendiri dengan alat Pelabelan Sampel Kecerdasan Dokumen.
Selesaikan mulai cepat Kecerdasan Dokumen dan mulai membuat aplikasi pemrosesan dokumen dalam bahasa pengembangan pilihan Anda.

Coba pemrosesan formulir dan dokumen Anda sendiri dengan Studio Kecerdasan Dokumen.
Selesaikan mulai cepat Kecerdasan Dokumen dan mulai membuat aplikasi pemrosesan dokumen dalam bahasa pengembangan pilihan Anda.

Model kustom Kecerdasan Dokumen

Jenis model dokumen kustom

Model ekstraksi kustom

Model neural kustom

Model template kustom

Persyaratan input

Mode build

Membandingkan fitur model

Model klasifikasi kustom

Alat model kustom

Membangun model kustom

Alat pelabelan sampel

Studio Kecerdasan Dokumen

Ringkasan ekstraksi model kustom

Opsi pengembangan model kustom

Bahasa dan lokal yang didukung

Langkah berikutnya

Sumber Daya Tambahan: