Model kustom Kecerdasan Dokumen
Penting
- Rilis pratinjau publik Kecerdasan Dokumen menyediakan akses awal ke fitur yang sedang dalam pengembangan aktif. Fitur, pendekatan, dan proses dapat berubah, sebelum Ketersediaan Umum (GA), berdasarkan umpan balik pengguna.
- Versi pratinjau publik pustaka klien Kecerdasan Dokumen default ke REST API versi 2024-07-31-preview.
- Pratinjau publik versi 2024-07-31-preview saat ini hanya tersedia di wilayah Azure berikut. Perhatikan bahwa model generatif kustom (ekstraksi bidang dokumen) di AI Studio hanya tersedia di wilayah US Tengah Utara:
- US Timur
- US Barat2
- Eropa Barat
- US Tengah Utara
Konten ini berlaku untuk: v4.0 (pratinjau) | Versi sebelumnya: v3.1 (GA) v3.0 (GA) v2.1 (GA)
Konten ini berlaku untuk: v3.1 (GA) | Versi terbaru: v4.0 (pratinjau) | Versi sebelumnya: v3.0 v2.1
Konten ini berlaku untuk: v3.0 (GA) | Versi terbaru: v4.0 (pratinjau) v3.1 | Versi sebelumnya: v2.1
Konten ini berlaku untuk: v2.1 | Versi terbaru: v4.0 (pratinjau)
Kecerdasan Dokumen menggunakan teknologi pembelajaran mesin canggih untuk mengidentifikasi dokumen, mendeteksi dan mengekstrak informasi dari formulir dan dokumen, dan mengembalikan data yang diekstrak dalam output JSON terstruktur. Dengan Kecerdasan Dokumen, Anda dapat menggunakan model analisis dokumen, model kustom mandiri bawaan/terlatih, atau model kustom mandiri terlatih Anda.
Model kustom sekarang menyertakan model klasifikasi kustom untuk skenario di mana Anda perlu mengidentifikasi jenis dokumen sebelum memanggil model ekstraksi. Model pengklasifikasi tersedia dimulai dengan 2023-07-31 (GA)
API. Model klasifikasi dapat dipasangkan dengan model ekstraksi kustom untuk menganalisis dan mengekstrak bidang dari formulir dan dokumen khusus untuk bisnis Anda. Model ekstraksi kustom mandiri dapat dikombinasikan untuk membuat model yang disusun.
Jenis model dokumen kustom
Model dokumen kustom dapat berupa salah satu dari dua jenis, templat kustom atau formulir kustom dan model dokumen kustom atau neural kustom. Proses pelabelan dan pelatihan untuk kedua model identik, tetapi modelnya berbeda sebagai berikut:
Model ekstraksi kustom
Untuk membuat model ekstraksi kustom, beri label himpunan data dokumen dengan nilai yang ingin Anda ekstrak dan latih model pada himpunan data berlabel. Anda hanya memerlukan lima contoh jenis formulir yang sama untuk memulai.
Model neural kustom
Penting
Dimulai dengan API versi 4.0 (2024-02-29-preview), model neural kustom sekarang mendukung bidang dan tabel, baris, dan tingkat sel yang tumpang tindih.
Model neural (dokumen kustom) kustom menggunakan model pembelajaran mendalam dan model dasar yang dilatih pada banyak koleksi dokumen. Model ini kemudian disesuaikan atau disesuaikan dengan data Anda saat Anda melatih model dengan himpunan data berlabel. Model neural kustom mendukung ekstraksi bidang data utama dari dokumen terstruktur, semi terstruktur, dan tidak terstruktur. Ketika Anda memilih antara dua jenis model, mulailah dengan model neural jika memenuhi kebutuhan fungsional Anda. Lihat model neural untuk mempelajari lebih lanjut tentang model dokumen kustom.
Model template kustom
Templat kustom atau model formulir kustom bergantung pada templat visual yang konsisten untuk mengekstrak data berlabel. Varians dalam struktur visual dokumen Anda memengaruhi akurasi model Anda. Bentuk terstruktur seperti kuesioner atau aplikasi adalah contoh templat visual yang konsisten.
Set pelatihan Anda terdiri dari dokumen terstruktur di mana pemformatan dan tata letak statis dan konstanta dari satu instans dokumen ke instans dokumen berikutnya. Model templat kustom mendukung pasangan nilai kunci, tanda pilihan, tabel, bidang tanda tangan, dan wilayah. Model templat dan dapat dilatih pada dokumen dalam salah satu bahasa yang didukung. Untuk informasi selengkapnya, lihat model templat kustom.
Jika bahasa dokumen dan skenario ekstraksi Anda mendukung model neural kustom, kami sarankan Anda menggunakan model neural kustom melalui model templat untuk akurasi yang lebih tinggi.
Tip
Untuk mengonfirmasi bahwa dokumen pelatihan Anda menyajikan templat visual yang konsisten, hapus semua data yang dimasukkan pengguna dari setiap formulir dalam set. Jika bentuk kosong identik dalam penampilan, mereka mewakili templat visual yang konsisten.
Untuk informasi selengkapnya, lihat Menginterpretasikan dan meningkatkan akurasi dan kepercayaan diri untuk model kustom.
Persyaratan input
Untuk hasil terbaik, berikan satu foto yang jelas atau pemindaian berkualitas tinggi per dokumen.
Format file yang didukung:
Model PDF Gambar: jpeg/jpg
, ,bmp
png
,tiff
, ,heif
Microsoft Office:
Word (docx), Excel (xlsx), PowerPoint (pptx)Read ✔ ✔ ✔ Tata letak ✔ ✔ ✔ (2024-02-29-preview, 2023-10-31-preview, dan yang lebih baru) Dokumen Umum ✔ ✔ Bawaan ✔ ✔ Ekstraksi kustom ✔ ✔ Klasifikasi kustom ✔ ✔ ✔ ✱ File Microsoft Office saat ini tidak didukung untuk model atau versi lain.
Untuk PDF dan TIFF, hingga 2.000 halaman dapat diproses (dengan langganan tingkat gratis, hanya dua halaman pertama yang diproses).
Ukuran file untuk menganalisis dokumen adalah 500 MB untuk tingkat berbayar (S0) dan 4 MB secara gratis (F0).
Dimensi gambar harus antara 50 x 50 piksel dan 10.000 piksel x 10.000 piksel.
Jika PDF Anda dikunci dengan kata sandi, Anda harus menghapus kunci sebelum pengiriman.
Tinggi minimum teks yang akan diekstrak adalah 12 piksel untuk gambar piksel 1024 x 768. Dimensi ini sesuai dengan teks sekitar
8
-point pada 150 titik per inci.Untuk pelatihan model kustom, jumlah maksimum halaman untuk data pelatihan adalah 500 untuk model template kustom dan 50.000 untuk model neural kustom.
Untuk pelatihan model ekstraksi kustom, ukuran total data pelatihan adalah 50 MB untuk model templat dan 1G-MB untuk model neural.
Untuk pelatihan model klasifikasi kustom, ukuran total data pelatihan adalah
1GB
dengan maksimum 10.000 halaman.
Data pelatihan yang optimal
Data input pelatihan adalah dasar dari model pembelajaran mesin apa pun. Ini menentukan kualitas, akurasi, dan performa model. Oleh karena itu, sangat penting untuk membuat data input pelatihan terbaik yang mungkin untuk proyek Kecerdasan Dokumen Anda. Saat Anda menggunakan model kustom Kecerdasan Dokumen, Anda menyediakan data pelatihan Anda sendiri. Berikut adalah beberapa tips untuk membantu melatih model Anda secara efektif:
Gunakan PDF berbasis teks, bukan PDF berbasis gambar jika memungkinkan. Salah satu cara untuk mengidentifikasi PDF berbasis gambar*adalah dengan mencoba memilih teks tertentu dalam dokumen. Jika Anda hanya dapat memilih seluruh gambar teks, dokumen berbasis gambar, bukan berbasis teks.
Atur dokumen pelatihan Anda dengan menggunakan subfolder untuk setiap format (JPEG/JPG, PNG, BMP, PDF, atau TIFF).
Gunakan formulir yang telah menyelesaikan semua bidang yang tersedia.
Gunakan formulir dengan nilai berbeda di setiap bidang.
Gunakan himpunan data yang lebih besar (lebih dari lima dokumen pelatihan) jika gambar Anda berkualitas rendah.
Tentukan apakah Anda perlu menggunakan satu model atau beberapa model yang disusun menjadi satu model.
Pertimbangkan untuk mensegmentasi himpunan data Anda ke dalam folder, di mana setiap folder adalah templat yang unik. Latih satu model per folder, dan buat model yang dihasilkan menjadi satu titik akhir. Akurasi model dapat menurun ketika Anda memiliki format berbeda yang dianalisis dengan satu model.
Pertimbangkan untuk mensegmentasi himpunan data Anda untuk melatih beberapa model jika formulir Anda memiliki variasi dengan format dan hentian halaman. Formulir kustom bergantung pada templat visual yang konsisten.
Pastikan Anda memiliki himpunan data seimbang dengan memperhitungkan format, jenis dokumen, dan struktur.
Mode build
Operasi ini build custom model
menambahkan dukungan untuk model kustom templat dan neural . Versi REST API dan pustaka klien sebelumnya hanya mendukung mode build tunggal yang sekarang dikenal sebagai mode templat .
Model templat hanya menerima dokumen yang memiliki struktur halaman dasar yang sama — tampilan visual yang seragam — atau posisi relatif elemen yang sama dalam dokumen.
Model neural mendukung dokumen yang memiliki informasi yang sama, tetapi struktur halaman yang berbeda. Contoh dokumen-dokumen ini termasuk Amerika Serikat formulir W2, yang berbagi informasi yang sama, tetapi bervariasi dalam penampilan di seluruh perusahaan.
Tabel ini menyediakan tautan ke referensi SDK bahasa pemrograman mode build dan sampel kode di GitHub:
Bahasa pemrograman | Referensi SDK | Sampel kode |
---|---|---|
C#/.NET | DocumentBuildMode Struct | Sample_BuildCustomModelAsync.cs |
Java | Kelas DocumentBuildMode | BuildModel.java |
JavaScript | Tipe DocumentBuildMode | buildModel.js |
Python | DocumentBuildMode Enum | sample_build_model.py |
Membandingkan fitur model
Tabel berikut membandingkan templat kustom dan fitur neural kustom:
Fitur | Templat kustom (formulir) | Neural kustom (dokumen) |
---|---|---|
Struktur dokumen | Templat, formulir, dan terstruktur | Terstruktur, semi-terstruktur, dan tidak terstruktur |
Waktu Pelatihan | 1 hingga 5 menit | 20 menit hingga 1 jam |
Ekstraksi data | Pasangan nilai kunci, tabel, tanda pilihan, koordinat, dan tanda tangan | Pasangan kunci-nilai, tanda pilihan, dan tabel |
Bidang yang tumpang tindih | Tidak didukung | Didukung |
Variasi dokumen | Memerlukan model per setiap variasi | Menggunakan satu model untuk semua variasi |
Dukungan bahasa | Templat kustom dukungan bahasa | Bahasa mendukung neural kustom |
Model klasifikasi kustom
Klasifikasi dokumen adalah skenario baru yang didukung oleh Kecerdasan Dokumen dengan 2023-07-31
API (v3.1 GA). API pengklasifikasi dokumen mendukung skenario klasifikasi dan pemisahan. Latih model klasifikasi untuk mengidentifikasi berbagai jenis dokumen yang didukung aplikasi Anda. File input untuk model klasifikasi dapat berisi beberapa dokumen dan mengklasifikasikan setiap dokumen dalam rentang halaman terkait. Untuk mempelajari selengkapnya, lihat model klasifikasi kustom.
Catatan
Dimulai dengan klasifikasi 2024-02-29-preview
dokumen versi API sekarang mendukung jenis dokumen Office untuk klasifikasi. Versi API ini juga memperkenalkan pelatihan inkremental untuk model klasifikasi.
Alat model kustom
Model Kecerdasan Dokumen v3.1 dan yang lebih baru mendukung alat, aplikasi, dan pustaka, program, dan pustaka berikut:
Fitur | Sumber | ID Model |
---|---|---|
Model kustom | • Studio Kecerdasan Dokumen• REST API • C# SDK • Python SDK |
custom-model-id |
Siklus hidup model kustom
Siklus hidup model kustom tergantung pada versi API yang digunakan untuk melatihnya. Jika versi API adalah versi ketersediaan umum (GA), model kustom memiliki siklus hidup yang sama dengan versi tersebut. Model kustom tidak tersedia untuk inferensi saat versi API tidak digunakan lagi. Jika versi API adalah versi pratinjau, model kustom memiliki siklus hidup yang sama dengan versi pratinjau API.
Kecerdasan Dokumen v2.1 mendukung alat, aplikasi, dan pustaka berikut:
Catatan
Jenis model kustom neural kustom dan templat kustom tersedia dengan Api v3.1 dan v3.0 versi Kecerdasan Dokumen.
Fitur | Sumber |
---|---|
Model kustom | • Alat pelabelan Kecerdasan Dokumen• REST API • Pustaka klien SDK • Kontainer Docker Kecerdasan Dokumen |
Membangun model kustom
Ekstrak data dari dokumen spesifik atau unik Anda menggunakan model kustom. Anda membutuhkan sumber daya berikut:
Langganan Azure. Anda dapat membuatnya secara gratis.
Instans Kecerdasan Dokumen di portal Azure. Anda dapat menggunakan tingkat harga gratis (
F0
) untuk mencoba layanan. Setelah sumber daya Anda disebarkan, pilih Buka sumber daya untuk mendapatkan kunci dan titik akhir Anda.
Alat pelabelan sampel
Tip
- Untuk pengalaman yang ditingkatkan dan kualitas model tingkat lanjut, coba Document Intelligence v3.0 Studio.
- Studio v3.0 mendukung model apa pun yang dilatih dengan data berlabel v2.1.
- Anda dapat mengacu ke panduan migrasi API untuk mendapatkan detail informasi tentang migrasi dari v2.1 ke v3.0.
- Lihat REST API atau C#, Java, JavaScript, atau Python SDK kami .. /quickstarts untuk mulai menggunakan versi v3.0.
Alat Pelabelan Sampel Kecerdasan Dokumen adalah alat sumber terbuka yang memungkinkan Anda menguji fitur terbaru fitur Kecerdasan Dokumen dan Pengenalan Karakter Optik (OCR).
Coba mulai cepat alat Pelabelan Sampel untuk mulai membangun dan menggunakan model kustom.
Studio Kecerdasan Dokumen
Catatan
Document Intelligence Studio tersedia dengan API v3.1 dan v3.0.
Pada beranda Studio Kecerdasan Dokumen, pilih Model ekstraksi kustom.
Di bagian Proyek Saya, pilih Buat proyek.
Lengkapi bidang detail proyek.
Konfigurasikan sumber daya layanan dengan menambahkan akun Storage dan kontainer Blob anda untuk Koneksi sumber data pelatihan anda.
Meninjau dan membuat proyek Anda.
Tambahkan dokumen sampel Anda untuk memberi label, membangun, dan menguji model kustom Anda.
Untuk panduan terperinci untuk membuat model ekstraksi kustom pertama Anda, lihat Cara membuat model ekstraksi kustom.
Ringkasan ekstraksi model kustom
Tabel ini membandingkan area ekstraksi data yang didukung:
Model | Bidang formulir | Tanda pilihan | Bidang terstruktur (Tabel) | Tanda Tangan | Pelabelan wilayah | Bidang yang tumpang tindih |
---|---|---|---|---|---|---|
Templat kustom | ✔ | ✔ | ✔ | ✔ | ✔ | n/a |
Neural kustom | ✔ | ✔ | ✔ | n/a | * | ✔ (Pratinjau 2024-02-29) |
Simbol tabel:
✔ —Didukung
**n/a—Saat ini tidak tersedia;
*-Berulah berbeda tergantung pada model. Dengan model templat, data sintetis dihasilkan pada waktu pelatihan. Dengan model neural, keluar dari teks yang dikenali di wilayah dipilih.
Tip
Saat memilih di antara dua jenis model, mulailah dengan model neural khusus jika memenuhi kebutuhan fungsional Anda. Lihat neural kustom untuk mempelajari lebih lanjut tentang model neural kustom.
Opsi pengembangan model kustom
Tabel berikut ini menjelaskan fitur yang tersedia dengan alat dan pustaka klien terkait. Sebagai praktik terbaik, pastikan Anda menggunakan alat yang kompatibel yang tercantum di sini.
Jenis dokumen | REST API | SDK | Model Label dan Uji |
---|---|---|---|
Templat kustom v 4.0 v3.1 v3.0 | Kecerdasan Dokumen 3.1 | SDK Kecerdasan Dokumen | Studio Kecerdasan Dokumen |
Neural kustom v4.0 v3.1 v3.0 | Kecerdasan Dokumen 3.1 | SDK Kecerdasan Dokumen | Studio Kecerdasan Dokumen |
Formulir kustom v2.1 | API GA Kecerdasan Dokumen 2.1 | SDK Kecerdasan Dokumen | Alat pelabelan sampel |
Catatan
Model templat kustom yang dilatih dengan API 3.0 akan memiliki beberapa peningkatan atas API 2.1 yang berasal dari peningkatan mesin OCR. Himpunan data yang digunakan untuk melatih model templat kustom menggunakan API 2.1 masih dapat digunakan untuk melatih model baru menggunakan API 3.0.
Untuk hasil terbaik, berikan satu foto yang jelas atau pemindaian berkualitas tinggi per dokumen.
Format file yang didukung adalah JPEG/JPG, PNG, BMP, TIFF, dan PDF (teks tersemat atau dipindai). PDF dengan teks tertanam adalah yang terbaik dalam mengeliminasi kemungkinan kesalahan dalam ekstraksi dan lokasi karakter.
Untuk file PDF dan TIFF, hingga 2.000 halaman dapat diproses. Dengan langganan tingkat gratis, hanya dua halaman pertama yang diproses.
Ukuran file harus kurang dari 500 MB untuk tingkat berbayar (S0) dan 4 MB untuk tingkat gratis (F0).
Dimensi gambar harus antara 50 x 50 piksel dan 10.000 x 10.000 piksel.
Dimensi PDF hingga 17 x 17 inci, sesuai dengan ukuran kertas Legal atau A3, atau lebih kecil.
Ukuran total data pelatihan adalah 500 halaman atau kurang.
Jika PDF Anda dikunci dengan kata sandi, Anda harus menghapus kunci sebelum pengiriman.
Tip
Data pelatihan:
- Jika memungkinkan, gunakan dokumen PDF berbasis teks daripada dokumen berbasis gambar. PDF yang dipindai ditangani sebagai gambar.
- Harap sediakan hanya satu instans formulir per dokumen.
- Untuk formulir yang diisi, gunakan contoh yang semua bidangnya telah terisi.
- Gunakan formulir dengan nilai berbeda di setiap bidang.
- Jika gambar formulir Anda memiliki kualitas yang lebih rendah, gunakan kumpulan data yang lebih besar. Misalnya, gunakan 10 hingga 15 gambar.
Bahasa dan lokal yang didukung
Lihat halaman Dukungan Bahasa—model kustom untuk daftar lengkap bahasa yang didukung.