Model kustom yang terdiri dari Kecerdasan Dokumen
Penting
- Rilis pratinjau publik Kecerdasan Dokumen menyediakan akses awal ke fitur yang sedang dalam pengembangan aktif. Fitur, pendekatan, dan proses dapat berubah, sebelum Ketersediaan Umum (GA), berdasarkan umpan balik pengguna.
- Versi pratinjau publik pustaka klien Kecerdasan Dokumen default ke REST API versi 2024-07-31-preview.
- Pratinjau publik versi 2024-07-31-preview saat ini hanya tersedia di wilayah Azure berikut. Perhatikan bahwa model generatif kustom (ekstraksi bidang dokumen) di AI Studio hanya tersedia di wilayah US Tengah Utara:
- US Timur
- US Barat2
- Eropa Barat
- US Tengah Utara
Konten ini berlaku untuk: v4.0 (pratinjau) | Versi sebelumnya: v3.1 (GA) v3.0 (GA) v2.1 (GA)
Konten ini berlaku untuk: v3.1 (GA) | Versi terbaru: v4.0 (pratinjau) | Versi sebelumnya: v3.0 v2.1
Konten ini berlaku untuk: v3.0 (GA) | Versi terbaru: v4.0 (pratinjau) v3.1 | Versi sebelumnya: v2.1
Konten ini berlaku untuk: v2.1 | Versi terbaru: v4.0 (pratinjau)
Penting
Perilaku model compose
operasi berubah dari api-version=2024-07-31-preview. model compose
Operasi v4.0 dan yang lebih baru menambahkan pengklasifikasi terlatih secara eksplisit alih-alih pengklasifikasi implisit untuk analisis. Untuk versi model yang terdiri sebelumnya, lihat Menyusun model kustom v3.1. Jika saat ini Anda menggunakan model yang terdiri dari peningkatan ke implementasi terbaru.
Apa itu model yang disusun?
Dengan model yang terdiri, Anda dapat mengelompokkan beberapa model kustom ke dalam model yang terdiri yang disebut dengan SATU ID model. Misalnya, model yang Anda buat mungkin menyertakan model khusus yang dilatih untuk menganalisis pesanan pembelian pasokan, peralatan, dan furnitur Anda. Alih-alih secara manual mencoba memilih model yang sesuai, Anda dapat menggunakan model yang disusun untuk menentukan model kustom yang sesuai untuk setiap analisis dan ekstraksi.
Beberapa skenario mengharuskan mengklasifikasikan dokumen terlebih dahulu lalu menganalisis dokumen dengan model yang paling cocok untuk mengekstrak bidang dari model. Skenario tersebut dapat mencakup skenario di mana pengguna mengunggah dokumen tetapi jenis dokumen tidak diketahui secara eksplisit. Skenario lain bisa ketika beberapa dokumen dipindai bersama-sama ke dalam satu file dan file dikirim untuk diproses. Aplikasi Anda kemudian perlu mengidentifikasi dokumen komponen dan memilih model terbaik untuk setiap dokumen.
Dalam versi sebelumnya, model compose
operasi melakukan klasifikasi implisit untuk memutuskan model kustom mana yang paling mewakili dokumen yang dikirimkan. Implementasi 2024-07-31-preview
model compose
operasi menggantikan klasifikasi implisit dari versi sebelumnya dengan langkah klasifikasi eksplisit dan menambahkan perutean kondisional.
Manfaat operasi pembuatan model baru
Operasi baru model compose
mengharuskan Anda untuk melatih pengklasifikasi eksplisit dan memberikan beberapa manfaat.
Peningkatan inkremental berkelanjutan. Anda dapat secara konsisten meningkatkan kualitas pengklasifikasi dengan menambahkan lebih banyak sampel dan meningkatkan klasifikasi secara bertahap. Penyetelan halus ini memastikan dokumen Anda selalu dirutekan ke model yang tepat untuk ekstraksi.
Kontrol penuh atas perutean. Dengan menambahkan perutean berbasis keyakinan, Anda memberikan ambang keyakinan untuk jenis dokumen dan respons klasifikasi.
Abaikan jenis dokumen tertentu dokumen selama operasi. Implementasi operasi sebelumnya
model compose
memilih model analisis terbaik untuk ekstraksi berdasarkan skor keyakinan bahkan jika skor keyakinan tertinggi relatif rendah. Dengan memberikan ambang keyakinan atau secara eksplisit tidak memetakan jenis dokumen yang diketahui dari klasifikasi ke model ekstraksi, Anda dapat mengabaikan jenis dokumen tertentu.Analisis beberapa instans dengan jenis dokumen yang sama. Saat dipasangkan dengan
splitMode
opsi pengklasifikasi,model compose
operasi dapat mendeteksi beberapa instans dokumen yang sama dalam file dan membagi file untuk memproses setiap dokumen secara independen. MenggunakansplitMode
memungkinkan pemrosesan beberapa instans dokumen dalam satu permintaan.Dukungan untuk fitur add-on. Menambahkan fitur seperti bidang kueri atau kode batang juga dapat ditentukan sebagai bagian dari parameter model analisis.
Model kustom yang ditetapkan maksimum diperluas menjadi 500. Implementasi
model compose
baru operasi memungkinkan Anda menetapkan hingga 500 model kustom terlatih ke satu model yang disusupi.
Cara menggunakan pembuatan model
Mulailah dengan mengumpulkan sampel semua dokumen yang Anda butuhkan termasuk sampel dengan informasi yang harus diekstraksi atau diabaikan.
Latih pengklasifikasi dengan mengatur dokumen dalam folder di mana nama folder adalah jenis dokumen yang ingin Anda gunakan dalam definisi model yang anda buat.
Terakhir, latih model ekstraksi untuk setiap jenis dokumen yang ingin Anda gunakan.
Setelah model klasifikasi dan ekstraksi Anda dilatih, gunakan Document Intelligence Studio, pustaka klien, atau REST API untuk menyusun model klasifikasi dan ekstraksi ke dalam model yang disusun.
splitMode
Gunakan parameter untuk mengontrol perilaku pemisahan file:
- Tidak ada. Seluruh file diperlakukan sebagai satu dokumen.
- perPage. Setiap halaman dalam file diperlakukan sebagai dokumen terpisah.
- otomatis. File secara otomatis dibagi menjadi dokumen.
Penagihan dan harga
Model yang terdiri ditagih sama dengan model kustom individual. Harga didasarkan pada jumlah halaman yang dianalisis oleh model analisis hilir. Penagihan didasarkan pada harga ekstraksi untuk halaman yang dirutekan ke model ekstraksi. Dengan penambahan biaya klasifikasi eksplisit dikeluarkan untuk klasifikasi semua halaman dalam file input. Untuk informasi selengkapnya, lihat halaman harga Kecerdasan Dokumen.
Menggunakan operasi pembuatan model
Mulailah dengan membuat daftar semua ID model yang ingin Anda buat ke dalam satu model.
Buat model ke dalam SATU ID model menggunakan Studio, REST API, atau pustaka klien.
Gunakan ID model yang terdiri untuk menganalisis dokumen.
Billing
Model yang terdiri ditagih sama dengan model kustom individual. Harga didasarkan pada jumlah halaman yang dianalisis. Penagihan didasarkan pada harga ekstraksi untuk halaman yang dirutekan ke model ekstraksi. Untuk informasi selengkapnya, lihat halaman harga Kecerdasan Dokumen.
- Tidak ada perubahan harga untuk menganalisis dokumen dengan menggunakan model kustom individual atau model kustom yang disusam.
Fitur model yang terdiri
Custom template
dancustom neural
model dapat terdiri bersama-sama ke dalam satu model yang terdiri di beberapa versi API.Respons mencakup
docType
properti untuk menunjukkan model mana yang dibuat digunakan untuk menganalisis dokumen.Untuk
custom template
model, model yang dibuat dapat dibuat menggunakan variasi templat kustom atau jenis formulir yang berbeda. Operasi ini berguna saat formulir masuk milik salah satu dari beberapa templat.Untuk model
custom neural
, praktik terbaiknya yaitu menambahkan semua variasi yang berbeda dari satu jenis dokumen ke dalam satu himpunan data pelatihan dan melatih model neural kustom. Operasimodel compose
ini paling cocok untuk skenario ketika Anda memiliki dokumen dari berbagai jenis yang dikirimkan untuk analisis.
Menyusun batas model
Dengan operasi ini
model compose
, Anda dapat menetapkan hingga 500 model ke satu ID model. Jika jumlah model yang ingin saya buat melebihi batas atas model yang disusupi, Anda dapat menggunakan salah satu alternatif berikut:Klasifikasikan dokumen sebelum memanggil model kustom. Anda dapat menggunakan model Baca dan membuat klasifikasi berdasarkan teks yang diekstrak dari dokumen dan frasa tertentu dengan menggunakan sumber seperti kode, ekspresi reguler, atau pencarian.
Jika Anda ingin mengekstrak bidang yang sama dari berbagai dokumen terstruktur, semi terstruktur, dan tidak terstruktur, pertimbangkan untuk menggunakan model neural kustom pembelajaran mendalam. Pelajari selengkapnya tentang perbedaan antara model templat kustom dan model neural kustom.
Menganalisis dokumen dengan menggunakan model yang terdiri identik dengan menganalisis dokumen dengan menggunakan satu model. Hasilnya
Analyze Document
mengembalikandocType
properti yang menunjukkan model komponen mana yang Anda pilih untuk menganalisis dokumen.Operasi
model compose
saat ini hanya tersedia untuk model kustom yang dilatih dengan label.
Kompatibilitas model yang disusun
Tipe model kustom | Model yang dilatih dengan v2.1 dan v2.0 | Templat kustom dan model neural v3.1 dan v3.0 | Templat kustom dan model neural pratinjau v4.0 | Pratinjau model Generatif Kustom v4.0 |
---|---|---|---|---|
Model yang dilatih dengan versi 2.1 dan v2.0 | Tidak Didukung | Tidak Didukung | Tidak Didukung | Tidak Didukung |
Templat kustom dan model neural v3.0 dan v3.1 | Tidak Didukung | Didukung | Didukung | Tidak Didukung |
Templat kustom dan model neural pratinjau v4.0 | Tidak Didukung | Didukung | Didukung | Tidak Didukung |
Pratinjau model generatif kustom v4.0 | Tidak Didukung | Tidak Didukung | Tidak Didukung | Tidak Didukung |
Untuk menyusun model yang dilatih dengan versi API sebelumnya (v2.1 atau versi lebih lama), melatih model dengan API v3.0 menggunakan himpunan data berlabel yang sama. Penambahan itu memastikan bahwa model v2.1 dapat dikomposisikan dengan model lain.
Dengan model yang terdiri menggunakan v2.1 api terus didukung, tidak memerlukan pembaruan.
Opsi pengembangan
Kecerdasan Dokumen v4.0:2024-07-31-preview mendukung alat, aplikasi, dan pustaka berikut:
Fitur | Sumber |
---|---|
Model kustom | • Document Intelligence Studio • REST API • C# SDK • Java SDK • JavaScript SDK • Python SDK |
Model yang disusun | • Document Intelligence Studio • REST API • C# SDK • Java SDK • JavaScript SDK • Python SDK |
Kecerdasan Dokumen v3.1:2023-07-31 (GA) mendukung alat, aplikasi, dan pustaka berikut:
Fitur | Sumber |
---|---|
Model kustom | • Document Intelligence Studio • REST API • C# SDK • Java SDK • JavaScript SDK • Python SDK |
Model yang disusun | • Document Intelligence Studio • REST API • C# SDK • Java SDK • JavaScript SDK • Python SDK |
Kecerdasan Dokumen v3.0:2022-08-31 (GA) mendukung alat, aplikasi, dan pustaka berikut:
Fitur | Sumber |
---|---|
Model kustom | • Document Intelligence Studio • REST API • C# SDK • Java SDK • JavaScript SDK • Python SDK |
Model yang disusun | • Document Intelligence Studio • REST API • C# SDK • Java SDK • JavaScript SDK • Python SDK |
Kecerdasan Dokumen v2.1 mendukung sumber daya berikut:
Fitur | Sumber |
---|---|
Model kustom | • Alat pelabelan Kecerdasan Dokumen• REST API • Pustaka klien SDK • Kontainer Docker Kecerdasan Dokumen |
Model yang disusun | • Alat pelabelan Kecerdasan Dokumen• REST API • C# SDK • Java SDK • JavaScript SDK • Python SDK |
Langkah berikutnya
Pelajari cara membuat dan menyusun model kustom: