Bagikan melalui


Model kustom yang terdiri dari Kecerdasan Dokumen

Penting

  • Rilis pratinjau publik Kecerdasan Dokumen menyediakan akses awal ke fitur yang sedang dalam pengembangan aktif. Fitur, pendekatan, dan proses dapat berubah, sebelum Ketersediaan Umum (GA), berdasarkan umpan balik pengguna.
  • Versi pratinjau publik pustaka klien Kecerdasan Dokumen default ke REST API versi 2024-07-31-preview.
  • Pratinjau publik versi 2024-07-31-preview saat ini hanya tersedia di wilayah Azure berikut. Perhatikan bahwa model generatif kustom (ekstraksi bidang dokumen) di AI Studio hanya tersedia di wilayah US Tengah Utara:
    • US Timur
    • US Barat2
    • Eropa Barat
    • US Tengah Utara

Konten ini berlaku untuk: tanda centang v4.0 (pratinjau) | Versi sebelumnya: tanda centang biru v3.1 (GA) tanda centang biru v3.0 (GA)tanda centang biru v2.1 (GA)

Konten ini berlaku untuk: tanda centang v3.1 (GA) | Versi terbaru:tanda centang ungu v4.0 (pratinjau) | Versi sebelumnya: tanda centang biru v3.0tanda centang biru v2.1

Konten ini berlaku untuk: tanda centang v3.0 (GA) | Versi terbaru: tanda centang ungu v4.0 (pratinjau) tanda centang unguv3.1 | Versi sebelumnya: tanda centang biru v2.1

Konten ini berlaku untuk: tanda centang v2.1 | Versi terbaru: tanda centang biru v4.0 (pratinjau)

Penting

Perilaku model compose operasi berubah dari api-version=2024-07-31-preview. model compose Operasi v4.0 dan yang lebih baru menambahkan pengklasifikasi terlatih secara eksplisit alih-alih pengklasifikasi implisit untuk analisis. Untuk versi model yang terdiri sebelumnya, lihat Menyusun model kustom v3.1. Jika saat ini Anda menggunakan model yang terdiri dari peningkatan ke implementasi terbaru.

Apa itu model yang disusun?

Dengan model yang terdiri, Anda dapat mengelompokkan beberapa model kustom ke dalam model yang terdiri yang disebut dengan SATU ID model. Misalnya, model yang Anda buat mungkin menyertakan model khusus yang dilatih untuk menganalisis pesanan pembelian pasokan, peralatan, dan furnitur Anda. Alih-alih secara manual mencoba memilih model yang sesuai, Anda dapat menggunakan model yang disusun untuk menentukan model kustom yang sesuai untuk setiap analisis dan ekstraksi.

Beberapa skenario mengharuskan mengklasifikasikan dokumen terlebih dahulu lalu menganalisis dokumen dengan model yang paling cocok untuk mengekstrak bidang dari model. Skenario tersebut dapat mencakup skenario di mana pengguna mengunggah dokumen tetapi jenis dokumen tidak diketahui secara eksplisit. Skenario lain bisa ketika beberapa dokumen dipindai bersama-sama ke dalam satu file dan file dikirim untuk diproses. Aplikasi Anda kemudian perlu mengidentifikasi dokumen komponen dan memilih model terbaik untuk setiap dokumen.

Dalam versi sebelumnya, model compose operasi melakukan klasifikasi implisit untuk memutuskan model kustom mana yang paling mewakili dokumen yang dikirimkan. Implementasi 2024-07-31-preview model compose operasi menggantikan klasifikasi implisit dari versi sebelumnya dengan langkah klasifikasi eksplisit dan menambahkan perutean kondisional.

Manfaat operasi pembuatan model baru

Operasi baru model compose mengharuskan Anda untuk melatih pengklasifikasi eksplisit dan memberikan beberapa manfaat.

  • Peningkatan inkremental berkelanjutan. Anda dapat secara konsisten meningkatkan kualitas pengklasifikasi dengan menambahkan lebih banyak sampel dan meningkatkan klasifikasi secara bertahap. Penyetelan halus ini memastikan dokumen Anda selalu dirutekan ke model yang tepat untuk ekstraksi.

  • Kontrol penuh atas perutean. Dengan menambahkan perutean berbasis keyakinan, Anda memberikan ambang keyakinan untuk jenis dokumen dan respons klasifikasi.

  • Abaikan jenis dokumen tertentu dokumen selama operasi. Implementasi operasi sebelumnya model compose memilih model analisis terbaik untuk ekstraksi berdasarkan skor keyakinan bahkan jika skor keyakinan tertinggi relatif rendah. Dengan memberikan ambang keyakinan atau secara eksplisit tidak memetakan jenis dokumen yang diketahui dari klasifikasi ke model ekstraksi, Anda dapat mengabaikan jenis dokumen tertentu.

  • Analisis beberapa instans dengan jenis dokumen yang sama. Saat dipasangkan dengan splitMode opsi pengklasifikasi, model compose operasi dapat mendeteksi beberapa instans dokumen yang sama dalam file dan membagi file untuk memproses setiap dokumen secara independen. Menggunakan splitMode memungkinkan pemrosesan beberapa instans dokumen dalam satu permintaan.

  • Dukungan untuk fitur add-on. Menambahkan fitur seperti bidang kueri atau kode batang juga dapat ditentukan sebagai bagian dari parameter model analisis.

  • Model kustom yang ditetapkan maksimum diperluas menjadi 500. Implementasi model compose baru operasi memungkinkan Anda menetapkan hingga 500 model kustom terlatih ke satu model yang disusupi.

Cara menggunakan pembuatan model

  • Mulailah dengan mengumpulkan sampel semua dokumen yang Anda butuhkan termasuk sampel dengan informasi yang harus diekstraksi atau diabaikan.

  • Latih pengklasifikasi dengan mengatur dokumen dalam folder di mana nama folder adalah jenis dokumen yang ingin Anda gunakan dalam definisi model yang anda buat.

  • Terakhir, latih model ekstraksi untuk setiap jenis dokumen yang ingin Anda gunakan.

  • Setelah model klasifikasi dan ekstraksi Anda dilatih, gunakan Document Intelligence Studio, pustaka klien, atau REST API untuk menyusun model klasifikasi dan ekstraksi ke dalam model yang disusun.

splitMode Gunakan parameter untuk mengontrol perilaku pemisahan file:

  • Tidak ada. Seluruh file diperlakukan sebagai satu dokumen.
  • perPage. Setiap halaman dalam file diperlakukan sebagai dokumen terpisah.
  • otomatis. File secara otomatis dibagi menjadi dokumen.

Penagihan dan harga

Model yang terdiri ditagih sama dengan model kustom individual. Harga didasarkan pada jumlah halaman yang dianalisis oleh model analisis hilir. Penagihan didasarkan pada harga ekstraksi untuk halaman yang dirutekan ke model ekstraksi. Dengan penambahan biaya klasifikasi eksplisit dikeluarkan untuk klasifikasi semua halaman dalam file input. Untuk informasi selengkapnya, lihat halaman harga Kecerdasan Dokumen.

Menggunakan pembuatan model

  • Mulailah dengan membuat daftar semua ID model yang ingin Anda buat ke dalam satu model.

  • Buat model ke dalam SATU ID model menggunakan Studio, REST API, atau pustaka klien.

  • Gunakan ID model yang terdiri untuk menganalisis dokumen.

Billing

Model yang terdiri ditagih sama dengan model kustom individual. Harga didasarkan pada jumlah halaman yang dianalisis. Penagihan didasarkan pada harga ekstraksi untuk halaman yang dirutekan ke model ekstraksi. Untuk informasi selengkapnya, lihat halaman harga Kecerdasan Dokumen.

  • Tidak ada perubahan harga untuk menganalisis dokumen dengan menggunakan model kustom individual atau model kustom yang disusam.

Fitur model yang terdiri

  • Custom template dan custom neural model dapat terdiri bersama-sama ke dalam satu model yang terdiri di beberapa versi API.

  • Respons mencakup docType properti untuk menunjukkan model mana yang dibuat digunakan untuk menganalisis dokumen.

  • Untuk custom template model, model yang dibuat dapat dibuat menggunakan variasi templat kustom atau jenis formulir yang berbeda. Operasi ini berguna saat formulir masuk milik salah satu dari beberapa templat.

  • Untuk model custom neural, praktik terbaiknya yaitu menambahkan semua variasi yang berbeda dari satu jenis dokumen ke dalam satu himpunan data pelatihan dan melatih model neural kustom. Operasi model compose ini paling cocok untuk skenario ketika Anda memiliki dokumen dari berbagai jenis yang dikirimkan untuk analisis.

Menyusun batas model

  • Dengan operasi ini model compose , Anda dapat menetapkan hingga 500 model ke satu ID model. Jika jumlah model yang ingin saya buat melebihi batas atas model yang disusupi, Anda dapat menggunakan salah satu alternatif berikut:

    • Klasifikasikan dokumen sebelum memanggil model kustom. Anda dapat menggunakan model Baca dan membuat klasifikasi berdasarkan teks yang diekstrak dari dokumen dan frasa tertentu dengan menggunakan sumber seperti kode, ekspresi reguler, atau pencarian.

    • Jika Anda ingin mengekstrak bidang yang sama dari berbagai dokumen terstruktur, semi terstruktur, dan tidak terstruktur, pertimbangkan untuk menggunakan model neural kustom pembelajaran mendalam. Pelajari selengkapnya tentang perbedaan antara model templat kustom dan model neural kustom.

  • Menganalisis dokumen dengan menggunakan model yang terdiri identik dengan menganalisis dokumen dengan menggunakan satu model. Hasilnya Analyze Document mengembalikan docType properti yang menunjukkan model komponen mana yang Anda pilih untuk menganalisis dokumen.

  • Operasi model compose saat ini hanya tersedia untuk model kustom yang dilatih dengan label.

Kompatibilitas model yang disusun

Tipe model kustom Model yang dilatih dengan v2.1 dan v2.0 Templat kustom dan model neural v3.1 dan v3.0 Templat kustom dan model neural pratinjau v4.0 Pratinjau model Generatif Kustom v4.0
Model yang dilatih dengan versi 2.1 dan v2.0 Tidak Didukung Tidak Didukung Tidak Didukung Tidak Didukung
Templat kustom dan model neural v3.0 dan v3.1 Tidak Didukung Didukung Didukung Tidak Didukung
Templat kustom dan model neural pratinjau v4.0 Tidak Didukung Didukung Didukung Tidak Didukung
Pratinjau model generatif kustom v4.0 Tidak Didukung Tidak Didukung Tidak Didukung Tidak Didukung
  • Untuk menyusun model yang dilatih dengan versi API sebelumnya (v2.1 atau versi lebih lama), melatih model dengan API v3.0 menggunakan himpunan data berlabel yang sama. Penambahan itu memastikan bahwa model v2.1 dapat dikomposisikan dengan model lain.

  • Dengan model yang terdiri menggunakan v2.1 api terus didukung, tidak memerlukan pembaruan.

Opsi pengembangan

Kecerdasan Dokumen v4.0:2024-07-31-preview mendukung alat, aplikasi, dan pustaka berikut:

Fitur Sumber
Model kustom Document Intelligence Studio
REST API
C# SDK
Java SDK
JavaScript SDK
Python SDK
Model yang disusun Document Intelligence Studio
REST API
C# SDK
Java SDK
JavaScript SDK
Python SDK

Kecerdasan Dokumen v3.1:2023-07-31 (GA) mendukung alat, aplikasi, dan pustaka berikut:

Fitur Sumber
Model kustom Document Intelligence Studio
REST API
C# SDK
Java SDK
JavaScript SDK
Python SDK
Model yang disusun Document Intelligence Studio
REST API
C# SDK
Java SDK
JavaScript SDK
Python SDK

Kecerdasan Dokumen v3.0:2022-08-31 (GA) mendukung alat, aplikasi, dan pustaka berikut:

Fitur Sumber
Model kustom Document Intelligence Studio
REST API
C# SDK
Java SDK
JavaScript SDK
Python SDK
Model yang disusun Document Intelligence Studio
REST API
C# SDK
Java SDK
JavaScript SDK
Python SDK

Kecerdasan Dokumen v2.1 mendukung sumber daya berikut:

Fitur Sumber
Model kustom Alat
pelabelan Kecerdasan Dokumen• REST API
Pustaka klien SDK
Kontainer Docker Kecerdasan Dokumen
Model yang disusun Alat
pelabelan Kecerdasan Dokumen• REST API
C# SDK
Java SDK
• JavaScript SDK
Python SDK

Langkah berikutnya

Pelajari cara membuat dan menyusun model kustom: