Bagikan melalui


Model kustom Kecerdasan Dokumen

Penting

  • Rilis pratinjau publik Kecerdasan Dokumen menyediakan akses awal ke fitur yang sedang dalam pengembangan aktif. Fitur, pendekatan, dan proses dapat berubah, sebelum Ketersediaan Umum (GA), berdasarkan umpan balik pengguna.
  • Versi pratinjau publik pustaka klien Kecerdasan Dokumen default ke REST API versi 2024-07-31-preview.
  • Pratinjau publik versi 2024-07-31-preview saat ini hanya tersedia di wilayah Azure berikut. Perhatikan bahwa model generatif kustom (ekstraksi bidang dokumen) di AI Studio hanya tersedia di wilayah US Tengah Utara:
    • US Timur
    • US Barat2
    • Eropa Barat
    • US Tengah Utara

Konten ini berlaku untuk: tanda centang v4.0 (pratinjau) | Versi sebelumnya: tanda centang biru v3.1 (GA) tanda centang biru v3.0 (GA)tanda centang biru v2.1 (GA)

Konten ini berlaku untuk: tanda centang v3.1 (GA) | Versi terbaru:tanda centang ungu v4.0 (pratinjau) | Versi sebelumnya: tanda centang biru v3.0tanda centang biru v2.1

Konten ini berlaku untuk: tanda centang v3.0 (GA) | Versi terbaru: tanda centang ungu v4.0 (pratinjau) tanda centang unguv3.1 | Versi sebelumnya: tanda centang biru v2.1

Konten ini berlaku untuk: tanda centang v2.1 | Versi terbaru: tanda centang biru v4.0 (pratinjau)

Kecerdasan Dokumen menggunakan teknologi pembelajaran mesin canggih untuk mengidentifikasi dokumen, mendeteksi dan mengekstrak informasi dari formulir dan dokumen, dan mengembalikan data yang diekstrak dalam output JSON terstruktur. Dengan Kecerdasan Dokumen, Anda dapat menggunakan model analisis dokumen, model kustom mandiri bawaan/terlatih, atau model kustom mandiri terlatih Anda.

Model kustom sekarang menyertakan model klasifikasi kustom untuk skenario di mana Anda perlu mengidentifikasi jenis dokumen sebelum memanggil model ekstraksi. Model pengklasifikasi tersedia dimulai dengan 2023-07-31 (GA) API. Model klasifikasi dapat dipasangkan dengan model ekstraksi kustom untuk menganalisis dan mengekstrak bidang dari formulir dan dokumen khusus untuk bisnis Anda. Model ekstraksi kustom mandiri dapat dikombinasikan untuk membuat model yang disusun.

Jenis model dokumen kustom

Model dokumen kustom dapat berupa salah satu dari dua jenis, templat kustom atau formulir kustom dan model dokumen kustom atau neural kustom. Proses pelabelan dan pelatihan untuk kedua model identik, tetapi modelnya berbeda sebagai berikut:

Model ekstraksi kustom

Untuk membuat model ekstraksi kustom, beri label himpunan data dokumen dengan nilai yang ingin Anda ekstrak dan latih model pada himpunan data berlabel. Anda hanya memerlukan lima contoh jenis formulir yang sama untuk memulai.

Model neural kustom

Penting

Dimulai dengan API versi 4.0 (2024-02-29-preview), model neural kustom sekarang mendukung bidang dan tabel, baris, dan tingkat sel yang tumpang tindih.

Model neural (dokumen kustom) kustom menggunakan model pembelajaran mendalam dan model dasar yang dilatih pada banyak koleksi dokumen. Model ini kemudian disesuaikan atau disesuaikan dengan data Anda saat Anda melatih model dengan himpunan data berlabel. Model neural kustom mendukung ekstraksi bidang data utama dari dokumen terstruktur, semi terstruktur, dan tidak terstruktur. Ketika Anda memilih antara dua jenis model, mulailah dengan model neural jika memenuhi kebutuhan fungsional Anda. Lihat model neural untuk mempelajari lebih lanjut tentang model dokumen kustom.

Model template kustom

Templat kustom atau model formulir kustom bergantung pada templat visual yang konsisten untuk mengekstrak data berlabel. Varians dalam struktur visual dokumen Anda memengaruhi akurasi model Anda. Bentuk terstruktur seperti kuesioner atau aplikasi adalah contoh templat visual yang konsisten.

Set pelatihan Anda terdiri dari dokumen terstruktur di mana pemformatan dan tata letak statis dan konstanta dari satu instans dokumen ke instans dokumen berikutnya. Model templat kustom mendukung pasangan nilai kunci, tanda pilihan, tabel, bidang tanda tangan, dan wilayah. Model templat dan dapat dilatih pada dokumen dalam salah satu bahasa yang didukung. Untuk informasi selengkapnya, lihat model templat kustom.

Jika bahasa dokumen dan skenario ekstraksi Anda mendukung model neural kustom, kami sarankan Anda menggunakan model neural kustom melalui model templat untuk akurasi yang lebih tinggi.

Tip

Untuk mengonfirmasi bahwa dokumen pelatihan Anda menyajikan templat visual yang konsisten, hapus semua data yang dimasukkan pengguna dari setiap formulir dalam set. Jika bentuk kosong identik dalam penampilan, mereka mewakili templat visual yang konsisten.

Untuk informasi selengkapnya, lihat Menginterpretasikan dan meningkatkan akurasi dan kepercayaan diri untuk model kustom.

Persyaratan input

  • Untuk hasil terbaik, berikan satu foto yang jelas atau pemindaian berkualitas tinggi per dokumen.

  • Format file yang didukung:

    Model PDF Gambar:
    jpeg/jpg, , bmppng, tiff, ,heif
    Microsoft Office:
    Word (docx), Excel (xlsx), PowerPoint (pptx)
    Read
    Tata letak ✔ (2024-02-29-preview, 2023-10-31-preview, dan yang lebih baru)
    Dokumen Umum
    Bawaan
    Ekstraksi kustom
    Klasifikasi kustom

    ✱ File Microsoft Office saat ini tidak didukung untuk model atau versi lain.

  • Untuk PDF dan TIFF, hingga 2.000 halaman dapat diproses (dengan langganan tingkat gratis, hanya dua halaman pertama yang diproses).

  • Ukuran file untuk menganalisis dokumen adalah 500 MB untuk tingkat berbayar (S0) dan 4 MB secara gratis (F0).

  • Dimensi gambar harus antara 50 x 50 piksel dan 10.000 piksel x 10.000 piksel.

  • Jika PDF Anda dikunci dengan kata sandi, Anda harus menghapus kunci sebelum pengiriman.

  • Tinggi minimum teks yang akan diekstrak adalah 12 piksel untuk gambar piksel 1024 x 768. Dimensi ini sesuai dengan teks sekitar 8-point pada 150 titik per inci.

  • Untuk pelatihan model kustom, jumlah maksimum halaman untuk data pelatihan adalah 500 untuk model template kustom dan 50.000 untuk model neural kustom.

  • Untuk pelatihan model ekstraksi kustom, ukuran total data pelatihan adalah 50 MB untuk model templat dan 1G-MB untuk model neural.

  • Untuk pelatihan model klasifikasi kustom, ukuran total data pelatihan adalah 1GB dengan maksimum 10.000 halaman.

Data pelatihan yang optimal

Data input pelatihan adalah dasar dari model pembelajaran mesin apa pun. Ini menentukan kualitas, akurasi, dan performa model. Oleh karena itu, sangat penting untuk membuat data input pelatihan terbaik yang mungkin untuk proyek Kecerdasan Dokumen Anda. Saat Anda menggunakan model kustom Kecerdasan Dokumen, Anda menyediakan data pelatihan Anda sendiri. Berikut adalah beberapa tips untuk membantu melatih model Anda secara efektif:

  • Gunakan PDF berbasis teks, bukan PDF berbasis gambar jika memungkinkan. Salah satu cara untuk mengidentifikasi PDF berbasis gambar*adalah dengan mencoba memilih teks tertentu dalam dokumen. Jika Anda hanya dapat memilih seluruh gambar teks, dokumen berbasis gambar, bukan berbasis teks.

  • Atur dokumen pelatihan Anda dengan menggunakan subfolder untuk setiap format (JPEG/JPG, PNG, BMP, PDF, atau TIFF).

  • Gunakan formulir yang telah menyelesaikan semua bidang yang tersedia.

  • Gunakan formulir dengan nilai berbeda di setiap bidang.

  • Gunakan himpunan data yang lebih besar (lebih dari lima dokumen pelatihan) jika gambar Anda berkualitas rendah.

  • Tentukan apakah Anda perlu menggunakan satu model atau beberapa model yang disusun menjadi satu model.

  • Pertimbangkan untuk mensegmentasi himpunan data Anda ke dalam folder, di mana setiap folder adalah templat yang unik. Latih satu model per folder, dan buat model yang dihasilkan menjadi satu titik akhir. Akurasi model dapat menurun ketika Anda memiliki format berbeda yang dianalisis dengan satu model.

  • Pertimbangkan untuk mensegmentasi himpunan data Anda untuk melatih beberapa model jika formulir Anda memiliki variasi dengan format dan hentian halaman. Formulir kustom bergantung pada templat visual yang konsisten.

  • Pastikan Anda memiliki himpunan data seimbang dengan memperhitungkan format, jenis dokumen, dan struktur.

Mode build

Operasi ini build custom model menambahkan dukungan untuk model kustom templat dan neural . Versi REST API dan pustaka klien sebelumnya hanya mendukung mode build tunggal yang sekarang dikenal sebagai mode templat .

  • Model templat hanya menerima dokumen yang memiliki struktur halaman dasar yang sama — tampilan visual yang seragam — atau posisi relatif elemen yang sama dalam dokumen.

  • Model neural mendukung dokumen yang memiliki informasi yang sama, tetapi struktur halaman yang berbeda. Contoh dokumen-dokumen ini termasuk Amerika Serikat formulir W2, yang berbagi informasi yang sama, tetapi bervariasi dalam penampilan di seluruh perusahaan.

Tabel ini menyediakan tautan ke referensi SDK bahasa pemrograman mode build dan sampel kode di GitHub:

Bahasa pemrograman Referensi SDK Sampel kode
C#/.NET DocumentBuildMode Struct Sample_BuildCustomModelAsync.cs
Java Kelas DocumentBuildMode BuildModel.java
JavaScript Tipe DocumentBuildMode buildModel.js
Python DocumentBuildMode Enum sample_build_model.py

Membandingkan fitur model

Tabel berikut membandingkan templat kustom dan fitur neural kustom:

Fitur Templat kustom (formulir) Neural kustom (dokumen)
Struktur dokumen Templat, formulir, dan terstruktur Terstruktur, semi-terstruktur, dan tidak terstruktur
Waktu Pelatihan 1 hingga 5 menit 20 menit hingga 1 jam
Ekstraksi data Pasangan nilai kunci, tabel, tanda pilihan, koordinat, dan tanda tangan Pasangan kunci-nilai, tanda pilihan, dan tabel
Bidang yang tumpang tindih Tidak didukung Didukung
Variasi dokumen Memerlukan model per setiap variasi Menggunakan satu model untuk semua variasi
Dukungan bahasa Templat kustom dukungan bahasa Bahasa mendukung neural kustom

Model klasifikasi kustom

Klasifikasi dokumen adalah skenario baru yang didukung oleh Kecerdasan Dokumen dengan 2023-07-31 API (v3.1 GA). API pengklasifikasi dokumen mendukung skenario klasifikasi dan pemisahan. Latih model klasifikasi untuk mengidentifikasi berbagai jenis dokumen yang didukung aplikasi Anda. File input untuk model klasifikasi dapat berisi beberapa dokumen dan mengklasifikasikan setiap dokumen dalam rentang halaman terkait. Untuk mempelajari selengkapnya, lihat model klasifikasi kustom.

Catatan

Dimulai dengan klasifikasi 2024-02-29-preview dokumen versi API sekarang mendukung jenis dokumen Office untuk klasifikasi. Versi API ini juga memperkenalkan pelatihan inkremental untuk model klasifikasi.

Alat model kustom

Model Kecerdasan Dokumen v3.1 dan yang lebih baru mendukung alat, aplikasi, dan pustaka, program, dan pustaka berikut:

Fitur Sumber ID Model
Model kustom Studio
Kecerdasan Dokumen• REST API
C# SDK
Python SDK
custom-model-id

Siklus hidup model kustom

Siklus hidup model kustom tergantung pada versi API yang digunakan untuk melatihnya. Jika versi API adalah versi ketersediaan umum (GA), model kustom memiliki siklus hidup yang sama dengan versi tersebut. Model kustom tidak tersedia untuk inferensi saat versi API tidak digunakan lagi. Jika versi API adalah versi pratinjau, model kustom memiliki siklus hidup yang sama dengan versi pratinjau API.

Kecerdasan Dokumen v2.1 mendukung alat, aplikasi, dan pustaka berikut:

Catatan

Jenis model kustom neural kustom dan templat kustom tersedia dengan Api v3.1 dan v3.0 versi Kecerdasan Dokumen.

Fitur Sumber
Model kustom Alat
pelabelan Kecerdasan Dokumen• REST API
Pustaka klien SDK
Kontainer Docker Kecerdasan Dokumen

Membangun model kustom

Ekstrak data dari dokumen spesifik atau unik Anda menggunakan model kustom. Anda membutuhkan sumber daya berikut:

  • Langganan Azure. Anda dapat membuatnya secara gratis.

  • Instans Kecerdasan Dokumen di portal Azure. Anda dapat menggunakan tingkat harga gratis (F0) untuk mencoba layanan. Setelah sumber daya Anda disebarkan, pilih Buka sumber daya untuk mendapatkan kunci dan titik akhir Anda.

    Cuplikan layar yang menampilkan lokasi titik akhir dan kunci dalam portal Azure.

Alat pelabelan sampel

Tip

  • Untuk pengalaman yang ditingkatkan dan kualitas model tingkat lanjut, coba Document Intelligence v3.0 Studio.
  • Studio v3.0 mendukung model apa pun yang dilatih dengan data berlabel v2.1.
  • Anda dapat mengacu ke panduan migrasi API untuk mendapatkan detail informasi tentang migrasi dari v2.1 ke v3.0.
  • Lihat REST API atau C#, Java, JavaScript, atau Python SDK kami .. /quickstarts untuk mulai menggunakan versi v3.0.
  • Alat Pelabelan Sampel Kecerdasan Dokumen adalah alat sumber terbuka yang memungkinkan Anda menguji fitur terbaru fitur Kecerdasan Dokumen dan Pengenalan Karakter Optik (OCR).

  • Coba mulai cepat alat Pelabelan Sampel untuk mulai membangun dan menggunakan model kustom.

Studio Kecerdasan Dokumen

Catatan

Document Intelligence Studio tersedia dengan API v3.1 dan v3.0.

  1. Pada beranda Studio Kecerdasan Dokumen, pilih Model ekstraksi kustom.

  2. Di bagian Proyek Saya, pilih Buat proyek.

  3. Lengkapi bidang detail proyek.

  4. Konfigurasikan sumber daya layanan dengan menambahkan akun Storage dan kontainer Blob anda untuk Koneksi sumber data pelatihan anda.

  5. Meninjau dan membuat proyek Anda.

  6. Tambahkan dokumen sampel Anda untuk memberi label, membangun, dan menguji model kustom Anda.

Untuk panduan terperinci untuk membuat model ekstraksi kustom pertama Anda, lihat Cara membuat model ekstraksi kustom.

Ringkasan ekstraksi model kustom

Tabel ini membandingkan area ekstraksi data yang didukung:

Model Bidang formulir Tanda pilihan Bidang terstruktur (Tabel) Tanda Tangan Pelabelan wilayah Bidang yang tumpang tindih
Templat kustom n/a
Neural kustom n/a * ✔ (Pratinjau 2024-02-29)

Simbol tabel:
✔ —Didukung
**n/a—Saat ini tidak tersedia;
*-Berulah berbeda tergantung pada model. Dengan model templat, data sintetis dihasilkan pada waktu pelatihan. Dengan model neural, keluar dari teks yang dikenali di wilayah dipilih.

Tip

Saat memilih di antara dua jenis model, mulailah dengan model neural khusus jika memenuhi kebutuhan fungsional Anda. Lihat neural kustom untuk mempelajari lebih lanjut tentang model neural kustom.

Opsi pengembangan model kustom

Tabel berikut ini menjelaskan fitur yang tersedia dengan alat dan pustaka klien terkait. Sebagai praktik terbaik, pastikan Anda menggunakan alat yang kompatibel yang tercantum di sini.

Jenis dokumen REST API SDK Model Label dan Uji
Templat kustom v 4.0 v3.1 v3.0 Kecerdasan Dokumen 3.1 SDK Kecerdasan Dokumen Studio Kecerdasan Dokumen
Neural kustom v4.0 v3.1 v3.0 Kecerdasan Dokumen 3.1 SDK Kecerdasan Dokumen Studio Kecerdasan Dokumen
Formulir kustom v2.1 API GA Kecerdasan Dokumen 2.1 SDK Kecerdasan Dokumen Alat pelabelan sampel

Catatan

Model templat kustom yang dilatih dengan API 3.0 akan memiliki beberapa peningkatan atas API 2.1 yang berasal dari peningkatan mesin OCR. Himpunan data yang digunakan untuk melatih model templat kustom menggunakan API 2.1 masih dapat digunakan untuk melatih model baru menggunakan API 3.0.

  • Untuk hasil terbaik, berikan satu foto yang jelas atau pemindaian berkualitas tinggi per dokumen.

  • Format file yang didukung adalah JPEG/JPG, PNG, BMP, TIFF, dan PDF (teks tersemat atau dipindai). PDF dengan teks tertanam adalah yang terbaik dalam mengeliminasi kemungkinan kesalahan dalam ekstraksi dan lokasi karakter.

  • Untuk file PDF dan TIFF, hingga 2.000 halaman dapat diproses. Dengan langganan tingkat gratis, hanya dua halaman pertama yang diproses.

  • Ukuran file harus kurang dari 500 MB untuk tingkat berbayar (S0) dan 4 MB untuk tingkat gratis (F0).

  • Dimensi gambar harus antara 50 x 50 piksel dan 10.000 x 10.000 piksel.

  • Dimensi PDF hingga 17 x 17 inci, sesuai dengan ukuran kertas Legal atau A3, atau lebih kecil.

  • Ukuran total data pelatihan adalah 500 halaman atau kurang.

  • Jika PDF Anda dikunci dengan kata sandi, Anda harus menghapus kunci sebelum pengiriman.

    Tip

    Data pelatihan:

    • Jika memungkinkan, gunakan dokumen PDF berbasis teks daripada dokumen berbasis gambar. PDF yang dipindai ditangani sebagai gambar.
    • Harap sediakan hanya satu instans formulir per dokumen.
    • Untuk formulir yang diisi, gunakan contoh yang semua bidangnya telah terisi.
    • Gunakan formulir dengan nilai berbeda di setiap bidang.
    • Jika gambar formulir Anda memiliki kualitas yang lebih rendah, gunakan kumpulan data yang lebih besar. Misalnya, gunakan 10 hingga 15 gambar.

Bahasa dan lokal yang didukung

Lihat halaman Dukungan Bahasa—model kustom untuk daftar lengkap bahasa yang didukung.

Langkah berikutnya

  • Coba pemrosesan formulir dan dokumen Anda sendiri dengan alat Pelabelan Sampel Kecerdasan Dokumen.

  • Selesaikan mulai cepat Kecerdasan Dokumen dan mulai membuat aplikasi pemrosesan dokumen dalam bahasa pengembangan pilihan Anda.

  • Coba pemrosesan formulir dan dokumen Anda sendiri dengan Studio Kecerdasan Dokumen.

  • Selesaikan mulai cepat Kecerdasan Dokumen dan mulai membuat aplikasi pemrosesan dokumen dalam bahasa pengembangan pilihan Anda.