Buat model kustom

Konten ini berlaku untuk:tanda centangv4.0 (pratinjau) | Versi sebelumnya:tanda centang biruv3.1 (GA)tanda centang biruv3.0 (GA)tanda centang biruv2.1 (GA)

Konten ini berlaku untuk:tanda centangv3.1 (GA) | Versi terbaru:tanda centang unguv4.0 (pratinjau) | Versi sebelumnya:tanda centang biruv3.0tanda centang biruv2.1

Konten ini berlaku untuk:tanda centangv3.0 (GA) | Versi terbaru:tanda centang unguv4.0 (pratinjau)tanda centang unguv3.1 | Versi sebelumnya:tanda centang biruv2.1

Konten ini berlaku untuk:tanda centangv2.1 | Versi terbaru:tanda centang biruv4.0 (pratinjau)

Model yang disusun dibuat dengan mengambil koleksi model kustom dan menetapkannya ke satu model yang mencakup jenis formulir Anda. Anda dapat menetapkan hingga 200 model kustom terlatih ke satu ID model yang terdiri. Ketika dokumen diserahkan ke model yang disusun, layanan melakukan langkah klasifikasi untuk memutuskan model kustom mana yang secara akurat mewakili formulir yang disajikan untuk analisis. Model tersusun berguna ketika Anda telah melatih beberapa model dan ingin mengelompokkannya untuk menganalisis jenis bentuk yang serupa. Misalnya, model yang Anda buat mungkin menyertakan model khusus yang dilatih untuk menganalisis pesanan pembelian pasokan, peralatan, dan furnitur Anda. Alih-alih secara manual mencoba memilih model yang sesuai, Anda dapat menggunakan model yang disusun untuk menentukan model kustom yang sesuai untuk setiap analisis dan ekstraksi.

Untuk mempelajari selengkapnya, lihat Menyusun model kustom.

Dalam artikel ini, Anda mempelajari cara membuat dan menggunakan model kustom yang terdiri untuk menganalisis formulir dan dokumen Anda.

Prasyarat

Untuk memulai, Anda memerlukan sumber daya berikut:

  • Langganan Azure. Anda dapat membuat langganan Azure gratis.

  • Instans Kecerdasan Dokumen. Setelah Anda memiliki langganan Azure, buat sumber daya Kecerdasan Dokumen di portal Azure untuk mendapatkan kunci dan titik akhir Anda. Jika Anda memiliki sumber daya Kecerdasan Dokumen yang sudah ada, navigasikan langsung ke halaman sumber daya Anda. Untuk mencoba layanan, Anda dapat menggunakan tingkat harga gratis (F0), lalu meningkatkannya ke tingkat berbayar untuk produksi.

    1. Setelah sumber daya disebarkan, pilih Buka sumber daya.

    2. Salin nilai Kunci dan Titik Akhir dari portal Microsoft Azure dan tempelkan di lokasi yang nyaman, seperti Microsoft Notepad. Anda memerlukan nilai kunci dan titik akhir untuk menyambungkan aplikasi Anda ke API Kecerdasan Dokumen.

    Foto diam yang menunjukkan cara mengakses kunci sumber daya dan URL titik akhir.

    Tip

    Untuk informasi selengkapnya, lihat membuat sumber daya Kecerdasan Dokumen.

  • Akun penyimpanan Azure. Jika Anda tidak tahu cara membuat akun penyimpanan Azure, ikuti mulai cepat Azure Storage untuk portal Azure. Untuk mencoba layanan, Anda dapat menggunakan tingkat harga gratis (F0), lalu meningkatkannya ke tingkat berbayar untuk produksi.

Membuat model kustom Anda

Pertama, Anda memerlukan sekumpulan model kustom untuk dibuat. Anda dapat menggunakan SDK Document Intelligence Studio, REST API, atau pustaka klien. Langkah langkahnya adalah sebagai berikut:

Mengumpulkan himpunan data pelatihan Anda

Membangun model kustom dimulai dengan membuat himpunan data pelatihan Anda. Anda memerlukan minimal lima formulir lengkap dengan jenis yang sama untuk himpunan data sampel Anda. Formulir tersebut dapat dari berbagai jenis file dan berisi teks serta tulisan tangan. Formulir Anda harus mengikuti persyaratan input untuk Kecerdasan Dokumen.

Tip

Ikuti tips tambahan ini untuk lebih mengoptimalkan himpunan data Anda untuk pelatihan:

  • Jika memungkinkan, gunakan dokumen PDF berbasis teks daripada dokumen berbasis gambar. PDF yang dipindai ditangani sebagai gambar.
  • Untuk formulir yang diisi, gunakan contoh yang semua bidangnya telah terisi.
  • Gunakan formulir dengan nilai berbeda di setiap bidang.
  • Jika gambar formulir Anda memiliki kualitas yang lebih rendah, gunakan kumpulan data yang lebih besar (10-15 gambar, misalnya).

Lihat Membuat kumpulan data pelatihan untuk kiat tentang cara mengumpulkan dokumen pelatihan Anda.

Mengunggah himpunan data pelatihan Anda

Setelah mengumpulkan sekumpulan dokumen pelatihan, Anda perlu mengunggah data pelatihan ke kontainer penyimpanan blob Azure.

Jika Anda ingin menggunakan data berlabel manual, Anda harus mengunggah file .labels.json dan .ocr.json yang sesuai dengan dokumen pelatihan Anda.

Melatih model kustom Anda

Saat Anda melatih model Anda dengan data berlabel, model menggunakan pembelajaran yang diawasi untuk mengekstrak nilai-nilai yang diminati, menggunakan formulir berlabel yang Anda berikan. Metode ini menghasilkan model yang berperforma lebih baik dan dapat menghasilkan model yang bekerja dengan bentuk kompleks atau formulir yang berisi nilai tanpa kunci.

Kecerdasan Dokumen menggunakan API model tata letak bawaan untuk mempelajari ukuran dan posisi elemen teks typeface dan tulisan tangan yang diharapkan dan mengekstrak tabel. Kemudian menggunakan label yang ditentukan pengguna untuk mempelajari asosiasi kunci/nilai dan tabel dalam dokumen. Kami menyarankan agar Anda menggunakan lima formulir berlabel manual dengan jenis yang sama (struktur yang sama) untuk memulai dengan pelatihan model baru. Kemudian, tambahkan lebih banyak data berlabel, sesuai kebutuhan, untuk meningkatkan akurasi model. Kecerdasan Dokumen memungkinkan pelatihan model untuk mengekstrak pasangan kunci-nilai dan tabel menggunakan kemampuan pembelajaran yang diawasi.

Untuk membuat model kustom, Anda mulai dengan mengonfigurasi proyek Anda:

  1. Dari beranda Studio, pilih Buat baru dari kartu model Kustom.

  2. Gunakan perintah ➕ Buat proyek untuk memulai wizard konfigurasi proyek baru.

  3. Masukkan detail proyek, pilih langganan dan sumber daya Azure, dan kontainer penyimpanan Azure Blob yang berisi data Anda.

  4. Tinjau dan kirimkan pengaturan Anda untuk membuat proyek.

Animasi memperlihatkan membuat proyek kustom di Studio Kecerdasan Dokumen.

Saat membuat model kustom, Anda mungkin perlu mengekstrak kumpulan data dari dokumen Anda. Koleksi mungkin muncul salah satu dari dua format. Menggunakan tabel sebagai pola visual:

  • Jumlah dinamis atau variabel nilai (baris) untuk set bidang (kolom) tertentu

  • Kumpulan nilai tertentu untuk set bidang (kolom) tertentu (kolom dan/atau baris)

Lihat Studio Kecerdasan Dokumen: pelabelan sebagai tabel

Membuat model yang disusun

Catatan

Operasi create compose model hanya tersedia untuk model kustom yang dilatih dengan label. Mencoba menyusun model yang tidak berlabel akan menghasilkan kesalahan.

Dengan operasi buat penyusunan model, Anda dapat menetapkan hingga 100 model kustom yang dilatih ke satu ID model. Saat menganalisis dokumen dengan model yang terdiri, Kecerdasan Dokumen terlebih dahulu mengklasifikasikan formulir yang Anda kirimkan, lalu memilih model yang ditetapkan yang paling cocok, dan mengembalikan hasil untuk model tersebut. Operasi ini berguna jika formulir masuk menjadi bagian dari salah satu templat.

Setelah proses pelatihan berhasil diselesaikan, Anda dapat mulai membangun model yang disusun. Berikut adalah langkah-langkah untuk membuat dan menggunakan model yang disusun:

Kumpulkan ID model Anda

Saat Anda melatih model menggunakan Document Intelligence Studio, ID model terletak di menu model di bawah proyek:

Cuplikan layar jendela konfigurasi model di Document Intelligence Studio.

Mengelola model kustom Anda

  1. Pilih proyek model kustom.

  2. Di proyek, pilih item menu Models.

  3. Dari daftar model yang dihasilkan, pilih model yang ingin Anda tulis.

  4. Pilih tombol Susun dari pojok kiri atas.

  5. Di jendela pop-up, beri nama model baru yang Anda susun, dan pilih Susun.

  6. Saat operasi selesai, model Yang baru Anda buat muncul dalam daftar.

  7. Setelah model siap, gunakan perintah Uji untuk memvalidasinya dengan dokumen pengujian Anda dan amati hasilnya.

Analisis dokumen

Operasi Analisis model kustom mengharuskan Anda untuk memberikan modelID dalam panggilan ke Kecerdasan Dokumen. Anda harus memberikan ID model yang disusun untuk modelID parameter dalam aplikasi Anda.

Cuplikan layar ID model yang terdiri di Document Intelligence Studio.

Mengelola model yang telah Anda susun

Anda dapat mengelola model kustom Anda sepanjang siklus hidup:

  • Menguji dan memvalidasi dokumen baru.
  • Unduh model Anda untuk digunakan dalam aplikasi Anda.
  • Hapus model Anda saat siklus hidupnya selesai.

Cuplikan layar model yang terdiri di Studio Kecerdasan Dokumen

Bagus! Anda telah mempelajari langkah-langkah untuk membuat model kustom dan yang dibuat dan menggunakannya dalam proyek dan aplikasi Kecerdasan Dokumen Anda.

Langkah berikutnya

Cobalah salah satu mulai cepat Kecerdasan Dokumen kami:

C#

Kecerdasan Dokumen menggunakan teknologi pembelajaran mesin tingkat lanjut untuk mendeteksi dan mengekstrak informasi dari gambar dokumen dan mengembalikan data yang diekstrak dalam output JSON terstruktur. Dengan Kecerdasan Dokumen, Anda dapat melatih model kustom mandiri atau menggabungkan model kustom untuk membuat model yang dibuat.

  • Model kustom. Model kustom Kecerdasan Dokumen memungkinkan Anda menganalisis dan mengekstrak data dari formulir dan dokumen khusus untuk bisnis Anda. Model kustom dilatih untuk data dan kasus penggunaan Anda yang berbeda.

  • Model yang disusun. Model yang disusun dibuat dengan mengambil koleksi model khusus dan menetapkannya ke satu model yang mencakup jenis formulir Anda. Ketika dokumen diserahkan ke model yang disusun, layanan melakukan langkah klasifikasi untuk memutuskan model kustom mana yang secara akurat mewakili formulir yang disajikan untuk analisis.

Dalam artikel ini, Anda mempelajari cara membuat model kustom dan yang dibuat Kecerdasan Dokumen menggunakan alat Pelabelan Sampel Kecerdasan Dokumen, REST API, atau SDK pustaka klien kami.

Alat pelabelan sampel

Coba ekstrak data dari formulir kustom menggunakan alat Pelabelan Sampel kami. Anda membutuhkan sumber daya berikut:

  • Langganan Azure—Anda dapat membuat langganan gratis

  • Instans Kecerdasan Dokumen di portal Azure. Anda dapat menggunakan tingkat harga gratis (F0) untuk mencoba layanan. Setelah sumber daya Anda disebarkan, pilih Buka sumber daya untuk mendapatkan kunci dan titik akhir Anda.

Cuplikan layar di titik akhir di portal Azure.

Di UI Kecerdasan Dokumen:

  1. Pilih Gunakan Kustom untuk melatih model dengan label dan mendapatkan pasangan kunci-nilai.

    Cuplikan layar alat FOTT memilih opsi model kustom.

  2. Di jendela berikutnya, pilih Proyek baru:

    Cuplikan layar alat FOTT memilih opsi proyek baru.

Buat model Anda

Langkah-langkah untuk membangun, melatih, dan menggunakan model kustom dan disusun adalah sebagai berikut:

Mengumpulkan himpunan data pelatihan Anda

Membangun model kustom dimulai dengan membuat himpunan data pelatihan Anda. Anda memerlukan minimal lima formulir lengkap dengan jenis yang sama untuk himpunan data sampel Anda. Formulir tersebut dapat dari berbagai jenis file dan berisi teks serta tulisan tangan. Formulir Anda harus mengikuti persyaratan input untuk Kecerdasan Dokumen.

Mengunggah himpunan data pelatihan Anda

Anda perlu mengunggah data pelatihan Anda ke kontainer penyimpanan blob Azure. Jika Anda tidak tahu cara membuat akun penyimpanan Azure dengan kontainer, lihatMulai cepat Azure Storage untuk portal Microsoft Azure. Untuk mencoba layanan, Anda dapat menggunakan tingkat harga gratis (F0), lalu meningkatkannya ke tingkat berbayar untuk produksi.

Melatih model kustom Anda

Anda melatih model Anda dengan himpunan data berlabel. Himpunan data berlabel bergantung pada API tata letak bawaan, tetapi input manusia tambahan disertakan, seperti label spesifik dan lokasi bidang Anda. Mulailah dengan setidaknya lima formulir yang telah selesai dari jenis yang sama untuk data pelatihan berlabel Anda.

Saat Anda berlatih dengan data berlabel, model menggunakan pembelajaran yang diawasi untuk mengekstrak nilai-nilai yang diminati, menggunakan formulir berlabel yang Anda berikan. Metode ini menghasilkan model yang berperforma lebih baik dan dapat menghasilkan model yang bekerja dengan bentuk kompleks atau formulir yang berisi nilai tanpa kunci.

Kecerdasan Dokumen menggunakan API Tata Letak untuk mempelajari ukuran dan posisi elemen teks typeface dan tulisan tangan yang diharapkan dan mengekstrak tabel. Kemudian menggunakan label yang ditentukan pengguna untuk mempelajari asosiasi kunci/nilai dan tabel dalam dokumen. Sebaiknya Anda menggunakan lima formulir berlabel manual dari jenis yang sama (struktur yang sama) untuk memulai saat melatih model baru. Tambahkan lebih banyak data berlabel sesuai kebutuhan untuk meningkatkan akurasi model. Kecerdasan Dokumen memungkinkan pelatihan model untuk mengekstrak pasangan nilai kunci dan tabel menggunakan kemampuan pembelajaran yang diawasi.

Memulai dengan Pelatihan dengan label

[!VIDEO https://learn.microsoft.com/Shows/Docs-Azure/Azure-Form-Recognizer/player]

Membuat model yang disusun

Catatan

Model Compose hanya tersedia untuk model kustom yang dilatih dengan label. Mencoba menyusun model yang tidak berlabel akan menghasilkan kesalahan.

Dengan operasi Model Compose, Anda dapat menetapkan hingga 200 model kustom terlatih ke satu ID model. Saat Anda memanggil Analisis dengan ID model yang terdiri, Kecerdasan Dokumen mengklasifikasikan formulir yang Anda kirimkan terlebih dahulu, memilih model yang ditetapkan yang paling cocok, lalu mengembalikan hasil untuk model tersebut. Operasi ini berguna jika formulir masuk menjadi bagian dari salah satu templat.

Menggunakan alat Pelabelan Sampel Kecerdasan Dokumen, REST API, atau SDK Pustaka klien, ikuti langkah-langkah untuk menyiapkan model yang disusam:

  1. Kumpulkan ID model kustom Anda
  2. Kelola model kustom Anda

Mengumpulkan ID model kustom Anda

Setelah proses pelatihan berhasil diselesaikan, model kustom Anda diberi ID model. Anda dapat mengambil ID model sebagai berikut:

Saat Anda melatih model menggunakan alat Pelabelan Sampel Kecerdasan Dokumen, ID model terletak di jendela Hasil Pelatihan:

Cuplikan layar jendela hasil pelatihan.

Mengelola model kustom Anda

Setelah Anda mengumpulkan model kustom yang sesuai dengan satu jenis formulir, Anda dapat menyusunnya menjadi satu model.

Alat Pelabelan Sampel memungkinkan Anda untuk dengan cepat memulai model pelatihan dan menyusunnya menjadi satu ID model.

Setelah Anda menyelesaikan pelatihan, susun model Anda sebagai berikut:

  1. Pada menu rel kiri, pilih ikon Pembuatan Model (panah yang digabungkan).

  2. Di jendela utama, pilih model yang ingin Anda tetapkan ke satu ID model. Model dengan ikon tanda panah adalah model yang sudah dibuat.

  3. Pilih tombol Susun dari pojok kiri atas.

  4. Di jendela pop-up, beri nama model baru yang Anda susun, dan pilih Susun.

Saat operasi selesai, model Yang baru Anda buat muncul dalam daftar.

Cuplikan layar jendela penyusunan model.

Menganalisis dokumen dengan model kustom atau yang disusun Anda

Operasi Analisis formulir kustom mengharuskan Anda untuk memberikan modelID dalam panggilan ke Kecerdasan Dokumen. Anda dapat memberikan ID model kustom tunggal atau ID model yang disusun untuk parameter modelID.

  1. Pada menu panel kiri alat, pilih ikon Analisis (bola lampu).

  2. Pilih file lokal atau URL citra untuk dianalisis.

  3. Pilih tombol Jalankan Analisis.

  4. Alat ini menerapkan tag dalam kotak pembatas dan melaporkan persentase keyakinan untuk setiap tag.

Cuplikan layar jendela analyze-a-custom-form alat Kecerdasan Dokumen.

Uji model yang baru Anda latih dengan menganalisis formulir yang bukan bagian dari himpunan data pelatihan. Bergantung pada akurasi yang dilaporkan, sebaiknya lakukan pelatihan lanjutan untuk menyempurnakan model. Anda dapat melanjutkan pelatihan untuk meningkatkan hasil.

Mengelola model kustom Anda

Anda dapat mengelola model kustom di sepanjang siklus hidupnya dengan melihat daftar semua model kustom di bagian langganan Anda, menerima informasi tentang model kustom tertentu, dan menghapus model kustom dari akun Anda.

Bagus! Anda telah mempelajari langkah-langkah untuk membuat model kustom dan yang dibuat dan menggunakannya dalam proyek dan aplikasi Kecerdasan Dokumen Anda.

Langkah berikutnya

Pelajari selengkapnya tentang pustaka klien Inteligensi Dokumen dengan menjelajahi dokumentasi referensi API kami.