Melatih model kustom
Layanan Azure Document Intelligence Azure mendukung pembelajaran mesin yang diawasi. Anda dapat melatih model kustom dan membuat model komposit dengan dokumen formulir dan dokumen JSON yang berisi bidang berlabel.
Untuk melatih model kustom:
- Simpan formulir sampel dalam kontainer blob Azure, bersama dengan file JSON yang berisi informasi bidang tata letak dan label.
- Anda dapat membuat file ocr.json untuk setiap formulir sampel menggunakan fungsi dokumen Analisis Kecerdasan Dokumen Azure. Selain itu, Anda memerlukan satu file fields.json yang menjelaskan bidang yang ingin Anda ekstrak, dan file labels.json untuk setiap formulir sampel yang memetakan bidang ke lokasinya dalam formulir tersebut.
- Buat URL keamanan akses bersama (SAS) untuk kontainer.
- Gunakan model build fungsi REST API (atau metode SDK yang setara).
- Gunakan fungsi Dapatkan model REST API (atau metode SDK yang setara) untuk mendapatkan ID model terlatih.
ATAU
- Gunakan Azure Document Intelligence Studio untuk memberi label dan melatih. Ada dua jenis model yang mendasar untuk formulir kustom model templat kustom atau model neural kustom .
- Model templat kustom mengekstrak pasangan kunci-nilai berlabel secara akurat, tanda pilihan, tabel, wilayah, dan tanda tangan dari dokumen. Pelatihan hanya membutuhkan waktu beberapa menit, dan lebih dari 100 bahasa didukung.
- Model neural kustom adalah model yang dipelajari secara mendalam yang menggabungkan fitur tata letak dan bahasa untuk mengekstrak bidang berlabel secara akurat dari dokumen. Model ini paling cocok untuk dokumen semi terstruktur atau tidak terstruktur.