Menggunakan Azure Document Intelligence Studio
Selain SDK dan REST API, layanan Azure Document Intelligence dapat diakses melalui antarmuka pengguna yang disebut Azure Document Intelligence Studio, alat online untuk menjelajahi, memahami, dan mengintegrasikan fitur secara visual dari layanan Azure Document Intelligence. Studio dapat digunakan untuk menganalisis tata letak formulir, mengekstrak data dari model bawaan, dan melatih model kustom.
Azure Document Intelligence Studio saat ini mendukung proyek berikut:
-
Model analisis dokumen
- Baca: Ekstrak baris teks cetak dan tulisan tangan, kata, lokasi, dan bahasa yang terdeteksi dari dokumen dan gambar.
- Tata Letak: Ekstrak teks, tabel, tanda pilihan, dan informasi struktur dari dokumen (PDF dan TIFF) dan gambar (JPG, PNG, dan BMP).
- Dokumen Umum: Mengekstrak pasangan kunci-nilai, tanda pilihan, dan entitas dari dokumen.
- Model bawaan
- Model kustomisasi
Membangun proyek model analisis Dokumen
Untuk mengekstrak teks, tabel, struktur, pasangan kunci-nilai, dan entitas bernama dengan model analisis dokumen:
- Membuat sumber daya Azure Document Intelligence atau Foundry Tools
- Pilih "Baca", "Tata Letak", atau "Dokumen Umum" di bawah kategori Model analisis dokumen
- Analisis dokumen Anda. Anda memerlukan endpoint dan kunci untuk Azure Document Intelligence atau Foundry Tools.
Membangun proyek model bawaan
Untuk mengekstrak data dari formulir umum dengan model bawaan:
- Membuat sumber daya Azure Document Intelligence atau Foundry Tools
- Pilih salah satu "model bawaan" termasuk W-2, Faktur, Tanda Terima, dokumen ID, Asuransi kesehatan, vaksinasi, dan kartu nama.
- Analisis dokumen Anda. Anda memerlukan *endpoint* dan *key* untuk Azure Document Intelligence atau Foundry Tools.
Membangun proyek model kustom
Anda dapat menggunakan layanan kustom Azure Document Intelligence Studio untuk seluruh proses pelatihan dan pengujian model kustom.
Saat Anda menggunakan Azure Document Intelligence Studio untuk membuat model kustom, file ocr.json , file labels.json , dan file fields.json yang diperlukan untuk pelatihan secara otomatis dibuat dan disimpan di akun penyimpanan Anda.
Untuk melatih model kustom dan menggunakannya untuk mengekstrak data dengan model kustom:
- Membuat sumber daya Azure Document Intelligence atau Foundry Tools
- Kumpulkan setidaknya 5-6 formulir sampel untuk pelatihan dan unggah ke kontainer akun penyimpanan Anda.
- Mengonfigurasi berbagi sumber daya lintas domain (CORS). CORS memungkinkan Azure Document Intelligence Studio menyimpan file berlabel di kontainer penyimpanan Anda.
- Buat proyek model kustom di Azure Document Intelligence Studio. Anda harus menyediakan konfigurasi yang menautkan kontainer penyimpanan dan sumber daya Azure Document Intelligence atau Foundry Tools ke proyek.
- Gunakan Azure Document Intelligence Studio untuk menerapkan label ke teks.
- Latih model Anda. Setelah model dilatih, Anda akan menerima ID Model dan Akurasi Rata-Rata untuk tag.
- Uji model Anda dengan menganalisis formulir baru yang tidak digunakan dalam pelatihan.