Bagikan melalui


Model mana yang harus saya pilih?

Penting

  • Rilis pratinjau publik Kecerdasan Dokumen menyediakan akses awal ke fitur yang sedang dalam pengembangan aktif. Fitur, pendekatan, dan proses dapat berubah, sebelum Ketersediaan Umum (GA), berdasarkan umpan balik pengguna.
  • Versi pratinjau publik pustaka klien Kecerdasan Dokumen default ke REST API versi 2024-07-31-preview.
  • Pratinjau publik versi 2024-07-31-preview saat ini hanya tersedia di wilayah Azure berikut. Perhatikan bahwa model generatif kustom (ekstraksi bidang dokumen) di AI Studio hanya tersedia di wilayah US Tengah Utara:
    • US Timur
    • US Barat2
    • Eropa Barat
    • US Tengah Utara

Azure AI Document Intelligence mendukung berbagai model yang memungkinkan Anda menambahkan pemrosesan dokumen cerdas ke aplikasi Anda dan mengoptimalkan alur kerja Anda. Memilih model yang tepat sangat penting untuk memastikan keberhasilan perusahaan Anda. Dalam artikel ini, kami menjelajahi model Kecerdasan Dokumen yang tersedia dan memberikan panduan tentang cara memilih solusi terbaik untuk proyek Anda.

Bagan keputusan berikut menyoroti fitur dari setiap model yang didukung untuk membantu Anda memilih model yang paling sesuai dengan kebutuhan dan persyaratan aplikasi Anda.

Penting

Pastikan untuk memeriksa halaman dukungan bahasa untuk teks bahasa dan ekstraksi bidang yang didukung berdasarkan fitur.

Model analisis dokumen yang telah dilatih sebelumnya

Jenis dokumen Contoh Data yang akan diekstrak Solusi terbaik Anda
Dokumen generik. Kontrak atau surat. Anda terutama ingin mengekstrak baris teks tertulis atau cetak, kata, lokasi, dan bahasa yang terdeteksi. Membaca model OCR
Dokumen yang menyertakan informasi struktural. Laporan atau studi. Selain teks tertulis atau cetak, Anda perlu mengekstrak informasi struktural seperti tabel, tanda pilihan, paragraf, judul, judul, dan subjudul. Model analisis tata letak
Dokumen terstruktur atau semi terstruktur yang menyertakan konten yang diformat sebagai bidang (kunci) dan nilai. Formulir atau dokumen yang merupakan format standar yang umum digunakan dalam bisnis atau industri Anda seperti aplikasi kredit atau survei. Anda ingin mengekstrak bidang dan nilai termasuk yang tidak tercakup oleh model bawaan khusus skenario tanpa harus melatih model kustom. **Model analisis tata letak dengan parameter features=keyValuePairs string kueri opsional diaktifkan **

Model khusus skenario yang telah dilatih sebelumnya

Jenis dokumen Data yang akan diekstrak Solusi terbaik Anda
Pajak Terpadu AS Anda ingin mengekstrak informasi utama di semua bentuk pajak W2, 1040, 1090, 1098 dari satu file tanpa menjalankan klasifikasi kustom Anda sendiri. Model pajak Terpadu AS
Pajak US W-2 Anda ingin mengekstrak informasi utama seperti gaji, upah, dan pajak yang ditahan. Model W-2 pajak AS
Pajak AS 1098 Anda ingin mengekstrak detail bunga hipotek seperti pokok, poin, dan pajak. Model pajak AS 1098
Pajak AS 1098-E Anda ingin mengekstrak detail bunga pinjaman siswa seperti pemberi pinjaman dan jumlah bunga. Model pajak AS 1098-E
Pajak AS 1098T Anda ingin mengekstrak detail biaya kuliah yang memenuhi syarat seperti penyesuaian beasiswa, status siswa, dan informasi pemberi pinjaman. Model 1098-T pajak AS
Pajak AS 1099(Variasi) Anda ingin mengekstrak informasi dari 1099 formulir dan variasinya (A, B, C, CAP, DIV, G, H, INT, K, LS, LTC, MISC, NEC, OID, PATR, Q, QA, R, S, SA, SB). Model pajak AS 1099
Pajak AS 1040(Variasi) Anda ingin mengekstrak informasi dari 1040 formulir dan variasinya (Jadwal 1, Jadwal 2, Jadwal 3, Jadwal 8812, Jadwal A, Jadwal B, Jadwal C, Jadwal D, Jadwal E, Jadwal EIC, Jadwal F, Jadwal H, Jadwal J, Jadwal R, Jadwal SE, Jadwal Senior). Model pajak AS 1040
Laporan Bank Anda ingin mengekstrak informasi utama dari laporan bank AS \Laporan Bank
Cek bank Anda ingin mengekstrak informasi kunci dari dokumen pemeriksaan. Cek Bank
Kontrak (perjanjian hukum antar pihak). Anda ingin mengekstrak detail perjanjian kontrak seperti pihak, tanggal, dan interval. Model kontrak
Kartu asuransi kesehatan atau ID asuransi kesehatan. Anda ingin mengekstrak informasi utama seperti penanggung, ID anggota, cakupan resep, dan nomor grup. Model kartu asuransi kesehatan
Kartu Kredit/Debit Anda ingin mengekstrak kartu bank informasi utama seperti nomor kartu dan nama bank. Model kartu Kredit/Debit
Surat Nikah Anda ingin mengekstrak informasi utama dari sertifikat pernikahan. Model sertifikat pernikahan
Faktur atau laporan tagihan Anda ingin mengekstrak informasi utama seperti nama pelanggan, alamat penagihan, dan jumlah yang jatuh tempo. Model faktur
Tanda terima, voucher, atau tanda terima hotel satu halaman. Anda ingin mengekstrak informasi utama seperti nama pedagang, tanggal transaksi, dan total transaksi. Model tanda terima
Dokumen identitas (ID) seperti SIM A.S. atau paspor internasional Anda ingin mengekstrak informasi utama seperti nama depan, nama keluarga, tanggal lahir, alamat, dan tanda tangan. Model dokumen identitas (ID)
Ganja bayar Anda ingin mengekstrak informasi kunci dari dokumen stub bayar. Model stub bayar
Hipotret AS 1003 Anda ingin mengekstrak informasi utama dari aplikasi pinjaman Uniform Residential. Model formulir 1003
Hipotret AS 1004 Anda ingin mengekstrak informasi utama dari Laporan Appraisal Residensial Seragam (URAR). Model formulir 1004
HIPOTP AS 1005 Anda ingin mengekstrak informasi utama dari formulir Verifikasi ketenagakerjaan Model formulir 1005
Hipotret AS 1008 Anda ingin mengekstrak informasi utama dari ringkasan Uniform Underwriting dan Transmittal. Model formulir 1008
Pengungkapan Penutupan Hipotek AS Anda ingin mengekstrak informasi utama dari formulir pengungkapan penutupan hipotek. Model formulir pengungkapan penutupan hipotek
Dokumen tipe campuran dengan elemen terstruktur, semi terstruktur, dan/atau tidak terstruktur Anda ingin mengekstrak pasangan kunci-nilai, tanda pilihan, tabel, bidang tanda tangan, dan wilayah yang dipilih yang tidak diekstrak oleh model dokumen bawaan atau umum. Model kustom

Tip

  • Jika Anda masih tidak yakin model mana yang telah dilatih sebelumnya untuk digunakan, coba model tata letak dengan parameter features=keyValuePairs string kueri opsional diaktifkan.
  • Model tata letak didukung oleh mesin Read OCR untuk mendeteksi halaman, tabel, gaya, teks, baris, kata, lokasi, dan bahasa.

Model ekstraksi kustom

Set pelatihan Contoh dokumen Solusi terbaik Anda
Dokumen terstruktur, konsisten, dengan tata letak statis. Bentuk terstruktur seperti kuesioner atau aplikasi. Model templat kustom
Terstruktur dan semi terstruktur. ● Survei
→ terstruktur● Faktur → semi terstruktur
Model neural kustom
Dokumen yang tidak terstruktur, dokumen dengan berbagai templat. ● Dokumen yang tidak terstruktur seperti kontrak atau surat
● Berbagai templat dokumen seperti pernyataan pinjaman dari perusahaan hipotong yang berbeda
Model generatif kustom
Kumpulan beberapa model yang masing-masing dilatih pada dokumen jenis serupa. ● Pesanan
pembelian pasokan● Pesanan
pembelian peralatan● Pesanan
pembelian furnitur Semua terdiri dalam satu model.
Model kustom yang terdiri

Model klasifikasi kustom

Set pelatihan Contoh dokumen Solusi terbaik Anda
Setidaknya dua jenis dokumen yang berbeda. Formulir, huruf, atau dokumen Model klasifikasi kustom

Langkah berikutnya