Model mana yang harus saya pilih?
Penting
- Rilis pratinjau publik Kecerdasan Dokumen menyediakan akses awal ke fitur yang sedang dalam pengembangan aktif. Fitur, pendekatan, dan proses dapat berubah, sebelum Ketersediaan Umum (GA), berdasarkan umpan balik pengguna.
- Versi pratinjau publik pustaka klien Kecerdasan Dokumen default ke REST API versi 2024-07-31-preview.
- Pratinjau publik versi 2024-07-31-preview saat ini hanya tersedia di wilayah Azure berikut. Perhatikan bahwa model generatif kustom (ekstraksi bidang dokumen) di AI Studio hanya tersedia di wilayah US Tengah Utara:
- US Timur
- US Barat2
- Eropa Barat
- US Tengah Utara
Azure AI Document Intelligence mendukung berbagai model yang memungkinkan Anda menambahkan pemrosesan dokumen cerdas ke aplikasi Anda dan mengoptimalkan alur kerja Anda. Memilih model yang tepat sangat penting untuk memastikan keberhasilan perusahaan Anda. Dalam artikel ini, kami menjelajahi model Kecerdasan Dokumen yang tersedia dan memberikan panduan tentang cara memilih solusi terbaik untuk proyek Anda.
Bagan keputusan berikut menyoroti fitur dari setiap model yang didukung untuk membantu Anda memilih model yang paling sesuai dengan kebutuhan dan persyaratan aplikasi Anda.
Penting
Pastikan untuk memeriksa halaman dukungan bahasa untuk teks bahasa dan ekstraksi bidang yang didukung berdasarkan fitur.
Model analisis dokumen yang telah dilatih sebelumnya
Jenis dokumen | Contoh | Data yang akan diekstrak | Solusi terbaik Anda |
---|---|---|---|
Dokumen generik. | Kontrak atau surat. | Anda terutama ingin mengekstrak baris teks tertulis atau cetak, kata, lokasi, dan bahasa yang terdeteksi. | Membaca model OCR |
Dokumen yang menyertakan informasi struktural. | Laporan atau studi. | Selain teks tertulis atau cetak, Anda perlu mengekstrak informasi struktural seperti tabel, tanda pilihan, paragraf, judul, judul, dan subjudul. | Model analisis tata letak |
Dokumen terstruktur atau semi terstruktur yang menyertakan konten yang diformat sebagai bidang (kunci) dan nilai. | Formulir atau dokumen yang merupakan format standar yang umum digunakan dalam bisnis atau industri Anda seperti aplikasi kredit atau survei. | Anda ingin mengekstrak bidang dan nilai termasuk yang tidak tercakup oleh model bawaan khusus skenario tanpa harus melatih model kustom. | **Model analisis tata letak dengan parameter features=keyValuePairs string kueri opsional diaktifkan ** |
Model khusus skenario yang telah dilatih sebelumnya
Jenis dokumen | Data yang akan diekstrak | Solusi terbaik Anda |
---|---|---|
Pajak Terpadu AS | Anda ingin mengekstrak informasi utama di semua bentuk pajak W2, 1040, 1090, 1098 dari satu file tanpa menjalankan klasifikasi kustom Anda sendiri. | Model pajak Terpadu AS |
Pajak US W-2 | Anda ingin mengekstrak informasi utama seperti gaji, upah, dan pajak yang ditahan. | Model W-2 pajak AS |
Pajak AS 1098 | Anda ingin mengekstrak detail bunga hipotek seperti pokok, poin, dan pajak. | Model pajak AS 1098 |
Pajak AS 1098-E | Anda ingin mengekstrak detail bunga pinjaman siswa seperti pemberi pinjaman dan jumlah bunga. | Model pajak AS 1098-E |
Pajak AS 1098T | Anda ingin mengekstrak detail biaya kuliah yang memenuhi syarat seperti penyesuaian beasiswa, status siswa, dan informasi pemberi pinjaman. | Model 1098-T pajak AS |
Pajak AS 1099(Variasi) | Anda ingin mengekstrak informasi dari 1099 formulir dan variasinya (A, B, C, CAP, DIV, G, H, INT, K, LS, LTC, MISC, NEC, OID, PATR, Q, QA, R, S, SA, SB). |
Model pajak AS 1099 |
Pajak AS 1040(Variasi) | Anda ingin mengekstrak informasi dari 1040 formulir dan variasinya (Jadwal 1, Jadwal 2, Jadwal 3, Jadwal 8812, Jadwal A, Jadwal B, Jadwal C, Jadwal D, Jadwal E, Jadwal EIC , Jadwal F, Jadwal H, Jadwal J, Jadwal R, Jadwal SE , Jadwal Senior). |
Model pajak AS 1040 |
Laporan Bank | Anda ingin mengekstrak informasi utama dari laporan bank AS | \Laporan Bank |
Cek bank | Anda ingin mengekstrak informasi kunci dari dokumen pemeriksaan. | Cek Bank |
Kontrak (perjanjian hukum antar pihak). | Anda ingin mengekstrak detail perjanjian kontrak seperti pihak, tanggal, dan interval. | Model kontrak |
Kartu asuransi kesehatan atau ID asuransi kesehatan. | Anda ingin mengekstrak informasi utama seperti penanggung, ID anggota, cakupan resep, dan nomor grup. | Model kartu asuransi kesehatan |
Kartu Kredit/Debit | Anda ingin mengekstrak kartu bank informasi utama seperti nomor kartu dan nama bank. | Model kartu Kredit/Debit |
Surat Nikah | Anda ingin mengekstrak informasi utama dari sertifikat pernikahan. | Model sertifikat pernikahan |
Faktur atau laporan tagihan | Anda ingin mengekstrak informasi utama seperti nama pelanggan, alamat penagihan, dan jumlah yang jatuh tempo. | Model faktur |
Tanda terima, voucher, atau tanda terima hotel satu halaman. | Anda ingin mengekstrak informasi utama seperti nama pedagang, tanggal transaksi, dan total transaksi. | Model tanda terima |
Dokumen identitas (ID) seperti SIM A.S. atau paspor internasional | Anda ingin mengekstrak informasi utama seperti nama depan, nama keluarga, tanggal lahir, alamat, dan tanda tangan. | Model dokumen identitas (ID) |
Ganja bayar | Anda ingin mengekstrak informasi kunci dari dokumen stub bayar. | Model stub bayar |
Hipotret AS 1003 | Anda ingin mengekstrak informasi utama dari aplikasi pinjaman Uniform Residential. | Model formulir 1003 |
Hipotret AS 1004 | Anda ingin mengekstrak informasi utama dari Laporan Appraisal Residensial Seragam (URAR). | Model formulir 1004 |
HIPOTP AS 1005 | Anda ingin mengekstrak informasi utama dari formulir Verifikasi ketenagakerjaan | Model formulir 1005 |
Hipotret AS 1008 | Anda ingin mengekstrak informasi utama dari ringkasan Uniform Underwriting dan Transmittal. | Model formulir 1008 |
Pengungkapan Penutupan Hipotek AS | Anda ingin mengekstrak informasi utama dari formulir pengungkapan penutupan hipotek. | Model formulir pengungkapan penutupan hipotek |
Dokumen tipe campuran dengan elemen terstruktur, semi terstruktur, dan/atau tidak terstruktur | Anda ingin mengekstrak pasangan kunci-nilai, tanda pilihan, tabel, bidang tanda tangan, dan wilayah yang dipilih yang tidak diekstrak oleh model dokumen bawaan atau umum. | Model kustom |
Tip
- Jika Anda masih tidak yakin model mana yang telah dilatih sebelumnya untuk digunakan, coba model tata letak dengan parameter
features=keyValuePairs
string kueri opsional diaktifkan. - Model tata letak didukung oleh mesin Read OCR untuk mendeteksi halaman, tabel, gaya, teks, baris, kata, lokasi, dan bahasa.
Model ekstraksi kustom
Set pelatihan | Contoh dokumen | Solusi terbaik Anda |
---|---|---|
Dokumen terstruktur, konsisten, dengan tata letak statis. | Bentuk terstruktur seperti kuesioner atau aplikasi. | Model templat kustom |
Terstruktur dan semi terstruktur. | ● Survei → terstruktur● Faktur → semi terstruktur |
Model neural kustom |
Dokumen yang tidak terstruktur, dokumen dengan berbagai templat. | ● Dokumen yang tidak terstruktur seperti kontrak atau surat ● Berbagai templat dokumen seperti pernyataan pinjaman dari perusahaan hipotong yang berbeda |
Model generatif kustom |
Kumpulan beberapa model yang masing-masing dilatih pada dokumen jenis serupa. | ● Pesanan pembelian pasokan● Pesanan pembelian peralatan● Pesanan pembelian furnitur Semua terdiri dalam satu model. |
Model kustom yang terdiri |
Model klasifikasi kustom
Set pelatihan | Contoh dokumen | Solusi terbaik Anda |
---|---|---|
Setidaknya dua jenis dokumen yang berbeda. | Formulir, huruf, atau dokumen | Model klasifikasi kustom |
Langkah berikutnya
- Pelajari cara memproses formulir dan dokumen Anda sendiri dengan Studio Kecerdasan Dokumen