Model mana yang harus saya pilih?
Penting
- Rilis pratinjau publik Kecerdasan Dokumen menyediakan akses awal ke fitur yang sedang dalam pengembangan aktif.
- Fitur, pendekatan, dan proses dapat berubah, sebelum Ketersediaan Umum (GA), berdasarkan umpan balik pengguna.
- Versi pratinjau publik pustaka klien Kecerdasan Dokumen default ke REST API versi 2024-02-29-preview.
- Pratinjau publik versi 2024-02-29-preview saat ini hanya tersedia di wilayah Azure berikut:
- US Timur
- US Barat2
- Eropa Barat
Konten ini berlaku untuk: v4.0 (pratinjau) | Versi sebelumnya: v3.1 (GA) v3.0 (GA)
Konten ini berlaku untuk: v3.1 (GA) | Versi terbaru: v4.0 (pratinjau) | Versi sebelumnya: v3.0
Konten ini berlaku untuk: v3.0 (GA) | Versi terbaru: v4.0 (pratinjau) v3.1
Azure AI Document Intelligence mendukung berbagai model yang memungkinkan Anda menambahkan pemrosesan dokumen cerdas ke aplikasi Anda dan mengoptimalkan alur kerja Anda. Memilih model yang tepat sangat penting untuk memastikan keberhasilan perusahaan Anda. Dalam artikel ini, kami menjelajahi model Kecerdasan Dokumen yang tersedia dan memberikan panduan tentang cara memilih solusi terbaik untuk proyek Anda.
Bagan keputusan berikut menyoroti fitur setiap model yang didukung Kecerdasan Dokumen v3.0 dan membantu Anda memilih model terbaik untuk memenuhi kebutuhan dan persyaratan aplikasi Anda.
Penting
Pastikan untuk memeriksa halaman dukungan bahasa untuk teks bahasa dan ekstraksi bidang yang didukung berdasarkan fitur.
Model analisis dokumen yang telah dilatih sebelumnya
Jenis dokumen | Contoh | Data yang akan diekstrak | Solusi terbaik Anda |
---|---|---|---|
Dokumen generik. | Kontrak atau surat. | Anda terutama ingin mengekstrak baris teks tertulis atau cetak, kata, lokasi, dan bahasa yang terdeteksi. | Membaca model OCR |
Dokumen yang menyertakan informasi struktural. | Laporan atau studi. | Selain teks tertulis atau cetak, Anda perlu mengekstrak informasi struktural seperti tabel, tanda pilihan, paragraf, judul, judul, dan subjudul. | Model analisis tata letak |
Dokumen terstruktur atau semi terstruktur yang menyertakan konten yang diformat sebagai bidang (kunci) dan nilai. | Formulir atau dokumen yang merupakan format standar yang umum digunakan dalam bisnis atau industri Anda seperti aplikasi kredit atau survei. | Anda ingin mengekstrak bidang dan nilai termasuk yang tidak tercakup oleh model bawaan khusus skenario tanpa harus melatih model kustom. | **Model analisis tata letak dengan parameter features=keyValuePairs string kueri opsional diaktifkan ** |
Model khusus skenario yang telah dilatih sebelumnya
Jenis dokumen | Data yang akan diekstrak | Solusi terbaik Anda |
---|---|---|
Formulir pajak US W-2 | Anda ingin mengekstrak informasi utama seperti gaji, upah, dan pajak yang ditahan. | Model W-2 pajak AS |
Formulir Pajak AS 1098 | Anda ingin mengekstrak detail bunga hipotek seperti pokok, poin, dan pajak. | Model pajak AS 1098 |
Formulir Pajak AS 1098-E | Anda ingin mengekstrak detail bunga pinjaman siswa seperti pemberi pinjaman dan jumlah bunga. | Model pajak AS 1098-E |
Formulir Pajak AS 1098T | Anda ingin mengekstrak detail biaya kuliah yang memenuhi syarat seperti penyesuaian beasiswa, status siswa, dan informasi pemberi pinjaman. | Model 1098-T pajak AS |
Formulir Pajak AS 1099(Variasi) | Anda ingin mengekstrak informasi dari 1099 formulir dan variasinya (A, B, C, CAP, DIV, G, H, INT, K, LS, LTC, MISC, NEC, OID, PATR, Q, QA, R, S, SA, SB). |
Model pajak AS 1099 |
Formulir Pajak AS 1040(Variasi) | Anda ingin mengekstrak informasi dari 1040 formulir dan variasinya (Jadwal 1, Jadwal 2, Jadwal 3, Jadwal 8812, Jadwal A, Jadwal B, Jadwal C, Jadwal D, Jadwal E, Jadwal EIC, Jadwal F, Jadwal H, Jadwal J, Jadwal R, Jadwal SE, Jadwal Senior). |
Model pajak AS 1040 |
Kontrak (perjanjian hukum antar pihak). | Anda ingin mengekstrak detail perjanjian kontrak seperti pihak, tanggal, dan interval. | Model kontrak |
Kartu asuransi kesehatan atau ID asuransi kesehatan. | Anda ingin mengekstrak informasi utama seperti penanggung, ID anggota, cakupan resep, dan nomor grup. | Model kartu asuransi kesehatan |
Kartu Kredit/Debit . | Anda ingin mengekstrak kartu bank informasi utama seperti nomor kartu dan nama bank. | Model kartu Kredit/Debit |
Surat Nikah . | Anda ingin mengekstrak informasi utama dari sertifikat pernikahan. | Model sertifikat pernikahan |
Faktur atau laporan tagihan. | Anda ingin mengekstrak informasi utama seperti nama pelanggan, alamat penagihan, dan jumlah yang jatuh tempo. | Model faktur |
Tanda terima, voucher, atau tanda terima hotel satu halaman. | Anda ingin mengekstrak informasi utama seperti nama pedagang, tanggal transaksi, dan total transaksi. | Model tanda terima |
Dokumen identitas (ID) seperti SIM A.S. atau paspor internasional. | Anda ingin mengekstrak informasi utama seperti nama depan, nama keluarga, tanggal lahir, alamat, dan tanda tangan. | Model dokumen identitas (ID) |
HIPOTP AS 1003 . | Anda ingin mengekstrak informasi utama dari aplikasi pinjaman Uniform Residential. | Model formulir 1003 |
HIPOTP AS 1008 . | Anda ingin mengekstrak informasi utama dari ringkasan Uniform Underwriting dan Transmittal. | Model formulir 1008 |
Pengungkapan Penutupan Hipotek AS. | Anda ingin mengekstrak informasi utama dari formulir pengungkapan penutupan hipotek. | Model formulir pengungkapan penutupan hipotek |
Dokumen tipe campuran dengan elemen terstruktur, semi terstruktur, dan/atau tidak terstruktur. | Anda ingin mengekstrak pasangan kunci-nilai, tanda pilihan, tabel, bidang tanda tangan, dan wilayah yang dipilih yang tidak diekstrak oleh model dokumen bawaan atau umum. | Model kustom |
Tip
- Jika Anda masih tidak yakin model mana yang telah dilatih sebelumnya untuk digunakan, coba model tata letak dengan parameter
features=keyValuePairs
string kueri opsional diaktifkan. - Model tata letak didukung oleh mesin Read OCR untuk mendeteksi halaman, tabel, gaya, teks, baris, kata, lokasi, dan bahasa.
Model ekstraksi kustom
Set pelatihan | Contoh dokumen | Solusi terbaik Anda |
---|---|---|
Dokumen terstruktur, konsisten, dengan tata letak statis. | Bentuk terstruktur seperti kuesioner atau aplikasi. | Model templat kustom |
Dokumen terstruktur, semi terstruktur, dan tidak terstruktur. | ● Survei → terstruktur● Faktur → semi terstruktur● Huruf → yang tidak terstruktur |
Model neural kustom |
Kumpulan beberapa model yang masing-masing dilatih pada dokumen jenis serupa. | ● Pesanan pembelian pasokan● Pesanan pembelian peralatan● Pesanan pembelian furnitur Semua terdiri dalam satu model. |
Model kustom yang terdiri |
Model klasifikasi kustom
Set pelatihan | Contoh dokumen | Solusi terbaik Anda |
---|---|---|
Setidaknya dua jenis dokumen yang berbeda. | Formulir, huruf, atau dokumen | Model klasifikasi kustom |
Langkah berikutnya
- Pelajari cara memproses formulir dan dokumen Anda sendiri dengan Studio Kecerdasan Dokumen
Saran dan Komentar
https://aka.ms/ContentUserFeedback.
Segera hadir: Sepanjang tahun 2024 kami akan menghentikan penggunaan GitHub Issues sebagai mekanisme umpan balik untuk konten dan menggantinya dengan sistem umpan balik baru. Untuk mengetahui informasi selengkapnya, lihat:Kirim dan lihat umpan balik untuk