Bagikan melalui


Model dokumen umum Kecerdasan Dokumen

Penting

Dimulai dengan pratinjau Kecerdasan Dokumen versi 2024-02-29, pratinjau 2023-10-31 dan ke depannya, model dokumen umum (dokumen bawaan) tidak digunakan lagi. Untuk mengekstrak pasangan kunci-nilai, tanda pilihan, teks, tabel, dan struktur dari dokumen, gunakan model berikut:

Fitur version ID Model
Layout model dengan parameter features=keyValuePairs string kueri opsional diaktifkan. • v4:2024-02-29-preview
• v3.1:2023-07-31 (GA)
prebuilt-layout
Model dokumen umum • v3.1:2023-07-31 (GA)
• v3.0:2022-08-31 (GA)
• v2.1 (GA)
prebuilt-document

Konten ini berlaku untuk: tanda centang v3.1 (GA) | Versi terbaru: tanda centang ungu v4.0 (pratinjau) | Versi sebelumnya: tanda centang biru v3.0

Konten ini berlaku untuk: tanda centang v3.0 (GA) | Versi terbaru: tanda centang ungu v4.0 (pratinjau)tanda centang ungu v3.1

Model dokumen Umum menggabungkan kemampuan Pengenalan Karakter Optik (OCR) yang kuat dengan model pembelajaran mendalam untuk mengekstrak pasangan kunci-nilai, tabel, dan tanda pilihan dari dokumen. Dokumen umum tersedia dengan API v3.1 dan v3.0. Untuk informasi selengkapnya, lihat panduan migrasi kami.

Fitur dokumen umum

  • Model dokumen umum adalah model yang telah dilatih sebelumnya; tidak memerlukan label atau pelatihan.

  • API tunggal mengekstrak pasangan kunci-nilai, tanda pilihan, entitas, teks, tabel, dan struktur dari dokumen.

  • Model dokumen umum mendukung dokumen terstruktur, semi terstruktur, dan tidak terstruktur.

  • Tanda pilihan diidentifikasi sebagai bidang dengan nilai :selected: atau :unselected:.

Contoh dokumen yang diproses di Studio Kecerdasan Dokumen

Cuplikan layar analisis dokumen umum di Studio Kecerdasan Dokumen.

Ekstraksi pasangan nilai kunci

API dokumen umum mendukung sebagian besar jenis formulir dan menganalisis dokumen Anda dan mengekstrak kunci dan nilai terkait. Model ini sangat ideal untuk mengekstrak pasangan kunci-nilai umum dari dokumen. Anda dapat menggunakan model dokumen umum sebagai alternatif untuk melatih model kustom tanpa label.

Opsi pengembangan

Kecerdasan Dokumen v3.1 mendukung alat, aplikasi, dan pustaka berikut:

Fitur Sumber ID Model
Model dokumen umum Document Intelligence Studio
REST API
C# SDK
Python SDK
Java SDK
JavaScript SDK
dokumen bawaan

Kecerdasan Dokumen v3.0 mendukung alat, aplikasi, dan pustaka berikut:

Fitur Sumber ID Model
Model dokumen umum Document Intelligence Studio
REST API
C# SDK
Python SDK
Java SDK
JavaScript SDK
dokumen bawaan

Persyaratan input

  • Format file yang didukung:

    Model PDF Gambar:
    JPEG/JPG, , BMPPNG, TIFF, ,HEIF
    Microsoft Office:
    Word (DOCX), Excel (XLSX), PowerPoint (PPTX), HTML
    Read
    Tata letak ✔ (2024-07-31-preview, 2024-02-29-preview, 2023-10-31-preview)
    Dokumen Umum
    Bawaan
    Ekstraksi kustom
    Klasifikasi kustom ✔ (2024-07-31-preview, 2024-02-29-preview)
  • Untuk hasil terbaik, berikan satu foto yang jelas atau pemindaian berkualitas tinggi per dokumen.

  • Untuk PDF dan TIFF, hingga 2.000 halaman dapat diproses (dengan langganan tingkat gratis, hanya dua halaman pertama yang diproses).

  • Ukuran file untuk menganalisis dokumen adalah 500 MB untuk tingkat berbayar (S0) dan 4 MB secara gratis (F0).

  • Dimensi gambar harus antara 50 piksel x 50 piksel dan 10.000 piksel x 10.000 piksel.

  • Jika PDF Anda dikunci dengan kata sandi, Anda harus menghapus kunci sebelum pengiriman.

  • Tinggi minimum teks yang akan diekstrak adalah 12 piksel untuk gambar piksel 1024 x 768. Dimensi ini sesuai dengan tentang 8 teks titik pada 150 titik per inci (DPI).

  • Untuk pelatihan model kustom, jumlah maksimum halaman untuk data pelatihan adalah 500 untuk model template kustom dan 50.000 untuk model neural kustom.

    • Untuk pelatihan model ekstraksi kustom, ukuran total data pelatihan adalah 50 MB untuk model templat dan 1 GB untuk model neural.

    • Untuk pelatihan model klasifikasi kustom, ukuran total data pelatihan adalah 1 GB dengan maksimum 10.000 halaman. Untuk pratinjau 2024-07-31 dan yang lebih baru, ukuran total data pelatihan adalah 2 GB dengan maksimum 10.000 halaman.

Ekstraksi data model dokumen umum

Coba ekstrak data dari formulir dan dokumen menggunakan Studio Kecerdasan Dokumen.

Anda membutuhkan sumber daya berikut:

  • Langganan Azure—Anda dapat membuatnya secara gratis.

  • Instans Kecerdasan Dokumen di portal Azure. Anda dapat menggunakan tingkat harga gratis (F0) untuk mencoba layanan. Setelah sumber daya Anda disebarkan, pilih Buka sumber daya untuk mendapatkan kunci dan titik akhir Anda.

Cuplikan layar di titik akhir di portal Azure.

Catatan

Document Intelligence Studio dan model dokumen umum tersedia dengan API v3.0.

  1. Pada beranda Studio Kecerdasan Dokumen, pilih Dokumen umum.

  2. Anda dapat menganalisis contoh dokumen atau mengunggah file Anda sendiri.

  3. Pilih tombol Jalankan analisis dan, jika perlu, konfigurasikan opsi Analisis:

    Cuplikan layar tombol Jalankan analisis dan Analisis opsi di Studio Kecerdasan Dokumen.

    Coba Studio Kecerdasan Dokumen.

Pasangan kunci-nilai

Pasangan kunci-nilai adalah rentang tertentu dalam dokumen yang mengidentifikasi label atau kunci dan respons atau nilai terkaitnya. Dalam bentuk terstruktur, pasangan ini dapat menjadi label dan nilai yang dimasukkan pengguna untuk bidang tersebut. Dalam dokumen tidak terstruktur, pasangan ini dapat menjadi tanggal kontrak dieksekusi berdasarkan teks dalam paragraf. Model AI dilatih untuk mengekstrak kunci dan nilai yang dapat diidentifikasi berdasarkan berbagai jenis, format, dan struktur dokumen.

Kunci juga dapat ada dalam isolasi ketika model mendeteksi bahwa ada kunci, tanpa nilai terkait atau saat memproses bidang opsional. Misalnya, bidang nama tengah dapat dibiarkan kosong pada formulir dalam beberapa instans. Pasangan kunci-nilai adalah rentang teks yang terkandung dalam dokumen. Untuk dokumen di mana nilai yang sama dijelaskan dengan cara yang berbeda, misalnya, pelanggan/pengguna, kunci terkait adalah pelanggan atau pengguna (berdasarkan konteks).

Ekstraksi data

Model Ekstraksi teks Pasangan Kunci-Nilai Tanda Pilihan Tabel Nama Umum
Dokumen umum ✓*

✓* - Hanya tersedia di 2023-07-31 (GA v3.1) dan versi API yang lebih baru.

Bahasa dan lokal yang didukung

Lihat halaman Dukungan Bahasa—model analisis dokumen untuk daftar lengkap bahasa yang didukung.

Pertimbangan

  • Karena kunci adalah rentang teks yang diekstrak dari dokumen, untuk dokumen semi terstruktur, kunci perlu dipetakan ke kamus kunci yang ada.

  • Diharapkan melihat pasangan kunci nilai dengan kunci, tetapi tidak ada nilai. Misalnya, jika pengguna memilih untuk tidak memberikan alamat email pada formulir.

Langkah berikutnya