Model kontrak Kecerdasan Dokumen

Penting

  • Rilis pratinjau publik Kecerdasan Dokumen menyediakan akses awal ke fitur yang sedang dalam pengembangan aktif.
  • Fitur, pendekatan, dan proses dapat berubah, sebelum Ketersediaan Umum (GA), berdasarkan umpan balik pengguna.
  • Versi pratinjau publik pustaka klien Kecerdasan Dokumen default ke REST API versi 2024-02-29-preview.
  • Pratinjau publik versi 2024-02-29-preview saat ini hanya tersedia di wilayah Azure berikut:
  • US Timur
  • US Barat2
  • Eropa Barat

Konten ini berlaku untuk:tanda centangv4.0 (pratinjau) | Versi sebelumnya:tanda centang biruv3.1 (GA)

Konten ini berlaku untuk:tanda centangv3.1 (GA) | Versi terbaru:tanda centang unguv4.0 (pratinjau)

Model kontrak Kecerdasan Dokumen menggunakan kemampuan Pengenalan Karakter Optik (OCR) yang kuat untuk menganalisis dan mengekstrak bidang kunci dan item baris dari sekelompok entitas kontrak penting tertentu. Kontrak dapat memiliki berbagai format dan kualitas termasuk gambar yang diambil telepon, dokumen yang dipindai, dan PDF digital. API menganalisis teks dokumen; mengekstrak informasi utama seperti Pihak, Yurisdiksi, ID Kontrak, dan Judul; dan mengembalikan representasi data JSON terstruktur. Model saat ini mendukung format dokumen berbahasa Inggris.

Pemrosesan kontrak otomatis

Pemrosesan kontrak otomatis adalah proses mengekstrak bidang kontrak kunci dari dokumen. Secara historis, proses analisis kontrak dicapai secara manual dan, karenanya, sangat memakan waktu. Ekstraksi data kunci yang akurat dari kontrak biasanya merupakan langkah pertama dan salah satu langkah paling penting dalam proses otomatisasi kontrak.

Opsi pengembangan

Kecerdasan Dokumen v4.0 (pratinjau 2024-02-29) mendukung alat, aplikasi, dan pustaka berikut:

Fitur Sumber ID Model
Model kontrak Document Intelligence Studio
REST API
C# SDK
Python SDK
Java SDK
JavaScript SDK
kontrak bawaan

Kecerdasan Dokumen v3.1 mendukung alat, aplikasi, dan pustaka berikut:

Fitur Sumber ID Model
Model kontrak Document Intelligence Studio
REST API
C# SDK
Python SDK
Java SDK
JavaScript SDK
kontrak bawaan

Kecerdasan Dokumen v3.0 mendukung alat, aplikasi, dan pustaka berikut:

Fitur Sumber ID Model
Model kontrak Document Intelligence Studio
REST API
C# SDK
Python SDK
Java SDK
JavaScript SDK
kontrak bawaan

Persyaratan input

  • Untuk hasil terbaik, berikan satu foto yang jelas atau pemindaian berkualitas tinggi per dokumen.

  • Format file yang didukung:

    Model PDF Gambar:
    JPEG/JPG, PNG, BMP, TIFF, HEIF
    Microsoft Office:
    Word (DOCX), Excel (XLSX), PowerPoint (PPTX), dan HTML
    Read
    Tata letak ✔ (2024-02-29-preview, 2023-10-31-preview)
    Dokumen Umum
    Bawaan
    Ekstraksi kustom
    Klasifikasi kustom ✔ (Pratinjau 2024-02-29)
  • Untuk PDF dan TIFF, hingga 2000 halaman yang dapat diproses (dengan langganan tingkat gratis, hanya dua halaman pertama yang diproses).

  • Ukuran file untuk menganalisis dokumen adalah 500 MB untuk tingkat berbayar (S0) dan 4 MB secara gratis (F0).

  • Dimensi gambar harus antara 50 x 50 piksel dan 10.000 piksel x 10.000 piksel.

  • Jika PDF Anda dikunci dengan kata sandi, Anda harus menghapus kunci sebelum pengiriman.

  • Tinggi minimum teks yang akan diekstrak adalah 12 piksel untuk gambar piksel 1024 x 768. Dimensi ini sesuai dengan teks sekitar 8-point pada 150 titik per inci (DPI).

  • Untuk pelatihan model kustom, jumlah maksimum halaman untuk data pelatihan adalah 500 untuk model template kustom dan 50.000 untuk model neural kustom.

    • Untuk pelatihan model ekstraksi kustom, ukuran total data pelatihan adalah 50 MB untuk model templat dan 1G-MB untuk model neural.

    • Untuk pelatihan model klasifikasi kustom, ukuran total data pelatihan adalah 1GB dengan maksimum 10.000 halaman.

Coba ekstraksi data dokumen kontrak

Lihat bagaimana data, termasuk informasi pelanggan, detail vendor, dan item baris, diekstrak dari kontrak. Anda membutuhkan sumber daya berikut:

  • Langganan Azure—Anda dapat membuatnya secara gratis.

  • Instans Kecerdasan Dokumen di portal Azure. Anda dapat menggunakan tingkat harga gratis (F0) untuk mencoba layanan. Setelah sumber daya Anda disebarkan, pilih Buka sumber daya untuk mendapatkan kunci dan titik akhir Anda.

Cuplikan layar di titik akhir di portal Azure.

Studio Kecerdasan Dokumen

  1. Pada beranda Studio Kecerdasan Dokumen, pilih Dokumen Pajak.

  2. Anda dapat menganalisis sampel dokumen pajak atau mengunggah file Anda sendiri.

  3. Pilih tombol Jalankan analisis dan, jika perlu, konfigurasikan opsi Analisis:

    Cuplikan layar tombol Jalankan analisis dan Analisis opsi di Studio Kecerdasan Dokumen.

Bahasa dan lokal yang didukung

Lihat halaman Dukungan Bahasa— model bawaan untuk daftar lengkap bahasa yang didukung.

Ekstraksi lapangan

Berikut ini adalah bidang yang diekstrak dari kontrak dalam respons output JSON.

Nama Tipe Deskripsi Contoh output
Judul String Judul kontrak Perjanjian layanan
ContractId String Judul kontrak AB12956
Pihak Array Daftar pihak hukum
ExecutionDate Tanggal Tanggal ketika perjanjian ditandatangani sepenuhnya dan disepakati oleh semua pihak On this twenty-third day of February two thousand and twenty two
ExpirationDate Tanggal Tanggal ketika kontrak berakhir berlaku Satu tahun
RenewalDate Tanggal Tanggal ketika kontrak perlu diperpanjang On this twenty-third day of February two thousand and twenty two
Yurisdiksi Array Daftar yurisdiksi

Pasangan kunci-nilai kontrak dan item baris yang diekstrak berada di bagian documentResults output JSON.

Langkah berikutnya

  • Coba pemrosesan formulir dan dokumen Anda sendiri dengan Studio Kecerdasan Dokumen.

  • Selesaikan mulai cepat Kecerdasan Dokumen dan mulai membuat aplikasi pemrosesan dokumen dalam bahasa pengembangan pilihan Anda.