Memahami tampilan bawaan

Selesai

Model bawaan di Azure AI Document Intelligence memungkinkan Anda mengekstrak data dari formulir dan dokumen umum tanpa melatih model Anda sendiri.

Di perusahaan polling Anda, formulir polling unik untuk setiap proyek survei, tetapi Anda juga menggunakan faktur dan tanda terima untuk mencatat transaksi keuangan dan Anda memiliki banyak dokumen yang tidak terstruktur. Anda ingin tahu berapa banyak pekerjaan yang diperlukan untuk mengekstrak nama, alamat, jumlah, dan informasi lainnya dari dokumen-dokumen ini.

Di sini, Anda akan mempelajari bagaimana model bawaan dapat membantu Anda menganalisis jenis dokumen umum.

Apa yang dimaksud dengan model bawaan?

Pendekatan umum yang digunakan dalam solusi AI adalah menyediakan sejumlah besar data sampel dan kemudian melatih model yang dioptimalkan dengan mencoba berbagai fitur data, parameter, dan perawatan statistik. Kombinasi yang paling baik memprediksi nilai yang Anda minati merupakan model terlatih dan Anda dapat menggunakannya untuk memprediksi nilai dari data baru.

Banyak bentuk yang digunakan bisnis dari hari ke hari adalah dari beberapa jenis umum. Misalnya, sebagian besar bisnis mengeluarkan atau menerima faktur dan tanda terima. Setiap bisnis yang memiliki karyawan di Amerika Serikat harus menggunakan formulir deklarasi pajak W-2. Anda juga sering memiliki dokumen yang lebih umum yang mungkin ingin Anda ekstrak datanya. Untuk kasus ini, Microsoft telah membantu dengan menyediakan model bawaan. Model bawaan sudah dilatih pada sejumlah besar jenis formulir targetnya.

Jika Anda ingin menggunakan Kecerdasan Dokumen untuk mengekstrak data dari salah satu formulir atau dokumen umum ini, Anda dapat memilih untuk menggunakan model bawaan dan Anda tidak perlu melatih sendiri. Karena Microsoft telah melatih model-model ini pada korpus besar contoh, Anda dapat mengharapkannya untuk memberikan hasil yang akurat dan andal saat berhadapan dengan formulir yang dimaksudkan.

Beberapa model bawaan dilatih pada jenis formulir tertentu:

  • Model faktur. Mengekstrak bidang umum dan nilainya dari faktur.
  • Model tanda terima. Mengekstrak bidang umum dan nilainya dari tanda terima.
  • Model Pajak AS. Model pajak AS terpadu yang dapat mengekstrak dari formulir seperti W-2, 1098, 1099, dan 1040.
  • Model dokumen identitas. Mengekstrak bidang umum dan nilainya dari SIM AS, ID Uni Eropa dan SIM, dan paspor internasional.
  • Model kartu nama. Mengekstrak bidang umum dan nilainya dari kartu nama.
  • Model kartu asuransi kesehatan. Mengekstrak bidang umum dan nilainya dari kartu asuransi kesehatan.
  • Surat nikah. Mengekstrak informasi dari sertifikat pernikahan.
  • Model kartu Kredit/Debit. Mengekstrak informasi umum dari kartu bank.
  • Dokumen hipotret. Mengekstrak informasi dari pengungkapan penutupan KPR, Aplikasi Pinjaman Residensial Seragam (Formulir 1003), Appraisal (Formulir 1004), Validasi Ketenagakerjaan (Formulir 1005), dan Ringkasan Underwriting dan Transmittal Seragam (Formulir 1008).
  • Model laporan bank. Mengekstrak informasi akun termasuk saldo awal dan akhir, detail transaksi dari laporan bank.
  • Model Stub Bayar. Mengekstrak upah, jam, pengurangan, pembayaran bersih, dan bidang stub bayar umum lainnya.
  • Periksa model. Mengekstrak penerima pembayaran, jumlah, tanggal, dan informasi relevan lainnya dari pemeriksaan.

Model lain dirancang untuk mengekstrak nilai dari dokumen dengan struktur yang kurang spesifik:

  • Model baca. Mengekstrak teks dan bahasa dari dokumen.
  • Model dokumen umum. Ekstrak teks, kunci, nilai, entitas, dan tanda pilihan dari dokumen.
  • Model tata letak. Mengekstrak informasi teks dan struktur dari dokumen.

Fitur model bawaan

Model bawaan dirancang untuk mengekstrak berbagai jenis data dari dokumen dan formulir yang dikirimkan pengguna. Untuk memilih model yang tepat untuk kebutuhan Anda, Anda harus memahami fitur-fitur ini:

  • Ekstraksi teks. Semua model bawaan mengekstrak baris teks dan kata-kata dari teks tulisan tangan dan cetak.
  • Pasangan kunci-nilai. Rentang teks dalam dokumen yang mengidentifikasi label atau kunci dan respons atau nilainya diekstrak oleh banyak model sebagai pasangan kunci-nilai. Misalnya, kunci khas mungkin Berat dan nilainya mungkin 31 kg.
  • Entitas. Teks yang mencakup struktur data umum yang lebih kompleks dapat diekstrak sebagai entitas. Jenis entitas mencakup orang, lokasi, dan tanggal.
  • Tanda pilihan. Rentang teks yang menunjukkan pilihan dapat diekstrak oleh beberapa model sebagai tanda pilihan. Tanda-tanda ini termasuk tombol radio dan kotak centang.
  • Tabel. Banyak model dapat mengekstrak tabel dalam bentuk yang dipindai termasuk data yang terkandung dalam sel, jumlah kolom dan baris, dan judul kolom dan baris. Tabel dengan sel gabungan didukung.
  • Bidang. Model yang dilatih untuk jenis formulir tertentu mengidentifikasi nilai set bidang tetap. Misalnya, model Faktur menyertakan bidang CustomerName dan InvoiceTotal.

Pertimbangkan juga bahwa model bawaan dirancang untuk dan dilatih pada jenis dokumen dan formulir generik. Jika Anda memiliki jenis formulir khusus industri atau unik yang sering Anda gunakan, Anda mungkin dapat memperoleh hasil yang lebih andal dan dapat diprediksi dengan menggunakan model kustom. Namun, model kustom membutuhkan waktu untuk dikembangkan karena Anda harus menginvestasikan waktu dan sumber daya untuk melatihnya pada formulir contoh sebelum Anda dapat menggunakannya. Semakin besar jumlah formulir contoh yang Anda berikan untuk pelatihan, semakin baik model akan berada pada konten formulir prediksi secara akurat.

Persyaratan input

Model bawaan sangat fleksibel tetapi Anda dapat membantu mereka mengembalikan hasil yang akurat dan bermanfaat dengan mengirimkan satu foto yang jelas atau pemindaian berkualitas tinggi untuk setiap dokumen.

Anda juga harus mematuhi persyaratan ini saat mengirimkan formulir untuk analisis:

  • File harus dalam format JPEG, PNG, BMP, TIFF, atau PDF. Selain itu, model Baca dapat menerima file Microsoft Office.
  • File harus lebih kecil dari 500 MB untuk tingkat standar, dan 4 MB untuk tingkat gratis.
  • Gambar harus memiliki dimensi antara 50 x 50 piksel dan 10.000 x 10.000 piksel.
  • Dokumen PDF harus memiliki dimensi kurang dari 17 x 17 inci atau ukuran kertas A3.
  • Dokumen PDF tidak boleh dilindungi dengan kata sandi.

Catatan

Jika bisa, kirimkan file PDF yang disematkan teks karena menghilangkan kesalahan dalam pengenalan karakter.

File PDF dan TIFF dapat memiliki sejumlah halaman tetapi, di tingkat standar, hanya 2000 halaman pertama yang dianalisis. Di tingkat gratis, hanya dua halaman pertama yang dianalisis.

Mencoba model bawaan dengan Azure AI Document Intelligence Studio

Azure AI Document Intelligence dirancang sebagai layanan web yang dapat Anda panggil menggunakan kode di aplikasi kustom Anda. Namun, seringkali membantu untuk menjelajahi model dan bagaimana perilakunya dengan formulir Anda secara visual. Anda dapat melakukan eksperimen tersebut dengan menggunakan Azure AI Document Intelligence Studio dan menggunakan pengalaman untuk membantu merancang dan menulis kode Anda.

Anda dapat memilih salah satu model bawaan di Azure AI Document Intelligence Studio. Microsoft menyediakan beberapa dokumen sampel untuk digunakan dengan setiap model atau Anda dapat menambahkan dokumen Anda sendiri dan menganalisisnya.

Cuplikan layar memperlihatkan cara menggunakan Azure AI Document Intelligence Studio untuk menjelajahi model bawaan kartu nama.

Memanggil model bawaan dengan menggunakan API

Karena Azure AI Document Intelligence mengimplementasikan layanan web RESTful, Anda dapat menggunakan panggilan layanan web dari bahasa apa pun yang mendukungnya. Namun, saat Anda menggunakan API Kecerdasan Dokumen Azure AI Microsoft, manajemen keamanan dan sesi disederhanakan dan Anda harus menulis lebih sedikit kode.

API tersedia untuk:

  • C# dan bahasa .NET lainnya.
  • Java.
  • Python.
  • JavaScript.

Setiap kali Anda ingin memanggil Azure AI Document Intelligence, Anda harus mulai dengan menyambungkan dan mengautentikasi dengan layanan di langganan Azure Anda. Untuk membuat koneksi tersebut, Anda memerlukan:

  • Titik akhir layanan. Nilai ini adalah URL tempat layanan diterbitkan.
  • Kunci API. Nilai ini adalah kunci unik yang memberikan akses.

Anda dapat memperoleh nilai-nilai ini dari portal Azure.

Karena layanan dapat memakan waktu beberapa detik untuk merespons, yang terbaik adalah menggunakan panggilan asinkron untuk mengirimkan formulir dan kemudian mendapatkan hasil dari analisis:

AnalyzeDocumentOperation operation = await client.AnalyzeDocumentFromUriAsync(WaitUntil.Completed, "prebuilt-layout", fileUri);

AnalyzeResult result = operation.Value;
poller = document_analysis_client.begin_analyze_document(
        "prebuilt-layout", AnalyzeDocumentRequest(url_source=docUrl
    ))
result: AnalyzeResult = poller.result()

Detail yang dapat Anda ekstrak dari hasil ini bergantung pada model yang Anda gunakan.

Pelajari lebih lanjut