Menggunakan model Dokumen, Baca, dan Tata Letak Umum

Selesai

Jika Anda ingin mengekstrak teks, bahasa, dan informasi lain dari dokumen dengan struktur yang tidak dapat diprediksi, Anda dapat menggunakan model baca, dokumen umum, atau tata letak.

Di perusahaan polling Anda, pelanggan dan mitra sering mengirim spesifikasi, tender, pernyataan pekerjaan, dan dokumen lain dengan struktur yang tidak dapat diprediksi. Anda ingin tahu apakah Kecerdasan Dokumen Azure AI dapat menganalisis dan mengekstrak nilai dari dokumen-dokumen ini.

Di sini, Anda akan mempelajari tentang model bawaan yang disediakan Microsoft untuk dokumen umum.

Menggunakan model baca

Model baca Kecerdasan Dokumen Azure AI mengekstrak teks cetak dan tulisan tangan dari dokumen dan gambar. Ini digunakan untuk menyediakan ekstraksi teks di semua model bawaan lainnya.

Model baca juga dapat mendeteksi bahasa tempat baris teks ditulis dan mengklasifikasikan apakah itu teks tulisan tangan atau cetak.

Catatan

Model baca mendukung lebih banyak bahasa untuk teks cetak daripada teks tulisan tangan. Periksa dokumentasi untuk melihat daftar bahasa yang didukung saat ini.

Untuk file PDF atau TIFF multi-halaman, Anda dapat menggunakan parameter pages dalam permintaan Anda untuk memperbaiki rentang halaman untuk analisis.

Model baca sangat ideal jika Anda ingin mengekstrak kata dan baris dari dokumen tanpa struktur tetap atau dapat diprediksi.

Menggunakan model dokumen umum

Model dokumen umum memperluas fungsionalitas model baca dengan menambahkan deteksi pasangan kunci-nilai, entitas, tanda pilihan, dan tabel. Model dapat mengekstrak nilai-nilai ini dari dokumen terstruktur, semi terstruktur, dan tidak terstruktur.

Model dokumen umum adalah satu-satunya model bawaan untuk mendukung ekstraksi entitas. Ini dapat mengenali entitas seperti orang, organisasi, dan tanggal dan berjalan terhadap seluruh dokumen, bukan hanya pasangan kunci-nilai. Pendekatan ini memastikan bahwa, ketika kompleksitas struktural telah mencegah model mengekstrak pasangan kunci-nilai, entitas dapat diekstraksi sebagai gantinya. Namun, ingatlah bahwa terkadang satu teks mungkin mengembalikan pasangan kunci-nilai dan entitas.

Jenis entitas yang dapat Anda deteksi meliputi:

  • Person. Nama seseorang.
  • PersonType. Jabatan atau peran pekerjaan.
  • Location. Bangunan, fitur geografis, entitas geopolitik.
  • Organization. Perusahaan, badan pemerintah, klub olahraga, band musik, dan grup lainnya.
  • Event. Pertemuan sosial, peristiwa bersejarah, hari jadi.
  • Product. Benda yang dibeli dan dijual.
  • Skill. Kemampuan milik seseorang.
  • Address. Alamat surat untuk lokasi fisik.
  • Phone number. Kode dan nomor panggilan untuk ponsel dan telepon rumah.
  • Email. Alamat email.
  • URL. Alamat halaman web.
  • IP Address. Alamat jaringan untuk perangkat keras komputer.
  • DateTime. Tanggal dan waktu kalender dalam sehari.
  • Quantity. Pengukuran numerik dengan unitnya.

Menggunakan model tata letak

Selain mengekstrak teks, model tata letak mengembalikan tanda pilihan dan tabel dari gambar input atau file PDF. Ini adalah model yang baik untuk digunakan ketika Anda membutuhkan informasi kaya tentang struktur dokumen.

Saat Anda mendigitalkan dokumen, dokumen bisa berada pada sudut ganjil. Tabel dapat memiliki struktur yang rumit dengan atau tanpa header, sel yang mencakup kolom atau baris, dan kolom atau baris yang tidak lengkap. Model tata letak dapat menangani semua kesulitan ini untuk mengekstrak struktur dokumen lengkap.

Misalnya, setiap sel tabel diekstrak dengan:

  • Teks kontennya.
  • Ukuran dan posisi kotak pembatasnya.
  • Jika itu adalah bagian dari kolom header.
  • Indeks untuk menunjukkan posisi baris dan kolomnya dalam tabel.

Tanda pilihan diekstrak dengan kotak pembatasnya, indikator keyakinan, dan apakah tanda tersebut dipilih atau tidak.

Pelajari lebih lanjut