Apa itu Kecerdasan Dokumen Azure?

Selesai

Azure Document Intelligence adalah salah satu dari banyak Foundry Tools, layanan kecerdasan buatan (AI) berbasis cloud dengan REST API dan SDK pustaka klien yang dapat digunakan untuk membangun kecerdasan ke dalam aplikasi Anda.

Kecerdasan Dokumen Azure menggunakan kemampuan Pengenalan Karakter Optik (OCR) dan model pembelajaran mendalam untuk mengekstrak teks, pasangan nilai kunci, tanda pilihan, dan tabel dari dokumen.

Cuplikan layar cara kerja OCR.

OCR mengambil struktur dokumen dengan membuat kotak pembatas di sekitar objek yang terdeteksi dalam gambar. Lokasi kotak pembatas dicatat sebagai koordinat sehubungan dengan halaman lainnya. Layanan Azure Document Intelligence mengembalikan data kotak pembatas dan informasi lain dalam bentuk terstruktur dengan hubungan dari file asli.

Cuplikan layar sampel output JSON.

Untuk membangun model akurasi tinggi dari awal, orang perlu membangun model pembelajaran mendalam, menggunakan sejumlah besar sumber daya komputasi, dan menghadapi waktu pelatihan model yang panjang. Faktor-faktor ini dapat membuat proyek tidak layak. Azure Document Intelligence menyediakan model yang mendasar yang telah dilatih pada ribuan contoh formulir. Model yang mendasar memungkinkan Anda melakukan ekstraksi data akurasi tinggi dari formulir Anda dengan sedikit atau tanpa pelatihan model.

Komponen layanan Azure Document Intelligence

Azure Document Intelligence terdiri dari layanan berikut:

  • Model analisis dokumen: yang mengambil input file JPEG, PNG, PDF, dan TIFF dan mengembalikan file JSON dengan lokasi teks dalam kotak pembatas, konten teks, tabel, tanda pilihan (juga dikenal sebagai kotak centang atau tombol radio), dan struktur dokumen.

  • Model bawaan: yang mendeteksi dan mengekstrak informasi dari gambar dokumen dan mengembalikan data yang diekstrak dalam output JSON terstruktur. Azure Document Intelligence saat ini mendukung model bawaan untuk beberapa formulir, termasuk:

    • Formulir W-2
    • Faktur
    • Tanda Terima
    • Dokumen ID
    • Kartu nama
  • Model kustom: model kustom mengekstrak data dari formulir khusus untuk bisnis Anda. Model kustom dapat dilatih melalui Azure Document Intelligence Studio.

Nota

Beberapa fitur Kecerdasan Dokumen Azure sedang dalam pratinjau, pada saat konten ini ditulis, dan akibatnya, fitur dan detail penggunaan mungkin berubah. Anda harus merujuk ke halaman resmi untuk informasi tanggal up-to.

Mengakses layanan

Anda dapat mengakses layanan Kecerdasan Dokumen Azure dalam beberapa cara. Opsi ini termasuk menggunakan:

  • A REST API
  • SDK pustaka klien
  • Studio Kecerdasan Dokumen Azure
  • Microsoft Foundry

Petunjuk / Saran

Latihan modul ini berfokus pada SDK Python dan .NET. Layanan REST yang mendasar dapat digunakan oleh bahasa apa pun.

Lihat dokumentasi untuk panduan mulai cepat di semua SDK dan REST API yang tersedia.