Apa yang baru dalam Kecerdasan Dokumen Azure AI

Konten ini berlaku untuk:checkmarkv4.0 (pratinjau)checkmarkv3.1 (GA)checkmarkv3.0 (GA)checkmarkv2.1 (GA)

Layanan Kecerdasan Dokumen diperbarui secara berkelanjutan. Tandai halaman ini untuk tetap diperbarui dengan catatan rilis, penyempurnaan fitur, dan dokumentasi terbaru kami.

Penting

Versi API pratinjau dihentikan setelah GA API dirilis. Versi API pratinjau 2023-02-28 dihentikan, jika Anda masih menggunakan API pratinjau atau versi SDK terkait, harap perbarui kode Anda untuk menargetkan API versi terbaru 2023-07-31 (GA).

Februari 2024

REST API pratinjau Dokumen 2024-02-29 sekarang tersedia. API pratinjau ini memperkenalkan kemampuan baru dan yang diperbarui:

  • Pratinjau publik versi 2024-02-29-preview saat ini hanya tersedia di wilayah Azure berikut:

    • US Timur
    • US Barat2
    • Eropa Barat
  • Model tata letak sekarang mendukung deteksi gambar dan analisis struktur dokumen hierarkis (bagian dan subbagian). Kualitas AI urutan baca dan deteksi peran logis juga ditingkatkan.

  • Model ekstraksi kustom

  • Model klasifikasi kustom

    • Model klasifikasi kustom sekarang mendukung pelatihan inkremental untuk skenario di mana Anda perlu memperbarui model pengklasifikasi dengan sampel tambahan atau kelas tambahan. Pelajari selengkapnya tentang pelatihan inkremental.
    • Model klasifikasi kustom menambahkan dukungan untuk jenis dokumen Office (.docx, .pptx, dan .xls). Pelajari selengkapnya tentang dukungan jenis dokumen yang diperluas.
  • Model faktur

    • Dukungan untuk lokal baru:
    Lokal Kode
    Arab Aku akan menemuinya.ar
    Bulgaria Aku akan menemuinya.bg
    Yunani Aku akan menemuinya.el
    Ibrani Aku akan menemuinya.he
    Makedonia Aku akan menemuinya.mk
    Bahasa Rusia (ru) Sirilik Serbia (sr-cyrl)
    Ukraina Aku akan menemuinya.uk
    Thailand Aku akan menemuinya.th
    Turki Aku akan menemuinya.tr
    Vietnam Aku akan menemuinya.vi
    • Dukungan untuk kode mata uang baru:
    Mata Uang Lokal Kode
    BAM Tanda Konversi Bosnia Aku akan menemuinya.ba
    BGN Lev Bulgaria Aku akan menemuinya.bg
    ILS Shekel Baru Israel Aku akan menemuinya.il
    MKD Denar Makedonia Aku akan menemuinya.mk
    RUB Rubel Rusia Aku akan menemuinya.ru
    THB Baht Thailand Aku akan menemuinya.th
    TRY Lira Turki Aku akan menemuinya.tr
    UAH Hryvnia Ukraina Aku akan menemuinya.ua
    VND Dong Vietnam Aku akan menemuinya.vn
    • Item pajak mendukung ekspansi untuk Jerman (de), Spanyol (es), Portugal (pt), Kanada en-CAInggris .
  • Model ID

    • Dukungan lapangan yang diperluas untuk ID Uni Eropa dan SIM.
  • 🆕 Dokumen hipotret

    • Ekstrak informasi dari Aplikasi Pinjaman Residensial Seragam (Formulir 1003).
    • Ekstrak informasi dari Uniform Underwriting and Transmittal Summary atau Form 1008.
    • Ekstrak informasi dari pengungkapan penutupan hipotek.
  • 🆕 Model kartu Kredit/Debit

    • Ekstrak informasi dari kartu bank.
  • 🆕 Surat nikah

    • Bawaan baru untuk mengekstrak informasi dari sertifikat pernikahan.

Desember 2023

Pustaka klien Kecerdasan Dokumen yang menargetkan REST API 2023-10-31-preview sekarang tersedia untuk digunakan!

November 2023

REST API pratinjau Dokumen 2023-10-31 sekarang tersedia. API pratinjau ini memperkenalkan kemampuan baru dan yang diperbarui:

  • Pratinjau publik versi 2023-10-31-preview saat ini hanya tersedia di wilayah Azure berikut:

    • US Timur
    • US Barat2
    • Eropa Barat
  • Model Baca

    • Ekspansi Bahasa untuk Tulisan Tangan: Rusia(ru), Arab(ar), Thai(th).
    • Kepatuhan Cyber Executive Order (EO).
  • Model tata letak

    • Mendukung file kantor dan HTML.
    • Dukungan output markdown.
    • Ekstraksi tabel, urutan baca, dan peningkatan deteksi judul bagian.
    • Dengan Document Intelligence 2023-10-31-preview, model dokumen umum (prebuilt-document) tidak digunakan lagi. Ke depannya, untuk mengekstrak pasangan kunci-nilai dari dokumen, gunakan prebuilt-layout model dengan parameter features=keyValuePairs string kueri opsional diaktifkan.
  • Model tanda terima

    • Sekarang mengekstrak mata uang untuk semua bidang terkait harga.
  • Model Kartu Asuransi Kesehatan

    • Dukungan bidang baru untuk informasi Medicare dan Medicaid.
  • Model Dokumen Pajak AS

    • Model pajak 1099 baru. Mendukung formulir dasar 1099 dan variasi berikut: A, B, C, CAP, DIV, G, H, INT, K, LS, LTC, MISC, NEC, OID, PATR, Q, QA, R, S, SA, SB.
  • Model faktur

    • Dukungan untuk KVK bidang.
    • Dukungan untuk BPAY bidang.
    • Banyak penyempurnaan bidang.
  • Klasifikasi Kustom

    • Dukungan untuk dokumen multi-bahasa.
    • Opsi pemisahan halaman baru: autosplit, selalu pisahkan menurut halaman, tanpa pemisahan.
  • Kemampuan add-on

Catatan

Dengan rilis ketersediaan umum (GA) API 2022-08-31, API pratinjau terkait tidak digunakan lagi. Jika Anda menggunakan pratinjau 2021-09-30, pratinjau 2022-01-30 atau versi API pratinjau 2022-06-30, harap perbarui aplikasi Anda untuk menargetkan versi API 2022-08-31. Ada beberapa perubahan kecil yang terlibat, untuk informasi selengkapnya, lihatpanduan migrasi.

Juli 2023

Catatan

Form Recognizer sekarang menjadi Kecerdasan Dokumen Azure AI!

  • Dokumen, layanan Azure AI mencakup semua yang sebelumnya dikenal sebagai Cognitive Services dan Azure Applied AI Services.
  • Tidak ada perubahan pada harga.
  • Nama Cognitive Services dan Azure Applied AI terus digunakan dalam tagihan Azure, analisis biaya, daftar harga, dan API harga.
  • Tidak ada perubahan yang melanggar pada antarmuka pemrograman aplikasi (API) atau pustaka klien.
  • Beberapa platform masih menunggu pembaruan penggantian nama. Semua penyebutan Form Recognizer atau Kecerdasan Dokumen dalam dokumentasi kami mengacu pada layanan Azure yang sama.

Kecerdasan Dokumen v3.1 (GA)

API Kecerdasan Dokumen versi 3.1 sekarang tersedia secara umum (GA)! Versi API sesuai dengan 2023-07-31. API v3.1 memperkenalkan kemampuan baru dan yang diperbarui:

  • API Kecerdasan Dokumen sekarang lebih modular dan dengan dukungan untuk fitur opsional. Anda sekarang dapat menyesuaikan output untuk secara khusus menyertakan fitur yang Anda butuhkan. Pelajari selengkapnya tentang parameter opsional.
  • API klasifikasi dokumen untuk memisahkan satu file menjadi dokumen individual. Pelajari selengkapnya tentang klasifikasi dokumen.
  • Model kontrak bawaan.
  • Formulir pajak AS bawaan 1098 model.
  • Dukungan untuk jenis file Office dengan API Baca.
  • Pengenalan kode batang dalam dokumen.
  • Kemampuan add-on pengenalan rumus.
  • Kemampuan add-on pengenalan font.
  • Dukungan untuk dokumen resolusi tinggi.
  • Model neural kustom sekarang memerlukan satu sampel berlabel untuk dilatih.
  • Ekspansi bahasa model neural kustom. Latih model neural untuk dokumen dalam 30 bahasa. Lihat dukungan bahasa untuk daftar lengkap bahasa yang didukung.
  • 🆕 Model kartu asuransi kesehatan bawaan.
  • Ekspansi lokal model faktur bawaan.
  • Bahasa model tanda terima bawaan dan perluasan lokal dengan lebih dari 100 bahasa yang didukung.
  • Model ID bawaan sekarang mendukung ID Eropa.

Pembaruan UX Studio Kecerdasan Dokumen

✔️ Opsi Analisis

  • Kecerdasan Dokumen sekarang mendukung kemampuan analisis yang lebih canggih dan Studio memungkinkan satu titik masuk (tombol Analisis opsi) untuk mengonfigurasi kemampuan add-on dengan mudah.

  • Bergantung pada skenario ekstraksi dokumen, konfigurasikan rentang analisis, rentang halaman dokumen, deteksi opsional, dan fitur deteksi premium.

    Animated screenshot showing use of the analyze-options button to configure options in Studio.

    Catatan

    Ekstraksi font tidak divisualisasikan di Document Intelligence Studio. Namun, Anda dapat memeriksa bagian gaya output JSON untuk hasil deteksi font.

✔️ Pelabelan dokumen otomatis dengan model bawaan atau salah satu model Anda sendiri

  • Di halaman pelabelan model ekstraksi kustom, Anda sekarang dapat memberi label otomatis dokumen Anda menggunakan salah satu model atau model bawaan Document Intelligent Service yang sebelumnya Anda latih.

    Animated screenshot showing auto labeling in Studio.

  • Untuk beberapa dokumen, mungkin ada label duplikat setelah menjalankan label otomatis. Pastikan untuk mengubah label sehingga tidak ada label duplikat di halaman pelabelan setelahnya.

    Screenshot showing duplicate label warning after auto labeling.

✔️ Tabel pelabelan otomatis

  • Di halaman pelabelan model ekstraksi kustom, Anda sekarang dapat melabeli tabel dalam dokumen secara otomatis tanpa harus memberi label tabel secara manual.

    Animated screenshot showing auto table labeling in Studio.

✔️ Menambahkan file pengujian langsung ke himpunan data pelatihan Anda

  • Setelah Anda melatih model ekstraksi kustom, gunakan halaman pengujian untuk meningkatkan kualitas model Anda dengan mengunggah dokumen pengujian ke himpunan data pelatihan jika diperlukan.

  • Jika skor keyakinan rendah dikembalikan untuk beberapa label, pastikan mereka diberi label dengan benar. Jika tidak, tambahkan ke himpunan data pelatihan dan relabel untuk meningkatkan kualitas model.

Animated screenshot showing how to add test files to training dataset.

✔️ Memanfaatkan opsi dan filter daftar dokumen dalam proyek kustom

  • Gunakan halaman pelabelan model ekstraksi kustom. Anda sekarang dapat menavigasi melalui dokumen pelatihan Anda dengan mudah dengan memanfaatkan pencarian, filter, dan mengurutkan berdasarkan fitur.

  • Gunakan tampilan kisi untuk mempratinjau dokumen atau menggunakan tampilan daftar untuk menggulir dokumen dengan lebih mudah.

    Screenshot showing document list view options and filters.

✔️ Berbagi proyek

Mei 2023

Memperkenalkan dokumentasi yang di-refresh untuk Build 2023

April 2023

Mengumumkan rilis pratinjau publik pustaka klien Kecerdasan Dokumen terbaru

Maret 2023

Penting

2023-02-28-preview kemampuan saat ini hanya tersedia di wilayah berikut:

  • Eropa Barat
  • West US2
  • AS Timur
  • Model klasifikasi kustom adalah kemampuan baru dalam Kecerdasan Dokumen yang 2023-02-28-preview dimulai dengan API. Coba kemampuan klasifikasi dokumen menggunakan Document Intelligence Studio atau REST API.
  • Kemampuan bidang kueri yang ditambahkan ke model Dokumen Umum, gunakan model Azure OpenAI untuk mengekstrak bidang tertentu dari dokumen. Coba fitur Dokumen umum dengan bidang kueri menggunakan Studio Kecerdasan Dokumen. Bidang kueri saat ini hanya aktif untuk sumber daya di wilayah tersebut East US .
  • Kemampuan add-on:
    • Ekstraksi font sekarang dikenali dengan 2023-02-28-preview API.
    • Ekstraksi rumus sekarang dikenali dengan 2023-02-28-preview API.
    • Ekstraksi resolusi tinggi sekarang dikenali dengan 2023-02-28-preview API.
  • Pembaruan model ekstraksi kustom:
    • Model neural kustom sekarang mendukung bahasa tambahan untuk pelatihan dan analisis. Latih model neural untuk Belanda, Prancis, Jerman, Italia, dan Spanyol.
    • Model templat kustom sekarang memiliki kemampuan deteksi tanda tangan yang ditingkatkan.
  • Pembaruan Studio Kecerdasan Dokumen:
    • Selain dukungan untuk semua fitur baru seperti bidang klasifikasi dan kueri, Studio sekarang mengaktifkan berbagi proyek untuk proyek model kustom.
    • Penambahan model baru dalam pratinjau terjaga: Kartu vaksinasi, Kontrak, Pajak AS 1098, Pajak AS 1098-E, dan Pajak AS 1098-T. Untuk meminta akses ke model pratinjau yang terjaga, lengkapi dan kirimkan formulir permintaan pratinjau privat Kecerdasan Dokumen.
  • Pembaruan model tanda terima:
    • Model tanda terima menambahkan dukungan untuk tanda terima termal.
    • Model tanda terima sekarang menambahkan dukungan bahasa untuk 18 bahasa dan tiga bahasa regional (Inggris, Prancis, Portugis).
    • Model tanda terima sekarang mendukung TaxDetails ekstraksi.
  • Model tata letak sekarang meningkatkan pengenalan tabel.
  • Model baca sekarang menambahkan peningkatan untuk pengenalan karakter satu digit.

Februari 2023

  • Pilih kontainer Kecerdasan Dokumen untuk v3.0 sekarang tersedia untuk digunakan!

  • Saat ini kontainer Read v3.0 dan Layout v3.0 tersedia.

    Untuk informasi selengkapnya, lihatMenginstal dan menjalankan kontainer Kecerdasan Dokumen.


January 2023

  • Model tanda terima bawaan - bahasa tambahan yang didukung. Model tanda terima sekarang mendukung bahasa dan lokal tambahan ini

    • Jepang - Jepang (ja-JP)
    • Bahasa Prancis - Kanada (fr-CA)
    • Belanda - Belanda (nl-NL)
    • Inggris - Uni Emirat Arab (en-AE)
    • Portugis - Brasil (pt-BR)
  • Model faktur bawaan - bahasa tambahan yang didukung. Model faktur sekarang mendukung bahasa dan lokal tambahan ini

    • Inggris - Amerika Serikat (id-ID), Australia (en-AU), Kanada (en-CA), Inggris Raya (en-UK), India (en-IN)
    • Spanyol - Spanyol (es-ES)
    • Prancis - Prancis (fr-FR)
    • Italia - Italia (it-IT)
    • Portugis - Portugal (pt-PT)
    • Belanda - Belanda (nl-NL)
  • Model faktur bawaan - bidang tambahan dikenali. Model faktur sekarang mengenali bidang yang ditambahkan ini

    • Kode mata uang
    • Opsi pembayaran
    • Total diskon
    • Item pajak (khusus en-IN)
  • Model ID bawaan - menambahkan jenis dokumen yang didukung. Model ID sekarang mendukung jenis dokumen yang ditambahkan ini

    • ID Militer AS

Tip

Semua pembaruan Januari 2023 tersedia dengan REST API versi 2022-08-31 (GA).

  • Model tanda terima bawaan—dukungan bahasa tambahan:

    Model tanda terima bawaan menambahkan dukungan untuk bahasa berikut:

    • Inggris - Uni Emirat Arab (en-AE)
    • Belanda - Belanda (nl-NL)
    • Bahasa Prancis - Kanada (fr-CA)
    • Bahasa Jerman - (de-DE)
    • Italia - (it-IT)
    • Jepang - Jepang (ja-JP)
    • Portugis - Brasil (pt-BR)
  • Model faktur bawaan—dukungan bahasa tambahan dan ekstraksi bidang

    Model faktur bawaan menambahkan dukungan untuk bahasa berikut:

    • Inggris - Australia (en-AU), Kanada (en-CA), Inggris Raya (id-id), India (en-IN)
    • Portugis - Brasil (pt-BR)

    Model faktur bawaan sekarang menambahkan dukungan untuk ekstraksi bidang berikut:

    • Kode mata uang
    • Opsi pembayaran
    • Total diskon
    • Item pajak (khusus en-IN)
  • Model dokumen ID bawaan—dukungan jenis dokumen tambahan

    Model dokumen ID bawaan sekarang menambahkan dukungan untuk jenis dokumen berikut:

    • Ekspansi SIM mendukung India, Kanada, Inggris Raya, dan Australia
    • Kartu dan dokumen ID militer AS
    • Kartu dan dokumen ID India (PAN dan Aadhaar)
    • Kartu IDENTITAS dan dokumen Australia (kartu foto, ID Key-pass)
    • Kartu ID dan dokumen Kanada (kartu identifikasi, kartu Maple)
    • Kartu ID dan dokumen Inggris Raya (kartu identitas nasional/regional)

Desember 2022

  • Pembaruan Studio Kecerdasan Dokumen

    Rilis Studio Inteligensi Dokumen Desember menyertakan pembaruan terbaru untuk Document Intelligence Studio. Ada peningkatan signifikan pada pengalaman pengguna, terutama dengan dukungan pelabelan model kustom.

    • Rentang halaman. Studio sekarang mendukung analisis halaman tertentu dari dokumen.

    • Pelabelan model kustom:

      • Jalankan API Tata Letak secara otomatis. Anda dapat memilih untuk menjalankan API Tata Letak untuk semua dokumen secara otomatis di penyimpanan blob Anda selama proses penyiapan untuk model kustom.

      • Pencarian. Studio sekarang menyertakan fungsionalitas pencarian untuk menemukan kata-kata dalam dokumen. Peningkatan ini memungkinkan navigasi yang lebih mudah saat pelabelan.

      • Navigasi. Anda dapat memilih label untuk menargetkan kata berlabel dalam dokumen.

      • Pelabelan tabel otomatis. Setelah Anda memilih ikon tabel dalam dokumen, Anda dapat memilih untuk memberi label otomatis tabel yang diekstrak dalam tampilan pelabelan.

      • Subjenis label dan subjenis tingkat kedua The Studio sekarang mendukung subjenis untuk kolom tabel, baris tabel, dan subjenis tingkat kedua untuk jenis seperti tanggal dan angka.

  • Membangun model neural kustom sekarang didukung di wilayah US Gov Virginia.

  • Pratinjau versi 2022-01-30-preview API dan 2021-09-30-preview akan dihentikan 31 Januari 2023. Perbarui ke 2022-08-31 versi API untuk menghindari gangguan layanan apa pun.


November 2022

  • Mengumumkan rilis stabil terbaru pustaka Kecerdasan Dokumen Azure AI
    • Rilis ini mencakup perubahan dan pembaruan penting untuk pustaka klien .NET, Java, JavaScript, dan Python. Untuk informasi selengkapnya, lihatAzure SDK DevBlog.
    • Peningkatan yang paling signifikan adalah pengenalan dua klien baru, DocumentAnalysisClient dan DocumentModelAdministrationClient.

Oktober 2022

  • Konten versi Kecerdasan Dokumen

    • Dokumentasi Kecerdasan Dokumen diperbarui untuk menyajikan pengalaman versi. Sekarang, Anda dapat memilih untuk melihat konten yang menargetkan v3.0 GA pengalaman atau v2.1 GA pengalaman. Pengalaman v3.0 adalah default.

      Screenshot of the Document Intelligence landing page denoting the version dropdown menu.

  • Kode Sampel Studio Kecerdasan Dokumen

    • Kode sampel untuk pengalaman pelabelan Studio Kecerdasan Dokumen sekarang tersedia di GitHub. Pelanggan dapat mengembangkan dan mengintegrasikan Kecerdasan Dokumen ke dalam UX mereka sendiri atau membangun UX baru mereka sendiri menggunakan kode sampel Document Intelligence Studio.
  • Ekspansi bahasa

    • Dengan rilis pratinjau terbaru, model templat Baca (OCR), Tata Letak, dan Kustom Kecerdasan Dokumen mendukung 134 bahasa baru. Penambahan bahasa ini termasuk bahasa Yunani, Latvia, Serbia, Thailand, Ukraina, dan Vietnam, bersama dengan beberapa bahasa Latin, dan Sirilik. Kecerdasan Dokumen sekarang memiliki total 299 bahasa yang didukung di seluruh GA terbaru dan versi pratinjau baru. Lihat halaman bahasa yang didukung untuk melihat semua bahasa yang didukung.
    • Gunakan parameter api-version=2022-06-30-preview REST API saat menggunakan API atau SDK terkait untuk mendukung bahasa baru dalam aplikasi Anda.
  • Model Kontrak Bawaan Baru

    • Bawaan baru yang mengekstrak informasi dari kontrak seperti pihak, judul, ID kontrak, tanggal eksekusi, dan banyak lagi. model kontrak saat ini dalam pratinjau, meminta akses di sini.
  • Ekspansi wilayah untuk melatih model neural kustom

    • Melatih model neural kustom sekarang didukung di wilayah tambahan.
      • AS Timur
      • US Timur2
      • US Gov Arizona

September 2022

Catatan

Dimulai dengan versi 4.0.0, sekumpulan klien baru telah diperkenalkan untuk memanfaatkan fitur terbaru layanan Kecerdasan Dokumen.

Rilis GA SDK versi 4.0.0 mencakup pembaruan berikut:

  • GA Versi 4.0.0 (08-09-2022)
  • Mendukung klien REST API v3.0 dan v2.0

Paket (NuGet)

Riwayat Changelog/Rilis

Panduan migrasi

ReadMe

Sampel

  • Ekspansi wilayah untuk melatih model neural kustom sekarang didukung di enam wilayah baru

    • Australia Timur
    • US Tengah
    • Asia Timur
    • Prancis Tengah
    • UK Selatan
    • West US2
    • Untuk daftar lengkap wilayah tempat pelatihan didukung, lihat model neural kustom.

    • Rilis versi 4.0.0 GA SDK Kecerdasan Dokumen:

      • Pustaka klien Kecerdasan Dokumen versi 4.0.0 (.NET/C#, Java, JavaScript) dan versi 3.2.0 (Python) umumnya tersedia dan siap digunakan dalam aplikasi produksi!.
      • Untuk informasi selengkapnya tentang pustaka klien Kecerdasan Dokumen, lihat gambaran umum SDK.
      • Perbarui aplikasi Anda menggunakan panduan migrasi bahasa pemrograman Anda.

Agustus 2022

Rilis pratinjau Document Intelligence SDK beta Agustus 2022 mencakup pembaruan berikut:

Versi 4.0.0-beta.5 (2022-08-09)

Riwayat Changelog/Rilis

Paket (NuGet)

Dokumentasi referensi SDK

  • Kecerdasan Dokumen v3.0 tersedia secara umum

    • REST API Kecerdasan Dokumen v3.0 sekarang tersedia secara umum dan siap digunakan dalam aplikasi produksi! Perbarui aplikasi Anda dengan REST API versi 2022-08-31.
  • Pembaruan Studio Kecerdasan Dokumen

    • Langkah berikutnya. Di bawah setiap halaman model, kini ada bagian langkah berikutnya di Studio. Pengguna dapat dengan cepat mereferensikan kode sampel, panduan pemecahan masalah, dan informasi harga.
    • Model kustom. Studio kini menyertakan kemampuan untuk menyusun ulang label dalam proyek model kustom guna meningkatkan efisiensi pelabelan.
    • Model Salin Model Kustom dapat disalin di seluruh layanan Kecerdasan Dokumen dari dalam Studio. Fitur ini memungkinkan promosi model terlatih ke lingkungan dan kawasan lain.
    • Hapus dokumen. Studio kini mendukung penghapusan dokumen dari himpunan data berlabel dalam proyek kustom.
  • Pembaruan layanan Kecerdasan Dokumen

    • baca bawaan. Model OCR baca sekarang juga tersedia di Kecerdasan Dokumen dengan paragraf dan deteksi bahasa sebagai dua fitur baru. Pembacaan Kecerdasan Dokumen menargetkan skenario dokumen tingkat lanjut yang selaras dengan kemampuan kecerdasan dokumen yang lebih luas dalam Kecerdasan Dokumen.
    • prebuilt-layout. Model Tata Letak mengekstrak paragraf dan apakah teks yang diekstrak adalah paragraf, judul, judul bagian, catatan kaki, header halaman, catatan kaki halaman, atau nomor halaman.
    • prebuilt-invoice. Bidang TotalVAT dan Line/VAT sekarang diselesaikan ke bidang totalTax dan Line/Tax yang ada masing-masing.
    • prebuilt-idDocument. Dukungan ekstraksi data untuk ID status AS, jaminan sosial, dan kartu hijau. Dukungan untuk informasi visa paspor.
    • prebuilt-receipt. Memperluas dukungan lokal untuk Bahasa Prancis (fr-FR), Spanyol (es-ES), Portugis (pt-PT), Italia (it-IT) dan Jerman (de-DE).
    • prebuilt-businessCard. Dukungan penguraian alamat untuk mengekstrak subbidang untuk komponen alamat seperti alamat, kota, negara bagian, negara/wilayah, dan kode pos.
  • Peningkatan kualitas AI

    • baca bawaan. Dukungan yang ditingkatkan untuk karakter tunggal, tanggal tulisan tangan, jumlah, nama, data kunci lainnya yang umumnya ditemukan dalam tanda terima dan faktur dan pemrosesan dokumen PDF digital yang ditingkatkan.
    • prebuilt-layout. Dukungan untuk deteksi tabel yang dipangkas yang lebih baik, tabel tanpa batas, dan pengenalan sel rentang panjang yang ditingkatkan.
    • prebuilt-document. Meningkatkan kualitas deteksi nilai dan kotak centang.
    • custom-neural. Peningkatan akurasi untuk deteksi dan ekstraksi tabel.

Juni 2022

  • Rilis pratinjau Document Intelligence SDK beta Juni 2022 mencakup pembaruan berikut:

Februari 2022

  • Rilis pratinjau Kecerdasan Dokumen v3.0 memperkenalkan beberapa fitur, kemampuan, dan peningkatan baru:

    • Model neural kustom atau model dokumen kustom adalah model kustom baru untuk mengekstrak teks dan tanda pilihan dari formulir terstruktur, dokumen semi terstruktur dan tidak terstruktur.
    • Model bawaan W-2 adalah model bawaan baru untuk mengekstrak bidang dari formulir W-2 untuk skenario verifikasi pendapatan dan pelaporan pajak.
    • API Baca mengekstrak baris teks yang dicetak, kata, lokasi teks, bahasa yang terdeteksi, dan teks tulisan tangan, jika terdeteksi.
    • Model dokumen umum yang telah dilatih sebelumnya sekarang diperbarui untuk mendukung tanda pilihan selain teks API, tabel, struktur, dan pasangan kunci-nilai dari formulir dan dokumen.
    • API Faktur Model faktur bawaan memperluas dukungan ke faktur Spanyol.
    • Document Intelligence Studio menambahkan demo baru untuk sampel tanda terima Baca, W2, Hotel, dan dukungan untuk melatih model neural kustom baru.
    • Language Expansion Document Intelligence Read, Layout, and Custom Form menambahkan dukungan untuk 42 bahasa baru termasuk bahasa Arab, Hindi, dan bahasa lain menggunakan skrip Arab dan Devanagari untuk memperluas cakupan ke 164 bahasa. Dukungan bahasa tulisan tangan diperluas ke bahasa Jepang dan Korea.
  • Memulai dengan REST API, Python, atau .NET untuk API pratinjau v3.0.

  • Ekstraksi data model Kecerdasan Dokumen:

    Model Ekstraksi teks Pasangan Kunci-Nilai Tanda Pilihan Tabel Tanda tangan
    Read âś“
    Dokumen umum âś“ âś“ âś“ âś“
    Tata letak âś“ âś“ âś“
    Faktur âś“ âś“ âś“ âś“
    Tanda Terima âś“ âś“ âś“
    Dokumen ID âś“ âś“
    Kartu nama âś“ âś“
    Templat kustom âś“ âś“ âś“ âś“ âś“
    Neural kustom âś“ âś“ âś“ âś“
  • Rilis pratinjau beta SDK Kecerdasan Dokumen mencakup pembaruan berikut:


November 2021

  • Pembaruan rilis SDK pratinjau Document Intelligence v3.0 (beta.2) menggabungkan perbaikan bug dan pembaruan fitur minor.

Oktober 2021

  • Rilis pratinjau Kecerdasan Dokumen v3.0 versi 4.0.0-beta.1 (2021-10-07)memperkenalkan beberapa fitur dan kemampuan baru:

    • Model dokumen umum adalah API baru yang menggunakan model yang telah dilatih sebelumnya untuk mengekstrak pasangan teks, tabel, struktur, dan nilai kunci dari formulir dan dokumen.

    • Model Tanda terima hotel ditambahkan ke pemrosesan tanda terima bawaan.

    • Bidang diperluas untuk dokumen ID mendukung pengesahan, pembatasan, dan ekstraksi klasifikasi kendaraan dari lisensi pengemudi AS.

    • Bidang tanda tangan adalah jenis bidang baru dalam formulir kustom untuk mendeteksi keberadaan tanda tangan dalam bidang formulir.

    • Dukungan Ekspansi Bahasa untuk 122 bahasa (cetak) dan 7 bahasa (tulisan tangan). Tata Letak Kecerdasan Dokumen dan Formulir Kustom memperluas bahasa yang didukung ke 122 dengan pratinjau terbarunya. Pratinjau mencakup ekstraksi teks untuk teks cetak dalam 49 bahasa baru termasuk Bahasa Rusia, Bulgaria, dan Bahasa Cyrillic lainnya serta lebih banyak bahasa Latin. Selain itu, ekstraksi teks tulisan tangan sekarang mendukung tujuh bahasa yang mencakup bahasa Inggris, dan pratinjau baru Cina Sederhana, Prancis, Jerman, Italia, Portugis, dan Spanyol.

    • Tabel dan penyempurnaan ekstraksi teks Tata letak sekarang mendukung penggalian tabel baris tunggal yang juga disebut tabel kunci-nilai. Peningkatan ekstraksi teks mencakup pemrosesan PDF digital dan teks Machine Readable Zone (MRZ) yang lebih baik dalam dokumen identitas, bersama dengan performa umum.

    • Document Intelligence Studio Untuk menyederhanakan penggunaan layanan, Anda sekarang dapat mengakses Studio Kecerdasan Dokumen untuk menguji berbagai model atau label bawaan dan melatih model kustom.

    • Memulai dengan REST API, Python, atau .NET untuk API pratinjau v3.0.

  • Ekstraksi data model Kecerdasan Dokumen

    Model Ekstraksi teks Pasangan Kunci-Nilai Tanda Pilihan Tabel
    Dokumen umum âś“ âś“ âś“ âś“
    Tata letak âś“ âś“ âś“
    Faktur âś“ âś“ âś“ âś“
    Tanda Terima âś“ âś“
    Dokumen ID âś“ âś“
    Kartu nama âś“ âś“
    Kustom âś“ âś“ âś“ âś“

September 2021

  • Fitur tingkat lanjut penjelajah metrik Azure tersedia di halaman gambaran umum sumber daya Kecerdasan Dokumen Anda di portal Azure.

  • Menu pemantauan:

    Screenshot showing the monitoring menu in the Azure portal.

  • Grafik:

    Screenshot showing an example metric chart in the Azure portal.

  • Pembaruan model Dokumen ID: nama depan termasuk akhiran, dengan atau tanpa tanda titik (berhenti penuh), proses berhasil:

    Teks Input Hasil dengan pembaruan
    William Isaac Kirby Jr. FirstName: William Isaac

    LastName: Kirby Jr.
    Henry Caleb Ross Sr FirstName: Henry Caleb

    LastName: Ross Sr.

Juli 2021

  • Dukungan identitas terkelola yang ditetapkan sistem: Anda sekarang dapat mengaktifkan identitas terkelola yang ditetapkan sistem untuk memberikan akses terbatas Kecerdasan Dokumen ke akun penyimpanan privat termasuk akun yang dilindungi oleh Virtual Network, firewall, atau bring-your-own-storage (BYOS) diaktifkan. LihatMembuat dan menggunakan identitas terkelola untuk sumber daya Kecerdasan Dokumen Anda untuk mempelajari selengkapnya.

Juni 2021

  • Kontainer Kecerdasan Dokumen v2.1 dirilis dalam pratinjau terjaga dan sekarang didukung oleh enam kontainer fitur—Tata Letak, Kartu Nama, Dokumen ID, Tanda Terima, Faktur, dan Kustom. Untuk menggunakannya, Anda harus mengirimkan permintaan online, dan menerima persetujuan.

  • Konektor Kecerdasan Dokumen dirilis dalam pratinjau: Konektor Kecerdasan Dokumen terintegrasi dengan Azure Logic Apps, Microsoft Power Automate, dan Microsoft Power Apps. Konektor mendukung tindakan dan pemicu alur kerja untuk mengekstrak dan menganalisis data dan struktur dokumen dari formulir kustom dan bawaan, faktur, tanda terima, kartu nama, dan dokumen ID.

  • SDK Kecerdasan Dokumen v3.1.0 di-patch ke v3.1.1 untuk C#, Java, dan Python. Patch menyelesaikan faktur yang tidak memiliki bidang item sub-baris yang terdeteksi seperti FormField dengan Text tetapi tanpa informasi BoundingBox atau Page.


Mei 2021

  • Versi 3.1.0 (2021-05-26)

Dokumentasi | Changelog/Release History| Reference paket NuGet versi 3.0.1 |

  • Kecerdasan Dokumen 2.1 tersedia secara umum. Rilis GA menandai stabilitas perubahan yang diperkenalkan dalam versi paket pratinjau 2.1 sebelumnya. Rilis ini memungkinkan Anda mendeteksi dan mengekstrak informasi dan data dari dokumen berikut ini:

  • Untuk memulai, coba Alat Sampel Kecerdasan Dokumen dan ikuti mulai cepat.

  • Fitur tabel Layout API yang diperbarui menambahkan pengenalan header dengan header kolom yang dapat menjangkau beberapa baris. Setiap sel tabel memiliki atribut yang menunjukkan apakah itu bagian dari header atau tidak. Pembaruan ini dapat digunakan untuk mengidentifikasi baris mana yang membentuk header tabel.


April 2021

  • Paket NuGet versi 3.1.0-beta.4

  • Riwayat Changelog/Rilis.

  • Metode baru untuk menganalisis data dari dokumen identitas:

    StartRecognizeIdDocumentsFromUriAsync

    StartRecognizeIdDocumentsAsync

    Untuk daftar nilai bidang, lihatBidang yang diekstrak dalam dokumentasi Kecerdasan Dokumen kami.

  • Memperluas kumpulan bahasa dokumen yang dapat disediakan untuk metode StartRecognizeContent.

  • Properti baru Pages didukung oleh kelas berikut:

    RecognizeBusinessCardsOptions
    RecognizeCustomFormsOptions
    RecognizeInvoicesOptions
    RecognizeReceiptsOptions

    Properti Pages memungkinkan Anda memilih individu atau rentang halaman untuk dokumen PDF dan TIFF multi-halaman. Untuk halaman individual, masukkan nomor halaman, misalnya, 3. Untuk rentang halaman (seperti halaman 2 dan halaman 5-7) masukkan nomor halaman dan rentang dipisahkan dengan koma: 2, 5-7.

  • Properti baru ReadingOrder didukung untuk kelas berikut:

    RecognizeContentOptions

    Properti ReadingOrder adalah parameter opsional yang memungkinkan Anda menentukan algoritme urutan pembacaan—basic atau natural—yang harus diterapkan untuk mengurutkan ekstraksi elemen teks. Jika tidak ditentukan, nilai defaultnya adalah basic.

  • Pembaruan pratinjau SDK untuk versi 2.1-preview.3 API memperkenalkan pembaruan dan penyempurnaan fitur.

Maret 2021

Pratinjau publik Kecerdasan Dokumen v2.1 v2.1-preview.3 telah dirilis dan menyertakan fitur-fitur berikut:

  • Model ID bawaan baru Model ID bawaan baru memungkinkan pelanggan mengambil ID dan mengembalikan data terstruktur untuk mengotomatiskan pemrosesan. Ini menggabungkan kemampuan Pengenalan Karakter Optik (OCR) kami yang kuat dengan model pemahaman ID untuk mengekstrak informasi penting dari paspor dan SIM Amerika Serikat.

    Pelajari lebih lanjut tentang model ID bawaan

    Screenshot of a sample passport.

  • Ekstraksi item baris untuk model faktur - Model Faktur bawaan sekarang mendukung ekstraksi item baris; sekarang mengekstrak item lengkap dan bagian-bagiannya - deskripsi, jumlah, kuantitas, ID produk, tanggal, dan banyak lagi. Dengan panggilan API/SDK sederhana, Anda dapat mengekstrak data yang berguna dari faktur - teks, tabel, pasangan nilai kunci, dan item baris.

    Pelajari selengkapnya tentang model faktur.

  • Pelabelan dan pelatihan tabel yang diawasi, pelabelan nilai kosong - Selain kemampuan ekstraksi tabel otomatis pembelajaran mendalam inteligensi dokumen yang canggih, sekarang memungkinkan pelanggan untuk memberi label dan melatih tabel. Rilis baru ini mencakup kemampuan untuk memberi label dan melatih item baris/tabel (dinamis dan tetap) dan melatih model kustom untuk mengekstrak pasangan nilai kunci dan item baris. Setelah model dilatih, model mengekstrak item baris sebagai bagian dari output JSON di bagian documentResults.

    Screenshot of the table labeling feature.

    Selain pelabelan tabel, Anda sekarang dapat melabeli nilai dan wilayah kosong. Jika beberapa dokumen dalam set pelatihan Anda tidak memiliki nilai untuk bidang tertentu, Anda bisa memberi label agar model Anda tahu untuk mengekstrak nilai dengan benar dari dokumen yang dianalisis.

  • Dukungan untuk 66 bahasa baru - API Tata Letak dan Model Kustom untuk Kecerdasan Dokumen sekarang mendukung 73 bahasa.

    Pelajari selengkapnya tentang dukungan bahasa Inteligensi Dokumen.

  • Urutan pembacaan alami, klasifikasi tulisan tangan, dan pemilihan halaman - Dengan pembaruan ini, Anda dapat memilih untuk mendapatkan keluaran baris teks dalam urutan pembacaan alami alih-alih urutan default kiri-ke-kanan dan atas-ke-bawah. Gunakan parameter kueri readingOrder yang baru dan setel ke nilai "alami" untuk output pesanan membaca yang lebih ramah manusia. Selain itu, untuk bahasa Latin, Kecerdasan Dokumen mengklasifikasikan baris teks sebagai gaya tulisan tangan atau tidak dan memberikan skor keyakinan.

  • Peningkatan kualitas model tanda terima bawaan Pembaruan ini mencakup banyak peningkatan kualitas untuk model Tanda Terima bawaan, terutama seputar ekstraksi item baris.


November 2020

  • Kecerdasan Dokumen v2.1-preview.2 telah dirilis dan menyertakan fitur-fitur berikut:

    • Model faktur bawaan baru - Model Faktur bawaan baru memungkinkan pelanggan mengambil faktur dalam berbagai format dan mengembalikan data terstruktur untuk mengotomatiskan pemrosesan faktur. Ini menggabungkan kemampuan Pengenalan Karakter Optik (OCR) kami yang kuat dengan model pembelajaran mendalam pemahaman faktur untuk mengekstrak informasi utama dari faktur dalam bahasa Inggris. Ini mengekstrak teks kunci, tabel, dan informasi seperti pelanggan, vendor, ID faktur, tanggal jatuh tempo faktur, total, jumlah terutang, jumlah pajak, pengiriman ke, dan tagihan ke.

      Pelajari lebih lanjut tentang model faktur bawaan

      Screenshot of a sample invoice.

    • Ekstraksi tabel yang ditingkatkan - Kecerdasan Dokumen sekarang menyediakan ekstraksi tabel yang ditingkatkan, yang menggabungkan kemampuan Pengenalan Karakter Optik (OCR) kami yang kuat dengan model ekstraksi tabel pembelajaran mendalam. Kecerdasan Dokumen dapat mengekstrak data dari tabel, termasuk tabel kompleks dengan kolom gabungan, baris, tanpa batas, dan lainnya.

      Screenshot of tables analysis.

      Pelajari selengkapnya tentang ekstraksi Tata Letak.

    • Pembaruan pustaka klien - Versi terbaru pustaka klien untuk .NET, Python, Java, dan JavaScript mendukung API Document Intelligence 2.1.

    • Bahasa baru didukung: Jepang - Bahasa baru berikut sekarang didukung: untuk AnalyzeLayout dan AnalyzeCustomForm: Jepang (ja). Dukungan bahasa.

    • Indikasi gaya baris teks (tulisan tangan/lainnya) (hanya bahasa Latin) - Kecerdasan Dokumen sekarang menghasilkan objek yang appearance mengklasifikasikan apakah setiap baris teks bergaya tulisan tangan atau tidak, bersama dengan skor keyakinan. Fitur ini hanya didukung untuk bahasa Latin.

    • Peningkatan kualitas - Peningkatan ekstraksi termasuk peningkatan ekstraksi satu digit.

    • Fitur coba-coba baru di Sampel Kecerdasan Dokumen dan Alat Pelabelan - Kemampuan untuk mencoba model Faktur, Tanda Terima, dan Kartu Nama bawaan dan API Tata Letak menggunakan alat Pelabelan Sampel Kecerdasan Dokumen. Lihat bagaimana data Anda diekstrak tanpa menulis kode apa pun.

    • Coba alat Pelabelan Sampel Kecerdasan Dokumen

      Screenshot of the Sample Labeling tool homepage.

      • Perulangan Umpan Balik - Saat Menganalisis file melalui alat Pelabelan Sampel, kini Anda juga dapat menambahkannya ke kumpulan pelatihan dan menyesuaikan label jika perlu dan melatih untuk meningkatkan model.
      • Dokumen Label Otomatis - Secara otomatis melabeli dokumen tambahan berdasarkan dokumen berlabel sebelumnya dalam proyek.

Agustus 2020

  • **Kecerdasan v2.1-preview.1 Dokumen mencakup fitur-fitur berikut:

    • Referensi REST API tersedia - Lihat v2.1-preview.1 reference.
    • Bahasa baru yang didukung Selain bahasa Inggris, bahasa berikut sekarang didukung: untuk Layout dan Train Custom Model: Inggris (en), Tionghoa (Sederhana) (zh-Hans), Belanda (nl), Prancis (fr), Jerman (de), Italia (it), Portugis (pt) dan Spanyol (es).
    • Kotak centang/ Deteksi Tanda Pilihan – Kecerdasan Dokumen mendukung deteksi dan ekstraksi tanda pilihan seperti kotak centang dan tombol radio. Tanda Pilihan diekstraksi dalam Layout dan kini Anda juga dapat memberi label dan melatih di Train Custom Model - Latih dengan Label untuk mengekstrak pasangan nilai kunci untuk tanda pilihan.
    • Model Compose - memungkinkan beberapa model dibuat dan dipanggil dengan satu ID model. Saat Anda mengirimkan dokumen untuk dianalisis dengan ID model yang disusun, langkah klasifikasi pertama dilakukan untuk mengarahkannya ke model kustom yang benar. Model Compose tersedia untuk Train Custom Model - Latih dengan label.
    • Nama model - tambahkan nama yang ramah ke model kustom Anda untuk pengelolaan dan pelacakan yang lebih mudah.
    • Model bawaan baru untuk Kartu Nama untuk mengekstrak bidang umum dalam bahasa Inggris, kartu nama bahasa.
    • Lokal baru untuk Tanda Terima bawaan selain EN-US, dukungan sekarang tersedia untuk EN-AU, EN-CA, EN-GB, EN-IN.
    • Peningkatan kualitas untuk Layout, Train Custom Model - Latih tanpa Label, dan Latih dengan Label.
  • v2.0 menyertakan pembaruan berikut:

    • Pustaka klien untuk NET, Python, Java, dan JavaScript Umumnya Tersedia.

    Sampel baru tersedia di GitHub.

    • Resep Ekstraksi Pengetahuan - Forms Playbook mengumpulkan praktik terbaik dari keterlibatan pelanggan Inteligensi Dokumen nyata dan menyediakan sampel kode yang dapat digunakan, daftar periksa, dan alur sampel yang digunakan dalam mengembangkan proyek-proyek ini.
    • Alat Pelabelan Sampel diperbarui untuk mendukung fungsionalitas v2.1 baru. Lihat mulai cepat ini untuk memulai alat.
    • Sampel Intelligent Kiosk Document Intelligence menunjukkan cara mengintegrasikan Analyze Receipt danTrain Custom Model - Melatih tanpa Label.

Juli 2020

  • Referensi Kecerdasan Dokumen v2.0 tersedia - Lihat Referensi API v2.0 dan pustaka klien yang diperbarui untuk .NET, Python, Java, dan JavaScript.
    • Penyempurnaan tabel dan peningkatan Ekstraksi - mencakup peningkatan akurasi dan peningkatan ekstraksi tabel, khususnya, kemampuan untuk mempelajari header dan struktur tabel dalam latihan kustom tanpa label.

    • Dukungan mata uang - Deteksi dan ekstraksi simbol mata uang global.

    • Azure Gov - Kecerdasan Dokumen sekarang juga tersedia di Azure Gov.

    • Fitur keamanan yang disempurnakan:

      • Bawa kunci Anda sendiri - Kecerdasan Dokumen secara otomatis mengenkripsi data Anda saat disimpan ke cloud untuk melindunginya dan untuk membantu Anda memenuhi komitmen keamanan dan kepatuhan organisasi Anda. Secara default, langganan Anda menggunakan kunci enkripsi yang dikelola Microsoft. Anda sekarang juga dapat mengelola langganan menggunakan kunci enkripsi Anda sendiri. Kunci yang dikelola pelanggan (CMK),juga dikenal sebagai Bring Your Own Key (BYOK), menawarkan fleksibilitas yang lebih luas untuk membuat, memutar, menonaktifkan, dan mencabut kontrol akses. Anda juga dapat mengaudit kunci enkripsi yang digunakan untuk melindungi data Anda.
      • Titik akhir privat – Memungkinkan Anda di jaringan virtual untuk mengakses data dengan aman melalui Private Link.

2020 Juni


April 2020

  • Dukungan SDK untuk Pratinjau Umum DOCUMENT Intelligence API v2.0 - Bulan ini kami memperluas dukungan layanan kami untuk menyertakan pratinjau SDK untuk rilis Document Intelligence v2.0. Gunakan tautan ini untuk memulai bahasa pilihan Anda:
  • .NET SDK
  • Java SDK
  • Python SDK
  • JavaScript SDK

SDK baru mendukung semua fitur REST API v2.0 untuk Kecerdasan Dokumen. Anda dapat membagikan umpan balik Anda tentang pustaka klien melalui formulir Umpan Balik SDK.

  • Copy Custom Model Kini Anda dapat menyalin model antar kawasan dan langganan menggunakan fitur Copy Custom Model yang baru. Sebelum memanggil Copy Custom Model API, Anda harus terlebih dahulu mendapatkan otorisasi untuk menyalin ke sumber daya target. Otorisasi ini diamankan dengan memanggil operasi Copy Authorization terhadap titik akhir sumber daya target.

  • Buat REST API otorisasi salinan.

  • Salin REST API model kustom.

  • Peningkatan keamanan.

  • Kunci Terkelola Pelanggan sekarang tersedia untuk FormRecognizer. Untuk informasi selengkapnya, lihat Enkripsi data tidak aktif untuk Kecerdasan Dokumen.

  • Gunakan Identitas Terkelola untuk akses ke sumber daya Azure dengan Azure Active Directory. Untuk informasi selengkapnya, lihat Mengotorisasi akses ke identitas terkelola.


Maret 2020

  • Jenis nilai untuk pelabelan Anda sekarang dapat menentukan jenis nilai yang Anda beri label dengan alat Pelabelan Sampel Kecerdasan Dokumen. Jenis dan variasi nilai berikut saat ini didukung:
  • string
    • default, no-whitespaces, alphanumeric
  • number
    • default, currency
  • date
    • default, dmy, mdy, ymd
  • time
  • integer

Lihat panduan Alat Pelabelan Sampel untuk mempelajari cara menggunakan fitur ini.

  • Visualisasi tabel Alat Pelabelan Sampel sekarang menampilkan tabel yang dikenali dalam dokumen. Fitur ini memungkinkan Anda melihat tabel yang dikenali dan diekstrak dari dokumen sebelum pelabelan dan analisis. Fitur ini dapat diaktifkan/dinonaktifkan menggunakan opsi lapisan.

  • Gambar berikut adalah contoh bagaimana tabel dikenali dan diekstraksi:

    Screenshot of table visualization using the Sample Labeling tool.

  • Tabel yang diekstrak tersedia dalam output JSON di bawah "pageResults".

    Penting

    Tabel pelabelan tidak didukung. Jika tabel tidak dikenali dan diekstrak secara otomatis, Anda hanya dapat memberi label sebagai pasangan kunci/nilai. Saat memberi melabeli tabel sebagai pasangan kunci/nilai, beri label setiap sel sebagai nilai unik.

  • Penyempurnaan ekstraksi.

  • Rilis ini mencakup peningkatan ekstraksi dan peningkatan akurasi, khususnya, kemampuan untuk memberi label dan mengekstrak beberapa pasangan kunci/nilai dalam baris teks yang sama.

  • Alat Pelabelan Sampel sekarang menjadi sumber terbuka.

  • Alat Pelabelan Sampel Kecerdasan Dokumen sekarang tersedia sebagai proyek sumber terbuka. Anda dapat mengintegrasikannya ke dalam solusi Anda dan membuat perubahan khusus pelanggan untuk memenuhi kebutuhan Anda.

  • Untuk informasi selengkapnya tentang alat Pelabelan Sampel Kecerdasan Dokumen, tinjau dokumentasi yang tersedia di GitHub.

  • TLS 1.2 penegakan.

  • TLS 1.2 sekarang diberlakukan untuk semua permintaan HTTP ke layanan ini. Untuk informasi selengkapnya, lihat Keamanan layanan Azure AI.


Januari 2020

Rilis ini memperkenalkan Kecerdasan Dokumen 2.0. Di bagian berikutnya, Anda akan menemukan informasi selengkapnya tentang fitur, penyempurnaan, dan perubahan baru.

  • Fitur baru

    • Model kustom

      • Latih dengan label Kini Anda dapat melatih model kustom dengan data berlabel manual. Metode ini menghasilkan model yang berperforma lebih baik dan dapat menghasilkan model yang bekerja dengan bentuk kompleks atau bentuk yang berisi nilai tanpa kunci.
      • API Asinkron Anda dapat menggunakan panggilan API asinkron untuk melatih dan menganalisis himpunan data dan file besar.
      • Dukungan file TIFF Sekarang Anda dapat melatih dan mengekstrak data dari dokumen TIFF.
      • Peningkatan akurasi ekstraksi.
    • Model tanda terima bawaan

      • Jumlah tip Sekarang Anda dapat mengekstrak jumlah tip dan nilai tulisan tangan lainnya.
      • Ekstraksi item baris Anda dapat mengekstrak nilai item baris dari tanda terima.
      • Nilai keyakinan Anda dapat melihat keyakinan model untuk setiap nilai yang diekstraksi.
      • Peningkatan akurasi ekstraksi.
      • Ekstraksi tata letak Sekarang Anda dapat menggunakan Layout API untuk mengekstrak data teks dan data tabel dari formulir Anda.
  • Perubahan API model kustom

    Semua API untuk pelatihan dan penggunaan model kustom diganti namanya, dan beberapa metode sinkron sekarang asinkron. Berikut ini adalah perubahan besar:

    • Proses pelatihan model sekarang asinkron. Anda memulai pelatihan melalui panggilan API /custom/models. Panggilan ini mengembalikan ID operasi, yang dapat Anda teruskan ke custom/models/{modelID} untuk mengembalikan hasil pelatihan.
    • Ekstraksi kunci/nilai sekarang dimulai oleh panggilan API /custom/models/{modelID}/analyze. Panggilan ini mengembalikan ID operasi, yang dapat Anda teruskan ke custom/models/{modelID}/analyzeResults/{resultID} untuk mengembalikan hasil ekstraksi.
    • ID Operasi untuk operasi Kereta sekarang ditemukan di header Lokasi respons HTTP, bukan header Lokasi-Operasi.
  • Perubahan API tanda terima

    • API untuk membaca tanda terima penjualan diganti namanya.

    • Ekstraksi data tanda terima sekarang dimulai oleh panggilan API /prebuilt/receipt/analyze. Panggilan ini mengembalikan ID operasi, yang dapat Anda teruskan ke /prebuilt/receipt/analyzeResults/{resultID} untuk mengembalikan hasil ekstraksi.

  • Perubahan format output

    • Respons JSON untuk semua panggilan API memiliki format baru. Beberapa kunci dan nilai ditambahkan, dihapus, atau diganti namanya. Lihat mulai cepat untuk contoh format JSON saat ini.

Langkah berikutnya

  • Coba pemrosesan formulir dan dokumen Anda sendiri dengan Studio Kecerdasan Dokumen.

  • Selesaikan mulai cepat Kecerdasan Dokumen dan mulai membuat aplikasi pemrosesan dokumen dalam bahasa pengembangan pilihan Anda.

  • Coba pemrosesan formulir dan dokumen Anda sendiri dengan alat Pelabelan Sampel Kecerdasan Dokumen.

  • Selesaikan mulai cepat Kecerdasan Dokumen dan mulai membuat aplikasi pemrosesan dokumen dalam bahasa pengembangan pilihan Anda.