Apa yang baru dalam Kecerdasan Dokumen Azure AI
Konten ini berlaku untuk:v4.0 (pratinjau)v3.1 (GA)v3.0 (GA)v2.1 (GA)
Layanan Kecerdasan Dokumen diperbarui secara berkelanjutan. Tandai halaman ini untuk tetap diperbarui dengan catatan rilis, penyempurnaan fitur, dan dokumentasi terbaru kami.
Penting
Versi API pratinjau dihentikan setelah GA API dirilis. Versi API pratinjau 2023-02-28 dihentikan, jika Anda masih menggunakan API pratinjau atau versi SDK terkait, harap perbarui kode Anda untuk menargetkan API versi terbaru 2023-07-31 (GA).
Februari 2024
REST API pratinjau Dokumen 2024-02-29 sekarang tersedia. API pratinjau ini memperkenalkan kemampuan baru dan yang diperbarui:
Pratinjau publik versi 2024-02-29-preview saat ini hanya tersedia di wilayah Azure berikut:
- US Timur
- US Barat2
- Eropa Barat
Model tata letak sekarang mendukung deteksi gambar dan analisis struktur dokumen hierarkis (bagian dan subbagian). Kualitas AI urutan baca dan deteksi peran logis juga ditingkatkan.
-
- Model ekstraksi kustom sekarang mendukung skor keyakinan tingkat sel, baris, dan tabel. Pelajari selengkapnya tentang keyakinan tabel, baris, dan sel.
- Model ekstraksi kustom memiliki peningkatan kualitas AI untuk ekstraksi bidang.
- Model ekstraksi templat kustom sekarang mendukung ekstraksi bidang yang tumpang tindih. Pelajari selengkapnya tentang bidang yang tumpang tindih dan cara Anda menggunakannya.
-
- Model klasifikasi kustom sekarang mendukung pelatihan inkremental untuk skenario di mana Anda perlu memperbarui model pengklasifikasi dengan sampel tambahan atau kelas tambahan. Pelajari selengkapnya tentang pelatihan inkremental.
- Model klasifikasi kustom menambahkan dukungan untuk jenis dokumen Office (.docx, .pptx, dan .xls). Pelajari selengkapnya tentang dukungan jenis dokumen yang diperluas.
-
- Dukungan untuk lokal baru:
Lokal Kode Arab Aku akan menemuinya. ar
Bulgaria Aku akan menemuinya. bg
Yunani Aku akan menemuinya. el
Ibrani Aku akan menemuinya. he
Makedonia Aku akan menemuinya. mk
Bahasa Rusia ( ru
)Sirilik Serbia ( sr-cyrl
)Ukraina Aku akan menemuinya. uk
Thailand Aku akan menemuinya. th
Turki Aku akan menemuinya. tr
Vietnam Aku akan menemuinya. vi
- Dukungan untuk kode mata uang baru:
Mata Uang Lokal Kode BAM Tanda Konversi Bosnia Aku akan menemuinya. ba
BGN Lev Bulgaria Aku akan menemuinya. bg
ILS Shekel Baru Israel Aku akan menemuinya. il
MKD Denar Makedonia Aku akan menemuinya. mk
RUB Rubel Rusia Aku akan menemuinya. ru
THB Baht Thailand Aku akan menemuinya. th
TRY Lira Turki Aku akan menemuinya. tr
UAH Hryvnia Ukraina Aku akan menemuinya. ua
VND Dong Vietnam Aku akan menemuinya. vn
- Item pajak mendukung ekspansi untuk Jerman (
de
), Spanyol (es
), Portugal (pt
), Kanadaen-CA
Inggris .
-
- Dukungan lapangan yang diperluas untuk ID Uni Eropa dan SIM.
-
- Ekstrak informasi dari Aplikasi Pinjaman Residensial Seragam (Formulir 1003).
- Ekstrak informasi dari Uniform Underwriting and Transmittal Summary atau Form 1008.
- Ekstrak informasi dari pengungkapan penutupan hipotek.
-
- Ekstrak informasi dari kartu bank.
-
- Bawaan baru untuk mengekstrak informasi dari sertifikat pernikahan.
Desember 2023
Pustaka klien Kecerdasan Dokumen yang menargetkan REST API 2023-10-31-preview sekarang tersedia untuk digunakan!
November 2023
REST API pratinjau Dokumen 2023-10-31 sekarang tersedia. API pratinjau ini memperkenalkan kemampuan baru dan yang diperbarui:
Pratinjau publik versi 2023-10-31-preview saat ini hanya tersedia di wilayah Azure berikut:
- US Timur
- US Barat2
- Eropa Barat
-
- Ekspansi Bahasa untuk Tulisan Tangan: Rusia(
ru
), Arab(ar
), Thai(th
). - Kepatuhan Cyber Executive Order (EO).
- Ekspansi Bahasa untuk Tulisan Tangan: Rusia(
-
- Mendukung file kantor dan HTML.
- Dukungan output markdown.
- Ekstraksi tabel, urutan baca, dan peningkatan deteksi judul bagian.
- Dengan Document Intelligence 2023-10-31-preview, model dokumen umum (prebuilt-document) tidak digunakan lagi. Ke depannya, untuk mengekstrak pasangan kunci-nilai dari dokumen, gunakan
prebuilt-layout
model dengan parameterfeatures=keyValuePairs
string kueri opsional diaktifkan.
-
- Sekarang mengekstrak mata uang untuk semua bidang terkait harga.
Model Kartu Asuransi Kesehatan
- Dukungan bidang baru untuk informasi Medicare dan Medicaid.
-
- Model pajak 1099 baru. Mendukung formulir dasar 1099 dan variasi berikut: A, B, C, CAP, DIV, G, H, INT, K, LS, LTC, MISC, NEC, OID, PATR, Q, QA, R, S, SA, SB.
-
- Dukungan untuk
KVK
bidang. - Dukungan untuk
BPAY
bidang. - Banyak penyempurnaan bidang.
- Dukungan untuk
-
- Dukungan untuk dokumen multi-bahasa.
- Opsi pemisahan halaman baru: autosplit, selalu pisahkan menurut halaman, tanpa pemisahan.
-
- Bidang kueri tersedia dengan
2023-10-31-preview
rilis. - Kemampuan add-on tersedia dalam semua model tidak termasuk model Baca.
- Bidang kueri tersedia dengan
Catatan
Dengan rilis ketersediaan umum (GA) API 2022-08-31, API pratinjau terkait tidak digunakan lagi. Jika Anda menggunakan pratinjau 2021-09-30, pratinjau 2022-01-30 atau versi API pratinjau 2022-06-30, harap perbarui aplikasi Anda untuk menargetkan versi API 2022-08-31. Ada beberapa perubahan kecil yang terlibat, untuk informasi selengkapnya, lihatpanduan migrasi.
Juli 2023
Catatan
Form Recognizer sekarang menjadi Kecerdasan Dokumen Azure AI!
- Dokumen, layanan Azure AI mencakup semua yang sebelumnya dikenal sebagai Cognitive Services dan Azure Applied AI Services.
- Tidak ada perubahan pada harga.
- Nama Cognitive Services dan Azure Applied AI terus digunakan dalam tagihan Azure, analisis biaya, daftar harga, dan API harga.
- Tidak ada perubahan yang melanggar pada antarmuka pemrograman aplikasi (API) atau pustaka klien.
- Beberapa platform masih menunggu pembaruan penggantian nama. Semua penyebutan Form Recognizer atau Kecerdasan Dokumen dalam dokumentasi kami mengacu pada layanan Azure yang sama.
Kecerdasan Dokumen v3.1 (GA)
API Kecerdasan Dokumen versi 3.1 sekarang tersedia secara umum (GA)! Versi API sesuai dengan 2023-07-31
.
API v3.1 memperkenalkan kemampuan baru dan yang diperbarui:
- API Kecerdasan Dokumen sekarang lebih modular dan dengan dukungan untuk fitur opsional. Anda sekarang dapat menyesuaikan output untuk secara khusus menyertakan fitur yang Anda butuhkan. Pelajari selengkapnya tentang parameter opsional.
- API klasifikasi dokumen untuk memisahkan satu file menjadi dokumen individual. Pelajari selengkapnya tentang klasifikasi dokumen.
- Model kontrak bawaan.
- Formulir pajak AS bawaan 1098 model.
- Dukungan untuk jenis file Office dengan API Baca.
- Pengenalan kode batang dalam dokumen.
- Kemampuan add-on pengenalan rumus.
- Kemampuan add-on pengenalan font.
- Dukungan untuk dokumen resolusi tinggi.
- Model neural kustom sekarang memerlukan satu sampel berlabel untuk dilatih.
- Ekspansi bahasa model neural kustom. Latih model neural untuk dokumen dalam 30 bahasa. Lihat dukungan bahasa untuk daftar lengkap bahasa yang didukung.
- 🆕 Model kartu asuransi kesehatan bawaan.
- Ekspansi lokal model faktur bawaan.
- Bahasa model tanda terima bawaan dan perluasan lokal dengan lebih dari 100 bahasa yang didukung.
- Model ID bawaan sekarang mendukung ID Eropa.
Pembaruan UX Studio Kecerdasan Dokumen
✔️ Opsi Analisis
Kecerdasan Dokumen sekarang mendukung kemampuan analisis yang lebih canggih dan Studio memungkinkan satu titik masuk (tombol Analisis opsi) untuk mengonfigurasi kemampuan add-on dengan mudah.
Bergantung pada skenario ekstraksi dokumen, konfigurasikan rentang analisis, rentang halaman dokumen, deteksi opsional, dan fitur deteksi premium.
Catatan
Ekstraksi font tidak divisualisasikan di Document Intelligence Studio. Namun, Anda dapat memeriksa bagian gaya output JSON untuk hasil deteksi font.
✔️ Pelabelan dokumen otomatis dengan model bawaan atau salah satu model Anda sendiri
Di halaman pelabelan model ekstraksi kustom, Anda sekarang dapat memberi label otomatis dokumen Anda menggunakan salah satu model atau model bawaan Document Intelligent Service yang sebelumnya Anda latih.
Untuk beberapa dokumen, mungkin ada label duplikat setelah menjalankan label otomatis. Pastikan untuk mengubah label sehingga tidak ada label duplikat di halaman pelabelan setelahnya.
✔️ Tabel pelabelan otomatis
Di halaman pelabelan model ekstraksi kustom, Anda sekarang dapat melabeli tabel dalam dokumen secara otomatis tanpa harus memberi label tabel secara manual.
✔️ Menambahkan file pengujian langsung ke himpunan data pelatihan Anda
Setelah Anda melatih model ekstraksi kustom, gunakan halaman pengujian untuk meningkatkan kualitas model Anda dengan mengunggah dokumen pengujian ke himpunan data pelatihan jika diperlukan.
Jika skor keyakinan rendah dikembalikan untuk beberapa label, pastikan mereka diberi label dengan benar. Jika tidak, tambahkan ke himpunan data pelatihan dan relabel untuk meningkatkan kualitas model.
✔️ Memanfaatkan opsi dan filter daftar dokumen dalam proyek kustom
Gunakan halaman pelabelan model ekstraksi kustom. Anda sekarang dapat menavigasi melalui dokumen pelatihan Anda dengan mudah dengan memanfaatkan pencarian, filter, dan mengurutkan berdasarkan fitur.
Gunakan tampilan kisi untuk mempratinjau dokumen atau menggunakan tampilan daftar untuk menggulir dokumen dengan lebih mudah.
✔️ Berbagi proyek
- Bagikan proyek ekstraksi kustom dengan mudah. Untuk informasi selengkapnya, lihat Berbagi proyek dengan model kustom.
Mei 2023
Memperkenalkan dokumentasi yang di-refresh untuk Build 2023
🆕 Gambaran Umum Kecerdasan Dokumen navigasi yang disempurnakan, titik akses terstruktur, dan gambar yang diperkaya.
🆕 Pilih model Kecerdasan Dokumen menyediakan panduan untuk memilih solusi Kecerdasan Dokumen terbaik untuk proyek dan alur kerja Anda.
April 2023
Mengumumkan rilis pratinjau publik pustaka klien Kecerdasan Dokumen terbaru
Rest API Kecerdasan Dokumen Versi 2023-02-28-preview mendukung pustaka klien rilis pratinjau publik. Rilis ini mencakup fitur dan kemampuan baru berikut yang tersedia untuk .NET/C# (4.1.0-beta-1), Java (4.1.0-beta-1), JavaScript (4.1.0-beta-1), dan pustaka klien Python (3.3.0b.1):
Untuk informasi selengkapnya, lihatSDK Kecerdasan Dokumen (pratinjau publik) dan catatan rilis Maret 2023
Maret 2023
Penting
2023-02-28-preview
kemampuan saat ini hanya tersedia di wilayah berikut:
- Eropa Barat
- West US2
- AS Timur
- Model klasifikasi kustom adalah kemampuan baru dalam Kecerdasan Dokumen yang
2023-02-28-preview
dimulai dengan API. Coba kemampuan klasifikasi dokumen menggunakan Document Intelligence Studio atau REST API. - Kemampuan bidang kueri yang ditambahkan ke model Dokumen Umum, gunakan model Azure OpenAI untuk mengekstrak bidang tertentu dari dokumen. Coba fitur Dokumen umum dengan bidang kueri menggunakan Studio Kecerdasan Dokumen. Bidang kueri saat ini hanya aktif untuk sumber daya di wilayah tersebut
East US
. - Kemampuan add-on:
- Ekstraksi font sekarang dikenali dengan
2023-02-28-preview
API. - Ekstraksi rumus sekarang dikenali dengan
2023-02-28-preview
API. - Ekstraksi resolusi tinggi sekarang dikenali dengan
2023-02-28-preview
API.
- Ekstraksi font sekarang dikenali dengan
- Pembaruan model ekstraksi kustom:
- Pembaruan Studio Kecerdasan Dokumen:
- Selain dukungan untuk semua fitur baru seperti bidang klasifikasi dan kueri, Studio sekarang mengaktifkan berbagi proyek untuk proyek model kustom.
- Penambahan model baru dalam pratinjau terjaga: Kartu vaksinasi, Kontrak, Pajak AS 1098, Pajak AS 1098-E, dan Pajak AS 1098-T. Untuk meminta akses ke model pratinjau yang terjaga, lengkapi dan kirimkan formulir permintaan pratinjau privat Kecerdasan Dokumen.
- Pembaruan model tanda terima:
- Model tanda terima menambahkan dukungan untuk tanda terima termal.
- Model tanda terima sekarang menambahkan dukungan bahasa untuk 18 bahasa dan tiga bahasa regional (Inggris, Prancis, Portugis).
- Model tanda terima sekarang mendukung
TaxDetails
ekstraksi.
- Model tata letak sekarang meningkatkan pengenalan tabel.
- Model baca sekarang menambahkan peningkatan untuk pengenalan karakter satu digit.
Februari 2023
Pilih kontainer Kecerdasan Dokumen untuk v3.0 sekarang tersedia untuk digunakan!
Saat ini kontainer Read v3.0 dan Layout v3.0 tersedia.
Untuk informasi selengkapnya, lihatMenginstal dan menjalankan kontainer Kecerdasan Dokumen.
January 2023
Model tanda terima bawaan - bahasa tambahan yang didukung. Model tanda terima sekarang mendukung bahasa dan lokal tambahan ini
- Jepang - Jepang (ja-JP)
- Bahasa Prancis - Kanada (fr-CA)
- Belanda - Belanda (nl-NL)
- Inggris - Uni Emirat Arab (en-AE)
- Portugis - Brasil (pt-BR)
Model faktur bawaan - bahasa tambahan yang didukung. Model faktur sekarang mendukung bahasa dan lokal tambahan ini
- Inggris - Amerika Serikat (id-ID), Australia (en-AU), Kanada (en-CA), Inggris Raya (en-UK), India (en-IN)
- Spanyol - Spanyol (es-ES)
- Prancis - Prancis (fr-FR)
- Italia - Italia (it-IT)
- Portugis - Portugal (pt-PT)
- Belanda - Belanda (nl-NL)
Model faktur bawaan - bidang tambahan dikenali. Model faktur sekarang mengenali bidang yang ditambahkan ini
- Kode mata uang
- Opsi pembayaran
- Total diskon
- Item pajak (khusus en-IN)
Model ID bawaan - menambahkan jenis dokumen yang didukung. Model ID sekarang mendukung jenis dokumen yang ditambahkan ini
- ID Militer AS
Tip
Semua pembaruan Januari 2023 tersedia dengan REST API versi 2022-08-31 (GA).
Model tanda terima bawaan—dukungan bahasa tambahan:
Model tanda terima bawaan menambahkan dukungan untuk bahasa berikut:
- Inggris - Uni Emirat Arab (en-AE)
- Belanda - Belanda (nl-NL)
- Bahasa Prancis - Kanada (fr-CA)
- Bahasa Jerman - (de-DE)
- Italia - (it-IT)
- Jepang - Jepang (ja-JP)
- Portugis - Brasil (pt-BR)
Model faktur bawaan—dukungan bahasa tambahan dan ekstraksi bidang
Model faktur bawaan menambahkan dukungan untuk bahasa berikut:
- Inggris - Australia (en-AU), Kanada (en-CA), Inggris Raya (id-id), India (en-IN)
- Portugis - Brasil (pt-BR)
Model faktur bawaan sekarang menambahkan dukungan untuk ekstraksi bidang berikut:
- Kode mata uang
- Opsi pembayaran
- Total diskon
- Item pajak (khusus en-IN)
Model dokumen ID bawaan—dukungan jenis dokumen tambahan
Model dokumen ID bawaan sekarang menambahkan dukungan untuk jenis dokumen berikut:
- Ekspansi SIM mendukung India, Kanada, Inggris Raya, dan Australia
- Kartu dan dokumen ID militer AS
- Kartu dan dokumen ID India (PAN dan Aadhaar)
- Kartu IDENTITAS dan dokumen Australia (kartu foto, ID Key-pass)
- Kartu ID dan dokumen Kanada (kartu identifikasi, kartu Maple)
- Kartu ID dan dokumen Inggris Raya (kartu identitas nasional/regional)
Desember 2022
Pembaruan Studio Kecerdasan Dokumen
Rilis Studio Inteligensi Dokumen Desember menyertakan pembaruan terbaru untuk Document Intelligence Studio. Ada peningkatan signifikan pada pengalaman pengguna, terutama dengan dukungan pelabelan model kustom.
Rentang halaman. Studio sekarang mendukung analisis halaman tertentu dari dokumen.
Pelabelan model kustom:
Jalankan API Tata Letak secara otomatis. Anda dapat memilih untuk menjalankan API Tata Letak untuk semua dokumen secara otomatis di penyimpanan blob Anda selama proses penyiapan untuk model kustom.
Pencarian. Studio sekarang menyertakan fungsionalitas pencarian untuk menemukan kata-kata dalam dokumen. Peningkatan ini memungkinkan navigasi yang lebih mudah saat pelabelan.
Navigasi. Anda dapat memilih label untuk menargetkan kata berlabel dalam dokumen.
Pelabelan tabel otomatis. Setelah Anda memilih ikon tabel dalam dokumen, Anda dapat memilih untuk memberi label otomatis tabel yang diekstrak dalam tampilan pelabelan.
Subjenis label dan subjenis tingkat kedua The Studio sekarang mendukung subjenis untuk kolom tabel, baris tabel, dan subjenis tingkat kedua untuk jenis seperti tanggal dan angka.
Membangun model neural kustom sekarang didukung di wilayah US Gov Virginia.
Pratinjau versi
2022-01-30-preview
API dan2021-09-30-preview
akan dihentikan 31 Januari 2023. Perbarui ke2022-08-31
versi API untuk menghindari gangguan layanan apa pun.
November 2022
- Mengumumkan rilis stabil terbaru pustaka Kecerdasan Dokumen Azure AI
- Rilis ini mencakup perubahan dan pembaruan penting untuk pustaka klien .NET, Java, JavaScript, dan Python. Untuk informasi selengkapnya, lihatAzure SDK DevBlog.
- Peningkatan yang paling signifikan adalah pengenalan dua klien baru,
DocumentAnalysisClient
danDocumentModelAdministrationClient
.
Oktober 2022
Konten versi Kecerdasan Dokumen
Dokumentasi Kecerdasan Dokumen diperbarui untuk menyajikan pengalaman versi. Sekarang, Anda dapat memilih untuk melihat konten yang menargetkan
v3.0 GA
pengalaman atauv2.1 GA
pengalaman. Pengalaman v3.0 adalah default.
Kode Sampel Studio Kecerdasan Dokumen
- Kode sampel untuk pengalaman pelabelan Studio Kecerdasan Dokumen sekarang tersedia di GitHub. Pelanggan dapat mengembangkan dan mengintegrasikan Kecerdasan Dokumen ke dalam UX mereka sendiri atau membangun UX baru mereka sendiri menggunakan kode sampel Document Intelligence Studio.
Ekspansi bahasa
- Dengan rilis pratinjau terbaru, model templat Baca (OCR), Tata Letak, dan Kustom Kecerdasan Dokumen mendukung 134 bahasa baru. Penambahan bahasa ini termasuk bahasa Yunani, Latvia, Serbia, Thailand, Ukraina, dan Vietnam, bersama dengan beberapa bahasa Latin, dan Sirilik. Kecerdasan Dokumen sekarang memiliki total 299 bahasa yang didukung di seluruh GA terbaru dan versi pratinjau baru. Lihat halaman bahasa yang didukung untuk melihat semua bahasa yang didukung.
- Gunakan parameter
api-version=2022-06-30-preview
REST API saat menggunakan API atau SDK terkait untuk mendukung bahasa baru dalam aplikasi Anda.
Model Kontrak Bawaan Baru
- Bawaan baru yang mengekstrak informasi dari kontrak seperti pihak, judul, ID kontrak, tanggal eksekusi, dan banyak lagi. model kontrak saat ini dalam pratinjau, meminta akses di sini.
Ekspansi wilayah untuk melatih model neural kustom
- Melatih model neural kustom sekarang didukung di wilayah tambahan.
- AS Timur
- US Timur2
- US Gov Arizona
- Melatih model neural kustom sekarang didukung di wilayah tambahan.
September 2022
Catatan
Dimulai dengan versi 4.0.0, sekumpulan klien baru telah diperkenalkan untuk memanfaatkan fitur terbaru layanan Kecerdasan Dokumen.
Rilis GA SDK versi 4.0.0 mencakup pembaruan berikut:
- GA Versi 4.0.0 (08-09-2022)
- Mendukung klien REST API v3.0 dan v2.0
Ekspansi wilayah untuk melatih model neural kustom sekarang didukung di enam wilayah baru
- Australia Timur
- US Tengah
- Asia Timur
- Prancis Tengah
- UK Selatan
- West US2
Untuk daftar lengkap wilayah tempat pelatihan didukung, lihat model neural kustom.
Rilis versi
4.0.0 GA
SDK Kecerdasan Dokumen:- Pustaka klien Kecerdasan Dokumen versi 4.0.0 (.NET/C#, Java, JavaScript) dan versi 3.2.0 (Python) umumnya tersedia dan siap digunakan dalam aplikasi produksi!.
- Untuk informasi selengkapnya tentang pustaka klien Kecerdasan Dokumen, lihat gambaran umum SDK.
- Perbarui aplikasi Anda menggunakan panduan migrasi bahasa pemrograman Anda.
Agustus 2022
Rilis pratinjau Document Intelligence SDK beta Agustus 2022 mencakup pembaruan berikut:
Versi 4.0.0-beta.5 (2022-08-09)
Kecerdasan Dokumen v3.0 tersedia secara umum
- REST API Kecerdasan Dokumen v3.0 sekarang tersedia secara umum dan siap digunakan dalam aplikasi produksi! Perbarui aplikasi Anda dengan REST API versi 2022-08-31.
Pembaruan Studio Kecerdasan Dokumen
- Langkah berikutnya. Di bawah setiap halaman model, kini ada bagian langkah berikutnya di Studio. Pengguna dapat dengan cepat mereferensikan kode sampel, panduan pemecahan masalah, dan informasi harga.
- Model kustom. Studio kini menyertakan kemampuan untuk menyusun ulang label dalam proyek model kustom guna meningkatkan efisiensi pelabelan.
- Model Salin Model Kustom dapat disalin di seluruh layanan Kecerdasan Dokumen dari dalam Studio. Fitur ini memungkinkan promosi model terlatih ke lingkungan dan kawasan lain.
- Hapus dokumen. Studio kini mendukung penghapusan dokumen dari himpunan data berlabel dalam proyek kustom.
Pembaruan layanan Kecerdasan Dokumen
- baca bawaan. Model OCR baca sekarang juga tersedia di Kecerdasan Dokumen dengan paragraf dan deteksi bahasa sebagai dua fitur baru. Pembacaan Kecerdasan Dokumen menargetkan skenario dokumen tingkat lanjut yang selaras dengan kemampuan kecerdasan dokumen yang lebih luas dalam Kecerdasan Dokumen.
- prebuilt-layout. Model Tata Letak mengekstrak paragraf dan apakah teks yang diekstrak adalah paragraf, judul, judul bagian, catatan kaki, header halaman, catatan kaki halaman, atau nomor halaman.
- prebuilt-invoice. Bidang TotalVAT dan Line/VAT sekarang diselesaikan ke bidang totalTax dan Line/Tax yang ada masing-masing.
- prebuilt-idDocument. Dukungan ekstraksi data untuk ID status AS, jaminan sosial, dan kartu hijau. Dukungan untuk informasi visa paspor.
- prebuilt-receipt. Memperluas dukungan lokal untuk Bahasa Prancis (fr-FR), Spanyol (es-ES), Portugis (pt-PT), Italia (it-IT) dan Jerman (de-DE).
- prebuilt-businessCard. Dukungan penguraian alamat untuk mengekstrak subbidang untuk komponen alamat seperti alamat, kota, negara bagian, negara/wilayah, dan kode pos.
Peningkatan kualitas AI
- baca bawaan. Dukungan yang ditingkatkan untuk karakter tunggal, tanggal tulisan tangan, jumlah, nama, data kunci lainnya yang umumnya ditemukan dalam tanda terima dan faktur dan pemrosesan dokumen PDF digital yang ditingkatkan.
- prebuilt-layout. Dukungan untuk deteksi tabel yang dipangkas yang lebih baik, tabel tanpa batas, dan pengenalan sel rentang panjang yang ditingkatkan.
- prebuilt-document. Meningkatkan kualitas deteksi nilai dan kotak centang.
- custom-neural. Peningkatan akurasi untuk deteksi dan ekstraksi tabel.
Juni 2022
- Rilis pratinjau Document Intelligence SDK beta Juni 2022 mencakup pembaruan berikut:
Versi 4.0.0-beta.4 (08-06-2022)
Rilis Document Intelligence Studio Juni adalah pembaruan terbaru ke Studio Kecerdasan Dokumen. Ada peningkatan kualitas aksesibilitas dan pengalaman pengguna yang cukup besar dan ditangani dalam pembaruan ini:
- Sampel kode untuk JavaScript dan C#. Tab kode Studio kini menambahkan sampel kode Javascript dan C# selain sampel Python yang sudah ada.
- Antarmuka pengguna unggahan dokumen baru. Studio sekarang mendukung pengunggahan dokumen dengan seret & letakkan ke antarmuka pengguna unggahan baru.
- Fitur baru untuk proyek kustom. Proyek kustom sekarang mendukung pembuatan akun penyimpanan dan blob saat mengonfigurasi proyek. Selain itu, proyek kustom sekarang mendukung pengunggahan file pelatihan langsung di dalam Studio dan menyalin model kustom yang ada.
Rilis pratinjau Kecerdasan Dokumen v3.0 2022-06-30 menyajikan pembaruan ekstensif di seluruh API fitur:
- Tata letak memperluas ekstraksi struktur. Tata letak sekarang menyertakan elemen struktur yang ditambahkan termasuk bagian, header bagian, dan paragraf. Pembaruan ini memungkinkan skenario segmentasi dokumen yang lebih mendetail. Untuk daftar lengkap elemen struktur yang diidentifikasi, lihatstruktur yang ditingkatkan.
- Dukungan bidang tabular model neural. Model dokumen kustom sekarang mendukung bidang tabular. Bidang tabular secara default juga bersifat multihalaman. Untuk mempelajari selengkapnya tentang bidang tabular dalam model neural kustom, lihatbidang tabular.
- Dukungan bidang tabular model template kustom untuk tabel lintas halaman. Model formulir kustom sekarang mendukung bidang tabular di seluruh halaman. Untuk mempelajari selengkapnya tentang bidang tabular dalam model templat kustom, lihatbidang tabular.
- Output model faktur kini menyertakan pasangan kunci-nilai dokumen umum. Jika faktur berisi bidang yang diperlukan di luar bidang yang disertakan dalam model bawaan, model dokumen umum melengkapi output dengan pasangan kunci-nilai. Lihatpasangan kunci-nilai.
- Ekspansi bahasa faktur. Model faktur mencakup dukungan bahasa yang diperluas. Lihatbahasa yang didukung.
- Kartu nama bawaan kini meliputi dukungan bahasa Jepang. Lihatbahasa yang didukung.
- Model dokumen ID bawaan. Model dokumen ID sekarang mengekstrak DateOfIssue, Height, Weight, EyeColor, HairColor, dan DocumentDiscriminator dari SIM Amerika Serikat. Lihatekstraksi bidang.
- Model baca kini mendukung beberapa jenis dokumen Microsoft Office umum. Jenis dokumen seperti Word (docx), Excel (xlsx), dan PowerPoint (pptx) sekarang didukung dengan API Baca. Lihat Membaca ekstraksi data.
Februari 2022
Versi 4.0.0-beta.3 (2022-02-10)
Rilis pratinjau Kecerdasan Dokumen v3.0 memperkenalkan beberapa fitur, kemampuan, dan peningkatan baru:
- Model neural kustom atau model dokumen kustom adalah model kustom baru untuk mengekstrak teks dan tanda pilihan dari formulir terstruktur, dokumen semi terstruktur dan tidak terstruktur.
- Model bawaan W-2 adalah model bawaan baru untuk mengekstrak bidang dari formulir W-2 untuk skenario verifikasi pendapatan dan pelaporan pajak.
- API Baca mengekstrak baris teks yang dicetak, kata, lokasi teks, bahasa yang terdeteksi, dan teks tulisan tangan, jika terdeteksi.
- Model dokumen umum yang telah dilatih sebelumnya sekarang diperbarui untuk mendukung tanda pilihan selain teks API, tabel, struktur, dan pasangan kunci-nilai dari formulir dan dokumen.
- API Faktur Model faktur bawaan memperluas dukungan ke faktur Spanyol.
- Document Intelligence Studio menambahkan demo baru untuk sampel tanda terima Baca, W2, Hotel, dan dukungan untuk melatih model neural kustom baru.
- Language Expansion Document Intelligence Read, Layout, and Custom Form menambahkan dukungan untuk 42 bahasa baru termasuk bahasa Arab, Hindi, dan bahasa lain menggunakan skrip Arab dan Devanagari untuk memperluas cakupan ke 164 bahasa. Dukungan bahasa tulisan tangan diperluas ke bahasa Jepang dan Korea.
Memulai dengan REST API, Python, atau .NET untuk API pratinjau v3.0.
Ekstraksi data model Kecerdasan Dokumen:
Model Ekstraksi teks Pasangan Kunci-Nilai Tanda Pilihan Tabel Tanda tangan Read âś“ Dokumen umum âś“ âś“ âś“ âś“ Tata letak âś“ âś“ âś“ Faktur âś“ âś“ âś“ âś“ Tanda Terima âś“ âś“ âś“ Dokumen ID âś“ âś“ Kartu nama âś“ âś“ Templat kustom âś“ âś“ âś“ âś“ âś“ Neural kustom âś“ âś“ âś“ âś“ Rilis pratinjau beta SDK Kecerdasan Dokumen mencakup pembaruan berikut:
Mode dan model Dokumen Kustom:
- Templat kustom (sebelumnya formulir kustom).
- Neural kustom.
- Model kustom—mode build.
Model bawaan W-2 (prebuilt-tax.us.w2).
Model Baca bawaan (prebuilt-read).
Model faktur bawaan (Spanyol) (prebuilt-invoice).
November 2021
Versi 4.0.0-beta.2 (2021-11-09)
| Dokumentasi referensi Api Riwayat Perubahan(NuGet) | Changelog/Release History API |
- Pembaruan rilis SDK pratinjau Document Intelligence v3.0 (beta.2) menggabungkan perbaikan bug dan pembaruan fitur minor.
Oktober 2021
Rilis pratinjau Kecerdasan Dokumen v3.0 versi 4.0.0-beta.1 (2021-10-07)memperkenalkan beberapa fitur dan kemampuan baru:
Model dokumen umum adalah API baru yang menggunakan model yang telah dilatih sebelumnya untuk mengekstrak pasangan teks, tabel, struktur, dan nilai kunci dari formulir dan dokumen.
Model Tanda terima hotel ditambahkan ke pemrosesan tanda terima bawaan.
Bidang diperluas untuk dokumen ID mendukung pengesahan, pembatasan, dan ekstraksi klasifikasi kendaraan dari lisensi pengemudi AS.
Bidang tanda tangan adalah jenis bidang baru dalam formulir kustom untuk mendeteksi keberadaan tanda tangan dalam bidang formulir.
Dukungan Ekspansi Bahasa untuk 122 bahasa (cetak) dan 7 bahasa (tulisan tangan). Tata Letak Kecerdasan Dokumen dan Formulir Kustom memperluas bahasa yang didukung ke 122 dengan pratinjau terbarunya. Pratinjau mencakup ekstraksi teks untuk teks cetak dalam 49 bahasa baru termasuk Bahasa Rusia, Bulgaria, dan Bahasa Cyrillic lainnya serta lebih banyak bahasa Latin. Selain itu, ekstraksi teks tulisan tangan sekarang mendukung tujuh bahasa yang mencakup bahasa Inggris, dan pratinjau baru Cina Sederhana, Prancis, Jerman, Italia, Portugis, dan Spanyol.
Tabel dan penyempurnaan ekstraksi teks Tata letak sekarang mendukung penggalian tabel baris tunggal yang juga disebut tabel kunci-nilai. Peningkatan ekstraksi teks mencakup pemrosesan PDF digital dan teks Machine Readable Zone (MRZ) yang lebih baik dalam dokumen identitas, bersama dengan performa umum.
Document Intelligence Studio Untuk menyederhanakan penggunaan layanan, Anda sekarang dapat mengakses Studio Kecerdasan Dokumen untuk menguji berbagai model atau label bawaan dan melatih model kustom.
Memulai dengan REST API, Python, atau .NET untuk API pratinjau v3.0.
Ekstraksi data model Kecerdasan Dokumen
Model Ekstraksi teks Pasangan Kunci-Nilai Tanda Pilihan Tabel Dokumen umum âś“ âś“ âś“ âś“ Tata letak âś“ âś“ âś“ Faktur âś“ âś“ âś“ âś“ Tanda Terima âś“ âś“ Dokumen ID âś“ âś“ Kartu nama âś“ âś“ Kustom âś“ âś“ âś“ âś“
September 2021
Fitur tingkat lanjut penjelajah metrik Azure tersedia di halaman gambaran umum sumber daya Kecerdasan Dokumen Anda di portal Azure.
Menu pemantauan:
Grafik:
Pembaruan model Dokumen ID: nama depan termasuk akhiran, dengan atau tanpa tanda titik (berhenti penuh), proses berhasil:
Teks Input Hasil dengan pembaruan William Isaac Kirby Jr. FirstName: William Isaac
LastName: Kirby Jr.Henry Caleb Ross Sr FirstName: Henry Caleb
LastName: Ross Sr.
Juli 2021
- Dukungan identitas terkelola yang ditetapkan sistem: Anda sekarang dapat mengaktifkan identitas terkelola yang ditetapkan sistem untuk memberikan akses terbatas Kecerdasan Dokumen ke akun penyimpanan privat termasuk akun yang dilindungi oleh Virtual Network, firewall, atau bring-your-own-storage (BYOS) diaktifkan. LihatMembuat dan menggunakan identitas terkelola untuk sumber daya Kecerdasan Dokumen Anda untuk mempelajari selengkapnya.
Juni 2021
Kontainer Kecerdasan Dokumen v2.1 dirilis dalam pratinjau terjaga dan sekarang didukung oleh enam kontainer fitur—Tata Letak, Kartu Nama, Dokumen ID, Tanda Terima, Faktur, dan Kustom. Untuk menggunakannya, Anda harus mengirimkan permintaan online, dan menerima persetujuan.
Konektor Kecerdasan Dokumen dirilis dalam pratinjau: Konektor Kecerdasan Dokumen terintegrasi dengan Azure Logic Apps, Microsoft Power Automate, dan Microsoft Power Apps. Konektor mendukung tindakan dan pemicu alur kerja untuk mengekstrak dan menganalisis data dan struktur dokumen dari formulir kustom dan bawaan, faktur, tanda terima, kartu nama, dan dokumen ID.
SDK Kecerdasan Dokumen v3.1.0 di-patch ke v3.1.1 untuk C#, Java, dan Python. Patch menyelesaikan faktur yang tidak memiliki bidang item sub-baris yang terdeteksi seperti
FormField
denganText
tetapi tanpa informasiBoundingBox
atauPage
.
Mei 2021
- Versi 3.1.0 (2021-05-26)
Dokumentasi | Changelog/Release History| Reference paket NuGet versi 3.0.1 |
Kecerdasan Dokumen 2.1 tersedia secara umum. Rilis GA menandai stabilitas perubahan yang diperkenalkan dalam versi paket pratinjau 2.1 sebelumnya. Rilis ini memungkinkan Anda mendeteksi dan mengekstrak informasi dan data dari dokumen berikut ini:
Untuk memulai, coba Alat Sampel Kecerdasan Dokumen dan ikuti mulai cepat.
Fitur tabel Layout API yang diperbarui menambahkan pengenalan header dengan header kolom yang dapat menjangkau beberapa baris. Setiap sel tabel memiliki atribut yang menunjukkan apakah itu bagian dari header atau tidak. Pembaruan ini dapat digunakan untuk mengidentifikasi baris mana yang membentuk header tabel.
April 2021
Paket NuGet versi 3.1.0-beta.4
Riwayat Changelog/Rilis.
Metode baru untuk menganalisis data dari dokumen identitas:
StartRecognizeIdDocumentsFromUriAsync
StartRecognizeIdDocumentsAsync
Untuk daftar nilai bidang, lihatBidang yang diekstrak dalam dokumentasi Kecerdasan Dokumen kami.
Memperluas kumpulan bahasa dokumen yang dapat disediakan untuk metode StartRecognizeContent.
Properti baru
Pages
didukung oleh kelas berikut:RecognizeBusinessCardsOptions
RecognizeCustomFormsOptions
RecognizeInvoicesOptions
RecognizeReceiptsOptionsProperti
Pages
memungkinkan Anda memilih individu atau rentang halaman untuk dokumen PDF dan TIFF multi-halaman. Untuk halaman individual, masukkan nomor halaman, misalnya,3
. Untuk rentang halaman (seperti halaman 2 dan halaman 5-7) masukkan nomor halaman dan rentang dipisahkan dengan koma:2, 5-7
.Properti baru
ReadingOrder
didukung untuk kelas berikut:Properti
ReadingOrder
adalah parameter opsional yang memungkinkan Anda menentukan algoritme urutan pembacaan—basic
ataunatural
—yang harus diterapkan untuk mengurutkan ekstraksi elemen teks. Jika tidak ditentukan, nilai defaultnya adalahbasic
.
- Pembaruan pratinjau SDK untuk versi
2.1-preview.3
API memperkenalkan pembaruan dan penyempurnaan fitur.
Maret 2021
Pratinjau publik Kecerdasan Dokumen v2.1 v2.1-preview.3 telah dirilis dan menyertakan fitur-fitur berikut:
Model ID bawaan baru Model ID bawaan baru memungkinkan pelanggan mengambil ID dan mengembalikan data terstruktur untuk mengotomatiskan pemrosesan. Ini menggabungkan kemampuan Pengenalan Karakter Optik (OCR) kami yang kuat dengan model pemahaman ID untuk mengekstrak informasi penting dari paspor dan SIM Amerika Serikat.
Ekstraksi item baris untuk model faktur - Model Faktur bawaan sekarang mendukung ekstraksi item baris; sekarang mengekstrak item lengkap dan bagian-bagiannya - deskripsi, jumlah, kuantitas, ID produk, tanggal, dan banyak lagi. Dengan panggilan API/SDK sederhana, Anda dapat mengekstrak data yang berguna dari faktur - teks, tabel, pasangan nilai kunci, dan item baris.
Pelabelan dan pelatihan tabel yang diawasi, pelabelan nilai kosong - Selain kemampuan ekstraksi tabel otomatis pembelajaran mendalam inteligensi dokumen yang canggih, sekarang memungkinkan pelanggan untuk memberi label dan melatih tabel. Rilis baru ini mencakup kemampuan untuk memberi label dan melatih item baris/tabel (dinamis dan tetap) dan melatih model kustom untuk mengekstrak pasangan nilai kunci dan item baris. Setelah model dilatih, model mengekstrak item baris sebagai bagian dari output JSON di bagian documentResults.
Selain pelabelan tabel, Anda sekarang dapat melabeli nilai dan wilayah kosong. Jika beberapa dokumen dalam set pelatihan Anda tidak memiliki nilai untuk bidang tertentu, Anda bisa memberi label agar model Anda tahu untuk mengekstrak nilai dengan benar dari dokumen yang dianalisis.
Dukungan untuk 66 bahasa baru - API Tata Letak dan Model Kustom untuk Kecerdasan Dokumen sekarang mendukung 73 bahasa.
Pelajari selengkapnya tentang dukungan bahasa Inteligensi Dokumen.
Urutan pembacaan alami, klasifikasi tulisan tangan, dan pemilihan halaman - Dengan pembaruan ini, Anda dapat memilih untuk mendapatkan keluaran baris teks dalam urutan pembacaan alami alih-alih urutan default kiri-ke-kanan dan atas-ke-bawah. Gunakan parameter kueri readingOrder yang baru dan setel ke nilai "alami" untuk output pesanan membaca yang lebih ramah manusia. Selain itu, untuk bahasa Latin, Kecerdasan Dokumen mengklasifikasikan baris teks sebagai gaya tulisan tangan atau tidak dan memberikan skor keyakinan.
Peningkatan kualitas model tanda terima bawaan Pembaruan ini mencakup banyak peningkatan kualitas untuk model Tanda Terima bawaan, terutama seputar ekstraksi item baris.
November 2020
Kecerdasan Dokumen v2.1-preview.2 telah dirilis dan menyertakan fitur-fitur berikut:
Model faktur bawaan baru - Model Faktur bawaan baru memungkinkan pelanggan mengambil faktur dalam berbagai format dan mengembalikan data terstruktur untuk mengotomatiskan pemrosesan faktur. Ini menggabungkan kemampuan Pengenalan Karakter Optik (OCR) kami yang kuat dengan model pembelajaran mendalam pemahaman faktur untuk mengekstrak informasi utama dari faktur dalam bahasa Inggris. Ini mengekstrak teks kunci, tabel, dan informasi seperti pelanggan, vendor, ID faktur, tanggal jatuh tempo faktur, total, jumlah terutang, jumlah pajak, pengiriman ke, dan tagihan ke.
Ekstraksi tabel yang ditingkatkan - Kecerdasan Dokumen sekarang menyediakan ekstraksi tabel yang ditingkatkan, yang menggabungkan kemampuan Pengenalan Karakter Optik (OCR) kami yang kuat dengan model ekstraksi tabel pembelajaran mendalam. Kecerdasan Dokumen dapat mengekstrak data dari tabel, termasuk tabel kompleks dengan kolom gabungan, baris, tanpa batas, dan lainnya.
Pelajari selengkapnya tentang ekstraksi Tata Letak.
Pembaruan pustaka klien - Versi terbaru pustaka klien untuk .NET, Python, Java, dan JavaScript mendukung API Document Intelligence 2.1.
Bahasa baru didukung: Jepang - Bahasa baru berikut sekarang didukung: untuk
AnalyzeLayout
danAnalyzeCustomForm
: Jepang (ja
). Dukungan bahasa.Indikasi gaya baris teks (tulisan tangan/lainnya) (hanya bahasa Latin) - Kecerdasan Dokumen sekarang menghasilkan objek yang
appearance
mengklasifikasikan apakah setiap baris teks bergaya tulisan tangan atau tidak, bersama dengan skor keyakinan. Fitur ini hanya didukung untuk bahasa Latin.Peningkatan kualitas - Peningkatan ekstraksi termasuk peningkatan ekstraksi satu digit.
Fitur coba-coba baru di Sampel Kecerdasan Dokumen dan Alat Pelabelan - Kemampuan untuk mencoba model Faktur, Tanda Terima, dan Kartu Nama bawaan dan API Tata Letak menggunakan alat Pelabelan Sampel Kecerdasan Dokumen. Lihat bagaimana data Anda diekstrak tanpa menulis kode apa pun.
Coba alat Pelabelan Sampel Kecerdasan Dokumen
- Perulangan Umpan Balik - Saat Menganalisis file melalui alat Pelabelan Sampel, kini Anda juga dapat menambahkannya ke kumpulan pelatihan dan menyesuaikan label jika perlu dan melatih untuk meningkatkan model.
- Dokumen Label Otomatis - Secara otomatis melabeli dokumen tambahan berdasarkan dokumen berlabel sebelumnya dalam proyek.
Agustus 2020
**Kecerdasan
v2.1-preview.1
Dokumen mencakup fitur-fitur berikut:- Referensi REST API tersedia - Lihat
v2.1-preview.1 reference
. - Bahasa baru yang didukung Selain bahasa Inggris, bahasa berikut sekarang didukung: untuk
Layout
danTrain Custom Model
: Inggris (en
), Tionghoa (Sederhana) (zh-Hans
), Belanda (nl
), Prancis (fr
), Jerman (de
), Italia (it
), Portugis (pt
) dan Spanyol (es
). - Kotak centang/ Deteksi Tanda Pilihan – Kecerdasan Dokumen mendukung deteksi dan ekstraksi tanda pilihan seperti kotak centang dan tombol radio. Tanda Pilihan diekstraksi dalam
Layout
dan kini Anda juga dapat memberi label dan melatih diTrain Custom Model
- Latih dengan Label untuk mengekstrak pasangan nilai kunci untuk tanda pilihan. - Model Compose - memungkinkan beberapa model dibuat dan dipanggil dengan satu ID model. Saat Anda mengirimkan dokumen untuk dianalisis dengan ID model yang disusun, langkah klasifikasi pertama dilakukan untuk mengarahkannya ke model kustom yang benar. Model Compose tersedia untuk
Train Custom Model
- Latih dengan label. - Nama model - tambahkan nama yang ramah ke model kustom Anda untuk pengelolaan dan pelacakan yang lebih mudah.
- Model bawaan baru untuk Kartu Nama untuk mengekstrak bidang umum dalam bahasa Inggris, kartu nama bahasa.
- Lokal baru untuk Tanda Terima bawaan selain EN-US, dukungan sekarang tersedia untuk EN-AU, EN-CA, EN-GB, EN-IN.
- Peningkatan kualitas untuk
Layout
,Train Custom Model
- Latih tanpa Label, dan Latih dengan Label.
- Referensi REST API tersedia - Lihat
v2.0 menyertakan pembaruan berikut:
- Pustaka klien untuk NET, Python, Java, dan JavaScript Umumnya Tersedia.
Sampel baru tersedia di GitHub.
- Resep Ekstraksi Pengetahuan - Forms Playbook mengumpulkan praktik terbaik dari keterlibatan pelanggan Inteligensi Dokumen nyata dan menyediakan sampel kode yang dapat digunakan, daftar periksa, dan alur sampel yang digunakan dalam mengembangkan proyek-proyek ini.
- Alat Pelabelan Sampel diperbarui untuk mendukung fungsionalitas v2.1 baru. Lihat mulai cepat ini untuk memulai alat.
- Sampel Intelligent Kiosk Document Intelligence menunjukkan cara mengintegrasikan
Analyze Receipt
danTrain Custom Model
- Melatih tanpa Label.
Juli 2020
- Referensi Kecerdasan Dokumen v2.0 tersedia - Lihat Referensi API v2.0 dan pustaka klien yang diperbarui untuk .NET, Python, Java, dan JavaScript.
Penyempurnaan tabel dan peningkatan Ekstraksi - mencakup peningkatan akurasi dan peningkatan ekstraksi tabel, khususnya, kemampuan untuk mempelajari header dan struktur tabel dalam latihan kustom tanpa label.
Dukungan mata uang - Deteksi dan ekstraksi simbol mata uang global.
Azure Gov - Kecerdasan Dokumen sekarang juga tersedia di Azure Gov.
Fitur keamanan yang disempurnakan:
- Bawa kunci Anda sendiri - Kecerdasan Dokumen secara otomatis mengenkripsi data Anda saat disimpan ke cloud untuk melindunginya dan untuk membantu Anda memenuhi komitmen keamanan dan kepatuhan organisasi Anda. Secara default, langganan Anda menggunakan kunci enkripsi yang dikelola Microsoft. Anda sekarang juga dapat mengelola langganan menggunakan kunci enkripsi Anda sendiri. Kunci yang dikelola pelanggan (CMK),juga dikenal sebagai Bring Your Own Key (BYOK), menawarkan fleksibilitas yang lebih luas untuk membuat, memutar, menonaktifkan, dan mencabut kontrol akses. Anda juga dapat mengaudit kunci enkripsi yang digunakan untuk melindungi data Anda.
- Titik akhir privat – Memungkinkan Anda di jaringan virtual untuk mengakses data dengan aman melalui Private Link.
2020 Juni
- CopyModel API ditambahkan ke pustaka klien - Anda sekarang dapat menggunakan pustaka klien untuk menyalin model dari satu langganan ke langganan lainnya. Lihat Mencadangkan dan memulihkan model untuk informasi umum tentang fitur ini.
- Integrasi Azure Active Directory - Sekarang Anda dapat menggunakan kredensial Azure AD untuk mengautentikasi objek klien Kecerdasan Dokumen Anda di pustaka klien.
- Perubahan khusus SDK - Perubahan ini mencakup penambahan fitur kecil dan perubahan yang melanggar. Untuk informasi selengkapnya, lihat log perubahan SDK.
April 2020
- Dukungan SDK untuk Pratinjau Umum DOCUMENT Intelligence API v2.0 - Bulan ini kami memperluas dukungan layanan kami untuk menyertakan pratinjau SDK untuk rilis Document Intelligence v2.0. Gunakan tautan ini untuk memulai bahasa pilihan Anda:
- .NET SDK
- Java SDK
- Python SDK
- JavaScript SDK
SDK baru mendukung semua fitur REST API v2.0 untuk Kecerdasan Dokumen. Anda dapat membagikan umpan balik Anda tentang pustaka klien melalui formulir Umpan Balik SDK.
Copy Custom Model Kini Anda dapat menyalin model antar kawasan dan langganan menggunakan fitur Copy Custom Model yang baru. Sebelum memanggil Copy Custom Model API, Anda harus terlebih dahulu mendapatkan otorisasi untuk menyalin ke sumber daya target. Otorisasi ini diamankan dengan memanggil operasi Copy Authorization terhadap titik akhir sumber daya target.
Buat REST API otorisasi salinan.
Salin REST API model kustom.
Peningkatan keamanan.
Kunci Terkelola Pelanggan sekarang tersedia untuk FormRecognizer. Untuk informasi selengkapnya, lihat Enkripsi data tidak aktif untuk Kecerdasan Dokumen.
Gunakan Identitas Terkelola untuk akses ke sumber daya Azure dengan Azure Active Directory. Untuk informasi selengkapnya, lihat Mengotorisasi akses ke identitas terkelola.
Maret 2020
- Jenis nilai untuk pelabelan Anda sekarang dapat menentukan jenis nilai yang Anda beri label dengan alat Pelabelan Sampel Kecerdasan Dokumen. Jenis dan variasi nilai berikut saat ini didukung:
string
- default,
no-whitespaces
,alphanumeric
- default,
number
- default,
currency
- default,
date
- default,
dmy
,mdy
,ymd
- default,
time
integer
Lihat panduan Alat Pelabelan Sampel untuk mempelajari cara menggunakan fitur ini.
Visualisasi tabel Alat Pelabelan Sampel sekarang menampilkan tabel yang dikenali dalam dokumen. Fitur ini memungkinkan Anda melihat tabel yang dikenali dan diekstrak dari dokumen sebelum pelabelan dan analisis. Fitur ini dapat diaktifkan/dinonaktifkan menggunakan opsi lapisan.
Gambar berikut adalah contoh bagaimana tabel dikenali dan diekstraksi:
Tabel yang diekstrak tersedia dalam output JSON di bawah
"pageResults"
.Penting
Tabel pelabelan tidak didukung. Jika tabel tidak dikenali dan diekstrak secara otomatis, Anda hanya dapat memberi label sebagai pasangan kunci/nilai. Saat memberi melabeli tabel sebagai pasangan kunci/nilai, beri label setiap sel sebagai nilai unik.
Penyempurnaan ekstraksi.
Rilis ini mencakup peningkatan ekstraksi dan peningkatan akurasi, khususnya, kemampuan untuk memberi label dan mengekstrak beberapa pasangan kunci/nilai dalam baris teks yang sama.
Alat Pelabelan Sampel sekarang menjadi sumber terbuka.
Alat Pelabelan Sampel Kecerdasan Dokumen sekarang tersedia sebagai proyek sumber terbuka. Anda dapat mengintegrasikannya ke dalam solusi Anda dan membuat perubahan khusus pelanggan untuk memenuhi kebutuhan Anda.
Untuk informasi selengkapnya tentang alat Pelabelan Sampel Kecerdasan Dokumen, tinjau dokumentasi yang tersedia di GitHub.
TLS
1.2 penegakan.TLS
1.2 sekarang diberlakukan untuk semua permintaan HTTP ke layanan ini. Untuk informasi selengkapnya, lihat Keamanan layanan Azure AI.
Januari 2020
Rilis ini memperkenalkan Kecerdasan Dokumen 2.0. Di bagian berikutnya, Anda akan menemukan informasi selengkapnya tentang fitur, penyempurnaan, dan perubahan baru.
Fitur baru
Model kustom
- Latih dengan label Kini Anda dapat melatih model kustom dengan data berlabel manual. Metode ini menghasilkan model yang berperforma lebih baik dan dapat menghasilkan model yang bekerja dengan bentuk kompleks atau bentuk yang berisi nilai tanpa kunci.
- API Asinkron Anda dapat menggunakan panggilan API asinkron untuk melatih dan menganalisis himpunan data dan file besar.
- Dukungan file TIFF Sekarang Anda dapat melatih dan mengekstrak data dari dokumen TIFF.
- Peningkatan akurasi ekstraksi.
Model tanda terima bawaan
- Jumlah tip Sekarang Anda dapat mengekstrak jumlah tip dan nilai tulisan tangan lainnya.
- Ekstraksi item baris Anda dapat mengekstrak nilai item baris dari tanda terima.
- Nilai keyakinan Anda dapat melihat keyakinan model untuk setiap nilai yang diekstraksi.
- Peningkatan akurasi ekstraksi.
- Ekstraksi tata letak Sekarang Anda dapat menggunakan Layout API untuk mengekstrak data teks dan data tabel dari formulir Anda.
Perubahan API model kustom
Semua API untuk pelatihan dan penggunaan model kustom diganti namanya, dan beberapa metode sinkron sekarang asinkron. Berikut ini adalah perubahan besar:
- Proses pelatihan model sekarang asinkron. Anda memulai pelatihan melalui panggilan API /custom/models. Panggilan ini mengembalikan ID operasi, yang dapat Anda teruskan ke custom/models/{modelID} untuk mengembalikan hasil pelatihan.
- Ekstraksi kunci/nilai sekarang dimulai oleh panggilan API /custom/models/{modelID}/analyze. Panggilan ini mengembalikan ID operasi, yang dapat Anda teruskan ke custom/models/{modelID}/analyzeResults/{resultID} untuk mengembalikan hasil ekstraksi.
- ID Operasi untuk operasi Kereta sekarang ditemukan di header Lokasi respons HTTP, bukan header Lokasi-Operasi.
Perubahan API tanda terima
API untuk membaca tanda terima penjualan diganti namanya.
Ekstraksi data tanda terima sekarang dimulai oleh panggilan API /prebuilt/receipt/analyze. Panggilan ini mengembalikan ID operasi, yang dapat Anda teruskan ke /prebuilt/receipt/analyzeResults/{resultID} untuk mengembalikan hasil ekstraksi.
Perubahan format output
- Respons JSON untuk semua panggilan API memiliki format baru. Beberapa kunci dan nilai ditambahkan, dihapus, atau diganti namanya. Lihat mulai cepat untuk contoh format JSON saat ini.