Q: Berapa skor akurasinya, dan bagaimana perhitungannya?

Output operasi build model kustom (v3.0 dan versi yang lebih baru) atau train (v2.1) mencakup perkiraan skor akurasi. Skor ini mewakili kemampuan model untuk memprediksi nilai berlabel secara akurat pada dokumen yang serupa secara visual. Akurasi diukur dalam rentang nilai persentase dari 0% (rendah) hingga 100% (tinggi). Untuk informasi selengkapnya, lihat Skor akurasi dan keyakinan .

Question 1

Apa itu Kecerdasan Dokumen Azure AI, dan apa yang terjadi pada Azure AI Form Recognizer?

Accepted Answer

Azure AI Document Intelligence adalah layanan berbasis cloud yang menggunakan model pembelajaran mesin untuk mengekstrak pasangan kunci/nilai, teks, dan tabel dari dokumen Anda. Hasil yang dikembalikan adalah output JSON terstruktur. Kasus penggunaan Kecerdasan Dokumen mencakup pemrosesan data otomatis, strategi berbasis data yang ditingkatkan, dan kemampuan pencarian dokumen yang diperkaya.

Kecerdasan Dokumen adalah bagian dari layanan Azure AI. Layanan Azure AI mencakup semua yang sebelumnya dikenal sebagai Azure Cognitive Services dan Azure Applied AI Services.

Nama sebelumnya untuk Kecerdasan Dokumen adalah Azure AI Form Recognizer. Form Recognizer resmi menjadi Document Intelligence pada Juli 2023.

Tidak ada perubahan pada harga. Nama Cognitive Services dan Applied AI Services terus digunakan dalam penagihan Azure, analisis biaya, daftar harga, dan API harga.

Tidak ada perubahan yang melanggar pada API atau pustaka klien (SDK). REST API dan SDK versi 2024-02-29-preview, 2023-10-31-preview, dan yang lebih baru diganti document intelligencenamanya.

Beberapa platform masih menunggu pembaruan penggantian nama. Dalam dokumentasi Microsoft, semua penyebutan Form Recognizer dan Kecerdasan Dokumen merujuk ke layanan Azure yang sama.

Question 2

Bagaimana Kecerdasan Dokumen terkait dengan AI generatif dokumen?

Accepted Answer

Anda dapat menggunakan solusi AI generatif dokumen untuk mengobrol dengan dokumen Anda, menghasilkan konten menawan dari dokumen tersebut, dan mengakses model Azure OpenAI Service pada data Anda. Dengan Azure AI Document Intelligence dan Azure OpenAI digabungkan, Anda dapat membangun aplikasi perusahaan untuk berinteraksi dengan dokumen Anda dengan lancar dengan menggunakan bahasa alami, dengan mudah menemukan jawaban dan mendapatkan wawasan berharga, dan menghasilkan konten baru dan menarik dari dokumen Anda yang sudah ada. Temukan detail selengkapnya di blog komunitas teknis.

Question 3

Bagaimana Kecerdasan Dokumen terkait dengan pengambilan-augmented generation?

Accepted Answer

Potongan semantik adalah langkah kunci dalam pengambilan-augmented generation (RAG) untuk memastikan penyimpanan dan pengambilannya yang efisien. Model tata letak Kecerdasan Dokumen menawarkan solusi komprehensif untuk kemampuan ekstraksi konten tingkat lanjut dan analisis struktur dokumen.

Dengan model tata letak, Anda dapat dengan mudah mengekstrak teks dan elemen struktural untuk membagi badan teks besar menjadi potongan yang lebih kecil dan bermakna berdasarkan konten semantik daripada pemisahan semena-mena. Anda kemudian dapat dengan mudah menghasilkan informasi yang diekstrak ke format Markdown, sehingga Anda dapat menentukan strategi penggugusan semantik Anda berdasarkan blok penyusun yang disediakan. Temukan detail selengkapnya dalam gambaran umum RAG di Kecerdasan Dokumen.

Question 4

Kasus penggunaan Kecerdasan Dokumen mana yang memerlukan pertimbangan khusus?

Accepted Answer

Berikan pertimbangan yang cermat untuk mendokumen proyek pemrosesan yang mencakup data keuangan, data kesehatan yang dilindungi, data pribadi, atau data yang sangat sensitif.

Pastikan untuk mematuhi semua persyaratan nasional/regional dan khusus industri.

Question 5

Bahasa apa yang didukung Oleh Inteligensi Dokumen?

Accepted Answer

Model universal berbasis pembelajaran mendalam dalam Kecerdasan Dokumen mendukung banyak bahasa yang dapat mengekstrak teks multibahasa dari gambar dan dokumen Anda, termasuk baris teks dengan bahasa campuran.

Dukungan bahasa bervariasi menurut fungsionalitas layanan Kecerdasan Dokumen. Untuk daftar lengkap teks tulisan tangan dan cetak yang didukung Kecerdasan Dokumen, lihat Dukungan bahasa.

Question 6

Apakah Kecerdasan Dokumen tersedia di wilayah Azure saya?

Accepted Answer

Kecerdasan Dokumen umumnya tersedia di banyak dari 60+ wilayah infrastruktur global Azure.

Pilih wilayah yang terbaik untuk Anda dan pelanggan Anda.

Question 7

Apakah Kecerdasan Dokumen terintegrasi dengan layanan Microsoft lain?

Accepted Answer

Ya, Kecerdasan Dokumen terintegrasi dengan layanan berikut:

Alur kerja AI Builder
Pencarian Azure AI
Azure Functions
Aplikasi Logika Azure

Question 8

Bagaimana Kecerdasan Dokumen terkait dengan pengenalan karakter optik?

Accepted Answer

Kecerdasan Dokumen adalah layanan berbasis cloud yang menggabungkan pengenalan karakter optik (OCR), analitik teks, dan klasifikasi teks kustom dari layanan Azure AI.

Kecerdasan Dokumen menggunakan OCR untuk mendeteksi dan mengekstrak informasi dari jenis huruf dan dokumen teks tulisan tangan yang didukung oleh AI untuk memberikan lebih banyak struktur dan informasi ke ekstraksi teks.

Question 9

Berapa lama model kustom saya tersedia untuk digunakan?

Accepted Answer

Model memiliki siklus hidup yang sama dengan versi API yang Anda gunakan untuk melatihnya. Model kustom yang dilatih dengan versi ketersediaan umum (GA) API memiliki siklus hidup yang sama dengan versi API. Ketika versi API tidak digunakan lagi, model tidak lagi tersedia untuk inferensi. Model yang dilatih dengan versi pratinjau API juga memiliki siklus hidup yang sama dengan API pratinjau.

Perkirakan penghentian API pratinjau dalam waktu tiga bulan setelah versi API pratinjau yang diperbarui atau versi GA API yang lebih baru.

Question 10

Berapa skor akurasinya, dan bagaimana perhitungannya?

Accepted Answer

Output operasi build model kustom (v3.0 dan versi yang lebih baru) atau train (v2.1) mencakup perkiraan skor akurasi. Skor ini mewakili kemampuan model untuk memprediksi nilai berlabel secara akurat pada dokumen yang serupa secara visual.

Akurasi diukur dalam rentang nilai persentase dari 0% (rendah) hingga 100% (tinggi).

Untuk informasi selengkapnya, lihat Skor akurasi dan keyakinan.

Question 11

Bagaimana cara meningkatkan skor akurasi?

Accepted Answer

Varians dalam struktur visual dokumen Anda dapat memengaruhi akurasi model. Berikut adalah beberapa tipnya:

Sertakan semua variasi dokumen dalam himpunan data pelatihan. Variasi mencakup format yang berbeda; misalnya, PDF digital versus yang dipindai.
Pisahkan jenis dokumen yang berbeda secara visual dan latih model yang berbeda.
Pastikan Anda tidak memiliki label asing.
Untuk pelabelan tanda tangan dan wilayah, jangan sertakan teks di sekitarnya.

Untuk informasi selengkapnya, lihat Skor akurasi dan keyakinan.

Question 12

Berapa skor keyakinan, dan bagaimana perhitungannya?

Accepted Answer

Skor keyakinan menunjukkan probabilitas dengan mengukur tingkat kepastian statistik bahwa hasil yang diekstraksi terdeteksi dengan benar.

Rentang nilai keyakinan adalah persentase dari 0% (rendah) hingga 100% (tinggi). Yang terbaik adalah menargetkan skor 80% atau lebih tinggi. Untuk kasus yang lebih sensitif, seperti catatan keuangan atau medis, kami merekomendasikan skor mendekati 100%. Anda juga dapat memerlukan tinjauan manusia.

Untuk informasi selengkapnya, lihat Skor akurasi dan keyakinan.

Question 13

Bagaimana saya bisa meningkatkan skor kepercayaan diri?

Accepted Answer

Setelah operasi analisis, tinjau output JSON. Uji nilai confidence untuk setiap hasil kunci/nilai di bagian simpul pageResults. Anda juga harus melihat skor kepercayaan di readResults node, yang sesuai dengan operasi membaca teks. Keyakinan hasil baca tidak memengaruhi keyakinan hasil ekstraksi kunci/nilai, jadi Anda harus memeriksa keduanya. Berikut adalah beberapa tipnya:

Jika nilai kepercayaan untuk objek readResults rendah, tingkatkan kualitas dokumen input Anda.
Jika skor keyakinan untuk pageResults objek rendah, pastikan bahwa dokumen yang Anda analisis memiliki jenis yang sama.
Pertimbangkan untuk memasukkan ulasan manusia ke dalam alur kerja Anda.
Gunakan formulir yang memiliki nilai berbeda di setiap bidang.
Untuk model kustom, gunakan satu set dokumen pelatihan yang lebih besar. Menandai lebih banyak dokumen mengajarkan model Anda untuk mengenali bidang dengan akurasi yang lebih besar.

Untuk informasi selengkapnya, lihat Skor akurasi dan keyakinan.

Question 14

Apa itu kotak pembatas?

Accepted Answer

Kotak pembatas (polygon dalam v3.0 dan versi yang lebih baru) adalah persegi panjang abstrak yang mengelilingi elemen teks dalam dokumen atau formulir. Ini digunakan sebagai titik referensi untuk deteksi objek.

Kotak pembatas menentukan posisi dengan menggunakan bidang koordinat x dan y yang disajikan dalam array empat pasangan numerik. Setiap pasangan mewakili sudut kotak dalam urutan berikut: kiri atas, kanan atas, kanan bawah, kiri bawah.

Untuk gambar, koordinat berada dalam piksel. Untuk PDF, koordinat berada dalam inci.

Question 15

Bisakah Inteligensi Dokumen membantu saya mengklasifikasikan dokumen?

Accepted Answer

Kecerdasan Dokumen menyediakan model klasifikasi kustom yang dapat menganalisis dokumen file tunggal atau beberapa file untuk mengidentifikasi apakah file input berisi salah satu jenis dokumen terlatih. Layanan ini mendukung skenario berikut:

Satu file yang berisi satu jenis dokumen, seperti formulir aplikasi pinjaman.
Satu file yang berisi beberapa dokumen. Contohnya adalah paket aplikasi pinjaman yang berisi formulir aplikasi pinjaman, payslip, dan rekening koran bank.
Satu file yang berisi beberapa instans dari dokumen yang sama. Contohnya adalah kumpulan faktur yang dipindai.

Untuk informasi selengkapnya, lihat gambaran umum model klasifikasi kustom.

Question 16

Apa saja opsi pengembangan untuk Kecerdasan Dokumen?

Accepted Answer

Kecerdasan Dokumen menawarkan opsi pengembangan terbaru dalam platform berikut:

REST API
Studio Kecerdasan Dokumen
C#/.NET
Java
JavaScript/TypeScript
Python

Question 17

Di mana saya dapat menemukan versi API yang didukung untuk SDK bahasa pemrograman terbaru?

Accepted Answer

Tabel ini menyediakan tautan ke versi SDK terbaru dan memperlihatkan hubungan antara SDK Kecerdasan Dokumen dan versi API yang didukung:

Referensi Azure SDK bahasa yang didukung	Versi API yang didukung
• C#/.NET: 4.0.0 • Java: 4.0.0 • JavaScript: 4.0.0 • Python 3.2.0	Pratinjau 10-31 2023 v3.0 v2.1 v2.0

Untuk informasi selengkapnya, lihat Klien yang didukung untuk v4.0 dan Klien yang didukung untuk v3.1.

Question 18

Apa perbedaan antara Kecerdasan Dokumen v3.0 dan v2.1, dan bagaimana cara bermigrasi ke versi terbaru?

Accepted Answer

Untuk meningkatkan kegunaan, Kecerdasan Dokumen v3.0 memperkenalkan pustaka klien yang sepenuhnya didesain ulang. Agar berhasil menggunakan fitur API Kecerdasan Dokumen terbaru, Anda memerlukan SDK terbaru, dan kode aplikasi Anda harus diperbarui untuk menggunakan klien baru.

Tabel ini menyediakan tautan ke instruksi terperinci untuk bermigrasi ke versi terbaru Kecerdasan Dokumen:

Bahasa/API	Panduan migrasi
REST API	v3
C#/.NET	4.0.0
Java	4.0.0
JavaScript	4.0.0
Python	3.2.0

Question 19

Format file mana yang didukung Oleh Inteligensi Dokumen? Apakah ada batasan ukuran untuk dokumen input?

Accepted Answer

Untuk mendapatkan hasil terbaik, lihat persyaratan input.

Question 20

Bagaimana cara menentukan rentang halaman yang akan dianalisis dalam dokumen?

Accepted Answer

pages Gunakan parameter (didukung dalam versi v2.1, v3.0, dan yang lebih baru dari REST API) untuk menentukan halaman untuk dokumen PDF dan TIFF beberapa halaman. Input yang diterima mencakup rentang berikut:

Satu halaman. Misalnya, jika Anda menentukan 1, 2, halaman 1 dan 2 diproses.
Rentang terbatas. Misalnya, jika Anda menentukan 2-5, halaman 2 hingga 5 diproses.
Rentang terbuka. Misalnya, jika Anda menentukan 5-, semua halaman dari halaman 5 diproses. Jika Anda menentukan -10, halaman 1 hingga 10 diproses.

Anda dapat mencampur parameter ini bersama-sama, dan rentang dapat tumpang tindih. Misalnya, jika Anda menentukan -5, 1, 3, 5-10, halaman 1 hingga 10 diproses.

Layanan menerima permintaan jika dapat memproses setidaknya satu halaman dokumen. Misalnya, menggunakan 5-100 pada dokumen lima halaman adalah input valid yang berarti halaman 5 diproses.

Jika Anda tidak menyediakan rentang halaman, seluruh dokumen akan diproses.

Question 21

Studio Kecerdasan Dokumen dan alat Pelabelan Sampel FOTT tersedia. Mana yang harus saya gunakan?

Accepted Answer

Sebagian besar waktu, kami merekomendasikan Document Intelligence Studio karena dapat mengurangi waktu Anda untuk mengonfigurasi sumber daya Kecerdasan Dokumen dan layanan penyimpanan.

Pertimbangkan untuk menggunakan Form OCR Testing Tool (FOTT) untuk skenario berikut:

Data Anda harus tetap berada dalam satu mesin. Gunakan alat Pelabelan Sampel FOTT dan kontainer Kecerdasan Dokumen.
Proyek Anda sangat bergantung pada Kecerdasan Dokumen v2.1, dan Anda ingin tetap menggunakan API v2.1.

Question 22

Bagaimana Azure menghitung harga untuk menggunakan Kecerdasan Dokumen?

Accepted Answer

Penagihan Kecerdasan Dokumen dihitung setiap bulan berdasarkan jenis model dan jumlah halaman yang dianalisis. Berikut beberapa detailnya:

Saat Anda mengirimkan dokumen untuk analisis, layanan menganalisis semua halaman kecuali Anda menentukan rentang halaman dengan menggunakan pages parameter dalam permintaan Anda. Saat layanan menganalisis dokumen Microsoft Excel dan PowerPoint melalui model baca, OCR, atau tata letak, layanan menghitung setiap lembar kerja Excel dan slide PowerPoint sebagai satu halaman.
Ketika layanan menganalisis file PDF dan TIFF, layanan menghitung setiap halaman dalam file PDF atau setiap gambar dalam file TIFF sebagai satu halaman tanpa batas karakter maksimum.
Ketika layanan menganalisis file Microsoft Word dan HTML yang didukung model baca dan tata letak, layanan menghitung halaman dalam blok masing-masing 3.000 karakter. Misalnya, jika dokumen Anda berisi 7.000 karakter, dua halaman dengan masing-masing 3.000 karakter dan satu halaman dengan 1.000 karakter menambahkan hingga total tiga halaman.
Saat Anda menggunakan model baca atau tata letak untuk menganalisis file Microsoft Word, Excel, PowerPoint, dan HTML, gambar yang disematkan atau ditautkan tidak didukung. Jadi layanan tidak menghitungnya sebagai gambar tambahan.
Melatih model kustom selalu gratis dengan Kecerdasan Dokumen. Anda hanya dikenakan biaya saat layanan menggunakan model untuk menganalisis dokumen.
Harga kontainer sama dengan harga layanan cloud.
Kecerdasan Dokumen menawarkan tingkat gratis (F0) tempat Anda dapat menguji semua fitur Kecerdasan Dokumen.
Kecerdasan Dokumen memiliki model harga berbasis komitmen untuk beban kerja besar.

Pelajari selengkapnya tentang opsi harga Azure AI Document Intelligence.

Question 23

Bagaimana cara memeriksa penggunaan Kecerdasan Dokumen saya dan memperkirakan harganya?

Accepted Answer

Anda dapat menemukan metrik penggunaan di dasbor metrik di portal Azure. Dasbor menampilkan jumlah halaman yang diproses Kecerdasan Dokumen Azure AI. Anda dapat memeriksa perkiraan biaya yang dihabiskan untuk sumber daya dengan menggunakan kalkulator harga Azure. Untuk petunjuk terperinci, lihat Memeriksa penggunaan dan memperkirakan biaya.

Question 24

Apa praktik terbaik untuk mengurangi pembatasan?

Accepted Answer

Kecerdasan Dokumen menggunakan penskalaan otomatis untuk menyediakan sumber daya komputasi yang diperlukan sesuai permintaan, sambil menjaga biaya pelanggan tetap rendah. Untuk mengurangi pembatasan selama autoscaling, kami merekomendasikan pendekatan berikut:

Terapkan logika coba lagi di aplikasi Anda.
Jika Anda menemukan bahwa Anda sedang dibatasi pada jumlah POST permintaan, pertimbangkan untuk menambahkan penundaan antara permintaan.
Tingkatkan beban kerja secara bertahap. Hindari perubahan tajam.
Buat permintaan dukungan untuk meningkatkan batas transaksi per detik (TPS).

Pelajari selengkapnya tentang kuota dan batas layanan Kecerdasan Dokumen.

Question 25

Berapa lama waktu yang diperlukan untuk menganalisis dokumen?

Accepted Answer

Waktu untuk menganalisis dokumen tergantung pada ukuran (misalnya, jumlah halaman) dan konten terkait di setiap halaman.

Kecerdasan Dokumen adalah layanan multipenyewa di mana latensi untuk dokumen serupa sebanding tetapi tidak selalu identik. Latensi adalah jumlah waktu yang diperlukan server API untuk menangani dan memproses permintaan masuk dan mengirimkan respons keluar ke klien. Varianbilitas sesekali dalam latensi dan performa melekat dalam layanan mikro berbasis layanan mikro, tanpa status, asinkron yang memproses gambar dan dokumen besar dalam skala besar.

Meskipun kami terus meningkatkan kemampuan perangkat keras dan kapasitas dan penskalaan, Anda mungkin masih memiliki masalah latensi saat runtime.

Question 26

Bagaimana cara mengumpulkan data pelatihan terbaik?

Accepted Answer

Saat Anda menggunakan model kustom Kecerdasan Dokumen, Anda menyediakan data pelatihan Anda sendiri. Berikut adalah beberapa tips untuk membantu melatih model Anda secara efektif:

Gunakan PDF berbasis teks, bukan PDF berbasis gambar jika memungkinkan. Salah satu cara untuk mengidentifikasi PDF berbasis gambar adalah dengan mencoba memilih teks tertentu dalam dokumen. Jika Anda hanya dapat memilih seluruh gambar teks, dokumen berbasis gambar, bukan berbasis teks.
Atur dokumen pelatihan Anda dengan menggunakan subfolder untuk setiap format (JPEG/JPG, PNG, BMP, PDF, atau TIFF).
Gunakan formulir yang telah menyelesaikan semua bidang yang tersedia.
Gunakan formulir dengan nilai berbeda di setiap bidang.
Jika gambar Anda berkualitas rendah, gunakan himpunan data yang lebih besar (lebih dari lima dokumen pelatihan).

Pelajari selengkapnya tentang membangun himpunan data pelatihan.

Question 27

Apa praktik terbaik untuk melatih model kustom yang sangat akurat?

Accepted Answer

Tingkat akurasi untuk model Anda tergantung pada kualitas materi pelatihan Anda. Berikut adalah beberapa tipnya:

Tentukan apakah Anda perlu menggunakan satu model atau beberapa model yang disusun menjadi satu model.
Akurasi model dapat menurun ketika Anda memiliki format berbeda yang dianalisis dengan satu model. Rencanakan segmentasi himpunan data Anda ke dalam folder, di mana setiap folder adalah templat unik. Latih satu model per folder, dan buat model yang dihasilkan menjadi satu titik akhir.
Formulir kustom bergantung pada templat visual yang konsisten. Jika formulir Anda memiliki variasi dengan format dan hentian halaman, pertimbangkan untuk menyegmentasikan himpunan data Anda untuk melatih beberapa model.
Pastikan Anda memiliki himpunan data seimbang dengan memperhitungkan format, jenis dokumen, dan struktur.

Pelajari model yang disusun lebih lanjut.

Question 28

Bisakah saya melatih ulang model kustom?

Accepted Answer

Kecerdasan Dokumen tidak memiliki operasi pelatihan ulang eksplisit. Setiap operasi kereta menghasilkan model baru.

Jika Anda menemukan bahwa model Anda perlu pelatihan ulang, tambahkan lebih banyak sampel ke himpunan data pelatihan Anda dan latih model baru.

Question 29

Berapa banyak model kustom yang dapat saya tulis menjadi satu model kustom?

Accepted Answer

Dengan operasi Penyusunan Model, Anda dapat menetapkan hingga 200 model kustom yang dilatih ke satu ID model. Saat Anda membuat Analyze Document permintaan dengan ID model yang terdiri, Kecerdasan Dokumen mengklasifikasikan formulir yang dikirimkan, memilih model terbaik, dan mengembalikan hasilnya. Model Compose saat ini hanya tersedia untuk model kustom yang dilatih dengan label.

Menganalisis dokumen dengan menggunakan model yang terdiri identik dengan menganalisis dokumen dengan menggunakan satu model. Hasilnya Analyze Document mengembalikan docType properti yang menunjukkan model komponen mana yang Anda pilih untuk menganalisis dokumen. Tidak ada perubahan harga untuk menganalisis dokumen dengan menggunakan model kustom individual atau model kustom yang disusam.

Pelajari model yang disusun lebih lanjut.

Question 30

Jika jumlah model yang ingin saya buat melebihi batas atas model yang disusupi, apa alternatifnya?

Accepted Answer

Anda dapat menggunakan salah satu alternatif berikut:

Klasifikasikan dokumen sebelum memanggil model kustom. Anda dapat menggunakan model baca dan membuat klasifikasi berdasarkan teks yang diekstrak dari dokumen dan frasa tertentu dengan menggunakan sumber seperti kode, ekspresi reguler, atau pencarian.
Jika Anda ingin mengekstrak bidang yang sama dari berbagai dokumen terstruktur, semistruktur, dan tidak terstruktur, pertimbangkan untuk menggunakan model neural kustom pembelajaran mendalam. Pelajari selengkapnya tentang perbedaan antara model templat kustom dan model neural kustom.

Question 31

Bagaimana cara memperbaiki model di luar pelatihan awal?

Accepted Answer

Setiap operasi pelatihan menghasilkan model baru.

Buat himpunan data untuk templat baru Anda.
Beri label dan latih model baru.
Validasi bahwa model baru berkinerja baik untuk jenis dokumen spesifik Anda.
Susun model baru Anda dengan model yang ada menjadi satu titik akhir. Kecerdasan Dokumen kemudian dapat menentukan model terbaik untuk setiap dokumen yang akan dianalisis.

Pelajari model yang disusun lebih lanjut.

Question 32

Aku sedang membangun model kustom. Apa yang dikembalikan label deteksi tanda tangan?

Accepted Answer

Deteksi tanda tangan mencari keberadaan tanda tangan, bukan identitas orang yang menandatangani dokumen.

Jika model mengembalikan unsigned untuk deteksi tanda tangan, model tidak menemukan tanda tangan di bidang yang ditentukan.

Question 33

Apa yang harus saya pertimbangkan dan apa praktik terbaik untuk mengekstrak tabel dari dokumen?

Accepted Answer

Anda dapat memulai dengan model tata letak Kecerdasan Dokumen untuk mengekstrak teks, tabel, tanda pilihan, dan informasi struktur dari dokumen dan gambar. Anda juga dapat mempertimbangkan faktor-faktor berikut:

Apakah data yang ingin Anda ekstrak disajikan sebagai tabel, dan apakah struktur tabel bermakna?
Jika data tidak dalam format tabel, bisakah data pas dalam kisi dua dimensi?
Apakah tabel Anda mencakup beberapa halaman? Jika demikian, untuk menghindari harus melabeli semua halaman, pisahkan PDF menjadi halaman sebelum mengirimkannya ke Kecerdasan Dokumen. Setelah analisis, pasca-proses halaman ke satu tabel.
Jika Anda membuat model kustom, lihat Pelabelan sebagai tabel. Tabel dinamis memiliki jumlah variabel baris untuk setiap kolom. Tabel tetap memiliki jumlah baris konstan untuk setiap kolom.

Question 34

Bagaimana saya bisa memindahkan model terlatih saya dari satu lingkungan (seperti beta) ke lingkungan lain (seperti produksi)?

Accepted Answer

Anda dapat menggunakan COPY API untuk menyalin model kustom dari satu akun Kecerdasan Dokumen ke akun lain yang ada di wilayah geografis yang didukung. Untuk instruksi terperinci, lihat Pemulihan bencana.

Operasi penyalinan terbatas pada menyalin model dalam lingkungan cloud tertentu tempat Anda melatih model. Misalnya, menyalin model dari cloud publik ke cloud Azure Government tidak didukung.

Question 35

Mengapa saya dikenakan biaya untuk tata letak saat menjalankan pelatihan kustom?

Accepted Answer

Tata letak diperlukan untuk menghasilkan label untuk himpunan data Anda. Jika himpunan data yang Anda gunakan untuk pelatihan kustom tidak memiliki file label yang tersedia, layanan akan menghasilkannya untuk Anda.

Question 36

Saya dapat mengakses akun penyimpanan saya beberapa hari yang lalu. Mengapa saya sekarang mengalami kesulitan untuk menyambungkan kembali?

Accepted Answer

Saat Anda membuat tanda tangan akses bersama, durasi defaultnya adalah 48 jam. Setelah 48 jam, Anda perlu membuat token baru.

Pertimbangkan untuk mengatur periode durasi yang lebih lama untuk waktu Anda menggunakan akun penyimpanan Anda dengan Kecerdasan Dokumen.

Question 37

Jika akun penyimpanan saya berada di belakang jaringan virtual atau firewall, bagaimana cara memberikan akses Kecerdasan Dokumen ke data?

Accepted Answer

Jika Anda memiliki akun penyimpanan Azure yang dilindungi oleh jaringan virtual atau firewall, Kecerdasan Dokumen tidak dapat langsung mengakses akun penyimpanan Anda. Namun, akses dan autentikasi akun penyimpanan Azure privat mendukung identitas terkelola untuk sumber daya Azure. Saat Anda menggunakan identitas terkelola, layanan Kecerdasan Dokumen dapat mengakses akun penyimpanan Anda dengan menggunakan kredensial yang ditetapkan.

Jika Anda berniat menganalisis data akun penyimpanan privat Anda dengan menggunakan FOTT, Anda harus menyebarkan alat di belakang jaringan virtual atau firewall.

Pelajari cara membuat dan menggunakan identitas terkelola untuk sumber daya Kecerdasan Dokumen Anda.

Question 38

Izin apa yang saya perlukan untuk mengakses Document Intelligence Studio?

Accepted Answer

Anda memerlukan akun dan langganan Azure aktif dengan setidaknya peran Pembaca untuk mengakses Studio Kecerdasan Dokumen.

Untuk analisis dokumen dan model bawaan, berikut adalah persyaratan peran untuk skenario pengguna:

Dasar
- Pengguna Cognitive Services: Anda memerlukan peran ini untuk sumber daya multi-layanan Kecerdasan Dokumen atau Azure Cognitive Services untuk menggunakan Studio Kecerdasan Dokumen.
Lanjutan
- Kontributor: Anda memerlukan peran ini untuk membuat grup sumber daya atau sumber daya Kecerdasan Dokumen. Peran Kontributor tidak memungkinkan Anda untuk mencantumkan kunci untuk Cognitive Services. Untuk menggunakan Studio Kecerdasan Dokumen, Anda masih memerlukan peran Pengguna Cognitive Services.

Untuk proyek model kustom, berikut adalah persyaratan peran untuk skenario pengguna:

Dasar
- Pengguna Cognitive Services: Anda memerlukan peran ini untuk sumber daya multi-layanan Kecerdasan Dokumen atau Cognitive Services untuk melatih model kustom atau menganalisis dengan model terlatih.
- Kontributor Data Blob Penyimpanan: Anda memerlukan peran ini untuk akun penyimpanan guna membuat proyek dan melabeli data.
Lanjutan
- Kontributor Akun Penyimpanan: Anda memerlukan peran ini agar akun penyimpanan menyiapkan pengaturan berbagi sumber daya lintas asal (CORS). Ini adalah upaya satu kali jika Anda menggunakan kembali akun penyimpanan yang sama.
  
  Peran Kontributor tidak memungkinkan Anda mengakses data di blob Anda. Untuk menggunakan Studio Kecerdasan Dokumen, Anda masih memerlukan peran Kontributor Data Blob Penyimpanan.
- Kontributor: Anda memerlukan peran ini untuk membuat grup sumber daya dan sumber daya. Peran Kontributor tidak memberi Anda akses untuk menggunakan sumber daya atau penyimpanan yang dibuat. Untuk menggunakan Studio Kecerdasan Dokumen, Anda masih memerlukan peran dasar.

Untuk informasi selengkapnya, lihat Peran bawaan Microsoft Entra dan bagian tentang penetapan peran Azure di mulai cepat Document Intelligence Studio.

Question 39

Saya memiliki beberapa halaman dalam sebuah dokumen. Mengapa hanya dua halaman yang dianalisis di Document Intelligence Studio?

Accepted Answer

Untuk sumber daya tingkat gratis (F0), hanya dua halaman pertama yang dianalisis apakah Anda menggunakan Document Intelligence Studio, REST API, atau SDK.

Di Studio Kecerdasan Dokumen, pilih tombol Pengaturan (roda gigi), pilih tab Sumber Daya, dan periksa tingkat harga yang Anda gunakan untuk menganalisis dokumen. Jika Anda ingin menganalisis semua halaman dalam dokumen, ubah ke sumber daya berbayar (S0).

Question 40

Bagaimana cara mengubah direktori atau langganan di Document Intelligence Studio?

Accepted Answer

Untuk mengubah direktori di Document Intelligence Studio, pilih tombol Pengaturan (gigi). Di bawah Direktori, pilih direktori dari daftar, lalu pilih Alihkan Direktori. Anda diminta untuk masuk lagi setelah mengalihkan direktori.

Untuk mengubah langganan atau sumber daya, buka tab Sumber Daya di bawah Pengaturan.

Question 41

Mengapa saya menerima kesalahan penyimpanan pada berbagi proyek, pelabelan otomatis, atau operasi peningkatan OCR saat sumber daya akun penyimpanan saya dikonfigurasi dengan firewall atau jaringan virtual?

Accepted Answer

Lihat Identitas terkelola untuk Kecerdasan Dokumen untuk menyiapkan sumber daya Azure Anda.

Question 42

Mengapa saya menerima kesalahan "Akses ditolak karena aturan Virtual Network/Firewall" pada operasi pelabelan otomatis atau peningkatan OCR saat sumber daya Kecerdasan Dokumen saya dikonfigurasi dengan firewall atau jaringan virtual?

Accepted Answer

Anda perlu menambahkan alamat IP khusus 20.3.165.95 ke daftar izin firewall untuk sumber daya Kecerdasan Dokumen Anda.

Question 43

Dapatkah saya menggunakan kembali atau menyesuaikan pengalaman pelabelan dari Document Intelligence Studio dan membuatnya ke dalam aplikasi saya sendiri?

Accepted Answer

Ya. Pengalaman pelabelan dari Document Intelligence Studio sumber terbuka d dalam repositori Toolkit.

Question 44

Mengapa saya menerima kesalahan "Form Recognizer Not Found" saat membuka proyek kustom saya?

Accepted Answer

Sumber daya Kecerdasan Dokumen Anda yang terikat pada proyek kustom ini telah dihapus atau dipindahkan ke grup sumber daya lain. Ada dua cara untuk mengatasi masalah ini:

Buat ulang sumber daya Kecerdasan Dokumen di bawah langganan dan grup sumber daya yang sama dengan nama yang sama.
Buat ulang proyek kustom dengan sumber daya Kecerdasan Dokumen yang dimigrasikan dan tentukan akun penyimpanan yang sama.

Question 45

Apakah saya memerlukan koneksi internet untuk menggunakan kontainer Kecerdasan Dokumen?

Accepted Answer

Ya. Kontainer Kecerdasan Dokumen memerlukan konektivitas internet untuk mengirim informasi penagihan ke Azure. Pelajari selengkapnya tentang keamanan Azure container.

Question 46

Apa perbedaan antara kontainer yang terputus dan terhubung?

Accepted Answer

Koneksi kontainer mengirim informasi penagihan ke Azure dengan menggunakan sumber daya Kecerdasan Dokumen di akun Azure Anda. Dengan kontainer yang terhubung, konektivitas internet diperlukan untuk mengirim informasi penagihan ke Azure.

Kontainer terputus memungkinkan Anda menggunakan API yang terputus dari internet. Informasi penagihan tidak dikirim melalui internet. Sebagai gantinya, Anda dikenakan biaya berdasarkan tingkat komitmen yang dibeli. Saat ini, penggunaan kontainer yang terputus tersedia untuk model kustom dan faktur Kecerdasan Dokumen.

Kemampuan model yang disediakan dalam kontainer yang terhubung dan terputus sama dan didukung oleh Kecerdasan Dokumen v2.1.

Question 47

Data apa yang dikirim kontainer yang terhubung ke cloud?

Accepted Answer

Kontainer tersambung Kecerdasan Dokumen mengirim informasi tagihan ke Azure dengan menggunakan sumber daya Kecerdasan Dokumen di akun Azure Anda. Kontainer Azure Cognitive Services tidak mengirim data pelanggan, seperti gambar atau teks yang sedang dianalisis, ke Microsoft.

Untuk contoh informasi yang dikirim kontainer yang tersambung ke Microsoft untuk penagihan, lihat FAQ kontainer Azure AI.

Question 48

Mengapa saya menerima kesalahan "Kontainer tidak dalam keadaan valid. Validasi langganan gagal dengan status kunci API 'OutOfQuota' kehabisan kuota"?

Accepted Answer

Kontainer tersambung Kecerdasan Dokumen mengirim informasi tagihan ke Azure dengan menggunakan sumber daya Kecerdasan Dokumen di akun Azure Anda. Kontainer Azure Cognitive Services tidak mengirim data pelanggan, seperti gambar atau teks yang sedang dianalisis, ke Microsoft.

Untuk contoh informasi yang dikirim kontainer yang tersambung ke Microsoft untuk penagihan, lihat FAQ kontainer Azure AI.

Question 49

Dapatkah saya menggunakan penyimpanan lokal untuk kontainer Document Intelligence Sample Labeling Tool (FOTT)?

Accepted Answer

FOTT memiliki versi yang menggunakan penyimpanan lokal. Versi perlu dipasang pada mesin Windows. Anda dapat memasangnya dari lokasi ini.

Pada halaman proyek, tentukan URI folder label sebagai /shared atau /shared/sub-dir jika file pelabelan Anda berada dalam subdirektori. Semua perilaku Alat Pelabelan Sampel Kecerdasan Dokumen lainnya sama dengan layanan yang dihosting.

Question 50

Apa praktik terbaik untuk meningkatkan skala?

Accepted Answer

Untuk panggilan asinkron, Anda dapat menjalankan beberapa kontainer dengan penyimpanan bersama. Kontainer yang memproses POST panggilan analisis menyimpan output dalam penyimpanan. Kemudian, kontainer lain dapat mengambil hasil dari penyimpanan dan melayani GET panggilan. ID permintaan tidak terkait dengan kontainer.

Untuk panggilan sinkron, Anda dapat menjalankan beberapa kontainer, tetapi hanya satu kontainer yang melayani permintaan. Karena ini adalah panggilan pemblokiran, kontainer apa pun dari kumpulan dapat melayani permintaan dan mengirim respons. Di sini, hanya satu kontainer yang terkait dengan permintaan pada satu waktu, dan tidak diperlukan polling.

Question 51

Bagaimana cara menyiapkan kontainer dengan penyimpanan bersama?

Accepted Answer

Kontainer menggunakan Mounts:Shared properti saat memulai untuk menentukan penyimpanan bersama untuk menyimpan file pemrosesan. Untuk melihat penggunaan properti ini, lihat dokumentasi kontainer.

Question 52

Apa saja metode dan persyaratan untuk mengautentikasi permintaan ke layanan Azure AI?

Accepted Answer

Setiap permintaan ke Azure Cognitive Service harus menyertakan header autentikasi. Anda dapat mengautentikasi permintaan dengan menggunakan beberapa metode:

Autentikasi dengan kunci layanan tunggal atau beberapa layanan .
Autentikasi dengan ID Microsoft Entra.
Aktifkan kunci yang dikelola pelanggan.
Mengotorisasi dari identitas terkelola.

Question 53

Apakah Inteligensi Dokumen menyimpan data saya?

Accepted Answer

Untuk semua fitur, Kecerdasan Dokumen untuk sementara menyimpan data dan menghasilkan Azure Storage di wilayah yang sama dengan permintaan. Data Anda kemudian dihapus dalam waktu 24 jam sejak Anda mengirimkan permintaan analisis.

Pelajari selengkapnya tentang data, privasi, dan keamanan untuk Kecerdasan Dokumen.

Question 54

Bagaimana model kustom terlatih saya disimpan dan digunakan dalam Kecerdasan Dokumen?

Accepted Answer

Output sementara setelah analisis dan pelabelan disimpan di lokasi Azure Storage yang sama tempat Anda menyimpan data pelatihan Anda. Model kustom terlatih disimpan di Azure Storage di wilayah yang sama, dan secara logis diisolasi dengan langganan Azure dan kredensial API Anda.

Question 55

Di mana saya dapat menemukan solusi lainnya untuk pertanyaan Inteligensi Dokumen Azure AI saya?

Accepted Answer

Tanya Jawab Microsoft adalah rumah untuk pertanyaan dan jawaban teknis di Microsoft. Anda dapat memfilter kueri yang khusus untuk Kecerdasan Dokumen.

Question 56

Apa yang harus saya lakukan jika layanan tidak mengenali teks tertentu, atau mengenalinya dengan salah, saat saya melabeli dokumen?

Accepted Answer

Kami terus memperbarui dan meningkatkan model OCR Kecerdasan Dokumen. Anda dapat mengirim email ke tim Kecerdasan Dokumen. Jika memungkinkan, bagikan dokumen sampel dengan masalah yang disorot.

Tanya Jawab Umum Kecerdasan Dokumen Azure AI

Konsep umum

Apa itu Kecerdasan Dokumen Azure AI, dan apa yang terjadi pada Azure AI Form Recognizer?

Bagaimana Kecerdasan Dokumen terkait dengan AI generatif dokumen?

Bagaimana Kecerdasan Dokumen terkait dengan pengambilan-augmented generation?

Kasus penggunaan Kecerdasan Dokumen mana yang memerlukan pertimbangan khusus?

Bahasa apa yang didukung Oleh Inteligensi Dokumen?

Apakah Kecerdasan Dokumen tersedia di wilayah Azure saya?

Apakah Kecerdasan Dokumen terintegrasi dengan layanan Microsoft lain?

Bagaimana Kecerdasan Dokumen terkait dengan pengenalan karakter optik?

Berapa lama model kustom saya tersedia untuk digunakan?

Berapa skor akurasinya, dan bagaimana perhitungannya?

Bagaimana cara meningkatkan skor akurasi?

Berapa skor keyakinan, dan bagaimana perhitungannya?

Bagaimana saya bisa meningkatkan skor kepercayaan diri?

Apa itu kotak pembatas?

Bisakah Inteligensi Dokumen membantu saya mengklasifikasikan dokumen?

Pengembangan aplikasi

Apa saja opsi pengembangan untuk Kecerdasan Dokumen?

Di mana saya dapat menemukan versi API yang didukung untuk SDK bahasa pemrograman terbaru?

Apa perbedaan antara Kecerdasan Dokumen v3.0 dan v2.1, dan bagaimana cara bermigrasi ke versi terbaru?

Format file mana yang didukung Oleh Inteligensi Dokumen? Apakah ada batasan ukuran untuk dokumen input?

Bagaimana cara menentukan rentang halaman yang akan dianalisis dalam dokumen?

Studio Kecerdasan Dokumen dan alat Pelabelan Sampel FOTT tersedia. Mana yang harus saya gunakan?

Batas layanan dan harga

Bagaimana Azure menghitung harga untuk menggunakan Kecerdasan Dokumen?

Bagaimana cara memeriksa penggunaan Kecerdasan Dokumen saya dan memperkirakan harganya?

Apa praktik terbaik untuk mengurangi pembatasan?

Berapa lama waktu yang diperlukan untuk menganalisis dokumen?

Model kustom

Bagaimana cara mengumpulkan data pelatihan terbaik?

Apa praktik terbaik untuk melatih model kustom yang sangat akurat?

Bisakah saya melatih ulang model kustom?

Berapa banyak model kustom yang dapat saya tulis menjadi satu model kustom?

Jika jumlah model yang ingin saya buat melebihi batas atas model yang disusupi, apa alternatifnya?

Bagaimana cara memperbaiki model di luar pelatihan awal?

Aku sedang membangun model kustom. Apa yang dikembalikan label deteksi tanda tangan?

Apa yang harus saya pertimbangkan dan apa praktik terbaik untuk mengekstrak tabel dari dokumen?

Bagaimana saya bisa memindahkan model terlatih saya dari satu lingkungan (seperti beta) ke lingkungan lain (seperti produksi)?

Mengapa saya dikenakan biaya untuk tata letak saat menjalankan pelatihan kustom?

Akun Penyimpanan

Saya dapat mengakses akun penyimpanan saya beberapa hari yang lalu. Mengapa saya sekarang mengalami kesulitan untuk menyambungkan kembali?

Jika akun penyimpanan saya berada di belakang jaringan virtual atau firewall, bagaimana cara memberikan akses Kecerdasan Dokumen ke data?

Studio Kecerdasan Dokumen

Izin apa yang saya perlukan untuk mengakses Document Intelligence Studio?

Saya memiliki beberapa halaman dalam sebuah dokumen. Mengapa hanya dua halaman yang dianalisis di Document Intelligence Studio?

Bagaimana cara mengubah direktori atau langganan di Document Intelligence Studio?

Mengapa saya menerima kesalahan penyimpanan pada berbagi proyek, pelabelan otomatis, atau operasi peningkatan OCR saat sumber daya akun penyimpanan saya dikonfigurasi dengan firewall atau jaringan virtual?

Mengapa saya menerima kesalahan "Akses ditolak karena aturan Virtual Network/Firewall" pada operasi pelabelan otomatis atau peningkatan OCR saat sumber daya Kecerdasan Dokumen saya dikonfigurasi dengan firewall atau jaringan virtual?

Dapatkah saya menggunakan kembali atau menyesuaikan pengalaman pelabelan dari Document Intelligence Studio dan membuatnya ke dalam aplikasi saya sendiri?

Mengapa saya menerima kesalahan "Form Recognizer Not Found" saat membuka proyek kustom saya?

Kontainer

Apakah saya memerlukan koneksi internet untuk menggunakan kontainer Kecerdasan Dokumen?

Apa perbedaan antara kontainer yang terputus dan terhubung?

Data apa yang dikirim kontainer yang terhubung ke cloud?

Mengapa saya menerima kesalahan "Kontainer tidak dalam keadaan valid. Validasi langganan gagal dengan status kunci API 'OutOfQuota' kehabisan kuota"?

Dapatkah saya menggunakan penyimpanan lokal untuk kontainer Document Intelligence Sample Labeling Tool (FOTT)?

Apa praktik terbaik untuk meningkatkan skala?

Bagaimana cara menyiapkan kontainer dengan penyimpanan bersama?

Keamanan dan privasi

Apa saja metode dan persyaratan untuk mengautentikasi permintaan ke layanan Azure AI?

Apakah Inteligensi Dokumen menyimpan data saya?

Bagaimana model kustom terlatih saya disimpan dan digunakan dalam Kecerdasan Dokumen?

Lebih banyak bantuan dan dukungan

Di mana saya dapat menemukan solusi lainnya untuk pertanyaan Inteligensi Dokumen Azure AI saya?

Apa yang harus saya lakukan jika layanan tidak mengenali teks tertentu, atau mengenalinya dengan salah, saat saya melabeli dokumen?

Saran dan Komentar

Sumber Daya Tambahan: