Tanya Jawab Umum Kecerdasan Dokumen Azure AI

Konten ini berlaku untuk:tanda centangv4.0 (pratinjau)tanda centangv3.1 (GA)tanda centangv3.0 (GA)tanda centangv2.1 (GA)

Konsep umum

Apa itu Kecerdasan Dokumen Azure AI, dan apa yang terjadi pada Azure AI Form Recognizer?

Azure AI Document Intelligence adalah layanan berbasis cloud yang menggunakan model pembelajaran mesin untuk mengekstrak pasangan kunci/nilai, teks, dan tabel dari dokumen Anda. Hasil yang dikembalikan adalah output JSON terstruktur. Kasus penggunaan Kecerdasan Dokumen mencakup pemrosesan data otomatis, strategi berbasis data yang ditingkatkan, dan kemampuan pencarian dokumen yang diperkaya.

Kecerdasan Dokumen adalah bagian dari layanan Azure AI. Layanan Azure AI mencakup semua yang sebelumnya dikenal sebagai Azure Cognitive Services dan Azure Applied AI Services.

Nama sebelumnya untuk Kecerdasan Dokumen adalah Azure AI Form Recognizer. Form Recognizer resmi menjadi Document Intelligence pada Juli 2023.

Tidak ada perubahan pada harga. Nama Cognitive Services dan Applied AI Services terus digunakan dalam penagihan Azure, analisis biaya, daftar harga, dan API harga.

Tidak ada perubahan yang melanggar pada API atau pustaka klien (SDK). REST API dan SDK versi 2024-02-29-preview, 2023-10-31-preview, dan yang lebih baru diganti document intelligencenamanya.

Beberapa platform masih menunggu pembaruan penggantian nama. Dalam dokumentasi Microsoft, semua penyebutan Form Recognizer dan Kecerdasan Dokumen merujuk ke layanan Azure yang sama.

Bagaimana Kecerdasan Dokumen terkait dengan AI generatif dokumen?

Anda dapat menggunakan solusi AI generatif dokumen untuk mengobrol dengan dokumen Anda, menghasilkan konten menawan dari dokumen tersebut, dan mengakses model Azure OpenAI Service pada data Anda. Dengan Azure AI Document Intelligence dan Azure OpenAI digabungkan, Anda dapat membangun aplikasi perusahaan untuk berinteraksi dengan dokumen Anda dengan lancar dengan menggunakan bahasa alami, dengan mudah menemukan jawaban dan mendapatkan wawasan berharga, dan menghasilkan konten baru dan menarik dari dokumen Anda yang sudah ada. Temukan detail selengkapnya di blog komunitas teknis.

Bagaimana Kecerdasan Dokumen terkait dengan pengambilan-augmented generation?

Potongan semantik adalah langkah kunci dalam pengambilan-augmented generation (RAG) untuk memastikan penyimpanan dan pengambilannya yang efisien. Model tata letak Kecerdasan Dokumen menawarkan solusi komprehensif untuk kemampuan ekstraksi konten tingkat lanjut dan analisis struktur dokumen.

Dengan model tata letak, Anda dapat dengan mudah mengekstrak teks dan elemen struktural untuk membagi badan teks besar menjadi potongan yang lebih kecil dan bermakna berdasarkan konten semantik daripada pemisahan semena-mena. Anda kemudian dapat dengan mudah menghasilkan informasi yang diekstrak ke format Markdown, sehingga Anda dapat menentukan strategi penggugusan semantik Anda berdasarkan blok penyusun yang disediakan. Temukan detail selengkapnya dalam gambaran umum RAG di Kecerdasan Dokumen.

Kasus penggunaan Kecerdasan Dokumen mana yang memerlukan pertimbangan khusus?

Berikan pertimbangan yang cermat untuk mendokumen proyek pemrosesan yang mencakup data keuangan, data kesehatan yang dilindungi, data pribadi, atau data yang sangat sensitif.

Pastikan untuk mematuhi semua persyaratan nasional/regional dan khusus industri.

Bahasa apa yang didukung Oleh Inteligensi Dokumen?

Model universal berbasis pembelajaran mendalam dalam Kecerdasan Dokumen mendukung banyak bahasa yang dapat mengekstrak teks multibahasa dari gambar dan dokumen Anda, termasuk baris teks dengan bahasa campuran.

Dukungan bahasa bervariasi menurut fungsionalitas layanan Kecerdasan Dokumen. Untuk daftar lengkap teks tulisan tangan dan cetak yang didukung Kecerdasan Dokumen, lihat Dukungan bahasa.

Apakah Kecerdasan Dokumen tersedia di wilayah Azure saya?

Kecerdasan Dokumen umumnya tersedia di banyak dari 60+ wilayah infrastruktur global Azure.

Pilih wilayah yang terbaik untuk Anda dan pelanggan Anda.

Apakah Kecerdasan Dokumen terintegrasi dengan layanan Microsoft lain?

Ya, Kecerdasan Dokumen terintegrasi dengan layanan berikut:

Bagaimana Kecerdasan Dokumen terkait dengan pengenalan karakter optik?

Kecerdasan Dokumen adalah layanan berbasis cloud yang menggabungkan pengenalan karakter optik (OCR), analitik teks, dan klasifikasi teks kustom dari layanan Azure AI.

Kecerdasan Dokumen menggunakan OCR untuk mendeteksi dan mengekstrak informasi dari jenis huruf dan dokumen teks tulisan tangan yang didukung oleh AI untuk memberikan lebih banyak struktur dan informasi ke ekstraksi teks.

Berapa lama model kustom saya tersedia untuk digunakan?

Model memiliki siklus hidup yang sama dengan versi API yang Anda gunakan untuk melatihnya. Model kustom yang dilatih dengan versi ketersediaan umum (GA) API memiliki siklus hidup yang sama dengan versi API. Ketika versi API tidak digunakan lagi, model tidak lagi tersedia untuk inferensi. Model yang dilatih dengan versi pratinjau API juga memiliki siklus hidup yang sama dengan API pratinjau.

Perkirakan penghentian API pratinjau dalam waktu tiga bulan setelah versi API pratinjau yang diperbarui atau versi GA API yang lebih baru.

Berapa skor akurasinya, dan bagaimana perhitungannya?

Output operasi build model kustom (v3.0 dan versi yang lebih baru) atau train (v2.1) mencakup perkiraan skor akurasi. Skor ini mewakili kemampuan model untuk memprediksi nilai berlabel secara akurat pada dokumen yang serupa secara visual.

Akurasi diukur dalam rentang nilai persentase dari 0% (rendah) hingga 100% (tinggi).

Untuk informasi selengkapnya, lihat Skor akurasi dan keyakinan.

Bagaimana cara meningkatkan skor akurasi?

Varians dalam struktur visual dokumen Anda dapat memengaruhi akurasi model. Berikut adalah beberapa tipnya:

  • Sertakan semua variasi dokumen dalam himpunan data pelatihan. Variasi mencakup format yang berbeda; misalnya, PDF digital versus yang dipindai.

  • Pisahkan jenis dokumen yang berbeda secara visual dan latih model yang berbeda.

  • Pastikan Anda tidak memiliki label asing.

  • Untuk pelabelan tanda tangan dan wilayah, jangan sertakan teks di sekitarnya.

Untuk informasi selengkapnya, lihat Skor akurasi dan keyakinan.

Berapa skor keyakinan, dan bagaimana perhitungannya?

Skor keyakinan menunjukkan probabilitas dengan mengukur tingkat kepastian statistik bahwa hasil yang diekstraksi terdeteksi dengan benar.

Rentang nilai keyakinan adalah persentase dari 0% (rendah) hingga 100% (tinggi). Yang terbaik adalah menargetkan skor 80% atau lebih tinggi. Untuk kasus yang lebih sensitif, seperti catatan keuangan atau medis, kami merekomendasikan skor mendekati 100%. Anda juga dapat memerlukan tinjauan manusia.

Untuk informasi selengkapnya, lihat Skor akurasi dan keyakinan.

Bagaimana saya bisa meningkatkan skor kepercayaan diri?

Setelah operasi analisis, tinjau output JSON. Uji nilai confidence untuk setiap hasil kunci/nilai di bagian simpul pageResults. Anda juga harus melihat skor kepercayaan di readResults node, yang sesuai dengan operasi membaca teks. Keyakinan hasil baca tidak memengaruhi keyakinan hasil ekstraksi kunci/nilai, jadi Anda harus memeriksa keduanya. Berikut adalah beberapa tipnya:

  • Jika nilai kepercayaan untuk objek readResults rendah, tingkatkan kualitas dokumen input Anda.

  • Jika skor keyakinan untuk pageResults objek rendah, pastikan bahwa dokumen yang Anda analisis memiliki jenis yang sama.

  • Pertimbangkan untuk memasukkan ulasan manusia ke dalam alur kerja Anda.

  • Gunakan formulir yang memiliki nilai berbeda di setiap bidang.

  • Untuk model kustom, gunakan satu set dokumen pelatihan yang lebih besar. Menandai lebih banyak dokumen mengajarkan model Anda untuk mengenali bidang dengan akurasi yang lebih besar.

Untuk informasi selengkapnya, lihat Skor akurasi dan keyakinan.

Apa itu kotak pembatas?

Kotak pembatas (polygon dalam v3.0 dan versi yang lebih baru) adalah persegi panjang abstrak yang mengelilingi elemen teks dalam dokumen atau formulir. Ini digunakan sebagai titik referensi untuk deteksi objek.

Kotak pembatas menentukan posisi dengan menggunakan bidang koordinat x dan y yang disajikan dalam array empat pasangan numerik. Setiap pasangan mewakili sudut kotak dalam urutan berikut: kiri atas, kanan atas, kanan bawah, kiri bawah.

Untuk gambar, koordinat berada dalam piksel. Untuk PDF, koordinat berada dalam inci.

Bisakah Inteligensi Dokumen membantu saya mengklasifikasikan dokumen?

Kecerdasan Dokumen menyediakan model klasifikasi kustom yang dapat menganalisis dokumen file tunggal atau beberapa file untuk mengidentifikasi apakah file input berisi salah satu jenis dokumen terlatih. Layanan ini mendukung skenario berikut:

  • Satu file yang berisi satu jenis dokumen, seperti formulir aplikasi pinjaman.

  • Satu file yang berisi beberapa dokumen. Contohnya adalah paket aplikasi pinjaman yang berisi formulir aplikasi pinjaman, payslip, dan rekening koran bank.

  • Satu file yang berisi beberapa instans dari dokumen yang sama. Contohnya adalah kumpulan faktur yang dipindai.

Untuk informasi selengkapnya, lihat gambaran umum model klasifikasi kustom.

Pengembangan aplikasi

Apa saja opsi pengembangan untuk Kecerdasan Dokumen?

Kecerdasan Dokumen menawarkan opsi pengembangan terbaru dalam platform berikut:

Di mana saya dapat menemukan versi API yang didukung untuk SDK bahasa pemrograman terbaru?

Tabel ini menyediakan tautan ke versi SDK terbaru dan memperlihatkan hubungan antara SDK Kecerdasan Dokumen dan versi API yang didukung:

Referensi Azure SDK bahasa yang didukung Versi API yang didukung
• C#/.NET: 4.0.0

• Java: 4.0.0

• JavaScript: 4.0.0

• Python 3.2.0
Pratinjau 10-31 2023
v3.0
v2.1
v2.0

Untuk informasi selengkapnya, lihat Klien yang didukung untuk v4.0 dan Klien yang didukung untuk v3.1.

Apa perbedaan antara Kecerdasan Dokumen v3.0 dan v2.1, dan bagaimana cara bermigrasi ke versi terbaru?

Untuk meningkatkan kegunaan, Kecerdasan Dokumen v3.0 memperkenalkan pustaka klien yang sepenuhnya didesain ulang. Agar berhasil menggunakan fitur API Kecerdasan Dokumen terbaru, Anda memerlukan SDK terbaru, dan kode aplikasi Anda harus diperbarui untuk menggunakan klien baru.

Tabel ini menyediakan tautan ke instruksi terperinci untuk bermigrasi ke versi terbaru Kecerdasan Dokumen:

Bahasa/API Panduan migrasi
REST API v3
C#/.NET 4.0.0
Java 4.0.0
JavaScript 4.0.0
Python 3.2.0

Format file mana yang didukung Oleh Inteligensi Dokumen? Apakah ada batasan ukuran untuk dokumen input?

Untuk mendapatkan hasil terbaik, lihat persyaratan input.

Bagaimana cara menentukan rentang halaman yang akan dianalisis dalam dokumen?

pages Gunakan parameter (didukung dalam versi v2.1, v3.0, dan yang lebih baru dari REST API) untuk menentukan halaman untuk dokumen PDF dan TIFF beberapa halaman. Input yang diterima mencakup rentang berikut:

  • Satu halaman. Misalnya, jika Anda menentukan 1, 2, halaman 1 dan 2 diproses.
  • Rentang terbatas. Misalnya, jika Anda menentukan 2-5, halaman 2 hingga 5 diproses.
  • Rentang terbuka. Misalnya, jika Anda menentukan 5-, semua halaman dari halaman 5 diproses. Jika Anda menentukan -10, halaman 1 hingga 10 diproses.

Anda dapat mencampur parameter ini bersama-sama, dan rentang dapat tumpang tindih. Misalnya, jika Anda menentukan -5, 1, 3, 5-10, halaman 1 hingga 10 diproses.

Layanan menerima permintaan jika dapat memproses setidaknya satu halaman dokumen. Misalnya, menggunakan 5-100 pada dokumen lima halaman adalah input valid yang berarti halaman 5 diproses.

Jika Anda tidak menyediakan rentang halaman, seluruh dokumen akan diproses.

Studio Kecerdasan Dokumen dan alat Pelabelan Sampel FOTT tersedia. Mana yang harus saya gunakan?

Sebagian besar waktu, kami merekomendasikan Document Intelligence Studio karena dapat mengurangi waktu Anda untuk mengonfigurasi sumber daya Kecerdasan Dokumen dan layanan penyimpanan.

Pertimbangkan untuk menggunakan Form OCR Testing Tool (FOTT) untuk skenario berikut:

  • Data Anda harus tetap berada dalam satu mesin. Gunakan alat Pelabelan Sampel FOTT dan kontainer Kecerdasan Dokumen.

  • Proyek Anda sangat bergantung pada Kecerdasan Dokumen v2.1, dan Anda ingin tetap menggunakan API v2.1.

Batas layanan dan harga

Bagaimana Azure menghitung harga untuk menggunakan Kecerdasan Dokumen?

Penagihan Kecerdasan Dokumen dihitung setiap bulan berdasarkan jenis model dan jumlah halaman yang dianalisis. Berikut beberapa detailnya:

  • Saat Anda mengirimkan dokumen untuk analisis, layanan menganalisis semua halaman kecuali Anda menentukan rentang halaman dengan menggunakan pages parameter dalam permintaan Anda. Saat layanan menganalisis dokumen Microsoft Excel dan PowerPoint melalui model baca, OCR, atau tata letak, layanan menghitung setiap lembar kerja Excel dan slide PowerPoint sebagai satu halaman.

  • Ketika layanan menganalisis file PDF dan TIFF, layanan menghitung setiap halaman dalam file PDF atau setiap gambar dalam file TIFF sebagai satu halaman tanpa batas karakter maksimum.

  • Ketika layanan menganalisis file Microsoft Word dan HTML yang didukung model baca dan tata letak, layanan menghitung halaman dalam blok masing-masing 3.000 karakter. Misalnya, jika dokumen Anda berisi 7.000 karakter, dua halaman dengan masing-masing 3.000 karakter dan satu halaman dengan 1.000 karakter menambahkan hingga total tiga halaman.

  • Saat Anda menggunakan model baca atau tata letak untuk menganalisis file Microsoft Word, Excel, PowerPoint, dan HTML, gambar yang disematkan atau ditautkan tidak didukung. Jadi layanan tidak menghitungnya sebagai gambar tambahan.

  • Melatih model kustom selalu gratis dengan Kecerdasan Dokumen. Anda hanya dikenakan biaya saat layanan menggunakan model untuk menganalisis dokumen.

  • Harga kontainer sama dengan harga layanan cloud.

  • Kecerdasan Dokumen menawarkan tingkat gratis (F0) tempat Anda dapat menguji semua fitur Kecerdasan Dokumen.

  • Kecerdasan Dokumen memiliki model harga berbasis komitmen untuk beban kerja besar.

Pelajari selengkapnya tentang opsi harga Azure AI Document Intelligence.

Bagaimana cara memeriksa penggunaan Kecerdasan Dokumen saya dan memperkirakan harganya?

Anda dapat menemukan metrik penggunaan di dasbor metrik di portal Azure. Dasbor menampilkan jumlah halaman yang diproses Kecerdasan Dokumen Azure AI. Anda dapat memeriksa perkiraan biaya yang dihabiskan untuk sumber daya dengan menggunakan kalkulator harga Azure. Untuk petunjuk terperinci, lihat Memeriksa penggunaan dan memperkirakan biaya.

Apa praktik terbaik untuk mengurangi pembatasan?

Kecerdasan Dokumen menggunakan penskalaan otomatis untuk menyediakan sumber daya komputasi yang diperlukan sesuai permintaan, sambil menjaga biaya pelanggan tetap rendah. Untuk mengurangi pembatasan selama autoscaling, kami merekomendasikan pendekatan berikut:

  • Terapkan logika coba lagi di aplikasi Anda.

  • Jika Anda menemukan bahwa Anda sedang dibatasi pada jumlah POST permintaan, pertimbangkan untuk menambahkan penundaan antara permintaan.

  • Tingkatkan beban kerja secara bertahap. Hindari perubahan tajam.

  • Buat permintaan dukungan untuk meningkatkan batas transaksi per detik (TPS).

Pelajari selengkapnya tentang kuota dan batas layanan Kecerdasan Dokumen.

Berapa lama waktu yang diperlukan untuk menganalisis dokumen?

Waktu untuk menganalisis dokumen tergantung pada ukuran (misalnya, jumlah halaman) dan konten terkait di setiap halaman.

Kecerdasan Dokumen adalah layanan multipenyewa di mana latensi untuk dokumen serupa sebanding tetapi tidak selalu identik. Latensi adalah jumlah waktu yang diperlukan server API untuk menangani dan memproses permintaan masuk dan mengirimkan respons keluar ke klien. Varianbilitas sesekali dalam latensi dan performa melekat dalam layanan mikro berbasis layanan mikro, tanpa status, asinkron yang memproses gambar dan dokumen besar dalam skala besar.

Meskipun kami terus meningkatkan kemampuan perangkat keras dan kapasitas dan penskalaan, Anda mungkin masih memiliki masalah latensi saat runtime.

Model kustom

Bagaimana cara mengumpulkan data pelatihan terbaik?

Saat Anda menggunakan model kustom Kecerdasan Dokumen, Anda menyediakan data pelatihan Anda sendiri. Berikut adalah beberapa tips untuk membantu melatih model Anda secara efektif:

  • Gunakan PDF berbasis teks, bukan PDF berbasis gambar jika memungkinkan. Salah satu cara untuk mengidentifikasi PDF berbasis gambar adalah dengan mencoba memilih teks tertentu dalam dokumen. Jika Anda hanya dapat memilih seluruh gambar teks, dokumen berbasis gambar, bukan berbasis teks.

  • Atur dokumen pelatihan Anda dengan menggunakan subfolder untuk setiap format (JPEG/JPG, PNG, BMP, PDF, atau TIFF).

  • Gunakan formulir yang telah menyelesaikan semua bidang yang tersedia.

  • Gunakan formulir dengan nilai berbeda di setiap bidang.

  • Jika gambar Anda berkualitas rendah, gunakan himpunan data yang lebih besar (lebih dari lima dokumen pelatihan).

Pelajari selengkapnya tentang membangun himpunan data pelatihan.

Apa praktik terbaik untuk melatih model kustom yang sangat akurat?

Tingkat akurasi untuk model Anda tergantung pada kualitas materi pelatihan Anda. Berikut adalah beberapa tipnya:

  • Tentukan apakah Anda perlu menggunakan satu model atau beberapa model yang disusun menjadi satu model.

  • Akurasi model dapat menurun ketika Anda memiliki format berbeda yang dianalisis dengan satu model. Rencanakan segmentasi himpunan data Anda ke dalam folder, di mana setiap folder adalah templat unik. Latih satu model per folder, dan buat model yang dihasilkan menjadi satu titik akhir.

  • Formulir kustom bergantung pada templat visual yang konsisten. Jika formulir Anda memiliki variasi dengan format dan hentian halaman, pertimbangkan untuk menyegmentasikan himpunan data Anda untuk melatih beberapa model.

  • Pastikan Anda memiliki himpunan data seimbang dengan memperhitungkan format, jenis dokumen, dan struktur.

Pelajari model yang disusun lebih lanjut.

Bisakah saya melatih ulang model kustom?

Kecerdasan Dokumen tidak memiliki operasi pelatihan ulang eksplisit. Setiap operasi kereta menghasilkan model baru.

Jika Anda menemukan bahwa model Anda perlu pelatihan ulang, tambahkan lebih banyak sampel ke himpunan data pelatihan Anda dan latih model baru.

Berapa banyak model kustom yang dapat saya tulis menjadi satu model kustom?

Dengan operasi Penyusunan Model, Anda dapat menetapkan hingga 200 model kustom yang dilatih ke satu ID model. Saat Anda membuat Analyze Document permintaan dengan ID model yang terdiri, Kecerdasan Dokumen mengklasifikasikan formulir yang dikirimkan, memilih model terbaik, dan mengembalikan hasilnya. Model Compose saat ini hanya tersedia untuk model kustom yang dilatih dengan label.

Menganalisis dokumen dengan menggunakan model yang terdiri identik dengan menganalisis dokumen dengan menggunakan satu model. Hasilnya Analyze Document mengembalikan docType properti yang menunjukkan model komponen mana yang Anda pilih untuk menganalisis dokumen. Tidak ada perubahan harga untuk menganalisis dokumen dengan menggunakan model kustom individual atau model kustom yang disusam.

Pelajari model yang disusun lebih lanjut.

Jika jumlah model yang ingin saya buat melebihi batas atas model yang disusupi, apa alternatifnya?

Anda dapat menggunakan salah satu alternatif berikut:

  • Klasifikasikan dokumen sebelum memanggil model kustom. Anda dapat menggunakan model baca dan membuat klasifikasi berdasarkan teks yang diekstrak dari dokumen dan frasa tertentu dengan menggunakan sumber seperti kode, ekspresi reguler, atau pencarian.

  • Jika Anda ingin mengekstrak bidang yang sama dari berbagai dokumen terstruktur, semistruktur, dan tidak terstruktur, pertimbangkan untuk menggunakan model neural kustom pembelajaran mendalam. Pelajari selengkapnya tentang perbedaan antara model templat kustom dan model neural kustom.

Bagaimana cara memperbaiki model di luar pelatihan awal?

Setiap operasi pelatihan menghasilkan model baru.

  1. Buat himpunan data untuk templat baru Anda.

  2. Beri label dan latih model baru.

  3. Validasi bahwa model baru berkinerja baik untuk jenis dokumen spesifik Anda.

  4. Susun model baru Anda dengan model yang ada menjadi satu titik akhir. Kecerdasan Dokumen kemudian dapat menentukan model terbaik untuk setiap dokumen yang akan dianalisis.

Pelajari model yang disusun lebih lanjut.

Aku sedang membangun model kustom. Apa yang dikembalikan label deteksi tanda tangan?

Deteksi tanda tangan mencari keberadaan tanda tangan, bukan identitas orang yang menandatangani dokumen.

Jika model mengembalikan unsigned untuk deteksi tanda tangan, model tidak menemukan tanda tangan di bidang yang ditentukan.

Apa yang harus saya pertimbangkan dan apa praktik terbaik untuk mengekstrak tabel dari dokumen?

Anda dapat memulai dengan model tata letak Kecerdasan Dokumen untuk mengekstrak teks, tabel, tanda pilihan, dan informasi struktur dari dokumen dan gambar. Anda juga dapat mempertimbangkan faktor-faktor berikut:

  • Apakah data yang ingin Anda ekstrak disajikan sebagai tabel, dan apakah struktur tabel bermakna?

  • Jika data tidak dalam format tabel, bisakah data pas dalam kisi dua dimensi?

  • Apakah tabel Anda mencakup beberapa halaman? Jika demikian, untuk menghindari harus melabeli semua halaman, pisahkan PDF menjadi halaman sebelum mengirimkannya ke Kecerdasan Dokumen. Setelah analisis, pasca-proses halaman ke satu tabel.

  • Jika Anda membuat model kustom, lihat Pelabelan sebagai tabel. Tabel dinamis memiliki jumlah variabel baris untuk setiap kolom. Tabel tetap memiliki jumlah baris konstan untuk setiap kolom.

Bagaimana saya bisa memindahkan model terlatih saya dari satu lingkungan (seperti beta) ke lingkungan lain (seperti produksi)?

Anda dapat menggunakan COPY API untuk menyalin model kustom dari satu akun Kecerdasan Dokumen ke akun lain yang ada di wilayah geografis yang didukung. Untuk instruksi terperinci, lihat Pemulihan bencana.

Operasi penyalinan terbatas pada menyalin model dalam lingkungan cloud tertentu tempat Anda melatih model. Misalnya, menyalin model dari cloud publik ke cloud Azure Government tidak didukung.

Mengapa saya dikenakan biaya untuk tata letak saat menjalankan pelatihan kustom?

Tata letak diperlukan untuk menghasilkan label untuk himpunan data Anda. Jika himpunan data yang Anda gunakan untuk pelatihan kustom tidak memiliki file label yang tersedia, layanan akan menghasilkannya untuk Anda.

Akun Penyimpanan

Saya dapat mengakses akun penyimpanan saya beberapa hari yang lalu. Mengapa saya sekarang mengalami kesulitan untuk menyambungkan kembali?

Saat Anda membuat tanda tangan akses bersama, durasi defaultnya adalah 48 jam. Setelah 48 jam, Anda perlu membuat token baru.

Pertimbangkan untuk mengatur periode durasi yang lebih lama untuk waktu Anda menggunakan akun penyimpanan Anda dengan Kecerdasan Dokumen.

Jika akun penyimpanan saya berada di belakang jaringan virtual atau firewall, bagaimana cara memberikan akses Kecerdasan Dokumen ke data?

Jika Anda memiliki akun penyimpanan Azure yang dilindungi oleh jaringan virtual atau firewall, Kecerdasan Dokumen tidak dapat langsung mengakses akun penyimpanan Anda. Namun, akses dan autentikasi akun penyimpanan Azure privat mendukung identitas terkelola untuk sumber daya Azure. Saat Anda menggunakan identitas terkelola, layanan Kecerdasan Dokumen dapat mengakses akun penyimpanan Anda dengan menggunakan kredensial yang ditetapkan.

Jika Anda berniat menganalisis data akun penyimpanan privat Anda dengan menggunakan FOTT, Anda harus menyebarkan alat di belakang jaringan virtual atau firewall.

Pelajari cara membuat dan menggunakan identitas terkelola untuk sumber daya Kecerdasan Dokumen Anda.

Studio Kecerdasan Dokumen

Izin apa yang saya perlukan untuk mengakses Document Intelligence Studio?

Anda memerlukan akun dan langganan Azure aktif dengan setidaknya peran Pembaca untuk mengakses Studio Kecerdasan Dokumen.

Untuk analisis dokumen dan model bawaan, berikut adalah persyaratan peran untuk skenario pengguna:

  • Dasar

    • Pengguna Cognitive Services: Anda memerlukan peran ini untuk sumber daya multi-layanan Kecerdasan Dokumen atau Azure Cognitive Services untuk menggunakan Studio Kecerdasan Dokumen.
  • Lanjutan

    • Kontributor: Anda memerlukan peran ini untuk membuat grup sumber daya atau sumber daya Kecerdasan Dokumen. Peran Kontributor tidak memungkinkan Anda untuk mencantumkan kunci untuk Cognitive Services. Untuk menggunakan Studio Kecerdasan Dokumen, Anda masih memerlukan peran Pengguna Cognitive Services.

Untuk proyek model kustom, berikut adalah persyaratan peran untuk skenario pengguna:

  • Dasar

    • Pengguna Cognitive Services: Anda memerlukan peran ini untuk sumber daya multi-layanan Kecerdasan Dokumen atau Cognitive Services untuk melatih model kustom atau menganalisis dengan model terlatih.

    • Kontributor Data Blob Penyimpanan: Anda memerlukan peran ini untuk akun penyimpanan guna membuat proyek dan melabeli data.

  • Lanjutan

    • Kontributor Akun Penyimpanan: Anda memerlukan peran ini agar akun penyimpanan menyiapkan pengaturan berbagi sumber daya lintas asal (CORS). Ini adalah upaya satu kali jika Anda menggunakan kembali akun penyimpanan yang sama.

      Peran Kontributor tidak memungkinkan Anda mengakses data di blob Anda. Untuk menggunakan Studio Kecerdasan Dokumen, Anda masih memerlukan peran Kontributor Data Blob Penyimpanan.

    • Kontributor: Anda memerlukan peran ini untuk membuat grup sumber daya dan sumber daya. Peran Kontributor tidak memberi Anda akses untuk menggunakan sumber daya atau penyimpanan yang dibuat. Untuk menggunakan Studio Kecerdasan Dokumen, Anda masih memerlukan peran dasar.

Untuk informasi selengkapnya, lihat Peran bawaan Microsoft Entra dan bagian tentang penetapan peran Azure di mulai cepat Document Intelligence Studio.

Saya memiliki beberapa halaman dalam sebuah dokumen. Mengapa hanya dua halaman yang dianalisis di Document Intelligence Studio?

Untuk sumber daya tingkat gratis (F0), hanya dua halaman pertama yang dianalisis apakah Anda menggunakan Document Intelligence Studio, REST API, atau SDK.

Di Studio Kecerdasan Dokumen, pilih tombol Pengaturan (roda gigi), pilih tab Sumber Daya, dan periksa tingkat harga yang Anda gunakan untuk menganalisis dokumen. Jika Anda ingin menganalisis semua halaman dalam dokumen, ubah ke sumber daya berbayar (S0).

Bagaimana cara mengubah direktori atau langganan di Document Intelligence Studio?

Untuk mengubah direktori di Document Intelligence Studio, pilih tombol Pengaturan (gigi). Di bawah Direktori, pilih direktori dari daftar, lalu pilih Alihkan Direktori. Anda diminta untuk masuk lagi setelah mengalihkan direktori.

Untuk mengubah langganan atau sumber daya, buka tab Sumber Daya di bawah Pengaturan.

Mengapa saya menerima kesalahan penyimpanan pada berbagi proyek, pelabelan otomatis, atau operasi peningkatan OCR saat sumber daya akun penyimpanan saya dikonfigurasi dengan firewall atau jaringan virtual?

Lihat Identitas terkelola untuk Kecerdasan Dokumen untuk menyiapkan sumber daya Azure Anda.

Mengapa saya menerima kesalahan "Akses ditolak karena aturan Virtual Network/Firewall" pada operasi pelabelan otomatis atau peningkatan OCR saat sumber daya Kecerdasan Dokumen saya dikonfigurasi dengan firewall atau jaringan virtual?

Anda perlu menambahkan alamat IP khusus 20.3.165.95 ke daftar izin firewall untuk sumber daya Kecerdasan Dokumen Anda.

Dapatkah saya menggunakan kembali atau menyesuaikan pengalaman pelabelan dari Document Intelligence Studio dan membuatnya ke dalam aplikasi saya sendiri?

Ya. Pengalaman pelabelan dari Document Intelligence Studio sumber terbuka d dalam repositori Toolkit.

Mengapa saya menerima kesalahan "Form Recognizer Not Found" saat membuka proyek kustom saya?

Sumber daya Kecerdasan Dokumen Anda yang terikat pada proyek kustom ini telah dihapus atau dipindahkan ke grup sumber daya lain. Ada dua cara untuk mengatasi masalah ini:

  • Buat ulang sumber daya Kecerdasan Dokumen di bawah langganan dan grup sumber daya yang sama dengan nama yang sama.

  • Buat ulang proyek kustom dengan sumber daya Kecerdasan Dokumen yang dimigrasikan dan tentukan akun penyimpanan yang sama.

Kontainer

Apakah saya memerlukan koneksi internet untuk menggunakan kontainer Kecerdasan Dokumen?

Ya. Kontainer Kecerdasan Dokumen memerlukan konektivitas internet untuk mengirim informasi penagihan ke Azure. Pelajari selengkapnya tentang keamanan Azure container.

Apa perbedaan antara kontainer yang terputus dan terhubung?

Koneksi kontainer mengirim informasi penagihan ke Azure dengan menggunakan sumber daya Kecerdasan Dokumen di akun Azure Anda. Dengan kontainer yang terhubung, konektivitas internet diperlukan untuk mengirim informasi penagihan ke Azure.

Kontainer terputus memungkinkan Anda menggunakan API yang terputus dari internet. Informasi penagihan tidak dikirim melalui internet. Sebagai gantinya, Anda dikenakan biaya berdasarkan tingkat komitmen yang dibeli. Saat ini, penggunaan kontainer yang terputus tersedia untuk model kustom dan faktur Kecerdasan Dokumen.

Kemampuan model yang disediakan dalam kontainer yang terhubung dan terputus sama dan didukung oleh Kecerdasan Dokumen v2.1.

Data apa yang dikirim kontainer yang terhubung ke cloud?

Kontainer tersambung Kecerdasan Dokumen mengirim informasi tagihan ke Azure dengan menggunakan sumber daya Kecerdasan Dokumen di akun Azure Anda. Kontainer Azure Cognitive Services tidak mengirim data pelanggan, seperti gambar atau teks yang sedang dianalisis, ke Microsoft.

Untuk contoh informasi yang dikirim kontainer yang tersambung ke Microsoft untuk penagihan, lihat FAQ kontainer Azure AI.

Mengapa saya menerima kesalahan "Kontainer tidak dalam keadaan valid. Validasi langganan gagal dengan status kunci API 'OutOfQuota' kehabisan kuota"?

Kontainer tersambung Kecerdasan Dokumen mengirim informasi tagihan ke Azure dengan menggunakan sumber daya Kecerdasan Dokumen di akun Azure Anda. Anda bisa mendapatkan pesan ini jika kontainer tidak dapat berkomunikasi dengan titik akhir penagihan.

Dapatkah saya menggunakan penyimpanan lokal untuk kontainer Document Intelligence Sample Labeling Tool (FOTT)?

FOTT memiliki versi yang menggunakan penyimpanan lokal. Versi perlu dipasang pada mesin Windows. Anda dapat memasangnya dari lokasi ini.

Pada halaman proyek, tentukan URI folder label sebagai /shared atau /shared/sub-dir jika file pelabelan Anda berada dalam subdirektori. Semua perilaku Alat Pelabelan Sampel Kecerdasan Dokumen lainnya sama dengan layanan yang dihosting.

Apa praktik terbaik untuk meningkatkan skala?

Untuk panggilan asinkron, Anda dapat menjalankan beberapa kontainer dengan penyimpanan bersama. Kontainer yang memproses POST panggilan analisis menyimpan output dalam penyimpanan. Kemudian, kontainer lain dapat mengambil hasil dari penyimpanan dan melayani GET panggilan. ID permintaan tidak terkait dengan kontainer.

Untuk panggilan sinkron, Anda dapat menjalankan beberapa kontainer, tetapi hanya satu kontainer yang melayani permintaan. Karena ini adalah panggilan pemblokiran, kontainer apa pun dari kumpulan dapat melayani permintaan dan mengirim respons. Di sini, hanya satu kontainer yang terkait dengan permintaan pada satu waktu, dan tidak diperlukan polling.

Bagaimana cara menyiapkan kontainer dengan penyimpanan bersama?

Kontainer menggunakan Mounts:Shared properti saat memulai untuk menentukan penyimpanan bersama untuk menyimpan file pemrosesan. Untuk melihat penggunaan properti ini, lihat dokumentasi kontainer.

Keamanan dan privasi

Apa saja metode dan persyaratan untuk mengautentikasi permintaan ke layanan Azure AI?

Setiap permintaan ke Azure Cognitive Service harus menyertakan header autentikasi. Anda dapat mengautentikasi permintaan dengan menggunakan beberapa metode:

Apakah Inteligensi Dokumen menyimpan data saya?

Untuk semua fitur, Kecerdasan Dokumen untuk sementara menyimpan data dan menghasilkan Azure Storage di wilayah yang sama dengan permintaan. Data Anda kemudian dihapus dalam waktu 24 jam sejak Anda mengirimkan permintaan analisis.

Pelajari selengkapnya tentang data, privasi, dan keamanan untuk Kecerdasan Dokumen.

Bagaimana model kustom terlatih saya disimpan dan digunakan dalam Kecerdasan Dokumen?

Output sementara setelah analisis dan pelabelan disimpan di lokasi Azure Storage yang sama tempat Anda menyimpan data pelatihan Anda. Model kustom terlatih disimpan di Azure Storage di wilayah yang sama, dan secara logis diisolasi dengan langganan Azure dan kredensial API Anda.

Lebih banyak bantuan dan dukungan

Di mana saya dapat menemukan solusi lainnya untuk pertanyaan Inteligensi Dokumen Azure AI saya?

Tanya Jawab Microsoft adalah rumah untuk pertanyaan dan jawaban teknis di Microsoft. Anda dapat memfilter kueri yang khusus untuk Kecerdasan Dokumen.

Apa yang harus saya lakukan jika layanan tidak mengenali teks tertentu, atau mengenalinya dengan salah, saat saya melabeli dokumen?

Kami terus memperbarui dan meningkatkan model OCR Kecerdasan Dokumen. Anda dapat mengirim email ke tim Kecerdasan Dokumen. Jika memungkinkan, bagikan dokumen sampel dengan masalah yang disorot.