Bagikan melalui


Tanya jawab umum

Konten ini berlaku untuk:checkmarktanda centangv4.0 (GA) checkmark v3.1 (GA)tanda centangv3.0 (GA)tanda centangv2.1 (GA)

Azure AI Document Intelligence adalah layanan berbasis cloud yang menggunakan model pembelajaran mesin untuk mengekstrak pasangan kunci/nilai, teks, dan tabel dari dokumen Anda. Hasil yang dikembalikan adalah output JSON terstruktur. Kasus penggunaan Kecerdasan Dokumen mencakup pemrosesan data otomatis, strategi berbasis data yang ditingkatkan, dan kemampuan pencarian dokumen yang diperkaya.

Gambaran Umum

Apakah Azure AI Document Intelligence dan Azure AI Form Recognizer memiliki layanan yang sama?

Ya.

Azure AI Document Intelligence dan Azure AI Form Recognizer adalah layanan yang sama. Layanan ini diganti namanya dari Azure AI Form Recognizer menjadi Azure AI Document Intelligence pada Juli 2023. Layanan ini menyediakan kemampuan dan fitur yang sama seperti sebelum penggantian nama.

  • Perubahan harga: Tidak ada perubahan pada harga. Nama Cognitive Services dan Applied AI Services terus digunakan dalam penagihan Azure, analisis biaya, daftar harga, dan API harga.

  • Perubahan yang melanggar: Tidak ada perubahan yang melanggar pada API atau pustaka klien.

Apakah Kecerdasan Dokumen terintegrasi dengan layanan Microsoft lain?

Ya.

Kecerdasan Dokumen terintegrasi dengan layanan berikut:

Kemampuan AI

Bisakah saya menggunakan Kecerdasan Dokumen dengan AI generatif untuk pemrosesan dokumen?

Ya.

Anda juga dapat menggunakan solusi AI generatif dokumen untuk mengobrol dengan dokumen Anda (RAG), menghasilkan konten menawan dari dokumen tersebut, dan mengakses model Azure OpenAI pada data Anda.

  • Dengan Gabungan Azure AI Document Intelligence dan Azure OpenAI, Anda dapat membuat aplikasi perusahaan untuk berinteraksi dengan dokumen Anda dengan lancar menggunakan bahasa alami. Anda dapat dengan mudah menemukan jawaban, mendapatkan wawasan berharga, dan menghasilkan konten baru dan menarik dari dokumen yang ada.

  • Anda dapat menemukan detail selengkapnya tentang pola pembuatan yang ditambungkan pengambilan di sini.

Dapatkah Kecerdasan Dokumen membantu potongan semantik dalam dokumen untuk pembuatan yang ditambung pengambilan?

Ya.

Kecerdasan Dokumen dapat menyediakan blok penyusun untuk mengaktifkan penggugusan semantik. Potongan semantik adalah langkah kunci dalam pengambilan-augmented generation (RAG) untuk memastikan potongan padat konteks dan peningkatan relevansi.

  • Kecerdasan Dokumen menyediakan model tata letak yang menyediakan dekomposisi visual dokumen ke dalam baris, paragraf, bagian, header, dan footer.

  • Anda kemudian dapat memilih untuk mengambil hasil dalam format markdown, untuk memotong dokumen lebih lanjut pada batas bagian atau paragraf.

Untuk informasi selengkapnya, lihat gambaran umum RAG dalam Kecerdasan Dokumen

Studio Kecerdasan Dokumen

Apakah saya memerlukan izin khusus untuk mengakses Studio Kecerdasan Dokumen?

Ya.

Anda memerlukan akun dan langganan Azure aktif dengan setidaknya peran Pembaca untuk mengakses Studio Kecerdasan Dokumen.

Untuk analisis dokumen dan model bawaan, berikut adalah persyaratan peran untuk skenario pengguna:

  • Dasar

    • Pengguna Cognitive Services: Anda memerlukan peran ini untuk sumber daya multi-layanan Kecerdasan Dokumen atau Azure Cognitive Services untuk menggunakan Studio Kecerdasan Dokumen.
  • Lanjutan

    • Kontributor: Anda memerlukan peran ini untuk membuat grup sumber daya atau sumber daya Kecerdasan Dokumen.

Untuk proyek model kustom, berikut adalah persyaratan peran untuk skenario pengguna:

  • Dasar

    • Pengguna Cognitive Services: Anda memerlukan peran ini untuk sumber daya multi-layanan Kecerdasan Dokumen atau Cognitive Services untuk melatih model kustom atau menganalisis dengan model terlatih.

    • Kontributor Data Blob Penyimpanan: Anda memerlukan peran ini untuk akun penyimpanan guna membuat proyek dan melabeli data.

  • Lanjutan

    • Kontributor Akun Penyimpanan: Anda memerlukan peran ini agar akun penyimpanan menyiapkan pengaturan berbagi sumber daya lintas asal (CORS). Ini adalah upaya satu kali jika Anda menggunakan kembali akun penyimpanan yang sama.

    • Kontributor: Anda memerlukan peran ini untuk membuat grup sumber daya dan sumber daya. Peran Kontributor atau Kontributor Akun Penyimpanan tidak memberi Anda akses untuk menggunakan sumber daya Atau akun penyimpanan Kecerdasan Dokumen Jika autentikasi lokal (berbasis kunci) dinonaktifkan. Anda masih memerlukan peran dasar (Pengguna Cognitive Services dan Kontributor Blob Data Penyimpanan) untuk menggunakan fungsi di Document Intelligence Studio.

Untuk informasi selengkapnya, lihat Peran bawaan Microsoft Entra dan bagian tentang penetapan peran Azure di mulai cepat Document Intelligence Studio.

Bisakah saya memproses dokumen dengan lebih dari dua halaman di Document Intelligence Studio?

Ya, untuk sumber daya tingkat berbayar.

Tidak, untuk sumber daya tingkat gratis.

  • Untuk sumber daya tingkat gratis (F0), hanya dua halaman pertama yang dianalisis apakah Anda menggunakan Document Intelligence Studio, REST API, atau pustaka klien.

  • Jika Anda ingin menganalisis semua halaman dalam dokumen, ubah ke sumber daya berbayar (S0). Di Studio Kecerdasan Dokumen, pilih tombol Pengaturan (roda gigi), pilih tab Sumber Daya , dan periksa tingkat harga yang akan digunakan untuk menganalisis dokumen Anda.

Bisakah saya mengubah direktori atau langganan di Document Intelligence Studio?

Ya.

  • Untuk mengubah direktori di Document Intelligence Studio, pilih tombol Pengaturan (gigi). Di bawah Direktori, pilih direktori dari daftar, lalu pilih Alihkan Direktori. Masuk lagi setelah Anda mengalihkan direktori.

  • Untuk mengubah langganan atau sumber daya, buka tab Sumber Daya di bawah Pengaturan.

Dapatkah saya menggunakan Document Intelligence Studio dengan sumber daya yang dikonfigurasi dengan firewall atau jaringan virtual?

Ya.

Untuk v4.0 11-30-2024 (GA), pelabelan otomatis dihosting secara asli dengan sisa layanan, jadi tidak perlu daftar IP yang diizinkan. Untuk versi sebelumnya, jika sumber daya Kecerdasan Dokumen Anda dikonfigurasi dengan firewall atau jaringan virtual, Anda perlu menambahkan alamat IP khusus 20.3.165.95 ke daftar yang diizinkan firewall untuk sumber daya Kecerdasan Dokumen Anda. Beberapa fungsi dalam proyek kustom (misalnya, autolabel, manajemen proyek, dan manusia dalam perulangan) tidak berfungsi jika akses jaringan publik dinonaktifkan.

Saat saya mengunggah file di Document Intelligence Studio dengan fungsi "Ambil dari URL", bisakah saya menggunakan URL dari penyimpanan blob saya?

Ya.

Jika URL penyimpanan blob Azure Anda menyertakan token SAS, dan dapat diakses dari jaringan publik. Anda tidak dapat menggunakan fungsi Ambil untuk akun penyimpanan tempat akses kunci dinonaktifkan atau di belakang firewall/VNet.

Dapatkah saya menggunakan kembali atau menyesuaikan pengalaman pelabelan dari Document Intelligence Studio dan membuatnya ke dalam aplikasi saya sendiri?

Ya.

Pengalaman pelabelan dari Document Intelligence Studio sumber terbuka d dalam repositori Toolkit.

Apakah ada titik akhir URL terpisah untuk wilayah sovereign cloud Kecerdasan Dokumen?

Ya.

Document Intelligence Studio memiliki titik akhir URL terpisah untuk wilayah sovereign cloud:

Pengembangan aplikasi

Dapatkah saya mengembangkan aplikasi menggunakan Azure AI Document Intelligence menggunakan opsi pengembangan terbaru?

Ya.

Kecerdasan Dokumen menawarkan opsi pengembangan terbaru dalam platform berikut:

Dapatkah saya memigrasikan aplikasi saya ke versi terbaru Kecerdasan Dokumen?

Ya.

Tabel berikut ini menyediakan tautan ke instruksi terperinci untuk bermigrasi ke versi terbaru Kecerdasan Dokumen:

Bahasa/API Panduan migrasi
REST API v3
C#/.NET 4.0.0
Jawa 4.0.0
JavaScript 4.0.0
Phyton 3.2.0

Bisakah saya menentukan rentang halaman yang akan dianalisis dalam dokumen?

Ya.

pages Gunakan parameter (didukung dalam versi v2.1, v3.0, dan yang lebih baru dari REST API) dan tentukan halaman untuk dokumen PDF dan TIFF beberapa halaman. Input yang diterima mencakup rentang berikut:

  • Satu halaman. Misalnya, jika Anda menentukan 1, 2, halaman 1 dan 2 diproses.
  • Rentang terbatas. Misalnya, jika Anda menentukan 2-5, halaman 2 hingga 5 diproses.
  • Rentang terbuka. Misalnya, jika Anda menentukan 5-, semua halaman dari halaman 5 diproses. Jika Anda menentukan -10, halaman 1 hingga 10 diproses.

Anda dapat mencampur parameter ini bersama-sama, dan rentang dapat tumpang tindih. Misalnya, jika Anda menentukan -5, 1, 3, 5-10, halaman 1 hingga 10 diproses.

Layanan menerima permintaan jika dapat memproses setidaknya satu halaman dokumen. Misalnya, menggunakan 5-100 pada dokumen lima halaman adalah input valid yang berarti halaman 5 diproses.

Jika Anda tidak menyediakan rentang halaman, seluruh dokumen akan diproses.

Apakah Anda merekomendasikan penggunaan Studio Kecerdasan Dokumen daripada alat Pelabelan Sampel FOTT untuk proyek saya?

Ya.

Kami merekomendasikan Studio Kecerdasan Dokumen sebagian besar waktu karena dapat mengurangi waktu Anda untuk mengonfigurasi sumber daya Kecerdasan Dokumen dan layanan penyimpanan.

Hanya pertimbangkan untuk menggunakan Alat Pengujian Formulir (FOTT) untuk skenario berikut:

  • Data Anda harus tetap berada dalam satu mesin. Gunakan alat Pelabelan Sampel FOTT dan kontainer Kecerdasan Dokumen.

  • Proyek Anda sangat bergantung pada Kecerdasan Dokumen V2.1 dan Anda ingin tetap menggunakan API v2.1.

Apakah ada praktik terbaik untuk mengurangi pembatasan?

Ya.

Kecerdasan Dokumen menggunakan penskalaan otomatis untuk menyediakan sumber daya komputasi yang diperlukan sesuai permintaan, sambil menjaga biaya pelanggan tetap rendah. Untuk mengurangi pembatasan selama autoscaling, kami merekomendasikan pendekatan berikut:

  • Terapkan logika coba lagi di aplikasi Anda.

  • Jika Anda menemukan bahwa Anda sedang dibatasi pada jumlah POST permintaan, pertimbangkan untuk menambahkan penundaan antara permintaan.

  • Tingkatkan beban kerja secara bertahap. Hindari perubahan tajam.

  • Buat permintaan dukungan untuk meningkatkan batas transaksi per detik (TPS).

Pelajari selengkapnya tentang kuota dan batas layanan Kecerdasan Dokumen.

Model kustom

Dapatkah saya meningkatkan perkiraan skor akurasi untuk model kustom?

Ya.

Varians dalam struktur visual dokumen Anda dapat memengaruhi akurasi model. Berikut adalah beberapa tipnya:

  • Sertakan semua variasi dokumen dalam himpunan data pelatihan. Variasi mencakup format yang berbeda; misalnya, PDF digital versus yang dipindai.

  • Pisahkan jenis dokumen yang berbeda secara visual dan latih model yang berbeda.

  • Pastikan Anda tidak memiliki label asing.

  • Untuk pelabelan tanda tangan dan wilayah, jangan sertakan teks di sekitarnya.

Untuk informasi selengkapnya, lihat Skor akurasi dan keyakinan.

Bisakah saya melatih ulang model kustom?

Tidak.

  • Kecerdasan Dokumen tidak memiliki operasi pelatihan ulang eksplisit. Setiap operasi kereta menghasilkan model baru.

  • Jika Anda menemukan bahwa model Anda perlu melatih kembali, Anda dapat menambahkan lebih banyak sampel ke himpunan data pelatihan Anda dan melatih model baru.

  • Anda juga dapat membuat model baru untuk dibuat dengan model asli Anda sebagai berikut:

    1. Buat himpunan data untuk templat baru Anda.

    2. Beri label dan latih model baru.

    3. Validasi bahwa model baru berkinerja baik untuk jenis dokumen spesifik Anda.

    4. Susun model baru Anda dengan model yang ada menjadi satu titik akhir. Kecerdasan Dokumen kemudian dapat menentukan model terbaik untuk setiap dokumen yang akan dianalisis.

    Untuk informasi selengkapnya, lihat model yang terdiri.

Dapatkah saya memindahkan model terlatih saya dari satu lingkungan (seperti beta) ke lingkungan lain (seperti produksi)?

Ya.

Anda dapat menggunakan COPY API untuk menyalin model kustom dari satu akun Kecerdasan Dokumen ke akun lain yang ada di wilayah geografis yang didukung. Untuk instruksi terperinci, lihat Pemulihan bencana.

Operasi penyalinan terbatas pada menyalin model dalam lingkungan cloud tertentu tempat Anda melatih model. Misalnya, menyalin model dari cloud publik ke cloud Azure Government tidak didukung.

Apakah saya dikenakan biaya saat menggunakan pelabelan otomatis?

Ya. Label otomatis dikenakan biaya yang setara dengan permintaan analisis untuk model yang sesuai untuk dokumen.

Apakah saya dikenakan biaya saat melatih model kustom?

Ya.

Untuk v4.0 11-30-2024 (GA) model neural kustom dapat dilatih secara gratis selama maksimal 10 jam. Baik Anda melatih satu model selama 10 jam, atau melatih beberapa model selama total 10 jam, Anda tidak dikenakan biaya selama 10 jam pertama. Setelah menggunakan gratis 10 jam, Anda secara otomatis dikenakan biaya oleh jam pelatihan tambahan. Untuk detail tentang harga, lihat halaman harga. Fitur pelatihan berbayar baru ini memungkinkan model pelatihan untuk durasi yang diperluas untuk memproses dokumen yang lebih besar. Untuk informasi selengkapnya tentang fitur pelatihan berbayar ini, periksa bagian penagihan model neural kustom.

Untuk v3.0 2022-08-31 atau v3.1 2023-07-31, model neural kustom dapat dilatih secara gratis untuk maksimum 20 sesi pelatihan, dengan setiap sesi dibatasi pada durasi pelatihan 30 menit. Setelah Anda menggunakan semua dari 20 sesi pelatihan, Anda dapat mengirimkan tiket dukungan Azure untuk meningkatkan batas sesi pelatihan. Untuk meningkatkan batas, dua sesi pelatihan dianggap sebagai satu jam pelatihan, dan Anda dikenakan biaya per dua sesi / satu jam pelatihan. Untuk detail tentang harga, lihat halaman harga. Untuk informasi selengkapnya tentang cara meningkatkan batas, periksa bagian penagihan model neural kustom. Untuk v3.0 dan v3.1, fitur pelatihan berbayar tidak tersedia. Fitur pelatihan berbayar untuk model neural kustom hanya tersedia di v4.0.

Akun Penyimpanan

Apakah ada waktu kedaluwarsa untuk token tanda tangan akses bersama (SAS) yang saya gunakan untuk autentikasi akun penyimpanan saya?

Ya.

Saat Anda membuat tanda tangan akses bersama (SAS), durasi defaultnya adalah 48 jam. Setelah 48 jam, Anda perlu membuat token baru.

Pertimbangkan untuk mengatur periode durasi yang lebih lama untuk waktu Anda menggunakan akun penyimpanan Anda dengan Kecerdasan Dokumen.

Dapatkah Inteligensi Dokumen mengakses data di akun penyimpanan saya jika berada di belakang jaringan virtual atau firewall?

Tidak, tidak secara langsung.

Kecerdasan Dokumen tidak dapat mengakses akun penyimpanan Anda jika dilindungi oleh jaringan virtual atau firewall.

Namun, akses dan autentikasi akun penyimpanan Azure privat mendukung identitas terkelola untuk sumber daya Azure. Saat Anda menggunakan identitas terkelola, layanan Kecerdasan Dokumen dapat mengakses akun penyimpanan Anda dengan menggunakan kredensial yang ditetapkan.

Jika Anda berniat menganalisis data akun penyimpanan privat Anda dengan menggunakan FOTT, Anda harus menyebarkan alat di belakang jaringan virtual atau firewall.

Pelajari cara membuat dan menggunakan identitas terkelola untuk sumber daya Kecerdasan Dokumen Anda.

Kontainer

Apakah ada perbedaan antara kontainer yang terputus dan terhubung?

Ya.

Meskipun kemampuan model sama untuk kontainer yang terhubung dan terputus, metode penagihan dan konektivitas berbeda:

  • Kontainer yang tersambung mengirim informasi penagihan ke Azure dengan menggunakan sumber daya Kecerdasan Dokumen di akun Azure Anda. Dengan kontainer yang terhubung, konektivitas internet diperlukan untuk mengirim informasi penagihan ke Azure. Kontainer tersambung Kecerdasan Dokumen mengirim informasi tagihan ke Azure dengan menggunakan sumber daya Kecerdasan Dokumen di akun Azure Anda. Kontainer Azure Cognitive Services tidak mengirim data pelanggan, seperti gambar atau teks yang sedang dianalisis, ke Microsoft. Untuk contoh informasi yang dikirim kontainer yang tersambung ke Microsoft untuk penagihan, lihat FAQ kontainer Azure AI.

  • Kontainer terputus memungkinkan Anda menggunakan API yang terputus dari internet. Informasi penagihan tidak dikirim melalui internet. Sebaliknya, Biaya didasarkan pada tingkat komitmen yang dibeli. Saat ini, penggunaan kontainer yang terputus tersedia untuk model kustom dan faktur Kecerdasan Dokumen.

Dapatkah saya menggunakan penyimpanan lokal untuk kontainer Document Intelligence Sample Labeling Tool (FOTT)?

Ya.

FOTT memiliki versi yang menggunakan penyimpanan lokal. Versi perlu dipasang pada mesin Windows. Anda dapat memasangnya dari lokasi ini.

Pada halaman proyek, tentukan URI folder label sebagai /shared atau /shared/sub-dir jika file pelabelan Anda berada dalam subdirektori. Semua perilaku Alat Pelabelan Sampel Kecerdasan Dokumen lainnya sama dengan layanan yang dihosting.

Apakah ada praktik terbaik untuk meningkatkan skala?

Ya.

Untuk panggilan asinkron, Anda dapat menjalankan beberapa kontainer dengan penyimpanan bersama. Kontainer yang memproses POST panggilan analisis menyimpan output dalam penyimpanan. Kemudian, kontainer lain dapat mengambil hasil dari penyimpanan dan melayani GET panggilan. ID permintaan tidak terkait dengan kontainer.

Untuk panggilan sinkron, Anda dapat menjalankan beberapa kontainer, tetapi hanya satu kontainer yang melayani permintaan. Karena ini adalah panggilan pemblokiran, kontainer apa pun dari kumpulan dapat melayani permintaan dan mengirim respons. Di sini, hanya satu kontainer yang terkait dengan permintaan pada satu waktu, dan tidak diperlukan polling.

Bisakah saya menyiapkan kontainer dengan penyimpanan bersama?

Ya.

Kontainer menggunakan Mounts: Shared properti saat memulai untuk menentukan penyimpanan bersama untuk menyimpan file pemrosesan. Untuk melihat penggunaan properti ini, lihat dokumentasi kontainer.

Keamanan dan privasi

Apakah Inteligensi Dokumen menyimpan data saya?

Ya, sebentar.

Untuk semua fitur, Kecerdasan Dokumen untuk sementara menyimpan data dan menghasilkan Azure Storage di wilayah yang sama dengan permintaan. Data Anda kemudian dihapus 24 jam sejak Anda mengirimkan permintaan analisis. Jika Anda ingin data dihapus lebih cepat, Anda dapat memanggil respons analisis penghapusan. API ini menandai hasil penghapusan dan tersedia di API v4.0.

Pelajari selengkapnya tentang data, privasi, dan keamanan untuk Kecerdasan Dokumen.

Untuk model kustom terlatih, output sementara setelah analisis dan pelabelan disimpan di lokasi Azure Storage yang sama tempat Anda menyimpan data pelatihan Anda. Model kustom terlatih disimpan di Azure Storage di wilayah yang sama, dan secara logis diisolasi dengan langganan Azure dan kredensial API Anda.

Lebih banyak bantuan dan dukungan

Apakah ada sumber daya lain yang tersedia untuk memberikan solusi untuk pertanyaan Inteligensi Dokumen Azure AI?

Ya.

Microsoft Q & A adalah rumah untuk pertanyaan dan jawaban teknis di Microsoft. Anda dapat memfilter kueri yang khusus untuk Kecerdasan Dokumen.

Dapatkah saya memberikan umpan balik langsung jika layanan tidak mengenali teks tertentu, atau mengenalinya dengan salah, saat saya melabeli dokumen?

Ya.

Kami terus memperbarui dan meningkatkan model Kecerdasan Dokumen. Anda dapat mengirim email ke tim Kecerdasan Dokumen. Jika memungkinkan, bagikan dokumen sampel dengan masalah yang disorot.