Kuota dan batas layanan

Artikel
10/16/2024

Konten ini berlaku untuk: v4.0 (pratinjau) | Versi sebelumnya: v3.1 (GA) v3.0 (GA)

Konten ini berlaku untuk: v2.1 | Versi terbaru: v4.0 (pratinjau)

Artikel ini berisi referensi cepat dan deskripsi terperinci tentang Kuota dan Batas layanan Kecerdasan Dokumen Azure AI untuk semua tingkat harga. Ini juga berisi beberapa praktik terbaik untuk menghindari pembatasan permintaan.

Penggunaan model

Jenis dokumen didukung	Read	Tata letak	Model bawaan	Model kustom	Kapabilitas add-on
PDF	✔️	✔️	✔️	✔️	✔️
Gambar: `JPEG/JPG`, , `BMPPNG`, `TIFF`,`HEIF`	✔️	✔️	✔️	✔️	✔️
Microsoft Office: `DOCX`, `PPTX`, `XLS`	✔️	✔️	✖️	✖️	✖️

✔️ = didukung ✖️ = Tidak didukung

Jenis dokumen didukung	Read	Tata letak	Model bawaan	Model kustom
PDF	✔️	✔️	✔️	✔️
Gambar: `JPEG/JPG`, , `BMPPNG`, `TIFF`,`HEIF`	✔️	✔️	✔️	✔️
Microsoft Office: `DOCX`, `PPTX`, `XLS`	✔️	✖️	✖️	✖️

✔️ = didukung ✖️ = Tidak didukung

Billing

Penagihan Kecerdasan Dokumen dihitung setiap bulan berdasarkan jenis model dan jumlah halaman yang dianalisis. Anda dapat menemukan metrik penggunaan di dasbor metrik di portal Azure. Dasbor menampilkan jumlah halaman yang diproses Kecerdasan Dokumen Azure AI. Anda dapat memeriksa perkiraan biaya yang dihabiskan untuk sumber daya dengan menggunakan kalkulator harga Azure. Untuk petunjuk terperinci, lihat Memeriksa penggunaan dan memperkirakan biaya. Berikut beberapa detailnya:

Saat Anda mengirimkan dokumen untuk analisis, layanan menganalisis semua halaman kecuali Anda menentukan rentang halaman dengan menggunakan pages parameter dalam permintaan Anda. Saat layanan menganalisis dokumen Microsoft Excel dan PowerPoint melalui model baca, OCR, atau tata letak, layanan menghitung setiap lembar kerja Excel dan slide PowerPoint sebagai satu halaman.
Ketika layanan menganalisis file PDF dan TIFF, layanan menghitung setiap halaman dalam file PDF atau setiap gambar dalam file TIFF sebagai satu halaman tanpa batas karakter maksimum.
Ketika layanan menganalisis file Microsoft Word dan HTML yang didukung model baca dan tata letak, layanan menghitung halaman dalam blok masing-masing 3.000 karakter. Misalnya, jika dokumen Anda berisi 7.000 karakter, dua halaman dengan masing-masing 3.000 karakter dan satu halaman dengan 1.000 karakter menambahkan hingga total tiga halaman.
Model baca dan tata letak tidak mendukung analisis gambar yang disematkan atau ditautkan dalam file Microsoft Word, Excel, PowerPoint, dan HTML. Oleh karena itu, layanan tidak menghitungnya sebagai gambar tambahan.
Melatih model kustom selalu gratis dengan Kecerdasan Dokumen. Biaya hanya dikenakan ketika layanan menggunakan model untuk menganalisis dokumen.
Harga kontainer sama dengan harga layanan cloud.
Kecerdasan Dokumen menawarkan tingkat gratis (F0) tempat Anda dapat menguji semua fitur Kecerdasan Dokumen.
Kecerdasan Dokumen memiliki model harga berbasis komitmen untuk beban kerja besar.
Model Tata Letak diperlukan untuk menghasilkan label untuk himpunan data Anda untuk pelatihan kustom. Jika himpunan data yang Anda gunakan untuk pelatihan kustom tidak memiliki file label yang tersedia, layanan akan menghasilkannya untuk Anda dan menagih Anda untuk penggunaan model tata letak.

Kuota	Gratis (F0)¹	Standar (S0)
Batas Transaksi Per Detik	1	15 (nilai default)
Dapat disesuaikan	No	Ya ²
Ukuran dokumen maks	4 MB	500 MB
Dapat disesuaikan	Tidak	Tidak
Jumlah maksimum halaman (Analisis)	2	2000
Dapat disesuaikan	Tidak	Tidak
Ukuran maksimum file label	10 MB	10 MB
Dapat disesuaikan	Tidak	Tidak
Ukuran maksimum respons json OCR	500 MB	500 MB
Dapat disesuaikan	Tidak	Tidak
Jumlah maksimum model Templat	500	5000
Dapat disesuaikan	Tidak	Tidak
Jumlah maksimum model Neural	100	500
Dapat disesuaikan	Tidak	Tidak

Penggunaan model kustom

Kuota	Gratis (F0)¹	Standar (S0)
Batas Model Tulis	5	500 (nilai default)
Dapat disesuaikan	Tidak	Tidak
*Ukuran himpunan data pelatihan Neural dan Generatif**	1 GB ³	1 GB (nilai default)
Dapat disesuaikan	Tidak	Tidak
*Ukuran himpunan data pelatihan Templat**	50 MB ⁴	50 MB (nilai default)
Dapat disesuaikan	Tidak	Tidak
*Jumlah maksimum halaman (Pelatihan) Templat**	500	500 (nilai default)
Dapat disesuaikan	Tidak	Tidak
*Jumlah maksimum halaman (Pelatihan) Neural dan Generatif**	50.000	50.000 (nilai default)
Dapat disesuaikan	Tidak	Tidak
Pelatihan model neural kustom	10 jam per bulan ⁵	tidak ada batas (bayar per jam)
Dapat disesuaikan	No	Ya ³
*Jumlah maksimum halaman (Pelatihan) Pengklasifikasi**	10,000	10.000 (nilai default)
Dapat disesuaikan	Tidak	Tidak
*Jumlah maksimum jenis dokumen (kelas) Pengklasifikasi**	500	500 (nilai default)
Dapat disesuaikan	Tidak	Tidak
*Ukuran himpunan data pelatihan Pengklasifikasi**	1GB	2GB (nilai default)
Dapat disesuaikan	Tidak	Tidak
*Jumlah minimum sampel per kelas Pengklasifikasi**	5	5 (nilai default)
Dapat disesuaikan	Tidak	Tidak

Penggunaan model kustom

Kuota	Gratis (F0)¹	Standar (S0)
Batas Model Tulis	5	200 (nilai default)
Dapat disesuaikan	Tidak	Tidak
*Ukuran himpunan data pelatihan Neural**	1 GB ³	1 GB (nilai default)
Dapat disesuaikan	Tidak	Tidak
*Ukuran himpunan data pelatihan Templat**	50 MB ⁴	50 MB (nilai default)
Dapat disesuaikan	Tidak	Tidak
*Jumlah maksimum halaman (Pelatihan) Templat**	500	500 (nilai default)
Dapat disesuaikan	Tidak	Tidak
*Jumlah maksimum halaman (Pelatihan) Neural**	50.000	50.000 (nilai default)
Dapat disesuaikan	Tidak	Tidak
Pelatihan model neural kustom	10 per bulan	20 per bulan
Dapat disesuaikan	No	Ya ³
*Jumlah maksimum halaman (Pelatihan) Pengklasifikasi**	10,000	10.000 (nilai default)
Dapat disesuaikan	Tidak	Tidak
*Jumlah maksimum jenis dokumen (kelas) Pengklasifikasi**	500	500 (nilai default)
Dapat disesuaikan	Tidak	Tidak
*Ukuran himpunan data pelatihan Pengklasifikasi**	1GB	1GB (nilai default)
Dapat disesuaikan	Tidak	Tidak
*Jumlah minimum sampel per kelas Pengklasifikasi**	5	5 (nilai default)
Dapat disesuaikan	Tidak	Tidak

Penggunaan model kustom

Kuota	Gratis (F0)¹	Standar (S0)
Batas Model Tulis	5	200 (nilai default)
Dapat disesuaikan	Tidak	Tidak
*Ukuran himpunan data pelatihan Neural**	1 GB ³	1 GB (nilai default)
Dapat disesuaikan	Tidak	Tidak
*Ukuran himpunan data pelatihan Templat**	50 MB ⁴	50 MB (nilai default)
Dapat disesuaikan	Tidak	Tidak
*Jumlah maksimum halaman (Pelatihan) Templat**	500	500 (nilai default)
Dapat disesuaikan	Tidak	Tidak
*Jumlah maksimum halaman (Pelatihan) Neural**	50.000	50.000 (nilai default)
Dapat disesuaikan	Tidak	Tidak
Pelatihan model neural kustom	10 per bulan	20 per bulan
Dapat disesuaikan	No	Ya ³
*Jumlah maksimum halaman (Pelatihan) Pengklasifikasi**	10,000	10.000 (nilai default)
Dapat disesuaikan	Tidak	Tidak
*Jumlah maksimum jenis dokumen (kelas) Pengklasifikasi**	500	500 (nilai default)
Dapat disesuaikan	Tidak	Tidak
*Ukuran himpunan data pelatihan Pengklasifikasi**	1GB	1GB (nilai default)
Dapat disesuaikan	Tidak	Tidak
*Jumlah minimum sampel per kelas Pengklasifikasi**	5	5 (nilai default)
Dapat disesuaikan	Tidak	Tidak

Batas model kustom

Kuota	Gratis (F0)¹	Standar (S0)
Batas Model Tulis	5	200 (nilai default)
Dapat disesuaikan	Tidak	Tidak
Himpunan data pelatihan	50 MB	50 MB (nilai default)
Dapat disesuaikan	Tidak	Tidak
Jumlah maksimum halaman (Pelatihan)	500	500 (nilai default)
Dapat disesuaikan	Tidak	Tidak

¹ Untuk tingkat harga Gratis (F0) lihat juga tunjangan bulanan di halaman harga.
² Lihat praktik terbaik, dan instruksi penyesuaian.
3 Jumlah pelatihan model neural diatur ulang setiap bulan kalender. Buka permintaan dukungan untuk meningkatkan batas pelatihan bulanan.

⁴ Batas ini berlaku untuk semua dokumen yang ditemukan di folder himpunan data pelatihan Anda sebelum pembaruan terkait pelabelan.

⁵ Batas ini hanya berlaku untuk v 4.0 (2024-07-31) model neural kustom. Mulai dari v 4.0, kami mendukung pelatihan dokumen yang lebih besar untuk durasi yang lebih lama (hingga 10 jam secara gratis, dan dikenakan biaya setelahnya). Untuk informasi selengkapnya, silakan merujuk ke halaman model nerual kustom.

Deskripsi mendetail, penyesuaian Kuota, dan praktik terbaik

Sebelum meminta peningkatan kuota (jika ada), pastikan bahwa hal ini diperlukan. Layanan Kecerdasan Dokumen menggunakan penskalaan otomatis untuk membawa sumber daya on-demandkomputasi yang diperlukan, menjaga biaya pelanggan tetap rendah, dan mendeprovisi sumber daya yang tidak digunakan dengan tidak mempertahankan jumlah kapasitas perangkat keras yang berlebihan.

Jika aplikasi Anda mengembalikan Kode Respons 429 (Terlalu banyak permintaan) dan beban kerja Anda berada dalam batas yang ditentukan: kemungkinan besar, layanan meningkatkan skala sesuai permintaan Anda, tetapi belum mencapai skala yang diperlukan. Dengan demikian layanan tidak segera memiliki sumber daya yang cukup untuk melayani permintaan. Keadaan ini biasanya bersifat sementara dan tidak berlangsung lama.

Praktik terbaik umum untuk mengurangi pelambatan selama penskalaan otomatis

Untuk meminimalkan masalah yang terkait dengan pelambatan (Kode Respons 429), sebaiknya gunakan teknik berikut:

Terapkan logika coba lagi di aplikasi Anda
Hindari perubahan ekstrem dalam beban kerja. Meningkatkan beban kerja secara bertahap
Contoh. Aplikasi Anda menggunakan Kecerdasan Dokumen dan beban kerja Anda saat ini adalah 10 TPS (transaksi per detik). Detik berikutnya Anda meningkatkan beban menjadi 40 TPS (yaitu empat kali lebih banyak). Layanan segera mulai meningkatkan skala untuk memenuhi beban baru, tetapi kemungkinan tidak dapat melakukannya dalam hitungan detik, sehingga beberapa permintaan mendapatkan Kode Respons 429.

Bagian berikutnya menjelaskan kasus-kasus khusus dalam menyesuaikan kuota. Lompat ke Kecerdasan Dokumen: meningkatkan batas permintaan bersamaan

Meningkatkan batas permintaan transaksi per detik

Secara default jumlah transaksi per detik dibatasi hingga 15 transaksi per detik untuk sumber daya Kecerdasan Dokumen. Untuk tingkat harga Standar, jumlah ini dapat ditingkatkan. Sebelum mengirimkan permintaan, pastikan Anda memahami materi di bagian ini dan mengetahui praktik terbaik ini.

Meningkatkan batas Permintaan Bersamaan tidak secara langsung memengaruhi biaya Anda. Layanan Kecerdasan Dokumen menggunakan model "Bayar hanya untuk apa yang Anda gunakan". Batas menentukan seberapa tinggi Layanan dapat diskalakan sebelum mulai membatasi permintaan Anda.

Nilai parameter batas Permintaan Bersamaan yang ada tidak terlihat melalui portal Azure, alat Baris Perintah, atau permintaan API. Untuk memverifikasi nilai yang ada, buat Permintaan Dukungan Azure.

Jika Anda ingin meningkatkan transaksi per detik, Anda dapat mengaktifkan penskalakan otomatis pada sumber daya Anda. Ikuti dokumen ini untuk mengaktifkan penskalakan otomatis pada sumber daya Anda * aktifkan penskalakan otomatis. Anda juga dapat mengirimkan permintaan dukungan TPS peningkatan.

Menyiapkan informasi yang diperlukan

ID Sumber Daya Kecerdasan Dokumen
Wilayah
Informasi model dasar:
- Masuk ke portal Microsoft Azure.
- Pilih Sumber Daya Kecerdasan Dokumen yang ingin Anda tingkatkan batas transaksinya
- Pilih -Properties- (-Resource Management- group)
- Salin dan simpan nilai bidang berikut ini:
  - ID Sumber Daya
  - Lokasi (Wilayah titik akhir Anda)

Buat dan kirimkan permintaan dukungan

Mulai peningkatan batas transaksi per detik (TPS) untuk sumber daya Anda dengan mengirimkan Permintaan Dukungan:

Pastikan Anda memiliki informasi yang diperlukan
Masuk ke portal Microsoft Azure.
Pilih Sumber Daya Kecerdasan Dokumen yang ingin Anda tingkatkan batas TPSnya
Pilih -Permintaan dukungan baru- (-Dukungan + pemecahan masalah- grup). Jendela baru muncul dengan informasi yang diisi otomatis tentang Langganan Azure dan Sumber Daya Azure Anda
Masukkan -Summary- (seperti "Tingkatkan batas TPS Inteligensi Dokumen")
Pilih "Validasi kuota atau penggunaan" untuk bidang jenis masalah.
Pilih -Berikutnya: Solusi-
Lanjutkan lebih jauh dengan pembuatan permintaan
Masukkan informasi berikut di bidang -Deskripsi- , di bawah tab Detail:
- catatan, bahwa permintaannya adalah tentang kuota Kecerdasan Dokumen.
- Berikan ekspektasi TPS yang ingin Anda skalakan untuk dipenuhi.
- Informasi sumber daya Azure yang Anda kumpulkan.
- Selesaikan memasukkan informasi yang diperlukan dan pilih tombol -Buat- di tab -Tinjau + buat-
- Catat nomor permintaan dukungan di pemberitahuan portal Azure. Cari Dukungan untuk segera menghubungi Anda untuk diproses lebih lanjut.

Contoh praktik terbaik pola beban kerja

Contoh ini menyajikan pendekatan yang kami sarankan untuk diikuti untuk mengurangi kemungkinan pembatasan permintaan karena Penskalaan otomatis sedang berlangsung. Ini bukan resep yang tepat, tetapi hanya templat yang kami undang untuk diikuti dan disesuaikan seperlunya.

Anggaplah sumber daya Kecerdasan Dokumen memiliki batas default yang ditetapkan. Mulai beban kerja untuk mengirimkan permintaan analisis Anda. Jika Anda mendapati bahwa Anda sering melihat pembatasan dengan kode respons 429, mulailah dengan menerapkan penghindaran eksponensial pada permintaan respons analisis GET. Dengan menggunakan waktu tunggu yang semakin lama antara percobaan ulang untuk respons kesalahan berturut-turut, misalnya pola penundaan 2-5-13-34 antar permintaan. Secara umum, kami merekomendasikan untuk tidak memanggil respons analisis get lebih dari sekali setiap 2 detik untuk permintaan POST yang sesuai.

Jika Anda menemukan bahwa Anda sedang dibatasi pada jumlah permintaan POST untuk dokumen yang diajukan, pertimbangkan untuk menambahkan penundaan di antara permintaan. Jika beban kerja Anda memerlukan tingkat pemrosesan bersamaan yang lebih tinggi, Anda kemudian perlu membuat permintaan dukungan untuk meningkatkan batas layanan Anda pada transaksi per detik.

Umumnya, kami merekomendasikan pengujian beban kerja dan pola beban kerja sebelum pergi ke produksi.

Langkah berikutnya

Pelajari kode galat dan pemecahan masalah

Bagikan melalui

Kuota dan batas layanan

Penggunaan model

Billing

Penggunaan model kustom

Penggunaan model kustom

Penggunaan model kustom

Batas model kustom

Deskripsi mendetail, penyesuaian Kuota, dan praktik terbaik

Praktik terbaik umum untuk mengurangi pelambatan selama penskalaan otomatis

Meningkatkan batas permintaan transaksi per detik

Menyiapkan informasi yang diperlukan

Buat dan kirimkan permintaan dukungan

Contoh praktik terbaik pola beban kerja

Langkah berikutnya

Saran dan Komentar

Sumber Daya Tambahan: