Kuota dan batas layanan
Konten ini berlaku untuk:v2.1 | Versi terbaru:v4.0 (pratinjau)
Artikel ini berisi referensi cepat dan deskripsi terperinci tentang Kuota dan Batas layanan Kecerdasan Dokumen Azure AI untuk semua tingkat harga. Ini juga berisi beberapa praktik terbaik untuk menghindari pembatasan permintaan.
Penggunaan model
Jenis dokumen didukung | Read | Tata letak | Model bawaan | Model kustom | Kemampuan add-on |
---|---|---|---|---|---|
✔️ | ✔️ | ✔️ | ✔️ | ✔️ | |
Gambar: JPEG/JPG , , BMP PNG , TIFF ,HEIF |
✔️ | ✔️ | ✔️ | ✔️ | ✔️ |
Microsoft Office: DOCX , PPTX , XLS |
✔️ | ✔️ | ✖️ | ✖️ | ✖️ |
✔️ = didukung ✖️ = Tidak didukung
Jenis dokumen didukung | Read | Tata letak | Model bawaan | Model kustom |
---|---|---|---|---|
✔️ | ✔️ | ✔️ | ✔️ | |
Gambar: JPEG/JPG , , BMP PNG , TIFF ,HEIF |
✔️ | ✔️ | ✔️ | ✔️ |
Microsoft Office: DOCX , PPTX , XLS |
✔️ | ✖️ | ✖️ | ✖️ |
✔️ = didukung ✖️ = Tidak didukung
Kuota | Gratis (F0)1 | Standar (S0) |
---|---|---|
Batas Transaksi Per Detik | 1 | 15 (nilai default) |
Dapat disesuaikan | No | Ya 2 |
Ukuran dokumen maks | 4 MB | 500 MB |
Dapat disesuaikan | Tidak | Tidak |
Jumlah maksimum halaman (Analisis) | 2 | 2000 |
Dapat disesuaikan | Tidak | Tidak |
Ukuran maksimum file label | 10 MB | 10 MB |
Dapat disesuaikan | Tidak | Tidak |
Ukuran maksimum respons json OCR | 500 MB | 500 MB |
Dapat disesuaikan | Tidak | Tidak |
Jumlah maksimum model Templat | 500 | 5000 |
Dapat disesuaikan | Tidak | Tidak |
Jumlah maksimum model Neural | 100 | 500 |
Dapat disesuaikan | Tidak | Tidak |
Penggunaan model kustom
Kuota | Gratis (F0)1 | Standar (S0) |
---|---|---|
Batas Model Tulis | 5 | 200 (nilai default) |
Dapat disesuaikan | Tidak | Tidak |
Ukuran himpunan data pelatihan * Neural | 1 GB 3 | 1 GB (nilai default) |
Dapat disesuaikan | Tidak | Tidak |
Ukuran himpunan data pelatihan * Templat | 50 MB 4 | 50 MB (nilai default) |
Dapat disesuaikan | Tidak | Tidak |
Jumlah maksimum halaman (Pelatihan) * Templat | 500 | 500 (nilai default) |
Dapat disesuaikan | Tidak | Tidak |
Jumlah maksimum halaman (Pelatihan) * Neural | 50.000 | 50.000 (nilai default) |
Dapat disesuaikan | Tidak | Tidak |
Pelatihan model neural kustom | 10 per bulan | 20 per bulan |
Dapat disesuaikan | No | Ya 3 |
Jumlah maksimum halaman (Pelatihan) * Pengklasifikasi | 10,000 | 10.000 (nilai default) |
Dapat disesuaikan | Tidak | Tidak |
Jumlah maksimum jenis dokumen (kelas) * Pengklasifikasi | 500 | 500 (nilai default) |
Dapat disesuaikan | Tidak | Tidak |
Ukuran himpunan data pelatihan * Pengklasifikasi | 1GB | 1GB (nilai default) |
Dapat disesuaikan | Tidak | Tidak |
Jumlah minimum sampel per kelas * Pengklasifikasi | 5 | 5 (nilai default) |
Dapat disesuaikan | Tidak | Tidak |
Batas model kustom
Kuota | Gratis (F0)1 | Standar (S0) |
---|---|---|
Batas Model Tulis | 5 | 200 (nilai default) |
Dapat disesuaikan | Tidak | Tidak |
Himpunan data pelatihan | 50 MB | 50 MB (nilai default) |
Dapat disesuaikan | Tidak | Tidak |
Jumlah maksimum halaman (Pelatihan) | 500 | 500 (nilai default) |
Dapat disesuaikan | Tidak | Tidak |
1 Untuk tingkat harga Gratis (F0) lihat juga tunjangan bulanan di halaman harga.
2 Lihat praktik terbaik, dan [instruksi penyesuaian(#create-and-submit-support-request).
3 Jumlah pelatihan model neural diatur ulang setiap bulan kalender. Buka permintaan dukungan untuk meningkatkan batas pelatihan bulanan.
4 Batas ini berlaku untuk semua dokumen yang ditemukan di folder himpunan data pelatihan Anda sebelum pembaruan terkait pelabelan.
Deskripsi mendetail, penyesuaian Kuota, dan praktik terbaik
Sebelum meminta peningkatan kuota (jika ada), pastikan bahwa hal ini diperlukan. Layanan Kecerdasan Dokumen menggunakan penskalaan otomatis untuk membawa sumber daya on-demand
komputasi yang diperlukan, menjaga biaya pelanggan tetap rendah, dan mendeprovisi sumber daya yang tidak digunakan dengan tidak mempertahankan jumlah kapasitas perangkat keras yang berlebihan.
Jika aplikasi Anda mengembalikan Kode Respons 429 (Terlalu banyak permintaan) dan beban kerja Anda berada dalam batas yang ditentukan: kemungkinan besar, layanan meningkatkan skala sesuai permintaan Anda, tetapi belum mencapai skala yang diperlukan. Dengan demikian layanan tidak segera memiliki sumber daya yang cukup untuk melayani permintaan. Keadaan ini biasanya bersifat sementara dan tidak berlangsung lama.
Praktik terbaik umum untuk mengurangi pelambatan selama penskalaan otomatis
Untuk meminimalkan masalah yang terkait dengan pelambatan (Kode Respons 429), sebaiknya gunakan teknik berikut:
- Terapkan logika coba lagi di aplikasi Anda
- Hindari perubahan ekstrem dalam beban kerja. Meningkatkan beban kerja secara bertahap
Contoh. Aplikasi Anda menggunakan Kecerdasan Dokumen dan beban kerja Anda saat ini adalah 10 TPS (transaksi per detik). Detik berikutnya Anda meningkatkan beban menjadi 40 TPS (yaitu empat kali lebih banyak). Layanan segera mulai meningkatkan skala untuk memenuhi beban baru, tetapi kemungkinan tidak dapat melakukannya dalam hitungan detik, sehingga beberapa permintaan mendapatkan Kode Respons 429.
Bagian berikutnya menjelaskan kasus-kasus khusus dalam menyesuaikan kuota. Lompat ke Kecerdasan Dokumen: meningkatkan batas permintaan bersamaan
Meningkatkan batas permintaan transaksi per detik
Secara default jumlah transaksi per detik dibatasi hingga 15 transaksi per detik untuk sumber daya Kecerdasan Dokumen. Untuk tingkat harga Standar, jumlah ini dapat ditingkatkan. Sebelum mengirimkan permintaan, pastikan Anda memahami materi di bagian ini dan mengetahui praktik terbaik ini.
Meningkatkan batas Permintaan Bersamaan tidak secara langsung memengaruhi biaya Anda. Layanan Kecerdasan Dokumen menggunakan model "Bayar hanya untuk apa yang Anda gunakan". Batas menentukan seberapa tinggi Layanan dapat diskalakan sebelum mulai membatasi permintaan Anda.
Nilai parameter batas Permintaan Bersamaan yang ada tidak terlihat melalui portal Azure, alat Baris Perintah, atau permintaan API. Untuk memverifikasi nilai yang ada, buat Permintaan Dukungan Azure.
Jika Anda ingin meningkatkan transaksi per detik, Anda dapat mengaktifkan penskalakan otomatis pada sumber daya Anda. Ikuti dokumen ini untuk mengaktifkan penskalakan otomatis pada sumber daya Anda * aktifkan penskalakan otomatis. Anda juga dapat mengirimkan permintaan dukungan TPS peningkatan.
Menyiapkan informasi yang diperlukan
ID Sumber Daya Kecerdasan Dokumen
Wilayah
Cara mendapatkan informasi (Model dasar):
- Masuk ke portal Microsoft Azure.
- Pilih Sumber Daya Kecerdasan Dokumen yang ingin Anda tingkatkan batas transaksinya
- Pilih Properti (grup Pengelolaan Sumber Daya)
- Salin dan simpan nilai bidang berikut ini:
- ID Sumber Daya
- Lokasi (Wilayah titik akhir Anda)
Buat dan kirimkan permintaan dukungan
Mulai peningkatan batas transaksi per detik (TPS) untuk sumber daya Anda dengan mengirimkan Permintaan Dukungan:
- Pastikan Anda memiliki informasi yang diperlukan
- Masuk ke portal Microsoft Azure.
- Pilih Sumber Daya Kecerdasan Dokumen yang ingin Anda tingkatkan batas TPSnya
- Pilih Permintaan dukungan baru (grup Dukungan + pemecahan masalah)
- Jendela baru muncul dengan informasi yang diisi otomatis tentang Langganan Azure dan Sumber Daya Azure Anda
- Masukkan Ringkasan (seperti "Tingkatkan batas TPS Inteligensi Dokumen")
- Di Jenis masalah,* pilih "Validasi kuota atau penggunaan"
- Pilih Berikutnya: Solusi
- Lanjutkan lebih jauh dengan pembuatan permintaan
- Di bawah tab Detail , masukkan informasi berikut ini di bidang Deskripsi :
- catatan, bahwa permintaannya adalah tentang kuota Kecerdasan Dokumen.
- Berikan ekspektasi TPS yang ingin Anda skalakan untuk dipenuhi.
- Informasi sumber daya Azure yang Anda kumpulkan.
- Selesaikan memasukkan informasi yang diperlukan dan pilih tombol Buat di tab Tinjau + buat
- Catat nomor permintaan dukungan di pemberitahuan portal Azure. Anda segera dihubungi untuk diproses lebih lanjut
Contoh praktik terbaik pola beban kerja
Contoh ini menyajikan pendekatan yang kami sarankan untuk diikuti untuk mengurangi kemungkinan pembatasan permintaan karena Penskalaan otomatis sedang berlangsung. Ini bukan resep yang tepat, tetapi hanya templat yang kami undang untuk diikuti dan disesuaikan seperlunya.
Anggaplah sumber daya Kecerdasan Dokumen memiliki batas default yang ditetapkan. Mulai beban kerja untuk mengirimkan permintaan analisis Anda. Jika Anda mendapati bahwa Anda sering melihat pembatasan dengan kode respons 429, mulailah dengan menerapkan penghindaran eksponensial pada permintaan respons analisis GET. Dengan menggunakan waktu tunggu yang semakin lama antara percobaan ulang untuk respons kesalahan berturut-turut, misalnya pola penundaan 2-5-13-34 antar permintaan. Secara umum, kami merekomendasikan untuk tidak memanggil respons analisis get lebih dari sekali setiap 2 detik untuk permintaan POST yang sesuai.
Jika Anda menemukan bahwa Anda sedang dibatasi pada jumlah permintaan POST untuk dokumen yang diajukan, pertimbangkan untuk menambahkan penundaan di antara permintaan. Jika beban kerja Anda memerlukan tingkat pemrosesan bersamaan yang lebih tinggi, Anda kemudian perlu membuat permintaan dukungan untuk meningkatkan batas layanan Anda pada transaksi per detik.
Umumnya, kami merekomendasikan pengujian beban kerja dan pola beban kerja sebelum pergi ke produksi.
Langkah berikutnya
Saran dan Komentar
https://aka.ms/ContentUserFeedback.
Segera hadir: Sepanjang tahun 2024 kami akan menghentikan penggunaan GitHub Issues sebagai mekanisme umpan balik untuk konten dan menggantinya dengan sistem umpan balik baru. Untuk mengetahui informasi selengkapnya, lihat:Kirim dan lihat umpan balik untuk