Kuota dan batas layanan Ucapan

Artikel
01/22/2024

Artikel ini berisi referensi cepat dan deskripsi terperinci tentang kuota dan batasan untuk layanan Ucapan di layanan Azure AI. Informasi ini berlaku untuk semua tingkatan harga layanan. Ini juga berisi beberapa praktik terbaik untuk menghindari pembatasan permintaan.

Untuk tingkat harga gratis (F0), lihat juga tunjangan bulanan di halaman harga.

Referensi kuota dan batas

Bagian berikut ini memberi Anda panduan cepat untuk kuota dan batasan yang berlaku untuk layanan Ucapan.

Untuk informasi tentang kuota yang dapat disesuaikan untuk sumber daya Ucapan Standar (S0), lihat penjelasan, praktik terbaik, dan instruksi penyesuaian lainnya. Kuota dan batasan untuk sumber daya Ucapan Gratis (F0) tidak dapat disesuaikan.

Penting

Jika Anda mengalihkan sumber daya Ucapan dari tingkat harga Gratis (F0) ke Standar (S0), perubahan kuota yang sesuai mungkin memakan waktu hingga beberapa jam.

Kuota dan batas ucapan ke teks per sumber daya

Bagian ini menjelaskan kuota dan batasan ucapan ke teks per sumber daya Ucapan. Kecuali ditentukan lain, batasan tidak dapat disesuaikan.

Terjemahan ucapan ke teks dan ucapan real time

Anda dapat menggunakan ucapan real-time untuk teks dengan Speech SDK atau REST API Ucapan ke teks untuk audio pendek.

Penting

Batas ini berlaku untuk permintaan ucapan real-time bersamaan ke permintaan teks dan permintaan terjemahan ucapan yang digabungkan. Misalnya, jika Anda memiliki 60 permintaan ucapan ke teks bersamaan dan 40 permintaan terjemahan ucapan bersamaan, Anda akan mencapai batas 100 permintaan bersamaan.

Kuota	Gratis (F0)	Standar (S0)
Batas permintaan bersamaan - titik akhir model dasar	1 Batas ini tidak dapat disesuaikan.	100 (nilai default) Tarif dapat disesuaikan untuk sumber daya Standar (S0). Lihat penjelasan, praktik terbaik, dan instruksi penyesuaian lainnya.
Batas permintaan bersamaan - titik akhir kustom	1 Batas ini tidak dapat disesuaikan.	100 (nilai default) Tarif dapat disesuaikan untuk sumber daya Standar (S0). Lihat penjelasan, praktik terbaik, dan instruksi penyesuaian lainnya.
Panjang audio maksimum untuk diarisasi real time.	T/A	240 menit per file

Transkripsi batch

Kuota	Gratis (F0)	Standar (S0)
Batas REST API ucapan ke teks	Tidak tersedia untuk F0	100 permintaan per 10 detik (600 permintaan per menit)
Ukuran file input audio maks	T/A	1 GB
Jumlah maksimal blob per kontainer	T/A	10000
Jumlah maksimum file per permintaan transkripsi (saat Anda menggunakan beberapa URL konten sebagai input).	T/A	1000
Panjang audio maksimum untuk transkripsi dengan diarisasi diaktifkan.	T/A	240 menit per file

Kustomisasi model

Batas dalam tabel ini berlaku per sumber daya Ucapan saat Anda membuat model ucapan kustom.

Kuota	Gratis (F0)	Standar (S0)
Batas REST API	100 permintaan per 10 detik (600 permintaan per menit)	100 permintaan per 10 detik (600 permintaan per menit)
Jumlah maksimal himpunan data ucapan	2	500
Ukuran file himpunan data akustik maks untuk impor data	2 GB	2 GB
Ukuran file himpunan data bahasa maks untuk impor data	200 MB	1,5 GB
Ukuran file himpunan data pengucapan untuk impor data	1 KB	1 MB
Ukuran teks maksimum saat Anda menggunakan `text` parameter dalam permintaan API Models_Create	200 KB	500 KB

Kuota teks ke ucapan dan batasan per sumber daya

Bagian ini menjelaskan kuota teks ke ucapan dan batasan per sumber daya Ucapan.

Teks real time ke ucapan

Anda dapat menggunakan teks real time untuk ucapan dengan Speech SDK atau REST API Teks ke ucapan. Kecuali ditentukan lain, batasan tidak dapat disesuaikan.

Kuota	Gratis (F0)	Standar (S0)
Jumlah maksimum transaksi per periode waktu untuk suara saraf bawaan dan suara neural kustom.	20 transaksi per 60 detik Batas ini tidak dapat disesuaikan.	200 transaksi per detik (TPS) (nilai default) Tarif dapat disesuaikan hingga 1000 TPS untuk sumber daya Standar (S0). Lihat penjelasan, praktik terbaik, dan instruksi penyesuaian lainnya.
Panjang audio maks yang dihasilkan per permintaan	10 menit	10 menit
Jumlah maksimum tag `<voice>` dan `<audio>` yang berbeda dalam SSML	50	50
Ukuran pesan SSML maks per giliran untuk websocket	64 KB	64 KB

Sintesis batch

Batas ini tidak dapat disesuaikan. Untuk informasi selengkapnya tentang latensi sintesis batch, lihat latensi sintesis batch dan praktik terbaik.

Kuota	Gratis (F0)	Standar (S0)
Batas REST API	Tidak tersedia untuk F0	100 permintaan per 10 detik
Ukuran payload JSON maks untuk membuat pekerjaan sintesis	T/A	2 megabyte
Pekerjaan sintesis aktif bersamaan	T/A	Tidak ada batasan
Jumlah maksimum input teks per pekerjaan sintesis	T/A	10000
Waktu maksimum untuk hidup untuk pekerjaan sintesis karena berada dalam status akhir	T/A	Hingga 31 hari (ditentukan menggunakan properti)

Suara saraf kustom - profesional

Batas dalam tabel ini berlaku per sumber daya Ucapan saat Anda membuat model suara neural kustom profesional.

Kuota	Gratis (F0)	Standar (S0)
Jumlah maksimum transaksi per detik (TPS)	Tidak tersedia untuk F0	200 transaksi per detik (TPS) (nilai default)
Jumlah maksimum himpunan data	T/A	500
Jumlah maksimum unggahan himpunan data simultan	T/A	5
Ukuran file data maks untuk impor data per himpunan data	T/A	2 GB
Unggahan audio atau audio panjang tanpa skrip	T/A	Ya
Jumlah maksimum pelatihan model simultan	T/A	4
Jumlah maksimum titik akhir kustom	T/A	50

Suara saraf kustom - suara pribadi

Batas dalam tabel ini berlaku per sumber daya Ucapan saat Anda membuat suara pribadi.

Kuota	Gratis (F0)	Standar (S0)
Batas REST API (tidak termasuk sintesis ucapan)	Tidak tersedia untuk F0	50 permintaan per 10 detik
Jumlah maksimum transaksi per detik (TPS) untuk sintesis ucapan	Tidak tersedia untuk F0	200 transaksi per detik (TPS) (nilai default)

Teks batch ke avatar ucapan

Kuota	Gratis (F0)	Standar (S0)
Batas REST API	Tidak tersedia untuk F0	2 permintaan per 1 menit

Teks real time ke avatar ucapan

Kuota	Gratis (F0)	Standar (S0)
Koneksi baru per menit	Tidak tersedia untuk F0	2 koneksi baru per menit

Alat Pembuatan Konten Audio

Kuota	Gratis (F0)	Standar (S0)
Ukuran file (teks biasa dalam SSML)¹	3.000 karakter per file	20.000 karakter per file
Ukuran file (file leksikon)²	30KB per file	100KB per file
Karakter yang dapat ditagih di SSML	15.000 karakter per file	100.000 karakter per file
Mengekspor ke pustaka audio	1 tugas bersamaan	T/A

¹ Batas hanya berlaku untuk teks biasa di SSML dan tidak menyertakan tag.

² Karakter file leksikon tidak dikenakan biaya. Hanya elemen leksikon dalam SSML yang dihitung sebagai karakter yang dapat ditagih. Lihat karakter yang dapat ditagih untuk mempelajari lebih lanjut.

Kuota dan batas pengenalan pembicara per sumber daya

Pengenalan pembicara dibatasi hingga 20 transaksi per detik (TPS).

Deskripsi mendetail, penyesuaian kuota, dan praktik terbaik

Beberapa kuota layanan Ucapan dapat disesuaikan. Bagian ini memberikan lebih banyak penjelasan, praktik terbaik, dan instruksi penyesuaian.

Kuota berikut dapat disesuaikan untuk sumber daya Standar (S0). Batas permintaan Gratis (F0) tidak dapat disesuaikan.

Batas permintaan bersamaan ucapan ke teks untuk titik akhir model dasar dan titik akhir kustom
Jumlah maksimum transaksi teks ke ucapan per periode waktu untuk suara neural bawaan dan suara neural kustom
Batas permintaan bersamaan terjemahan ucapan

Sebelum meminta peningkatan kuota (jika ada), pastikan bahwa hal ini diperlukan. Layanan Ucapan menggunakan teknologi penskalaan otomatis untuk membawa sumber daya komputasi yang diperlukan dalam mode sesuai permintaan. Pada saat yang sama, layanan Ucapan mencoba untuk menjaga biaya Anda tetap rendah dengan tidak mempertahankan kapasitas perangkat keras yang berlebihan.

Mari lihat contohnya. Misalkan aplikasi Anda menerima kode respons 429, yang menunjukkan bahwa ada terlalu banyak permintaan. Aplikasi Anda menerima respons ini meskipun beban kerja Anda berada dalam batas yang ditentukan oleh Referensi kuota dan batas. Penjelasan yang paling tepat adalah bahwa layanan Ucapan melakukan peningkatan berdasarkan permintaan Anda dan masih belum mencapai skala yang diperlukan. Oleh karena itu, layanan tidak segera memiliki sumber daya yang cukup untuk melayani permintaan. Dalam kebanyakan kasus, keadaan yang dibatasi ini bersifat sementara.

Praktik terbaik umum untuk mengurangi pelambatan selama penskalaan otomatis

Untuk meminimalkan masalah yang berkaitan dengan pembatasan, ada baiknya Anda menggunakan teknik berikut:

Terapkan logika coba lagi di aplikasi Anda.
Hindari perubahan ekstrem dalam beban kerja. Tingkatkan beban kerja secara bertahap. Misalnya, aplikasi Anda menggunakan teks ke ucapan, dan beban kerja Anda saat ini adalah 5 TPS. Detik berikutnya, Anda meningkatkan beban menjadi 20 TPS (yaitu empat kali lebih banyak). Layanan Ucapan segera memulai peningkatan skala untuk memenuhi beban baru, tetapi tidak dapat menskalakan sesuai kebutuhan dalam satu detik. Beberapa permintaan mendapatkan kode respons 429 (terlalu banyak permintaan).
Uji pola peningkatan beban yang berbeda. Untuk informasi selengkapnya, lihat contoh pola beban kerja.
Buat lebih banyak sumber daya layanan Ucapan di berbagai wilayah, dan distribusikan beban kerja di antara mereka. (Membuat beberapa sumber daya layanan Ucapan di wilayah yang sama tidak akan memengaruhi performa, karena semua sumber daya dilayani oleh kluster backend yang sama).

Bagian berikutnya menjelaskan kasus-kasus khusus dalam menyesuaikan kuota.

Ucapan ke teks: tingkatkan ucapan real-time ke batas permintaan bersamaan teks

Secara default, jumlah permintaan terjemahan ucapan ke teks dan ucapan bersamaan yang digabungkan dibatasi hingga 100 per sumber daya dalam model dasar, dan 100 per titik akhir kustom dalam model kustom. Untuk tingkat harga standar, Anda dapat meningkatkan jumlah ini. Sebelum mengirimkan permintaan, pastikan Anda tidak asing dengan materi yang dibahas sebelumnya dalam artikel ini, seperti praktik terbaik untuk mengurangi pembatasan.

Catatan

Batas permintaan bersamaan untuk model dasar dan kustom perlu disesuaikan secara terpisah. Anda dapat memiliki sumber daya layanan Ucapan yang terkait dengan banyak titik akhir kustom yang menghosting banyak penyebaran model kustom. Sesuai kebutuhan, penyesuaian batas per titik akhir kustom harus diminta secara terpisah.

Meningkatkan batas permintaan bersamaan tidak memengaruhi biaya Anda secara langsung. Layanan Ucapan menggunakan model pembayaran yang mengharuskan Anda hanya membayar untuk apa yang Anda gunakan. Batas menentukan seberapa tinggi layanan dapat diskalakan sebelum mulai membatasi permintaan Anda.

Anda tidak dapat melihat nilai yang ada dari parameter batas permintaan bersamaan di portal Azure, alat baris perintah, atau permintaan API. Untuk memverifikasi nilai yang ada, buat permintaan dukungan Azure.

Catatan

Kontainer ucapan tidak memerlukan peningkatan batas permintaan bersamaan, karena kontainer hanya dibatasi oleh CPU dari perangkat keras tempat kontainer tersebut dihosting. Namun, kontainer ucapan memiliki batasan kapasitasnya sendiri yang harus diperhitungkan. Untuk informasi selengkapnya, lihat FAQ kontainer ucapan.

Menyiapkan informasi yang diperlukan

Untuk model dasar:
- ID sumber daya ucapan
- Wilayah
Untuk model kustom:
- Wilayah
- ID titik akhir kustom

Cara mendapatkan informasi untuk model dasar:

Buka portal Microsoft Azure.
Pilih sumber daya layanan Ucapan yang ingin Anda tingkatkan batas permintaan bersamaannya.
Dari grup Pengelolaan Sumber Daya, pilih Properti.
Salin dan simpan nilai bidang berikut ini:
- ID Sumber Daya
- Lokasi (wilayah titik akhir Anda)

Cara mendapatkan informasi untuk model kustom:

Buka portal Speech Studio.
Masuk jika perlu, dan buka Ucapan kustom.
Pilih proyek Anda, dan buka Penyebaran.
Pilih titik akhir yang diperlukan.
Salin dan simpan nilai bidang berikut ini:
- Wilayah Layanan (wilayah titik akhir Anda)
- ID Titik Akhir

Membuat dan mengirimkan permintaan dukungan

Mulai peningkatan batas untuk permintaan bersamaan sumber daya Anda, atau jika perlu periksa batas saat ini, dengan mengirimkan permintaan dukungan. Berikut caranya:

Pastikan Anda memiliki informasi yang diperlukan yang tercantum di bagian sebelumnya.
Buka portal Microsoft Azure.
Pilih sumber daya layanan Ucapan yang ingin Anda tingkatkan (atau periksa) batas permintaan bersamaannya.
Di grup Dukungan + pemecahan masalah, pilih Permintaan dukungan baru. Jendela baru muncul, dengan informasi yang diisi otomatis tentang langganan Azure dan sumber daya Azure Anda.
Di Ringkasan, jelaskan apa yang Anda inginkan (misalnya, "Tingkatkan batas permintaan konkurensi ucapan ke teks").
Di Jenis masalah, pilih Masalah Kuota atau Langganan.
Di Subjenis masalah, pilih:
- Peningkatan permintaan bersamaan atau kuota untuk permintaan yang meningkat.
- Validasi kuota atau penggunaan untuk memeriksa batas yang ada.
Pilih Berikutnya: Solusi. Lanjutkan lebih jauh dengan pembuatan permintaan.
Pada tab Detail , di bidang Deskripsi , masukkan yang berikut ini:
- Catatan bahwa permintaannya adalah tentang kuota ucapan ke teks.
- Pilih model dasar atau kustom.
- Informasi sumber daya Azure yang Anda kumpulkan sebelumnya.
- Informasi lain yang diperlukan.
Di tab Tinjau + buat, pilih Buat.
Catat nomor permintaan dukungan di pemberitahuan portal Azure. Anda segera dihubungi tentang permintaan Anda.

Contoh praktik terbaik pola beban kerja

Berikut adalah contoh umum dari pendekatan yang tepat untuk dilakukan. Ini dimaksudkan hanya sebagai template yang dapat Anda sesuaikan sesuai kebutuhan untuk penggunaan Anda sendiri.

Misalkan sumber daya layanan Ucapan memiliki batas permintaan bersamaan yang ditetapkan ke 300. Mulai beban kerja dari 20 sambungan bersamaan, dan tingkatkan beban sebanyak 20 sambungan bersamaan setiap 90-120 detik. Kontrol respons layanan, dan terapkan logika yang mundur (mengurangi beban) jika Anda mendapatkan terlalu banyak permintaan (kode respons 429). Kemudian, coba lagi peningkatan beban dalam satu menit, dan jika masih tidak berfungsi, coba lagi dalam dua menit. Gunakan pola 1-2-4-4 menit untuk intervalnya.

Umumnya, ada baiknya menguji beban kerja dan pola beban kerja sebelum pergi ke produksi.

Teks ke ucapan: tingkatkan batas permintaan bersamaan

Untuk tingkat harga standar, Anda dapat meningkatkan jumlah ini. Sebelum mengirimkan permintaan, pastikan Anda tidak asing dengan materi yang dibahas sebelumnya dalam artikel ini, seperti praktik terbaik untuk mengurangi pembatasan.

Meningkatkan batas permintaan bersamaan tidak memengaruhi biaya Anda secara langsung. Layanan Ucapan menggunakan model pembayaran yang mengharuskan Anda membayar hanya untuk apa yang Anda gunakan. Batas menentukan seberapa tinggi layanan dapat diskalakan sebelum mulai membatasi permintaan Anda.

Catatan

Kontainer ucapan tidak memerlukan peningkatan batas permintaan bersamaan, karena kontainer hanya dibatasi oleh CPU dari perangkat keras tempat kontainer tersebut dihosting.

Menyiapkan informasi yang diperlukan

Untuk membuat permintaan peningkatan, Anda perlu memberikan informasi Anda.

Untuk suara bawaan:
- ID sumber daya ucapan
- Wilayah
Untuk suara kustom:
- Wilayah penyebaran
- ID titik akhir kustom

Cara mendapatkan informasi untuk suara bawaan:

Buka portal Microsoft Azure.
Pilih sumber daya layanan Ucapan yang ingin Anda tingkatkan batas permintaan bersamaannya.
Dari grup Pengelolaan Sumber Daya, pilih Properti.
Salin dan simpan nilai bidang berikut ini:
- ID Sumber Daya
- Lokasi (wilayah titik akhir Anda)

Cara mendapatkan informasi untuk suara kustom:

Buka portal Speech Studio.
Masuk jika perlu, dan buka Suara kustom.
Pilih proyek Anda, dan buka Sebarkan model.
Pilih titik akhir yang diperlukan.
Salin dan simpan nilai bidang berikut ini:
- Wilayah Layanan (wilayah titik akhir Anda)
- ID Titik Akhir

Membuat dan mengirimkan permintaan dukungan

Mulai peningkatan batas untuk permintaan bersamaan sumber daya Anda, atau jika perlu periksa batas saat ini, dengan mengirimkan permintaan dukungan. Berikut caranya:

Pastikan Anda memiliki informasi yang diperlukan yang tercantum di bagian sebelumnya.
Buka portal Microsoft Azure.
Pilih sumber daya layanan Ucapan yang ingin Anda tingkatkan (atau periksa) batas permintaan bersamaannya.
Di grup Dukungan + pemecahan masalah, pilih Permintaan dukungan baru. Jendela baru muncul, dengan informasi yang diisi otomatis tentang langganan Azure dan sumber daya Azure Anda.
Di Ringkasan, jelaskan apa yang Anda inginkan (misalnya, "Tingkatkan batas permintaan konkurensi teks ke ucapan").
Di Jenis masalah, pilih Masalah Kuota atau Langganan.
Di Subjenis masalah, pilih:
- Peningkatan permintaan bersamaan atau kuota untuk permintaan yang meningkat.
- Validasi kuota atau penggunaan untuk memeriksa batas yang ada.
Pada tab Solusi yang direkomendasikan, pilih Berikutnya.
Pada tab Detail tambahan, isi semua item yang diperlukan. Dan di bidang Detail , masukkan yang berikut ini:
- Catatan bahwa permintaannya adalah tentang kuota teks ke ucapan.
- Pilih suara bawaan atau suara kustom.
- Informasi sumber daya Azure yang Anda kumpulkan sebelumnya.
- Informasi lain yang diperlukan.
Di tab Tinjau + buat, pilih Buat.
Catat nomor permintaan dukungan di pemberitahuan portal Azure. Anda segera dihubungi tentang permintaan Anda.

Avatar teks ke ucapan: tingkatkan batas koneksi baru

Untuk meningkatkan batas koneksi baru per menit untuk avatar teks ke ucapan, hubungi perwakilan penjualan Anda untuk membuat tiket dengan informasi berikut:

URI sumber daya ucapan
Meminta batasan baru untuk ditingkatkan
Justifikasi untuk peningkatan
Tanggal mulai untuk peningkatan
Tanggal berakhir untuk peningkatan
Avatar bawaan atau avatar kustom

Kuota dan batas layanan Ucapan

Referensi kuota dan batas

Kuota dan batas ucapan ke teks per sumber daya

Terjemahan ucapan ke teks dan ucapan real time

Transkripsi batch

Kustomisasi model

Kuota teks ke ucapan dan batasan per sumber daya

Teks real time ke ucapan

Sintesis batch

Suara saraf kustom - profesional

Suara saraf kustom - suara pribadi

Teks batch ke avatar ucapan

Teks real time ke avatar ucapan

Alat Pembuatan Konten Audio

Kuota dan batas pengenalan pembicara per sumber daya

Deskripsi mendetail, penyesuaian kuota, dan praktik terbaik

Praktik terbaik umum untuk mengurangi pelambatan selama penskalaan otomatis

Ucapan ke teks: tingkatkan ucapan real-time ke batas permintaan bersamaan teks

Menyiapkan informasi yang diperlukan

Membuat dan mengirimkan permintaan dukungan

Contoh praktik terbaik pola beban kerja

Teks ke ucapan: tingkatkan batas permintaan bersamaan

Menyiapkan informasi yang diperlukan

Membuat dan mengirimkan permintaan dukungan

Avatar teks ke ucapan: tingkatkan batas koneksi baru

Sumber Daya Tambahan: