Not
Bu sayfaya erişim yetkilendirme gerektiriyor. Oturum açmayı veya dizinleri değiştirmeyi deneyebilirsiniz.
Bu sayfaya erişim yetkilendirme gerektiriyor. Dizinleri değiştirmeyi deneyebilirsiniz.
Bu makale, Azure yapay zeka hizmetlerinde Konuşma hizmeti için kotalar ve sınırlar hakkında hızlı bir referans ve ayrıntılı bir açıklama içermektedir. Bilgiler, hizmetin tüm fiyatlandırma katmanları için geçerlidir. Ayrıca istek kısıtlamasını önlemek için bazı en iyi yöntemleri içerir.
Ücretsiz (F0) fiyatlandırma katmanı için fiyatlandırma sayfasındaki aylık izinlere de bakın.
Kotalar ve limitler referansı
Aşağıdaki bölümlerde Konuşma hizmeti için geçerli olan kotalar ve sınırlar için hızlı bir kılavuz sağlanır.
Standart (S0) Konuşma kaynakları için ayarlanabilir kotalar hakkında bilgi için daha fazla açıklamaya, en iyi yöntemlere ve ayarlama yönergelerine bakın. Ücretsiz (F0) Konuşma kaynaklarının kotaları ve sınırları ayarlanamaz.
Önemli
Konuşma için bir AI Foundry kaynağını Ücretsiz (F0) fiyatlandırma katmanından Standart (S0) fiyatlandırma katmanına değiştirirseniz, ilgili kotaların değişmesi birkaç saat sürebilir.
Kaynak başına konuşma metin kotaları ve sınırları
Bu bölümde Konuşma kaynağı başına konuşmayı metne dönüştürme kotaları ve sınırları açıklanmaktadır. Aksi belirtilmediği sürece sınırlar ayarlanamaz.
Gerçek zamanlı konuşmayı metne dönüştürme ve konuşma çevirisi
Kısa ses için Konuşma SDK'sı veya Konuşmayı metne dönüştürme REST API'siyle metinde gerçek zamanlı konuşma kullanabilirsiniz.
Önemli
Bu sınırlar, metin isteklerine eş zamanlı gerçek zamanlı konuşma ve konuşma çevirisi isteklerinin birleştirilmesi için geçerlidir. Örneğin, metin isteklerine yönelik 60 eşzamanlı konuşma ve 40 eşzamanlı konuşma çevirisi isteğiniz varsa, 100 eşzamanlı istek sınırına ulaşırsınız.
Kota | Ücretsiz (F0) | Standart (S0) |
---|---|---|
Eşzamanlı istek sınırı - temel model uç noktası | 1 Bu sınır ayarlanamaz. |
100 (varsayılan değer) Oran Standart (S0) kaynakları için ayarlanabilir. Daha fazla açıklama, en iyi yöntem ve ayarlama yönergelerine bakın. |
Eşzamanlı istek sınırı - özel uç nokta | 1 Bu sınır ayarlanamaz. |
100 (varsayılan değer) Oran Standart (S0) kaynakları için ayarlanabilir. Daha fazla açıklama, en iyi yöntem ve ayarlama yönergelerine bakın. |
Gerçek zamanlı darizasyon için maksimum ses uzunluğu. | Yok | Dosya başına 240 dakika |
Hızlı transkripsiyon
Kota | Ücretsiz (F0) | Standart (S0) |
---|---|---|
En büyük ses giriş dosyası boyutu | Yok | < 300 MB |
Maksimum ses uzunluğu | Yok | < Dosya başına 120 dakika |
Dakika başına en fazla istek sayısı | Yok | 600 |
Toplu transkripsiyon
Kota | Ücretsiz (F0) | Standart (S0) |
---|---|---|
Konuşmayı metne dönüştürme REST API sınırı | F0 için kullanılamaz | 10 saniyede 100 istek (dakikada 600 istek) |
Maksimum ses giriş dosyası boyutu | Yok | 1 GB |
Kapsayıcı başına maksimum blob sayısı | Yok | 10.000 |
Transkripsiyon isteği başına en fazla dosya sayısı (giriş olarak birden çok içerik URL'sini kullandığınızda). | Yok | 1000 |
Darizasyon etkin transkripsiyonlar için maksimum ses uzunluğu. | Yok | Dosya başına 240 dakika |
Model özelleştirme
Bu tablodaki sınırlar, özel bir konuşma modeli oluşturduğunuzda Konuşma kaynağı başına uygulanır.
Kaynak başına metin okuma kotaları ve sınırları
Bu bölümde Konuşma kaynağı başına metin okuma kotaları ve sınırları açıklanmaktadır.
Gerçek zamanlı metin okuma
Konuşma SDK'sı veya Metin okuma REST API'siyle gerçek zamanlı metin kullanarak konuşma yapabilirsiniz. Aksi belirtilmediği sürece sınırlar ayarlanamaz.
Kota | Ücretsiz (F0) | Standart (S0) |
---|---|---|
Standart sesler ve özel sesler için zaman aralığı başına işlem sayısı üst sınırı. | 60 saniyede 20 işlem Bu sınır ayarlanamaz. |
Saniyede 200 işlem (TPS) (varsayılan değer) Standart (S0) kaynaklar için hız 1000 TPS'ye kadar ayarlanabilir. Daha fazla açıklama, en iyi yöntem ve ayarlama yönergelerine bakın. |
İstek başına üretilen maksimum ses uzunluğu | 10 dk | 10 dk |
SSML'de en fazla benzersiz <voice> ve <audio> etiket sayısı |
50 | 50 |
Websocket için dönüş başına en fazla SSML ileti boyutu | 64 KB | 64 KB |
Toplu sentez
Bu sınırlar ayarlanmıyor. Toplu sentez gecikme süresi hakkında daha fazla bilgi için bkz . toplu sentez gecikme süresi ve en iyi yöntemler.
Kota | Ücretsiz (F0) | Standart (S0) |
---|---|---|
REST API sınırı | F0 için kullanılamaz | 10 saniyede 100 istek |
Sentez işi oluşturmak için maksimum JSON yükü boyutu | Yok | 2 megabayt |
Eşzamanlı etkin sentez işleri | Yok | Sınırsız |
Sentez işi başına en fazla metin girişi sayısı | Yok | 10.000 |
Son durumda olduğundan beri bir sentez işinin maksimum geçerlilik süresi | Yok | 31 güne kadar (özellikler kullanılarak belirtilir) |
Özel ses - profesyonel
Bu tablodaki sınırlar, profesyonel bir ses oluşturduğunuzda Konuşma kaynağı başına uygulanır.
Kota | Ücretsiz (F0) | Standart (S0) |
---|---|---|
Saniye başına en fazla işlem sayısı (TPS) | F0 için kullanılamaz | Saniyede 200 işlem (TPS) (varsayılan değer) |
En fazla veri kümesi sayısı | Yok | beş yüz |
En fazla eşzamanlı veri kümesi yükleme sayısı | Yok | 5 |
Veri kümesi başına veri içeri aktarma için maksimum veri dosyası boyutu | Yok | 2GB |
Uzun ses dosyası veya betiği olmayan ses dosyası yükleme | Yok | Evet |
En fazla eşzamanlı model eğitimi sayısı | Yok | 4 |
En fazla özel uç nokta sayısı | Yok | 50 |
Özel ses - kişisel ses
Bu tablodaki sınırlar, kişisel bir ses oluşturduğunuzda Konuşma kaynağı başına uygulanır.
Kota | Ücretsiz (F0) | Standart (S0) |
---|---|---|
REST API sınırı (konuşma sentezi dahil değildir) | F0 için kullanılamaz | 10 saniyede 50 istek |
Konuşma sentezi için saniye başına en fazla işlem sayısı (TPS) | F0 için kullanılamaz | Saniyede 200 işlem (TPS) (varsayılan değer) |
Toplu metni sese çevirme avatarı
Kota | Ücretsiz (F0) | Standart (S0) |
---|---|---|
REST API sınırı | F0 için kullanılamaz | 1 dakikada 2 istek |
Gerçek zamanlı metin okuma avatarı
Kota | Ücretsiz (F0) | Standart (S0) |
---|---|---|
Dakika başına yeni bağlantılar | F0 için kullanılamaz | Dakikada 2 yeni bağlantı |
Konuşma ile maksimum bağlantı süresi | F0 için kullanılamaz | 30 dakika1 |
Boşta durumuyla maksimum bağlantı süresi | F0 için kullanılamaz | 5 dakika |
1 Gerçek zamanlı avatarın 30 dakikadan uzun süre sürekli çalışmasını sağlamak için otomatik yeniden bağlanmayı etkinleştirebilirsiniz. Otomatik yeniden bağlanmayı ayarlama hakkında bilgi için bu örnek koda ("otomatik yeniden bağlanma" araması yapın) bakın.
Ses İçeriği Oluşturma aracı
Kota | Ücretsiz (F0) | Standart (S0) |
---|---|---|
Dosya boyutu (SSML'de düz metin)1 | Dosya başına 3.000 karakter | Dosya başına 20.000 karakter |
Dosya boyutu (sözlük dosyası)2 | Dosya başına 30 KB | Dosya başına 100 KB |
SSML'de faturalanabilir karakterler | Dosya başına 15.000 karakter | Dosya başına 100.000 karakter |
Ses kitaplığına aktar | 1 eşzamanlı görev | Yok |
1 Sınır yalnızca SSML'deki düz metinler için geçerlidir ve etiket içermez.
2 Sözlük dosyasının karakterleri ücretlendirilmiyor. Yalnızca SSML'deki sözlük öğeleri faturalanabilir karakterler olarak sayılır. Daha fazla bilgi edinmek için faturalanabilir karakterlere bakın.
Kaynak başına konuşmacı tanıma kotaları ve sınırları
Konuşmacı tanıma, saniyede 20 işlemle (TPS) sınırlıdır.
Ayrıntılı açıklama, kota ayarlama ve en iyi yöntemler
Konuşma hizmeti kotalarından bazıları ayarlanabilir. Bu bölümde daha fazla açıklama, en iyi yöntem ve ayarlama yönergeleri sağlanmaktadır.
Standart (S0) kaynaklar için aşağıdaki kotalar ayarlanabilir. Ücretsiz (F0) istek sınırları ayarlanmıyor.
- Temel model uç noktası ve özel uç nokta için konuşmayı metne dönüştürme eşzamanlı istek sınırı
- Metinden konuşmaya standart sesler ve özel sesler için belirli bir dönem içinde maksimum işlem sayısı
- Konuşma çevirisi eşzamanlı istek sınırı
Kota artışı istemeden önce (varsa), geçerli TPS'nizi (saniyedeki işlemler) denetleyin ve kotayı artırmanın gerekli olduğundan emin olun. Konuşma hizmeti, gerekli hesaplama kaynaklarını isteğe bağlı moda getirmek için otomatik ölçeklendirme teknolojilerini kullanır. Konuşma hizmeti aynı zamanda aşırı miktarda donanım kapasitesi korumayarak maliyetlerinizi düşük tutmaya çalışır.
Bir örneğe göz atalım. Uygulamanızın çok fazla istek olduğunu belirten 429 yanıt kodunu aldığını varsayalım. İş yükünüz Kotalar ve sınırlar başvurusu tarafından tanımlanan sınırlar içinde olsa bile uygulamanız bu yanıtı alır. En olası açıklama, Konuşma hizmetinin talebinize göre ölçeği artırması ve henüz gerekli ölçeğe ulaşmamış olmasıdır. Bu nedenle, hizmetin talebi karşılamak için hemen yeterli kaynağı yoktur. Bu gibi durumlarda kotanın artırılması yararlı olmaz. Çoğu durumda Konuşma hizmeti yakında ölçeğini genişletecek ve yanıt kodu 429'a neden olan sorun çözülecektir.
Otomatik ölçeklendirme sırasında kısıtlamayı hafifletmek için genel en iyi uygulamalar
Azaltmayla ilgili sorunları en aza indirmek için aşağıdaki teknikleri kullanmak iyi bir fikirdir:
- Uygulamanıza yeniden deneme mantığı ekleyin.
- İş yükünde ani değişikliklerden kaçının. İş yükünü kademeli olarak artırın. Örneğin, uygulamanızın metin okuma özelliğini kullandığını ve geçerli iş yükünüzün 5 TPS olduğunu düşünelim. Sonraki saniye, yükü 20 TPS'ye (yani dört kat daha fazla) yükseltin. Konuşma hizmeti, yeni yükü karşılamak için ölçeklendirmeye hemen başlar, ancak bir saniye içerisinde gerekli şekilde ölçeklendirmeyi gerçekleştiremez. İsteklerden bazıları 429 yanıt kodunu (çok fazla istek) alır.
- Farklı yük artışı desenlerini test edin. Daha fazla bilgi için iş yükü deseni örneğine bakın.
- Farklı bölgelerde daha fazla Konuşma hizmeti kaynağı oluşturun ve iş yükünü bunlar arasında dağıtın. (Tüm kaynaklar aynı arka uç kümesi tarafından sunulduğundan, aynı bölgede birden çok Konuşma hizmeti kaynağı oluşturulması performansı etkilemez).
Sonraki bölümlerde kotaları ayarlamayla ilgili belirli durumlar açıklanmaktadır.
Konuşmayı metne dönüştürme: Gerçek zamanlı konuşmayı metne eş zamanlı istek sınırını yükseltme
Varsayılan olarak, konuşmadan metne ve konuşma çevirisi taleplerinin birleştirilmiş eş zamanlı sayısı, temel modelde kaynak başına 100 ve özel modelde özel uç nokta başına 100 ile sınırlıdır. Standart fiyatlandırma katmanı için bu miktarı artırabilirsiniz. İsteği göndermeden önce, kısıtlamayı azaltmak için en iyi yöntemler gibi bu makalenin önceki bölümlerinde açıklanan bilgileri bildiğinizden emin olun.
Not
Temel ve özel modeller için eşzamanlı istek sınırlarının ayrı olarak ayarlanması gerekir. Birçok özel model dağıtımlarını barındıran birçok özel uç noktayla ilişkili bir Konuşma hizmeti kaynağınız olabilir. Gerektiğinde, özel uç nokta başına sınır ayarlamaları ayrı olarak istenmelidir.
Eşzamanlı istek sınırını artırmak maliyetlerinizi doğrudan etkilemez. Konuşma hizmeti, yalnızca kullandığınız kadar ödeme yapılmasını gerektiren bir ödeme modeli kullanır. Sınır, hizmetin isteklerinizi kısıtlamaya başlamadan önce hangi dereceye kadar ölçeklenebileceğini tanımlar.
Azure portalında, komut satırı araçlarında veya API isteklerinde eşzamanlı istek sınırı parametresinin mevcut değerini göremezsiniz. Mevcut değeri doğrulamak için bir Azure desteği isteği oluşturun.
Not
Konuşma kapsayıcıları , yalnızca barındırıldıkları donanımın CPU'ları tarafından kısıtlandığından eşzamanlı istek sınırının artmasına gerek yoktur. Ancak konuşma kapsayıcılarının dikkate alınması gereken kendi kapasite sınırlamaları vardır. Daha fazla bilgi için Konuşma kapsayıcıları SSS'sine bakın.
Gerekli bilgileri hazır bulundurun
- Temel model için:
- Konuşma kaynağı kimliği
- Bölge
- Özel model için:
- Bölge
- Özel uç nokta kimliği
Temel model hakkında bilgi alma:
- Azure portala gidin.
- Eşzamanlılık isteği sınırını artırmak istediğiniz Konuşma hizmeti kaynağını seçin.
- Kaynak Yönetimi grubunda Özellikler'i seçin.
- Aşağıdaki alanların değerlerini kopyalayın ve kaydedin:
- Kaynak Kimliği
- Konum (uç nokta bölgeniz)
Özel modelle ilgili bilgi alma:
- Speech Studio portalına gidin.
- Gerekirse oturum açın ve Özel konuşma'ya gidin.
- Projenizi seçin ve Dağıtım'a gidin.
- Gerekli uç noktayı seçin.
- Aşağıdaki alanların değerlerini kopyalayın ve kaydedin:
- Hizmet Bölgesi (uç nokta bölgeniz)
- Uç Nokta Kimliği
Destek isteği oluşturma ve gönderme
Kaynağınız için eşzamanlı istekler için sınırın artırılmasını başlatın veya gerekirse bir destek isteği göndererek geçerli sınırı denetleyin. Şunu yapabilirsiniz:
- Önceki bölümde listelenen gerekli bilgilere sahip olduğunuzdan emin olun.
- Azure portala gidin.
- Eşzamanlılık isteği sınırını artırmak (veya denetlemek) istediğiniz Konuşma hizmeti kaynağını seçin.
- Destek + sorun giderme grubunda Yeni destek isteği'ni seçin. Azure aboneliğiniz ve Azure kaynağınızla ilgili otomatik olarak doldurulmuş bilgiler içeren yeni bir pencere görüntülenir.
- Özet'te ne istediğinizi açıklayın (örneğin, "Konuşmadan metne eşzamanlı istek sınırını artırma").
- Sorun türü'nde Kota veya Abonelik sorunları'yı seçin.
- Sorun alt türü'nde aşağıdakilerden birini seçin:
- Bir artış isteği için kota veya eşzamanlı istekler artar .
- Mevcut sınırı denetlemek için kota veya kullanım doğrulaması .
- İleri: Çözümler'i seçin. İstek oluşturma işlemine devam edin.
- Ayrıntılar sekmesindeki Açıklama alanına aşağıdakileri girin:
- İsteğin konuşmadan metne kotayla ilgili olduğunu belirten bir not.
- Temel veya özel modeli seçin.
- Daha önce topladığınız Azure kaynak bilgileri.
- Diğer gerekli bilgiler.
- Gözden Geçir + oluştur sekmesinde Oluştur'u seçin.
- Azure portal bildirimlerindeki destek isteği numarasını not alın. İsteğiniz hakkında kısa süre sonra sizinle iletişime geçilir.
İş yükü modeli en iyi uygulama örneği
İşte iyi bir yaklaşımın genel bir örneği. Yalnızca kendi kullanımınız için gereken şekilde ayarlayabileceğiniz bir şablon olarak tasarlanabilir.
Konuşma hizmeti kaynağının eşzamanlı istek sınırının 300 olarak ayarlandığını varsayalım. İş yükünü 20 eşzamanlı bağlantıdan başlatın ve yükü her 90-120 saniyede bir 20 eşzamanlı bağlantı artırın. Hizmet yanıtlarını kontrol edin ve çok fazla istek alırsanız (yanıt kodu 429) yükü azaltacak mantığı uygulayın. Ardından yük artışını bir dakika içinde yeniden deneyin ve yine de işe yaramazsa iki dakika içinde yeniden deneyin. Aralıklar için 1-2-4-4 dakikalık bir desen kullanın.
Genel olarak, üretime geçmeden önce iş yükünü ve iş yükü desenlerini test etmek iyi bir fikirdir.
Metin okuma: eşzamanlı istek sınırını artırma
Standart fiyatlandırma katmanı için bu miktarı artırabilirsiniz. İsteği göndermeden önce, kısıtlamayı azaltmak için en iyi yöntemler gibi bu makalenin önceki bölümlerinde açıklanan bilgileri bildiğinizden emin olun.
Eşzamanlı istek sınırını artırmak maliyetlerinizi doğrudan etkilemez. Konuşma hizmeti, yalnızca kullandığınız kadar ödeme yapılmasını gerektiren bir ödeme modeli kullanır. Sınır, hizmetin isteklerinizi kısıtlamaya başlamadan önce hangi dereceye kadar ölçeklenebileceğini tanımlar.
Azure portalında, komut satırı araçlarında veya API isteklerinde eşzamanlı istek sınırı parametresinin mevcut değerini göremezsiniz. Mevcut değeri doğrulamak için bir Azure desteği isteği oluşturun.
Not
Konuşma kapsayıcıları , yalnızca barındırıldıkları donanımın CPU'ları tarafından kısıtlandığından eşzamanlı istek sınırının artmasına gerek yoktur.
Gerekli bilgileri hazırlama
Bir artış isteği oluşturmak için bilgilerinizi sağlamanız gerekir.
- Standart ses için:
- Konuşma kaynağı kimliği
- Bölge
- Özel ses için:
- Dağıtım bölgesi
- Özel uç nokta kimliği
Standart ses hakkında bilgi nasıl alınır?
- Azure portala gidin.
- Eşzamanlılık isteği sınırını artırmak istediğiniz Konuşma hizmeti kaynağını seçin.
- Kaynak Yönetimi grubunda Özellikler'i seçin.
- Aşağıdaki alanların değerlerini kopyalayın ve kaydedin:
- Kaynak Kimliği
- Konum (uç nokta bölgeniz)
Özel ses hakkında bilgi alma:
- Speech Studio portalına gidin.
- Gerekirse oturum açın ve Özel ses'e gidin.
- Projenizi seçin ve Modeli dağıtma'ya gidin.
- Gerekli uç noktayı seçin.
- Aşağıdaki alanların değerlerini kopyalayın ve kaydedin:
- Hizmet Bölgesi (uç nokta bölgeniz)
- Uç Nokta Kimliği
Destek isteği oluşturma ve gönderme
Kaynağınız için eşzamanlı istekler için sınırın artırılmasını başlatın veya gerekirse bir destek isteği göndererek geçerli sınırı denetleyin. Şunu yapabilirsiniz:
- Önceki bölümde listelenen gerekli bilgilere sahip olduğunuzdan emin olun.
- Azure portala gidin.
- Eşzamanlılık isteği sınırını artırmak (veya denetlemek) istediğiniz Konuşma hizmeti kaynağını seçin.
- Destek + sorun giderme grubunda Yeni destek isteği'ni seçin. Azure aboneliğiniz ve Azure kaynağınızla ilgili otomatik olarak doldurulmuş bilgiler içeren yeni bir pencere görüntülenir.
- Özet bölümünde ne istediğinizi açıklayın (örneğin, "Metni konuşma eşzamanlılığı istek sınırını artırma").
- Sorun türü'nde Kota veya Abonelik sorunları'yı seçin.
- Sorun alt türü'nde aşağıdakilerden birini seçin:
- Bir artış isteği için kota veya eşzamanlı istekler artar .
- Mevcut sınırı denetlemek için kota veya kullanım doğrulaması .
- Önerilen çözüm sekmesinde İleri'yi seçin.
-
Ek ayrıntılar sekmesinde tüm gerekli öğeleri doldurun.
Ayrıntılar alanına aşağıdakileri girin:
- İsteğin metin okuma kotası ile ilgili olduğuna dikkat edin.
- Standart sesi veya özel sesi seçin.
- Daha önce topladığınız Azure kaynak bilgileri.
- Diğer gerekli bilgiler.
- Gözden Geçir + oluştur sekmesinde Oluştur'u seçin.
- Azure portal bildirimlerindeki destek isteği numarasını not alın. İsteğiniz hakkında kısa süre sonra sizinle iletişime geçilir.
Metin okuma avatarı: yeni bağlantı sınırını artırma
Metin okuma avatarı için dakikada yeni bağlantı sınırını artırmak için satış temsilcinizle iletişime geçerek aşağıdaki bilgileri içeren bir bilet oluşturun:
- Konuşma kaynağı URI'si
- Yeni sınırlamanın arttırılması talep edildi
- Artış için gerekçe
- Artışın başlangıç tarihi
- Artışın bitiş tarihi
- Standart avatar veya özel avatar