Aracılığıyla paylaş


Konuşma hizmeti kotaları ve sınırları

Bu makale, Azure yapay zeka hizmetlerinde Konuşma hizmeti için kotalar ve sınırlar hakkında hızlı bir referans ve ayrıntılı bir açıklama içermektedir. Bilgiler, hizmetin tüm fiyatlandırma katmanları için geçerlidir. Ayrıca istek kısıtlamasını önlemek için bazı en iyi yöntemleri içerir.

Ücretsiz (F0) fiyatlandırma katmanı için fiyatlandırma sayfasındaki aylık izinlere de bakın.

Kotalar ve limitler referansı

Aşağıdaki bölümlerde Konuşma hizmeti için geçerli olan kotalar ve sınırlar için hızlı bir kılavuz sağlanır.

Standart (S0) Konuşma kaynakları için ayarlanabilir kotalar hakkında bilgi için daha fazla açıklamaya, en iyi yöntemlere ve ayarlama yönergelerine bakın. Ücretsiz (F0) Konuşma kaynaklarının kotaları ve sınırları ayarlanamaz.

Önemli

Konuşma için bir AI Foundry kaynağını Ücretsiz (F0) fiyatlandırma katmanından Standart (S0) fiyatlandırma katmanına değiştirirseniz, ilgili kotaların değişmesi birkaç saat sürebilir.

Kaynak başına konuşma metin kotaları ve sınırları

Bu bölümde Konuşma kaynağı başına konuşmayı metne dönüştürme kotaları ve sınırları açıklanmaktadır. Aksi belirtilmediği sürece sınırlar ayarlanamaz.

Gerçek zamanlı konuşmayı metne dönüştürme ve konuşma çevirisi

Kısa ses için Konuşma SDK'sı veya Konuşmayı metne dönüştürme REST API'siyle metinde gerçek zamanlı konuşma kullanabilirsiniz.

Önemli

Bu sınırlar, metin isteklerine eş zamanlı gerçek zamanlı konuşma ve konuşma çevirisi isteklerinin birleştirilmesi için geçerlidir. Örneğin, metin isteklerine yönelik 60 eşzamanlı konuşma ve 40 eşzamanlı konuşma çevirisi isteğiniz varsa, 100 eşzamanlı istek sınırına ulaşırsınız.

Kota Ücretsiz (F0) Standart (S0)
Eşzamanlı istek sınırı - temel model uç noktası 1

Bu sınır ayarlanamaz.
100 (varsayılan değer)

Oran Standart (S0) kaynakları için ayarlanabilir. Daha fazla açıklama, en iyi yöntem ve ayarlama yönergelerine bakın.
Eşzamanlı istek sınırı - özel uç nokta 1

Bu sınır ayarlanamaz.
100 (varsayılan değer)

Oran Standart (S0) kaynakları için ayarlanabilir. Daha fazla açıklama, en iyi yöntem ve ayarlama yönergelerine bakın.
Gerçek zamanlı darizasyon için maksimum ses uzunluğu. Yok Dosya başına 240 dakika

Hızlı transkripsiyon

Kota Ücretsiz (F0) Standart (S0)
En büyük ses giriş dosyası boyutu Yok < 300 MB
Maksimum ses uzunluğu Yok < Dosya başına 120 dakika
Dakika başına en fazla istek sayısı Yok 600

Toplu transkripsiyon

Kota Ücretsiz (F0) Standart (S0)
Konuşmayı metne dönüştürme REST API sınırı F0 için kullanılamaz 10 saniyede 100 istek (dakikada 600 istek)
Maksimum ses giriş dosyası boyutu Yok 1 GB
Kapsayıcı başına maksimum blob sayısı Yok 10.000
Transkripsiyon isteği başına en fazla dosya sayısı (giriş olarak birden çok içerik URL'sini kullandığınızda). Yok 1000
Darizasyon etkin transkripsiyonlar için maksimum ses uzunluğu. Yok Dosya başına 240 dakika

Model özelleştirme

Bu tablodaki sınırlar, özel bir konuşma modeli oluşturduğunuzda Konuşma kaynağı başına uygulanır.

Kota Ücretsiz (F0) Standart (S0)
REST API sınırı 10 saniyede 100 istek (dakikada 600 istek) 10 saniyede 100 istek (dakikada 600 istek)
Konuşma kaynağı başına en fazla özel model dağıtımı sayısı 1 50
Maksimum konuşma veri kümesi sayısı 2 beş yüz
Veri içeri aktarma için maksimum akustik veri kümesi dosya boyutu 2GB 2GB
Veri içeri aktarma için en fazla dil veri kümesi dosya boyutu 200 MB 1,5 GB
Veri içe aktarma için söyleniş veri kümesi en fazla dosya boyutu 1 KB 1 MB
Models_Createtextparametresini kullanırken en büyük metin boyutu 200 KB 500 KB

Kaynak başına metin okuma kotaları ve sınırları

Bu bölümde Konuşma kaynağı başına metin okuma kotaları ve sınırları açıklanmaktadır.

Gerçek zamanlı metin okuma

Konuşma SDK'sı veya Metin okuma REST API'siyle gerçek zamanlı metin kullanarak konuşma yapabilirsiniz. Aksi belirtilmediği sürece sınırlar ayarlanamaz.

Kota Ücretsiz (F0) Standart (S0)
Standart sesler ve özel sesler için zaman aralığı başına işlem sayısı üst sınırı. 60 saniyede 20 işlem

Bu sınır ayarlanamaz.
Saniyede 200 işlem (TPS) (varsayılan değer)

Standart (S0) kaynaklar için hız 1000 TPS'ye kadar ayarlanabilir. Daha fazla açıklama, en iyi yöntem ve ayarlama yönergelerine bakın.
İstek başına üretilen maksimum ses uzunluğu 10 dk 10 dk
SSML'de en fazla benzersiz <voice> ve <audio> etiket sayısı 50 50
Websocket için dönüş başına en fazla SSML ileti boyutu 64 KB 64 KB

Toplu sentez

Bu sınırlar ayarlanmıyor. Toplu sentez gecikme süresi hakkında daha fazla bilgi için bkz . toplu sentez gecikme süresi ve en iyi yöntemler.

Kota Ücretsiz (F0) Standart (S0)
REST API sınırı F0 için kullanılamaz 10 saniyede 100 istek
Sentez işi oluşturmak için maksimum JSON yükü boyutu Yok 2 megabayt
Eşzamanlı etkin sentez işleri Yok Sınırsız
Sentez işi başına en fazla metin girişi sayısı Yok 10.000
Son durumda olduğundan beri bir sentez işinin maksimum geçerlilik süresi Yok 31 güne kadar (özellikler kullanılarak belirtilir)

Özel ses - profesyonel

Bu tablodaki sınırlar, profesyonel bir ses oluşturduğunuzda Konuşma kaynağı başına uygulanır.

Kota Ücretsiz (F0) Standart (S0)
Saniye başına en fazla işlem sayısı (TPS) F0 için kullanılamaz Saniyede 200 işlem (TPS) (varsayılan değer)
En fazla veri kümesi sayısı Yok beş yüz
En fazla eşzamanlı veri kümesi yükleme sayısı Yok 5
Veri kümesi başına veri içeri aktarma için maksimum veri dosyası boyutu Yok 2GB
Uzun ses dosyası veya betiği olmayan ses dosyası yükleme Yok Evet
En fazla eşzamanlı model eğitimi sayısı Yok 4
En fazla özel uç nokta sayısı Yok 50

Özel ses - kişisel ses

Bu tablodaki sınırlar, kişisel bir ses oluşturduğunuzda Konuşma kaynağı başına uygulanır.

Kota Ücretsiz (F0) Standart (S0)
REST API sınırı (konuşma sentezi dahil değildir) F0 için kullanılamaz 10 saniyede 50 istek
Konuşma sentezi için saniye başına en fazla işlem sayısı (TPS) F0 için kullanılamaz Saniyede 200 işlem (TPS) (varsayılan değer)

Toplu metni sese çevirme avatarı

Kota Ücretsiz (F0) Standart (S0)
REST API sınırı F0 için kullanılamaz 1 dakikada 2 istek

Gerçek zamanlı metin okuma avatarı

Kota Ücretsiz (F0) Standart (S0)
Dakika başına yeni bağlantılar F0 için kullanılamaz Dakikada 2 yeni bağlantı
Konuşma ile maksimum bağlantı süresi F0 için kullanılamaz 30 dakika1
Boşta durumuyla maksimum bağlantı süresi F0 için kullanılamaz 5 dakika

1 Gerçek zamanlı avatarın 30 dakikadan uzun süre sürekli çalışmasını sağlamak için otomatik yeniden bağlanmayı etkinleştirebilirsiniz. Otomatik yeniden bağlanmayı ayarlama hakkında bilgi için bu örnek koda ("otomatik yeniden bağlanma" araması yapın) bakın.

Ses İçeriği Oluşturma aracı

Kota Ücretsiz (F0) Standart (S0)
Dosya boyutu (SSML'de düz metin)1 Dosya başına 3.000 karakter Dosya başına 20.000 karakter
Dosya boyutu (sözlük dosyası)2 Dosya başına 30 KB Dosya başına 100 KB
SSML'de faturalanabilir karakterler Dosya başına 15.000 karakter Dosya başına 100.000 karakter
Ses kitaplığına aktar 1 eşzamanlı görev Yok

1 Sınır yalnızca SSML'deki düz metinler için geçerlidir ve etiket içermez.

2 Sözlük dosyasının karakterleri ücretlendirilmiyor. Yalnızca SSML'deki sözlük öğeleri faturalanabilir karakterler olarak sayılır. Daha fazla bilgi edinmek için faturalanabilir karakterlere bakın.

Kaynak başına konuşmacı tanıma kotaları ve sınırları

Konuşmacı tanıma, saniyede 20 işlemle (TPS) sınırlıdır.

Ayrıntılı açıklama, kota ayarlama ve en iyi yöntemler

Konuşma hizmeti kotalarından bazıları ayarlanabilir. Bu bölümde daha fazla açıklama, en iyi yöntem ve ayarlama yönergeleri sağlanmaktadır.

Standart (S0) kaynaklar için aşağıdaki kotalar ayarlanabilir. Ücretsiz (F0) istek sınırları ayarlanmıyor.

Kota artışı istemeden önce (varsa), geçerli TPS'nizi (saniyedeki işlemler) denetleyin ve kotayı artırmanın gerekli olduğundan emin olun. Konuşma hizmeti, gerekli hesaplama kaynaklarını isteğe bağlı moda getirmek için otomatik ölçeklendirme teknolojilerini kullanır. Konuşma hizmeti aynı zamanda aşırı miktarda donanım kapasitesi korumayarak maliyetlerinizi düşük tutmaya çalışır.

Bir örneğe göz atalım. Uygulamanızın çok fazla istek olduğunu belirten 429 yanıt kodunu aldığını varsayalım. İş yükünüz Kotalar ve sınırlar başvurusu tarafından tanımlanan sınırlar içinde olsa bile uygulamanız bu yanıtı alır. En olası açıklama, Konuşma hizmetinin talebinize göre ölçeği artırması ve henüz gerekli ölçeğe ulaşmamış olmasıdır. Bu nedenle, hizmetin talebi karşılamak için hemen yeterli kaynağı yoktur. Bu gibi durumlarda kotanın artırılması yararlı olmaz. Çoğu durumda Konuşma hizmeti yakında ölçeğini genişletecek ve yanıt kodu 429'a neden olan sorun çözülecektir.

Otomatik ölçeklendirme sırasında kısıtlamayı hafifletmek için genel en iyi uygulamalar

Azaltmayla ilgili sorunları en aza indirmek için aşağıdaki teknikleri kullanmak iyi bir fikirdir:

  • Uygulamanıza yeniden deneme mantığı ekleyin.
  • İş yükünde ani değişikliklerden kaçının. İş yükünü kademeli olarak artırın. Örneğin, uygulamanızın metin okuma özelliğini kullandığını ve geçerli iş yükünüzün 5 TPS olduğunu düşünelim. Sonraki saniye, yükü 20 TPS'ye (yani dört kat daha fazla) yükseltin. Konuşma hizmeti, yeni yükü karşılamak için ölçeklendirmeye hemen başlar, ancak bir saniye içerisinde gerekli şekilde ölçeklendirmeyi gerçekleştiremez. İsteklerden bazıları 429 yanıt kodunu (çok fazla istek) alır.
  • Farklı yük artışı desenlerini test edin. Daha fazla bilgi için iş yükü deseni örneğine bakın.
  • Farklı bölgelerde daha fazla Konuşma hizmeti kaynağı oluşturun ve iş yükünü bunlar arasında dağıtın. (Tüm kaynaklar aynı arka uç kümesi tarafından sunulduğundan, aynı bölgede birden çok Konuşma hizmeti kaynağı oluşturulması performansı etkilemez).

Sonraki bölümlerde kotaları ayarlamayla ilgili belirli durumlar açıklanmaktadır.

Konuşmayı metne dönüştürme: Gerçek zamanlı konuşmayı metne eş zamanlı istek sınırını yükseltme

Varsayılan olarak, konuşmadan metne ve konuşma çevirisi taleplerinin birleştirilmiş eş zamanlı sayısı, temel modelde kaynak başına 100 ve özel modelde özel uç nokta başına 100 ile sınırlıdır. Standart fiyatlandırma katmanı için bu miktarı artırabilirsiniz. İsteği göndermeden önce, kısıtlamayı azaltmak için en iyi yöntemler gibi bu makalenin önceki bölümlerinde açıklanan bilgileri bildiğinizden emin olun.

Not

Temel ve özel modeller için eşzamanlı istek sınırlarının ayrı olarak ayarlanması gerekir. Birçok özel model dağıtımlarını barındıran birçok özel uç noktayla ilişkili bir Konuşma hizmeti kaynağınız olabilir. Gerektiğinde, özel uç nokta başına sınır ayarlamaları ayrı olarak istenmelidir.

Eşzamanlı istek sınırını artırmak maliyetlerinizi doğrudan etkilemez. Konuşma hizmeti, yalnızca kullandığınız kadar ödeme yapılmasını gerektiren bir ödeme modeli kullanır. Sınır, hizmetin isteklerinizi kısıtlamaya başlamadan önce hangi dereceye kadar ölçeklenebileceğini tanımlar.

Azure portalında, komut satırı araçlarında veya API isteklerinde eşzamanlı istek sınırı parametresinin mevcut değerini göremezsiniz. Mevcut değeri doğrulamak için bir Azure desteği isteği oluşturun.

Not

Konuşma kapsayıcıları , yalnızca barındırıldıkları donanımın CPU'ları tarafından kısıtlandığından eşzamanlı istek sınırının artmasına gerek yoktur. Ancak konuşma kapsayıcılarının dikkate alınması gereken kendi kapasite sınırlamaları vardır. Daha fazla bilgi için Konuşma kapsayıcıları SSS'sine bakın.

Gerekli bilgileri hazır bulundurun

  • Temel model için:
    • Konuşma kaynağı kimliği
    • Bölge
  • Özel model için:
    • Bölge
    • Özel uç nokta kimliği

Temel model hakkında bilgi alma:

  1. Azure portala gidin.
  2. Eşzamanlılık isteği sınırını artırmak istediğiniz Konuşma hizmeti kaynağını seçin.
  3. Kaynak Yönetimi grubunda Özellikler'i seçin.
  4. Aşağıdaki alanların değerlerini kopyalayın ve kaydedin:
    • Kaynak Kimliği
    • Konum (uç nokta bölgeniz)

Özel modelle ilgili bilgi alma:

  1. Speech Studio portalına gidin.
  2. Gerekirse oturum açın ve Özel konuşma'ya gidin.
  3. Projenizi seçin ve Dağıtım'a gidin.
  4. Gerekli uç noktayı seçin.
  5. Aşağıdaki alanların değerlerini kopyalayın ve kaydedin:
    • Hizmet Bölgesi (uç nokta bölgeniz)
    • Uç Nokta Kimliği

Destek isteği oluşturma ve gönderme

Kaynağınız için eşzamanlı istekler için sınırın artırılmasını başlatın veya gerekirse bir destek isteği göndererek geçerli sınırı denetleyin. Şunu yapabilirsiniz:

  1. Önceki bölümde listelenen gerekli bilgilere sahip olduğunuzdan emin olun.
  2. Azure portala gidin.
  3. Eşzamanlılık isteği sınırını artırmak (veya denetlemek) istediğiniz Konuşma hizmeti kaynağını seçin.
  4. Destek + sorun giderme grubunda Yeni destek isteği'ni seçin. Azure aboneliğiniz ve Azure kaynağınızla ilgili otomatik olarak doldurulmuş bilgiler içeren yeni bir pencere görüntülenir.
  5. Özet'te ne istediğinizi açıklayın (örneğin, "Konuşmadan metne eşzamanlı istek sınırını artırma").
  6. Sorun türü'nde Kota veya Abonelik sorunları'yı seçin.
  7. Sorun alt türü'nde aşağıdakilerden birini seçin:
    • Bir artış isteği için kota veya eşzamanlı istekler artar .
    • Mevcut sınırı denetlemek için kota veya kullanım doğrulaması .
  8. İleri: Çözümler'i seçin. İstek oluşturma işlemine devam edin.
  9. Ayrıntılar sekmesindeki Açıklama alanına aşağıdakileri girin:
    • İsteğin konuşmadan metne kotayla ilgili olduğunu belirten bir not.
    • Temel veya özel modeli seçin.
    • Daha önce topladığınız Azure kaynak bilgileri.
    • Diğer gerekli bilgiler.
  10. Gözden Geçir + oluştur sekmesinde Oluştur'u seçin.
  11. Azure portal bildirimlerindeki destek isteği numarasını not alın. İsteğiniz hakkında kısa süre sonra sizinle iletişime geçilir.

İş yükü modeli en iyi uygulama örneği

İşte iyi bir yaklaşımın genel bir örneği. Yalnızca kendi kullanımınız için gereken şekilde ayarlayabileceğiniz bir şablon olarak tasarlanabilir.

Konuşma hizmeti kaynağının eşzamanlı istek sınırının 300 olarak ayarlandığını varsayalım. İş yükünü 20 eşzamanlı bağlantıdan başlatın ve yükü her 90-120 saniyede bir 20 eşzamanlı bağlantı artırın. Hizmet yanıtlarını kontrol edin ve çok fazla istek alırsanız (yanıt kodu 429) yükü azaltacak mantığı uygulayın. Ardından yük artışını bir dakika içinde yeniden deneyin ve yine de işe yaramazsa iki dakika içinde yeniden deneyin. Aralıklar için 1-2-4-4 dakikalık bir desen kullanın.

Genel olarak, üretime geçmeden önce iş yükünü ve iş yükü desenlerini test etmek iyi bir fikirdir.

Metin okuma: eşzamanlı istek sınırını artırma

Standart fiyatlandırma katmanı için bu miktarı artırabilirsiniz. İsteği göndermeden önce, kısıtlamayı azaltmak için en iyi yöntemler gibi bu makalenin önceki bölümlerinde açıklanan bilgileri bildiğinizden emin olun.

Eşzamanlı istek sınırını artırmak maliyetlerinizi doğrudan etkilemez. Konuşma hizmeti, yalnızca kullandığınız kadar ödeme yapılmasını gerektiren bir ödeme modeli kullanır. Sınır, hizmetin isteklerinizi kısıtlamaya başlamadan önce hangi dereceye kadar ölçeklenebileceğini tanımlar.

Azure portalında, komut satırı araçlarında veya API isteklerinde eşzamanlı istek sınırı parametresinin mevcut değerini göremezsiniz. Mevcut değeri doğrulamak için bir Azure desteği isteği oluşturun.

Not

Konuşma kapsayıcıları , yalnızca barındırıldıkları donanımın CPU'ları tarafından kısıtlandığından eşzamanlı istek sınırının artmasına gerek yoktur.

Gerekli bilgileri hazırlama

Bir artış isteği oluşturmak için bilgilerinizi sağlamanız gerekir.

  • Standart ses için:
    • Konuşma kaynağı kimliği
    • Bölge
  • Özel ses için:
    • Dağıtım bölgesi
    • Özel uç nokta kimliği

Standart ses hakkında bilgi nasıl alınır?

  1. Azure portala gidin.
  2. Eşzamanlılık isteği sınırını artırmak istediğiniz Konuşma hizmeti kaynağını seçin.
  3. Kaynak Yönetimi grubunda Özellikler'i seçin.
  4. Aşağıdaki alanların değerlerini kopyalayın ve kaydedin:
    • Kaynak Kimliği
    • Konum (uç nokta bölgeniz)

Özel ses hakkında bilgi alma:

  1. Speech Studio portalına gidin.
  2. Gerekirse oturum açın ve Özel ses'e gidin.
  3. Projenizi seçin ve Modeli dağıtma'ya gidin.
  4. Gerekli uç noktayı seçin.
  5. Aşağıdaki alanların değerlerini kopyalayın ve kaydedin:
    • Hizmet Bölgesi (uç nokta bölgeniz)
    • Uç Nokta Kimliği

Destek isteği oluşturma ve gönderme

Kaynağınız için eşzamanlı istekler için sınırın artırılmasını başlatın veya gerekirse bir destek isteği göndererek geçerli sınırı denetleyin. Şunu yapabilirsiniz:

  1. Önceki bölümde listelenen gerekli bilgilere sahip olduğunuzdan emin olun.
  2. Azure portala gidin.
  3. Eşzamanlılık isteği sınırını artırmak (veya denetlemek) istediğiniz Konuşma hizmeti kaynağını seçin.
  4. Destek + sorun giderme grubunda Yeni destek isteği'ni seçin. Azure aboneliğiniz ve Azure kaynağınızla ilgili otomatik olarak doldurulmuş bilgiler içeren yeni bir pencere görüntülenir.
  5. Özet bölümünde ne istediğinizi açıklayın (örneğin, "Metni konuşma eşzamanlılığı istek sınırını artırma").
  6. Sorun türü'nde Kota veya Abonelik sorunları'yı seçin.
  7. Sorun alt türü'nde aşağıdakilerden birini seçin:
    • Bir artış isteği için kota veya eşzamanlı istekler artar .
    • Mevcut sınırı denetlemek için kota veya kullanım doğrulaması .
  8. Önerilen çözüm sekmesinde İleri'yi seçin.
  9. Ek ayrıntılar sekmesinde tüm gerekli öğeleri doldurun. Ayrıntılar alanına aşağıdakileri girin:
    • İsteğin metin okuma kotası ile ilgili olduğuna dikkat edin.
    • Standart sesi veya özel sesi seçin.
    • Daha önce topladığınız Azure kaynak bilgileri.
    • Diğer gerekli bilgiler.
  10. Gözden Geçir + oluştur sekmesinde Oluştur'u seçin.
  11. Azure portal bildirimlerindeki destek isteği numarasını not alın. İsteğiniz hakkında kısa süre sonra sizinle iletişime geçilir.

Metin okuma avatarı: yeni bağlantı sınırını artırma

Metin okuma avatarı için dakikada yeni bağlantı sınırını artırmak için satış temsilcinizle iletişime geçerek aşağıdaki bilgileri içeren bir bilet oluşturun:

  • Konuşma kaynağı URI'si
  • Yeni sınırlamanın arttırılması talep edildi
  • Artış için gerekçe
  • Artışın başlangıç tarihi
  • Artışın bitiş tarihi
  • Standart avatar veya özel avatar