Kodu Uzun Ses API'sinden Batch sentez API'sine geçirme

Batch sentez API'si, uzun biçimli metinden konuşmaya zaman uyumsuz sentez sağlar. Bu makalede, Uzun Ses API'sinden Batch sentez API'sine yükseltmenin avantajları ve bunun nasıl yapılacağının ayrıntıları açıklanmaktadır.

Önemli

Toplu sentez API'si genel olarak kullanılabilir. Uzun Ses API'si 1 Nisan 2027'de kullanımdan kaldırılacaktır.

Temel yol ve sürüm

uç noktasını olarak https://YourSpeechRegion.customvoice.api.speech.microsoft.comhttps://YourSpeechRegion.api.cognitive.microsoft.com güncelleştirin veya bunun yerine özel etki alanı kullanabilirsiniz: https://{customDomainName}.cognitiveservices.azure.com/.

kodunuzdaki temel yolu ile /texttospeech/v3.0/longaudiosynthesis/texttospeech/batchsynthesesgüncelleştirin.

Temel yoldan sorgu dizesine /texttospeech/v3.0/longaudiosynthesis sürümü olarak ?api-version=2024-04-01güncelleştirin.

Örneğin, bölgedeki Konuşma kaynağınızın eastus sentez işlerini listelemek için yerine https://eastus.customvoice.api.speech.microsoft.com/api/texttospeech/v3.0/longaudiosynthesiskullanınhttps://eastus.api.cognitive.microsoft.com/texttospeech/batchsyntheses?api-version=2024-04-01.

Bölgeler ve uç noktalar

Toplu sentez API'si daha fazla Konuşma bölgesinde kullanılabilir.

Uzun Ses API'si aşağıdaki bölgeyle sınırlıdır:

Bölge Uç nokta
Doğu Avustralya https://australiaeast.customvoice.api.speech.microsoft.com
Doğu ABD https://eastus.customvoice.api.speech.microsoft.com
Hindistan Orta https://centralindia.customvoice.api.speech.microsoft.com
Orta Güney ABD https://southcentralus.customvoice.api.speech.microsoft.com
Güneydoğu Asya https://southeastasia.customvoice.api.speech.microsoft.com
Güney Birleşik Krallık https://uksouth.customvoice.api.speech.microsoft.com
West Europe https://westeurope.customvoice.api.speech.microsoft.com

Sesler listesi

Toplu sentez API'si tüm metin okuma seslerini ve stillerini destekler.

Uzun Ses API'si, get isteği tarafından döndürülen ses kümesiyle https://<endpoint>/api/texttospeech/v3.0/longaudiosynthesis/voicessınırlıdır.

Metin girişleri

Toplu sentez metin girişleri 2 megabayta kadar bir JSON yükünde gönderilir.

Uzun Ses API'sinin metin girişleri aşağıdaki gereksinimleri karşılayan bir dosyadan yüklenir:

  • Bayt Sipariş İşareti (BOM) ile UTF-8 olarak kodlanmış bir düz metin (.txt) veya SSML metni (.txt) dosyası. ZIP gibi sıkıştırılmış dosyaları kullanmayın. Birden fazla giriş dosyanız varsa, birden çok istek göndermeniz gerekir.
  • Düz metin için 400'den fazla karakter veya SSML metni için 400 faturalanabilir karakter ve 10.000'den az paragraf içerir. Düz metin için her paragraf yeni bir satırla ayrılır. SSML metni için her SSML parçası bir paragraf olarak kabul edilir. SSML parçalarını farklı paragraflara göre ayırın.

Batch sentez API'si ile, , mstts:backgroundaudiove lexicon öğeleri de dahil olmak üzere audiodesteklenen SSML öğelerinden herhangi birini kullanabilirsiniz. Uzun ses API'si , mstts:backgroundaudiove lexicon öğelerini desteklemezaudio.

Ses çıkış biçimleri

Toplu sentez API'si tüm metin okuma ses çıkış biçimlerini destekler.

Uzun Ses API'si aşağıdaki ses çıkış biçimleri kümesiyle sınırlıdır. Uzun ses sesleri için örnek hızı 48kHz değil 24kHz'dir. Diğer örnek oranları, sentezleme sırasında yukarı örnekleme veya aşağı örnekleme yoluyla elde edilebilir.

  • riff-8khz-16bit-mono-pcm
  • riff-16khz-16bit-mono-pcm
  • riff-24khz-16bit-mono-pcm
  • riff-48khz-16bit-mono-pcm
  • audio-16khz-32kbitrate-mono-mp3
  • audio-16khz-64kbitrate-mono-mp3
  • audio-16khz-128kbitrate-mono-mp3
  • audio-24khz-48kbitrate-mono-mp3
  • audio-24khz-96kbitrate-mono-mp3
  • audio-24khz-160kbitrate-mono-mp3

Sonuçlar alınıyor

Toplu sentez API'si ile HTTP GET toplu sentez yanıtının özelliğinden URL'yi outputs.result kullanın. Sonuçlar, sesi (örneğin0001.wav), özetini ve hata ayıklama ayrıntılarını içeren bir ZIP dosyasında bulunur.

Uzun Ses API'sinin metin girişleri ve sonuçları, aşağıdaki örnekte gösterildiği gibi iki ayrı içerik URL'si aracılığıyla döndürülür. ile gelen "kind": "LongAudioSynthesisScript" , gönderilen giriş betiğidir. Diğerinde "kind": "LongAudioSynthesisResult" ise bu isteğin sonucu yer alır. Her iki ZIP dosyası da kendi links.contentUrl özelliğindeki URL'den indirilebilir.

Kaynakları temizleme

Toplu sentez API'si, "Başarılı" veya "Başarısız" durumuna sahip olmayan en fazla 300 toplu sentez işini destekler. Konuşma hizmeti her sentez geçmişini 31 güne kadar veya istek timeToLiveInHours özelliğinin süresi boyunca (hangisi daha erken gelirse) tutar. Otomatik silme tarihi ve saati ("Başarılı" veya "Başarısız" durumundaki sentez işleri için) özelliklere lastActionDateTime + timeToLiveInHours eşittir.

Uzun Ses API'si her Azure abonelik hesabı için 20.000 istekle sınırlıdır. Konuşma hizmeti iş geçmişini otomatik olarak kaldırmaz. Aksi takdirde sınırı aşacak yeni istekler yapmadan önce önceki iş çalıştırma geçmişini kaldırmanız gerekir.

Sonraki adımlar