Aracılığıyla paylaş


Kodu Uzun Ses API'sinden Batch sentez API'sine geçirme

Batch sentez API, uzun metinleri metinden sese zaman uyumsuz olarak sentezler. Bu makalede, Uzun Ses API'sinden Toplu Sentezleme API'sine yükseltmenin avantajları ve bunu nasıl yapacağınız hakkında ayrıntılar açıklanmaktadır.

Önemli

Toplu sentez API'si genel olarak kullanılabilir. Uzun Ses API'si 1 Nisan 2027'de devre dışı bırakılacak.

Temel yol ve sürüm

uç noktayı https://YourSpeechRegion.customvoice.api.speech.microsoft.com'den https://YourSpeechRegion.api.cognitive.microsoft.com'a güncelleştirin veya bunun yerine custom domain kullanabilirsiniz: https://{customDomainName}.cognitiveservices.azure.com/.

Kodunuzdaki temel yolu /texttospeech/v3.0/longaudiosynthesis'dan /texttospeech/batchsyntheses'e güncelleyin.

/texttospeech/v3.0/longaudiosynthesis sürümünü, temel yoldan sorgu dizesine ?api-version=2024-04-01 güncelleştirin.

Örneğin, eastus bölgesindeki Konuşma kaynağınızın sentez işlerini listelemek için https://eastus.api.cognitive.microsoft.com/texttospeech/batchsyntheses?api-version=2024-04-01 yerine https://eastus.customvoice.api.speech.microsoft.com/api/texttospeech/v3.0/longaudiosynthesis kullanın.

Bölgeler ve uç noktalar

Toplu sentez API'si daha fazla Konuşma bölgesinde kullanılabilir.

Uzun Ses API'si aşağıdaki bölgeyle sınırlıdır:

Bölge Uç nokta
Doğu Avustralya https://australiaeast.customvoice.api.speech.microsoft.com
Doğu ABD https://eastus.customvoice.api.speech.microsoft.com
Hindistan Orta https://centralindia.customvoice.api.speech.microsoft.com
Orta Güney ABD https://southcentralus.customvoice.api.speech.microsoft.com
Güneydoğu Asya https://southeastasia.customvoice.api.speech.microsoft.com
Güney Birleşik Krallık https://uksouth.customvoice.api.speech.microsoft.com
Batı Avrupa https://westeurope.customvoice.api.speech.microsoft.com

Sesler listesi

Batch sentez API'si tüm text to speech seslerini ve stillerini destekler.

Uzun Ses API'si, GET isteği tarafından geri döndürülen ses kümesiyle https://<endpoint>/api/texttospeech/v3.0/longaudiosynthesis/voices ile sınırlıdır.

Metin girişleri

Toplu sentez metin girişleri 2 megabayta kadar bir JSON yükünde gönderilir.

Uzun Ses API'sinin metin girişleri aşağıdaki gereksinimleri karşılayan bir dosyadan yüklenir:

  • Bayt Sipariş İşareti (BOM) ile UTF-8 olarak kodlanmış bir düz metin (.txt) veya SSML metni (.txt) dosyası. ZIP gibi sıkıştırılmış dosyaları kullanmayın. Birden fazla giriş dosyanız varsa, birden çok istek göndermeniz gerekir.
  • Düz metin için 400'den fazla karakter veya SSML metni için 400 faturalanabilir karakter ve 10.000'den az paragraf içerir. Düz metin için her paragraf yeni bir satırla ayrılır. SSML metni için her SSML parçası bir paragraf olarak kabul edilir. SSML parçalarını farklı paragraflara göre ayırın.

Batch sentez API'si ile, desteklenen SSML öğelerinden, audio, mstts:backgroundaudio ve lexicon öğelerini kullanabilirsiniz. Uzun sesli API, audio, mstts:backgroundaudio ve lexicon öğelerini desteklemez.

Ses çıkış biçimleri

Toplu sentez API'si tüm text to speech ses çıkış biçimlerini destekler.

Uzun Ses API'si aşağıdaki ses çıkış biçimleri kümesiyle sınırlıdır. Uzun ses sesleri için örnek hızı 48kHz değil 24kHz'dir. Diğer örnek oranları, sentezleme sırasında yukarı örnekleme veya aşağı örnekleme yoluyla elde edilebilir.

  • riff-8khz-16bit-mono-pcm
  • riff-16khz-16bit-mono-pcm
  • riff-24khz-16bit-mono-pcm
  • riff-48khz-16bit-mono-pcm
  • audio-16khz-32kbitrate-mono-mp3
  • Ses dosyası - 16kHz, 64 kbit/s, mono, mp3
  • audio-16khz-128kbitrate-mono-mp3
  • ses - 24khz - 48kbitrate - mono - mp3
  • audio-24khz-96kbitrate-mono-mp3
  • audio-24khz-160kbitrate-mono-mp3

Sonuçlar alınıyor

HTTP GET toplu sentez yanıtının outputs.result özelliğinden gelen URL'yi toplu sentez API'si ile kullanın. Sonuçlar, sesi (örneğin0001.wav), özetini ve hata ayıklama ayrıntılarını içeren bir ZIP dosyasında bulunur.

Uzun Ses API'sinin metin girişleri ve sonuçları, aşağıdaki örnekte gösterildiği gibi iki ayrı içerik URL'si aracılığıyla döndürülür. "kind": "LongAudioSynthesisScript" içeren, gönderilen giriş betiğidir. Diğerinde "kind": "LongAudioSynthesisResult" ise bu isteğin sonucu yer alır. Her iki ZIP dosyası da kendi links.contentUrl özelliğindeki URL'den indirilebilir.

Kaynakları temizleme

Toplu sentez API'si, "Başarılı" veya "Başarısız" durumuna sahip olmayan en fazla 300 toplu sentez işini destekler. Konuşma hizmeti her sentez geçmişini 31 güne kadar veya istek timeToLiveInHours özelliğinin süresi boyunca (hangisi daha erken gelirse) tutar. Otomatik silme tarihi ve saati ("Başarılı" veya "Başarısız" durumundaki sentez işleri için) özelliklere lastActionDateTime + timeToLiveInHours eşittir.

Uzun Ses API'si, her Azure abonelik hesabı için 20.000 istekle sınırlıdır. Konuşma hizmeti iş geçmişini otomatik olarak kaldırmaz. Aksi takdirde sınırı aşacak yeni istekler yapmadan önce önceki iş çalıştırma geçmişini kaldırmanız gerekir.

Sonraki adımlar