Kodu Uzun Ses API'sinden Batch sentez API'sine geçirme
Batch sentez API'si, uzun biçimli metinden konuşmaya zaman uyumsuz sentez sağlar. Bu makalede, Uzun Ses API'sinden Batch sentez API'sine yükseltmenin avantajları ve bunun nasıl yapılacağının ayrıntıları açıklanmaktadır.
Önemli
Toplu sentez API'si genel olarak kullanılabilir. Uzun Ses API'si 1 Nisan 2027'de kullanımdan kaldırılacaktır.
Temel yol ve sürüm
uç noktasını olarak https://YourSpeechRegion.customvoice.api.speech.microsoft.com
https://YourSpeechRegion.api.cognitive.microsoft.com
güncelleştirin veya bunun yerine özel etki alanı kullanabilirsiniz: https://{customDomainName}.cognitiveservices.azure.com/
.
kodunuzdaki temel yolu ile /texttospeech/v3.0/longaudiosynthesis
/texttospeech/batchsyntheses
güncelleştirin.
Temel yoldan sorgu dizesine /texttospeech/v3.0/longaudiosynthesis
sürümü olarak ?api-version=2024-04-01
güncelleştirin.
Örneğin, bölgedeki Konuşma kaynağınızın eastus
sentez işlerini listelemek için yerine https://eastus.customvoice.api.speech.microsoft.com/api/texttospeech/v3.0/longaudiosynthesis
kullanınhttps://eastus.api.cognitive.microsoft.com/texttospeech/batchsyntheses?api-version=2024-04-01
.
Bölgeler ve uç noktalar
Toplu sentez API'si daha fazla Konuşma bölgesinde kullanılabilir.
Uzun Ses API'si aşağıdaki bölgeyle sınırlıdır:
Bölge | Uç nokta |
---|---|
Doğu Avustralya | https://australiaeast.customvoice.api.speech.microsoft.com |
Doğu ABD | https://eastus.customvoice.api.speech.microsoft.com |
Hindistan Orta | https://centralindia.customvoice.api.speech.microsoft.com |
Orta Güney ABD | https://southcentralus.customvoice.api.speech.microsoft.com |
Güneydoğu Asya | https://southeastasia.customvoice.api.speech.microsoft.com |
Güney Birleşik Krallık | https://uksouth.customvoice.api.speech.microsoft.com |
West Europe | https://westeurope.customvoice.api.speech.microsoft.com |
Sesler listesi
Toplu sentez API'si tüm metin okuma seslerini ve stillerini destekler.
Uzun Ses API'si, get isteği tarafından döndürülen ses kümesiyle https://<endpoint>/api/texttospeech/v3.0/longaudiosynthesis/voices
sınırlıdır.
Metin girişleri
Toplu sentez metin girişleri 2 megabayta kadar bir JSON yükünde gönderilir.
Uzun Ses API'sinin metin girişleri aşağıdaki gereksinimleri karşılayan bir dosyadan yüklenir:
- Bayt Sipariş İşareti (BOM) ile UTF-8 olarak kodlanmış bir düz metin (.txt) veya SSML metni (.txt) dosyası. ZIP gibi sıkıştırılmış dosyaları kullanmayın. Birden fazla giriş dosyanız varsa, birden çok istek göndermeniz gerekir.
- Düz metin için 400'den fazla karakter veya SSML metni için 400 faturalanabilir karakter ve 10.000'den az paragraf içerir. Düz metin için her paragraf yeni bir satırla ayrılır. SSML metni için her SSML parçası bir paragraf olarak kabul edilir. SSML parçalarını farklı paragraflara göre ayırın.
Batch sentez API'si ile, , mstts:backgroundaudio
ve lexicon
öğeleri de dahil olmak üzere audio
desteklenen SSML öğelerinden herhangi birini kullanabilirsiniz. Uzun ses API'si , mstts:backgroundaudio
ve lexicon
öğelerini desteklemezaudio
.
Ses çıkış biçimleri
Toplu sentez API'si tüm metin okuma ses çıkış biçimlerini destekler.
Uzun Ses API'si aşağıdaki ses çıkış biçimleri kümesiyle sınırlıdır. Uzun ses sesleri için örnek hızı 48kHz değil 24kHz'dir. Diğer örnek oranları, sentezleme sırasında yukarı örnekleme veya aşağı örnekleme yoluyla elde edilebilir.
- riff-8khz-16bit-mono-pcm
- riff-16khz-16bit-mono-pcm
- riff-24khz-16bit-mono-pcm
- riff-48khz-16bit-mono-pcm
- audio-16khz-32kbitrate-mono-mp3
- audio-16khz-64kbitrate-mono-mp3
- audio-16khz-128kbitrate-mono-mp3
- audio-24khz-48kbitrate-mono-mp3
- audio-24khz-96kbitrate-mono-mp3
- audio-24khz-160kbitrate-mono-mp3
Sonuçlar alınıyor
Toplu sentez API'si ile HTTP GET toplu sentez yanıtının özelliğinden URL'yi outputs.result
kullanın. Sonuçlar, sesi (örneğin0001.wav
), özetini ve hata ayıklama ayrıntılarını içeren bir ZIP dosyasında bulunur.
Uzun Ses API'sinin metin girişleri ve sonuçları, aşağıdaki örnekte gösterildiği gibi iki ayrı içerik URL'si aracılığıyla döndürülür. ile gelen "kind": "LongAudioSynthesisScript"
, gönderilen giriş betiğidir. Diğerinde "kind": "LongAudioSynthesisResult"
ise bu isteğin sonucu yer alır. Her iki ZIP dosyası da kendi links.contentUrl
özelliğindeki URL'den indirilebilir.
Kaynakları temizleme
Toplu sentez API'si, "Başarılı" veya "Başarısız" durumuna sahip olmayan en fazla 300 toplu sentez işini destekler. Konuşma hizmeti her sentez geçmişini 31 güne kadar veya istek timeToLiveInHours
özelliğinin süresi boyunca (hangisi daha erken gelirse) tutar. Otomatik silme tarihi ve saati ("Başarılı" veya "Başarısız" durumundaki sentez işleri için) özelliklere lastActionDateTime
+ timeToLiveInHours
eşittir.
Uzun Ses API'si her Azure abonelik hesabı için 20.000 istekle sınırlıdır. Konuşma hizmeti iş geçmişini otomatik olarak kaldırmaz. Aksi takdirde sınırı aşacak yeni istekler yapmadan önce önceki iş çalıştırma geçmişini kaldırmanız gerekir.
Sonraki adımlar
Geri Bildirim
https://aka.ms/ContentUserFeedback.
Çok yakında: 2024 boyunca, içerik için geri bildirim mekanizması olarak GitHub Sorunları’nı kullanımdan kaldıracak ve yeni bir geri bildirim sistemiyle değiştireceğiz. Daha fazla bilgi için bkz.Gönderin ve geri bildirimi görüntüleyin