Not
Bu sayfaya erişim yetkilendirme gerektiriyor. Oturum açmayı veya dizinleri değiştirmeyi deneyebilirsiniz.
Bu sayfaya erişim yetkilendirme gerektiriyor. Dizinleri değiştirmeyi deneyebilirsiniz.
Batch sentez API, uzun metinleri metinden sese zaman uyumsuz olarak sentezler. Bu makalede, Uzun Ses API'sinden Toplu Sentezleme API'sine yükseltmenin avantajları ve bunu nasıl yapacağınız hakkında ayrıntılar açıklanmaktadır.
Önemli
Toplu sentez API'si genel olarak kullanılabilir. Uzun Ses API'si 1 Nisan 2027'de devre dışı bırakılacak.
Temel yol ve sürüm
uç noktayı https://YourSpeechRegion.customvoice.api.speech.microsoft.com'den https://YourSpeechRegion.api.cognitive.microsoft.com'a güncelleştirin veya bunun yerine custom domain kullanabilirsiniz: https://{customDomainName}.cognitiveservices.azure.com/.
Kodunuzdaki temel yolu /texttospeech/v3.0/longaudiosynthesis'dan /texttospeech/batchsyntheses'e güncelleyin.
/texttospeech/v3.0/longaudiosynthesis sürümünü, temel yoldan sorgu dizesine ?api-version=2024-04-01 güncelleştirin.
Örneğin, eastus bölgesindeki Konuşma kaynağınızın sentez işlerini listelemek için https://eastus.api.cognitive.microsoft.com/texttospeech/batchsyntheses?api-version=2024-04-01 yerine https://eastus.customvoice.api.speech.microsoft.com/api/texttospeech/v3.0/longaudiosynthesis kullanın.
Bölgeler ve uç noktalar
Toplu sentez API'si daha fazla Konuşma bölgesinde kullanılabilir.
Uzun Ses API'si aşağıdaki bölgeyle sınırlıdır:
| Bölge | Uç nokta |
|---|---|
| Doğu Avustralya | https://australiaeast.customvoice.api.speech.microsoft.com |
| Doğu ABD | https://eastus.customvoice.api.speech.microsoft.com |
| Hindistan Orta | https://centralindia.customvoice.api.speech.microsoft.com |
| Orta Güney ABD | https://southcentralus.customvoice.api.speech.microsoft.com |
| Güneydoğu Asya | https://southeastasia.customvoice.api.speech.microsoft.com |
| Güney Birleşik Krallık | https://uksouth.customvoice.api.speech.microsoft.com |
| Batı Avrupa | https://westeurope.customvoice.api.speech.microsoft.com |
Sesler listesi
Batch sentez API'si tüm text to speech seslerini ve stillerini destekler.
Uzun Ses API'si, GET isteği tarafından geri döndürülen ses kümesiyle https://<endpoint>/api/texttospeech/v3.0/longaudiosynthesis/voices ile sınırlıdır.
Metin girişleri
Toplu sentez metin girişleri 2 megabayta kadar bir JSON yükünde gönderilir.
Uzun Ses API'sinin metin girişleri aşağıdaki gereksinimleri karşılayan bir dosyadan yüklenir:
- Bayt Sipariş İşareti (BOM) ile UTF-8 olarak kodlanmış bir düz metin (.txt) veya SSML metni (.txt) dosyası. ZIP gibi sıkıştırılmış dosyaları kullanmayın. Birden fazla giriş dosyanız varsa, birden çok istek göndermeniz gerekir.
- Düz metin için 400'den fazla karakter veya SSML metni için 400 faturalanabilir karakter ve 10.000'den az paragraf içerir. Düz metin için her paragraf yeni bir satırla ayrılır. SSML metni için her SSML parçası bir paragraf olarak kabul edilir. SSML parçalarını farklı paragraflara göre ayırın.
Batch sentez API'si ile, desteklenen SSML öğelerinden, audio, mstts:backgroundaudio ve lexicon öğelerini kullanabilirsiniz. Uzun sesli API, audio, mstts:backgroundaudio ve lexicon öğelerini desteklemez.
Ses çıkış biçimleri
Toplu sentez API'si tüm text to speech ses çıkış biçimlerini destekler.
Uzun Ses API'si aşağıdaki ses çıkış biçimleri kümesiyle sınırlıdır. Uzun ses sesleri için örnek hızı 48kHz değil 24kHz'dir. Diğer örnek oranları, sentezleme sırasında yukarı örnekleme veya aşağı örnekleme yoluyla elde edilebilir.
- riff-8khz-16bit-mono-pcm
- riff-16khz-16bit-mono-pcm
- riff-24khz-16bit-mono-pcm
- riff-48khz-16bit-mono-pcm
- audio-16khz-32kbitrate-mono-mp3
- Ses dosyası - 16kHz, 64 kbit/s, mono, mp3
- audio-16khz-128kbitrate-mono-mp3
- ses - 24khz - 48kbitrate - mono - mp3
- audio-24khz-96kbitrate-mono-mp3
- audio-24khz-160kbitrate-mono-mp3
Sonuçlar alınıyor
HTTP GET toplu sentez yanıtının outputs.result özelliğinden gelen URL'yi toplu sentez API'si ile kullanın. Sonuçlar, sesi (örneğin0001.wav), özetini ve hata ayıklama ayrıntılarını içeren bir ZIP dosyasında bulunur.
Uzun Ses API'sinin metin girişleri ve sonuçları, aşağıdaki örnekte gösterildiği gibi iki ayrı içerik URL'si aracılığıyla döndürülür.
"kind": "LongAudioSynthesisScript" içeren, gönderilen giriş betiğidir. Diğerinde "kind": "LongAudioSynthesisResult" ise bu isteğin sonucu yer alır. Her iki ZIP dosyası da kendi links.contentUrl özelliğindeki URL'den indirilebilir.
Kaynakları temizleme
Toplu sentez API'si, "Başarılı" veya "Başarısız" durumuna sahip olmayan en fazla 300 toplu sentez işini destekler. Konuşma hizmeti her sentez geçmişini 31 güne kadar veya istek timeToLiveInHours özelliğinin süresi boyunca (hangisi daha erken gelirse) tutar. Otomatik silme tarihi ve saati ("Başarılı" veya "Başarısız" durumundaki sentez işleri için) özelliklere lastActionDateTime + timeToLiveInHours eşittir.
Uzun Ses API'si, her Azure abonelik hesabı için 20.000 istekle sınırlıdır. Konuşma hizmeti iş geçmişini otomatik olarak kaldırmaz. Aksi takdirde sınırı aşacak yeni istekler yapmadan önce önceki iş çalıştırma geçmişini kaldırmanız gerekir.