Uygulamanızda kişisel sesi kullanma
100'den fazla yerel ayarda desteklenen 91 dilden herhangi birinde konuşmayı sentezlemek için kişisel sesinizin konuşmacı profili kimliğini kullanabilirsiniz. Yerel ayar etiketi gerekli değildir. Kişisel ses, cümle düzeyinde otomatik dil algılamayı kullanır.
Uygulamanızda kişisel sesi tümleştirme
Uygulamanızda kişisel sesi kullanmak için konuşma sentezi işaretleme dilini (SSML) kullanmanız gerekir. SSML, yapay konuşma oluşturma için metni işaretlemek için standart bir yol sağlayan XML tabanlı bir işaretleme dilidir. SSML etiketleri konuşma sentezi çıkışının söylenişini, ses düzeyini, perdesini, hızını ve diğer özniteliklerini denetlemek için kullanılır.
speakerProfileId
SSML'deki özelliği, kişisel ses için konuşmacı profili kimliğini belirtmek için kullanılır.Ses adı SSML'deki özelliğinde
name
belirtilir. Kişisel ses için ses adı desteklenen temel model ses adlarından biri olmalıdır. Desteklenen temel model ses adlarının listesini almak için özel ses API'sinin BaseModels_List işlemini kullanın.Not
veya gibi
DragonLatestNeural
PhoenixLatestNeural
ileLatest
etiketlenmiş ses adları zaman zaman güncelleştirilir; performansı, devam eden iyileştirmeler için güncelleştirmelerle farklılık gösterebilir. Sabit bir sürüm kullanmak istiyorsanız, gibiPhoenixV2Neural
bir sürüm numarasıyla etiketlenmiş bir sürüm seçin.DragonLatestNeural
ile karşılaştırıldığındaPhoenixLatestNeural
üstün ses kopyalama benzerliğine sahip bir temel modeldir.PhoenixLatestNeural
, daha doğru telaffuza ve daha düşük gecikme süresine sahip bir temel modeldirDragonLatestNeural
.Kişisel ses için, konuşma dilini ayarlamak için öğesini kullanabilirsiniz
<lang xml:lang>
. Çok dilli seslerle aynıdır. Farklı dilleri konuşmak için lang öğesini nasıl kullanacağınızı görün.
Ses adı ve konuşmacı profili kimliğiyle metin okuma isteğinde örnek SSML aşağıda verilmiştir. Örnek ayrıca, öğesini kullanarak <lang xml:lang>
diller en-US
arasında geçiş yapmayı zh-HK
da gösterir.
<speak version='1.0' xmlns='http://www.w3.org/2001/10/synthesis' xmlns:mstts='http://www.w3.org/2001/mstts' xml:lang='en-US'>
<voice name='DragonLatestNeural'>
<mstts:ttsembedding speakerProfileId='your speaker profile ID here'>
I'm happy to hear that you find me amazing and that I have made your trip planning easier and more fun.
<lang xml:lang='zh-HK'>我很高興聽到你覺得我很了不起,我讓你的旅行計劃更輕鬆、更有趣。</lang>
</mstts:ttsembedding>
</voice>
</speak>
SSML'yi Konuşma SDK'sı veya REST API aracılığıyla kullanabilirsiniz.
- Gerçek zamanlı konuşma sentezi: Metni konuşmaya dönüştürmek için Konuşma SDK'sını veya REST API'sini kullanın.
- Konuşma SDK'sı kullanırken, uç nokta kimliğini önceden oluşturulmuş ses gibi ayarlamayın.
- REST API kullanırken lütfen önceden oluşturulmuş sinir sesleri uç noktasını kullanın.
Başvuru belgeleri
Sonraki adımlar
Geri Bildirim
https://aka.ms/ContentUserFeedback.
Çok yakında: 2024 boyunca, içerik için geri bildirim mekanizması olarak GitHub Sorunları’nı kullanımdan kaldıracak ve yeni bir geri bildirim sistemiyle değiştireceğiz. Daha fazla bilgi için bkz.Gönderin ve geri bildirimi görüntüleyin