Aracılığıyla paylaş


Uygulamanızda kişisel sesi kullanma

100'den fazla yerel ayarda desteklenen 91 dilden herhangi birinde konuşmayı sentezlemek için kişisel sesinizin konuşmacı profili kimliğini kullanabilirsiniz. Yerel ayar etiketi gerekli değildir. Kişisel ses, cümle düzeyinde otomatik dil algılamayı kullanır.

Uygulamanızda kişisel sesi tümleştirme

Uygulamanızda kişisel sesi kullanmak için konuşma sentezi işaretleme dilini (SSML) kullanmanız gerekir. SSML, yapay konuşma oluşturma için metni işaretlemek için standart bir yol sağlayan XML tabanlı bir işaretleme dilidir. SSML etiketleri konuşma sentezi çıkışının söylenişini, ses düzeyini, perdesini, hızını ve diğer özniteliklerini denetlemek için kullanılır.

  • speakerProfileId SSML'deki özelliği, kişisel ses için konuşmacı profili kimliğini belirtmek için kullanılır.

  • Ses adı SSML'deki özelliğinde name belirtilir. Kişisel ses için ses adı desteklenen temel model ses adlarından biri olmalıdır. Desteklenen temel model ses adlarının listesini almak için özel ses API'sinin BaseModels_List işlemini kullanın.

    Not

    veya gibi DragonLatestNeuralPhoenixLatestNeuralile Latestetiketlenmiş ses adları zaman zaman güncelleştirilir; performansı, devam eden iyileştirmeler için güncelleştirmelerle farklılık gösterebilir. Sabit bir sürüm kullanmak istiyorsanız, gibi PhoenixV2Neuralbir sürüm numarasıyla etiketlenmiş bir sürüm seçin.

  • DragonLatestNeural ile karşılaştırıldığında PhoenixLatestNeuralüstün ses kopyalama benzerliğine sahip bir temel modeldir. PhoenixLatestNeural , daha doğru telaffuza ve daha düşük gecikme süresine sahip bir temel modeldir DragonLatestNeural.

  • Kişisel ses için, konuşma dilini ayarlamak için öğesini kullanabilirsiniz <lang xml:lang> . Çok dilli seslerle aynıdır. Farklı dilleri konuşmak için lang öğesini nasıl kullanacağınızı görün.

Ses adı ve konuşmacı profili kimliğiyle metin okuma isteğinde örnek SSML aşağıda verilmiştir. Örnek ayrıca, öğesini kullanarak <lang xml:lang> diller en-US arasında geçiş yapmayı zh-HK da gösterir.

<speak version='1.0' xmlns='http://www.w3.org/2001/10/synthesis' xmlns:mstts='http://www.w3.org/2001/mstts' xml:lang='en-US'>
    <voice name='DragonLatestNeural'> 
        <mstts:ttsembedding speakerProfileId='your speaker profile ID here'> 
            I'm happy to hear that you find me amazing and that I have made your trip planning easier and more fun. 
            <lang xml:lang='zh-HK'>我很高興聽到你覺得我很了不起,我讓你的旅行計劃更輕鬆、更有趣。</lang>
        </mstts:ttsembedding> 
    </voice> 
</speak>

SSML'yi Konuşma SDK'sı veya REST API aracılığıyla kullanabilirsiniz.

  • Gerçek zamanlı konuşma sentezi: Metni konuşmaya dönüştürmek için Konuşma SDK'sını veya REST API'sini kullanın.
    • Konuşma SDK'sı kullanırken, uç nokta kimliğini önceden oluşturulmuş ses gibi ayarlamayın.
    • REST API kullanırken lütfen önceden oluşturulmuş sinir sesleri uç noktasını kullanın.

Başvuru belgeleri

Sonraki adımlar

  • Genel bakış bölümünde özel sinir sesi hakkında daha fazla bilgi edinin.
  • Genel bakış bölümünde Speech Studio hakkında daha fazla bilgi edinin.