SSML を使用してテキスト読み上げアバターのジェスチャをカスタマイズする (プレビュー)
Note
現在のところ、テキスト読み上げアバターはパブリック プレビュー段階にあります。 このプレビュー版はサービス レベル アグリーメントなしで提供されています。運用環境のワークロードに使用することはお勧めできません。 特定の機能はサポート対象ではなく、機能が制限されることがあります。 詳しくは、Microsoft Azure プレビューの追加使用条件に関するページをご覧ください。
音声合成マークアップ言語 (SSML) と入力テキストにより、テキスト読み上げ出力の構造、コンテンツ、その他の特性が決定されます。 ほとんどの SSML タグはテキスト読み上げアバターでも機能できます。 さらに、テキスト読み上げアバター バッチ モードからは、形式 <bookmark mark='gesture.*'/>
の SSML ブックマーク要素を使用することで、アバターのジェスチャ挿入機能が提供されます。
ジェスチャは挿入時点から開始されます。 ジェスチャにオーディオよりも時間がかかる場合、オーディオが終了した時点でジェスチャがカットされます。
ブックマークの例
次の例では、SSML を使用してテキスト読み上げアバター バッチ合成にジェスチャを挿入する方法を示します。
<speak version="1.0" xmlns="http://www.w3.org/2001/10/synthesis" xml:lang="en-US">
<voice name="en-US-AvaMultilingualNeural">
Hello <bookmark mark='gesture.wave-left-1'/>, my name is Ava, nice to meet you!
</voice>
</speak>
この例では、"Hello" という単語の後、左側でアバターが手を振り始めます。
サポートされている事前構築済みのアバターの文字、スタイル、ジェスチャ
ここで提供されている、事前構築済みのアバターでサポートされているジェスチャの完全な一覧は、テキスト読み上げアバター ポータルでも確認できます。
登場人物 | スタイル | 手ぶり |
---|---|---|
Lisa | casual-sitting | numeric1-left-1 numeric2-left-1 numeric3-left-1 thumbsup-left-1 show-front-1 show-front-2 show-front-3 show-front-4 show-front-5 think-twice-1 show-front-6 show-front-7 show-front-8 show-front-9 |
Lisa | graceful-sitting | wave-left-1 wave-left-2 thumbsup-left show-left-1 show-left-2 show-left-3 show-left-4 show-left-5 show-right-1 show-right-2 show-right-3 show-right-4 show-right-5 |
Lisa | graceful-standing | |
Lisa | technical-sitting | wave-left-1 wave-left-2 show-left-1 show-left-2 point-left-1 point-left-2 point-left-3 point-left-4 point-left-5 point-left-6 show-right-1 show-right-2 show-right-3 point-right-1 point-right-2 point-right-3 point-right-4 point-right-5 point-right-6 |
Lisa | technical-standing |
casual-sitting
スタイルのみリアルタイム テキスト読み上げ API を介してサポートされています。 ジェスチャーはバッチ合成 API でのみサポートされており、リアルタイム API ではサポートされていません。
次のステップ
フィードバック
https://aka.ms/ContentUserFeedback」を参照してください。
以下は間もなく提供いたします。2024 年を通じて、コンテンツのフィードバック メカニズムとして GitHub の issue を段階的に廃止し、新しいフィードバック システムに置き換えます。 詳細については、「フィードバックの送信と表示