次の方法で共有


SSML を使用してテキスト読み上げアバターのジェスチャをカスタマイズする (プレビュー)

Note

現在のところ、テキスト読み上げアバターはパブリック プレビュー段階にあります。 このプレビュー版はサービス レベル アグリーメントなしで提供されています。運用環境のワークロードに使用することはお勧めできません。 特定の機能はサポート対象ではなく、機能が制限されることがあります。 詳しくは、Microsoft Azure プレビューの追加使用条件に関するページをご覧ください。

音声合成マークアップ言語 (SSML) と入力テキストにより、テキスト読み上げ出力の構造、コンテンツ、その他の特性が決定されます。 ほとんどの SSML タグはテキスト読み上げアバターでも機能できます。 さらに、テキスト読み上げアバター バッチ モードからは、形式 <bookmark mark='gesture.*'/> の SSML ブックマーク要素を使用することで、アバターのジェスチャ挿入機能が提供されます。

ジェスチャは挿入時点から開始されます。 ジェスチャにオーディオよりも時間がかかる場合、オーディオが終了した時点でジェスチャがカットされます。

ブックマークの例

次の例では、SSML を使用してテキスト読み上げアバター バッチ合成にジェスチャを挿入する方法を示します。

<speak version="1.0" xmlns="http://www.w3.org/2001/10/synthesis" xml:lang="en-US">
<voice name="en-US-AvaMultilingualNeural">
Hello <bookmark mark='gesture.wave-left-1'/>, my name is Ava, nice to meet you!
</voice>
</speak>

この例では、"Hello" という単語の後、左側でアバターが手を振り始めます。

Screenshot of displaying the prebuilt avatar waving their hand at the left.

サポートされている事前構築済みのアバターの文字、スタイル、ジェスチャ

ここで提供されている、事前構築済みのアバターでサポートされているジェスチャの完全な一覧は、テキスト読み上げアバター ポータルでも確認できます。

登場人物 スタイル 手ぶり
Lisa casual-sitting numeric1-left-1
numeric2-left-1
numeric3-left-1
thumbsup-left-1
show-front-1
show-front-2
show-front-3
show-front-4
show-front-5
think-twice-1
show-front-6
show-front-7
show-front-8
show-front-9
Lisa graceful-sitting wave-left-1
wave-left-2
thumbsup-left
show-left-1
show-left-2
show-left-3
show-left-4
show-left-5
show-right-1
show-right-2
show-right-3
show-right-4
show-right-5
Lisa graceful-standing
Lisa technical-sitting wave-left-1
wave-left-2
show-left-1
show-left-2
point-left-1
point-left-2
point-left-3
point-left-4
point-left-5
point-left-6
show-right-1
show-right-2
show-right-3
point-right-1
point-right-2
point-right-3
point-right-4
point-right-5
point-right-6
Lisa technical-standing

casual-sitting スタイルのみリアルタイム テキスト読み上げ API を介してサポートされています。 ジェスチャーはバッチ合成 API でのみサポートされており、リアルタイム API ではサポートされていません。

次のステップ