概要

1 分

このモジュールでは、オーディオ対応のジェネレーティブ AI モデルと、オーディオベースの入力を含むチャットソリューションを実装する方法について学習しました。

オーディオ対応モデルを使用すると、オーディオを理解し、関連する質問や指示に応答できる AI ソリューションを作成できます。話された単語を識別するだけでなく、一部のモデルでは、読み上げられた内容に基づいて推論を使用することもできます。たとえば、メッセージを要約したり、話者のセンチメントを評価したりできます。

ヒント

Microsoft Foundry でのマルチモーダルモデルの操作の詳細については、Azure AI モデルの推論で画像とオーディオを使用する方法およびクイックスタート: AI チャットで音声とオーディオを使用する方法を参照してください。

フィードバック

このページはお役に立ちましたか?