概要

完了

このモジュールでは、オーディオ対応のジェネレーティブ AI モデルと、オーディオベースの入力を含むチャット ソリューションを実装する方法について学習しました。

オーディオ対応モデルを使用すると、オーディオを理解し、関連する質問や指示に応答できる AI ソリューションを作成できます。 話された単語を識別するだけでなく、一部のモデルでは、読み上げられた内容に基づいて推論を使用することもできます。 たとえば、メッセージを要約したり、話者のセンチメントを評価したりできます。

ヒント

Microsoft Foundry でのマルチモーダル モデルの操作の詳細については、Azure AI モデルの推論で画像とオーディオを使用する方法およびクイックスタート: AI チャットで音声とオーディオを使用する方法を参照してください。