イントロダクション
生成 AI モデルを使用すると、入力を理解して推論できるインテリジェントなチャットベースのアプリケーションを構築できます。 従来、テキスト入力は AI モデルとの対話の主要なモードですが、マルチモーダル モデルの利用はますます進んでいます。 これらのモデルを使用すると、チャット アプリケーションがオーディオ入力とテキストに応答できるようになります。
このモジュールでは、オーディオ対応のジェネレーティブ AI について説明し、Microsoft Foundry を使用して、テキストとオーディオ データの組み合わせを含むプロンプトに応答する生成 AI ソリューションを作成する方法について説明します。