マルチモーダル モデルをデプロイする
オーディオを含むプロンプトを処理するには、 マルチモーダル 生成 AI モデル (つまり、テキストベースの入力だけでなく、オーディオベースの入力もサポートするモデル) をデプロイする必要があります。 Microsoft Foundry で使用できるマルチモーダル モデルには、次のようなものがあります。
- マイクロソフト ファイ - 4 - マルチモーダル - 指示
- OpenAI GPT-4o
- OpenAI の gpt-4o-mini
ヒント
Microsoft Foundry で使用可能なモデルの詳細については、Microsoft Foundry ドキュメントの Microsoft Foundry ポータルのモデル カタログとコレクション に関する記事を参照してください。
オーディオベースのプロンプトを使用したマルチモーダル モデルのテスト
マルチモーダル モデルをデプロイした後は、Microsoft Foundry ポータルのチャットプレイグラウンドでテストできます。 一部のモデルでは、ファイルのアップロードまたはメッセージの記録によって、プレイグラウンドにオーディオ添付ファイルを含めることができます。
チャットプレイグラウンドでは、ローカルのオーディオ ファイルをアップロードし、メッセージにテキストを追加して、マルチモーダル モデルからの応答を引き出すことができます。