マルチモーダルモデルをデプロイする

3 分

オーディオを含むプロンプトを処理するには、 マルチモーダル 生成 AI モデル (つまり、テキストベースの入力だけでなく、オーディオベースの入力もサポートするモデル) をデプロイする必要があります。 Microsoft Foundry で使用できるマルチモーダルモデルには、次のようなものがあります。

マイクロソフト ファイ - 4 - マルチモーダル - 指示
OpenAI GPT-4o
OpenAI の gpt-4o-mini

ヒント

Microsoft Foundry で使用可能なモデルの詳細については、Microsoft Foundry ドキュメントの Microsoft Foundry ポータルのモデルカタログとコレクション に関する記事を参照してください。

オーディオベースのプロンプトを使用したマルチモーダルモデルのテスト

マルチモーダルモデルをデプロイした後は、Microsoft Foundry ポータルのチャットプレイグラウンドでテストできます。一部のモデルでは、ファイルのアップロードまたはメッセージの記録によって、プレイグラウンドにオーディオ添付ファイルを含めることができます。

音声ベースのプロンプトが表示されたチャットプレイグラウンドのスクリーンショット。

チャットプレイグラウンドでは、ローカルのオーディオファイルをアップロードし、メッセージにテキストを追加して、マルチモーダルモデルからの応答を引き出すことができます。

フィードバック

このページはお役に立ちましたか?

マルチモーダル モデルをデプロイする

オーディオベースのプロンプトを使用したマルチモーダル モデルのテスト

フィードバック

マルチモーダルモデルをデプロイする

オーディオベースのプロンプトを使用したマルチモーダルモデルのテスト