Azure OpenAI GPT-4 Turbo with Vision ツール (プレビュー)
Azure OpenAI GPT-4 Turbo with Vision ツールを使用すると、AzureOpenAI GPT-4 Turbo with Vision モデルデプロイを利用して画像を分析し、それらに関する質問に対するテキスト回答を提供できます。
重要
Azure OpenAI GPT-4 Turbo with Vision ツールは現在、パブリック プレビュー段階です。 このプレビュー版はサービス レベル アグリーメントなしで提供されています。運用環境のワークロードに使用することはお勧めできません。 特定の機能はサポート対象ではなく、機能が制限されることがあります。 詳しくは、Microsoft Azure プレビューの追加使用条件に関するページをご覧ください。
前提条件
AzureOpenAI リソースを作成する
手順を使用して Azure OpenAI リソースを 作成します。
Vision デプロイで GPT-4 Turbo を作成する
Azure OpenAI Studio に移動し、Azure OpenAI リソースに関連付けられている資格情報でサインインします。 サインイン ワークフローの途中または後で、適切なディレクトリ、Azure サブスクリプション、Azure OpenAI リソースを選択します。
[管理] で[デプロイ] を選択し、モデル名と
gpt-4
モデル バージョンvision-preview
を選択して GPT-4 Turbo with Vision デプロイを作成します。
つながり
プロビジョニングされたリソースへの接続をプロンプト フローで設定します。
型 | 名前 | API KEY | API の種類 | API バージョン |
---|---|---|---|---|
AzureOpenAI | 必須 | パキスタン | パキスタン | 必須 |
入力
Name | 種類 | 内容 | 必須 |
---|---|---|---|
connection | AzureOpenAI | ツールで使用する AzureOpenAI 接続 | はい |
deployment_name | string | 使う言語モデル | はい |
プロンプト | string | 言語モデルで応答を生成するために使うテキスト プロンプト。 このツールでプロンプトを作成するための Jinja テンプレートは、LLM ツールのチャット API と同様の構造に従います。 プロンプト内で画像入力を表すために、構文 ![image]({{INPUT NAME}}) を使用できます。 画像入力は、user 、system 、assistant メッセージで渡すことができます。 |
はい |
max_tokens | 整数 (integer) | 応答で生成するトークンの最大数。 既定値は 512 です。 | いいえ |
温度 | float | 生成されるテキストのランダム性。 既定値は 1 です。 | いいえ |
stop | list | 生成されるテキストの停止シーケンス。 既定値は Null です。 | いいえ |
top_p | float | 生成されたトークンから一番上の選択肢を使う確率。 既定値は 1 です。 | いいえ |
presence_penalty | float | フレーズの繰り返しに関するモデルの動作を制御する値。 既定値は 0 です。 | いいえ |
frequency_penalty | float | まれなフレーズの生成に関するモデルの動作を制御する値。 既定値は 0 です。 | いいえ |
出力
返り値の種類 | 説明 |
---|---|
string | 会話の 1 つの応答のテキスト |
次のステップ
プロンプト フローでイメージを処理する方法の詳細 について説明します。