你当前正在访问 Microsoft Azure Global Edition 技术文档网站。 如果需要访问由世纪互联运营的 Microsoft Azure 中国技术文档网站,请访问 https://docs.azure.cn。
Azure OpenAI GPT-4 Turbo with Vision tool (预览版)
借助具有视觉工具的 Azure OpenAI GPT-4 Turbo,可以利用 AzureOpenAI GPT-4 Turbo 和视觉模型部署来分析图像,并为有关图像的问题提供文本响应。
重要
Azure OpenAI GPT-4 Turbo with Vision tool 目前以公共预览版提供。 此预览版没有附带服务级别协议,建议不要用于生产工作负载。 某些功能可能不受支持或者受限。 有关详细信息,请参阅 Microsoft Azure 预览版补充使用条款。
先决条件
创建 AzureOpenAI 资源
按照 说明创建 Azure OpenAI 资源。
创建具有视觉部署的 GPT-4 Turbo
转到 Azure OpenAI Studio 并使用与 Azure OpenAI 资源关联的凭据登录。 在登录过程中或登录之后,选择适当的目录、Azure 订阅和 Azure OpenAI 资源。
在“管理”下,通过选择模型名称和
gpt-4
模型版本vision-preview
,选择“部署”并创建具有视觉部署的 GPT-4 Turbo。
连接
在提示流中设置与预配资源的连接。
类型 | 名称 | API 密钥 | API 类型 | API 版本 |
---|---|---|---|---|
AzureOpenAI | 必需 | 必需 | 必需 | 必需 |
输入
名称 | Type | 描述 | 必需 |
---|---|---|---|
连接 | AzureOpenAI | 要用于该工具的 AzureOpenAI 连接 | 是 |
deployment_name | string | 要使用的语言模型 | 是 |
prompt | string | 语言模型用于生成其响应的文本提示。 用于在此工具中撰写提示的 Jinja 模板遵循与 LLM 工具中的聊天 API 类似的结构。 若要在提示中表示图像输入,可以使用语法 ![image]({{INPUT NAME}}) 。 图像输入可以在 user 、system 和 assistant 消息中传递。 |
是 |
max_tokens | 整型 | 在响应中生成的最大令牌数。 默认值为 512。 | 否 |
温度 | FLOAT | 生成的文本的随机性。 默认值为 1。 | 否 |
stop | list | 生成的文本的停止序列。 默认值为 null。 | 否 |
top_p | FLOAT | 使用所生成令牌中的最高选项的概率。 默认值为 1。 | 否 |
presence_penalty | FLOAT | 控制模型与重复短语相关的行为的值。 默认为 0。 | 否 |
frequency_penalty | FLOAT | 控制模型与生成的罕见短语相关的行为的值。 默认为 0。 | 否 |
输出
返回类型 | 说明 |
---|---|
string | 对话的一个响应的文本 |
下一步
详细了解如何在提示流中处理图像。