你当前正在访问 Microsoft Azure Global Edition 技术文档网站。 如果需要访问由世纪互联运营的 Microsoft Azure 中国技术文档网站,请访问 https://docs.azure.cn

Azure OpenAI GPT-4 Turbo with Vision tool (预览版)

借助具有视觉工具的 Azure OpenAI GPT-4 Turbo,可以利用 AzureOpenAI GPT-4 Turbo 和视觉模型部署来分析图像,并为有关图像的问题提供文本响应。

重要

Azure OpenAI GPT-4 Turbo with Vision tool 目前以公共预览版提供。 此预览版没有附带服务级别协议,建议不要用于生产工作负载。 某些功能可能不受支持或者受限。 有关详细信息,请参阅 Microsoft Azure 预览版补充使用条款

先决条件

  • 创建 AzureOpenAI 资源

    按照 说明创建 Azure OpenAI 资源。

  • 创建具有视觉部署的 GPT-4 Turbo

    转到 Azure OpenAI Studio 并使用与 Azure OpenAI 资源关联的凭据登录。 在登录过程中或登录之后,选择适当的目录、Azure 订阅和 Azure OpenAI 资源。

    在“管理”下,通过选择模型名称和 gpt-4 模型版本 vision-preview,选择“部署”并创建具有视觉部署的 GPT-4 Turbo。

连接

在提示流中设置与预配资源的连接。

类型 名称 API 密钥 API 类型 API 版本
AzureOpenAI 必需 必需 必需 必需

输入

名称 Type 描述 必需
连接 AzureOpenAI 要用于该工具的 AzureOpenAI 连接
deployment_name string 要使用的语言模型
prompt string 语言模型用于生成其响应的文本提示。 用于在此工具中撰写提示的 Jinja 模板遵循与 LLM 工具中的聊天 API 类似的结构。 若要在提示中表示图像输入,可以使用语法 ![image]({{INPUT NAME}})。 图像输入可以在 usersystemassistant 消息中传递。
max_tokens 整型 在响应中生成的最大令牌数。 默认值为 512。
温度 FLOAT 生成的文本的随机性。 默认值为 1。
stop list 生成的文本的停止序列。 默认值为 null。
top_p FLOAT 使用所生成令牌中的最高选项的概率。 默认值为 1。
presence_penalty FLOAT 控制模型与重复短语相关的行为的值。 默认为 0。
frequency_penalty FLOAT 控制模型与生成的罕见短语相关的行为的值。 默认为 0。

输出

返回类型 说明
string 对话的一个响应的文本

下一步

详细了解如何在提示流中处理图像