你当前正在访问 Microsoft Azure Global Edition 技术文档网站。 如果需要访问由世纪互联运营的 Microsoft Azure 中国技术文档网站,请访问 https://docs.azure.cn

Azure OpenAI GPT-4 Turbo with Vision tool (预览版)

借助具有视觉工具的 Azure OpenAI GPT-4 Turbo,可以利用 AzureOpenAI GPT-4 Turbo 和视觉模型部署来分析图像,并为有关图像的问题提供文本响应。

重要

Azure OpenAI GPT-4 Turbo with Vision tool 目前以公共预览版提供。 此预览版没有附带服务级别协议,建议不要用于生产工作负载。 某些功能可能不受支持或者受限。 有关详细信息,请参阅 Microsoft Azure 预览版补充使用条款

先决条件

  • 创建 AzureOpenAI 资源

    按照 说明创建 Azure OpenAI 资源。

  • 创建具有视觉部署的 GPT-4 Turbo

    转到 Azure AI Foundry 门户 ,使用与 Azure OpenAI 资源关联的凭据登录。 在登录过程中或登录之后,选择适当的目录、Azure 订阅和 Azure OpenAI 资源。

    在“管理”下,通过选择模型名称和 gpt-4 模型版本 vision-preview,选择“部署”并创建具有视觉部署的 GPT-4 Turbo。

连接

在提示流中设置与预配资源的连接。

类型 名称 API 密钥 API 类型 API 版本
AzureOpenAI 必需 必需 必需 必需

输入

名称 类型 描述 必需
连接 AzureOpenAI 要用于该工具的 AzureOpenAI 连接
部署名称 字符串 要使用的语言模型
提示 字符串 语言模型用于生成其响应的文本提示。 用于在此工具中撰写提示的 Jinja 模板遵循与 LLM 工具中的聊天 API 类似的结构。 若要在提示中表示图像输入,可以使用语法 ![image]({{INPUT NAME}})。 图像输入可以在 usersystemassistant 消息中传递。
max_tokens 整型 在响应中生成的最大令牌数。 默认值为 512。
温度 FLOAT 生成的文本的随机性。 默认值为 1。
列表 生成的文本的停止序列。 默认值为 null。
top_p FLOAT 使用所生成令牌中的最高选项的概率。 默认值为 1。
presence_penalty FLOAT 控制模型与重复短语相关的行为的值。 默认为 0。
frequency_penalty FLOAT 控制模型与生成的罕见短语相关的行为的值。 默认为 0。

输出

返回类型 描述
字符串 对话的一个响应的文本

下一步

详细了解如何在提示流中处理图像