你当前正在访问 Microsoft Azure Global Edition 技术文档网站。 如果需要访问由世纪互联运营的 Microsoft Azure 中国技术文档网站,请访问 https://docs.azure.cn。
什么是 Azure OpenAI 服务?
Azure OpenAI 服务提供对 OpenAI 强大语言模型的 REST API 访问,这些模型包括 GPT-4o、支持视觉的 GPT-4 Turbo、GPT-4、GPT-3.5-Turbo 和嵌入模型系列。 这些模型可以轻松适应特定的任务,包括但不限于内容生成、汇总、图像理解、语义搜索和自然语言到代码的转换。 用户可以通过 REST API、Python SDK 或 Azure OpenAI Studio 中基于 Web 的界面访问该服务。
功能概述
功能 | Azure OpenAI |
---|---|
可用的模型 | GPT-4o 和 GPT-4o mini GPT-4 系列(包括 GPT-4 Turbo with Vision) GPT-35-Turbo 系列 Embeddings 系列 在模型页中了解详细信息。 |
微调 | GPT-4o-mini (预览版)GPT-4 (预览版)GPT-3.5-Turbo (0613) babbage-002 davinci-002 。 |
价格 | 此处提供 有关 GPT-4 Turbo with Vision 的详细信息,请参阅特殊定价信息。 |
虚拟网络支持和专用链接支持 | 是,除非对数据使用 Azure OpenAI。 |
托管标识 | 是,通过 Microsoft Entra ID |
UI 体验 | 用于帐户和资源管理的 Azure 门户, 用于模型探索和微调的 Azure OpenAI Service Studio |
模型区域可用性 | 模型可用性 |
内容筛选 | 使用自动化系统根据内容策略评估提示和完成情况。 将筛选高严重性内容。 |
负责任的 AI
Microsoft 致力于遵照“以人为本”的原则推动 AI 的进步。 生成性模型(例如 Azure OpenAI 中提供的模型)提供显著的潜在优势,但如果不经过精心设计和采用全方位的缓解措施,此类模型有可能会生成错误甚至有害的内容。 Microsoft 已进行了大量投资来帮助防范滥用和意外损害,其中包括融入 Microsoft 的负责任 AI 使用原则,采用服务使用行为准则,生成内容筛选器以支持客户,以及提供客户在使用 Azure OpenAI 时应考虑的负责任 AI 信息和指导。
如何访问 Azure OpenAI?
访问大多数 Azure OpenAI 模型不需要有限访问注册表单。 在 Azure OpenAI 有限访问页上了解详细信息。
比较 Azure OpenAI 和 OpenAI
Azure OpenAI 服务通过 OpenAI GPT-4、GPT-3、Codex、DALL-E、Whisper 和文本转语音模型为客户提供高级语言 AI,并能够实现 Azure 的安全性和企业承诺。 Azure OpenAI 与 OpenAI 共同开发 API,确保兼容性的同时能够实现二者之间的平稳过渡。
使用 Azure OpenAI,客户可在运行与 OpenAI 相同的模型时获得 Microsoft Azure 的安全功能。 Azure OpenAI 提供专用网络、区域可用性和负责任 AI 内容筛选功能。
关键概念
提示和补全
补全终结点是 API 服务的核心组件。 此 API 提供对模型的文本输入、文本输出接口的访问。 用户只需提供一个包含英文文本命令的输入提示,模型就会生成文本补全。
下面是一个简单的提示和补全的示例:
提示:
""" count to 5 in a for loop """
补全:
for i in range(1, 6): print(i)
令牌
文本标记
Azure OpenAI 通过将文本分解为标记来处理文本。 标记可以是单词,也可以是字符块。 例如,单词“hamburger”将分解为标记“ham”、“bur”和“ger”,而“pear”之类的常见短单词只是一个单个标记。 许多标记以空格开头,例如“ hello”和“ bye”。
给定请求中处理的标记总数取决于输入、输出和请求参数的长度。 处理的标记数量也会影响模型的响应延迟和吞吐量。
图像标记(GPT-4 Turbo with Vision 和 GPT-4o)
输入图像的标记成本取决于两个主要因素:图像的大小以及用于每个图像的细节设置(低或高)。 下面是其工作原理的明细:
细节:低分辨率模式
- 通过低细节,API 可以返回更快的响应,并且对于不需要高细节的用例,可以使用更少的输入标记。
- 无论图像大小如何,这些图像分别消耗 85 个标记。
- 示例:4096 x 8192 图像(低细节):成本为固定的 85 个标记,因为它是一个低细节图像,并且大小不会影响此模式下的成本。
细节:高分辨率模式
- 利用高细节,API 可以通过将图像裁剪为较小的方块更详细地查看图像。 每个方块可使用更多标记来生成文本。
- 标记成本由一系列缩放步骤计算得出:
- 首先缩放图像,以适合 2048 x 2048 方形,同时保持其纵横比。
- 然后纵向缩减图像,以将其最短的一边长度缩放至 768 像素。
- 将图像分为 512 像素方形图块,这些图块(部分图块向上舍入)的数量决定了最终成本。 每个图块的成本为 170 个标记。
- 总成本中会额外增加 85 个标记。
- 示例:2048 x 4096 图像(高细节)
- 初始重设大小为 1024 x 2048 以适应 2048 方块。
- 再进一步调整为 768 x 1536。
- 需要 6 个 512px 图块才能覆盖。
- 总成本是
170 × 6 + 85 = 1105
个标记。
资源
Azure OpenAI 是 Azure 上的一个新产品。 可以在 Azure 订阅中像使用任何其他 Azure 产品一样通过创建资源或服务实例开始使用 Azure OpenAI。 可以阅读有关 Azure 的资源管理设计的详细信息。
部署
创建 Azure OpenAI 资源后,必须先部署模型,然后才能开始发出 API 调用和生成文本。 可以使用部署 API 来完成此操作。 这些 API 允许指定要使用的模型。
提示设计
OpenAI 中的 GPT-3、GPT-3.5 和 GPT-4 模型是基于提示的。 使用基于提示的模型时,用户通过输入文本提示与模型交互,该文本提示通过文本补全进行响应。 补全是模型的输入文本的延续。
虽然这些模型非常强大,但它们的行为对提示也非常敏感。 这使得提示工程成为一项重要的开发技能。
提示构造可能很困难。 在实践中,提示的作用是配置模型权重以完成所需的任务,但它更像艺术而不是科学,通常需要经验和直觉来制作成功的提示。
模型
该服务为用户提供对多种不同模型的访问。 每种模型提供不同的功能和价位。
DALL-E 模型(有一些为预览版,请参阅模型)基于用户提供的文本提示生成图像。
Whisper 模型可用于将语音转录并翻译成文本。
文本转语音模型(目前为预览版)可用于将文本合成为语音。
在模型概念页上详细了解每个模型。