你当前正在访问 Microsoft Azure Global Edition 技术文档网站。 如果需要访问由世纪互联运营的 Microsoft Azure 中国技术文档网站,请访问 https://docs.azure.cn

Azure OpenAI 服务模型

Azure OpenAI 服务由一组具有不同功能和价位的模型提供支持。 模型可用性因地区而异。 有关将在 2024 年 7 月停用的 GPT-3 和其他模型的信息,请参阅 Azure OpenAI 服务旧模型

模型 说明
GPT-4 Turbo 🆕 功能最强大的最新 Azure OpenAI 模型具有多模态版本,可以接受文本和图像作为输入。
GPT-4 一组在 GPT-3.5 的基础上进行了改进的模型,可以理解并生成自然语言和代码。
GPT-3.5 一组在 GPT-3 的基础上进行了改进的模型,可以理解并生成自然语言和代码。
嵌入 一组模型,可将文本转换为数字矢量形式,以提高文本相似性。
DALL-E 一系列可从自然语言生成原始图像的模型。
Whisper 一系列预览版模型,可将语音转录和翻译为文本。
文本转语音(预览版) 预览版中的一系列模型,可将文本合成为语音。

GPT-4 Turbo

GPT-4 Turbo 是一个大型多模态模型(接受文本或图像输入并生成文本),它可以比 OpenAI 的任何以前的模型更准确地解决难题。 与 GPT-3.5 Turbo 和较旧的 GPT-4 模型一样,GPT-4 Turbo 针对聊天进行了优化,能够很好地完成传统的补全任务。

GPT-4 Turbo 的最新 GA 版本是:

  • gpt-4版本:turbo-2024-04-09

这是以下预览版模型的替代品:

  • gpt-4版本:1106-Preview
  • gpt-4版本:0125-Preview
  • gpt-4版本:vision-preview

OpenAI 和 Azure OpenAI GPT-4 Turbo with Vision GA 模型之间的差异

  • OpenAI 的最新 0409 turbo 模型的版本支持所有推理请求的 JSON 模式和函数调用。
  • Azure OpenAI 的最新 turbo-2024-04-09 的版本目前不支持在使用图像(视觉)输入发出推理请求时使用 JSON 模式和函数调用。 基于文本的输入请求支持 JSON 模式和函数调用。

与 gpt-4 vision-preview 的差异

  • gpt-4 版本 turbo-2024-04-09 不支持将 Azure AI 的特定 Vision 增强功能与 GPT-4 Turbo with Vision 集成。 这包括光学字符识别 (OCR)、对象接地、视频提示以及改进的图像数据处理。

区域可用性

有关模型区域可用性的信息,请参阅模型矩阵

部署 GPT-4 Turbo with Vision GA

若要从 Studio UI 部署 GA 模型,请选择 GPT-4,然后从下拉菜单中选择 turbo-2024-04-09 版本。 gpt-4-turbo-2024-04-09 模型的默认配额将与 GPT-4-Turbo 的当前配额相同。 请参阅区域配额限制

GPT-4

GPT-4 是 GPT-4 Turbo 的前身。 GPT-4 模型和 GPT-4 Turbo 模型的基础模型名称均为 gpt-4。 可以通过检查模型版本来区分 GPT-4 模型和 Turbo 模型。

  • gpt-4版本0314
  • gpt-4版本0613
  • gpt-4-32k版本0613

可以看到模型摘要表中的每个模型支持的令牌上下文长度。

GPT-4 模型和 GPT-4 Turbo 模型

  • 这些模型只能与聊天补全 API 一起使用。

请参阅模型版本,了解 Azure OpenAI 服务如何处理模型版本升级,使用模型了解如何查看和配置 GPT-4 部署的模型版本设置。

模型 ID 最大请求(令牌) 训练数据(上限)
gpt-4 (0314) 8,192 2021 年 9 月
gpt-4-32k(0314) 32,768 2021 年 9 月
gpt-4 (0613) 8,192 2021 年 9 月
gpt-4-32k (0613) 32,768 2021 年 9 月
gpt-4 (1106-Preview)1
GPT-4 Turbo 预览版
输入:128,000
输出:4,096
2023 年 4 月
gpt-4 (0125-Preview)1
GPT-4 Turbo 预览版
输入:128,000
输出:4,096
2023 年 12 月
gpt-4 (vision-preview)2
包含视觉功能预览版的 GPT-4 Turbo
输入:128,000
输出:4,096
2023 年 4 月
gpt-4 (turbo-2024-04-09) 🆕
GPT-4 Turbo with Vision GA
输入:128,000
输出:4,096
2023 年 12 月

1 GPT-4 Turbo Preview = gpt-4 (0125-Preview) 或 gpt-4 (1106-Preview)。 若要部署此模型,请在“部署”下选择模型 gpt-4。 在“版本”下,选择“(0125-Preview)”或“(1106-Preview)”。

2 包含视觉功能预览版的 GPT-4 Turbo = gpt-4 (vision-preview)。 若要部署此模型,请在“部署”下选择模型 gpt-4。 对于“模型版本”,请选择“vision-preview”。

注意

我们不建议在生产环境中使用预览模型。 我们会将预览模型的所有部署升级到未来的预览版和稳定版本。 指定的模型预览版不遵循标准的 Azure OpenAI 模型生命周期。

注意

gpt-4gpt-4-32k 的版本 0314 将于 2024 年 7 月 5 日或之后停用。 gpt-4gpt-4-32k 的版本 0613 将于 2024 年 9 月 30 日或之后停用。 如需了解模型升级行为,请参阅模型更新

  • GPT-4 版本 0125-preview 是以前发布的 1106-preview 版 GPT-4 Turbo 预览版的更新版本。
  • 与 gpt-4-1106-preview 相比,GPT-4 版本 0125-preview 更完整地完成了代码生成等任务。 因此,根据任务的不同,客户可能会发现 GPT-4-0125-preview 比 gpt-4-1106-preview 生成更多输出。 我们建议客户比较新模型的输出。 GPT-4-0125-preview 还解决了 gpt-4-1106-preview 中针对非英语语言的 UTF-8 处理中的 bug。 GPT-4 版本 turbo-2024-04-09 是最新的 GA 版本,取代了 0125-Preview1106-previewvision-preview

重要

  • 将来会使用 gpt-4 稳定版本升级 gpt-4 版本 1106-Preview 和 0125-Preview。 原定于 2024 年 3 月 8 日进行的从 gpt-4 1106-Preview 到 gpt-4 0125-Preview 的部署升级将不再发生。 设置为“自动更新为默认版本”和“过期时升级”的 gpt-4 版本 1106-Preview 和 0125-Preview 部署将在稳定版本发布后开始升级。 对于每次部署,将会进行模型版本升级,API 调用服务不会出现中断。 升级按区域分阶段进行,整个升级过程预期需要 2 周时间。 设置为“不自动升级”的 gpt-4 版本 1106-Preview 和 0125-Preview 部署将不会升级,并且当预览版在区域中升级时将停止运行。

GPT-3.5

GPT-3.5 模型可以理解和生成自然语言或代码。 GPT-3.5 系列中功能最强大且最具成本效益的模型是 GPT-3.5 Turbo,该模型已针对聊天进行了优化,且能够很好地完成传统的补全任务。 GPT-3.5 Turbo 可用于聊天完成 API。 GPT-3.5 Turbo 指令具有与使用完成 API 而不是聊天完成 API 类似的功能 text-davinci-003。 我们建议使用 GPT-3.5 Turbo 和 GPT-3.5 Turbo Instruct,而不是 GPT-3.5 和 GPT-3 两种旧模型

  • gpt-35-turbo
  • gpt-35-turbo-16k
  • gpt-35-turbo-instruct

可以看到模型摘要表中的每个模型支持的令牌上下文长度。

若要详细了解如何与 GPT-3.5 Turbo 以及聊天补全 API 进行交互,请查看我们的操作方法详解

嵌入

text-embedding-3-large 是最新且能力最强的嵌入模型。 无法在嵌入模型之间进行升级。 若要从使用 text-embedding-ada-002 转移到 text-embedding-3-large,你需要生成新的嵌入内容。

  • text-embedding-3-large
  • text-embedding-3-small
  • text-embedding-ada-002

在测试中,OpenAI 报告显示,大型和小型第三代嵌入模型在 MIRACL 基准中提供了更好的平均多语言检索性能,同时仍在 MTEB 基准中保持了英语任务的性能。

评估基准 text-embedding-ada-002 text-embedding-3-small text-embedding-3-large
MIRACL 平均值 31.4 44.0 54.9
MTEB 平均值 61.0 62.3 64.6

第三代嵌入模型支持通过新的 dimensions 参数减小嵌入的大小。 通常,从计算、内存和存储的角度来看,更大的嵌入成本更高。 调整维度数量的功能让你可以更好地控制总体成本和性能。 OpenAI 1.x Python 库的所有版本都不支持 dimensions 参数,为了利用此参数,我们建议升级到最新版本:pip install openai --upgrade

OpenAI 的 MTEB 基准测试发现,即使第三代模型的维度减少到了小于 text-embeddings-ada-002 1,536 个维度,性能还是要稍好一些。

DALL-E

DALL-E 模型根据用户提供的文本提示生成图像。 DALL-E 3 可通过 REST API 供公众使用。 配备客户端 SDK 的 DALL-E 2 和 DALL-E 3 处于预览状态。

Whisper

Whisper 模型可用于实现语音转文本。

还可以通过 Azure AI 语音 批量听录 API 使用 Whisper 模型。 请查看什么是 Whisper 模型?,详细了解使用 Azure AI 语音与 Azure OpenAI 服务的场景。

文本转语音(预览版)

OpenAI 文本转语音模型(目前为预览版)可用于将文本合成为语音。

还可以通过 Azure AI 语音使用 OpenAI 文本转语音声音。 要了解详细信息,请参阅通过 Azure OpenAI 服务或通过 Azure AI 语音实现 OpenAI 文本转语音声音指南。

模型摘要表和区域可用性

注意

本文主要介绍适用于部署类型为“标准”的所有 Azure OpenAI 客户的模型/区域可用性。 某些精选客户有权访问下表中未列出的模型/区域组合。 有关预配部署的详细信息,请参阅预配指南

标准部署模型可用性

区域 gpt-40613 gpt-41106-Preview gpt-40125-Preview gpt-4,turbo-2024-04-09 gpt-4vision-preview gpt-4-32k0613 gpt-35-turbo0301 gpt-35-turbo0613 gpt-35-turbo1106 gpt-35-turbo0125 gpt-35-turbo-16k0613 gpt-35-turbo-instruct0914 text-embedding-ada-0021 text-embedding-ada-0022 text-embedding-3-small1 text-embedding-3-large1 babbage-0021 dall-e-33.0 davinci-0021 tts001 tts-hd001 whisper001
australiaeast - - - - - - - - - - - - -
巴西南部 - - - - - - - - - - - - - - - - - - - - -
canadaeast - - - - - - - - - - - -
eastus - - - - - - - - - - - -
eastus2 - - - - - - - - - - - - - -
francecentral - - - - - - - - - - - - - -
日本东部 - - - - - - - - - - - - - - - - - -
northcentralus - - - - - - - - - - - -
norwayeast - - - - - - - - - - - - - - - - - - -
southafricanorth - - - - - - - - - - - - - - - - - - - - -
southcentralus - - - - - - - - - - - - - - - - -
southindia - - - - - - - - - - - - - - - - - -
瑞典中部 - - - - - -
瑞士北部 - - - - - - - - - - - - - - - -
uksouth - - - - - - - - - - - - - - -
westeurope - - - - - - - - - - - - - - - - - - -
westus - - - - - - - - - - - - - - - - - -
westus3 - - - - - - - - - - - - - - - - - - - - -

此表不包括微调区域可用性。有关该信息,请参阅专门的微调部分

标准部署模型配额

模型的默认配额因模型和区域而异。 默认配额限制可能会更改。

标准部署的配额按每分钟令牌数 (TPM) 进行描述。

区域 GPT-4 GPT-4-32K GPT-4-Turbo GPT-4-Turbo-V GPT-35-Turbo GPT-35-Turbo-Instruct Text-Embedding-Ada-002 text-embedding-3-small text-embedding-3-large Babbage-002 Babbage-002 - 微调 Davinci-002 Davinci-002 - 微调 GPT-35-Turbo - 微调 GPT-35-Turbo-1106 - 微调 GPT-35-Turbo-0125 - 微调
australiaeast 40,000 80,000 80,000 30 K 300,000 - 350,000 - - - - - - - - -
巴西南部 - - - - - - 350,000 - - - - - - - - -
canadaeast 40,000 80,000 80,000 - 300,000 - 350,000 350,000 350,000 - - - - - - -
eastus - - 80,000 - 240,000 240,000 240,000 350,000 350,000 - - - - - - -
eastus2 - - 80,000 - 300,000 - 350,000 350,000 350,000 - - - - 250 K 250 K 250 K
francecentral 20000 60 K 80,000 - 240,000 - 240,000 - - - - - - - - -
日本东部 - - - 30 K 300,000 - 350,000 - - - - - - - - -
northcentralus - - 80,000 - 300,000 - 350,000 - - 240,000 250 K 240,000 250 K 250 K 250 K 250 K
norwayeast - - 150 K - - - 350,000 - - - - - - - - -
southafricanorth - - - - - - 350,000 - - - - - - - - -
southcentralus - - 80,000 - 240,000 - 240,000 - - - - - - - - -
southindia - - 150 K - 300,000 - 350,000 - - - - - - - - -
瑞典中部 40,000 80,000 150 K 30 K 300,000 240,000 350,000 - - 240,000 250 K 240,000 250 K 250 K 250 K 250 K
瑞士北部 40,000 80,000 - 30 K 300,000 - 350,000 - - - - - - - - -
switzerlandwest - - - - - - - - - - 250 K - 250 K 250 K 250 K 250 K
uksouth - - 80,000 - 240,000 - 350,000 - - - - - - - - -
westeurope - - - - 240,000 - 240,000 - - - - - - - - -
westus - - 80,000 30 K 300,000 - 350,000 - - - - - - - - -
westus3 - - - - - - 350,000 - - - - - - - - -

1 K = 1000 个每分钟令牌数 (TPM)。 TPM 与每分钟请求数 (RPM) 之间的关系目前定义为每 1000 个 TPM 对应 6 个 RPM

预配部署模型可用性

区域 gpt-40613 gpt-41106-Preview gpt-40125-Preview gpt-4-32k0613 gpt-35-turbo1106 gpt-35-turbo0125
australiaeast
巴西南部 - -
canadacentral - - -
canadaeast - - -
eastus
eastus2
francecentral -
germanywestcentral -
日本东部 - - -
koreacentral - - -
northcentralus
norwayeast - - -
polandcentral
southafricanorth - -
southcentralus
southindia
瑞典中部
瑞士北部
switzerlandwest - - - - -
uksouth
westus
westus3

如何访问预配项?

需要与 Microsoft 销售/帐户团队交谈才能获取预配的吞吐量。 如果目前没有销售/帐户团队,则无法购买预配的吞吐量。

有关预配部署的详细信息,请参阅预配指南

GPT-4 和 GPT-4 Turbo 模型可用性

公有云区域

区域 gpt-40613 gpt-41106-Preview gpt-40125-Preview gpt-4vision-preview gpt-4,turbo-2024-04-09 gpt-4-32k0613
australiaeast - -
canadaeast - - -
eastus - - - - -
eastus2 - - - -
francecentral - - -
日本东部 - - - - -
northcentralus - - - - -
norwayeast - - - - -
southcentralus - - - - -
southindia - - - - -
瑞典中部 -
瑞士北部 - - -
uksouth - - - -
westus - - - -

精选客户访问权限

除上述可供所有 Azure OpenAI 客户使用的区域外,一些精选的现有客户还有权访问其他区域中的 GPT-4 版本:

模型 区域
gpt-4 (0314) 美国东部
法国中部
美国中南部
英国南部
gpt-4 (0613) 美国东部
美国东部 2
日本东部
英国南部

Azure 政府区域

Azure 政府提供以下 GPT-4 模型:

模型 ID 模型可用性
gpt-4 (1106-Preview) US Gov 弗吉尼亚州
US Gov 亚利桑那州

GPT-3.5 模型

重要

新的 gpt-35-turbo (0125) 模型进行了各种改进,包括提高响应请求格式的准确度,修复导致非英语函数调用的文本编码问题的 bug。

GPT-3.5 Turbo 可与聊天补全 API 搭配使用。 GPT-3.5 Turbo 版本 0301 也可以与补全 API 搭配使用,但不建议这样做。 GPT-3.5 Turbo 版本 0613 和 1106 仅支持聊天补全 API。

GPT-3.5 Turbo 版本 0301 是发布的模型的第一个版本。 版本 0613 是模型的第二个版本,并添加了函数调用支持。

请参阅模型版本,了解 Azure OpenAI 服务如何处理模型版本升级,使用模型了解如何查看和配置 GPT-3.5 Turbo 部署的模型版本设置。

注意

gpt-35-turbogpt-35-turbo-16k 的版本 0613 将于 2024 年 8 月 1 日或之后停用。 gpt-35-turbo 的版本 0301 将于 2024 年 8 月 1 日或之后停用。 如需了解模型升级行为,请参阅模型更新

模型 ID 最大请求(令牌) 训练数据(上限)
gpt-35-turbo1 (0301) 4,096 2021 年 9 月
gpt-35-turbo (0613) 4,096 2021 年 9 月
gpt-35-turbo-16k (0613) 16,384 2021 年 9 月
gpt-35-turbo-instruct (0914) 4,097 2021 年 9 月
gpt-35-turbo (1106) 输入:16,385
输出:4,096
2021 年 9 月
gpt-35-turbo (0125) 输入:16,385
输出:4,096
2021 年 9 月

GPT-3.5-Turbo 模型可用性

公有云区域

区域 gpt-35-turbo0301 gpt-35-turbo0613 gpt-35-turbo1106 gpt-35-turbo0125 gpt-35-turbo-16k0613 gpt-35-turbo-instruct0914
australiaeast - - -
canadaeast - -
eastus - -
eastus2 - - - -
francecentral - -
日本东部 - - - -
northcentralus - - -
southcentralus - - - -
southindia - - - - -
瑞典中部 - -
瑞士北部 - - - -
uksouth - -
westeurope - - - - -
westus - - - - -

1 此模型将接受 > 4,096 个令牌的请求。 不建议超过 4,096 个输入令牌限制,因为较新版本的模型上限为 4,096 个令牌。 如果使用此模型超过 4,096 个输入令牌时遇到问题,则此配置不受正式支持。

Azure 政府区域

Azure 政府提供以下 GPT-3.5 turbo 模型:

模型 ID 模型可用性
gpt-35-turbo (1106-Preview) US Gov 弗吉尼亚州

嵌入模型

这些模型只能与嵌入 API 请求一起使用。

注意

text-embedding-3-large 是最新且能力最强的嵌入模型。 无法在嵌入模型之间进行升级。 若要从使用 text-embedding-ada-002 迁移到 text-embedding-3-large,你需要生成新的嵌入内容。

模型 ID 最大请求(令牌) 输出维度 训练数据(上限)
text-embedding-ada-002(版本 2) 8,191 1,536 2021 年 9 月
text-embedding-ada-002(版本 1) 2,046 1,536 2021 年 9 月
text-embedding-3-large 8,191 3,072 2021 年 9 月
text-embedding-3-small 8,191 1,536 2021 年 9 月

注意

发送用于嵌入的输入数组时,每次调用嵌入终结点的数组中输入项的最大数目为 2048。

公有云区域

区域 text-embedding-ada-0021 text-embedding-ada-0022 text-embedding-3-small1 text-embedding-3-large1
australiaeast - - -
巴西南部 - - -
canadaeast -
eastus
eastus2 -
francecentral - - -
日本东部 - - -
northcentralus - - -
norwayeast - - -
southafricanorth - - -
southcentralus - -
southindia - - -
瑞典中部 - - -
瑞士北部 - - -
uksouth - - -
westeurope - - -
westus - - -
westus3 - - -

Azure 政府区域

Azure 政府提供以下嵌入模型:

模型 ID 模型可用性
text-embedding-ada-002(版本 2) US Gov 弗吉尼亚州
US Gov 亚利桑那州

DALL-E 模型

模型 ID 功能可用性 最大请求(字符数)
dalle2(预览版) 美国东部 1,000
dall-e-3 美国东部、澳大利亚东部、瑞典中部 4,000

微调模型

未训练 babbage-002davinci-002 按照说明进行操作。 查询这些基本模型只能作为对微调版本的引用点来完成,以评估训练进度。

gpt-35-turbo - 此模型的微调仅限于区域子集,并且基础模型在可用的每个区域中都不可用。

模型 ID 微调区域 最大请求(令牌) 训练数据(上限)
babbage-002 美国中北部
瑞典中部
瑞士西部
16,384 2021 年 9 月
davinci-002 美国中北部
瑞典中部
瑞士西部
16,384 2021 年 9 月
gpt-35-turbo (0613) 美国东部 2
美国中北部
瑞典中部
瑞士西部
4,096 2021 年 9 月
gpt-35-turbo (1106) 美国东部 2
美国中北部
瑞典中部
瑞士西部
输入:16,385
输出:4,096
2021 年 9 月
gpt-35-turbo (0125) 美国东部 2
美国中北部
瑞典中部
瑞士西部
16,385 2021 年 9 月

Whisper 模型

模型 ID 模型可用性 最大请求(音频文件大小)
whisper 美国东部 2
美国中北部
挪威东部
印度南部
瑞典中部
西欧
25 MB

文本转语音模型(预览版)

模型 ID 模型可用性
tts-1 美国中北部
瑞典中部
tts-1-hd 美国中北部
瑞典中部

助手(预览版)

对于助手,支持的模型和支持的区域的组合。 某些工具和功能需要最新的模型。 助手 API、SDK、Azure AI Studio 和 Azure OpenAI Studio 中可使用以下模型。 下表适用于即用即付。 有关预配吞吐量单位 (PTU) 的详细信息,请参阅预配吞吐量

区域 gpt-35-turbo (0613) gpt-35-turbo (1106) gpt-4 (0613) gpt-4 (1106) gpt-4 (0125)
澳大利亚东部
美国东部
美国东部 2
法国中部
挪威东部
瑞典中部
英国南部

后续步骤