你当前正在访问 Microsoft Azure Global Edition 技术文档网站。 如果需要访问由世纪互联运营的 Microsoft Azure 中国技术文档网站,请访问 https://docs.azure.cn。
Azure OpenAI 服务中的新增功能有哪些
2023 年 8 月
基于自有数据的 Azure OpenAI(预览版)更新
- 现在可以将基于自有数据的 Azure OpenAI 部署到 Power Virtual Agents。
- 基于自有数据的 Azure OpenAI 现在支持专用终结点。
- 能够筛选对敏感文档的访问。
- 按计划自动刷新索引。
- 矢量搜索和语义搜索选项。
- 在已部署的 Web 应用中查看聊天历史记录
2023 年 7 月
支持函数调用
- Azure OpenAI 现在支持函数调用,使你能够使用聊天完成 API 中的函数。
嵌入输入数组增加
- Azure OpenAI 现在通过 text-embedding-ada-002 版本 2 支持每个 API 请求最多包含 16 个输入的数组。
新区域
- Azure OpenAI 现在也在加拿大东部、美国东部 2、日本东部和美国中北部区域中可用。 请查看“模型”页面,获取有关每个地区模型可用性的最新信息。
2023 年 6 月
使用基于数据的 Azure OpenAI(预览版)
- 基于数据的 Azure OpenAI 现在以预览版提供,你能够与 OpenAI 模型(如 GPT-35-Turbo 和 GPT-4)聊天,并收到根据你的数据做出的响应。
新版本的 gpt-35-turbo 和 gpt-4 型号
- gpt-35-turbo(版本 0613)
- gpt-35-turbo-16k(版本 0613)
- gpt-4(版本 0613)
- gpt-4-32k(版本 0613)
英国南部
- Azure OpenAI 现已在英国南部地区推出。 请查看“模型”页面,获取有关每个地区模型可用性的最新信息。
配置筛选与注释(预览版)
Quota
- 配额使你可以灵活、主动地管理订阅中不同部署的速率上限的分配。
2023 年 5 月
Java 与 JavaScript SDK 支持
- 新的 Azure OpenAI 预览版 SDK 产品/服务支持 JavaScript 和 Java。
Azure OpenAI 聊天补全正式发布 (GA)
- 正式发布支持:
- 聊天补全 API 版本
2023-05-15。 - GPT-35-Turbo 模型。
- GPT-4 模型系列。 由于需求较高,目前只能通过请求来访问此模型系列。 要请求访问权限,现有的 Azure OpenAI 客户可以通过填写此表单来提出申请
- 聊天补全 API 版本
如果当前正在使用 2023-03-15-preview API,建议迁移到 GA 2023-05-15 API。 如果当前使用的是 API 版本 2022-12-01,此 API 仍为正式版,但不包括最新的聊天补全功能。
重要
将当前版本的 GPT-35-Turbo 模型与补全终结点结合使用的功能仍为预览版。
法国中部
- Azure OpenAI 现已在法国中部地区推出。 请查看“模型”页面,获取有关每个地区模型可用性的最新信息。
2023 年 4 月
DALL-E 2 公共预览版。 Azure OpenAI 服务现在支持由 OpenAI 的 DALL-E 2 模型提供支持的图像生成 API。 根据你提供的描述性文本获取 AI 生成的图像。 若要了解详细信息,请查看快速入门。 要请求访问权限,现有的 Azure OpenAI 客户可以通过填写此表单来提出申请。
自定义模型的非活动部署现在将在 15 天后删除;模型将仍可用于重新部署。 如果自定义(微调)模型是在超过十五 (15) 天前部署的且在此期间未对其进行补全或聊天补全调用,则将自动删除部署(针对该部署,不会产生进一步的托管费用)。 基础自定义模型仍将可用,并且可以随时重新部署。 若要了解详细信息,请查看操作指南文章。
2023 年 3 月
GPT-4 系列模型现已在 Azure OpenAI 上以预览版提供。 要请求访问权限,现有的 Azure OpenAI 客户可以通过填写此表单来提出申请。 上述模型目前在美国东部和美国中南部区域中可用。
3 月 21 日在预览版中发布了适用于 GPT-35-Turbo 和 GPT-4 模型的新聊天完成 API。 要了解详细信息,请查看更新的快速入门和操作指南文章。
GPT-35-Turbo 预览版。 要了解详细信息,请查看操作指南文章。
提高了微调的训练限制:对于所有模型,最大训练作业大小(训练文件中的标记数)x(时期数)为 20 亿个标记数。 此外,我们还将最大训练作业时间从 120 小时延长到 720 小时。
将其他用例添加到现有访问权限。 以前,添加新用例的过程要求客户重新应用到服务。 现在,我们将发布一个新流程,允许你快速添加新用例以使用服务。 此过程遵循 Azure AI 服务中既定的受限访问流程。 现有客户可以在此处证明任何和所有新用例。 请注意,每当你想要将服务用于最初未申请的新用例时,都需要这样做。
2023 年 2 月
新增功能
- .NET SDK(推理)预览版 | 示例
- Terraform SDK 更新以支持 Azure OpenAI 管理操作。
- 现在,支持使用
suffix参数在完成末尾插入文本。
更新
- 默认启用内容筛选。
以下主题的新文章:
新的培训课程:
2023 年 1 月
新功能
服务 GA。 Azure OpenAI 服务现已正式发布。
新模型 - 添加了最新的文本模型:text-davinci-003(美国东部、西欧)、text-ada-embeddings-002(美国东部、美国中南部、西欧)
2022 年 12 月
新增功能
OpenAI 中的最新模型。 Azure OpenAI 提供对所有最新模型(包括 GPT-3.5 系列)的访问权限。
新的 API 版本 (2022-12-01)。 此更新包括几个请求的增强功能,其中包括 API 响应中的令牌使用情况信息、改进的文件错误消息、在微调创建数据结构上与 OpenAI 保持一致,以及对后缀参数的支持以允许微调作业的自定义命名。
每秒请求数的上限更高。 对于非 Davinci 模型,限制为 50。 对于 Davinci 模型,限制为 20。
微调部署速度更快。 在 10 分钟内部署 Ada 和 Curie 微调模型。
训练限制值更高:对于 Ada、Babbage 和 Curie,限制为 4,000 万个训练令牌。 对于 Davinci,限制为 1,000 万。
请求修改滥用和误用数据日志记录和人工评审的过程。 目前,该服务记录请求/响应数据,以便进行滥用和误用检测,确保这些功能强大的模型不会被滥用。 但是,许多客户有严格的数据隐私和安全要求,需要对他们的数据进行更高级别的控制。 为了支持这些用例,我们将发布一个新流程,供客户修改内容筛选策略或关闭低风险用例的滥用日志记录。 此过程遵循 Azure AI 服务中既定的受限访问流程,现有 OpenAI 客户可在此处申请。
客户管理的密钥 (CMK) 加密。 CMK 通过提供客户自己的用于存储训练数据和自定义模型的加密密钥,让客户能够更好地控制在 Azure OpenAI 服务中管理其数据。 客户管理的密钥 (CMK)(也称为创建自己的密钥,BYOK)在创建、轮换、禁用和撤销访问控制方面可提供更大的灵活性。 此外,你还可以审核用于保护数据的加密密钥。 有关详细信息,请参阅静态加密文档。
密码箱支持
SOC-2 符合性
通过 Azure 资源运行状况、成本分析以及指标和诊断设置进行日志记录和诊断。
工作室改进。 对工作室工作流进行了大量可用性改进,包括 Azure AD 角色支持,可以控制团队中的哪个成员有权创建微调的模型和部署。
变更(中断性)
微调创建 API 请求已更新,以匹配 OpenAI 的架构。
预览 API 版本:
{
"training_file": "file-XGinujblHPwGLSztz8cPS8XY",
"hyperparams": {
"batch_size": 4,
"learning_rate_multiplier": 0.1,
"n_epochs": 4,
"prompt_loss_weight": 0.1,
}
}
API version 2022-12-01:
{
"training_file": "file-XGinujblHPwGLSztz8cPS8XY",
"batch_size": 4,
"learning_rate_multiplier": 0.1,
"n_epochs": 4,
"prompt_loss_weight": 0.1,
}
默认情况下,内容筛选暂时处于关闭状态。 Azure 内容审核的工作方式与 OpenAI 不同。 Azure OpenAI 在生成调用期间运行内容筛选器,以检测有害或滥用的内容,并从响应中筛选它们。 了解详细信息
这些模型将在 2023 年第 1 季度重新启用,并默认开启。
客户操作
- 如果想要为订阅启用这些设置,请联系 Azure 支持。
- 如果想要让它们保持关闭状态,请申请筛选修改。 (此选项仅适用于低风险用例。)