你当前正在访问 Microsoft Azure Global Edition 技术文档网站。 如果需要访问由世纪互联运营的 Microsoft Azure 中国技术文档网站,请访问 https://docs.azure.cn

Azure OpenAI 部署类型

Azure OpenAI 为客户提供了适合其业务和使用模式的托管结构选择。 该服务提供两种主要部署类型:标准和预配。 标准提供全球部署选项,全球路由流量以提供更高的吞吐量。 所有部署都可以执行完全相同的推理操作,但计费、规模和性能却大不相同。 作为解决方案设计的一部分,需要做出两个关键决策:

  • 数据驻留需求:全球资源与区域资源
  • 调用量:标准与预配

全球部署类型与区域部署类型

对于标准部署,可以在资源 - 全球或资源 - 区域中选择两种类型的配置。 全球标准是开发和试验的推荐起点。 全球部署利用 Azure 的全球基础结构,将客户流量动态路由到可用性最好的数据中心,以满足客户的推理请求。 全球部署的初始吞吐量限制较高,但延迟可能因使用率较高而有所不同。 对于在大型工作负荷使用量上需要较小的延迟差异的客户,我们建议购买预配的吞吐量。

我们的全球部署将是所有新模型和功能的首发地。 吞吐量要求极大的客户应考虑我们的预配部署服务。

部署类型

Azure OpenAI 提供三种类型的部署。 它们提供各种级别的功能,可在吞吐量、SLA 和价格方面进行权衡。 下面是选项的摘要,后跟每个选项的深入介绍。

产品/服务 全球标准1 标准 已预配
最适用于 不需要数据驻留的应用程序。 建议的客户起点。 针对有数据驻留需求的客户。 针对低到中等流量进行了优化。 适用于稳定大流量的实时评分。 包含最高的承诺使用量和限制。
工作原理 流量可以路由到世界上任何地方
入门 模型部署 模型部署 预配加入
成本 基线 区域定价 稳定使用可节省成本
提供的服务 轻松访问具有最高默认按调用付费限制的所有新模型。

使用量较高的客户可能会遇到更大的延迟变化
使用可用性 SLA 轻松访问。 针对低到中等流量、高突发性的工作负荷进行了优化。

具有稳定大流量的客户可能会遇到更大的延迟变化。
具有非常高且可预测的吞吐量的区域访问。 使用提供的容量计算器确定每个 PTU 的吞吐量
无法提供 ❌数据驻留保证 ❌高流量及稳定低延迟 ❌按调用付费的灵活性
每次调用的延迟 针对实时调用和低到中等流量使用量进行了优化。 使用量较高的客户可能会遇到更大的延迟变化。 每个模型设置的阈值 针对实时调用和低到中等流量使用量进行了优化。 使用量较高的客户可能会遇到更大的延迟变化。 每个模型设置的阈值 针对实时进行了优化。
代码中的 SKU 名称 GlobalStandard Standard ProvisionedManaged
计费模式 按令牌付费 按令牌付费 每月承诺使用量

1 全球标准部署类型目前为预览版。

已预配

借助预配的部署,可以指定部署中需要的吞吐量。 然后该服务会分配必要的模型处理容量,并确保随时可用。 吞吐量是根据预配的吞吐量单位 (PTU) 定义的,是表示部署吞吐量的规范化方式。 每个模型版本对需要不同的 PTU 量来部署,并提供不同的每 PTU 吞吐量。 从我们的预配吞吐量概念文章中了解详细信息。

Standard

标准部署针对所选模型提供按调用付费的计费模型。 提供最快速的入门方法,因为只需为使用的内容付费。 每个区域中可用的模型以及吞吐量可能很有限。

标准部署针对低到中等流量、高突发性的工作负荷进行优化。 具有稳定大流量的客户可能会遇到更大的延迟变化。

全球标准(预览版)

全球部署可在与非全球服务相同的 Azure OpenAI 资源中使用,但可以利用 Azure 的全球基础结构将流量动态路由到可为每个请求提供最佳可用性的数据中心。 全球标准将为新模型提供最高的默认配额,并且无需跨多个资源进行负载均衡。

该部署类型针对低到中等流量、高突发性的工作负荷进行了优化。 具有稳定大流量的客户可能会遇到更大的延迟变化。 为每个模型设置阈值。 有关详细信息,请参阅“配额”页

对于在大型工作负荷使用量上需要较小的延迟差异的客户,我们建议购买预配的吞吐量。

如何禁用对订阅中的全球部署的访问权限

Azure Policy 可帮助实施组织标准并大规模评估合规性。 Azure Policy 通过其合规性仪表板提供一个聚合视图来评估环境的整体状态,并允许用户按资源、按策略粒度向下钻取。 它还通过对现有资源的批量修正以及对新资源的自动修正,帮助资源符合规范。 详细了解 Azure Policy 和 AI 服务的特定内置控件

可以使用以下策略来禁用对 Azure OpenAI 全球标准部署的访问。

{
    "mode": "All",
    "policyRule": {
        "if": {
            "allOf": [
                {
                    "field": "type",
                    "equals": "Microsoft.CognitiveServices/accounts/deployments"
                },
                {
                    "field": "Microsoft.CognitiveServices/accounts/deployments/sku.name",
                    "equals": "GlobalStandard"
                }
            ]
        }
    }
}

部署模型

显示 Azure OpenAI Studio 中模型部署对话的屏幕截图,其中突出显示了三种部署类型。

若要了解如何创建资源和部署模型,请参阅资源创建指南

另请参阅