AksServiceDeploymentConfiguration 类

表示部署在 Azure Kubernetes 服务上的服务的部署配置信息。

使用 AksWebservice 类的 deploy_configuration 方法创建 AksServiceDeploymentConfiguration 对象。

初始化要部署到 AKS 计算目标的配置对象。

继承
AksServiceDeploymentConfiguration

构造函数

AksServiceDeploymentConfiguration(autoscale_enabled, autoscale_min_replicas, autoscale_max_replicas, autoscale_refresh_seconds, autoscale_target_utilization, collect_model_data, auth_enabled, cpu_cores, memory_gb, enable_app_insights, scoring_timeout_ms, replica_max_concurrent_requests, max_request_wait_time, num_replicas, primary_key, secondary_key, tags, properties, description, gpu_cores, period_seconds, initial_delay_seconds, timeout_seconds, success_threshold, failure_threshold, namespace, token_auth_enabled, compute_target_name, cpu_cores_limit, memory_gb_limit, blobfuse_enabled=None)

参数

cpu_cores_limit
必需

允许此 Webservice 使用的最大 CPU 核心数。 可以是小数。

memory_gb_limit
必需

允许此 Webservice 使用的最大内存量 (GB)。 可以是小数。

autoscale_enabled
bool
必需

指示是否为此 Webservice 启用自动缩放。 如果 num_replicas 为 None,则默认值为 True。

autoscale_min_replicas
int
必需

自动缩放此 Webservice 时要使用的容器的最小数目。 默认值为 1。

autoscale_max_replicas
int
必需

自动缩放此 Webservice 时要使用的容器的最大数目。 默认值为 10

autoscale_refresh_seconds
int
必需

自动缩放程序应尝试缩放此 Webservice 的频率。 默认值为 1。

autoscale_target_utilization
int
必需

自动缩放程序应尝试维持此 Webservice 的目标利用率(以低于 100 的百分比表示)。 默认值为 70。

collect_model_data
bool
必需

是否为此 Webservice 启用模型数据收集。 默认为 False。

auth_enabled
bool
必需

是否为此 Webservice 启用身份验证。 默认为 True。

cpu_cores
float
必需

要分配给此 Webservice 的 CPU 核心数。 可以是小数。 默认值为 0.1

memory_gb
float
必需

为此 Webservice 分配的内存量 (GB)。 可以是小数。 默认值为 0.5

enable_app_insights
bool
必需

是否为此 Webservice 启用 Application Insights 日志记录。 默认为 False

scoring_timeout_ms
int
必需

对此 Webservice 的评分调用强制执行的超时时间。 默认值为 60000。

replica_max_concurrent_requests
int
必需

允许用于此 Webservice 的每个副本的最大并发请求数。 默认值为 1。 除非获得 Microsoft 技术支持人员或 Azure 机器学习团队成员的指导,否则不要更改此设置的默认值 1。

max_request_wait_time
int
必需

在返回 503 错误之前,请求将在队列中停留的最长时间(以毫秒为单位)。 默认为 500。

num_replicas
int
必需

要分配给此 Webservice 的容器数量。 无默认值,如果未设置此参数,则默认启用自动缩放程序。

primary_key
str
必需

要用于此 Webservice 的主要身份验证密钥。

secondary_key
str
必需

要用于此 Webservice 的辅助身份验证密钥。

tags
dict[str, str]
必需

为此 Webservice 指定的键值标记字典。

properties
dict[str, str]
必需

提供此 Webservice 的键值属性的字典。 这些属性在部署后无法更改,但是可以添加新的键值对。

description
str
必需

提供此 Webservice 的说明。

gpu_cores
int
必需

要分配给此 Web 服务的 GPU 核心数。 默认值为 0。

period_seconds
int
必需

执行运行情况探测的频率(秒)。 默认值为 10 秒。 最小值为 1。

initial_delay_seconds
int
必需

启动容器后,启动运行情况探测前的秒数。 默认值为 310。

timeout_seconds
int
必需

运行情况探测超时前等待的秒数。默认值为 2 秒。 最小值为 1。

success_threshold
int
必需

运行情况探测失败后,将其视为成功所需的最小连续成功次数。 默认值为 1。 最小值为 1。

failure_threshold
int
必需

当 Pod 启动而运行情况探测失败时,Kubernetes 将尝试 failureThreshold 次才会放弃。 默认值为 3。 最小值为 1。

namespace
str
必需

要在其中部署此 Web 服务的 Kubernetes 命名空间:最多 63 个小写字母数字(“a”-“z”、“0”-“9”)和连字符(“-”)。 第一个和最后一个字符不能为连字符。

token_auth_enabled
bool
必需

是否为此 Webservice 启用 Azure Active Directory 身份验证。 如果启用此功能,则用户可以通过使用其 Azure Active Directory 凭据提取访问令牌来访问此 Webservice。 默认为 False。

cpu_cores_limit
必需

允许此 Webservice 使用的最大 CPU 核心数。 可以是小数。

memory_gb_limit
必需

允许此 Webservice 使用的最大内存量 (GB)。 可以是小数。

blobfuse_enabled
bool
默认值: None

是否为此 Webservice 启用 blobfuse 模型下载。 默认为 True

autoscale_enabled
bool
必需

指示是否为此 Webservice 启用自动缩放。 如果 num_replicas 为 None,则默认值为 True。

autoscale_min_replicas
int
必需

自动缩放此 Webservice 时要使用的容器的最小数目。 默认值为 1。

autoscale_max_replicas
int
必需

自动缩放此 Webservice 时要使用的容器的最大数目。 默认值为 10

autoscale_refresh_seconds
int
必需

自动缩放程序应尝试缩放此 Webservice 的频率。 默认值为 1。

autoscale_target_utilization
int
必需

自动缩放程序应尝试维持此 Webservice 的目标利用率(以低于 100 的百分比表示)。 默认值为 70。

collect_model_data
bool
必需

是否为此 Webservice 启用模型数据收集。 默认为 False。

auth_enabled
bool
必需

是否为此 Webservice 启用身份验证。 默认为 True。

cpu_cores
float
必需

要分配给此 Webservice 的 CPU 核心数。 可以是小数。 默认值为 0.1

memory_gb
float
必需

为此 Webservice 分配的内存量 (GB)。 可以是小数。 默认值为 0.5

enable_app_insights
bool
必需

是否为此 Webservice 启用 Application Insights 日志记录。 默认为 False

scoring_timeout_ms
int
必需

对此 Webservice 的评分调用强制执行的超时时间。 默认值为 60000。

replica_max_concurrent_requests
int
必需

允许用于此 Webservice 的每个副本的最大并发请求数。 默认值为 1。 除非获得 Microsoft 技术支持人员或 Azure 机器学习团队成员的指导,否则不要更改此设置的默认值 1。

max_request_wait_time
int
必需

在返回 503 错误之前,请求将在队列中停留的最长时间(以毫秒为单位)。 默认为 500。

num_replicas
int
必需

要分配给此 Webservice 的容器数量。 无默认值,如果未设置此参数,则默认启用自动缩放程序。

primary_key
str
必需

要用于此 Webservice 的主要身份验证密钥。

secondary_key
str
必需

要用于此 Webservice 的辅助身份验证密钥。

tags
dict[str, str]
必需

为此 Webservice 指定的键值标记字典。

properties
dict[str, str]
必需

提供此 Webservice 的键值属性的字典。 这些属性在部署后无法更改,但是可以添加新的键值对。

description
str
必需

提供此 Webservice 的说明。

gpu_cores
int
必需

要分配给此 Web 服务的 GPU 核心数。 默认值为 0。

period_seconds
int
必需

执行运行情况探测的频率(秒)。 默认值为 10 秒。 最小值为 1。

initial_delay_seconds
int
必需

启动容器后,启动运行情况探测前的秒数。 默认值为 310。

timeout_seconds
int
必需

运行情况探测超时前等待的秒数。默认值为 2 秒。 最小值为 1。

success_threshold
int
必需

运行情况探测失败后,将其视为成功所需的最小连续成功次数。 默认值为 1。 最小值为 1。

failure_threshold
int
必需

当 Pod 启动而运行情况探测失败时,Kubernetes 将尝试 failureThreshold 次才会放弃。 默认值为 3。 最小值为 1。

namespace
str
必需

要在其中部署此 Web 服务的 Kubernetes 命名空间:最多 63 个小写字母数字(“a”-“z”、“0”-“9”)和连字符(“-”)。 第一个和最后一个字符不能为连字符。

token_auth_enabled
bool
必需

是否为此 Webservice 启用 Azure Active Directory 身份验证。 如果启用此功能,则用户可以通过使用其 Azure Active Directory 凭据提取访问令牌来访问此 Webservice。 默认为 False。

compute_target_name
str
必需

要部署到的计算目标的名称

cpu_cores_limit
float
必需

允许此 Webservice 使用的最大 CPU 核心数。 可以是小数。

memory_gb_limit
float
必需

允许此 Webservice 使用的最大内存量 (GB)。 可以是小数。

blobfuse_enabled
bool
必需

是否为此 Webservice 启用 blobfuse 模型下载。 默认为 True

变量

autoscale_enabled
bool

指示是否为此 Webservice 启用自动缩放。 如果 num_replicas 为 None,则默认值为 True。

autoscale_min_replicas
int

自动缩放此 Webservice 时要使用的容器的最小数目。 默认值为 1。

autoscale_max_replicas
int

自动缩放此 Webservice 时要使用的容器的最大数目。 默认值为 10

autoscale_refresh_seconds
int

自动缩放程序应尝试缩放此 Webservice 的频率。 默认值为 1。

autoscale_target_utilization
int

自动缩放程序应尝试维持此 Webservice 的目标利用率(以低于 100 的百分比表示)。 默认值为 70。

collect_model_data
bool

是否为此 Webservice 启用模型数据收集。 默认为 False。

auth_enabled
bool

是否为此 Webservice 启用身份验证。 默认为 True。

cpu_cores
float

要分配给此 Webservice 的 CPU 核心数。 可以是小数。 默认值为 0.1

memory_gb
float

为此 Webservice 分配的内存量 (GB)。 可以是小数。 默认值为 0.5

enable_app_insights
bool

是否为此 Webservice 启用 Application Insights 日志记录。 默认为 False

scoring_timeout_ms
int

对此 Webservice 的评分调用强制执行的超时时间。 默认值为 60000。

replica_max_concurrent_requests
int

允许用于此 Webservice 的每个副本的最大并发请求数。 默认值为 1。 除非获得 Microsoft 技术支持人员或 Azure 机器学习团队成员的指导,否则不要更改此设置的默认值 1。

max_request_wait_time
int

在返回 503 错误之前,请求将在队列中停留的最长时间(以毫秒为单位)。 默认为 500。

num_replicas
int

要分配给此 Webservice 的容器数量。 无默认值,如果未设置此参数,则默认启用自动缩放程序。

primary_key
str

要用于此 Webservice 的主要身份验证密钥。

secondary_key
str

要用于此 Webservice 的辅助身份验证密钥。

azureml.core.webservice.AksServiceDeploymentConfiguration.tags

为此 Webservice 指定的键值标记字典。

azureml.core.webservice.AksServiceDeploymentConfiguration.properties

提供此 Webservice 的键值属性的字典。 这些属性在部署后无法更改,但是可以添加新的键值对。

azureml.core.webservice.AksServiceDeploymentConfiguration.description

提供此 Webservice 的说明。

gpu_cores
int

要分配给此 Web 服务的 GPU 核心数。 默认值为 0。

period_seconds
int

执行运行情况探测的频率(秒)。 默认值为 10 秒。 最小值为 1。

initial_delay_seconds
int

启动容器后,启动运行情况探测前的秒数。 默认值为 310。

timeout_seconds
int

运行情况探测超时前等待的秒数。默认值为 2 秒。 最小值为 1。

success_threshold
int

运行情况探测失败后,将其视为成功所需的最小连续成功次数。 默认值为 1。 最小值为 1。

failure_threshold
int

当 Pod 启动而运行情况探测失败时,Kubernetes 将尝试 failureThreshold 次才会放弃。 默认值为 3。 最小值为 1。

azureml.core.webservice.AksServiceDeploymentConfiguration.namespace

要在其中部署此 Web 服务的 Kubernetes 命名空间:最多 63 个小写字母数字(“a”-“z”、“0”-“9”)和连字符(“-”)。 第一个和最后一个字符不能为连字符。

token_auth_enabled
bool

是否为此 Webservice 启用 Azure Active Directory 身份验证。 如果启用此功能,则用户可以通过使用其 Azure Active Directory 凭据提取访问令牌来访问此 Webservice。 默认为 False。

方法

print_deploy_configuration

打印部署配置。

validate_configuration

检查指定的配置值是否有效。

如果验证失败,将引发 WebserviceException。

print_deploy_configuration

打印部署配置。

print_deploy_configuration()

validate_configuration

检查指定的配置值是否有效。

如果验证失败,将引发 WebserviceException。

validate_configuration()

例外