AksEndpoint 类
注意
这是一个试验性的类,随时可能更改。 有关详细信息,请参阅 https://aka.ms/azuremlexperimental。
表示在 Azure Kubernetes 服务上运行的同一终结点后面的 Web 服务版本的集合。
虽然 AksWebservice 使用一个评分终结点来部署一个服务,但 AksEndpoint 类可让你在同一评分终结点后面部署多个 Web 服务版本。 可以将每个 Web 服务版本配置为提供一定百分比的流量,以便以受控方式部署模型,例如用于 A/B 测试。 AksEndpoint 允许从类似于 AksWebservice 的模型对象进行部署。
初始化 Web 服务实例。
Webservice 构造函数检索与提供的工作区关联的 Webservice 对象的云表示形式。 它将返回与检索到的 Webservice 对象的特定类型对应的子类的实例。
- 继承
-
AksEndpoint
构造函数
AksEndpoint(workspace, name)
参数
变量
- versions
- dict[str, AksWebservice]
版本名称和版本对象对的字典。 包含部署为此终结点的一部分的所有版本。
方法
create_version |
使用提供的属性在终结点中添加新版本。 |
delete_version |
删除终结点中的版本。 |
deploy_configuration |
创建配置对象以部署到 AKS 计算目标。 |
serialize |
将此 Web 服务对象转换为 JSON 序列化字典。 |
update |
使用提供的属性更新终结点。 在此终结点中,保留为 None 的值将保持不变 |
update_version |
使用提供的属性更新终结点中的现有版本。 在此版本中,保留为 None 的值将保持不变。 |
create_version
使用提供的属性在终结点中添加新版本。
create_version(version_name, autoscale_enabled=None, autoscale_min_replicas=None, autoscale_max_replicas=None, autoscale_refresh_seconds=None, autoscale_target_utilization=None, collect_model_data=None, cpu_cores=None, memory_gb=None, scoring_timeout_ms=None, replica_max_concurrent_requests=None, max_request_wait_time=None, num_replicas=None, tags=None, properties=None, description=None, models=None, inference_config=None, gpu_cores=None, period_seconds=None, initial_delay_seconds=None, timeout_seconds=None, success_threshold=None, failure_threshold=None, traffic_percentile=None, is_default=None, is_control_version_type=None, cpu_cores_limit=None, memory_gb_limit=None)
参数
- replica_max_concurrent_requests
- int
允许对终结点中此版本使用的每个副本的最大并发请求数。 默认值为 1。 除非获得 Microsoft 技术支持人员或 Azure 机器学习团队成员的指导,否则不要更改此设置的默认值 1。
- failure_threshold
- int
当 Pod 启动而运行情况探测失败时,Kubernetes 将尝试 failureThreshold 次才会放弃。 默认值为 3。 最小值为 1。
例外
delete_version
删除终结点中的版本。
delete_version(version_name)
参数
例外
deploy_configuration
创建配置对象以部署到 AKS 计算目标。
static deploy_configuration(autoscale_enabled=None, autoscale_min_replicas=None, autoscale_max_replicas=None, autoscale_refresh_seconds=None, autoscale_target_utilization=None, collect_model_data=None, auth_enabled=None, cpu_cores=None, memory_gb=None, enable_app_insights=None, scoring_timeout_ms=None, replica_max_concurrent_requests=None, max_request_wait_time=None, num_replicas=None, primary_key=None, secondary_key=None, tags=None, properties=None, description=None, gpu_cores=None, period_seconds=None, initial_delay_seconds=None, timeout_seconds=None, success_threshold=None, failure_threshold=None, namespace=None, token_auth_enabled=None, version_name=None, traffic_percentile=None, compute_target_name=None, cpu_cores_limit=None, memory_gb_limit=None)
参数
- replica_max_concurrent_requests
- int
允许对终结点中此版本使用的每个副本的最大并发请求数。 默认值为 1。 除非获得 Microsoft 技术支持人员或 Azure 机器学习团队成员的指导,否则不要更改此设置的默认值 1。
- failure_threshold
- int
当 Pod 启动而运行情况探测失败时,Kubernetes 将尝试 failureThreshold
次才会放弃。 默认值为 3。 最小值为 1。
- namespace
- str
要在其中部署此终结点的 Kubernetes 命名空间:最多 63 个小写字母数字(“a”-“z”、“0”-“9”)和连字符(“-”)。 第一个和最后一个字符不能为连字符。
- token_auth_enabled
- bool
是否为此终结点启用令牌身份验证。 如果启用此功能,则用户可以通过使用使用其 Azure Active Directory 凭据提取访问令牌来访问此终结点。 默认为 False。
返回类型
例外
serialize
update
使用提供的属性更新终结点。
在此终结点中,保留为 None 的值将保持不变
update(auth_enabled=None, token_auth_enabled=None, enable_app_insights=None, description=None, tags=None, properties=None)
参数
- token_auth_enabled
- bool
是否为此终结点启用令牌身份验证。 如果启用此功能,则用户可以通过使用使用其 Azure Active Directory 凭据提取访问令牌来访问此终结点。 默认为 False。
例外
update_version
使用提供的属性更新终结点中的现有版本。
在此版本中,保留为 None 的值将保持不变。
update_version(version_name, autoscale_enabled=None, autoscale_min_replicas=None, autoscale_max_replicas=None, autoscale_refresh_seconds=None, autoscale_target_utilization=None, collect_model_data=None, cpu_cores=None, memory_gb=None, scoring_timeout_ms=None, replica_max_concurrent_requests=None, max_request_wait_time=None, num_replicas=None, tags=None, properties=None, description=None, models=None, inference_config=None, gpu_cores=None, period_seconds=None, initial_delay_seconds=None, timeout_seconds=None, success_threshold=None, failure_threshold=None, traffic_percentile=None, is_default=None, is_control_version_type=None, cpu_cores_limit=None, memory_gb_limit=None)
参数
- replica_max_concurrent_requests
- int
允许对终结点中此版本使用的每个副本的最大并发请求数。 默认值为 1。 除非获得 Microsoft 技术支持人员或 Azure 机器学习团队成员的指导,否则不要更改此设置的默认值 1。
- failure_threshold
- int
当 Pod 启动而运行情况探测失败时,Kubernetes 将尝试 failureThreshold 次才会放弃。 默认值为 3。 最小值为 1。
例外
反馈
https://aka.ms/ContentUserFeedback。
即将发布:在整个 2024 年,我们将逐步淘汰作为内容反馈机制的“GitHub 问题”,并将其取代为新的反馈系统。 有关详细信息,请参阅:提交和查看相关反馈