다음을 통해 공유


Online Deployments - List

유추 엔드포인트 배포를 나열합니다.

GET https://management.azure.com/subscriptions/{subscriptionId}/resourceGroups/{resourceGroupName}/providers/Microsoft.MachineLearningServices/workspaces/{workspaceName}/onlineEndpoints/{endpointName}/deployments?api-version=2024-04-01
GET https://management.azure.com/subscriptions/{subscriptionId}/resourceGroups/{resourceGroupName}/providers/Microsoft.MachineLearningServices/workspaces/{workspaceName}/onlineEndpoints/{endpointName}/deployments?api-version=2024-04-01&$orderBy={$orderBy}&$top={$top}&$skip={$skip}

URI 매개 변수

Name In(다음 안에) 필수 형식 Description
endpointName
path True

string

유추 엔드포인트 이름입니다.

resourceGroupName
path True

string

리소스 그룹의 이름입니다. 이름은 대/소문자를 구분하지 않습니다.

subscriptionId
path True

string

대상 구독의 ID입니다.

workspaceName
path True

string

Azure Machine Learning 작업 영역의 이름입니다.

regex 패턴: ^[a-zA-Z0-9][a-zA-Z0-9_-]{2,32}$

api-version
query True

string

이 작업에 사용할 API 버전입니다.

$orderBy
query

string

목록의 순서입니다.

$skip
query

string

페이지 매김에 대한 연속 토큰입니다.

$top
query

integer

int32

목록의 맨 위입니다.

응답

Name 형식 Description
200 OK

OnlineDeploymentTrackedResourceArmPaginatedResult

성공

Other Status Codes

ErrorResponse

오류

예제

List Online Deployments.

샘플 요청

GET https://management.azure.com/subscriptions/00000000-1111-2222-3333-444444444444/resourceGroups/test-rg/providers/Microsoft.MachineLearningServices/workspaces/my-aml-workspace/onlineEndpoints/testEndpointName/deployments?api-version=2024-04-01&$orderBy=string&$top=1

샘플 응답

{
  "value": [
    {
      "id": "string",
      "name": "string",
      "type": "string",
      "properties": {
        "description": "string",
        "properties": {
          "string": "string"
        },
        "codeConfiguration": {
          "codeId": "string",
          "scoringScript": "string"
        },
        "environmentId": "string",
        "environmentVariables": {
          "string": "string"
        },
        "scaleSettings": {
          "scaleType": "Default"
        },
        "requestSettings": {
          "maxQueueWait": "PT5M",
          "requestTimeout": "PT5M",
          "maxConcurrentRequestsPerInstance": 1
        },
        "modelMountPath": "string",
        "appInsightsEnabled": false,
        "livenessProbe": {
          "failureThreshold": 1,
          "successThreshold": 1,
          "timeout": "PT5M",
          "period": "PT5M",
          "initialDelay": "PT5M"
        },
        "provisioningState": "Creating",
        "instanceType": "string",
        "model": "string",
        "endpointComputeType": "Kubernetes",
        "containerResourceRequirements": {
          "containerResourceRequests": {
            "cpu": "\"1\"",
            "memory": "\"2Gi\"",
            "gpu": "\"1\""
          },
          "containerResourceLimits": {
            "cpu": "\"1\"",
            "memory": "\"2Gi\"",
            "gpu": "\"1\""
          }
        }
      },
      "systemData": {
        "createdAt": "2020-01-01T12:34:56.999Z",
        "createdBy": "string",
        "createdByType": "User",
        "lastModifiedAt": "2020-01-01T12:34:56.999Z",
        "lastModifiedBy": "string",
        "lastModifiedByType": "User"
      },
      "tags": {},
      "location": "string",
      "kind": "string",
      "identity": {
        "type": "SystemAssigned",
        "principalId": "00000000-1111-2222-3333-444444444444",
        "tenantId": "00000000-1111-2222-3333-444444444444",
        "userAssignedIdentities": {
          "string": {
            "principalId": "00000000-1111-2222-3333-444444444444",
            "clientId": "00000000-1111-2222-3333-444444444444"
          }
        }
      },
      "sku": {
        "name": "string",
        "tier": "Free",
        "size": "string",
        "family": "string",
        "capacity": 1
      }
    }
  ],
  "nextLink": "string"
}

정의

Name Description
CodeConfiguration

점수 매기기 코드 자산에 대한 구성입니다.

Collection
ContainerResourceRequirements

온라인 배포 내의 각 컨테이너 인스턴스에 대한 리소스 요구 사항입니다.

ContainerResourceSettings
createdByType

리소스를 만든 ID의 형식입니다.

DataCollectionMode
DataCollector
DefaultScaleSettings
DeploymentProvisioningState

DeploymentProvisioningState에 사용할 수 있는 값입니다.

EgressPublicNetworkAccessType

배포 송신을 위해 PublicNetworkAccess가 사용 또는 사용 안 함인지 확인하는 열거형입니다.

EndpointComputeType

엔드포인트 컴퓨팅 유형을 결정하는 열거형입니다.

ErrorAdditionalInfo

리소스 관리 오류 추가 정보입니다.

ErrorDetail

오류 세부 정보입니다.

ErrorResponse

오류 응답

KubernetesOnlineDeployment

KubernetesOnlineDeployment와 관련된 속성입니다.

ManagedOnlineDeployment

ManagedOnlineDeployment와 관련된 속성입니다.

ManagedServiceIdentity

관리 서비스 ID(시스템 할당 및/또는 사용자 할당 ID)

ManagedServiceIdentityType

관리 서비스 ID의 유형입니다(SystemAssigned 및 UserAssigned 형식이 모두 허용되는 경우).

OnlineDeploymentTrackedResource
OnlineDeploymentTrackedResourceArmPaginatedResult

페이지를 매긴 OnlineDeployment 엔터티 목록입니다.

OnlineRequestSettings

온라인 배포 점수 매기기 요청 구성

ProbeSettings

배포 컨테이너 활동성/준비 상태 프로브 구성.

RequestLogging
RollingRateType
ScaleType
Sku

SKU를 나타내는 리소스 모델 정의

SkuTier

이 필드는 서비스에 둘 이상의 계층이 있지만 PUT에는 필요하지 않은 경우 리소스 공급자가 구현해야 합니다.

systemData

리소스의 생성 및 마지막 수정과 관련된 메타데이터입니다.

TargetUtilizationScaleSettings
UserAssignedIdentity

사용자 할당 ID 속성

CodeConfiguration

점수 매기기 코드 자산에 대한 구성입니다.

Name 형식 Description
codeId

string

코드 자산의 ARM 리소스 ID입니다.

scoringScript

string

[필수] 시작할 때 실행할 스크립트입니다. 예. "score.py"

Collection

Name 형식 Default value Description
clientId

string

Blob Storage에 대한 로깅을 수집하는 데 사용되는 msi 클라이언트 ID입니다. null인 경우 백 엔드는 인증할 등록된 엔드포인트 ID를 선택합니다.

dataCollectionMode

DataCollectionMode

Disabled

데이터 수집을 사용하거나 사용하지 않도록 설정합니다.

dataId

string

데이터 자산 arm 리소스 ID입니다. 클라이언트 쪽에서는 데이터 자산이 Blob Storage를 가리키도록 하고 백 엔드는 Blob Storage에 데이터를 수집합니다.

samplingRate

number

1

컬렉션에 대한 샘플링 속도입니다. 샘플링 속도 1.0은 기본적으로 100% 데이터를 수집한다는 것을 의미합니다.

ContainerResourceRequirements

온라인 배포 내의 각 컨테이너 인스턴스에 대한 리소스 요구 사항입니다.

Name 형식 Description
containerResourceLimits

ContainerResourceSettings

컨테이너 리소스 제한 정보:

containerResourceRequests

ContainerResourceSettings

컨테이너 리소스 요청 정보:

ContainerResourceSettings

Name 형식 Description
cpu

string

컨테이너에 대한 vCPU 요청/제한 수입니다. 추가 정보: https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/

gpu

string

컨테이너에 대한 Nvidia GPU 카드 요청/제한 수입니다. 추가 정보: https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/

memory

string

컨테이너에 대한 메모리 크기 요청/제한입니다. 추가 정보: https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/

createdByType

리소스를 만든 ID의 형식입니다.

Name 형식 Description
Application

string

Key

string

ManagedIdentity

string

User

string

DataCollectionMode

Name 형식 Description
Disabled

string

Enabled

string

DataCollector

Name 형식 Default value Description
collections

<string,  Collection>

[필수] 컬렉션 구성입니다. 각 컬렉션에는 모델 데이터를 수집하기 위한 자체 구성이 있으며 컬렉션 이름은 임의의 문자열일 수 있습니다. 모델 데이터 수집기는 페이로드 로깅 또는 사용자 지정 로깅 또는 둘 다에 사용할 수 있습니다. 컬렉션 요청 및 응답은 페이로드 로깅을 위해 예약되고, 다른 요청은 사용자 지정 로깅용입니다.

requestLogging

RequestLogging

mdc에 대한 요청 로깅 구성에는 모든 컬렉션에 대한 고급 로깅 설정이 포함됩니다. 선택 사항입니다.

rollingRate

RollingRateType

Hour

모델 데이터가 Blob Storage에 수집되는 경우 단일 Blob 파일에서 모든 데이터를 로깅하지 않도록 데이터를 다른 경로로 롤백해야 합니다. 롤링 속도가 시간인 경우 모든 데이터가 Blob 경로 /yyyy/MM/dd/HH/에 수집됩니다. 날짜인 경우 모든 데이터가 Blob 경로 /yyyy/MM/dd/에서 수집됩니다. 롤링 경로의 다른 이점은 모델 모니터링 UI가 데이터의 시간 범위를 매우 빠르게 선택할 수 있다는 것입니다.

DefaultScaleSettings

Name 형식 Description
scaleType string:

Default

[필수] 배포 크기 조정 알고리즘의 유형

DeploymentProvisioningState

DeploymentProvisioningState에 사용할 수 있는 값입니다.

Name 형식 Description
Canceled

string

Creating

string

Deleting

string

Failed

string

Scaling

string

Succeeded

string

Updating

string

EgressPublicNetworkAccessType

배포 송신을 위해 PublicNetworkAccess가 사용 또는 사용 안 함인지 확인하는 열거형입니다.

Name 형식 Description
Disabled

string

Enabled

string

EndpointComputeType

엔드포인트 컴퓨팅 유형을 결정하는 열거형입니다.

Name 형식 Description
AzureMLCompute

string

Kubernetes

string

Managed

string

ErrorAdditionalInfo

리소스 관리 오류 추가 정보입니다.

Name 형식 Description
info

object

추가 정보입니다.

type

string

추가 정보 유형입니다.

ErrorDetail

오류 세부 정보입니다.

Name 형식 Description
additionalInfo

ErrorAdditionalInfo[]

오류 추가 정보입니다.

code

string

오류 코드입니다.

details

ErrorDetail[]

오류 세부 정보입니다.

message

string

오류 메시지입니다.

target

string

오류 대상입니다.

ErrorResponse

오류 응답

Name 형식 Description
error

ErrorDetail

오류 개체입니다.

KubernetesOnlineDeployment

KubernetesOnlineDeployment와 관련된 속성입니다.

Name 형식 Default value Description
appInsightsEnabled

boolean

False

true이면 Application Insights 로깅을 사용하도록 설정합니다.

codeConfiguration

CodeConfiguration

엔드포인트 배포에 대한 코드 구성입니다.

containerResourceRequirements

ContainerResourceRequirements

컨테이너(cpu 및 메모리)에 대한 리소스 요구 사항입니다.

dataCollector

DataCollector

mdc 구성은 null일 때 mdc를 사용하지 않도록 설정합니다.

description

string

엔드포인트 배포에 대한 설명입니다.

egressPublicNetworkAccess

EgressPublicNetworkAccessType

Enabled

사용하도록 설정된 경우 송신 공용 네트워크 액세스를 허용합니다. 사용하지 않도록 설정하면 보안 송신이 생성됩니다. 기본값: 사용

endpointComputeType string:

Kubernetes

[필수] 엔드포인트의 컴퓨팅 형식입니다.

environmentId

string

엔드포인트 배포에 대한 환경 사양의 ARM 리소스 ID 또는 AssetId입니다.

environmentVariables

object

배포에 대한 환경 변수 구성입니다.

instanceType

string

컴퓨팅 인스턴스 유형입니다.

livenessProbe

ProbeSettings

활동성 프로브는 컨테이너의 상태를 정기적으로 모니터링합니다.

model

string

모델의 URI 경로입니다.

modelMountPath

string

사용자 지정 컨테이너에 모델을 탑재할 경로입니다.

properties

object

속성 사전입니다. 속성을 추가할 수 있지만 제거하거나 변경할 수는 없습니다.

provisioningState

DeploymentProvisioningState

엔드포인트 배포에 대한 프로비전 상태입니다.

readinessProbe

ProbeSettings

준비 상태 프로브는 컨테이너가 트래픽을 처리할 준비가 되었는지 확인합니다. 속성 및 기본값은 활동성 프로브와 동일합니다.

requestSettings

OnlineRequestSettings

배포에 대한 요청 설정입니다.

scaleSettings OnlineScaleSettings:

배포에 대한 크기 조정 설정입니다. null이거나 제공되지 않은 경우 기본적으로 KubernetesOnlineDeployment 및 ManagedOnlineDeployment의 DefaultScaleSettings에 대한 TargetUtilizationScaleSettings로 설정됩니다.

ManagedOnlineDeployment

ManagedOnlineDeployment와 관련된 속성입니다.

Name 형식 Default value Description
appInsightsEnabled

boolean

False

true이면 Application Insights 로깅을 사용하도록 설정합니다.

codeConfiguration

CodeConfiguration

엔드포인트 배포에 대한 코드 구성입니다.

dataCollector

DataCollector

mdc 구성은 null일 때 mdc를 사용하지 않도록 설정합니다.

description

string

엔드포인트 배포에 대한 설명입니다.

egressPublicNetworkAccess

EgressPublicNetworkAccessType

Enabled

사용하도록 설정된 경우 송신 공용 네트워크 액세스를 허용합니다. 사용하지 않도록 설정하면 보안 송신이 생성됩니다. 기본값: 사용

endpointComputeType string:

Managed

[필수] 엔드포인트의 컴퓨팅 형식입니다.

environmentId

string

엔드포인트 배포에 대한 환경 사양의 ARM 리소스 ID 또는 AssetId입니다.

environmentVariables

object

배포에 대한 환경 변수 구성입니다.

instanceType

string

컴퓨팅 인스턴스 유형입니다.

livenessProbe

ProbeSettings

활동성 프로브는 컨테이너의 상태를 정기적으로 모니터링합니다.

model

string

모델의 URI 경로입니다.

modelMountPath

string

사용자 지정 컨테이너에 모델을 탑재할 경로입니다.

properties

object

속성 사전입니다. 속성을 추가할 수 있지만 제거하거나 변경할 수는 없습니다.

provisioningState

DeploymentProvisioningState

엔드포인트 배포에 대한 프로비전 상태입니다.

readinessProbe

ProbeSettings

준비 상태 프로브는 컨테이너가 트래픽을 처리할 준비가 되었는지 확인합니다. 속성 및 기본값은 활동성 프로브와 동일합니다.

requestSettings

OnlineRequestSettings

배포에 대한 요청 설정입니다.

scaleSettings OnlineScaleSettings:

배포에 대한 크기 조정 설정입니다. null이거나 제공되지 않은 경우 기본적으로 KubernetesOnlineDeployment 및 ManagedOnlineDeployment의 DefaultScaleSettings에 대한 TargetUtilizationScaleSettings로 설정됩니다.

ManagedServiceIdentity

관리 서비스 ID(시스템 할당 및/또는 사용자 할당 ID)

Name 형식 Description
principalId

string

시스템 할당 ID의 서비스 주체 ID입니다. 이 속성은 시스템 할당 ID에 대해서만 제공됩니다.

tenantId

string

시스템 할당 ID의 테넌트 ID입니다. 이 속성은 시스템 할당 ID에 대해서만 제공됩니다.

type

ManagedServiceIdentityType

관리 서비스 ID의 유형입니다(SystemAssigned 및 UserAssigned 형식이 모두 허용되는 경우).

userAssignedIdentities

<string,  UserAssignedIdentity>

User-Assigned ID
리소스와 연결된 사용자 할당 ID 집합입니다. userAssignedIdentities 사전 키는 '/subscriptions/{subscriptionId}/resourceGroups/{resourceGroupName}/providers/Microsoft.ManagedIdentity/userAssignedIdentities/{identityName} 형식의 ARM 리소스 ID입니다. 사전 값은 요청에서 빈 개체({})일 수 있습니다.

ManagedServiceIdentityType

관리 서비스 ID의 유형입니다(SystemAssigned 및 UserAssigned 형식이 모두 허용되는 경우).

Name 형식 Description
None

string

SystemAssigned

string

SystemAssigned,UserAssigned

string

UserAssigned

string

OnlineDeploymentTrackedResource

Name 형식 Description
id

string

리소스에 대한 정규화된 리소스 ID입니다. 예 - /subscriptions/{subscriptionId}/resourceGroups/{resourceGroupName}/providers/{resourceProviderNamespace}/{resourceType}/{resourceName}

identity

ManagedServiceIdentity

관리 서비스 ID(시스템 할당 및/또는 사용자 할당 ID)

kind

string

포털/도구/등에서 동일한 형식의 리소스에 대해 다른 UX 환경을 렌더링하는 데 사용되는 메타데이터입니다.

location

string

리소스가 있는 지리적 위치

name

string

리소스의 이름

properties OnlineDeployment:

[필수] 엔터티의 추가 특성입니다.

sku

Sku

자동 크기 조정을 위한 ARM 계약에 필요한 SKU 세부 정보입니다.

systemData

systemData

createdBy 및 modifiedBy 정보가 포함된 Azure Resource Manager 메타데이터입니다.

tags

object

리소스 태그.

type

string

리소스의 형식입니다. 예: "Microsoft.Compute/virtualMachines" 또는 "Microsoft.Storage/storageAccounts"

OnlineDeploymentTrackedResourceArmPaginatedResult

페이지를 매긴 OnlineDeployment 엔터티 목록입니다.

Name 형식 Description
nextLink

string

OnlineDeployment 개체의 다음 페이지에 대한 링크입니다. null이면 추가 페이지가 없습니다.

value

OnlineDeploymentTrackedResource[]

OnlineDeployment 형식의 개체 배열입니다.

OnlineRequestSettings

온라인 배포 점수 매기기 요청 구성

Name 형식 Default value Description
maxConcurrentRequestsPerInstance

integer

1

배포당 허용되는 노드당 최대 동시 요청 수입니다. 기본값은 1입니다.

maxQueueWait

string

PT0.5S

(관리되는 온라인 엔드포인트의 경우 사용되지 않음) 요청이 ISO 8601 형식으로 큐에 유지되는 최대 시간입니다. 기본값은 500ms입니다. (이제 네트워킹/큐 지연을 고려하여 request_timeout_ms 늘리기)

requestTimeout

string

PT5S

ISO 8601 형식의 채점 시간 제한입니다. 기본값은 5000ms입니다.

ProbeSettings

배포 컨테이너 활동성/준비 상태 프로브 구성.

Name 형식 Default value Description
failureThreshold

integer

30

비정상 상태를 반환하기 전에 허용할 실패 횟수입니다.

initialDelay

string

ISO 8601 형식의 첫 번째 프로브 앞의 지연입니다.

period

string

PT10S

ISO 8601 형식의 프로브 간 시간입니다.

successThreshold

integer

1

정상 상태를 반환하기 전에 성공한 프로브의 수입니다.

timeout

string

PT2S

ISO 8601 형식의 프로브 시간 제한입니다.

RequestLogging

Name 형식 Description
captureHeaders

string[]

페이로드 로깅의 경우 기본적으로 페이로드만 수집합니다. 고객이 지정된 헤더를 수집하려는 경우 백 엔드가 페이로드와 함께 해당 헤더를 수집하도록 captureHeaders에서 설정할 수 있습니다.

RollingRateType

Name 형식 Description
Day

string

Hour

string

Minute

string

Month

string

Year

string

ScaleType

Name 형식 Description
Default

string

TargetUtilization

string

Sku

SKU를 나타내는 리소스 모델 정의

Name 형식 Description
capacity

integer

SKU가 스케일 아웃/인을 지원하는 경우 용량 정수가 포함되어야 합니다. 리소스에 대해 스케일 아웃/인이 불가능한 경우 생략할 수 있습니다.

family

string

서비스에 여러 세대의 하드웨어가 있는 경우 동일한 SKU에 대해 여기에서 캡처할 수 있습니다.

name

string

SKU의 이름입니다. 예 - P3. 일반적으로 letter+number 코드입니다.

size

string

SKU 크기입니다. 이름 필드가 계층과 다른 값의 조합인 경우 독립 실행형 코드입니다.

tier

SkuTier

이 필드는 서비스에 둘 이상의 계층이 있지만 PUT에는 필요하지 않은 경우 리소스 공급자가 구현해야 합니다.

SkuTier

이 필드는 서비스에 둘 이상의 계층이 있지만 PUT에는 필요하지 않은 경우 리소스 공급자가 구현해야 합니다.

Name 형식 Description
Basic

string

Free

string

Premium

string

Standard

string

systemData

리소스의 생성 및 마지막 수정과 관련된 메타데이터입니다.

Name 형식 Description
createdAt

string

리소스 만들기의 타임스탬프(UTC)입니다.

createdBy

string

리소스를 만든 ID입니다.

createdByType

createdByType

리소스를 만든 ID의 형식입니다.

lastModifiedAt

string

리소스 마지막 수정의 타임스탬프(UTC)

lastModifiedBy

string

리소스를 마지막으로 수정한 ID입니다.

lastModifiedByType

createdByType

리소스를 마지막으로 수정한 ID의 형식입니다.

TargetUtilizationScaleSettings

Name 형식 Default value Description
maxInstances

integer

1

배포를 확장할 수 있는 최대 인스턴스 수입니다. 할당량은 max_instances 예약됩니다.

minInstances

integer

1

항상 존재할 최소 인스턴스 수입니다.

pollingInterval

string

PT1S

ISO 8691 형식의 폴링 간격입니다. 전체 자릿수가 초인 기간만 지원합니다.

scaleType string:

TargetUtilization

[필수] 배포 크기 조정 알고리즘의 유형

targetUtilizationPercentage

integer

70

자동 크기 조정기용 대상 CPU 사용량입니다.

UserAssignedIdentity

사용자 할당 ID 속성

Name 형식 Description
clientId

string

할당된 ID의 클라이언트 ID입니다.

principalId

string

할당된 ID의 보안 주체 ID입니다.