次の方法で共有


Online Deployments - List

推論エンドポイントのデプロイを一覧表示します。

GET https://management.azure.com/subscriptions/{subscriptionId}/resourceGroups/{resourceGroupName}/providers/Microsoft.MachineLearningServices/workspaces/{workspaceName}/onlineEndpoints/{endpointName}/deployments?api-version=2025-12-01
GET https://management.azure.com/subscriptions/{subscriptionId}/resourceGroups/{resourceGroupName}/providers/Microsoft.MachineLearningServices/workspaces/{workspaceName}/onlineEndpoints/{endpointName}/deployments?api-version=2025-12-01&$orderBy={$orderBy}&$top={$top}&$skip={$skip}

URI パラメーター

名前 / 必須 説明
endpointName
path True

string

オンライン エンドポイント名。

resourceGroupName
path True

string

minLength: 1
maxLength: 90

リソース グループの名前。 名前は大文字と小文字が区別されます。

subscriptionId
path True

string

minLength: 1

ターゲット サブスクリプションの ID。

workspaceName
path True

string

pattern: ^[a-zA-Z0-9][a-zA-Z0-9_-]{2,32}$

Azure Machine Learning ワークスペース名

api-version
query True

string

minLength: 1

この操作に使用する API バージョン。

$orderBy
query

string

リストの順序。

$skip
query

string

改ページ位置の継続トークン。

$top
query

integer (int32)

リストの先頭。

応答

名前 説明
200 OK

OnlineDeploymentTrackedResourceArmPaginatedResult

Azure 操作は正常に完了しました。

Other Status Codes

ErrorResponse

予期しないエラー応答。

セキュリティ

azure_auth

Azure Active Directory OAuth2 フロー。

型: oauth2
フロー: implicit
Authorization URL (承認 URL): https://login.microsoftonline.com/common/oauth2/authorize

スコープ

名前 説明
user_impersonation ユーザー アカウントを偽装する

List Online Deployments.

要求のサンプル

GET https://management.azure.com/subscriptions/00000000-1111-2222-3333-444444444444/resourceGroups/test-rg/providers/Microsoft.MachineLearningServices/workspaces/my-aml-workspace/onlineEndpoints/testEndpointName/deployments?api-version=2025-12-01&$orderBy=string&$top=1

応答のサンプル

{
  "nextLink": "https://management.azure.com/subscriptions/34adfa4f-cedf-4dc0-ba29-b6d1a69ab345/resourceGroups/testrg123/providers/Microsoft.MachineLearningServices/workspaces/my-aml-workspace/onlineEndpoints/testEndpointName/deployments?api-version=2025-07-01-preview&$skip=2",
  "value": [
    {
      "name": "string",
      "type": "string",
      "id": "string",
      "identity": {
        "type": "SystemAssigned",
        "principalId": "00000000-1111-2222-3333-444444444444",
        "tenantId": "00000000-1111-2222-3333-444444444444",
        "userAssignedIdentities": {
          "string": {
            "clientId": "00000000-1111-2222-3333-444444444444",
            "principalId": "00000000-1111-2222-3333-444444444444"
          }
        }
      },
      "kind": "string",
      "location": "string",
      "properties": {
        "description": "string",
        "appInsightsEnabled": false,
        "codeConfiguration": {
          "codeId": "string",
          "scoringScript": "string"
        },
        "containerResourceRequirements": {
          "containerResourceLimits": {
            "cpu": "\"1\"",
            "gpu": "\"1\"",
            "memory": "\"2Gi\""
          },
          "containerResourceRequests": {
            "cpu": "\"1\"",
            "gpu": "\"1\"",
            "memory": "\"2Gi\""
          }
        },
        "endpointComputeType": "Kubernetes",
        "environmentId": "string",
        "environmentVariables": {
          "string": "string"
        },
        "instanceType": "string",
        "livenessProbe": {
          "failureThreshold": 1,
          "initialDelay": "PT5M",
          "period": "PT5M",
          "successThreshold": 1,
          "timeout": "PT5M"
        },
        "model": "string",
        "modelMountPath": "string",
        "properties": {
          "string": "string"
        },
        "provisioningState": "Creating",
        "requestSettings": {
          "maxConcurrentRequestsPerInstance": 1,
          "maxQueueWait": "PT5M",
          "requestTimeout": "PT5M"
        },
        "scaleSettings": {
          "scaleType": "Default"
        }
      },
      "sku": {
        "name": "string",
        "capacity": 1,
        "family": "string",
        "size": "string",
        "tier": "Free"
      },
      "systemData": {
        "createdAt": "2020-01-01T12:34:56.999Z",
        "createdBy": "string",
        "createdByType": "User",
        "lastModifiedAt": "2020-01-01T12:34:56.999Z",
        "lastModifiedBy": "string",
        "lastModifiedByType": "User"
      },
      "tags": {}
    }
  ]
}

定義

名前 説明
CodeConfiguration

スコアリング・コード資産の構成。

Collection
ContainerResourceRequirements

オンライン デプロイ内の各コンテナー インスタンスのリソース要件。

ContainerResourceSettings
createdByType

リソースを作成した ID の種類。

DataCollectionMode

データ収集を有効または無効にします。

DataCollector
DefaultScaleSettings
DeploymentProvisioningState

DeploymentProvisioningState に指定できる値。

EgressPublicNetworkAccessType

デプロイのエグレスに対して PublicNetworkAccess が有効か無効かを判断する列挙型。

EndpointComputeType

エンドポイントのコンピューティングの種類を決定する列挙型。

ErrorAdditionalInfo

リソース管理エラーの追加情報。

ErrorDetail

エラーの詳細。

ErrorResponse

エラー応答

KubernetesOnlineDeployment

KubernetesOnlineDeployment に固有のプロパティ。

ManagedOnlineDeployment

ManagedOnlineDeployment に固有のプロパティ。

ManagedServiceIdentity

マネージド サービス ID (システム割り当て ID またはユーザー割り当て ID)

ManagedServiceIdentityType

マネージド サービス ID の種類 (SystemAssigned 型と UserAssigned 型の両方が許可されます)。

OnlineDeployment

具体的な追跡対象リソースの種類は、特定のプロパティ型を使用してこの型にエイリアスを設定することで作成できます。

OnlineDeploymentTrackedResourceArmPaginatedResult

OnlineDeployment エンティティのページ分割された一覧。

OnlineRequestSettings

オンライン展開スコアリング要求の構成。

ProbeSettings

デプロイ コンテナーのライブネス/準備プローブの構成。

RequestLogging
RollingRateType

モデル データが BLOB ストレージに収集される場合は、データをすべて 1 つの BLOB ファイルに記録しないように、データを別のパスにロールする必要があります。 ローリング レートが時間の場合、すべてのデータが BLOB パス /yyyy/MM/dd/HH/ に収集されます。 1 日の場合、すべてのデータが BLOB パス /yyyy/MM/dd/ に収集されます。 ローリング パスのもう 1 つの利点は、モデル監視 UI でデータの時間範囲を非常に迅速に選択できることです。

ScaleType
Sku

SKU を表すリソース モデル定義

SkuTier

このフィールドは、サービスに複数のレベルがあるが PUT では必要ない場合に、リソース プロバイダーによって実装される必要があります。

systemData

リソースの作成と最後の変更に関連するメタデータ。

TargetUtilizationScaleSettings
UserAssignedIdentity

ユーザー割り当て ID プロパティ

CodeConfiguration

スコアリング・コード資産の構成。

名前 説明
codeId

string

コード資産の ARM リソース ID。

scoringScript

string

minLength: 1
pattern: [a-zA-Z0-9_]

[必須]起動時に実行するスクリプト。 eg. "score.py"

Collection

名前 規定値 説明
clientId

string

BLOB ストレージへのログ記録の収集に使用される msi クライアント ID。 null の場合、バックエンドは認証する登録済みのエンドポイント ID を選択します。

dataCollectionMode

DataCollectionMode

Disabled

データ収集を有効または無効にします。

dataId

string

データ資産の arm リソース ID。クライアント側では、データ資産が BLOB ストレージを指していることを確認し、バックエンドは BLOB ストレージにデータを収集します。

samplingRate

number (double)

1

コレクションのサンプリング レート。 サンプリング レート 1.0 は、既定で 100% のデータを収集します。

ContainerResourceRequirements

オンライン デプロイ内の各コンテナー インスタンスのリソース要件。

名前 説明
containerResourceLimits

ContainerResourceSettings

コンテナー リソースの制限情報:

containerResourceRequests

ContainerResourceSettings

コンテナー リソース要求情報:

ContainerResourceSettings

名前 説明
cpu

string

コンテナーの vCPU 要求/制限の数。 詳細情報: https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/

gpu

string

コンテナーの Nvidia GPU カード要求/制限の数。 詳細情報: https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/

memory

string

コンテナーのメモリ サイズ要求/制限。 詳細情報: https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/

createdByType

リソースを作成した ID の種類。

説明
User
Application
ManagedIdentity
Key

DataCollectionMode

データ収集を有効または無効にします。

説明
Enabled
Disabled

DataCollector

名前 規定値 説明
collections

<string,  Collection>

[必須]コレクションの構成。 各コレクションには、モデル データを収集するための独自の構成があり、コレクションの名前は任意の文字列にすることができます。 モデル データ コレクターは、ペイロード ログ記録またはカスタム ログ記録、またはその両方に使用できます。 コレクションの要求と応答はペイロード ログ用に予約され、他の要求はカスタム ログ用です。

requestLogging

RequestLogging

mdc の要求ログ構成には、すべてのコレクションの詳細なログ設定が含まれています。 これは省略可能です。

rollingRate

RollingRateType

Hour

モデル データが BLOB ストレージに収集される場合は、データをすべて 1 つの BLOB ファイルに記録しないように、データを別のパスにロールする必要があります。 ローリング レートが時間の場合、すべてのデータが BLOB パス /yyyy/MM/dd/HH/ に収集されます。 1 日の場合、すべてのデータが BLOB パス /yyyy/MM/dd/ に収集されます。 ローリング パスのもう 1 つの利点は、モデル監視 UI でデータの時間範囲を非常に迅速に選択できることです。

DefaultScaleSettings

名前 説明
scaleType string:

Default

[必須]デプロイ スケーリング アルゴリズムの種類

DeploymentProvisioningState

DeploymentProvisioningState に指定できる値。

説明
Creating
Deleting
Scaling
Updating
Succeeded
Failed
Canceled

EgressPublicNetworkAccessType

デプロイのエグレスに対して PublicNetworkAccess が有効か無効かを判断する列挙型。

説明
Enabled
Disabled

EndpointComputeType

エンドポイントのコンピューティングの種類を決定する列挙型。

説明
Managed
Kubernetes
AzureMLCompute

ErrorAdditionalInfo

リソース管理エラーの追加情報。

名前 説明
info

object

追加情報。

type

string

追加情報の種類。

ErrorDetail

エラーの詳細。

名前 説明
additionalInfo

ErrorAdditionalInfo[]

エラーの追加情報。

code

string

エラー コード。

details

ErrorDetail[]

エラーの詳細。

message

string

エラー メッセージ。

target

string

エラーターゲット。

ErrorResponse

エラー応答

名前 説明
error

ErrorDetail

エラー オブジェクト。

KubernetesOnlineDeployment

KubernetesOnlineDeployment に固有のプロパティ。

名前 規定値 説明
appInsightsEnabled

boolean

False

true の場合は、Application Insights のログ記録を有効にします。

codeConfiguration

CodeConfiguration

エンドポイントデプロイのコード構成。

containerResourceRequirements

ContainerResourceRequirements

コンテナーのリソース要件 (cpu とメモリ)。

dataCollector

DataCollector

mdc 構成では、mdc が null の場合は無効になります。

description

string

エンドポイントのデプロイの説明。

egressPublicNetworkAccess

EgressPublicNetworkAccessType

Enabled

デプロイのエグレスに対して PublicNetworkAccess が有効か無効かを判断する列挙型。

endpointComputeType string:

Kubernetes

[必須]エンドポイントのコンピューティングの種類。

environmentId

string

エンドポイントデプロイの環境仕様の ARM リソース ID または AssetId。

environmentVariables

object

デプロイの環境変数の構成。

instanceType

string

Standard_F4s_v2

コンピューティング インスタンスの種類。 既定値: Standard_F4s_v2。

livenessProbe

ProbeSettings

Liveness プローブは、コンテナーの正常性を定期的に監視します。

model

string

モデルへの URI パス。

modelMountPath

string

カスタム コンテナーにモデルをマウントするパス。

properties

object

プロパティ ディクショナリ。 プロパティは追加できますが、削除または変更することはできません。

provisioningState

DeploymentProvisioningState

エンドポイント展開のプロビジョニング状態。

readinessProbe

ProbeSettings

準備プローブは、コンテナーがトラフィックを処理する準備ができているかどうかを検証します。 プロパティと既定値は、liveness プローブと同じです。

requestSettings

OnlineRequestSettings

デプロイの要求設定。

scaleSettings OnlineScaleSettings:

デプロイのスケール設定。 null の場合、または指定されていない場合、KubernetesOnlineDeployment の場合は TargetUtilizationScaleSettings、ManagedOnlineDeployment の場合は DefaultScaleSettings がデフォルトになります。

startupProbe

ProbeSettings

スタートアップ プローブは、コンテナー内のアプリケーションが正常に開始されたかどうかを確認します。

ManagedOnlineDeployment

ManagedOnlineDeployment に固有のプロパティ。

名前 規定値 説明
appInsightsEnabled

boolean

False

true の場合は、Application Insights のログ記録を有効にします。

codeConfiguration

CodeConfiguration

エンドポイントデプロイのコード構成。

dataCollector

DataCollector

mdc 構成では、mdc が null の場合は無効になります。

description

string

エンドポイントのデプロイの説明。

egressPublicNetworkAccess

EgressPublicNetworkAccessType

Enabled

デプロイのエグレスに対して PublicNetworkAccess が有効か無効かを判断する列挙型。

endpointComputeType string:

Managed

[必須]エンドポイントのコンピューティングの種類。

environmentId

string

エンドポイントデプロイの環境仕様の ARM リソース ID または AssetId。

environmentVariables

object

デプロイの環境変数の構成。

instanceType

string

Standard_F4s_v2

コンピューティング インスタンスの種類。 既定値: Standard_F4s_v2。

livenessProbe

ProbeSettings

Liveness プローブは、コンテナーの正常性を定期的に監視します。

model

string

モデルへの URI パス。

modelMountPath

string

カスタム コンテナーにモデルをマウントするパス。

properties

object

プロパティ ディクショナリ。 プロパティは追加できますが、削除または変更することはできません。

provisioningState

DeploymentProvisioningState

エンドポイント展開のプロビジョニング状態。

readinessProbe

ProbeSettings

準備プローブは、コンテナーがトラフィックを処理する準備ができているかどうかを検証します。 プロパティと既定値は、liveness プローブと同じです。

requestSettings

OnlineRequestSettings

デプロイの要求設定。

scaleSettings OnlineScaleSettings:

デプロイのスケール設定。 null の場合、または指定されていない場合、KubernetesOnlineDeployment の場合は TargetUtilizationScaleSettings、ManagedOnlineDeployment の場合は DefaultScaleSettings がデフォルトになります。

startupProbe

ProbeSettings

スタートアップ プローブは、コンテナー内のアプリケーションが正常に開始されたかどうかを確認します。

ManagedServiceIdentity

マネージド サービス ID (システム割り当て ID またはユーザー割り当て ID)

名前 説明
principalId

string (uuid)

システム割り当て ID のサービス プリンシパル ID。 このプロパティは、システム割り当て ID にのみ提供されます。

tenantId

string (uuid)

システム割り当て ID のテナント ID。 このプロパティは、システム割り当て ID にのみ提供されます。

type

ManagedServiceIdentityType

マネージド サービス ID の種類 (SystemAssigned 型と UserAssigned 型の両方が許可されます)。

userAssignedIdentities

<string,  UserAssignedIdentity>

User-Assigned ID
リソースに関連付けられているユーザー割り当て ID のセット。 userAssignedIdentities ディクショナリ キーは、'/subscriptions/{subscriptionId}/resourceGroups/{resourceGroupName}/providers/Microsoft.ManagedIdentity/userAssignedIdentities/{identityName} という形式の ARM リソース ID になります。 ディクショナリ値は、要求内の空のオブジェクト ({}) にすることができます。

ManagedServiceIdentityType

マネージド サービス ID の種類 (SystemAssigned 型と UserAssigned 型の両方が許可されます)。

説明
None
SystemAssigned
UserAssigned
SystemAssigned,UserAssigned

OnlineDeployment

具体的な追跡対象リソースの種類は、特定のプロパティ型を使用してこの型にエイリアスを設定することで作成できます。

名前 説明
id

string

リソースの完全修飾リソース ID。 例 - /subscriptions/{subscriptionId}/resourceGroups/{resourceGroupName}/providers/{resourceProviderNamespace}/{resourceType}/{resourceName}

identity

ManagedServiceIdentity

マネージド サービス ID (システム割り当て ID またはユーザー割り当て ID)

kind

string

同じ種類のリソースに対して異なる UX エクスペリエンスをレンダリングするためにポータルやツールなどで使用されるメタデータ。

location

string

リソースが存在する地理的な場所

name

string

リソースの名前

properties OnlineDeploymentProperties:

[必須]エンティティの追加の属性。

sku

Sku

自動スケールの ARM コントラクトに必要な SKU の詳細。

systemData

systemData

createdBy および modifiedBy 情報を含む Azure Resource Manager メタデータ。

tags

object

リソース タグ。

type

string

リソースの型。 例: "Microsoft.Compute/virtualMachines" または "Microsoft.Storage/storageAccounts"

OnlineDeploymentTrackedResourceArmPaginatedResult

OnlineDeployment エンティティのページ分割された一覧。

名前 説明
nextLink

string (uri)

アイテムの次のページへのリンク

value

OnlineDeployment[]

このページのOnlineDeployment項目

OnlineRequestSettings

オンライン展開スコアリング要求の構成。

名前 規定値 説明
maxConcurrentRequestsPerInstance

integer (int32)

1

デプロイごとに許可されるノードあたりの最大同時要求数。 既定値は 1 です。

maxQueueWait

string (duration)

PT0.5S

(Managed Online エンドポイントでは非推奨)要求が ISO 8601 形式のキューに保持される最大時間。 既定値は 500 ミリ秒です。 (ネットワーク/キューの遅延を考慮して request_timeout_ms を増やします)

requestTimeout

string (duration)

PT5S

ISO 8601 形式のスコアリング タイムアウト。 既定値は 5,000 ミリ秒です。

ProbeSettings

デプロイ コンテナーのライブネス/準備プローブの構成。

名前 規定値 説明
failureThreshold

integer (int32)

30

異常な状態を返す前に許可するエラーの数。

initialDelay

string (duration)

ISO 8601 形式の最初のプローブの前の遅延。

period

string (duration)

PT10S

ISO 8601 形式のプローブ間の時間の長さ。

successThreshold

integer (int32)

1

正常な状態を返す前の成功したプローブの数。

timeout

string (duration)

PT2S

ISO 8601 形式のプローブ タイムアウト。

RequestLogging

名前 説明
captureHeaders

string[]

ペイロード ログの場合、既定ではペイロードのみが収集されます。 指定したヘッダーも収集する必要がある場合は、バックエンドがペイロードと共にこれらのヘッダーを収集するように captureHeaders で設定できます。

RollingRateType

モデル データが BLOB ストレージに収集される場合は、データをすべて 1 つの BLOB ファイルに記録しないように、データを別のパスにロールする必要があります。 ローリング レートが時間の場合、すべてのデータが BLOB パス /yyyy/MM/dd/HH/ に収集されます。 1 日の場合、すべてのデータが BLOB パス /yyyy/MM/dd/ に収集されます。 ローリング パスのもう 1 つの利点は、モデル監視 UI でデータの時間範囲を非常に迅速に選択できることです。

説明
Year
Month
Day
Hour
Minute

ScaleType

説明
Default
TargetUtilization

Sku

SKU を表すリソース モデル定義

名前 説明
capacity

integer (int32)

SKU でスケールアウト/インがサポートされている場合は、容量の整数を含める必要があります。 リソースに対してスケールアウト/インができない場合は、これを省略できます。

family

string

同じ SKU に対して、サービスの世代が異なるハードウェアがある場合は、ここでキャプチャできます。

name

string

SKU の名前。 例 - P3。 通常は文字 + 数字のコードです

size

string

SKU サイズ。 名前フィールドが層と他の値の組み合わせである場合、これはスタンドアロン コードになります。

tier

SkuTier

このフィールドは、サービスに複数のレベルがあるが PUT では必要ない場合に、リソース プロバイダーによって実装される必要があります。

SkuTier

このフィールドは、サービスに複数のレベルがあるが PUT では必要ない場合に、リソース プロバイダーによって実装される必要があります。

説明
Free
Basic
Standard
Premium

systemData

リソースの作成と最後の変更に関連するメタデータ。

名前 説明
createdAt

string (date-time)

リソース作成のタイムスタンプ (UTC)。

createdBy

string

リソースを作成した ID。

createdByType

createdByType

リソースを作成した ID の種類。

lastModifiedAt

string (date-time)

リソースの最終変更のタイムスタンプ (UTC)

lastModifiedBy

string

リソースを最後に変更した ID。

lastModifiedByType

createdByType

リソースを最後に変更した ID の種類。

TargetUtilizationScaleSettings

名前 規定値 説明
maxInstances

integer (int32)

1

デプロイがスケーリングできるインスタンスの最大数。 クォータはmax_instances用に予約されます。

minInstances

integer (int32)

1

常に存在するインスタンスの最小数。

pollingInterval

string (duration)

PT1S

ISO 8691 形式のポーリング間隔。 秒という低い精度の期間のみをサポートします。

scaleType string:

TargetUtilization

[必須]デプロイ スケーリング アルゴリズムの種類

targetUtilizationPercentage

integer (int32)

70

自動スケーラーのターゲット CPU 使用率。

UserAssignedIdentity

ユーザー割り当て ID プロパティ

名前 説明
clientId

string (uuid)

割り当てられた ID のクライアント ID。

principalId

string (uuid)

割り当てられた ID のプリンシパル ID。