Online Deployments - List
推論エンドポイントのデプロイを一覧表示します。
GET https://management.azure.com/subscriptions/{subscriptionId}/resourceGroups/{resourceGroupName}/providers/Microsoft.MachineLearningServices/workspaces/{workspaceName}/onlineEndpoints/{endpointName}/deployments?api-version=2025-12-01
GET https://management.azure.com/subscriptions/{subscriptionId}/resourceGroups/{resourceGroupName}/providers/Microsoft.MachineLearningServices/workspaces/{workspaceName}/onlineEndpoints/{endpointName}/deployments?api-version=2025-12-01&$orderBy={$orderBy}&$top={$top}&$skip={$skip}
URI パラメーター
| 名前 | / | 必須 | 型 | 説明 |
|---|---|---|---|---|
|
endpoint
|
path | True |
string |
オンライン エンドポイント名。 |
|
resource
|
path | True |
string minLength: 1maxLength: 90 |
リソース グループの名前。 名前は大文字と小文字が区別されます。 |
|
subscription
|
path | True |
string minLength: 1 |
ターゲット サブスクリプションの ID。 |
|
workspace
|
path | True |
string pattern: ^[a-zA-Z0-9][a-zA-Z0-9_-]{2,32}$ |
Azure Machine Learning ワークスペース名 |
|
api-version
|
query | True |
string minLength: 1 |
この操作に使用する API バージョン。 |
|
$order
|
query |
string |
リストの順序。 |
|
|
$skip
|
query |
string |
改ページ位置の継続トークン。 |
|
|
$top
|
query |
integer (int32) |
リストの先頭。 |
応答
| 名前 | 型 | 説明 |
|---|---|---|
| 200 OK |
Azure 操作は正常に完了しました。 |
|
| Other Status Codes |
予期しないエラー応答。 |
セキュリティ
azure_auth
Azure Active Directory OAuth2 フロー。
型:
oauth2
フロー:
implicit
Authorization URL (承認 URL):
https://login.microsoftonline.com/common/oauth2/authorize
スコープ
| 名前 | 説明 |
|---|---|
| user_impersonation | ユーザー アカウントを偽装する |
例
List Online Deployments.
要求のサンプル
GET https://management.azure.com/subscriptions/00000000-1111-2222-3333-444444444444/resourceGroups/test-rg/providers/Microsoft.MachineLearningServices/workspaces/my-aml-workspace/onlineEndpoints/testEndpointName/deployments?api-version=2025-12-01&$orderBy=string&$top=1
応答のサンプル
{
"nextLink": "https://management.azure.com/subscriptions/34adfa4f-cedf-4dc0-ba29-b6d1a69ab345/resourceGroups/testrg123/providers/Microsoft.MachineLearningServices/workspaces/my-aml-workspace/onlineEndpoints/testEndpointName/deployments?api-version=2025-07-01-preview&$skip=2",
"value": [
{
"name": "string",
"type": "string",
"id": "string",
"identity": {
"type": "SystemAssigned",
"principalId": "00000000-1111-2222-3333-444444444444",
"tenantId": "00000000-1111-2222-3333-444444444444",
"userAssignedIdentities": {
"string": {
"clientId": "00000000-1111-2222-3333-444444444444",
"principalId": "00000000-1111-2222-3333-444444444444"
}
}
},
"kind": "string",
"location": "string",
"properties": {
"description": "string",
"appInsightsEnabled": false,
"codeConfiguration": {
"codeId": "string",
"scoringScript": "string"
},
"containerResourceRequirements": {
"containerResourceLimits": {
"cpu": "\"1\"",
"gpu": "\"1\"",
"memory": "\"2Gi\""
},
"containerResourceRequests": {
"cpu": "\"1\"",
"gpu": "\"1\"",
"memory": "\"2Gi\""
}
},
"endpointComputeType": "Kubernetes",
"environmentId": "string",
"environmentVariables": {
"string": "string"
},
"instanceType": "string",
"livenessProbe": {
"failureThreshold": 1,
"initialDelay": "PT5M",
"period": "PT5M",
"successThreshold": 1,
"timeout": "PT5M"
},
"model": "string",
"modelMountPath": "string",
"properties": {
"string": "string"
},
"provisioningState": "Creating",
"requestSettings": {
"maxConcurrentRequestsPerInstance": 1,
"maxQueueWait": "PT5M",
"requestTimeout": "PT5M"
},
"scaleSettings": {
"scaleType": "Default"
}
},
"sku": {
"name": "string",
"capacity": 1,
"family": "string",
"size": "string",
"tier": "Free"
},
"systemData": {
"createdAt": "2020-01-01T12:34:56.999Z",
"createdBy": "string",
"createdByType": "User",
"lastModifiedAt": "2020-01-01T12:34:56.999Z",
"lastModifiedBy": "string",
"lastModifiedByType": "User"
},
"tags": {}
}
]
}
定義
| 名前 | 説明 |
|---|---|
|
Code |
スコアリング・コード資産の構成。 |
| Collection | |
|
Container |
オンライン デプロイ内の各コンテナー インスタンスのリソース要件。 |
|
Container |
|
|
created |
リソースを作成した ID の種類。 |
|
Data |
データ収集を有効または無効にします。 |
|
Data |
|
|
Default |
|
|
Deployment |
DeploymentProvisioningState に指定できる値。 |
|
Egress |
デプロイのエグレスに対して PublicNetworkAccess が有効か無効かを判断する列挙型。 |
|
Endpoint |
エンドポイントのコンピューティングの種類を決定する列挙型。 |
|
Error |
リソース管理エラーの追加情報。 |
|
Error |
エラーの詳細。 |
|
Error |
エラー応答 |
|
Kubernetes |
KubernetesOnlineDeployment に固有のプロパティ。 |
|
Managed |
ManagedOnlineDeployment に固有のプロパティ。 |
|
Managed |
マネージド サービス ID (システム割り当て ID またはユーザー割り当て ID) |
|
Managed |
マネージド サービス ID の種類 (SystemAssigned 型と UserAssigned 型の両方が許可されます)。 |
|
Online |
具体的な追跡対象リソースの種類は、特定のプロパティ型を使用してこの型にエイリアスを設定することで作成できます。 |
|
Online |
OnlineDeployment エンティティのページ分割された一覧。 |
|
Online |
オンライン展開スコアリング要求の構成。 |
|
Probe |
デプロイ コンテナーのライブネス/準備プローブの構成。 |
|
Request |
|
|
Rolling |
モデル データが BLOB ストレージに収集される場合は、データをすべて 1 つの BLOB ファイルに記録しないように、データを別のパスにロールする必要があります。 ローリング レートが時間の場合、すべてのデータが BLOB パス /yyyy/MM/dd/HH/ に収集されます。 1 日の場合、すべてのデータが BLOB パス /yyyy/MM/dd/ に収集されます。 ローリング パスのもう 1 つの利点は、モデル監視 UI でデータの時間範囲を非常に迅速に選択できることです。 |
|
Scale |
|
| Sku |
SKU を表すリソース モデル定義 |
|
Sku |
このフィールドは、サービスに複数のレベルがあるが PUT では必要ない場合に、リソース プロバイダーによって実装される必要があります。 |
|
system |
リソースの作成と最後の変更に関連するメタデータ。 |
|
Target |
|
|
User |
ユーザー割り当て ID プロパティ |
CodeConfiguration
スコアリング・コード資産の構成。
| 名前 | 型 | 説明 |
|---|---|---|
| codeId |
string |
コード資産の ARM リソース ID。 |
| scoringScript |
string minLength: 1pattern: [a-zA-Z0-9_] |
[必須]起動時に実行するスクリプト。 eg. "score.py" |
Collection
| 名前 | 型 | 規定値 | 説明 |
|---|---|---|---|
| clientId |
string |
BLOB ストレージへのログ記録の収集に使用される msi クライアント ID。 null の場合、バックエンドは認証する登録済みのエンドポイント ID を選択します。 |
|
| dataCollectionMode | Disabled |
データ収集を有効または無効にします。 |
|
| dataId |
string |
データ資産の arm リソース ID。クライアント側では、データ資産が BLOB ストレージを指していることを確認し、バックエンドは BLOB ストレージにデータを収集します。 |
|
| samplingRate |
number (double) |
1 |
コレクションのサンプリング レート。 サンプリング レート 1.0 は、既定で 100% のデータを収集します。 |
ContainerResourceRequirements
オンライン デプロイ内の各コンテナー インスタンスのリソース要件。
| 名前 | 型 | 説明 |
|---|---|---|
| containerResourceLimits |
コンテナー リソースの制限情報: |
|
| containerResourceRequests |
コンテナー リソース要求情報: |
ContainerResourceSettings
| 名前 | 型 | 説明 |
|---|---|---|
| cpu |
string |
コンテナーの vCPU 要求/制限の数。 詳細情報: https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/ |
| gpu |
string |
コンテナーの Nvidia GPU カード要求/制限の数。 詳細情報: https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/ |
| memory |
string |
コンテナーのメモリ サイズ要求/制限。 詳細情報: https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/ |
createdByType
リソースを作成した ID の種類。
| 値 | 説明 |
|---|---|
| User | |
| Application | |
| ManagedIdentity | |
| Key |
DataCollectionMode
データ収集を有効または無効にします。
| 値 | 説明 |
|---|---|
| Enabled | |
| Disabled |
DataCollector
| 名前 | 型 | 規定値 | 説明 |
|---|---|---|---|
| collections |
<string, Collection> |
[必須]コレクションの構成。 各コレクションには、モデル データを収集するための独自の構成があり、コレクションの名前は任意の文字列にすることができます。 モデル データ コレクターは、ペイロード ログ記録またはカスタム ログ記録、またはその両方に使用できます。 コレクションの要求と応答はペイロード ログ用に予約され、他の要求はカスタム ログ用です。 |
|
| requestLogging |
mdc の要求ログ構成には、すべてのコレクションの詳細なログ設定が含まれています。 これは省略可能です。 |
||
| rollingRate | Hour |
モデル データが BLOB ストレージに収集される場合は、データをすべて 1 つの BLOB ファイルに記録しないように、データを別のパスにロールする必要があります。 ローリング レートが時間の場合、すべてのデータが BLOB パス /yyyy/MM/dd/HH/ に収集されます。 1 日の場合、すべてのデータが BLOB パス /yyyy/MM/dd/ に収集されます。 ローリング パスのもう 1 つの利点は、モデル監視 UI でデータの時間範囲を非常に迅速に選択できることです。 |
DefaultScaleSettings
| 名前 | 型 | 説明 |
|---|---|---|
| scaleType |
string:
Default |
[必須]デプロイ スケーリング アルゴリズムの種類 |
DeploymentProvisioningState
DeploymentProvisioningState に指定できる値。
| 値 | 説明 |
|---|---|
| Creating | |
| Deleting | |
| Scaling | |
| Updating | |
| Succeeded | |
| Failed | |
| Canceled |
EgressPublicNetworkAccessType
デプロイのエグレスに対して PublicNetworkAccess が有効か無効かを判断する列挙型。
| 値 | 説明 |
|---|---|
| Enabled | |
| Disabled |
EndpointComputeType
エンドポイントのコンピューティングの種類を決定する列挙型。
| 値 | 説明 |
|---|---|
| Managed | |
| Kubernetes | |
| AzureMLCompute |
ErrorAdditionalInfo
リソース管理エラーの追加情報。
| 名前 | 型 | 説明 |
|---|---|---|
| info |
object |
追加情報。 |
| type |
string |
追加情報の種類。 |
ErrorDetail
エラーの詳細。
| 名前 | 型 | 説明 |
|---|---|---|
| additionalInfo |
エラーの追加情報。 |
|
| code |
string |
エラー コード。 |
| details |
エラーの詳細。 |
|
| message |
string |
エラー メッセージ。 |
| target |
string |
エラーターゲット。 |
ErrorResponse
エラー応答
| 名前 | 型 | 説明 |
|---|---|---|
| error |
エラー オブジェクト。 |
KubernetesOnlineDeployment
KubernetesOnlineDeployment に固有のプロパティ。
| 名前 | 型 | 規定値 | 説明 |
|---|---|---|---|
| appInsightsEnabled |
boolean |
False |
true の場合は、Application Insights のログ記録を有効にします。 |
| codeConfiguration |
エンドポイントデプロイのコード構成。 |
||
| containerResourceRequirements |
コンテナーのリソース要件 (cpu とメモリ)。 |
||
| dataCollector |
mdc 構成では、mdc が null の場合は無効になります。 |
||
| description |
string |
エンドポイントのデプロイの説明。 |
|
| egressPublicNetworkAccess | Enabled |
デプロイのエグレスに対して PublicNetworkAccess が有効か無効かを判断する列挙型。 |
|
| endpointComputeType |
string:
Kubernetes |
[必須]エンドポイントのコンピューティングの種類。 |
|
| environmentId |
string |
エンドポイントデプロイの環境仕様の ARM リソース ID または AssetId。 |
|
| environmentVariables |
object |
デプロイの環境変数の構成。 |
|
| instanceType |
string |
Standard_F4s_v2 |
コンピューティング インスタンスの種類。 既定値: Standard_F4s_v2。 |
| livenessProbe |
Liveness プローブは、コンテナーの正常性を定期的に監視します。 |
||
| model |
string |
モデルへの URI パス。 |
|
| modelMountPath |
string |
カスタム コンテナーにモデルをマウントするパス。 |
|
| properties |
object |
プロパティ ディクショナリ。 プロパティは追加できますが、削除または変更することはできません。 |
|
| provisioningState |
エンドポイント展開のプロビジョニング状態。 |
||
| readinessProbe |
準備プローブは、コンテナーがトラフィックを処理する準備ができているかどうかを検証します。 プロパティと既定値は、liveness プローブと同じです。 |
||
| requestSettings |
デプロイの要求設定。 |
||
| scaleSettings | OnlineScaleSettings: |
デプロイのスケール設定。 null の場合、または指定されていない場合、KubernetesOnlineDeployment の場合は TargetUtilizationScaleSettings、ManagedOnlineDeployment の場合は DefaultScaleSettings がデフォルトになります。 |
|
| startupProbe |
スタートアップ プローブは、コンテナー内のアプリケーションが正常に開始されたかどうかを確認します。 |
ManagedOnlineDeployment
ManagedOnlineDeployment に固有のプロパティ。
| 名前 | 型 | 規定値 | 説明 |
|---|---|---|---|
| appInsightsEnabled |
boolean |
False |
true の場合は、Application Insights のログ記録を有効にします。 |
| codeConfiguration |
エンドポイントデプロイのコード構成。 |
||
| dataCollector |
mdc 構成では、mdc が null の場合は無効になります。 |
||
| description |
string |
エンドポイントのデプロイの説明。 |
|
| egressPublicNetworkAccess | Enabled |
デプロイのエグレスに対して PublicNetworkAccess が有効か無効かを判断する列挙型。 |
|
| endpointComputeType |
string:
Managed |
[必須]エンドポイントのコンピューティングの種類。 |
|
| environmentId |
string |
エンドポイントデプロイの環境仕様の ARM リソース ID または AssetId。 |
|
| environmentVariables |
object |
デプロイの環境変数の構成。 |
|
| instanceType |
string |
Standard_F4s_v2 |
コンピューティング インスタンスの種類。 既定値: Standard_F4s_v2。 |
| livenessProbe |
Liveness プローブは、コンテナーの正常性を定期的に監視します。 |
||
| model |
string |
モデルへの URI パス。 |
|
| modelMountPath |
string |
カスタム コンテナーにモデルをマウントするパス。 |
|
| properties |
object |
プロパティ ディクショナリ。 プロパティは追加できますが、削除または変更することはできません。 |
|
| provisioningState |
エンドポイント展開のプロビジョニング状態。 |
||
| readinessProbe |
準備プローブは、コンテナーがトラフィックを処理する準備ができているかどうかを検証します。 プロパティと既定値は、liveness プローブと同じです。 |
||
| requestSettings |
デプロイの要求設定。 |
||
| scaleSettings | OnlineScaleSettings: |
デプロイのスケール設定。 null の場合、または指定されていない場合、KubernetesOnlineDeployment の場合は TargetUtilizationScaleSettings、ManagedOnlineDeployment の場合は DefaultScaleSettings がデフォルトになります。 |
|
| startupProbe |
スタートアップ プローブは、コンテナー内のアプリケーションが正常に開始されたかどうかを確認します。 |
ManagedServiceIdentity
マネージド サービス ID (システム割り当て ID またはユーザー割り当て ID)
| 名前 | 型 | 説明 |
|---|---|---|
| principalId |
string (uuid) |
システム割り当て ID のサービス プリンシパル ID。 このプロパティは、システム割り当て ID にのみ提供されます。 |
| tenantId |
string (uuid) |
システム割り当て ID のテナント ID。 このプロパティは、システム割り当て ID にのみ提供されます。 |
| type |
マネージド サービス ID の種類 (SystemAssigned 型と UserAssigned 型の両方が許可されます)。 |
|
| userAssignedIdentities |
<string,
User |
User-Assigned ID |
ManagedServiceIdentityType
マネージド サービス ID の種類 (SystemAssigned 型と UserAssigned 型の両方が許可されます)。
| 値 | 説明 |
|---|---|
| None | |
| SystemAssigned | |
| UserAssigned | |
| SystemAssigned,UserAssigned |
OnlineDeployment
具体的な追跡対象リソースの種類は、特定のプロパティ型を使用してこの型にエイリアスを設定することで作成できます。
| 名前 | 型 | 説明 |
|---|---|---|
| id |
string |
リソースの完全修飾リソース ID。 例 - /subscriptions/{subscriptionId}/resourceGroups/{resourceGroupName}/providers/{resourceProviderNamespace}/{resourceType}/{resourceName} |
| identity |
マネージド サービス ID (システム割り当て ID またはユーザー割り当て ID) |
|
| kind |
string |
同じ種類のリソースに対して異なる UX エクスペリエンスをレンダリングするためにポータルやツールなどで使用されるメタデータ。 |
| location |
string |
リソースが存在する地理的な場所 |
| name |
string |
リソースの名前 |
| properties | OnlineDeploymentProperties: |
[必須]エンティティの追加の属性。 |
| sku |
自動スケールの ARM コントラクトに必要な SKU の詳細。 |
|
| systemData |
createdBy および modifiedBy 情報を含む Azure Resource Manager メタデータ。 |
|
| tags |
object |
リソース タグ。 |
| type |
string |
リソースの型。 例: "Microsoft.Compute/virtualMachines" または "Microsoft.Storage/storageAccounts" |
OnlineDeploymentTrackedResourceArmPaginatedResult
OnlineDeployment エンティティのページ分割された一覧。
| 名前 | 型 | 説明 |
|---|---|---|
| nextLink |
string (uri) |
アイテムの次のページへのリンク |
| value |
このページのOnlineDeployment項目 |
OnlineRequestSettings
オンライン展開スコアリング要求の構成。
| 名前 | 型 | 規定値 | 説明 |
|---|---|---|---|
| maxConcurrentRequestsPerInstance |
integer (int32) |
1 |
デプロイごとに許可されるノードあたりの最大同時要求数。 既定値は 1 です。 |
| maxQueueWait |
string (duration) |
PT0.5S |
(Managed Online エンドポイントでは非推奨)要求が ISO 8601 形式のキューに保持される最大時間。
既定値は 500 ミリ秒です。
(ネットワーク/キューの遅延を考慮して |
| requestTimeout |
string (duration) |
PT5S |
ISO 8601 形式のスコアリング タイムアウト。 既定値は 5,000 ミリ秒です。 |
ProbeSettings
デプロイ コンテナーのライブネス/準備プローブの構成。
| 名前 | 型 | 規定値 | 説明 |
|---|---|---|---|
| failureThreshold |
integer (int32) |
30 |
異常な状態を返す前に許可するエラーの数。 |
| initialDelay |
string (duration) |
ISO 8601 形式の最初のプローブの前の遅延。 |
|
| period |
string (duration) |
PT10S |
ISO 8601 形式のプローブ間の時間の長さ。 |
| successThreshold |
integer (int32) |
1 |
正常な状態を返す前の成功したプローブの数。 |
| timeout |
string (duration) |
PT2S |
ISO 8601 形式のプローブ タイムアウト。 |
RequestLogging
| 名前 | 型 | 説明 |
|---|---|---|
| captureHeaders |
string[] |
ペイロード ログの場合、既定ではペイロードのみが収集されます。 指定したヘッダーも収集する必要がある場合は、バックエンドがペイロードと共にこれらのヘッダーを収集するように captureHeaders で設定できます。 |
RollingRateType
モデル データが BLOB ストレージに収集される場合は、データをすべて 1 つの BLOB ファイルに記録しないように、データを別のパスにロールする必要があります。 ローリング レートが時間の場合、すべてのデータが BLOB パス /yyyy/MM/dd/HH/ に収集されます。 1 日の場合、すべてのデータが BLOB パス /yyyy/MM/dd/ に収集されます。 ローリング パスのもう 1 つの利点は、モデル監視 UI でデータの時間範囲を非常に迅速に選択できることです。
| 値 | 説明 |
|---|---|
| Year | |
| Month | |
| Day | |
| Hour | |
| Minute |
ScaleType
| 値 | 説明 |
|---|---|
| Default | |
| TargetUtilization |
Sku
SKU を表すリソース モデル定義
| 名前 | 型 | 説明 |
|---|---|---|
| capacity |
integer (int32) |
SKU でスケールアウト/インがサポートされている場合は、容量の整数を含める必要があります。 リソースに対してスケールアウト/インができない場合は、これを省略できます。 |
| family |
string |
同じ SKU に対して、サービスの世代が異なるハードウェアがある場合は、ここでキャプチャできます。 |
| name |
string |
SKU の名前。 例 - P3。 通常は文字 + 数字のコードです |
| size |
string |
SKU サイズ。 名前フィールドが層と他の値の組み合わせである場合、これはスタンドアロン コードになります。 |
| tier |
このフィールドは、サービスに複数のレベルがあるが PUT では必要ない場合に、リソース プロバイダーによって実装される必要があります。 |
SkuTier
このフィールドは、サービスに複数のレベルがあるが PUT では必要ない場合に、リソース プロバイダーによって実装される必要があります。
| 値 | 説明 |
|---|---|
| Free | |
| Basic | |
| Standard | |
| Premium |
systemData
リソースの作成と最後の変更に関連するメタデータ。
| 名前 | 型 | 説明 |
|---|---|---|
| createdAt |
string (date-time) |
リソース作成のタイムスタンプ (UTC)。 |
| createdBy |
string |
リソースを作成した ID。 |
| createdByType |
リソースを作成した ID の種類。 |
|
| lastModifiedAt |
string (date-time) |
リソースの最終変更のタイムスタンプ (UTC) |
| lastModifiedBy |
string |
リソースを最後に変更した ID。 |
| lastModifiedByType |
リソースを最後に変更した ID の種類。 |
TargetUtilizationScaleSettings
| 名前 | 型 | 規定値 | 説明 |
|---|---|---|---|
| maxInstances |
integer (int32) |
1 |
デプロイがスケーリングできるインスタンスの最大数。 クォータはmax_instances用に予約されます。 |
| minInstances |
integer (int32) |
1 |
常に存在するインスタンスの最小数。 |
| pollingInterval |
string (duration) |
PT1S |
ISO 8691 形式のポーリング間隔。 秒という低い精度の期間のみをサポートします。 |
| scaleType |
string:
Target |
[必須]デプロイ スケーリング アルゴリズムの種類 |
|
| targetUtilizationPercentage |
integer (int32) |
70 |
自動スケーラーのターゲット CPU 使用率。 |
UserAssignedIdentity
ユーザー割り当て ID プロパティ
| 名前 | 型 | 説明 |
|---|---|---|
| clientId |
string (uuid) |
割り当てられた ID のクライアント ID。 |
| principalId |
string (uuid) |
割り当てられた ID のプリンシパル ID。 |