Online Deployments - Get
Dapatkan Penyebaran Penyebaran Inferensi.
GET https://management.azure.com/subscriptions/{subscriptionId}/resourceGroups/{resourceGroupName}/providers/Microsoft.MachineLearningServices/workspaces/{workspaceName}/onlineEndpoints/{endpointName}/deployments/{deploymentName}?api-version=2025-06-01
Parameter URI
Nama | Dalam | Diperlukan | Jenis | Deskripsi |
---|---|---|---|---|
deployment
|
path | True |
string |
Nama Penyebaran Titik Akhir Inferensi. |
endpoint
|
path | True |
string |
Nama titik akhir inferensi. |
resource
|
path | True |
string minLength: 1maxLength: 90 |
Nama grup sumber daya. Nama tidak sensitif terhadap penggunaan huruf besar atau kecil. |
subscription
|
path | True |
string minLength: 1 |
ID langganan target. |
workspace
|
path | True |
string pattern: ^[a-zA-Z0-9][a-zA-Z0-9_-]{2,32}$ |
Nama ruang kerja Azure Machine Learning. |
api-version
|
query | True |
string minLength: 1 |
Versi API yang digunakan untuk operasi ini. |
Respons
Nama | Jenis | Deskripsi |
---|---|---|
200 OK |
Keberhasilan |
|
Other Status Codes |
Kesalahan |
Contoh
Get Kubernetes Online Deployment. |
Get Managed Online Deployment. |
Get Kubernetes Online Deployment.
Permintaan sampel
GET https://management.azure.com/subscriptions/00000000-1111-2222-3333-444444444444/resourceGroups/test-rg/providers/Microsoft.MachineLearningServices/workspaces/my-aml-workspace/onlineEndpoints/testEndpointName/deployments/testDeploymentName?api-version=2025-06-01
Respon sampel
{
"id": "string",
"name": "string",
"type": "string",
"properties": {
"description": "string",
"properties": {
"string": "string"
},
"codeConfiguration": {
"codeId": "string",
"scoringScript": "string"
},
"environmentId": "string",
"environmentVariables": {
"string": "string"
},
"scaleSettings": {
"scaleType": "Default"
},
"requestSettings": {
"maxQueueWait": "PT5M",
"requestTimeout": "PT5M",
"maxConcurrentRequestsPerInstance": 1
},
"modelMountPath": "string",
"appInsightsEnabled": false,
"livenessProbe": {
"failureThreshold": 1,
"successThreshold": 1,
"timeout": "PT5M",
"period": "PT5M",
"initialDelay": "PT5M"
},
"provisioningState": "Creating",
"instanceType": "string",
"model": "string",
"endpointComputeType": "Kubernetes",
"containerResourceRequirements": {
"containerResourceRequests": {
"cpu": "\"1\"",
"memory": "\"2Gi\"",
"gpu": "\"1\""
},
"containerResourceLimits": {
"cpu": "\"1\"",
"memory": "\"2Gi\"",
"gpu": "\"1\""
}
}
},
"systemData": {
"createdAt": "2020-01-01T12:34:56.999Z",
"createdBy": "string",
"createdByType": "User",
"lastModifiedAt": "2020-01-01T12:34:56.999Z",
"lastModifiedBy": "string",
"lastModifiedByType": "User"
},
"tags": {},
"location": "string",
"kind": "string",
"identity": {
"type": "SystemAssigned",
"principalId": "00000000-1111-2222-3333-444444444444",
"tenantId": "00000000-1111-2222-3333-444444444444",
"userAssignedIdentities": {
"string": {
"principalId": "00000000-1111-2222-3333-444444444444",
"clientId": "00000000-1111-2222-3333-444444444444"
}
}
},
"sku": {
"name": "string",
"tier": "Free",
"size": "string",
"family": "string",
"capacity": 1
}
}
Get Managed Online Deployment.
Permintaan sampel
GET https://management.azure.com/subscriptions/00000000-1111-2222-3333-444444444444/resourceGroups/test-rg/providers/Microsoft.MachineLearningServices/workspaces/my-aml-workspace/onlineEndpoints/testEndpointName/deployments/testDeploymentName?api-version=2025-06-01
Respon sampel
{
"id": "string",
"name": "string",
"type": "string",
"properties": {
"description": "string",
"properties": {
"string": "string"
},
"codeConfiguration": {
"codeId": "string",
"scoringScript": "string"
},
"environmentId": "string",
"environmentVariables": {
"string": "string"
},
"scaleSettings": {
"scaleType": "Default"
},
"requestSettings": {
"maxQueueWait": "PT5M",
"requestTimeout": "PT5M",
"maxConcurrentRequestsPerInstance": 1
},
"appInsightsEnabled": false,
"livenessProbe": {
"failureThreshold": 1,
"successThreshold": 1,
"timeout": "PT5M",
"period": "PT5M",
"initialDelay": "PT5M"
},
"provisioningState": "Creating",
"instanceType": "string",
"model": "string",
"endpointComputeType": "Managed",
"modelMountPath": "string",
"readinessProbe": {
"failureThreshold": 30,
"successThreshold": 1,
"timeout": "PT2S",
"period": "PT10S",
"initialDelay": "PT1S"
}
},
"systemData": {
"createdAt": "2020-01-01T12:34:56.999Z",
"createdBy": "string",
"createdByType": "User",
"lastModifiedAt": "2020-01-01T12:34:56.999Z",
"lastModifiedBy": "string",
"lastModifiedByType": "User"
},
"tags": {},
"location": "string",
"kind": "string",
"identity": {
"type": "SystemAssigned",
"principalId": "00000000-1111-2222-3333-444444444444",
"tenantId": "00000000-1111-2222-3333-444444444444",
"userAssignedIdentities": {
"string": {
"principalId": "00000000-1111-2222-3333-444444444444",
"clientId": "00000000-1111-2222-3333-444444444444"
}
}
},
"sku": {
"name": "string",
"tier": "Free",
"size": "string",
"family": "string",
"capacity": 1
}
}
Definisi
Nama | Deskripsi |
---|---|
Code |
Konfigurasi untuk aset kode penilaian. |
Collection | |
Container |
Persyaratan sumber daya untuk setiap instans kontainer dalam penyebaran online. |
Container |
|
created |
Jenis identitas yang membuat sumber daya. |
Data |
|
Data |
|
Default |
|
Deployment |
Nilai yang mungkin untuk DeploymentProvisioningState. |
Egress |
Enum untuk menentukan apakah PublicNetworkAccess Diaktifkan atau Dinonaktifkan untuk keluar dari penyebaran. |
Endpoint |
Enum untuk menentukan jenis komputasi titik akhir. |
Error |
Info tambahan kesalahan manajemen sumber daya. |
Error |
Detail kesalahan. |
Error |
Tanggapan kesalahan |
Kubernetes |
Properti khusus untuk KubernetesOnlineDeployment. |
Managed |
Properti khusus untuk ManagedOnlineDeployment. |
Managed |
Identitas layanan terkelola (identitas yang ditetapkan sistem dan/atau pengguna) |
Managed |
Jenis identitas layanan terkelola (di mana jenis SystemAssigned dan UserAssigned diizinkan). |
Online |
|
Online |
Konfigurasi permintaan penilaian penyebaran online. |
Probe |
Konfigurasi pemeriksaan keaktifan/kesiapan kontainer penyebaran. |
Request |
|
Rolling |
|
Scale |
|
Sku |
Definisi model sumber daya yang mewakili SKU |
Sku |
Bidang ini diperlukan untuk diimplementasikan oleh Penyedia Sumber Jika layanan memiliki lebih dari satu tingkat, tetapi tidak diperlukan pada PUT. |
system |
Metadata yang berkaitan dengan pembuatan dan modifikasi terakhir sumber daya. |
Target |
|
User |
Properti identitas yang ditetapkan pengguna |
CodeConfiguration
Konfigurasi untuk aset kode penilaian.
Nama | Jenis | Deskripsi |
---|---|---|
codeId |
string |
ID sumber daya ARM dari aset kode. |
scoringScript |
string minLength: 1pattern: [a-zA-Z0-9_] |
[Diperlukan] Skrip yang akan dijalankan saat startup. misalnya. "score.py" |
Collection
Nama | Jenis | Nilai default | Deskripsi |
---|---|---|---|
clientId |
string |
Id klien msi digunakan untuk mengumpulkan pengelogan ke penyimpanan blob. Jika null, backend akan memilih identitas titik akhir terdaftar untuk autentikasi. |
|
dataCollectionMode | Disabled |
Mengaktifkan atau menonaktifkan pengumpulan data. |
|
dataId |
string |
Id sumber daya arm aset data. Sisi klien akan memastikan aset data menunjuk ke penyimpanan blob, dan backend akan mengumpulkan data ke penyimpanan blob. |
|
samplingRate |
number (double) |
1 |
Tingkat pengambilan sampel untuk koleksi. Laju pengambilan sampel 1.0 berarti kami mengumpulkan 100% data secara default. |
ContainerResourceRequirements
Persyaratan sumber daya untuk setiap instans kontainer dalam penyebaran online.
Nama | Jenis | Deskripsi |
---|---|---|
containerResourceLimits |
Info batas sumber daya kontainer: |
|
containerResourceRequests |
Info permintaan sumber daya kontainer: |
ContainerResourceSettings
Nama | Jenis | Deskripsi |
---|---|---|
cpu |
string |
Jumlah permintaan/batas vCPU untuk kontainer. Info selengkapnya: https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/ |
gpu |
string |
Jumlah permintaan/batas kartu GPU Nvidia untuk kontainer. Info selengkapnya: https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/ |
memory |
string |
Permintaan/batas ukuran memori untuk kontainer. Info selengkapnya: https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/ |
createdByType
Jenis identitas yang membuat sumber daya.
Nilai | Deskripsi |
---|---|
Application | |
Key | |
ManagedIdentity | |
User |
DataCollectionMode
Nilai | Deskripsi |
---|---|
Disabled | |
Enabled |
DataCollector
Nama | Jenis | Nilai default | Deskripsi |
---|---|---|---|
collections |
<string, Collection> |
[Diperlukan] Konfigurasi koleksi. Setiap koleksi memiliki konfigurasinya sendiri untuk mengumpulkan data model dan nama koleksi dapat berupa string arbitrer. Pengumpul data model dapat digunakan untuk pengelogan payload atau pengelogan kustom atau keduanya. Permintaan dan respons pengumpulan dicadangkan untuk pengelogan payload, yang lain adalah untuk pengelogan kustom. |
|
requestLogging |
Konfigurasi pengelogan permintaan untuk mdc, termasuk pengaturan pengelogan tingkat lanjut untuk semua koleksi. Ini opsional. |
||
rollingRate | Hour |
Ketika data model dikumpulkan ke penyimpanan blob, kita perlu menggulung data ke jalur yang berbeda untuk menghindari pengelogan semuanya dalam satu file blob. Jika laju rolling adalah jam, semua data akan dikumpulkan di jalur blob /yyyy/MM/dd/HH/. Jika hari ini, semua data akan dikumpulkan di jalur blob /yyyy/MM/dd/. Manfaat lain dari jalur bergulir adalah bahwa ui pemantauan model dapat memilih rentang waktu data dengan sangat cepat. |
DefaultScaleSettings
Nama | Jenis | Deskripsi |
---|---|---|
scaleType |
string:
Default |
[Diperlukan] Jenis algoritma penskalaan penyebaran |
DeploymentProvisioningState
Nilai yang mungkin untuk DeploymentProvisioningState.
Nilai | Deskripsi |
---|---|
Canceled | |
Creating | |
Deleting | |
Failed | |
Scaling | |
Succeeded | |
Updating |
EgressPublicNetworkAccessType
Enum untuk menentukan apakah PublicNetworkAccess Diaktifkan atau Dinonaktifkan untuk keluar dari penyebaran.
Nilai | Deskripsi |
---|---|
Disabled | |
Enabled |
EndpointComputeType
Enum untuk menentukan jenis komputasi titik akhir.
Nilai | Deskripsi |
---|---|
AzureMLCompute | |
Kubernetes | |
Managed |
ErrorAdditionalInfo
Info tambahan kesalahan manajemen sumber daya.
Nama | Jenis | Deskripsi |
---|---|---|
info |
object |
Info tambahan. |
type |
string |
Jenis info tambahan. |
ErrorDetail
Detail kesalahan.
Nama | Jenis | Deskripsi |
---|---|---|
additionalInfo |
Info tambahan kesalahan. |
|
code |
string |
Kode kesalahan. |
details |
Detail kesalahan. |
|
message |
string |
Pesan kesalahan. |
target |
string |
Target kesalahan. |
ErrorResponse
Tanggapan kesalahan
Nama | Jenis | Deskripsi |
---|---|---|
error |
Objek kesalahan. |
KubernetesOnlineDeployment
Properti khusus untuk KubernetesOnlineDeployment.
Nama | Jenis | Nilai default | Deskripsi |
---|---|---|---|
appInsightsEnabled |
boolean |
False |
Jika true, mengaktifkan pengelogan Application Insights. |
codeConfiguration |
Konfigurasi kode untuk penyebaran titik akhir. |
||
containerResourceRequirements |
Persyaratan sumber daya untuk kontainer (cpu dan memori). |
||
dataCollector |
Konfigurasi mdc, kami menonaktifkan mdc saat null. |
||
description |
string |
Deskripsi penyebaran titik akhir. |
|
egressPublicNetworkAccess | Enabled |
Jika Diaktifkan, izinkan akses jaringan publik keluar. Jika Dinonaktifkan, ini akan membuat keluar aman. Default: Diaktifkan. |
|
endpointComputeType |
string:
Kubernetes |
[Diperlukan] Jenis komputasi titik akhir. |
|
environmentId |
string |
ID sumber daya ARM atau AssetId spesifikasi lingkungan untuk penyebaran titik akhir. |
|
environmentVariables |
object |
Konfigurasi variabel lingkungan untuk penyebaran. |
|
instanceType |
string |
Standard_F4s_v2 |
Jenis instans komputasi. Default: Standard_F4s_v2. |
livenessProbe |
Pemeriksaan keaktifan memantau kesehatan kontainer secara teratur. |
||
model |
string |
Jalur URI ke model. |
|
modelMountPath |
string |
Jalur untuk memasang model dalam kontainer kustom. |
|
properties |
object |
Kamus properti. Properti dapat ditambahkan, tetapi tidak dihapus atau diubah. |
|
provisioningState |
Status provisi untuk penyebaran titik akhir. |
||
readinessProbe |
Pemeriksaan kesiapan memvalidasi apakah kontainer siap melayani lalu lintas. Properti dan defaultnya sama dengan pemeriksaan keaktifan. |
||
requestSettings |
Minta pengaturan untuk penyebaran. |
||
scaleSettings | OnlineScaleSettings: |
Pengaturan skala untuk penyebaran. Jika null atau tidak disediakan, defaultnya adalah TargetUtilizationScaleSettings untuk KubernetesOnlineDeployment dan ke DefaultScaleSettings untuk ManagedOnlineDeployment. |
|
startupProbe |
Pemeriksaan startup memverifikasi apakah aplikasi dalam kontainer telah berhasil dimulai. |
ManagedOnlineDeployment
Properti khusus untuk ManagedOnlineDeployment.
Nama | Jenis | Nilai default | Deskripsi |
---|---|---|---|
appInsightsEnabled |
boolean |
False |
Jika true, mengaktifkan pengelogan Application Insights. |
codeConfiguration |
Konfigurasi kode untuk penyebaran titik akhir. |
||
dataCollector |
Konfigurasi mdc, kami menonaktifkan mdc saat null. |
||
description |
string |
Deskripsi penyebaran titik akhir. |
|
egressPublicNetworkAccess | Enabled |
Jika Diaktifkan, izinkan akses jaringan publik keluar. Jika Dinonaktifkan, ini akan membuat keluar aman. Default: Diaktifkan. |
|
endpointComputeType |
string:
Managed |
[Diperlukan] Jenis komputasi titik akhir. |
|
environmentId |
string |
ID sumber daya ARM atau AssetId spesifikasi lingkungan untuk penyebaran titik akhir. |
|
environmentVariables |
object |
Konfigurasi variabel lingkungan untuk penyebaran. |
|
instanceType |
string |
Standard_F4s_v2 |
Jenis instans komputasi. Default: Standard_F4s_v2. |
livenessProbe |
Pemeriksaan keaktifan memantau kesehatan kontainer secara teratur. |
||
model |
string |
Jalur URI ke model. |
|
modelMountPath |
string |
Jalur untuk memasang model dalam kontainer kustom. |
|
properties |
object |
Kamus properti. Properti dapat ditambahkan, tetapi tidak dihapus atau diubah. |
|
provisioningState |
Status provisi untuk penyebaran titik akhir. |
||
readinessProbe |
Pemeriksaan kesiapan memvalidasi apakah kontainer siap melayani lalu lintas. Properti dan defaultnya sama dengan pemeriksaan keaktifan. |
||
requestSettings |
Minta pengaturan untuk penyebaran. |
||
scaleSettings | OnlineScaleSettings: |
Pengaturan skala untuk penyebaran. Jika null atau tidak disediakan, defaultnya adalah TargetUtilizationScaleSettings untuk KubernetesOnlineDeployment dan ke DefaultScaleSettings untuk ManagedOnlineDeployment. |
|
startupProbe |
Pemeriksaan startup memverifikasi apakah aplikasi dalam kontainer telah berhasil dimulai. |
ManagedServiceIdentity
Identitas layanan terkelola (identitas yang ditetapkan sistem dan/atau pengguna)
Nama | Jenis | Deskripsi |
---|---|---|
principalId |
string (uuid) |
ID perwakilan layanan dari identitas yang ditetapkan sistem. Properti ini hanya akan disediakan untuk identitas yang ditetapkan sistem. |
tenantId |
string (uuid) |
ID penyewa dari identitas yang ditetapkan sistem. Properti ini hanya akan disediakan untuk identitas yang ditetapkan sistem. |
type |
Jenis identitas layanan terkelola (di mana jenis SystemAssigned dan UserAssigned diizinkan). |
|
userAssignedIdentities |
<string,
User |
Identitas User-Assigned |
ManagedServiceIdentityType
Jenis identitas layanan terkelola (di mana jenis SystemAssigned dan UserAssigned diizinkan).
Nilai | Deskripsi |
---|---|
None | |
SystemAssigned | |
SystemAssigned,UserAssigned | |
UserAssigned |
OnlineDeploymentTrackedResource
Nama | Jenis | Deskripsi |
---|---|---|
id |
string |
ID sumber daya yang sepenuhnya memenuhi syarat untuk sumber daya. Misalnya - /subscriptions/{subscriptionId}/resourceGroups/{resourceGroupName}/providers/{resourceProviderNamespace}/{resourceType}/{resourceName} |
identity |
Identitas layanan terkelola (identitas yang ditetapkan sistem dan/atau pengguna) |
|
kind |
string |
Metadata yang digunakan oleh portal/peralatan/dll untuk merender pengalaman UX yang berbeda untuk sumber daya dengan jenis yang sama. |
location |
string |
Lokasi geografis tempat sumber daya berada |
name |
string |
Nama sumber daya |
properties | OnlineDeployment: |
[Diperlukan] Atribut tambahan entitas. |
sku |
Detail Sku diperlukan untuk kontrak ARM untuk Autoscaling. |
|
systemData |
Metadata Azure Resource Manager yang berisi informasi createBy dan modifiedBy. |
|
tags |
object |
Tag sumber daya. |
type |
string |
Jenis sumber daya. Misalnya, "Microsoft.Compute/virtualMachines" atau "Microsoft.Storage/storageAccounts" |
OnlineRequestSettings
Konfigurasi permintaan penilaian penyebaran online.
Nama | Jenis | Nilai default | Deskripsi |
---|---|---|---|
maxConcurrentRequestsPerInstance |
integer (int32) |
1 |
Jumlah permintaan bersamaan maksimum per simpul yang diizinkan per penyebaran. Default ke 1. |
maxQueueWait |
string (duration) |
PT0.5S |
(Tidak digunakan lagi untuk Titik Akhir Online Terkelola) Jumlah maksimum waktu permintaan akan tetap dalam antrean dalam format ISO 8601.
Default ke 500ms.
(Sekarang tingkatkan |
requestTimeout |
string (duration) |
PT5S |
Batas waktu penilaian dalam format ISO 8601. Default ke 5000ms. |
ProbeSettings
Konfigurasi pemeriksaan keaktifan/kesiapan kontainer penyebaran.
Nama | Jenis | Nilai default | Deskripsi |
---|---|---|---|
failureThreshold |
integer (int32) |
30 |
Jumlah kegagalan yang diizinkan sebelum mengembalikan status tidak sehat. |
initialDelay |
string (duration) |
Penundaan sebelum pemeriksaan pertama dalam format ISO 8601. |
|
period |
string (duration) |
PT10S |
Lamanya waktu antara pemeriksaan dalam format ISO 8601. |
successThreshold |
integer (int32) |
1 |
Jumlah pemeriksaan yang berhasil sebelum mengembalikan status sehat. |
timeout |
string (duration) |
PT2S |
Batas waktu pemeriksaan dalam format ISO 8601. |
RequestLogging
Nama | Jenis | Deskripsi |
---|---|---|
captureHeaders |
string[] |
Untuk pengelogan payload, kami hanya mengumpulkan payload secara default. Jika pelanggan juga ingin mengumpulkan header yang ditentukan, mereka dapat mengaturnya di captureHeaders sehingga backend akan mengumpulkan header tersebut bersama dengan payload. |
RollingRateType
Nilai | Deskripsi |
---|---|
Day | |
Hour | |
Minute | |
Month | |
Year |
ScaleType
Nilai | Deskripsi |
---|---|
Default | |
TargetUtilization |
Sku
Definisi model sumber daya yang mewakili SKU
Nama | Jenis | Deskripsi |
---|---|---|
capacity |
integer (int32) |
Jika SKU mendukung peluasan skala/masuk, bilangan bulat kapasitas harus disertakan. Jika peluasan/masuk skala tidak dimungkinkan untuk sumber daya, ini dapat dihilangkan. |
family |
string |
Jika layanan memiliki generasi perangkat keras yang berbeda, untuk SKU yang sama, maka itu dapat ditangkap di sini. |
name |
string |
Nama SKU. Ex - P3. Biasanya kode huruf+angka |
size |
string |
Ukuran SKU. Ketika bidang nama adalah kombinasi tingkatan dan beberapa nilai lainnya, ini akan menjadi kode mandiri. |
tier |
Bidang ini diperlukan untuk diimplementasikan oleh Penyedia Sumber Jika layanan memiliki lebih dari satu tingkat, tetapi tidak diperlukan pada PUT. |
SkuTier
Bidang ini diperlukan untuk diimplementasikan oleh Penyedia Sumber Jika layanan memiliki lebih dari satu tingkat, tetapi tidak diperlukan pada PUT.
Nilai | Deskripsi |
---|---|
Basic | |
Free | |
Premium | |
Standard |
systemData
Metadata yang berkaitan dengan pembuatan dan modifikasi terakhir sumber daya.
Nama | Jenis | Deskripsi |
---|---|---|
createdAt |
string (date-time) |
Tanda waktu pembuatan sumber daya (UTC). |
createdBy |
string |
Identitas yang membuat sumber daya. |
createdByType |
Jenis identitas yang membuat sumber daya. |
|
lastModifiedAt |
string (date-time) |
Tanda waktu modifikasi terakhir sumber daya (UTC) |
lastModifiedBy |
string |
Identitas yang terakhir mengubah sumber daya. |
lastModifiedByType |
Jenis identitas yang terakhir memodifikasi sumber daya. |
TargetUtilizationScaleSettings
Nama | Jenis | Nilai default | Deskripsi |
---|---|---|---|
maxInstances |
integer (int32) |
1 |
Jumlah maksimum instans yang dapat diskalakan oleh penyebaran. Kuota akan dicadangkan untuk max_instances. |
minInstances |
integer (int32) |
1 |
Jumlah minimum instans yang akan selalu ada. |
pollingInterval |
string (duration) |
PT1S |
Interval polling dalam format ISO 8691. Hanya mendukung durasi dengan presisi serendah Detik. |
scaleType |
string:
Target |
[Diperlukan] Jenis algoritma penskalaan penyebaran |
|
targetUtilizationPercentage |
integer (int32) |
70 |
Targetkan penggunaan CPU untuk autoscaler. |
UserAssignedIdentity
Properti identitas yang ditetapkan pengguna
Nama | Jenis | Deskripsi |
---|---|---|
clientId |
string (uuid) |
ID klien dari identitas yang ditetapkan. |
principalId |
string (uuid) |
ID utama identitas yang ditetapkan. |