Online Deployments - List
Vypíše nasazení koncových bodů odvozování.
GET https://management.azure.com/subscriptions/{subscriptionId}/resourceGroups/{resourceGroupName}/providers/Microsoft.MachineLearningServices/workspaces/{workspaceName}/onlineEndpoints/{endpointName}/deployments?api-version=2025-12-01
GET https://management.azure.com/subscriptions/{subscriptionId}/resourceGroups/{resourceGroupName}/providers/Microsoft.MachineLearningServices/workspaces/{workspaceName}/onlineEndpoints/{endpointName}/deployments?api-version=2025-12-01&$orderBy={$orderBy}&$top={$top}&$skip={$skip}
Parametry identifikátoru URI
| Name | V | Vyžadováno | Typ | Description |
|---|---|---|---|---|
|
endpoint
|
path | True |
string |
Název online koncového bodu |
|
resource
|
path | True |
string minLength: 1maxLength: 90 |
Název skupiny prostředků. Název nerozlišuje malá a velká písmena. |
|
subscription
|
path | True |
string minLength: 1 |
ID cílového předplatného. |
|
workspace
|
path | True |
string pattern: ^[a-zA-Z0-9][a-zA-Z0-9_-]{2,32}$ |
Název pracovního prostoru služby Azure Machine Learning |
|
api-version
|
query | True |
string minLength: 1 |
Verze rozhraní API, která se má použít pro tuto operaci. |
|
$order
|
query |
string |
Řazení seznamu |
|
|
$skip
|
query |
string |
Token pokračování pro stránkování |
|
|
$top
|
query |
integer (int32) |
Začátek seznamu |
Odpovědi
| Name | Typ | Description |
|---|---|---|
| 200 OK |
Operace Azure byla úspěšně dokončena. |
|
| Other Status Codes |
Neočekávaná chybová odpověď |
Zabezpečení
azure_auth
Tok Azure Active Directory OAuth2.
Typ:
oauth2
Tok:
implicit
URL autorizace:
https://login.microsoftonline.com/common/oauth2/authorize
Rozsahy
| Name | Description |
|---|---|
| user_impersonation | zosobnění uživatelského účtu |
Příklady
List Online Deployments.
Ukázkový požadavek
GET https://management.azure.com/subscriptions/00000000-1111-2222-3333-444444444444/resourceGroups/test-rg/providers/Microsoft.MachineLearningServices/workspaces/my-aml-workspace/onlineEndpoints/testEndpointName/deployments?api-version=2025-12-01&$orderBy=string&$top=1
Ukázková odpověď
{
"nextLink": "https://management.azure.com/subscriptions/34adfa4f-cedf-4dc0-ba29-b6d1a69ab345/resourceGroups/testrg123/providers/Microsoft.MachineLearningServices/workspaces/my-aml-workspace/onlineEndpoints/testEndpointName/deployments?api-version=2025-07-01-preview&$skip=2",
"value": [
{
"name": "string",
"type": "string",
"id": "string",
"identity": {
"type": "SystemAssigned",
"principalId": "00000000-1111-2222-3333-444444444444",
"tenantId": "00000000-1111-2222-3333-444444444444",
"userAssignedIdentities": {
"string": {
"clientId": "00000000-1111-2222-3333-444444444444",
"principalId": "00000000-1111-2222-3333-444444444444"
}
}
},
"kind": "string",
"location": "string",
"properties": {
"description": "string",
"appInsightsEnabled": false,
"codeConfiguration": {
"codeId": "string",
"scoringScript": "string"
},
"containerResourceRequirements": {
"containerResourceLimits": {
"cpu": "\"1\"",
"gpu": "\"1\"",
"memory": "\"2Gi\""
},
"containerResourceRequests": {
"cpu": "\"1\"",
"gpu": "\"1\"",
"memory": "\"2Gi\""
}
},
"endpointComputeType": "Kubernetes",
"environmentId": "string",
"environmentVariables": {
"string": "string"
},
"instanceType": "string",
"livenessProbe": {
"failureThreshold": 1,
"initialDelay": "PT5M",
"period": "PT5M",
"successThreshold": 1,
"timeout": "PT5M"
},
"model": "string",
"modelMountPath": "string",
"properties": {
"string": "string"
},
"provisioningState": "Creating",
"requestSettings": {
"maxConcurrentRequestsPerInstance": 1,
"maxQueueWait": "PT5M",
"requestTimeout": "PT5M"
},
"scaleSettings": {
"scaleType": "Default"
}
},
"sku": {
"name": "string",
"capacity": 1,
"family": "string",
"size": "string",
"tier": "Free"
},
"systemData": {
"createdAt": "2020-01-01T12:34:56.999Z",
"createdBy": "string",
"createdByType": "User",
"lastModifiedAt": "2020-01-01T12:34:56.999Z",
"lastModifiedBy": "string",
"lastModifiedByType": "User"
},
"tags": {}
}
]
}
Definice
| Name | Description |
|---|---|
|
Code |
Konfigurace pro prostředek bodovacího kódu. |
| Collection | |
|
Container |
Požadavky na prostředky pro každou instanci kontejneru v rámci online nasazení. |
|
Container |
|
|
created |
Typ identity, která prostředek vytvořila. |
|
Data |
Povolte nebo zakažte shromažďování dat. |
|
Data |
|
|
Default |
|
|
Deployment |
Možné hodnoty pro DeploymentProvisioningState. |
|
Egress |
Výčet k určení, zda je PublicNetworkAccess povolen nebo zakázán pro výchozí přenos dat. |
|
Endpoint |
Výčet určující typ výpočetního typu koncového bodu |
|
Error |
Chyba správy zdrojů další informace. |
|
Error |
Detail chyby. |
|
Error |
Chybová odpověď |
|
Kubernetes |
Vlastnosti specifické pro KubernetesOnlineDeployment. |
|
Managed |
Vlastnosti specifické pro ManagedOnlineDeployment. |
|
Managed |
Identita spravované služby (identita přiřazená systémem nebo identita přiřazená uživatelem) |
|
Managed |
Typ identity spravované služby (kde jsou povolené typy SystemAssigned i UserAssigned). |
|
Online |
Konkrétní sledované typy prostředků lze vytvořit aliasem tohoto typu pomocí konkrétního typu vlastnosti. |
|
Online |
Stránkovaný seznam entit OnlineDeployment. |
|
Online |
Konfigurace požadavků na bodování online nasazení. |
|
Probe |
Konfigurace sondy živosti/připravenosti kontejneru nasazení. |
|
Request |
|
|
Rolling |
Když se data modelu shromažďují do úložiště objektů blob, musíme data vrátit do jiné cesty, abychom se vyhnuli protokolování všech v jednom souboru objektu blob. Pokud je průběžná rychlost hodina, budou se všechna data shromažďovat v cestě k objektu blob /yyyy/MM/dd/HH/. Pokud je den, budou se všechna data shromažďovat v cestě k objektu blob /yyyy/MM/dd/. Další výhodou postupné cesty je, že uživatelské rozhraní pro monitorování modelů dokáže velmi rychle vybrat časový rozsah dat. |
|
Scale |
|
| Sku |
Definice modelu prostředků představující skladovou položku |
|
Sku |
Toto pole musí implementovat poskytovatel prostředků, pokud má služba více než jednu úroveň, ale nevyžaduje se u put. |
|
system |
Metadata týkající se vytvoření a poslední změny prostředku. |
|
Target |
|
|
User |
Vlastnosti identity přiřazené uživatelem |
CodeConfiguration
Konfigurace pro prostředek bodovacího kódu.
| Name | Typ | Description |
|---|---|---|
| codeId |
string |
ID prostředku ARM prostředku kódu |
| scoringScript |
string minLength: 1pattern: [a-zA-Z0-9_] |
[Povinné] Skript, který se má spustit při spuštění. eg. "score.py" |
Collection
| Name | Typ | Default value | Description |
|---|---|---|---|
| clientId |
string |
ID klienta MSI sloužící ke shromažďování protokolování do úložiště objektů blob. Pokud má hodnotu null, back-end vybere zaregistrovanou identitu koncového bodu k ověření. |
|
| dataCollectionMode | Disabled |
Povolte nebo zakažte shromažďování dat. |
|
| dataId |
string |
ID prostředku arm datového assetu. Na straně klienta se zajistí, že datový prostředek ukazuje na úložiště objektů blob a back-end bude shromažďovat data do úložiště objektů blob. |
|
| samplingRate |
number (double) |
1 |
Vzorkovací frekvence pro kolekci Vzorkovací frekvence 1,0 znamená, že ve výchozím nastavení shromažďujeme 100% dat. |
ContainerResourceRequirements
Požadavky na prostředky pro každou instanci kontejneru v rámci online nasazení.
| Name | Typ | Description |
|---|---|---|
| containerResourceLimits |
Informace o limitu prostředků kontejneru: |
|
| containerResourceRequests |
Informace o požadavku na prostředek kontejneru: |
ContainerResourceSettings
| Name | Typ | Description |
|---|---|---|
| cpu |
string |
Počet požadavků nebo limitu počtu vCPU pro kontejner Další informace: https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/ |
| gpu |
string |
Počet požadavků nebo omezení karet Nvidia GPU pro kontejner Další informace: https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/ |
| memory |
string |
Požadavek nebo limit velikosti paměti pro kontejner. Další informace: https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/ |
createdByType
Typ identity, která prostředek vytvořila.
| Hodnota | Description |
|---|---|
| User | |
| Application | |
| ManagedIdentity | |
| Key |
DataCollectionMode
Povolte nebo zakažte shromažďování dat.
| Hodnota | Description |
|---|---|
| Enabled | |
| Disabled |
DataCollector
| Name | Typ | Default value | Description |
|---|---|---|---|
| collections |
<string, Collection> |
[Povinné] Konfigurace kolekce. Každá kolekce má vlastní konfiguraci pro shromažďování dat modelu a název kolekce může být libovolný řetězec. Kolektor dat modelu se dá použít buď pro protokolování datové části, nebo pro vlastní protokolování, nebo pro obojí. Požadavek na kolekci a odpověď jsou vyhrazené pro protokolování datové části, jiné jsou určené pro vlastní protokolování. |
|
| requestLogging |
Konfigurace protokolování požadavků pro mdc zahrnuje upřesňující nastavení protokolování pro všechny kolekce. Je nepovinný. |
||
| rollingRate | Hour |
Když se data modelu shromažďují do úložiště objektů blob, musíme data vrátit do jiné cesty, abychom se vyhnuli protokolování všech v jednom souboru objektu blob. Pokud je průběžná rychlost hodina, budou se všechna data shromažďovat v cestě k objektu blob /yyyy/MM/dd/HH/. Pokud je den, budou se všechna data shromažďovat v cestě k objektu blob /yyyy/MM/dd/. Další výhodou postupné cesty je, že uživatelské rozhraní pro monitorování modelů dokáže velmi rychle vybrat časový rozsah dat. |
DefaultScaleSettings
| Name | Typ | Description |
|---|---|---|
| scaleType |
string:
Default |
[Povinné] Typ algoritmu škálování nasazení |
DeploymentProvisioningState
Možné hodnoty pro DeploymentProvisioningState.
| Hodnota | Description |
|---|---|
| Creating | |
| Deleting | |
| Scaling | |
| Updating | |
| Succeeded | |
| Failed | |
| Canceled |
EgressPublicNetworkAccessType
Výčet k určení, zda je PublicNetworkAccess povolen nebo zakázán pro výchozí přenos dat.
| Hodnota | Description |
|---|---|
| Enabled | |
| Disabled |
EndpointComputeType
Výčet určující typ výpočetního typu koncového bodu
| Hodnota | Description |
|---|---|
| Managed | |
| Kubernetes | |
| AzureMLCompute |
ErrorAdditionalInfo
Chyba správy zdrojů další informace.
| Name | Typ | Description |
|---|---|---|
| info |
object |
Další informace. |
| type |
string |
Typ doplňkových informací. |
ErrorDetail
Detail chyby.
| Name | Typ | Description |
|---|---|---|
| additionalInfo |
Chyba další informace. |
|
| code |
string |
Kód chyby. |
| details |
Podrobnosti o chybě. |
|
| message |
string |
Chybová zpráva. |
| target |
string |
Cíl chyby. |
ErrorResponse
Chybová odpověď
| Name | Typ | Description |
|---|---|---|
| error |
Objekt chyby. |
KubernetesOnlineDeployment
Vlastnosti specifické pro KubernetesOnlineDeployment.
| Name | Typ | Default value | Description |
|---|---|---|---|
| appInsightsEnabled |
boolean |
False |
Pokud je pravda, povolí protokolování Application Insights. |
| codeConfiguration |
Konfigurace kódu pro nasazení koncového bodu |
||
| containerResourceRequirements |
Požadavky na prostředky pro kontejner (procesor a paměť). |
||
| dataCollector |
Konfigurace mdc zakážeme mdc, když má hodnotu null. |
||
| description |
string |
Popis nasazení koncového bodu |
|
| egressPublicNetworkAccess | Enabled |
Výčet k určení, zda je PublicNetworkAccess povolen nebo zakázán pro výchozí přenos dat. |
|
| endpointComputeType |
string:
Kubernetes |
[Povinné] Typ výpočetního objektu koncového bodu. |
|
| environmentId |
string |
ID prostředku ARM nebo AssetId specifikace prostředí pro nasazení koncového bodu |
|
| environmentVariables |
object |
Konfigurace proměnných prostředí pro nasazení |
|
| instanceType |
string |
Standard_F4s_v2 |
Typ výpočetní instance. Výchozí hodnota: Standard_F4s_v2. |
| livenessProbe |
Sonda aktivity pravidelně monitoruje stav kontejneru. |
||
| model |
string |
Cesta URI k modelu. |
|
| modelMountPath |
string |
Cesta k připojení modelu ve vlastním kontejneru. |
|
| properties |
object |
Slovník vlastností Vlastnosti lze přidat, ale ne odebrat nebo změnit. |
|
| provisioningState |
Stav zřizování pro nasazení koncového bodu. |
||
| readinessProbe |
Sonda připravenosti ověří, jestli je kontejner připravený obsluhovat provoz. Vlastnosti a výchozí hodnoty jsou stejné jako sonda aktivity. |
||
| requestSettings |
Požádejte o nastavení nasazení. |
||
| scaleSettings | OnlineScaleSettings: |
Nastavení škálování pro nasazení Pokud je null nebo není zadaná, použije se výchozí hodnota TargetUtilizationScaleSettings pro KubernetesOnlineDeployment a DefaultScaleSettings pro ManagedOnlineDeployment. |
|
| startupProbe |
Sonda spuštění ověří, jestli se aplikace v kontejneru úspěšně spustila. |
ManagedOnlineDeployment
Vlastnosti specifické pro ManagedOnlineDeployment.
| Name | Typ | Default value | Description |
|---|---|---|---|
| appInsightsEnabled |
boolean |
False |
Pokud je pravda, povolí protokolování Application Insights. |
| codeConfiguration |
Konfigurace kódu pro nasazení koncového bodu |
||
| dataCollector |
Konfigurace mdc zakážeme mdc, když má hodnotu null. |
||
| description |
string |
Popis nasazení koncového bodu |
|
| egressPublicNetworkAccess | Enabled |
Výčet k určení, zda je PublicNetworkAccess povolen nebo zakázán pro výchozí přenos dat. |
|
| endpointComputeType |
string:
Managed |
[Povinné] Typ výpočetního objektu koncového bodu. |
|
| environmentId |
string |
ID prostředku ARM nebo AssetId specifikace prostředí pro nasazení koncového bodu |
|
| environmentVariables |
object |
Konfigurace proměnných prostředí pro nasazení |
|
| instanceType |
string |
Standard_F4s_v2 |
Typ výpočetní instance. Výchozí hodnota: Standard_F4s_v2. |
| livenessProbe |
Sonda aktivity pravidelně monitoruje stav kontejneru. |
||
| model |
string |
Cesta URI k modelu. |
|
| modelMountPath |
string |
Cesta k připojení modelu ve vlastním kontejneru. |
|
| properties |
object |
Slovník vlastností Vlastnosti lze přidat, ale ne odebrat nebo změnit. |
|
| provisioningState |
Stav zřizování pro nasazení koncového bodu. |
||
| readinessProbe |
Sonda připravenosti ověří, jestli je kontejner připravený obsluhovat provoz. Vlastnosti a výchozí hodnoty jsou stejné jako sonda aktivity. |
||
| requestSettings |
Požádejte o nastavení nasazení. |
||
| scaleSettings | OnlineScaleSettings: |
Nastavení škálování pro nasazení Pokud je null nebo není zadaná, použije se výchozí hodnota TargetUtilizationScaleSettings pro KubernetesOnlineDeployment a DefaultScaleSettings pro ManagedOnlineDeployment. |
|
| startupProbe |
Sonda spuštění ověří, jestli se aplikace v kontejneru úspěšně spustila. |
ManagedServiceIdentity
Identita spravované služby (identita přiřazená systémem nebo identita přiřazená uživatelem)
| Name | Typ | Description |
|---|---|---|
| principalId |
string (uuid) |
ID instančního objektu identity přiřazené systémem. Tato vlastnost bude poskytována pouze pro identitu přiřazenou systémem. |
| tenantId |
string (uuid) |
ID tenanta přiřazené identity systému. Tato vlastnost bude poskytována pouze pro identitu přiřazenou systémem. |
| type |
Typ identity spravované služby (kde jsou povolené typy SystemAssigned i UserAssigned). |
|
| userAssignedIdentities |
<string,
User |
identity User-Assigned |
ManagedServiceIdentityType
Typ identity spravované služby (kde jsou povolené typy SystemAssigned i UserAssigned).
| Hodnota | Description |
|---|---|
| None | |
| SystemAssigned | |
| UserAssigned | |
| SystemAssigned,UserAssigned |
OnlineDeployment
Konkrétní sledované typy prostředků lze vytvořit aliasem tohoto typu pomocí konkrétního typu vlastnosti.
| Name | Typ | Description |
|---|---|---|
| id |
string |
Plně kvalifikované ID prostředku pro prostředek. Příklad : /subscriptions/{subscriptionId}/resourceGroups/{resourceGroupName}/providers/{resourceProviderNamespace}/{resourceType}/{resourceName} |
| identity |
Identita spravované služby (identita přiřazená systémem nebo identita přiřazená uživatelem) |
|
| kind |
string |
Metadata používaná portálem, nástroji atd. k vykreslení různých prostředí uživatelského rozhraní pro prostředky stejného typu. |
| location |
string |
Geografické umístění, ve kterém se nachází zdroj |
| name |
string |
Název prostředku |
| properties | OnlineDeploymentProperties: |
[Povinné] Další atributy entity. |
| sku |
Podrobnosti skladové položky vyžadované pro kontrakt ARM pro automatické škálování |
|
| systemData |
Metadata služby Azure Resource Manager obsahující informace o tom, kdo jej vytvořil a upravil. |
|
| tags |
object |
Značky prostředků |
| type |
string |
Typ prostředku. Např. "Microsoft.Compute/virtualMachines" nebo "Microsoft.Storage/storageAccounts" |
OnlineDeploymentTrackedResourceArmPaginatedResult
Stránkovaný seznam entit OnlineDeployment.
| Name | Typ | Description |
|---|---|---|
| nextLink |
string (uri) |
Odkaz na další stránku položek |
| value |
Položky OnlineDeployment na této stránce |
OnlineRequestSettings
Konfigurace požadavků na bodování online nasazení.
| Name | Typ | Default value | Description |
|---|---|---|---|
| maxConcurrentRequestsPerInstance |
integer (int32) |
1 |
Počet maximálních souběžných požadavků na uzel povolený pro každé nasazení. Výchozí hodnota je 1. |
| maxQueueWait |
string (duration) |
PT0.5S |
(Zastaralé pro spravované online koncové body) Maximální doba, po kterou požadavek zůstane ve frontě ve formátu ISO 8601.
Výchozí hodnota je 500 ms.
(Nyní zvyšte úroveň |
| requestTimeout |
string (duration) |
PT5S |
Časový limit bodování ve formátu ISO 8601. Výchozí hodnota je 5000 ms. |
ProbeSettings
Konfigurace sondy živosti/připravenosti kontejneru nasazení.
| Name | Typ | Default value | Description |
|---|---|---|---|
| failureThreshold |
integer (int32) |
30 |
Počet chyb, které se mají povolit před vrácením stavu, který není v pořádku. |
| initialDelay |
string (duration) |
Zpoždění před první sondou ve formátu ISO 8601. |
|
| period |
string (duration) |
PT10S |
Doba mezi sondami ve formátu ISO 8601. |
| successThreshold |
integer (int32) |
1 |
Počet úspěšných sond před vrácením stavu v pořádku. |
| timeout |
string (duration) |
PT2S |
Časový limit sondy ve formátu ISO 8601. |
RequestLogging
| Name | Typ | Description |
|---|---|---|
| captureHeaders |
string[] |
Pro protokolování datové části shromažďujeme ve výchozím nastavení pouze datovou část. Pokud zákazníci také chtějí shromažďovat zadaná záhlaví, mohou je nastavit v captureHeaders tak, aby back-end tyto hlavičky shromažďoval spolu s datovou částí. |
RollingRateType
Když se data modelu shromažďují do úložiště objektů blob, musíme data vrátit do jiné cesty, abychom se vyhnuli protokolování všech v jednom souboru objektu blob. Pokud je průběžná rychlost hodina, budou se všechna data shromažďovat v cestě k objektu blob /yyyy/MM/dd/HH/. Pokud je den, budou se všechna data shromažďovat v cestě k objektu blob /yyyy/MM/dd/. Další výhodou postupné cesty je, že uživatelské rozhraní pro monitorování modelů dokáže velmi rychle vybrat časový rozsah dat.
| Hodnota | Description |
|---|---|
| Year | |
| Month | |
| Day | |
| Hour | |
| Minute |
ScaleType
| Hodnota | Description |
|---|---|
| Default | |
| TargetUtilization |
Sku
Definice modelu prostředků představující skladovou položku
| Name | Typ | Description |
|---|---|---|
| capacity |
integer (int32) |
Pokud skladová položka podporuje horizontální navýšení/snížení kapacity, měla by být zahrnuta celá čísla kapacity. Pokud není pro prostředek možné horizontální navýšení kapacity nebo jeho snížení kapacity, může se tento parametr vynechat. |
| family |
string |
Pokud má služba různé generace hardwaru, pro stejnou skladovou položku, můžete ji zde zachytit. |
| name |
string |
Název skladové položky. Ex - P3. Obvykle se jedná o písmeno+číslo. |
| size |
string |
Velikost skladové položky. Pokud je pole název kombinací vrstvy a jiné hodnoty, jedná se o samostatný kód. |
| tier |
Toto pole musí implementovat poskytovatel prostředků, pokud má služba více než jednu úroveň, ale nevyžaduje se u put. |
SkuTier
Toto pole musí implementovat poskytovatel prostředků, pokud má služba více než jednu úroveň, ale nevyžaduje se u put.
| Hodnota | Description |
|---|---|
| Free | |
| Basic | |
| Standard | |
| Premium |
systemData
Metadata týkající se vytvoření a poslední změny prostředku.
| Name | Typ | Description |
|---|---|---|
| createdAt |
string (date-time) |
Časové razítko vytvoření prostředku (UTC). |
| createdBy |
string |
Identita, která prostředek vytvořila. |
| createdByType |
Typ identity, která prostředek vytvořila. |
|
| lastModifiedAt |
string (date-time) |
Časové razítko poslední změny zdroje (UTC) |
| lastModifiedBy |
string |
Identita, která naposledy změnila prostředek. |
| lastModifiedByType |
Typ identity, která naposledy změnila prostředek. |
TargetUtilizationScaleSettings
| Name | Typ | Default value | Description |
|---|---|---|---|
| maxInstances |
integer (int32) |
1 |
Maximální počet instancí, na které se může nasazení škálovat. Kvóta bude vyhrazena pro max_instances. |
| minInstances |
integer (int32) |
1 |
Minimální početinstancíchch |
| pollingInterval |
string (duration) |
PT1S |
Interval dotazování ve formátu ISO 8691. Podporuje pouze dobu trvání s přesností v sekundách. |
| scaleType |
string:
Target |
[Povinné] Typ algoritmu škálování nasazení |
|
| targetUtilizationPercentage |
integer (int32) |
70 |
Cílové využití procesoru pro automatické škálování |
UserAssignedIdentity
Vlastnosti identity přiřazené uživatelem
| Name | Typ | Description |
|---|---|---|
| clientId |
string (uuid) |
ID klienta přiřazené identity. |
| principalId |
string (uuid) |
ID objektu zabezpečení přiřazené identity. |