Online Deployments - List
Visa en lista över distributioner av inferensslutpunkter.
GET https://management.azure.com/subscriptions/{subscriptionId}/resourceGroups/{resourceGroupName}/providers/Microsoft.MachineLearningServices/workspaces/{workspaceName}/onlineEndpoints/{endpointName}/deployments?api-version=2025-12-01
GET https://management.azure.com/subscriptions/{subscriptionId}/resourceGroups/{resourceGroupName}/providers/Microsoft.MachineLearningServices/workspaces/{workspaceName}/onlineEndpoints/{endpointName}/deployments?api-version=2025-12-01&$orderBy={$orderBy}&$top={$top}&$skip={$skip}
URI-parametrar
| Namn | I | Krävs | Typ | Beskrivning |
|---|---|---|---|---|
|
endpoint
|
path | True |
string |
Onlineslutpunktsnamn. |
|
resource
|
path | True |
string minLength: 1maxLength: 90 |
Namnet på resursgruppen. Namnet är skiftlägesokänsligt. |
|
subscription
|
path | True |
string minLength: 1 |
ID för målprenumerationen. |
|
workspace
|
path | True |
string pattern: ^[a-zA-Z0-9][a-zA-Z0-9_-]{2,32}$ |
Namn på Azure Machine Learning-arbetsyta |
|
api-version
|
query | True |
string minLength: 1 |
Den API-version som ska användas för den här åtgärden. |
|
$order
|
query |
string |
Ordningen på listan. |
|
|
$skip
|
query |
string |
Fortsättningstoken för sidnumrering. |
|
|
$top
|
query |
integer (int32) |
Överst i listan. |
Svaren
| Namn | Typ | Beskrivning |
|---|---|---|
| 200 OK |
Azure-åtgärden har slutförts. |
|
| Other Status Codes |
Ett oväntat felsvar. |
Säkerhet
azure_auth
Azure Active Directory OAuth2-flöde.
Typ:
oauth2
Rinna:
implicit
Auktorisations-URL:
https://login.microsoftonline.com/common/oauth2/authorize
Scope
| Namn | Beskrivning |
|---|---|
| user_impersonation | personifiera ditt användarkonto |
Exempel
List Online Deployments.
Exempelförfrågan
GET https://management.azure.com/subscriptions/00000000-1111-2222-3333-444444444444/resourceGroups/test-rg/providers/Microsoft.MachineLearningServices/workspaces/my-aml-workspace/onlineEndpoints/testEndpointName/deployments?api-version=2025-12-01&$orderBy=string&$top=1
Exempelsvar
{
"nextLink": "https://management.azure.com/subscriptions/34adfa4f-cedf-4dc0-ba29-b6d1a69ab345/resourceGroups/testrg123/providers/Microsoft.MachineLearningServices/workspaces/my-aml-workspace/onlineEndpoints/testEndpointName/deployments?api-version=2025-07-01-preview&$skip=2",
"value": [
{
"name": "string",
"type": "string",
"id": "string",
"identity": {
"type": "SystemAssigned",
"principalId": "00000000-1111-2222-3333-444444444444",
"tenantId": "00000000-1111-2222-3333-444444444444",
"userAssignedIdentities": {
"string": {
"clientId": "00000000-1111-2222-3333-444444444444",
"principalId": "00000000-1111-2222-3333-444444444444"
}
}
},
"kind": "string",
"location": "string",
"properties": {
"description": "string",
"appInsightsEnabled": false,
"codeConfiguration": {
"codeId": "string",
"scoringScript": "string"
},
"containerResourceRequirements": {
"containerResourceLimits": {
"cpu": "\"1\"",
"gpu": "\"1\"",
"memory": "\"2Gi\""
},
"containerResourceRequests": {
"cpu": "\"1\"",
"gpu": "\"1\"",
"memory": "\"2Gi\""
}
},
"endpointComputeType": "Kubernetes",
"environmentId": "string",
"environmentVariables": {
"string": "string"
},
"instanceType": "string",
"livenessProbe": {
"failureThreshold": 1,
"initialDelay": "PT5M",
"period": "PT5M",
"successThreshold": 1,
"timeout": "PT5M"
},
"model": "string",
"modelMountPath": "string",
"properties": {
"string": "string"
},
"provisioningState": "Creating",
"requestSettings": {
"maxConcurrentRequestsPerInstance": 1,
"maxQueueWait": "PT5M",
"requestTimeout": "PT5M"
},
"scaleSettings": {
"scaleType": "Default"
}
},
"sku": {
"name": "string",
"capacity": 1,
"family": "string",
"size": "string",
"tier": "Free"
},
"systemData": {
"createdAt": "2020-01-01T12:34:56.999Z",
"createdBy": "string",
"createdByType": "User",
"lastModifiedAt": "2020-01-01T12:34:56.999Z",
"lastModifiedBy": "string",
"lastModifiedByType": "User"
},
"tags": {}
}
]
}
Definitioner
| Namn | Beskrivning |
|---|---|
|
Code |
Konfiguration för en bedömningskodtillgång. |
| Collection | |
|
Container |
Resurskrav för varje containerinstans i en onlinedistribution. |
|
Container |
|
|
created |
Den typ av identitet som skapade resursen. |
|
Data |
Aktivera eller inaktivera datainsamling. |
|
Data |
|
|
Default |
|
|
Deployment |
Möjliga värden för DeploymentProvisioningState. |
|
Egress |
Räkna upp för att avgöra om PublicNetworkAccess är aktiverat eller inaktiverat för utgående trafik från en distribution. |
|
Endpoint |
Räkna upp för att fastställa beräkningstyp för slutpunkter. |
|
Error |
Ytterligare information om resurshanteringsfelet. |
|
Error |
Felinformationen. |
|
Error |
Felsvar |
|
Kubernetes |
Egenskaper som är specifika för en KubernetesOnlineDeployment. |
|
Managed |
Egenskaper som är specifika för en ManagedOnlineDeployment. |
|
Managed |
Hanterad tjänstidentitet (systemtilldelade och/eller användartilldelade identiteter) |
|
Managed |
Typ av hanterad tjänstidentitet (där både SystemAssigned- och UserAssigned-typer tillåts). |
|
Online |
Konkreta spårade resurstyper kan skapas genom att aliasisera den här typen med hjälp av en specifik egenskapstyp. |
|
Online |
En sidnumrerad lista över OnlineDeployment-entiteter. |
|
Online |
Konfiguration av onlinedistributionsbedömningsbegäranden. |
|
Probe |
Konfiguration av distributionscontainerns liveness/readiness probe. |
|
Request |
|
|
Rolling |
När modelldata samlas in till bloblagring måste vi distribuera data till en annan sökväg för att undvika att logga dem alla i en enda blobfil. Om den löpande hastigheten är timme samlas alla data in i blobsökvägen /åååå/MM/dd/HH/. Om det är dag samlas alla data in i blobsökvägen /åååå/MM/dd/. Den andra fördelen med rullande sökväg är att användargränssnittet för modellövervakning kan välja ett tidsintervall med data mycket snabbt. |
|
Scale |
|
| Sku |
Resursmodelldefinitionen som representerar SKU |
|
Sku |
Det här fältet måste implementeras av resursprovidern om tjänsten har mer än en nivå, men inte krävs på en PUT. |
|
system |
Metadata som rör skapande och senaste ändring av resursen. |
|
Target |
|
|
User |
Användartilldelade identitetsegenskaper |
CodeConfiguration
Konfiguration för en bedömningskodtillgång.
| Namn | Typ | Beskrivning |
|---|---|---|
| codeId |
string |
ARM-resurs-ID för kodtillgången. |
| scoringScript |
string minLength: 1pattern: [a-zA-Z0-9_] |
[Krävs] Skriptet som ska köras vid start. eg. "score.py" |
Collection
| Namn | Typ | Standardvärde | Beskrivning |
|---|---|---|---|
| clientId |
string |
Msi-klient-ID:t som används för att samla in loggning till bloblagring. Om det är null väljer serverdelen en registrerad slutpunktsidentitet för autentisering. |
|
| dataCollectionMode | Disabled |
Aktivera eller inaktivera datainsamling. |
|
| dataId |
string |
Resurs-ID för datatillgångsarmen. På klientsidan ser du till att datatillgången pekar på bloblagringen och att serverdelen samlar in data till bloblagringen. |
|
| samplingRate |
number (double) |
1 |
Samplingsfrekvensen för insamling. Samplingshastighet 1,0 innebär att vi samlar in 100% data som standard. |
ContainerResourceRequirements
Resurskrav för varje containerinstans i en onlinedistribution.
| Namn | Typ | Beskrivning |
|---|---|---|
| containerResourceLimits |
Information om gräns för containerresurser: |
|
| containerResourceRequests |
Information om containerresursbegäran: |
ContainerResourceSettings
| Namn | Typ | Beskrivning |
|---|---|---|
| cpu |
string |
Antal vCPU:er för begäran/gräns för container. Mer information: https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/ |
| gpu |
string |
Antal Nvidia GPU-kort för begäran/gräns för container. Mer information: https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/ |
| memory |
string |
Begäran/gräns för minnesstorlek för container. Mer information: https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/ |
createdByType
Den typ av identitet som skapade resursen.
| Värde | Beskrivning |
|---|---|
| User | |
| Application | |
| ManagedIdentity | |
| Key |
DataCollectionMode
Aktivera eller inaktivera datainsamling.
| Värde | Beskrivning |
|---|---|
| Enabled | |
| Disabled |
DataCollector
| Namn | Typ | Standardvärde | Beskrivning |
|---|---|---|---|
| collections |
<string, Collection> |
[Krävs] Samlingskonfigurationen. Varje samling har en egen konfiguration för att samla in modelldata och namnet på samlingen kan vara godtycklig sträng. Modelldatainsamlare kan användas för antingen nyttolastloggning eller anpassad loggning eller båda. Samlingsbegäran och svar är reserverade för nyttolastloggning, andra är för anpassad loggning. |
|
| requestLogging |
Konfigurationen för begärandeloggning för mdc innehåller avancerade loggningsinställningar för alla samlingar. Det är valfritt. |
||
| rollingRate | Hour |
När modelldata samlas in till bloblagring måste vi distribuera data till en annan sökväg för att undvika att logga dem alla i en enda blobfil. Om den löpande hastigheten är timme samlas alla data in i blobsökvägen /åååå/MM/dd/HH/. Om det är dag samlas alla data in i blobsökvägen /åååå/MM/dd/. Den andra fördelen med rullande sökväg är att användargränssnittet för modellövervakning kan välja ett tidsintervall med data mycket snabbt. |
DefaultScaleSettings
| Namn | Typ | Beskrivning |
|---|---|---|
| scaleType |
string:
Default |
[Krävs] Typ av distributionsskalningsalgoritm |
DeploymentProvisioningState
Möjliga värden för DeploymentProvisioningState.
| Värde | Beskrivning |
|---|---|
| Creating | |
| Deleting | |
| Scaling | |
| Updating | |
| Succeeded | |
| Failed | |
| Canceled |
EgressPublicNetworkAccessType
Räkna upp för att avgöra om PublicNetworkAccess är aktiverat eller inaktiverat för utgående trafik från en distribution.
| Värde | Beskrivning |
|---|---|
| Enabled | |
| Disabled |
EndpointComputeType
Räkna upp för att fastställa beräkningstyp för slutpunkter.
| Värde | Beskrivning |
|---|---|
| Managed | |
| Kubernetes | |
| AzureMLCompute |
ErrorAdditionalInfo
Ytterligare information om resurshanteringsfelet.
| Namn | Typ | Beskrivning |
|---|---|---|
| info |
object |
Ytterligare information. |
| type |
string |
Ytterligare informationstyp. |
ErrorDetail
Felinformationen.
| Namn | Typ | Beskrivning |
|---|---|---|
| additionalInfo |
Ytterligare information om felet. |
|
| code |
string |
Felkoden. |
| details |
Felinformationen. |
|
| message |
string |
Felmeddelandet. |
| target |
string |
Felmålet. |
ErrorResponse
Felsvar
| Namn | Typ | Beskrivning |
|---|---|---|
| error |
Felobjektet. |
KubernetesOnlineDeployment
Egenskaper som är specifika för en KubernetesOnlineDeployment.
| Namn | Typ | Standardvärde | Beskrivning |
|---|---|---|---|
| appInsightsEnabled |
boolean |
False |
Om det är sant aktiverar du Application Insights-loggning. |
| codeConfiguration |
Kodkonfiguration för slutpunktsdistributionen. |
||
| containerResourceRequirements |
Resurskraven för containern (cpu och minne). |
||
| dataCollector |
MDC-konfigurationen inaktiverar vi mdc när det är null. |
||
| description |
string |
Beskrivning av slutpunktsdistributionen. |
|
| egressPublicNetworkAccess | Enabled |
Räkna upp för att avgöra om PublicNetworkAccess är aktiverat eller inaktiverat för utgående trafik från en distribution. |
|
| endpointComputeType |
string:
Kubernetes |
[Krävs] Slutpunktens beräkningstyp. |
|
| environmentId |
string |
ARM-resurs-ID eller AssetId för miljöspecifikationen för slutpunktsdistributionen. |
|
| environmentVariables |
object |
Konfiguration av miljövariabler för distributionen. |
|
| instanceType |
string |
Standard_F4s_v2 |
Typ av beräkningsinstans. Standard: Standard_F4s_v2. |
| livenessProbe |
Liveness-avsökning övervakar regelbundet containerns hälsa. |
||
| model |
string |
URI-sökvägen till modellen. |
|
| modelMountPath |
string |
Sökvägen för att montera modellen i en anpassad container. |
|
| properties |
object |
Egenskapsordlista. Egenskaper kan läggas till, men inte tas bort eller ändras. |
|
| provisioningState |
Etableringstillstånd för slutpunktsdistributionen. |
||
| readinessProbe |
Beredskapsavsökningen verifierar om containern är redo att hantera trafik. Egenskaperna och standardvärdena är desamma som liveness-avsökningen. |
||
| requestSettings |
Begär inställningar för distributionen. |
||
| scaleSettings | OnlineScaleSettings: |
Skalningsinställningar för distributionen. Om den är null eller inte anges är den som standard TargetUtilizationScaleSettings för KubernetesOnlineDeployment och DefaultScaleSettings för ManagedOnlineDeployment. |
|
| startupProbe |
Startavsökningen kontrollerar om ett program i en container har startats. |
ManagedOnlineDeployment
Egenskaper som är specifika för en ManagedOnlineDeployment.
| Namn | Typ | Standardvärde | Beskrivning |
|---|---|---|---|
| appInsightsEnabled |
boolean |
False |
Om det är sant aktiverar du Application Insights-loggning. |
| codeConfiguration |
Kodkonfiguration för slutpunktsdistributionen. |
||
| dataCollector |
MDC-konfigurationen inaktiverar vi mdc när det är null. |
||
| description |
string |
Beskrivning av slutpunktsdistributionen. |
|
| egressPublicNetworkAccess | Enabled |
Räkna upp för att avgöra om PublicNetworkAccess är aktiverat eller inaktiverat för utgående trafik från en distribution. |
|
| endpointComputeType |
string:
Managed |
[Krävs] Slutpunktens beräkningstyp. |
|
| environmentId |
string |
ARM-resurs-ID eller AssetId för miljöspecifikationen för slutpunktsdistributionen. |
|
| environmentVariables |
object |
Konfiguration av miljövariabler för distributionen. |
|
| instanceType |
string |
Standard_F4s_v2 |
Typ av beräkningsinstans. Standard: Standard_F4s_v2. |
| livenessProbe |
Liveness-avsökning övervakar regelbundet containerns hälsa. |
||
| model |
string |
URI-sökvägen till modellen. |
|
| modelMountPath |
string |
Sökvägen för att montera modellen i en anpassad container. |
|
| properties |
object |
Egenskapsordlista. Egenskaper kan läggas till, men inte tas bort eller ändras. |
|
| provisioningState |
Etableringstillstånd för slutpunktsdistributionen. |
||
| readinessProbe |
Beredskapsavsökningen verifierar om containern är redo att hantera trafik. Egenskaperna och standardvärdena är desamma som liveness-avsökningen. |
||
| requestSettings |
Begär inställningar för distributionen. |
||
| scaleSettings | OnlineScaleSettings: |
Skalningsinställningar för distributionen. Om den är null eller inte anges är den som standard TargetUtilizationScaleSettings för KubernetesOnlineDeployment och DefaultScaleSettings för ManagedOnlineDeployment. |
|
| startupProbe |
Startavsökningen kontrollerar om ett program i en container har startats. |
ManagedServiceIdentity
Hanterad tjänstidentitet (systemtilldelade och/eller användartilldelade identiteter)
| Namn | Typ | Beskrivning |
|---|---|---|
| principalId |
string (uuid) |
Tjänstens huvudnamns-ID för den systemtilldelade identiteten. Den här egenskapen tillhandahålls endast för en systemtilldelad identitet. |
| tenantId |
string (uuid) |
Klientorganisations-ID för den systemtilldelade identiteten. Den här egenskapen tillhandahålls endast för en systemtilldelad identitet. |
| type |
Typ av hanterad tjänstidentitet (där både SystemAssigned- och UserAssigned-typer tillåts). |
|
| userAssignedIdentities |
<string,
User |
User-Assigned identiteter |
ManagedServiceIdentityType
Typ av hanterad tjänstidentitet (där både SystemAssigned- och UserAssigned-typer tillåts).
| Värde | Beskrivning |
|---|---|
| None | |
| SystemAssigned | |
| UserAssigned | |
| SystemAssigned,UserAssigned |
OnlineDeployment
Konkreta spårade resurstyper kan skapas genom att aliasisera den här typen med hjälp av en specifik egenskapstyp.
| Namn | Typ | Beskrivning |
|---|---|---|
| id |
string |
Fullständigt kvalificerat resurs-ID för resursen. Ex – /subscriptions/{subscriptionId}/resourceGroups/{resourceGroupName}/providers/{resourceProviderNamespace}/{resourceType}/{resourceName} |
| identity |
Hanterad tjänstidentitet (systemtilldelade och/eller användartilldelade identiteter) |
|
| kind |
string |
Metadata som används av portal/verktyg/etc för att återge olika UX-funktioner för resurser av samma typ. |
| location |
string |
Den geo-plats där resursen finns |
| name |
string |
Namnet på resursen |
| properties | OnlineDeploymentProperties: |
[Krävs] Ytterligare attribut för entiteten. |
| sku |
Sku-information som krävs för ARM-kontrakt för automatisk skalning. |
|
| systemData |
Azure Resource Manager-metadata som innehåller createdBy och modifiedBy information. |
|
| tags |
object |
Resursetiketter. |
| type |
string |
Resurstypen. T.ex. "Microsoft.Compute/virtualMachines" eller "Microsoft.Storage/storageAccounts" |
OnlineDeploymentTrackedResourceArmPaginatedResult
En sidnumrerad lista över OnlineDeployment-entiteter.
| Namn | Typ | Beskrivning |
|---|---|---|
| nextLink |
string (uri) |
Länken till nästa sida med objekt |
| value |
OnlineDeployment-punkterna på denna sida |
OnlineRequestSettings
Konfiguration av onlinedistributionsbedömningsbegäranden.
| Namn | Typ | Standardvärde | Beskrivning |
|---|---|---|---|
| maxConcurrentRequestsPerInstance |
integer (int32) |
1 |
Antalet maximala samtidiga begäranden per nod som tillåts per distribution. Standardvärdet är 1. |
| maxQueueWait |
string (duration) |
PT0.5S |
(Inaktuell för hanterade onlineslutpunkter) Den maximala tiden som en begäran stannar i kön i ISO 8601-format.
Standardvärdet är 500 ms.
(Öka nu |
| requestTimeout |
string (duration) |
PT5S |
Tidsgränsen för bedömning i ISO 8601-format. Standardvärdet är 5 000 ms. |
ProbeSettings
Konfiguration av distributionscontainerns liveness/readiness probe.
| Namn | Typ | Standardvärde | Beskrivning |
|---|---|---|---|
| failureThreshold |
integer (int32) |
30 |
Antalet fel som tillåts innan statusen inte är felfri returneras. |
| initialDelay |
string (duration) |
Fördröjningen före den första avsökningen i ISO 8601-format. |
|
| period |
string (duration) |
PT10S |
Tiden mellan avsökningar i ISO 8601-format. |
| successThreshold |
integer (int32) |
1 |
Antalet lyckade avsökningar innan en felfri status returneras. |
| timeout |
string (duration) |
PT2S |
Tidsgränsen för avsökningen i ISO 8601-format. |
RequestLogging
| Namn | Typ | Beskrivning |
|---|---|---|
| captureHeaders |
string[] |
För nyttolastloggning samlar vi bara in nyttolasten som standard. Om kunderna också vill samla in de angivna huvudena kan de ange dem i captureHeaders så att serverdelen samlar in dessa huvuden tillsammans med nyttolasten. |
RollingRateType
När modelldata samlas in till bloblagring måste vi distribuera data till en annan sökväg för att undvika att logga dem alla i en enda blobfil. Om den löpande hastigheten är timme samlas alla data in i blobsökvägen /åååå/MM/dd/HH/. Om det är dag samlas alla data in i blobsökvägen /åååå/MM/dd/. Den andra fördelen med rullande sökväg är att användargränssnittet för modellövervakning kan välja ett tidsintervall med data mycket snabbt.
| Värde | Beskrivning |
|---|---|
| Year | |
| Month | |
| Day | |
| Hour | |
| Minute |
ScaleType
| Värde | Beskrivning |
|---|---|
| Default | |
| TargetUtilization |
Sku
Resursmodelldefinitionen som representerar SKU
| Namn | Typ | Beskrivning |
|---|---|---|
| capacity |
integer (int32) |
Om SKU:n stöder utskalning/in bör kapacitets heltal inkluderas. Om det inte går att skala ut/in för resursen kan detta utelämnas. |
| family |
string |
Om tjänsten har olika generationer av maskinvara, för samma SKU, kan den samlas in här. |
| name |
string |
Namnet på SKU:n. Ex - P3. Det är vanligtvis en bokstav+nummerkod |
| size |
string |
SKU-storleken. När namnfältet är kombinationen av nivå och något annat värde är detta den fristående koden. |
| tier |
Det här fältet måste implementeras av resursprovidern om tjänsten har mer än en nivå, men inte krävs på en PUT. |
SkuTier
Det här fältet måste implementeras av resursprovidern om tjänsten har mer än en nivå, men inte krävs på en PUT.
| Värde | Beskrivning |
|---|---|
| Free | |
| Basic | |
| Standard | |
| Premium |
systemData
Metadata som rör skapande och senaste ändring av resursen.
| Namn | Typ | Beskrivning |
|---|---|---|
| createdAt |
string (date-time) |
Tidsstämpeln för resursskapande (UTC). |
| createdBy |
string |
Identiteten som skapade resursen. |
| createdByType |
Den typ av identitet som skapade resursen. |
|
| lastModifiedAt |
string (date-time) |
Tidsstämpeln för senaste ändring av resurs (UTC) |
| lastModifiedBy |
string |
Identiteten som senast ändrade resursen. |
| lastModifiedByType |
Den typ av identitet som senast ändrade resursen. |
TargetUtilizationScaleSettings
| Namn | Typ | Standardvärde | Beskrivning |
|---|---|---|---|
| maxInstances |
integer (int32) |
1 |
Det maximala antalet instanser som distributionen kan skalas till. Kvoten reserveras för max_instances. |
| minInstances |
integer (int32) |
1 |
Det minsta antalet instanser som alltid ska finnas. |
| pollingInterval |
string (duration) |
PT1S |
Avsökningsintervallet i ISO 8691-format. Stöder endast varaktighet med så låg precision som Sekunder. |
| scaleType |
string:
Target |
[Krävs] Typ av distributionsskalningsalgoritm |
|
| targetUtilizationPercentage |
integer (int32) |
70 |
Mål-CPU-användning för autoskalning. |
UserAssignedIdentity
Användartilldelade identitetsegenskaper
| Namn | Typ | Beskrivning |
|---|---|---|
| clientId |
string (uuid) |
Klient-ID för den tilldelade identiteten. |
| principalId |
string (uuid) |
Huvud-ID för den tilldelade identiteten. |