Dela via


Online Deployments - List

Visa en lista över distributioner av inferensslutpunkter.

GET https://management.azure.com/subscriptions/{subscriptionId}/resourceGroups/{resourceGroupName}/providers/Microsoft.MachineLearningServices/workspaces/{workspaceName}/onlineEndpoints/{endpointName}/deployments?api-version=2025-12-01
GET https://management.azure.com/subscriptions/{subscriptionId}/resourceGroups/{resourceGroupName}/providers/Microsoft.MachineLearningServices/workspaces/{workspaceName}/onlineEndpoints/{endpointName}/deployments?api-version=2025-12-01&$orderBy={$orderBy}&$top={$top}&$skip={$skip}

URI-parametrar

Namn I Krävs Typ Beskrivning
endpointName
path True

string

Onlineslutpunktsnamn.

resourceGroupName
path True

string

minLength: 1
maxLength: 90

Namnet på resursgruppen. Namnet är skiftlägesokänsligt.

subscriptionId
path True

string

minLength: 1

ID för målprenumerationen.

workspaceName
path True

string

pattern: ^[a-zA-Z0-9][a-zA-Z0-9_-]{2,32}$

Namn på Azure Machine Learning-arbetsyta

api-version
query True

string

minLength: 1

Den API-version som ska användas för den här åtgärden.

$orderBy
query

string

Ordningen på listan.

$skip
query

string

Fortsättningstoken för sidnumrering.

$top
query

integer (int32)

Överst i listan.

Svaren

Namn Typ Beskrivning
200 OK

OnlineDeploymentTrackedResourceArmPaginatedResult

Azure-åtgärden har slutförts.

Other Status Codes

ErrorResponse

Ett oväntat felsvar.

Säkerhet

azure_auth

Azure Active Directory OAuth2-flöde.

Typ: oauth2
Rinna: implicit
Auktorisations-URL: https://login.microsoftonline.com/common/oauth2/authorize

Scope

Namn Beskrivning
user_impersonation personifiera ditt användarkonto

Exempel

List Online Deployments.

Exempelförfrågan

GET https://management.azure.com/subscriptions/00000000-1111-2222-3333-444444444444/resourceGroups/test-rg/providers/Microsoft.MachineLearningServices/workspaces/my-aml-workspace/onlineEndpoints/testEndpointName/deployments?api-version=2025-12-01&$orderBy=string&$top=1

Exempelsvar

{
  "nextLink": "https://management.azure.com/subscriptions/34adfa4f-cedf-4dc0-ba29-b6d1a69ab345/resourceGroups/testrg123/providers/Microsoft.MachineLearningServices/workspaces/my-aml-workspace/onlineEndpoints/testEndpointName/deployments?api-version=2025-07-01-preview&$skip=2",
  "value": [
    {
      "name": "string",
      "type": "string",
      "id": "string",
      "identity": {
        "type": "SystemAssigned",
        "principalId": "00000000-1111-2222-3333-444444444444",
        "tenantId": "00000000-1111-2222-3333-444444444444",
        "userAssignedIdentities": {
          "string": {
            "clientId": "00000000-1111-2222-3333-444444444444",
            "principalId": "00000000-1111-2222-3333-444444444444"
          }
        }
      },
      "kind": "string",
      "location": "string",
      "properties": {
        "description": "string",
        "appInsightsEnabled": false,
        "codeConfiguration": {
          "codeId": "string",
          "scoringScript": "string"
        },
        "containerResourceRequirements": {
          "containerResourceLimits": {
            "cpu": "\"1\"",
            "gpu": "\"1\"",
            "memory": "\"2Gi\""
          },
          "containerResourceRequests": {
            "cpu": "\"1\"",
            "gpu": "\"1\"",
            "memory": "\"2Gi\""
          }
        },
        "endpointComputeType": "Kubernetes",
        "environmentId": "string",
        "environmentVariables": {
          "string": "string"
        },
        "instanceType": "string",
        "livenessProbe": {
          "failureThreshold": 1,
          "initialDelay": "PT5M",
          "period": "PT5M",
          "successThreshold": 1,
          "timeout": "PT5M"
        },
        "model": "string",
        "modelMountPath": "string",
        "properties": {
          "string": "string"
        },
        "provisioningState": "Creating",
        "requestSettings": {
          "maxConcurrentRequestsPerInstance": 1,
          "maxQueueWait": "PT5M",
          "requestTimeout": "PT5M"
        },
        "scaleSettings": {
          "scaleType": "Default"
        }
      },
      "sku": {
        "name": "string",
        "capacity": 1,
        "family": "string",
        "size": "string",
        "tier": "Free"
      },
      "systemData": {
        "createdAt": "2020-01-01T12:34:56.999Z",
        "createdBy": "string",
        "createdByType": "User",
        "lastModifiedAt": "2020-01-01T12:34:56.999Z",
        "lastModifiedBy": "string",
        "lastModifiedByType": "User"
      },
      "tags": {}
    }
  ]
}

Definitioner

Namn Beskrivning
CodeConfiguration

Konfiguration för en bedömningskodtillgång.

Collection
ContainerResourceRequirements

Resurskrav för varje containerinstans i en onlinedistribution.

ContainerResourceSettings
createdByType

Den typ av identitet som skapade resursen.

DataCollectionMode

Aktivera eller inaktivera datainsamling.

DataCollector
DefaultScaleSettings
DeploymentProvisioningState

Möjliga värden för DeploymentProvisioningState.

EgressPublicNetworkAccessType

Räkna upp för att avgöra om PublicNetworkAccess är aktiverat eller inaktiverat för utgående trafik från en distribution.

EndpointComputeType

Räkna upp för att fastställa beräkningstyp för slutpunkter.

ErrorAdditionalInfo

Ytterligare information om resurshanteringsfelet.

ErrorDetail

Felinformationen.

ErrorResponse

Felsvar

KubernetesOnlineDeployment

Egenskaper som är specifika för en KubernetesOnlineDeployment.

ManagedOnlineDeployment

Egenskaper som är specifika för en ManagedOnlineDeployment.

ManagedServiceIdentity

Hanterad tjänstidentitet (systemtilldelade och/eller användartilldelade identiteter)

ManagedServiceIdentityType

Typ av hanterad tjänstidentitet (där både SystemAssigned- och UserAssigned-typer tillåts).

OnlineDeployment

Konkreta spårade resurstyper kan skapas genom att aliasisera den här typen med hjälp av en specifik egenskapstyp.

OnlineDeploymentTrackedResourceArmPaginatedResult

En sidnumrerad lista över OnlineDeployment-entiteter.

OnlineRequestSettings

Konfiguration av onlinedistributionsbedömningsbegäranden.

ProbeSettings

Konfiguration av distributionscontainerns liveness/readiness probe.

RequestLogging
RollingRateType

När modelldata samlas in till bloblagring måste vi distribuera data till en annan sökväg för att undvika att logga dem alla i en enda blobfil. Om den löpande hastigheten är timme samlas alla data in i blobsökvägen /åååå/MM/dd/HH/. Om det är dag samlas alla data in i blobsökvägen /åååå/MM/dd/. Den andra fördelen med rullande sökväg är att användargränssnittet för modellövervakning kan välja ett tidsintervall med data mycket snabbt.

ScaleType
Sku

Resursmodelldefinitionen som representerar SKU

SkuTier

Det här fältet måste implementeras av resursprovidern om tjänsten har mer än en nivå, men inte krävs på en PUT.

systemData

Metadata som rör skapande och senaste ändring av resursen.

TargetUtilizationScaleSettings
UserAssignedIdentity

Användartilldelade identitetsegenskaper

CodeConfiguration

Konfiguration för en bedömningskodtillgång.

Namn Typ Beskrivning
codeId

string

ARM-resurs-ID för kodtillgången.

scoringScript

string

minLength: 1
pattern: [a-zA-Z0-9_]

[Krävs] Skriptet som ska köras vid start. eg. "score.py"

Collection

Namn Typ Standardvärde Beskrivning
clientId

string

Msi-klient-ID:t som används för att samla in loggning till bloblagring. Om det är null väljer serverdelen en registrerad slutpunktsidentitet för autentisering.

dataCollectionMode

DataCollectionMode

Disabled

Aktivera eller inaktivera datainsamling.

dataId

string

Resurs-ID för datatillgångsarmen. På klientsidan ser du till att datatillgången pekar på bloblagringen och att serverdelen samlar in data till bloblagringen.

samplingRate

number (double)

1

Samplingsfrekvensen för insamling. Samplingshastighet 1,0 innebär att vi samlar in 100% data som standard.

ContainerResourceRequirements

Resurskrav för varje containerinstans i en onlinedistribution.

Namn Typ Beskrivning
containerResourceLimits

ContainerResourceSettings

Information om gräns för containerresurser:

containerResourceRequests

ContainerResourceSettings

Information om containerresursbegäran:

ContainerResourceSettings

Namn Typ Beskrivning
cpu

string

Antal vCPU:er för begäran/gräns för container. Mer information: https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/

gpu

string

Antal Nvidia GPU-kort för begäran/gräns för container. Mer information: https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/

memory

string

Begäran/gräns för minnesstorlek för container. Mer information: https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/

createdByType

Den typ av identitet som skapade resursen.

Värde Beskrivning
User
Application
ManagedIdentity
Key

DataCollectionMode

Aktivera eller inaktivera datainsamling.

Värde Beskrivning
Enabled
Disabled

DataCollector

Namn Typ Standardvärde Beskrivning
collections

<string,  Collection>

[Krävs] Samlingskonfigurationen. Varje samling har en egen konfiguration för att samla in modelldata och namnet på samlingen kan vara godtycklig sträng. Modelldatainsamlare kan användas för antingen nyttolastloggning eller anpassad loggning eller båda. Samlingsbegäran och svar är reserverade för nyttolastloggning, andra är för anpassad loggning.

requestLogging

RequestLogging

Konfigurationen för begärandeloggning för mdc innehåller avancerade loggningsinställningar för alla samlingar. Det är valfritt.

rollingRate

RollingRateType

Hour

När modelldata samlas in till bloblagring måste vi distribuera data till en annan sökväg för att undvika att logga dem alla i en enda blobfil. Om den löpande hastigheten är timme samlas alla data in i blobsökvägen /åååå/MM/dd/HH/. Om det är dag samlas alla data in i blobsökvägen /åååå/MM/dd/. Den andra fördelen med rullande sökväg är att användargränssnittet för modellövervakning kan välja ett tidsintervall med data mycket snabbt.

DefaultScaleSettings

Namn Typ Beskrivning
scaleType string:

Default

[Krävs] Typ av distributionsskalningsalgoritm

DeploymentProvisioningState

Möjliga värden för DeploymentProvisioningState.

Värde Beskrivning
Creating
Deleting
Scaling
Updating
Succeeded
Failed
Canceled

EgressPublicNetworkAccessType

Räkna upp för att avgöra om PublicNetworkAccess är aktiverat eller inaktiverat för utgående trafik från en distribution.

Värde Beskrivning
Enabled
Disabled

EndpointComputeType

Räkna upp för att fastställa beräkningstyp för slutpunkter.

Värde Beskrivning
Managed
Kubernetes
AzureMLCompute

ErrorAdditionalInfo

Ytterligare information om resurshanteringsfelet.

Namn Typ Beskrivning
info

object

Ytterligare information.

type

string

Ytterligare informationstyp.

ErrorDetail

Felinformationen.

Namn Typ Beskrivning
additionalInfo

ErrorAdditionalInfo[]

Ytterligare information om felet.

code

string

Felkoden.

details

ErrorDetail[]

Felinformationen.

message

string

Felmeddelandet.

target

string

Felmålet.

ErrorResponse

Felsvar

Namn Typ Beskrivning
error

ErrorDetail

Felobjektet.

KubernetesOnlineDeployment

Egenskaper som är specifika för en KubernetesOnlineDeployment.

Namn Typ Standardvärde Beskrivning
appInsightsEnabled

boolean

False

Om det är sant aktiverar du Application Insights-loggning.

codeConfiguration

CodeConfiguration

Kodkonfiguration för slutpunktsdistributionen.

containerResourceRequirements

ContainerResourceRequirements

Resurskraven för containern (cpu och minne).

dataCollector

DataCollector

MDC-konfigurationen inaktiverar vi mdc när det är null.

description

string

Beskrivning av slutpunktsdistributionen.

egressPublicNetworkAccess

EgressPublicNetworkAccessType

Enabled

Räkna upp för att avgöra om PublicNetworkAccess är aktiverat eller inaktiverat för utgående trafik från en distribution.

endpointComputeType string:

Kubernetes

[Krävs] Slutpunktens beräkningstyp.

environmentId

string

ARM-resurs-ID eller AssetId för miljöspecifikationen för slutpunktsdistributionen.

environmentVariables

object

Konfiguration av miljövariabler för distributionen.

instanceType

string

Standard_F4s_v2

Typ av beräkningsinstans. Standard: Standard_F4s_v2.

livenessProbe

ProbeSettings

Liveness-avsökning övervakar regelbundet containerns hälsa.

model

string

URI-sökvägen till modellen.

modelMountPath

string

Sökvägen för att montera modellen i en anpassad container.

properties

object

Egenskapsordlista. Egenskaper kan läggas till, men inte tas bort eller ändras.

provisioningState

DeploymentProvisioningState

Etableringstillstånd för slutpunktsdistributionen.

readinessProbe

ProbeSettings

Beredskapsavsökningen verifierar om containern är redo att hantera trafik. Egenskaperna och standardvärdena är desamma som liveness-avsökningen.

requestSettings

OnlineRequestSettings

Begär inställningar för distributionen.

scaleSettings OnlineScaleSettings:

Skalningsinställningar för distributionen. Om den är null eller inte anges är den som standard TargetUtilizationScaleSettings för KubernetesOnlineDeployment och DefaultScaleSettings för ManagedOnlineDeployment.

startupProbe

ProbeSettings

Startavsökningen kontrollerar om ett program i en container har startats.

ManagedOnlineDeployment

Egenskaper som är specifika för en ManagedOnlineDeployment.

Namn Typ Standardvärde Beskrivning
appInsightsEnabled

boolean

False

Om det är sant aktiverar du Application Insights-loggning.

codeConfiguration

CodeConfiguration

Kodkonfiguration för slutpunktsdistributionen.

dataCollector

DataCollector

MDC-konfigurationen inaktiverar vi mdc när det är null.

description

string

Beskrivning av slutpunktsdistributionen.

egressPublicNetworkAccess

EgressPublicNetworkAccessType

Enabled

Räkna upp för att avgöra om PublicNetworkAccess är aktiverat eller inaktiverat för utgående trafik från en distribution.

endpointComputeType string:

Managed

[Krävs] Slutpunktens beräkningstyp.

environmentId

string

ARM-resurs-ID eller AssetId för miljöspecifikationen för slutpunktsdistributionen.

environmentVariables

object

Konfiguration av miljövariabler för distributionen.

instanceType

string

Standard_F4s_v2

Typ av beräkningsinstans. Standard: Standard_F4s_v2.

livenessProbe

ProbeSettings

Liveness-avsökning övervakar regelbundet containerns hälsa.

model

string

URI-sökvägen till modellen.

modelMountPath

string

Sökvägen för att montera modellen i en anpassad container.

properties

object

Egenskapsordlista. Egenskaper kan läggas till, men inte tas bort eller ändras.

provisioningState

DeploymentProvisioningState

Etableringstillstånd för slutpunktsdistributionen.

readinessProbe

ProbeSettings

Beredskapsavsökningen verifierar om containern är redo att hantera trafik. Egenskaperna och standardvärdena är desamma som liveness-avsökningen.

requestSettings

OnlineRequestSettings

Begär inställningar för distributionen.

scaleSettings OnlineScaleSettings:

Skalningsinställningar för distributionen. Om den är null eller inte anges är den som standard TargetUtilizationScaleSettings för KubernetesOnlineDeployment och DefaultScaleSettings för ManagedOnlineDeployment.

startupProbe

ProbeSettings

Startavsökningen kontrollerar om ett program i en container har startats.

ManagedServiceIdentity

Hanterad tjänstidentitet (systemtilldelade och/eller användartilldelade identiteter)

Namn Typ Beskrivning
principalId

string (uuid)

Tjänstens huvudnamns-ID för den systemtilldelade identiteten. Den här egenskapen tillhandahålls endast för en systemtilldelad identitet.

tenantId

string (uuid)

Klientorganisations-ID för den systemtilldelade identiteten. Den här egenskapen tillhandahålls endast för en systemtilldelad identitet.

type

ManagedServiceIdentityType

Typ av hanterad tjänstidentitet (där både SystemAssigned- och UserAssigned-typer tillåts).

userAssignedIdentities

<string,  UserAssignedIdentity>

User-Assigned identiteter
Uppsättningen användartilldelade identiteter som är associerade med resursen. Ordlistenycklarna userAssignedIdentities är ARM-resurs-ID:er i formuläret: '/subscriptions/{subscriptionId}/resourceGroups/{resourceGroupName}/providers/Microsoft.ManagedIdentity/userAssignedIdentities/{identityName}. Ordlistevärdena kan vara tomma objekt ({}) i begäranden.

ManagedServiceIdentityType

Typ av hanterad tjänstidentitet (där både SystemAssigned- och UserAssigned-typer tillåts).

Värde Beskrivning
None
SystemAssigned
UserAssigned
SystemAssigned,UserAssigned

OnlineDeployment

Konkreta spårade resurstyper kan skapas genom att aliasisera den här typen med hjälp av en specifik egenskapstyp.

Namn Typ Beskrivning
id

string

Fullständigt kvalificerat resurs-ID för resursen. Ex – /subscriptions/{subscriptionId}/resourceGroups/{resourceGroupName}/providers/{resourceProviderNamespace}/{resourceType}/{resourceName}

identity

ManagedServiceIdentity

Hanterad tjänstidentitet (systemtilldelade och/eller användartilldelade identiteter)

kind

string

Metadata som används av portal/verktyg/etc för att återge olika UX-funktioner för resurser av samma typ.

location

string

Den geo-plats där resursen finns

name

string

Namnet på resursen

properties OnlineDeploymentProperties:

[Krävs] Ytterligare attribut för entiteten.

sku

Sku

Sku-information som krävs för ARM-kontrakt för automatisk skalning.

systemData

systemData

Azure Resource Manager-metadata som innehåller createdBy och modifiedBy information.

tags

object

Resursetiketter.

type

string

Resurstypen. T.ex. "Microsoft.Compute/virtualMachines" eller "Microsoft.Storage/storageAccounts"

OnlineDeploymentTrackedResourceArmPaginatedResult

En sidnumrerad lista över OnlineDeployment-entiteter.

Namn Typ Beskrivning
nextLink

string (uri)

Länken till nästa sida med objekt

value

OnlineDeployment[]

OnlineDeployment-punkterna på denna sida

OnlineRequestSettings

Konfiguration av onlinedistributionsbedömningsbegäranden.

Namn Typ Standardvärde Beskrivning
maxConcurrentRequestsPerInstance

integer (int32)

1

Antalet maximala samtidiga begäranden per nod som tillåts per distribution. Standardvärdet är 1.

maxQueueWait

string (duration)

PT0.5S

(Inaktuell för hanterade onlineslutpunkter) Den maximala tiden som en begäran stannar i kön i ISO 8601-format. Standardvärdet är 500 ms. (Öka nu request_timeout_ms till konto för eventuella nätverks-/köfördröjningar)

requestTimeout

string (duration)

PT5S

Tidsgränsen för bedömning i ISO 8601-format. Standardvärdet är 5 000 ms.

ProbeSettings

Konfiguration av distributionscontainerns liveness/readiness probe.

Namn Typ Standardvärde Beskrivning
failureThreshold

integer (int32)

30

Antalet fel som tillåts innan statusen inte är felfri returneras.

initialDelay

string (duration)

Fördröjningen före den första avsökningen i ISO 8601-format.

period

string (duration)

PT10S

Tiden mellan avsökningar i ISO 8601-format.

successThreshold

integer (int32)

1

Antalet lyckade avsökningar innan en felfri status returneras.

timeout

string (duration)

PT2S

Tidsgränsen för avsökningen i ISO 8601-format.

RequestLogging

Namn Typ Beskrivning
captureHeaders

string[]

För nyttolastloggning samlar vi bara in nyttolasten som standard. Om kunderna också vill samla in de angivna huvudena kan de ange dem i captureHeaders så att serverdelen samlar in dessa huvuden tillsammans med nyttolasten.

RollingRateType

När modelldata samlas in till bloblagring måste vi distribuera data till en annan sökväg för att undvika att logga dem alla i en enda blobfil. Om den löpande hastigheten är timme samlas alla data in i blobsökvägen /åååå/MM/dd/HH/. Om det är dag samlas alla data in i blobsökvägen /åååå/MM/dd/. Den andra fördelen med rullande sökväg är att användargränssnittet för modellövervakning kan välja ett tidsintervall med data mycket snabbt.

Värde Beskrivning
Year
Month
Day
Hour
Minute

ScaleType

Värde Beskrivning
Default
TargetUtilization

Sku

Resursmodelldefinitionen som representerar SKU

Namn Typ Beskrivning
capacity

integer (int32)

Om SKU:n stöder utskalning/in bör kapacitets heltal inkluderas. Om det inte går att skala ut/in för resursen kan detta utelämnas.

family

string

Om tjänsten har olika generationer av maskinvara, för samma SKU, kan den samlas in här.

name

string

Namnet på SKU:n. Ex - P3. Det är vanligtvis en bokstav+nummerkod

size

string

SKU-storleken. När namnfältet är kombinationen av nivå och något annat värde är detta den fristående koden.

tier

SkuTier

Det här fältet måste implementeras av resursprovidern om tjänsten har mer än en nivå, men inte krävs på en PUT.

SkuTier

Det här fältet måste implementeras av resursprovidern om tjänsten har mer än en nivå, men inte krävs på en PUT.

Värde Beskrivning
Free
Basic
Standard
Premium

systemData

Metadata som rör skapande och senaste ändring av resursen.

Namn Typ Beskrivning
createdAt

string (date-time)

Tidsstämpeln för resursskapande (UTC).

createdBy

string

Identiteten som skapade resursen.

createdByType

createdByType

Den typ av identitet som skapade resursen.

lastModifiedAt

string (date-time)

Tidsstämpeln för senaste ändring av resurs (UTC)

lastModifiedBy

string

Identiteten som senast ändrade resursen.

lastModifiedByType

createdByType

Den typ av identitet som senast ändrade resursen.

TargetUtilizationScaleSettings

Namn Typ Standardvärde Beskrivning
maxInstances

integer (int32)

1

Det maximala antalet instanser som distributionen kan skalas till. Kvoten reserveras för max_instances.

minInstances

integer (int32)

1

Det minsta antalet instanser som alltid ska finnas.

pollingInterval

string (duration)

PT1S

Avsökningsintervallet i ISO 8691-format. Stöder endast varaktighet med så låg precision som Sekunder.

scaleType string:

TargetUtilization

[Krävs] Typ av distributionsskalningsalgoritm

targetUtilizationPercentage

integer (int32)

70

Mål-CPU-användning för autoskalning.

UserAssignedIdentity

Användartilldelade identitetsegenskaper

Namn Typ Beskrivning
clientId

string (uuid)

Klient-ID för den tilldelade identiteten.

principalId

string (uuid)

Huvud-ID för den tilldelade identiteten.