Sdílet prostřednictvím


Online Deployments - List

Vypíše nasazení koncových bodů odvozování.

GET https://management.azure.com/subscriptions/{subscriptionId}/resourceGroups/{resourceGroupName}/providers/Microsoft.MachineLearningServices/workspaces/{workspaceName}/onlineEndpoints/{endpointName}/deployments?api-version=2025-12-01
GET https://management.azure.com/subscriptions/{subscriptionId}/resourceGroups/{resourceGroupName}/providers/Microsoft.MachineLearningServices/workspaces/{workspaceName}/onlineEndpoints/{endpointName}/deployments?api-version=2025-12-01&$orderBy={$orderBy}&$top={$top}&$skip={$skip}

Parametry identifikátoru URI

Name V Vyžadováno Typ Description
endpointName
path True

string

Název online koncového bodu

resourceGroupName
path True

string

minLength: 1
maxLength: 90

Název skupiny prostředků. Název nerozlišuje malá a velká písmena.

subscriptionId
path True

string

minLength: 1

ID cílového předplatného.

workspaceName
path True

string

pattern: ^[a-zA-Z0-9][a-zA-Z0-9_-]{2,32}$

Název pracovního prostoru služby Azure Machine Learning

api-version
query True

string

minLength: 1

Verze rozhraní API, která se má použít pro tuto operaci.

$orderBy
query

string

Řazení seznamu

$skip
query

string

Token pokračování pro stránkování

$top
query

integer (int32)

Začátek seznamu

Odpovědi

Name Typ Description
200 OK

OnlineDeploymentTrackedResourceArmPaginatedResult

Operace Azure byla úspěšně dokončena.

Other Status Codes

ErrorResponse

Neočekávaná chybová odpověď

Zabezpečení

azure_auth

Tok Azure Active Directory OAuth2.

Typ: oauth2
Tok: implicit
URL autorizace: https://login.microsoftonline.com/common/oauth2/authorize

Rozsahy

Name Description
user_impersonation zosobnění uživatelského účtu

Příklady

List Online Deployments.

Ukázkový požadavek

GET https://management.azure.com/subscriptions/00000000-1111-2222-3333-444444444444/resourceGroups/test-rg/providers/Microsoft.MachineLearningServices/workspaces/my-aml-workspace/onlineEndpoints/testEndpointName/deployments?api-version=2025-12-01&$orderBy=string&$top=1

Ukázková odpověď

{
  "nextLink": "https://management.azure.com/subscriptions/34adfa4f-cedf-4dc0-ba29-b6d1a69ab345/resourceGroups/testrg123/providers/Microsoft.MachineLearningServices/workspaces/my-aml-workspace/onlineEndpoints/testEndpointName/deployments?api-version=2025-07-01-preview&$skip=2",
  "value": [
    {
      "name": "string",
      "type": "string",
      "id": "string",
      "identity": {
        "type": "SystemAssigned",
        "principalId": "00000000-1111-2222-3333-444444444444",
        "tenantId": "00000000-1111-2222-3333-444444444444",
        "userAssignedIdentities": {
          "string": {
            "clientId": "00000000-1111-2222-3333-444444444444",
            "principalId": "00000000-1111-2222-3333-444444444444"
          }
        }
      },
      "kind": "string",
      "location": "string",
      "properties": {
        "description": "string",
        "appInsightsEnabled": false,
        "codeConfiguration": {
          "codeId": "string",
          "scoringScript": "string"
        },
        "containerResourceRequirements": {
          "containerResourceLimits": {
            "cpu": "\"1\"",
            "gpu": "\"1\"",
            "memory": "\"2Gi\""
          },
          "containerResourceRequests": {
            "cpu": "\"1\"",
            "gpu": "\"1\"",
            "memory": "\"2Gi\""
          }
        },
        "endpointComputeType": "Kubernetes",
        "environmentId": "string",
        "environmentVariables": {
          "string": "string"
        },
        "instanceType": "string",
        "livenessProbe": {
          "failureThreshold": 1,
          "initialDelay": "PT5M",
          "period": "PT5M",
          "successThreshold": 1,
          "timeout": "PT5M"
        },
        "model": "string",
        "modelMountPath": "string",
        "properties": {
          "string": "string"
        },
        "provisioningState": "Creating",
        "requestSettings": {
          "maxConcurrentRequestsPerInstance": 1,
          "maxQueueWait": "PT5M",
          "requestTimeout": "PT5M"
        },
        "scaleSettings": {
          "scaleType": "Default"
        }
      },
      "sku": {
        "name": "string",
        "capacity": 1,
        "family": "string",
        "size": "string",
        "tier": "Free"
      },
      "systemData": {
        "createdAt": "2020-01-01T12:34:56.999Z",
        "createdBy": "string",
        "createdByType": "User",
        "lastModifiedAt": "2020-01-01T12:34:56.999Z",
        "lastModifiedBy": "string",
        "lastModifiedByType": "User"
      },
      "tags": {}
    }
  ]
}

Definice

Name Description
CodeConfiguration

Konfigurace pro prostředek bodovacího kódu.

Collection
ContainerResourceRequirements

Požadavky na prostředky pro každou instanci kontejneru v rámci online nasazení.

ContainerResourceSettings
createdByType

Typ identity, která prostředek vytvořila.

DataCollectionMode

Povolte nebo zakažte shromažďování dat.

DataCollector
DefaultScaleSettings
DeploymentProvisioningState

Možné hodnoty pro DeploymentProvisioningState.

EgressPublicNetworkAccessType

Výčet k určení, zda je PublicNetworkAccess povolen nebo zakázán pro výchozí přenos dat.

EndpointComputeType

Výčet určující typ výpočetního typu koncového bodu

ErrorAdditionalInfo

Chyba správy zdrojů další informace.

ErrorDetail

Detail chyby.

ErrorResponse

Chybová odpověď

KubernetesOnlineDeployment

Vlastnosti specifické pro KubernetesOnlineDeployment.

ManagedOnlineDeployment

Vlastnosti specifické pro ManagedOnlineDeployment.

ManagedServiceIdentity

Identita spravované služby (identita přiřazená systémem nebo identita přiřazená uživatelem)

ManagedServiceIdentityType

Typ identity spravované služby (kde jsou povolené typy SystemAssigned i UserAssigned).

OnlineDeployment

Konkrétní sledované typy prostředků lze vytvořit aliasem tohoto typu pomocí konkrétního typu vlastnosti.

OnlineDeploymentTrackedResourceArmPaginatedResult

Stránkovaný seznam entit OnlineDeployment.

OnlineRequestSettings

Konfigurace požadavků na bodování online nasazení.

ProbeSettings

Konfigurace sondy živosti/připravenosti kontejneru nasazení.

RequestLogging
RollingRateType

Když se data modelu shromažďují do úložiště objektů blob, musíme data vrátit do jiné cesty, abychom se vyhnuli protokolování všech v jednom souboru objektu blob. Pokud je průběžná rychlost hodina, budou se všechna data shromažďovat v cestě k objektu blob /yyyy/MM/dd/HH/. Pokud je den, budou se všechna data shromažďovat v cestě k objektu blob /yyyy/MM/dd/. Další výhodou postupné cesty je, že uživatelské rozhraní pro monitorování modelů dokáže velmi rychle vybrat časový rozsah dat.

ScaleType
Sku

Definice modelu prostředků představující skladovou položku

SkuTier

Toto pole musí implementovat poskytovatel prostředků, pokud má služba více než jednu úroveň, ale nevyžaduje se u put.

systemData

Metadata týkající se vytvoření a poslední změny prostředku.

TargetUtilizationScaleSettings
UserAssignedIdentity

Vlastnosti identity přiřazené uživatelem

CodeConfiguration

Konfigurace pro prostředek bodovacího kódu.

Name Typ Description
codeId

string

ID prostředku ARM prostředku kódu

scoringScript

string

minLength: 1
pattern: [a-zA-Z0-9_]

[Povinné] Skript, který se má spustit při spuštění. eg. "score.py"

Collection

Name Typ Default value Description
clientId

string

ID klienta MSI sloužící ke shromažďování protokolování do úložiště objektů blob. Pokud má hodnotu null, back-end vybere zaregistrovanou identitu koncového bodu k ověření.

dataCollectionMode

DataCollectionMode

Disabled

Povolte nebo zakažte shromažďování dat.

dataId

string

ID prostředku arm datového assetu. Na straně klienta se zajistí, že datový prostředek ukazuje na úložiště objektů blob a back-end bude shromažďovat data do úložiště objektů blob.

samplingRate

number (double)

1

Vzorkovací frekvence pro kolekci Vzorkovací frekvence 1,0 znamená, že ve výchozím nastavení shromažďujeme 100% dat.

ContainerResourceRequirements

Požadavky na prostředky pro každou instanci kontejneru v rámci online nasazení.

Name Typ Description
containerResourceLimits

ContainerResourceSettings

Informace o limitu prostředků kontejneru:

containerResourceRequests

ContainerResourceSettings

Informace o požadavku na prostředek kontejneru:

ContainerResourceSettings

Name Typ Description
cpu

string

Počet požadavků nebo limitu počtu vCPU pro kontejner Další informace: https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/

gpu

string

Počet požadavků nebo omezení karet Nvidia GPU pro kontejner Další informace: https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/

memory

string

Požadavek nebo limit velikosti paměti pro kontejner. Další informace: https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/

createdByType

Typ identity, která prostředek vytvořila.

Hodnota Description
User
Application
ManagedIdentity
Key

DataCollectionMode

Povolte nebo zakažte shromažďování dat.

Hodnota Description
Enabled
Disabled

DataCollector

Name Typ Default value Description
collections

<string,  Collection>

[Povinné] Konfigurace kolekce. Každá kolekce má vlastní konfiguraci pro shromažďování dat modelu a název kolekce může být libovolný řetězec. Kolektor dat modelu se dá použít buď pro protokolování datové části, nebo pro vlastní protokolování, nebo pro obojí. Požadavek na kolekci a odpověď jsou vyhrazené pro protokolování datové části, jiné jsou určené pro vlastní protokolování.

requestLogging

RequestLogging

Konfigurace protokolování požadavků pro mdc zahrnuje upřesňující nastavení protokolování pro všechny kolekce. Je nepovinný.

rollingRate

RollingRateType

Hour

Když se data modelu shromažďují do úložiště objektů blob, musíme data vrátit do jiné cesty, abychom se vyhnuli protokolování všech v jednom souboru objektu blob. Pokud je průběžná rychlost hodina, budou se všechna data shromažďovat v cestě k objektu blob /yyyy/MM/dd/HH/. Pokud je den, budou se všechna data shromažďovat v cestě k objektu blob /yyyy/MM/dd/. Další výhodou postupné cesty je, že uživatelské rozhraní pro monitorování modelů dokáže velmi rychle vybrat časový rozsah dat.

DefaultScaleSettings

Name Typ Description
scaleType string:

Default

[Povinné] Typ algoritmu škálování nasazení

DeploymentProvisioningState

Možné hodnoty pro DeploymentProvisioningState.

Hodnota Description
Creating
Deleting
Scaling
Updating
Succeeded
Failed
Canceled

EgressPublicNetworkAccessType

Výčet k určení, zda je PublicNetworkAccess povolen nebo zakázán pro výchozí přenos dat.

Hodnota Description
Enabled
Disabled

EndpointComputeType

Výčet určující typ výpočetního typu koncového bodu

Hodnota Description
Managed
Kubernetes
AzureMLCompute

ErrorAdditionalInfo

Chyba správy zdrojů další informace.

Name Typ Description
info

object

Další informace.

type

string

Typ doplňkových informací.

ErrorDetail

Detail chyby.

Name Typ Description
additionalInfo

ErrorAdditionalInfo[]

Chyba další informace.

code

string

Kód chyby.

details

ErrorDetail[]

Podrobnosti o chybě.

message

string

Chybová zpráva.

target

string

Cíl chyby.

ErrorResponse

Chybová odpověď

Name Typ Description
error

ErrorDetail

Objekt chyby.

KubernetesOnlineDeployment

Vlastnosti specifické pro KubernetesOnlineDeployment.

Name Typ Default value Description
appInsightsEnabled

boolean

False

Pokud je pravda, povolí protokolování Application Insights.

codeConfiguration

CodeConfiguration

Konfigurace kódu pro nasazení koncového bodu

containerResourceRequirements

ContainerResourceRequirements

Požadavky na prostředky pro kontejner (procesor a paměť).

dataCollector

DataCollector

Konfigurace mdc zakážeme mdc, když má hodnotu null.

description

string

Popis nasazení koncového bodu

egressPublicNetworkAccess

EgressPublicNetworkAccessType

Enabled

Výčet k určení, zda je PublicNetworkAccess povolen nebo zakázán pro výchozí přenos dat.

endpointComputeType string:

Kubernetes

[Povinné] Typ výpočetního objektu koncového bodu.

environmentId

string

ID prostředku ARM nebo AssetId specifikace prostředí pro nasazení koncového bodu

environmentVariables

object

Konfigurace proměnných prostředí pro nasazení

instanceType

string

Standard_F4s_v2

Typ výpočetní instance. Výchozí hodnota: Standard_F4s_v2.

livenessProbe

ProbeSettings

Sonda aktivity pravidelně monitoruje stav kontejneru.

model

string

Cesta URI k modelu.

modelMountPath

string

Cesta k připojení modelu ve vlastním kontejneru.

properties

object

Slovník vlastností Vlastnosti lze přidat, ale ne odebrat nebo změnit.

provisioningState

DeploymentProvisioningState

Stav zřizování pro nasazení koncového bodu.

readinessProbe

ProbeSettings

Sonda připravenosti ověří, jestli je kontejner připravený obsluhovat provoz. Vlastnosti a výchozí hodnoty jsou stejné jako sonda aktivity.

requestSettings

OnlineRequestSettings

Požádejte o nastavení nasazení.

scaleSettings OnlineScaleSettings:

Nastavení škálování pro nasazení Pokud je null nebo není zadaná, použije se výchozí hodnota TargetUtilizationScaleSettings pro KubernetesOnlineDeployment a DefaultScaleSettings pro ManagedOnlineDeployment.

startupProbe

ProbeSettings

Sonda spuštění ověří, jestli se aplikace v kontejneru úspěšně spustila.

ManagedOnlineDeployment

Vlastnosti specifické pro ManagedOnlineDeployment.

Name Typ Default value Description
appInsightsEnabled

boolean

False

Pokud je pravda, povolí protokolování Application Insights.

codeConfiguration

CodeConfiguration

Konfigurace kódu pro nasazení koncového bodu

dataCollector

DataCollector

Konfigurace mdc zakážeme mdc, když má hodnotu null.

description

string

Popis nasazení koncového bodu

egressPublicNetworkAccess

EgressPublicNetworkAccessType

Enabled

Výčet k určení, zda je PublicNetworkAccess povolen nebo zakázán pro výchozí přenos dat.

endpointComputeType string:

Managed

[Povinné] Typ výpočetního objektu koncového bodu.

environmentId

string

ID prostředku ARM nebo AssetId specifikace prostředí pro nasazení koncového bodu

environmentVariables

object

Konfigurace proměnných prostředí pro nasazení

instanceType

string

Standard_F4s_v2

Typ výpočetní instance. Výchozí hodnota: Standard_F4s_v2.

livenessProbe

ProbeSettings

Sonda aktivity pravidelně monitoruje stav kontejneru.

model

string

Cesta URI k modelu.

modelMountPath

string

Cesta k připojení modelu ve vlastním kontejneru.

properties

object

Slovník vlastností Vlastnosti lze přidat, ale ne odebrat nebo změnit.

provisioningState

DeploymentProvisioningState

Stav zřizování pro nasazení koncového bodu.

readinessProbe

ProbeSettings

Sonda připravenosti ověří, jestli je kontejner připravený obsluhovat provoz. Vlastnosti a výchozí hodnoty jsou stejné jako sonda aktivity.

requestSettings

OnlineRequestSettings

Požádejte o nastavení nasazení.

scaleSettings OnlineScaleSettings:

Nastavení škálování pro nasazení Pokud je null nebo není zadaná, použije se výchozí hodnota TargetUtilizationScaleSettings pro KubernetesOnlineDeployment a DefaultScaleSettings pro ManagedOnlineDeployment.

startupProbe

ProbeSettings

Sonda spuštění ověří, jestli se aplikace v kontejneru úspěšně spustila.

ManagedServiceIdentity

Identita spravované služby (identita přiřazená systémem nebo identita přiřazená uživatelem)

Name Typ Description
principalId

string (uuid)

ID instančního objektu identity přiřazené systémem. Tato vlastnost bude poskytována pouze pro identitu přiřazenou systémem.

tenantId

string (uuid)

ID tenanta přiřazené identity systému. Tato vlastnost bude poskytována pouze pro identitu přiřazenou systémem.

type

ManagedServiceIdentityType

Typ identity spravované služby (kde jsou povolené typy SystemAssigned i UserAssigned).

userAssignedIdentities

<string,  UserAssignedIdentity>

identity User-Assigned
Sada identit přiřazených uživatelem přidružená k prostředku. Klíče slovníku userAssignedIdentities budou ID prostředků ARM ve formuláři: /subscriptions/{subscriptionId}/resourceGroups/{resourceGroupName}/providers/Microsoft.ManagedIdentity/userAssignedIdentities/{identityName}. Hodnoty slovníku můžou být prázdné objekty ({}) v požadavcích.

ManagedServiceIdentityType

Typ identity spravované služby (kde jsou povolené typy SystemAssigned i UserAssigned).

Hodnota Description
None
SystemAssigned
UserAssigned
SystemAssigned,UserAssigned

OnlineDeployment

Konkrétní sledované typy prostředků lze vytvořit aliasem tohoto typu pomocí konkrétního typu vlastnosti.

Name Typ Description
id

string

Plně kvalifikované ID prostředku pro prostředek. Příklad : /subscriptions/{subscriptionId}/resourceGroups/{resourceGroupName}/providers/{resourceProviderNamespace}/{resourceType}/{resourceName}

identity

ManagedServiceIdentity

Identita spravované služby (identita přiřazená systémem nebo identita přiřazená uživatelem)

kind

string

Metadata používaná portálem, nástroji atd. k vykreslení různých prostředí uživatelského rozhraní pro prostředky stejného typu.

location

string

Geografické umístění, ve kterém se nachází zdroj

name

string

Název prostředku

properties OnlineDeploymentProperties:

[Povinné] Další atributy entity.

sku

Sku

Podrobnosti skladové položky vyžadované pro kontrakt ARM pro automatické škálování

systemData

systemData

Metadata služby Azure Resource Manager obsahující informace o tom, kdo jej vytvořil a upravil.

tags

object

Značky prostředků

type

string

Typ prostředku. Např. "Microsoft.Compute/virtualMachines" nebo "Microsoft.Storage/storageAccounts"

OnlineDeploymentTrackedResourceArmPaginatedResult

Stránkovaný seznam entit OnlineDeployment.

Name Typ Description
nextLink

string (uri)

Odkaz na další stránku položek

value

OnlineDeployment[]

Položky OnlineDeployment na této stránce

OnlineRequestSettings

Konfigurace požadavků na bodování online nasazení.

Name Typ Default value Description
maxConcurrentRequestsPerInstance

integer (int32)

1

Počet maximálních souběžných požadavků na uzel povolený pro každé nasazení. Výchozí hodnota je 1.

maxQueueWait

string (duration)

PT0.5S

(Zastaralé pro spravované online koncové body) Maximální doba, po kterou požadavek zůstane ve frontě ve formátu ISO 8601. Výchozí hodnota je 500 ms. (Nyní zvyšte úroveň request_timeout_ms , aby se zohlednily případné zpoždění sítě nebo fronty)

requestTimeout

string (duration)

PT5S

Časový limit bodování ve formátu ISO 8601. Výchozí hodnota je 5000 ms.

ProbeSettings

Konfigurace sondy živosti/připravenosti kontejneru nasazení.

Name Typ Default value Description
failureThreshold

integer (int32)

30

Počet chyb, které se mají povolit před vrácením stavu, který není v pořádku.

initialDelay

string (duration)

Zpoždění před první sondou ve formátu ISO 8601.

period

string (duration)

PT10S

Doba mezi sondami ve formátu ISO 8601.

successThreshold

integer (int32)

1

Počet úspěšných sond před vrácením stavu v pořádku.

timeout

string (duration)

PT2S

Časový limit sondy ve formátu ISO 8601.

RequestLogging

Name Typ Description
captureHeaders

string[]

Pro protokolování datové části shromažďujeme ve výchozím nastavení pouze datovou část. Pokud zákazníci také chtějí shromažďovat zadaná záhlaví, mohou je nastavit v captureHeaders tak, aby back-end tyto hlavičky shromažďoval spolu s datovou částí.

RollingRateType

Když se data modelu shromažďují do úložiště objektů blob, musíme data vrátit do jiné cesty, abychom se vyhnuli protokolování všech v jednom souboru objektu blob. Pokud je průběžná rychlost hodina, budou se všechna data shromažďovat v cestě k objektu blob /yyyy/MM/dd/HH/. Pokud je den, budou se všechna data shromažďovat v cestě k objektu blob /yyyy/MM/dd/. Další výhodou postupné cesty je, že uživatelské rozhraní pro monitorování modelů dokáže velmi rychle vybrat časový rozsah dat.

Hodnota Description
Year
Month
Day
Hour
Minute

ScaleType

Hodnota Description
Default
TargetUtilization

Sku

Definice modelu prostředků představující skladovou položku

Name Typ Description
capacity

integer (int32)

Pokud skladová položka podporuje horizontální navýšení/snížení kapacity, měla by být zahrnuta celá čísla kapacity. Pokud není pro prostředek možné horizontální navýšení kapacity nebo jeho snížení kapacity, může se tento parametr vynechat.

family

string

Pokud má služba různé generace hardwaru, pro stejnou skladovou položku, můžete ji zde zachytit.

name

string

Název skladové položky. Ex - P3. Obvykle se jedná o písmeno+číslo.

size

string

Velikost skladové položky. Pokud je pole název kombinací vrstvy a jiné hodnoty, jedná se o samostatný kód.

tier

SkuTier

Toto pole musí implementovat poskytovatel prostředků, pokud má služba více než jednu úroveň, ale nevyžaduje se u put.

SkuTier

Toto pole musí implementovat poskytovatel prostředků, pokud má služba více než jednu úroveň, ale nevyžaduje se u put.

Hodnota Description
Free
Basic
Standard
Premium

systemData

Metadata týkající se vytvoření a poslední změny prostředku.

Name Typ Description
createdAt

string (date-time)

Časové razítko vytvoření prostředku (UTC).

createdBy

string

Identita, která prostředek vytvořila.

createdByType

createdByType

Typ identity, která prostředek vytvořila.

lastModifiedAt

string (date-time)

Časové razítko poslední změny zdroje (UTC)

lastModifiedBy

string

Identita, která naposledy změnila prostředek.

lastModifiedByType

createdByType

Typ identity, která naposledy změnila prostředek.

TargetUtilizationScaleSettings

Name Typ Default value Description
maxInstances

integer (int32)

1

Maximální počet instancí, na které se může nasazení škálovat. Kvóta bude vyhrazena pro max_instances.

minInstances

integer (int32)

1

Minimální početinstancíchch

pollingInterval

string (duration)

PT1S

Interval dotazování ve formátu ISO 8691. Podporuje pouze dobu trvání s přesností v sekundách.

scaleType string:

TargetUtilization

[Povinné] Typ algoritmu škálování nasazení

targetUtilizationPercentage

integer (int32)

70

Cílové využití procesoru pro automatické škálování

UserAssignedIdentity

Vlastnosti identity přiřazené uživatelem

Name Typ Description
clientId

string (uuid)

ID klienta přiřazené identity.

principalId

string (uuid)

ID objektu zabezpečení přiřazené identity.