Microsoft.MachineLearningServices workspaces/onlineEndpoints/deployments 2021-03-01-preview

Definicja zasobu Bicep

Typ zasobu obszary robocze/onlineEndpoints/deployments można wdrożyć z operacjami docelowymi:

Aby uzyskać listę zmienionych właściwości w każdej wersji interfejsu API, zobacz dziennik zmian.

Format zasobu

Aby utworzyć zasób Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments, dodaj następujący kod Bicep do szablonu.

resource symbolicname 'Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments@2021-03-01-preview' = {
  name: 'string'
  location: 'string'
  tags: {
    tagName1: 'tagValue1'
    tagName2: 'tagValue2'
  }
  kind: 'string'
  parent: resourceSymbolicName
  identity: {
    type: 'string'
    userAssignedIdentities: {
      {customized property}: {
        clientId: 'string'
        principalId: 'string'
      }
    }
  }
  properties: {
    appInsightsEnabled: bool
    codeConfiguration: {
      codeId: 'string'
      scoringScript: 'string'
    }
    description: 'string'
    environmentId: 'string'
    environmentVariables: {
      {customized property}: 'string'
    }
    livenessProbe: {
      failureThreshold: int
      initialDelay: 'string'
      period: 'string'
      successThreshold: int
      timeout: 'string'
    }
    model: {
      referenceType: 'string'
      // For remaining properties, see AssetReferenceBase objects
    }
    properties: {
      {customized property}: 'string'
    }
    requestSettings: {
      maxConcurrentRequestsPerInstance: int
      maxQueueWait: 'string'
      requestTimeout: 'string'
    }
    scaleSettings: {
      maxInstances: int
      minInstances: int
      scaleType: 'string'
      // For remaining properties, see OnlineScaleSettings objects
    }
    endpointComputeType: 'string'
    // For remaining properties, see OnlineDeployment objects
  }
}

Obiekty OnlineDeployment

Ustaw właściwość endpointComputeType , aby określić typ obiektu.

W przypadku usługi K8S użyj:

  endpointComputeType: 'K8S'
  containerResourceRequirements: {
    cpu: int
    cpuLimit: int
    fpga: int
    gpu: int
    memoryInGB: int
    memoryInGBLimit: int
  }

W przypadku opcji Zarządzane użyj:

  endpointComputeType: 'Managed'
  instanceType: 'string'
  readinessProbe: {
    failureThreshold: int
    initialDelay: 'string'
    period: 'string'
    successThreshold: int
    timeout: 'string'
  }

Obiekty AssetReferenceBase

Ustaw właściwość referenceType , aby określić typ obiektu.

W przypadku elementu DataPath użyj:

  referenceType: 'DataPath'
  datastoreId: 'string'
  path: 'string'

W obszarze Identyfikator użyj:

  referenceType: 'Id'
  assetId: 'string'

W przypadku elementu OutputPath użyj:

  referenceType: 'OutputPath'
  jobId: 'string'
  path: 'string'

Obiekty OnlineScaleSettings

Ustaw właściwość scaleType , aby określić typ obiektu.

W przypadku opcji Automatycznie użyj polecenia:

  scaleType: 'Auto'
  pollingInterval: 'string'
  targetUtilizationPercentage: int

W przypadku instrukcji ręcznych użyj:

  scaleType: 'Manual'
  instanceCount: int

Wartości właściwości

obszary robocze/onlineEndpoints/deployments

Nazwa Opis Wartość
name Nazwa zasobu

Zobacz, jak ustawić nazwy i typy dla zasobów podrzędnych w aplikacji Bicep.
ciąg (wymagany)
location Lokalizacja geograficzna, w której znajduje się zasób ciąg (wymagany)
tags Tagi zasobów. Słownik nazw tagów i wartości. Zobacz Tagi w szablonach
Rodzaju Metadane używane przez portal/narzędzia/itp. do renderowania różnych środowisk środowiska użytkownika dla zasobów tego samego typu. ciąg
Nadrzędny W Bicep można określić zasób nadrzędny dla zasobu podrzędnego. Tę właściwość należy dodać tylko wtedy, gdy zasób podrzędny jest zadeklarowany poza zasobem nadrzędnym.

Aby uzyskać więcej informacji, zobacz Zasób podrzędny poza zasobem nadrzędnym.
Nazwa symboliczna zasobu typu: onlineEndpoints
identity Tożsamość usługi skojarzona z zasobem. Identyfikator zasobu
properties [Wymagane] Dodatkowe atrybuty jednostki. Wdrażanie online (wymagane)

Identyfikator zasobu

Nazwa Opis Wartość
typ Definiuje wartości typu ResourceIdentity. "Brak"
"SystemAssigned"
"SystemAssigned,UserAssigned"
"UserAssigned"
userAssignedIdentities Słownik tożsamości przypisanych przez użytkownika, klucz jest identyfikator zasobu ARM interfejsu użytkownika. ResourceIdentityUserAssignedIdentities

ResourceIdentityUserAssignedIdentities

Nazwa Opis Wartość
{niestandardowa właściwość} UserAssignedIdentityMeta

UserAssignedIdentityMeta

Nazwa Opis Wartość
clientId Identyfikator aplikacji — unikatowy identyfikator wygenerowany przez Azure AD, który jest powiązany z aplikacją i jednostką usługi podczas początkowej aprowizacji. ciąg
principalId Identyfikator obiektu jednostki usługi dla tożsamości zarządzanej, który służy do udzielania dostępu opartego na rolach do zasobu platformy Azure. ciąg

Wdrażanie online

Nazwa Opis Wartość
appInsightsEnabled Jeśli wartość true, włączy rejestrowanie usługi Application Insights. bool
codeConfiguration Konfiguracja kodu dla wdrożenia punktu końcowego. Konfiguracja kodu
description (opis) Opis wdrożenia punktu końcowego. ciąg
environmentId Identyfikator zasobu usługi ARM specyfikacji środowiska dla wdrożenia punktu końcowego. ciąg
environmentVariables Konfiguracja zmiennych środowiskowych dla wdrożenia. OnlineDeploymentEnvironmentVariables
livenessProbe Konfiguracja sondy liveness/readiness kontenera wdrożenia. ProbeSettings
model Odwołanie do zasobu modelu dla wdrożenia punktu końcowego. AssetReferenceBase
properties Słownik właściwości. Właściwości można dodać, ale nie usuwać ani zmieniać. OnlineDeploymentProperties
requestSettings Konfiguracja żądań oceniania wdrożenia online. OnlineRequestSettings
scaleSettings Konfiguracja skalowania wdrożenia online. OnlineScaleSettings
endpointComputeType Ustawianie typu obiektu K8S
Zarządzane (wymagane)

Konfiguracja kodu

Nazwa Opis Wartość
codeId Identyfikator zasobu usługi ARM zasobu kodu. ciąg
scoringScript [Wymagane] Skrypt do wykonania podczas uruchamiania. np. "score.py" ciąg (wymagany)

Ograniczenia:
Minimalna długość = 1
Wzorzec = [a-zA-Z0-9_]

OnlineDeploymentEnvironmentVariables

Nazwa Opis Wartość
{niestandardowa właściwość} ciąg

ProbeSettings

Nazwa Opis Wartość
failureThreshold Liczba niepowodzeń, które mają być dozwolone przed zwróceniem stanu złej kondycji. int
initialDelay Opóźnienie przed pierwszą sondą w formacie ISO 8601. ciąg
period Długość czasu między sondami w formacie ISO 8601. ciąg
successThreshold Liczba pomyślnych sond przed zwróceniem stanu w dobrej kondycji. int
timeout Limit czasu sondy w formacie ISO 8601. ciąg

AssetReferenceBase

Nazwa Opis Wartość
referenceType Ustawianie typu obiektu DataPath
Identyfikator
OutputPath (wymagane)

DataPathAssetReference

Nazwa Opis Wartość
referenceType [Wymagane] Określa typ odwołania do zasobu. "DataPath" (wymagane)
datastoreId Identyfikator zasobu usługi ARM magazynu danych, w którym znajduje się zasób. ciąg
path Ścieżka pliku/katalogu w magazynie danych. ciąg

IdAssetReference

Nazwa Opis Wartość
referenceType [Wymagane] Określa typ odwołania do zasobu. "Id" (wymagany)
assetId [Wymagane] Identyfikator zasobu usługi ARM. ciąg (wymagany)

Ograniczenia:
Wzorzec = [a-zA-Z0-9_]

OutputPathAssetReference

Nazwa Opis Wartość
referenceType [Wymagane] Określa typ odwołania do zasobu. "OutputPath" (wymagane)
Jobid Identyfikator zasobu usługi ARM zadania. ciąg
path Ścieżka pliku/katalogu w danych wyjściowych zadania. ciąg

OnlineDeploymentProperties

Nazwa Opis Wartość
{niestandardowa właściwość} ciąg

OnlineRequestSettings

Nazwa Opis Wartość
maxConcurrentRequestsPerInstance Liczba żądań dozwolonych do kolejkowania jednocześnie dla tego wdrożenia. int
maxQueueWait Maksymalny czas oczekiwania kolejki w formacie ISO 8601. Obsługuje precyzję milisekund. ciąg
requestTimeout Limit czasu żądania w formacie ISO 8601. Obsługuje precyzję milisekund. ciąg

OnlineScaleSettings

Nazwa Opis Wartość
maxInstances Maksymalna liczba wystąpień dla tego wdrożenia. int
minInstances Minimalna liczba wystąpień dla tego wdrożenia. int
scaleType Ustawianie typu obiektu Automatycznie
Ręczne (wymagane)

AutoSkalowanieUstawienia

Nazwa Opis Wartość
scaleType [Wymagane] Typ algorytmu skalowania wdrożenia "Auto" (wymagane)
Pollinginterval Interwał sondowania w formacie ISO 8691. Obsługuje tylko czas trwania z dokładnością do sekund. ciąg
targetUscsiPercentage Docelowe użycie procesora CPU dla narzędzia do skalowania automatycznego. int

ManualScaleSettings

Nazwa Opis Wartość
scaleType [Wymagane] Typ algorytmu skalowania wdrożenia "Ręczne" (wymagane)
instanceCount Stała liczba wystąpień dla tego wdrożenia. int

K8SOnlineDeployment

Nazwa Opis Wartość
endpointComputeType [Wymagane] Typ obliczeniowy punktu końcowego. "K8S" (wymagane)
containerResourceRequirements Wymagania dotyczące zasobów dla każdego wystąpienia kontenera we wdrożeniu online. ContainerResourceRequirements

ContainerResourceRequirements

Nazwa Opis Wartość
Procesora Minimalna ilość rdzeni procesora CPU do użycia przez kontener. Więcej informacji:
https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/
int
cpuLimit Maksymalna liczba rdzeni procesora CPU, które mogą być używane przez kontener. Więcej informacji:
https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/
int
Fpga Liczba urządzeń PCIE FPGA uwidocznionych w kontenerze. Musi mieć wielokrotność 2. int
Gpu Liczba rdzeni procesora GPU w kontenerze. int
memoryInGB Minimalna ilość pamięci (w GB) do użycia przez kontener. Więcej informacji:
https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/
int
memoryInGBLimit Maksymalna ilość pamięci (w GB) dozwolona do użycia przez kontener. Więcej informacji:
https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/
int

ManagedOnlineDeployment

Nazwa Opis Wartość
endpointComputeType [Wymagane] Typ obliczeniowy punktu końcowego. "Zarządzane" (wymagane)
Instancetype Typ wystąpienia obliczeniowego. ciąg
gotowośćProbe Konfiguracja sondy kondycji/gotowości kontenera wdrożenia. ProbeSettings

Definicja zasobu szablonu usługi ARM

Typ zasobu obszary robocze/onlineEndpoints/deployments można wdrożyć z operacjami docelowymi:

Aby uzyskać listę zmienionych właściwości w każdej wersji interfejsu API, zobacz dziennik zmian.

Format zasobu

Aby utworzyć zasób Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments, dodaj następujący kod JSON do szablonu.

{
  "type": "Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments",
  "apiVersion": "2021-03-01-preview",
  "name": "string",
  "location": "string",
  "tags": {
    "tagName1": "tagValue1",
    "tagName2": "tagValue2"
  },
  "kind": "string",
  "identity": {
    "type": "string",
    "userAssignedIdentities": {
      "{customized property}": {
        "clientId": "string",
        "principalId": "string"
      }
    }
  },
  "properties": {
    "appInsightsEnabled": "bool",
    "codeConfiguration": {
      "codeId": "string",
      "scoringScript": "string"
    },
    "description": "string",
    "environmentId": "string",
    "environmentVariables": {
      "{customized property}": "string"
    },
    "livenessProbe": {
      "failureThreshold": "int",
      "initialDelay": "string",
      "period": "string",
      "successThreshold": "int",
      "timeout": "string"
    },
    "model": {
      "referenceType": "string"
      // For remaining properties, see AssetReferenceBase objects
    },
    "properties": {
      "{customized property}": "string"
    },
    "requestSettings": {
      "maxConcurrentRequestsPerInstance": "int",
      "maxQueueWait": "string",
      "requestTimeout": "string"
    },
    "scaleSettings": {
      "maxInstances": "int",
      "minInstances": "int",
      "scaleType": "string"
      // For remaining properties, see OnlineScaleSettings objects
    },
    "endpointComputeType": "string"
    // For remaining properties, see OnlineDeployment objects
  }
}

Obiekty OnlineDeployment

Ustaw właściwość endpointComputeType , aby określić typ obiektu.

W przypadku usługi K8S użyj:

  "endpointComputeType": "K8S",
  "containerResourceRequirements": {
    "cpu": "int",
    "cpuLimit": "int",
    "fpga": "int",
    "gpu": "int",
    "memoryInGB": "int",
    "memoryInGBLimit": "int"
  }

W przypadku opcji Zarządzane użyj:

  "endpointComputeType": "Managed",
  "instanceType": "string",
  "readinessProbe": {
    "failureThreshold": "int",
    "initialDelay": "string",
    "period": "string",
    "successThreshold": "int",
    "timeout": "string"
  }

Obiekty AssetReferenceBase

Ustaw właściwość referenceType , aby określić typ obiektu.

W przypadku elementu DataPath użyj:

  "referenceType": "DataPath",
  "datastoreId": "string",
  "path": "string"

W obszarze Identyfikator użyj:

  "referenceType": "Id",
  "assetId": "string"

W przypadku elementu OutputPath użyj:

  "referenceType": "OutputPath",
  "jobId": "string",
  "path": "string"

Obiekty OnlineScaleSettings

Ustaw właściwość scaleType , aby określić typ obiektu.

W przypadku opcji Automatycznie użyj polecenia:

  "scaleType": "Auto",
  "pollingInterval": "string",
  "targetUtilizationPercentage": "int"

W przypadku instrukcji ręcznych użyj:

  "scaleType": "Manual",
  "instanceCount": "int"

Wartości właściwości

obszary robocze/onlineEndpoints/deployments

Nazwa Opis Wartość
typ Typ zasobu "Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments"
apiVersion Wersja interfejsu API zasobów "2021-03-01-preview"
name Nazwa zasobu

Zobacz, jak ustawić nazwy i typy dla zasobów podrzędnych w szablonach usługi ARM w formacie JSON.
ciąg (wymagany)
location Lokalizacja geograficzna, w której znajduje się zasób ciąg (wymagany)
tags Tagi zasobów. Słownik nazw tagów i wartości. Zobacz Tagi w szablonach
Rodzaju Metadane używane przez portal/narzędzia/itp. do renderowania różnych środowisk środowiska użytkownika dla zasobów tego samego typu. ciąg
identity Tożsamość usługi skojarzona z zasobem. Identyfikator zasobu
properties [Wymagane] Dodatkowe atrybuty jednostki. Wdrażanie online (wymagane)

Identyfikator zasobu

Nazwa Opis Wartość
typ Definiuje wartości typu ResourceIdentity. "Brak"
"SystemAssigned"
"SystemAssigned,UserAssigned"
"UserAssigned"
userAssignedIdentities Słownik tożsamości przypisanych przez użytkownika, klucz jest identyfikator zasobu ARM interfejsu użytkownika. ResourceIdentityUserAssignedIdentities

ResourceIdentityUserAssignedIdentities

Nazwa Opis Wartość
{niestandardowa właściwość} UserAssignedIdentityMeta

UserAssignedIdentityMeta

Nazwa Opis Wartość
clientId Identyfikator aplikacji — unikatowy identyfikator wygenerowany przez Azure AD, który jest powiązany z aplikacją i jednostką usługi podczas początkowej aprowizacji. ciąg
principalId Identyfikator obiektu jednostki usługi dla tożsamości zarządzanej, który służy do udzielania dostępu opartego na rolach do zasobu platformy Azure. ciąg

Wdrażanie online

Nazwa Opis Wartość
appInsightsEnabled Jeśli to prawda, włącza rejestrowanie usługi Application Insights. bool
codeConfiguration Konfiguracja kodu dla wdrożenia punktu końcowego. Konfiguracja kodu
description (opis) Opis wdrożenia punktu końcowego. ciąg
environmentId Identyfikator zasobu usługi ARM specyfikacji środowiska dla wdrożenia punktu końcowego. ciąg
environmentVariables Konfiguracja zmiennych środowiskowych dla wdrożenia. OnlineDeploymentEnvironmentVariables
livenessProbe Konfiguracja sondy kondycji/gotowości kontenera wdrożenia. ProbeSettings
model Odwołanie do zasobu modelu dla wdrożenia punktu końcowego. AssetReferenceBase
properties Słownik właściwości. Właściwości można dodawać, ale nie usuwać ani zmieniać. Właściwości onlineDeploymentProperties
requestSettings Konfiguracja żądań oceniania wdrożenia online. OnlineRequestSettings
scaleSettings Konfiguracja skalowania wdrożenia online. OnlineScaleSettings
endpointComputeType Ustawianie typu obiektu K8S
Zarządzane (wymagane)

Konfiguracja kodu

Nazwa Opis Wartość
codeId Identyfikator zasobu usługi ARM zasobu kodu. ciąg
scoringScript [Wymagane] Skrypt do wykonania podczas uruchamiania. np. "score.py" ciąg (wymagany)

Ograniczenia:
Minimalna długość = 1
Wzorzec = [a-zA-Z0-9_]

OnlineDeploymentEnvironmentVariables

Nazwa Opis Wartość
{niestandardowa właściwość} ciąg

ProbeSettings

Nazwa Opis Wartość
failureThreshold Liczba niepowodzeń, które należy zezwolić przed zwróceniem stanu złej kondycji. int
initialDelay Opóźnienie przed pierwszą sondą w formacie ISO 8601. ciąg
period Czas między sondami w formacie ISO 8601. ciąg
successThreshold Liczba pomyślnych sond przed zwróceniem stanu dobrej kondycji. int
timeout Limit czasu sondy w formacie ISO 8601. ciąg

AssetReferenceBase

Nazwa Opis Wartość
referenceType Ustawianie typu obiektu DataPath
Identyfikator
OutputPath (wymagane)

DataPathAssetReference

Nazwa Opis Wartość
referenceType [Wymagane] Określa typ odwołania do zasobu. "DataPath" (wymagane)
datastoreId Identyfikator zasobu usługi ARM magazynu danych, w którym znajduje się zasób. ciąg
path Ścieżka pliku/katalogu w magazynie danych. ciąg

IdAssetReference

Nazwa Opis Wartość
referenceType [Wymagane] Określa typ odwołania do zasobu. "Id" (wymagany)
assetId [Wymagane] Identyfikator zasobu usługi ARM. ciąg (wymagany)

Ograniczenia:
Wzorzec = [a-zA-Z0-9_]

OutputPathAssetReference

Nazwa Opis Wartość
referenceType [Wymagane] Określa typ odwołania do zasobu. "OutputPath" (wymagane)
Jobid Identyfikator zasobu usługi ARM zadania. ciąg
path Ścieżka pliku/katalogu w danych wyjściowych zadania. ciąg

Właściwości onlineDeploymentProperties

Nazwa Opis Wartość
{niestandardowa właściwość} ciąg

OnlineRequestSettings

Nazwa Opis Wartość
maxConcurrentRequestsPerInstance Liczba żądań dozwolonych do kolejki jednocześnie dla tego wdrożenia. int
maxQueueWait Maksymalny czas oczekiwania kolejki w formacie ISO 8601. Obsługuje precyzję milisekund. ciąg
requestTimeout Limit czasu żądania w formacie ISO 8601. Obsługuje precyzję milisekund. ciąg

OnlineScaleSettings

Nazwa Opis Wartość
maxInstances Maksymalna liczba wystąpień dla tego wdrożenia. int
minInstances Minimalna liczba wystąpień dla tego wdrożenia. int
scaleType Ustawianie typu obiektu Automatycznie
Ręczne (wymagane)

AutoskalowanieUstawienia

Nazwa Opis Wartość
scaleType [Wymagane] Typ algorytmu skalowania wdrożenia "Auto" (wymagane)
Pollinginterval Interwał sondowania w formacie ISO 8691. Obsługuje tylko czas trwania z dokładnością do sekund. ciąg
targetUprzedażyPercentage Docelowe użycie procesora CPU dla narzędzia do skalowania automatycznego. int

ManualScaleSettings

Nazwa Opis Wartość
scaleType [Wymagane] Typ algorytmu skalowania wdrożenia "Ręczne" (wymagane)
instanceCount Stała liczba wystąpień dla tego wdrożenia. int

K8SOnlineDeployment

Nazwa Opis Wartość
endpointComputeType [Wymagane] Typ obliczeniowy punktu końcowego. "K8S" (wymagane)
containerResourceRequirements Wymagania dotyczące zasobów dla każdego wystąpienia kontenera we wdrożeniu online. ContainerResourceRequirements

ContainerResourceRequirements

Nazwa Opis Wartość
Procesora Minimalna ilość rdzeni procesora CPU do użycia przez kontener. Więcej informacji:
https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/
int
cpuLimit Maksymalna ilość rdzeni procesora CPU może być używana przez kontener. Więcej informacji:
https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/
int
Fpga Liczba urządzeń FPGA PCIE uwidocznionych w kontenerze. Musi być wielokrotna z 2. int
Gpu Liczba rdzeni procesora GPU w kontenerze. int
memoryInGB Minimalna ilość pamięci (w GB) do użycia przez kontener. Więcej informacji:
https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/
int
memoryInGBLimit Maksymalna ilość pamięci (w GB) może być używana przez kontener. Więcej informacji:
https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/
int

ManagedOnlineDeployment

Nazwa Opis Wartość
endpointComputeType [Wymagane] Typ obliczeniowy punktu końcowego. "Zarządzane" (wymagane)
Instancetype Typ wystąpienia obliczeniowego. ciąg
gotowośćProbe Konfiguracja sondy liveness/readiness kontenera wdrożenia. ProbeSettings

Definicja zasobu narzędzia Terraform (dostawcy AzAPI)

Typ zasobu workspaces/onlineEndpoints/deployments można wdrożyć przy użyciu operacji docelowych:

  • Grupy zasobów

Aby uzyskać listę zmienionych właściwości w każdej wersji interfejsu API, zobacz dziennik zmian.

Format zasobu

Aby utworzyć zasób Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments, dodaj następujące narzędzie Terraform do szablonu.

resource "azapi_resource" "symbolicname" {
  type = "Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments@2021-03-01-preview"
  name = "string"
  location = "string"
  parent_id = "string"
  tags = {
    tagName1 = "tagValue1"
    tagName2 = "tagValue2"
  }
  identity {
    type = "string"
    identity_ids = []
  }
  body = jsonencode({
    properties = {
      appInsightsEnabled = bool
      codeConfiguration = {
        codeId = "string"
        scoringScript = "string"
      }
      description = "string"
      environmentId = "string"
      environmentVariables = {
        {customized property} = "string"
      }
      livenessProbe = {
        failureThreshold = int
        initialDelay = "string"
        period = "string"
        successThreshold = int
        timeout = "string"
      }
      model = {
        referenceType = "string"
        // For remaining properties, see AssetReferenceBase objects
      }
      properties = {
        {customized property} = "string"
      }
      requestSettings = {
        maxConcurrentRequestsPerInstance = int
        maxQueueWait = "string"
        requestTimeout = "string"
      }
      scaleSettings = {
        maxInstances = int
        minInstances = int
        scaleType = "string"
        // For remaining properties, see OnlineScaleSettings objects
      }
      endpointComputeType = "string"
      // For remaining properties, see OnlineDeployment objects
    }
    kind = "string"
  })
}

Obiekty OnlineDeployment

Ustaw właściwość endpointComputeType , aby określić typ obiektu.

W przypadku K8S użyj:

  endpointComputeType = "K8S"
  containerResourceRequirements = {
    cpu = int
    cpuLimit = int
    fpga = int
    gpu = int
    memoryInGB = int
    memoryInGBLimit = int
  }

W przypadku opcji Zarządzane użyj:

  endpointComputeType = "Managed"
  instanceType = "string"
  readinessProbe = {
    failureThreshold = int
    initialDelay = "string"
    period = "string"
    successThreshold = int
    timeout = "string"
  }

Obiekty AssetReferenceBase

Ustaw właściwość referenceType , aby określić typ obiektu.

W przypadku programu DataPath użyj:

  referenceType = "DataPath"
  datastoreId = "string"
  path = "string"

W przypadku identyfikatora użyj:

  referenceType = "Id"
  assetId = "string"

W przypadku parametru OutputPath użyj:

  referenceType = "OutputPath"
  jobId = "string"
  path = "string"

Obiekty OnlineScaleSettings

Ustaw właściwość scaleType , aby określić typ obiektu.

W przypadku opcji Auto użyj:

  scaleType = "Auto"
  pollingInterval = "string"
  targetUtilizationPercentage = int

W przypadku opcji Ręczne użyj:

  scaleType = "Manual"
  instanceCount = int

Wartości właściwości

workspaces/onlineEndpoints/deployments

Nazwa Opis Wartość
typ Typ zasobu "Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments@2021-03-01-preview"
name Nazwa zasobu ciąg (wymagany)
location Lokalizacja geograficzna, w której znajduje się zasób ciąg (wymagany)
parent_id Identyfikator zasobu, który jest elementem nadrzędnym dla tego zasobu. Identyfikator zasobu typu: onlineEndpoints
tags Tagi zasobów. Słownik nazw tagów i wartości.
Rodzaju Metadane używane przez portal/narzędzia/itp. do renderowania różnych środowisk środowiska użytkownika dla zasobów tego samego typu. ciąg
identity Tożsamość usługi skojarzona z zasobem. Identyfikator zasobu
properties [Wymagane] Dodatkowe atrybuty jednostki. OnlineDeployment (wymagane)

Identyfikator zasobu

Nazwa Opis Wartość
typ Definiuje wartości typu ResourceIdentity. "SystemAssigned"
"SystemAssigned,UserAssigned"
"UserAssigned"
identity_ids Słownik tożsamości przypisanych przez użytkownika, klucz jest identyfikator zasobu ARM interfejsu użytkownika. Tablica identyfikatorów tożsamości użytkowników.

ResourceIdentityUserAssignedIdentities

Nazwa Opis Wartość
{niestandardowa właściwość} UserAssignedIdentityMeta

UserAssignedIdentityMeta

Nazwa Opis Wartość
clientId Identyfikator aplikacji — unikatowy identyfikator wygenerowany przez Azure AD, który jest powiązany z aplikacją i jednostką usługi podczas początkowej aprowizacji. ciąg
principalId Identyfikator obiektu jednostki usługi dla tożsamości zarządzanej, który służy do udzielania dostępu opartego na rolach do zasobu platformy Azure. ciąg

Wdrażanie online

Nazwa Opis Wartość
appInsightsEnabled Jeśli to prawda, włącza rejestrowanie usługi Application Insights. bool
codeConfiguration Konfiguracja kodu dla wdrożenia punktu końcowego. Konfiguracja kodu
description (opis) Opis wdrożenia punktu końcowego. ciąg
environmentId Identyfikator zasobu usługi ARM specyfikacji środowiska dla wdrożenia punktu końcowego. ciąg
environmentVariables Konfiguracja zmiennych środowiskowych dla wdrożenia. OnlineDeploymentEnvironmentVariables
livenessProbe Konfiguracja sondy kondycji/gotowości kontenera wdrożenia. ProbeSettings
model Odwołanie do zasobu modelu dla wdrożenia punktu końcowego. AssetReferenceBase
properties Słownik właściwości. Właściwości można dodawać, ale nie usuwać ani zmieniać. Właściwości onlineDeploymentProperties
requestSettings Konfiguracja żądań oceniania wdrożenia online. OnlineRequestSettings
scaleSettings Konfiguracja skalowania wdrożenia online. OnlineScaleSettings
endpointComputeType Ustawianie typu obiektu K8S
Zarządzane (wymagane)

Konfiguracja kodu

Nazwa Opis Wartość
codeId Identyfikator zasobu usługi ARM zasobu kodu. ciąg
scoringScript [Wymagane] Skrypt do wykonania podczas uruchamiania. np. "score.py" ciąg (wymagany)

Ograniczenia:
Minimalna długość = 1
Wzorzec = [a-zA-Z0-9_]

OnlineDeploymentEnvironmentVariables

Nazwa Opis Wartość
{niestandardowa właściwość} ciąg

ProbeSettings

Nazwa Opis Wartość
failureThreshold Liczba niepowodzeń, które należy zezwolić przed zwróceniem stanu złej kondycji. int
initialDelay Opóźnienie przed pierwszą sondą w formacie ISO 8601. ciąg
period Czas między sondami w formacie ISO 8601. ciąg
successThreshold Liczba pomyślnych sond przed zwróceniem stanu dobrej kondycji. int
timeout Limit czasu sondy w formacie ISO 8601. ciąg

AssetReferenceBase

Nazwa Opis Wartość
referenceType Ustawianie typu obiektu DataPath
Identyfikator
OutputPath (wymagane)

DataPathAssetReference

Nazwa Opis Wartość
referenceType [Wymagane] Określa typ odwołania do zasobu. "DataPath" (wymagany)
datastoreId Identyfikator zasobu usługi ARM magazynu danych, w którym znajduje się zasób. ciąg
path Ścieżka pliku/katalogu w magazynie danych. ciąg

IdAssetReference

Nazwa Opis Wartość
referenceType [Wymagane] Określa typ odwołania do zasobu. "Id" (wymagany)
assetId [Wymagane] Identyfikator zasobu usługi ARM. ciąg (wymagany)

Ograniczenia:
Wzorzec = [a-zA-Z0-9_]

OutputPathAssetReference

Nazwa Opis Wartość
referenceType [Wymagane] Określa typ odwołania do zasobu. "OutputPath" (wymagane)
Jobid Identyfikator zasobu usługi ARM zadania. ciąg
path Ścieżka pliku/katalogu w danych wyjściowych zadania. ciąg

OnlineDeploymentProperties

Nazwa Opis Wartość
{niestandardowa właściwość} ciąg

OnlineRequestSettings

Nazwa Opis Wartość
maxConcurrentRequestsPerInstance Liczba żądań dozwolonych do kolejkowania jednocześnie dla tego wdrożenia. int
maxQueueWait Maksymalny czas oczekiwania kolejki w formacie ISO 8601. Obsługuje precyzję milisekund. ciąg
requestTimeout Limit czasu żądania w formacie ISO 8601. Obsługuje precyzję milisekund. ciąg

OnlineScaleSettings

Nazwa Opis Wartość
maxInstances Maksymalna liczba wystąpień dla tego wdrożenia. int
minInstances Minimalna liczba wystąpień dla tego wdrożenia. int
scaleType Ustawianie typu obiektu Automatycznie
Ręczne (wymagane)

AutoSkalowanieUstawienia

Nazwa Opis Wartość
scaleType [Wymagane] Typ algorytmu skalowania wdrożenia "Auto" (wymagane)
Pollinginterval Interwał sondowania w formacie ISO 8691. Obsługuje tylko czas trwania z dokładnością do sekund. ciąg
targetUscsiPercentage Docelowe użycie procesora CPU dla narzędzia do skalowania automatycznego. int

ManualScaleSettings

Nazwa Opis Wartość
scaleType [Wymagane] Typ algorytmu skalowania wdrożenia "Ręczne" (wymagane)
instanceCount Stała liczba wystąpień dla tego wdrożenia. int

K8SOnlineDeployment

Nazwa Opis Wartość
endpointComputeType [Wymagane] Typ obliczeniowy punktu końcowego. "K8S" (wymagane)
containerResourceRequirements Wymagania dotyczące zasobów dla każdego wystąpienia kontenera we wdrożeniu online. ContainerResourceRequirements

ContainerResourceRequirements

Nazwa Opis Wartość
Procesora Minimalna ilość rdzeni procesora CPU do użycia przez kontener. Więcej informacji:
https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/
int
cpuLimit Maksymalna ilość rdzeni procesora CPU może być używana przez kontener. Więcej informacji:
https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/
int
Fpga Liczba urządzeń FPGA PCIE uwidocznionych w kontenerze. Musi być wielokrotna z 2. int
Gpu Liczba rdzeni procesora GPU w kontenerze. int
memoryInGB Minimalna ilość pamięci (w GB) do użycia przez kontener. Więcej informacji:
https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/
int
memoryInGBLimit Maksymalna ilość pamięci (w GB) może być używana przez kontener. Więcej informacji:
https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/
int

ManagedOnlineDeployment

Nazwa Opis Wartość
endpointComputeType [Wymagane] Typ obliczeniowy punktu końcowego. "Zarządzane" (wymagane)
Instancetype Typ wystąpienia obliczeniowego. ciąg
gotowośćProbe Konfiguracja sondy liveness/readiness kontenera wdrożenia. ProbeSettings