Microsoft.MachineLearningServices workspaces/onlineEndpoints/deployments 2022-05-01

Definicja zasobu Bicep

Typ zasobu obszary robocze/onlineEndpoints/deployments można wdrożyć z operacjami docelowymi:

Aby uzyskać listę zmienionych właściwości w każdej wersji interfejsu API, zobacz dziennik zmian.

Format zasobu

Aby utworzyć zasób Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments, dodaj następujący kod Bicep do szablonu.

resource symbolicname 'Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments@2022-05-01' = {
  name: 'string'
  location: 'string'
  tags: {
    tagName1: 'tagValue1'
    tagName2: 'tagValue2'
  }
  sku: {
    capacity: int
    family: 'string'
    name: 'string'
    size: 'string'
    tier: 'string'
  }
  kind: 'string'
  parent: resourceSymbolicName
  identity: {
    type: 'string'
    userAssignedIdentities: {
      {customized property}: {}
    }
  }
  properties: {
    appInsightsEnabled: bool
    codeConfiguration: {
      codeId: 'string'
      scoringScript: 'string'
    }
    description: 'string'
    environmentId: 'string'
    environmentVariables: {
      {customized property}: 'string'
      {customized property}: 'string'
    }
    instanceType: 'string'
    livenessProbe: {
      failureThreshold: int
      initialDelay: 'string'
      period: 'string'
      successThreshold: int
      timeout: 'string'
    }
    model: 'string'
    modelMountPath: 'string'
    properties: {
      {customized property}: 'string'
      {customized property}: 'string'
    }
    readinessProbe: {
      failureThreshold: int
      initialDelay: 'string'
      period: 'string'
      successThreshold: int
      timeout: 'string'
    }
    requestSettings: {
      maxConcurrentRequestsPerInstance: int
      maxQueueWait: 'string'
      requestTimeout: 'string'
    }
    scaleSettings: {
      scaleType: 'string'
      // For remaining properties, see OnlineScaleSettings objects
    }
    endpointComputeType: 'string'
    // For remaining properties, see OnlineDeploymentProperties objects
  }
}

Obiekty OnlineDeploymentProperties

Ustaw właściwość endpointComputeType , aby określić typ obiektu.

W przypadku platformy Kubernetes użyj:

  endpointComputeType: 'Kubernetes'
  containerResourceRequirements: {
    containerResourceLimits: {
      cpu: 'string'
      gpu: 'string'
      memory: 'string'
    }
    containerResourceRequests: {
      cpu: 'string'
      gpu: 'string'
      memory: 'string'
    }
  }

W przypadku opcji Zarządzane użyj:

  endpointComputeType: 'Managed'

Obiekty OnlineScaleSettings

Ustaw właściwość scaleType , aby określić typ obiektu.

W obszarze Wartość domyślna użyj:

  scaleType: 'Default'

W przypadku elementu TargetU nie należy używać:

  scaleType: 'TargetUtilization'
  maxInstances: int
  minInstances: int
  pollingInterval: 'string'
  targetUtilizationPercentage: int

Wartości właściwości

obszary robocze/onlineEndpoints/deployments

Nazwa Opis Wartość
name Nazwa zasobu

Zobacz, jak ustawić nazwy i typy dla zasobów podrzędnych w aplikacji Bicep.
ciąg (wymagany)
location Lokalizacja geograficzna, w której znajduje się zasób ciąg (wymagany)
tags Tagi zasobów. Słownik nazw tagów i wartości. Zobacz Tagi w szablonach
sku Szczegóły jednostki SKU wymagane dla kontraktu usługi ARM na potrzeby skalowania automatycznego. Numer jednostki magazynowej
Rodzaju Metadane używane przez portal/narzędzia/itp. do renderowania różnych środowisk środowiska użytkownika dla zasobów tego samego typu. ciąg
Nadrzędny W Bicep można określić zasób nadrzędny dla zasobu podrzędnego. Tę właściwość należy dodać tylko wtedy, gdy zasób podrzędny jest zadeklarowany poza zasobem nadrzędnym.

Aby uzyskać więcej informacji, zobacz Zasób podrzędny poza zasobem nadrzędnym.
Nazwa symboliczna zasobu typu: onlineEndpoints
identity Tożsamość usługi zarządzanej (tożsamości przypisane przez system i/lub przypisane przez użytkownika) ManagedServiceIdentity
properties [Wymagane] Dodatkowe atrybuty jednostki. Właściwości onlineDeploymentProperties (wymagane)

ManagedServiceIdentity

Nazwa Opis Wartość
typ Typ tożsamości usługi zarządzanej (gdzie dozwolone są typy SystemAssigned i UserAssigned). "Brak"
"SystemAssigned"
"SystemAssigned,UserAssigned"
"UserAssigned" (wymagane)
userAssignedIdentities Zestaw tożsamości przypisanych przez użytkownika skojarzonych z zasobem. Klucze słownika userAssignedIdentities będą identyfikatorami zasobów usługi ARM w postaci: "/subscriptions/{subscriptionId}/resourceGroups/{resourceGroupName}/providers/Microsoft.ManagedIdentity/userAssignedIdentities/{identityName}. Wartości słownika mogą być pustymi obiektami ({}) w żądaniach. UserAssignedIdentities

UserAssignedIdentities

Nazwa Opis Wartość
{niestandardowa właściwość} UserAssignedIdentity

UserAssignedIdentity

Ten obiekt nie zawiera żadnych właściwości do ustawienia podczas wdrażania. Wszystkie właściwości to ReadOnly.

Właściwości onlineDeploymentProperties

Nazwa Opis Wartość
appInsightsEnabled Jeśli to prawda, włącza rejestrowanie usługi Application Insights. bool
codeConfiguration Konfiguracja kodu dla wdrożenia punktu końcowego. Konfiguracja kodu
description (opis) Opis wdrożenia punktu końcowego. ciąg
environmentId Identyfikator zasobu usługi ARM lub identyfikator zasobu specyfikacji środowiska dla wdrożenia punktu końcowego. ciąg
environmentVariables Konfiguracja zmiennych środowiskowych dla wdrożenia. EndpointDeploymentPropertiesBaseEnvironmentVariables
Instancetype Typ wystąpienia obliczeniowego. ciąg
livenessProbe Sonda liveness regularnie monitoruje kondycję kontenera. ProbeSettings
model Ścieżka identyfikatora URI do modelu. ciąg
modelMountPath Ścieżka do zainstalowania modelu w kontenerze niestandardowym. ciąg
properties Słownik właściwości. Właściwości można dodać, ale nie usuwać ani zmieniać. EndpointDeploymentPropertiesBaseProperties
gotowośćProbe Sonda gotowości sprawdza, czy kontener jest gotowy do obsługi ruchu. Właściwości i wartości domyślne są takie same jak sonda liveness. ProbeSettings
requestSettings Zażądaj ustawień wdrożenia. OnlineRequestSettings
scaleSettings Skalowanie ustawień wdrożenia.
Jeśli ma wartość null lub nie jest podana,
wartość domyślna to TargetUsettingsScaleSettings for KubernetesOnlineDeployment
i do wartości DefaultScaleSettings for ManagedOnlineDeployment.
OnlineScaleSettings
endpointComputeType Ustawianie typu obiektu Kubernetes
Zarządzane (wymagane)

Konfiguracja kodu

Nazwa Opis Wartość
codeId Identyfikator zasobu usługi ARM zasobu kodu. ciąg
scoringScript [Wymagane] Skrypt do wykonania podczas uruchamiania. np. "score.py" ciąg (wymagany)

Ograniczenia:
Minimalna długość = 1
Wzorzec = [a-zA-Z0-9_]

EndpointDeploymentPropertiesBaseEnvironmentVariables

Nazwa Opis Wartość
{niestandardowa właściwość} ciąg
{niestandardowa właściwość} ciąg

ProbeSettings

Nazwa Opis Wartość
failureThreshold Liczba niepowodzeń, które mają być dozwolone przed zwróceniem stanu złej kondycji. int
initialDelay Opóźnienie przed pierwszą sondą w formacie ISO 8601. ciąg
period Długość czasu między sondami w formacie ISO 8601. ciąg
successThreshold Liczba pomyślnych sond przed zwróceniem stanu w dobrej kondycji. int
timeout Limit czasu sondy w formacie ISO 8601. ciąg

EndpointDeploymentPropertiesBaseProperties

Nazwa Opis Wartość
{niestandardowa właściwość} ciąg
{niestandardowa właściwość} ciąg

OnlineRequestSettings

Nazwa Opis Wartość
maxConcurrentRequestsPerInstance Maksymalna liczba współbieżnych żądań na węzeł dozwolonych na wdrożenie. Wartość domyślna to 1. int
maxQueueWait Maksymalny czas, przez jaki żądanie pozostanie w kolejce w formacie ISO 8601.
Wartość domyślna to 500 ms.
ciąg
requestTimeout Limit czasu oceniania w formacie ISO 8601.
Wartość domyślna to 5000 ms.
ciąg

OnlineScaleSettings

Nazwa Opis Wartość
scaleType Ustawianie typu obiektu Default
TargetU bez wykorzystania (wymagane)

DefaultScaleSettings

Nazwa Opis Wartość
scaleType [Wymagane] Typ algorytmu skalowania wdrożenia "Wartość domyślna" (wymagana)

TargetUscsiScaleSettings

Nazwa Opis Wartość
scaleType [Wymagane] Typ algorytmu skalowania wdrożenia "TargetU działania" (wymagane)
maxInstances Maksymalna liczba wystąpień, do których wdrożenie może być skalowane. Limit przydziału zostanie zarezerwowany dla max_instances. int
minInstances Minimalna liczba wystąpień, które mają być zawsze obecne. int
Pollinginterval Interwał sondowania w formacie ISO 8691. Obsługuje tylko czas trwania z dokładnością do sekund. ciąg
targetUprzedażyPercentage Docelowe użycie procesora CPU dla narzędzia do skalowania automatycznego. int

KubernetesOnlineDeployment

Nazwa Opis Wartość
endpointComputeType [Wymagane] Typ obliczeniowy punktu końcowego. "Kubernetes" (wymagane)
containerResourceRequirements Wymagania dotyczące zasobów dla kontenera (procesor i pamięć). ContainerResourceRequirements

ContainerResourceRequirements

Nazwa Opis Wartość
containerResourceLimits Informacje o limicie zasobów kontenera: ContainerResourceSettings
containerResourceRequests Informacje o żądaniu zasobu kontenera: ContainerResourceSettings

ContainerResourceSettings

Nazwa Opis Wartość
Procesora Liczba żądań/limitu procesorów wirtualnych dla kontenera. Więcej informacji:
https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/
ciąg
Gpu Liczba żądań/limitów kart gpu firmy Nvidia dla kontenera. Więcej informacji:
https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/
ciąg
pamięć Żądanie/limit rozmiaru pamięci dla kontenera. Więcej informacji:
https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/
ciąg

ManagedOnlineDeployment

Nazwa Opis Wartość
endpointComputeType [Wymagane] Typ obliczeniowy punktu końcowego. "Zarządzane" (wymagane)

SKU

Nazwa Opis Wartość
capacity Jeśli jednostka SKU obsługuje skalowanie w poziomie/w poziomie, należy uwzględnić liczbę całkowitą pojemności. Jeśli skalowanie w poziomie/w poziomie nie jest możliwe dla zasobu, może to zostać pominięte. int
rodzina Jeśli usługa ma różne generacje sprzętu, dla tej samej jednostki SKU, można je przechwycić tutaj. ciąg
name Nazwa jednostki SKU. Ex - P3. Zazwyczaj jest to kod litery i cyfry ciąg (wymagany)
size Rozmiar jednostki SKU. Gdy pole nazwy jest kombinacją warstwy i inną wartością, będzie to autonomiczny kod. ciąg
tier To pole jest wymagane do zaimplementowania przez dostawcę zasobów, jeśli usługa ma więcej niż jedną warstwę, ale nie jest wymagana w put. "Podstawowa"
"Bezpłatna"
"Premium"
"Standardowa"

Definicja zasobu szablonu usługi ARM

Typ zasobu workspaces/onlineEndpoints/deployments można wdrożyć przy użyciu operacji docelowych:

Aby uzyskać listę zmienionych właściwości w każdej wersji interfejsu API, zobacz dziennik zmian.

Format zasobu

Aby utworzyć zasób Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments, dodaj następujący kod JSON do szablonu.

{
  "type": "Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments",
  "apiVersion": "2022-05-01",
  "name": "string",
  "location": "string",
  "tags": {
    "tagName1": "tagValue1",
    "tagName2": "tagValue2"
  },
  "sku": {
    "capacity": "int",
    "family": "string",
    "name": "string",
    "size": "string",
    "tier": "string"
  },
  "kind": "string",
  "identity": {
    "type": "string",
    "userAssignedIdentities": {
      "{customized property}": {}
    }
  },
  "properties": {
    "appInsightsEnabled": "bool",
    "codeConfiguration": {
      "codeId": "string",
      "scoringScript": "string"
    },
    "description": "string",
    "environmentId": "string",
    "environmentVariables": {
      "{customized property}": "string",
      "{customized property}": "string"
    },
    "instanceType": "string",
    "livenessProbe": {
      "failureThreshold": "int",
      "initialDelay": "string",
      "period": "string",
      "successThreshold": "int",
      "timeout": "string"
    },
    "model": "string",
    "modelMountPath": "string",
    "properties": {
      "{customized property}": "string",
      "{customized property}": "string"
    },
    "readinessProbe": {
      "failureThreshold": "int",
      "initialDelay": "string",
      "period": "string",
      "successThreshold": "int",
      "timeout": "string"
    },
    "requestSettings": {
      "maxConcurrentRequestsPerInstance": "int",
      "maxQueueWait": "string",
      "requestTimeout": "string"
    },
    "scaleSettings": {
      "scaleType": "string"
      // For remaining properties, see OnlineScaleSettings objects
    },
    "endpointComputeType": "string"
    // For remaining properties, see OnlineDeploymentProperties objects
  }
}

Obiekty OnlineDeploymentProperties

Ustaw właściwość endpointComputeType , aby określić typ obiektu.

W przypadku platformy Kubernetes użyj:

  "endpointComputeType": "Kubernetes",
  "containerResourceRequirements": {
    "containerResourceLimits": {
      "cpu": "string",
      "gpu": "string",
      "memory": "string"
    },
    "containerResourceRequests": {
      "cpu": "string",
      "gpu": "string",
      "memory": "string"
    }
  }

W przypadku opcji Zarządzane użyj:

  "endpointComputeType": "Managed"

Obiekty OnlineScaleSettings

Ustaw właściwość scaleType , aby określić typ obiektu.

W obszarze Wartość domyślna użyj:

  "scaleType": "Default"

W przypadku elementu TargetUscsi użyj:

  "scaleType": "TargetUtilization",
  "maxInstances": "int",
  "minInstances": "int",
  "pollingInterval": "string",
  "targetUtilizationPercentage": "int"

Wartości właściwości

workspaces/onlineEndpoints/deployments

Nazwa Opis Wartość
typ Typ zasobu "Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments"
apiVersion Wersja interfejsu API zasobów '2022-05-01'
name Nazwa zasobu

Zobacz, jak ustawiać nazwy i typy dla zasobów podrzędnych w szablonach usługi ARM JSON.
ciąg (wymagany)
location Lokalizacja geograficzna, w której znajduje się zasób ciąg (wymagany)
tags Tagi zasobów. Słownik nazw tagów i wartości. Zobacz Tagi w szablonach
sku Szczegóły jednostki SKU wymagane dla kontraktu usługi ARM na potrzeby skalowania automatycznego. Numer jednostki magazynowej
Rodzaju Metadane używane przez portal/narzędzia/itp. do renderowania różnych środowisk środowiska użytkownika dla zasobów tego samego typu. ciąg
identity Tożsamość usługi zarządzanej (tożsamości przypisane przez system i/lub przypisane przez użytkownika) Identyfikator usługi zarządzanej
properties [Wymagane] Dodatkowe atrybuty jednostki. OnlineDeploymentProperties (wymagane)

Identyfikator usługi zarządzanej

Nazwa Opis Wartość
typ Typ tożsamości usługi zarządzanej (gdzie dozwolone są typy SystemAssigned i UserAssigned). "Brak"
"SystemAssigned"
"SystemAssigned,UserAssigned"
"UserAssigned" (wymagane)
userAssignedIdentities Zestaw tożsamości przypisanych przez użytkownika skojarzonych z zasobem. Klucze słownika userAssignedIdentities będą identyfikatorami zasobów usługi ARM w postaci: '/subscriptions/{subscriptionId}/resourceGroups/{resourceGroupName}/providers/Microsoft.ManagedIdentity/userAssignedIdentities/{identityName}. Wartości słownika mogą być pustymi obiektami ({}) w żądaniach. UserAssignedIdentities

UserAssignedIdentities

Nazwa Opis Wartość
{niestandardowa właściwość} UserAssignedIdentity

UserAssignedIdentity

Ten obiekt nie zawiera żadnych właściwości do ustawienia podczas wdrażania. Wszystkie właściwości to ReadOnly.

OnlineDeploymentProperties

Nazwa Opis Wartość
appInsightsEnabled Jeśli wartość true, włączy rejestrowanie usługi Application Insights. bool
codeConfiguration Konfiguracja kodu dla wdrożenia punktu końcowego. Konfiguracja kodu
description (opis) Opis wdrożenia punktu końcowego. ciąg
environmentId Identyfikator zasobu usługi ARM lub identyfikator zasobu specyfikacji środowiska dla wdrożenia punktu końcowego. ciąg
environmentVariables Konfiguracja zmiennych środowiskowych dla wdrożenia. EndpointDeploymentPropertiesBaseEnvironmentVariables
Instancetype Typ wystąpienia obliczeniowego. ciąg
livenessProbe Sonda liveness regularnie monitoruje kondycję kontenera. ProbeSettings
model Ścieżka identyfikatora URI do modelu. ciąg
modelMountPath Ścieżka instalacji modelu w kontenerze niestandardowym. ciąg
properties Słownik właściwości. Właściwości można dodawać, ale nie usuwać ani zmieniać. EndpointDeploymentPropertiesBaseProperties
gotowośćProbe Sonda gotowości sprawdza, czy kontener jest gotowy do obsługi ruchu. Właściwości i wartości domyślne są takie same jak sonda liveness. ProbeSettings
requestSettings Zażądaj ustawień wdrożenia. OnlineRequestSettings
scaleSettings Ustawienia skalowania wdrożenia.
Jeśli ma wartość null lub nie jest podana,
wartość domyślna to TargetUsettingScaleSettings dla rozwiązania KubernetesOnlineDeployment
i na DefaultScaleSettings dla elementu ManagedOnlineDeployment.
OnlineScaleSettings
endpointComputeType Ustawianie typu obiektu Kubernetes
Zarządzane (wymagane)

Konfiguracja kodu

Nazwa Opis Wartość
codeId Identyfikator zasobu usługi ARM zasobu kodu. ciąg
scoringScript [Wymagane] Skrypt do wykonania podczas uruchamiania. np. "score.py" ciąg (wymagany)

Ograniczenia:
Minimalna długość = 1
Wzorzec = [a-zA-Z0-9_]

EndpointDeploymentPropertiesBaseEnvironmentVariables

Nazwa Opis Wartość
{niestandardowa właściwość} ciąg
{niestandardowa właściwość} ciąg

ProbeSettings

Nazwa Opis Wartość
failureThreshold Liczba niepowodzeń, które należy zezwolić przed zwróceniem stanu złej kondycji. int
initialDelay Opóźnienie przed pierwszą sondą w formacie ISO 8601. ciąg
period Czas między sondami w formacie ISO 8601. ciąg
successThreshold Liczba pomyślnych sond przed zwróceniem stanu dobrej kondycji. int
timeout Limit czasu sondy w formacie ISO 8601. ciąg

EndpointDeploymentPropertiesBaseProperties

Nazwa Opis Wartość
{niestandardowa właściwość} ciąg
{niestandardowa właściwość} ciąg

OnlineRequestSettings

Nazwa Opis Wartość
maxConcurrentRequestsPerInstance Maksymalna liczba współbieżnych żądań na węzeł dozwolonych na wdrożenie. Wartość domyślna to 1. int
maxQueueWait Maksymalny czas, przez jaki żądanie pozostanie w kolejce w formacie ISO 8601.
Wartość domyślna to 500 ms.
ciąg
requestTimeout Limit czasu oceniania w formacie ISO 8601.
Wartość domyślna to 5000 ms.
ciąg

OnlineScaleSettings

Nazwa Opis Wartość
scaleType Ustawianie typu obiektu Default
TargetU bez wykorzystania (wymagane)

DefaultScaleSettings

Nazwa Opis Wartość
scaleType [Wymagane] Typ algorytmu skalowania wdrożenia "Wartość domyślna" (wymagana)

TargetUscsiScaleSettings

Nazwa Opis Wartość
scaleType [Wymagane] Typ algorytmu skalowania wdrożenia "TargetU działania" (wymagane)
maxInstances Maksymalna liczba wystąpień, do których wdrożenie może być skalowane. Limit przydziału zostanie zarezerwowany dla max_instances. int
minInstances Minimalna liczba wystąpień, które mają być zawsze obecne. int
Pollinginterval Interwał sondowania w formacie ISO 8691. Obsługuje tylko czas trwania z dokładnością do sekund. ciąg
targetUprzedażyPercentage Docelowe użycie procesora CPU dla narzędzia do skalowania automatycznego. int

KubernetesOnlineDeployment

Nazwa Opis Wartość
endpointComputeType [Wymagane] Typ obliczeniowy punktu końcowego. "Kubernetes" (wymagane)
containerResourceRequirements Wymagania dotyczące zasobów dla kontenera (procesor i pamięć). ContainerResourceRequirements

ContainerResourceRequirements

Nazwa Opis Wartość
containerResourceLimits Informacje o limicie zasobów kontenera: ContainerResourceSettings
containerResourceRequests Informacje o żądaniu zasobu kontenera: ContainerResourceSettings

ContainerResourceSettings

Nazwa Opis Wartość
Procesora Liczba żądań/limitu procesorów wirtualnych dla kontenera. Więcej informacji:
https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/
ciąg
Gpu Liczba żądań/limitów kart gpu firmy Nvidia dla kontenera. Więcej informacji:
https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/
ciąg
pamięć Żądanie/limit rozmiaru pamięci dla kontenera. Więcej informacji:
https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/
ciąg

ManagedOnlineDeployment

Nazwa Opis Wartość
endpointComputeType [Wymagane] Typ obliczeniowy punktu końcowego. "Zarządzane" (wymagane)

SKU

Nazwa Opis Wartość
capacity Jeśli jednostka SKU obsługuje skalowanie w poziomie/w poziomie, należy uwzględnić liczbę całkowitą pojemności. Jeśli skalowanie w poziomie/w poziomie nie jest możliwe dla zasobu, może to zostać pominięte. int
rodzina Jeśli usługa ma różne generacje sprzętu, dla tej samej jednostki SKU, można je przechwycić tutaj. ciąg
name Nazwa jednostki SKU. Ex - P3. Zazwyczaj jest to kod litery i cyfry ciąg (wymagany)
size Rozmiar jednostki SKU. Jeśli pole nazwy jest kombinacją warstwy i innej wartości, będzie to autonomiczny kod. ciąg
tier To pole jest wymagane do zaimplementowania przez dostawcę zasobów, jeśli usługa ma więcej niż jedną warstwę, ale nie jest wymagana w put. "Podstawowa"
"Bezpłatna"
"Premium"
"Standardowa"

Definicja zasobu narzędzia Terraform (dostawcy AzAPI)

Typ zasobu workspaces/onlineEndpoints/deployments można wdrożyć przy użyciu operacji docelowych:

  • Grupy zasobów

Aby uzyskać listę zmienionych właściwości w każdej wersji interfejsu API, zobacz dziennik zmian.

Format zasobu

Aby utworzyć zasób Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments, dodaj następujące narzędzie Terraform do szablonu.

resource "azapi_resource" "symbolicname" {
  type = "Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments@2022-05-01"
  name = "string"
  location = "string"
  parent_id = "string"
  tags = {
    tagName1 = "tagValue1"
    tagName2 = "tagValue2"
  }
  identity {
    type = "string"
    identity_ids = []
  }
  body = jsonencode({
    properties = {
      appInsightsEnabled = bool
      codeConfiguration = {
        codeId = "string"
        scoringScript = "string"
      }
      description = "string"
      environmentId = "string"
      environmentVariables = {
        {customized property} = "string"
        {customized property} = "string"
      }
      instanceType = "string"
      livenessProbe = {
        failureThreshold = int
        initialDelay = "string"
        period = "string"
        successThreshold = int
        timeout = "string"
      }
      model = "string"
      modelMountPath = "string"
      properties = {
        {customized property} = "string"
        {customized property} = "string"
      }
      readinessProbe = {
        failureThreshold = int
        initialDelay = "string"
        period = "string"
        successThreshold = int
        timeout = "string"
      }
      requestSettings = {
        maxConcurrentRequestsPerInstance = int
        maxQueueWait = "string"
        requestTimeout = "string"
      }
      scaleSettings = {
        scaleType = "string"
        // For remaining properties, see OnlineScaleSettings objects
      }
      endpointComputeType = "string"
      // For remaining properties, see OnlineDeploymentProperties objects
    }
    sku = {
      capacity = int
      family = "string"
      name = "string"
      size = "string"
      tier = "string"
    }
    kind = "string"
  })
}

Obiekty OnlineDeploymentProperties

Ustaw właściwość endpointComputeType , aby określić typ obiektu.

W przypadku platformy Kubernetes użyj:

  endpointComputeType = "Kubernetes"
  containerResourceRequirements = {
    containerResourceLimits = {
      cpu = "string"
      gpu = "string"
      memory = "string"
    }
    containerResourceRequests = {
      cpu = "string"
      gpu = "string"
      memory = "string"
    }
  }

W przypadku opcji Zarządzane użyj:

  endpointComputeType = "Managed"

Obiekty OnlineScaleSettings

Ustaw właściwość scaleType , aby określić typ obiektu.

W obszarze Wartość domyślna użyj:

  scaleType = "Default"

W przypadku elementu TargetUscsi użyj:

  scaleType = "TargetUtilization"
  maxInstances = int
  minInstances = int
  pollingInterval = "string"
  targetUtilizationPercentage = int

Wartości właściwości

workspaces/onlineEndpoints/deployments

Nazwa Opis Wartość
typ Typ zasobu "Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments@2022-05-01"
name Nazwa zasobu ciąg (wymagany)
location Lokalizacja geograficzna, w której znajduje się zasób ciąg (wymagany)
parent_id Identyfikator zasobu, który jest elementem nadrzędnym dla tego zasobu. Identyfikator zasobu typu: onlineEndpoints
tags Tagi zasobów. Słownik nazw tagów i wartości.
sku Szczegóły jednostki SKU wymagane dla kontraktu usługi ARM na potrzeby skalowania automatycznego. Numer jednostki magazynowej
Rodzaju Metadane używane przez portal/narzędzia/itp. do renderowania różnych środowisk środowiska użytkownika dla zasobów tego samego typu. ciąg
identity Tożsamość usługi zarządzanej (tożsamości przypisane przez system i/lub przypisane przez użytkownika) Identyfikator usługi zarządzanej
properties [Wymagane] Dodatkowe atrybuty jednostki. OnlineDeploymentProperties (wymagane)

Identyfikator usługi zarządzanej

Nazwa Opis Wartość
typ Typ tożsamości usługi zarządzanej (gdzie dozwolone są typy SystemAssigned i UserAssigned). "SystemAssigned"
"SystemAssigned,UserAssigned"
"UserAssigned" (wymagane)
identity_ids Zestaw tożsamości przypisanych przez użytkownika skojarzonych z zasobem. Klucze słownika userAssignedIdentities będą identyfikatorami zasobów usługi ARM w postaci: '/subscriptions/{subscriptionId}/resourceGroups/{resourceGroupName}/providers/Microsoft.ManagedIdentity/userAssignedIdentities/{identityName}. Wartości słownika mogą być pustymi obiektami ({}) w żądaniach. Tablica identyfikatorów tożsamości użytkownika.

UserAssignedIdentities

Nazwa Opis Wartość
{niestandardowa właściwość} UserAssignedIdentity

UserAssignedIdentity

Ten obiekt nie zawiera żadnych właściwości do ustawienia podczas wdrażania. Wszystkie właściwości to ReadOnly.

OnlineDeploymentProperties

Nazwa Opis Wartość
appInsightsEnabled Jeśli wartość true, włączy rejestrowanie usługi Application Insights. bool
codeConfiguration Konfiguracja kodu dla wdrożenia punktu końcowego. Konfiguracja kodu
description (opis) Opis wdrożenia punktu końcowego. ciąg
environmentId Identyfikator zasobu usługi ARM lub identyfikator zasobu specyfikacji środowiska dla wdrożenia punktu końcowego. ciąg
environmentVariables Konfiguracja zmiennych środowiskowych dla wdrożenia. EndpointDeploymentPropertiesBaseEnvironmentVariables
Instancetype Typ wystąpienia obliczeniowego. ciąg
livenessProbe Sonda liveness regularnie monitoruje kondycję kontenera. ProbeSettings
model Ścieżka identyfikatora URI do modelu. ciąg
modelMountPath Ścieżka do zainstalowania modelu w kontenerze niestandardowym. ciąg
properties Słownik właściwości. Właściwości można dodać, ale nie usuwać ani zmieniać. EndpointDeploymentPropertiesBaseProperties
gotowośćProbe Sonda gotowości sprawdza, czy kontener jest gotowy do obsługi ruchu. Właściwości i wartości domyślne są takie same jak sonda liveness. ProbeSettings
requestSettings Zażądaj ustawień wdrożenia. OnlineRequestSettings
scaleSettings Skalowanie ustawień wdrożenia.
Jeśli ma wartość null lub nie jest podana,
wartość domyślna to TargetUsettingsScaleSettings for KubernetesOnlineDeployment
i do wartości DefaultScaleSettings for ManagedOnlineDeployment.
OnlineScaleSettings
endpointComputeType Ustawianie typu obiektu Kubernetes
Zarządzane (wymagane)

Konfiguracja kodu

Nazwa Opis Wartość
codeId Identyfikator zasobu usługi ARM zasobu kodu. ciąg
scoringScript [Wymagane] Skrypt do wykonania podczas uruchamiania. np. "score.py" ciąg (wymagany)

Ograniczenia:
Minimalna długość = 1
Wzorzec = [a-zA-Z0-9_]

EndpointDeploymentPropertiesBaseEnvironmentVariables

Nazwa Opis Wartość
{niestandardowa właściwość} ciąg
{niestandardowa właściwość} ciąg

ProbeSettings

Nazwa Opis Wartość
failureThreshold Liczba niepowodzeń, które mają być dozwolone przed zwróceniem stanu złej kondycji. int
initialDelay Opóźnienie przed pierwszą sondą w formacie ISO 8601. ciąg
period Długość czasu między sondami w formacie ISO 8601. ciąg
successThreshold Liczba pomyślnych sond przed zwróceniem stanu w dobrej kondycji. int
timeout Limit czasu sondy w formacie ISO 8601. ciąg

EndpointDeploymentPropertiesBaseProperties

Nazwa Opis Wartość
{niestandardowa właściwość} ciąg
{niestandardowa właściwość} ciąg

OnlineRequestSettings

Nazwa Opis Wartość
maxConcurrentRequestsPerInstance Maksymalna liczba współbieżnych żądań na węzeł dozwolonych na wdrożenie. Wartość domyślna to 1. int
maxQueueWait Maksymalny czas, przez jaki żądanie pozostanie w kolejce w formacie ISO 8601.
Wartość domyślna to 500 ms.
ciąg
requestTimeout Limit czasu oceniania w formacie ISO 8601.
Wartość domyślna to 5000 ms.
ciąg

OnlineScaleSettings

Nazwa Opis Wartość
scaleType Ustawianie typu obiektu Default
TargetU bez wykorzystania (wymagane)

DefaultScaleSettings

Nazwa Opis Wartość
scaleType [Wymagane] Typ algorytmu skalowania wdrożenia "Ustawienie domyślne" (wymagane)

TargetUscsiScaleSettings

Nazwa Opis Wartość
scaleType [Wymagane] Typ algorytmu skalowania wdrożenia "TargetU działania" (wymagane)
maxInstances Maksymalna liczba wystąpień, do których wdrożenie może być skalowane. Limit przydziału zostanie zarezerwowany dla max_instances. int
minInstances Minimalna liczba wystąpień, które mają być zawsze obecne. int
Pollinginterval Interwał sondowania w formacie ISO 8691. Obsługuje tylko czas trwania z dokładnością do sekund. ciąg
targetUprzedażyPercentage Docelowe użycie procesora CPU dla narzędzia do skalowania automatycznego. int

KubernetesOnlineDeployment

Nazwa Opis Wartość
endpointComputeType [Wymagane] Typ obliczeniowy punktu końcowego. "Kubernetes" (wymagane)
containerResourceRequirements Wymagania dotyczące zasobów dla kontenera (procesor i pamięć). ContainerResourceRequirements

ContainerResourceRequirements

Nazwa Opis Wartość
containerResourceLimits Informacje o limicie zasobów kontenera: ContainerResourceSettings
containerResourceRequests Informacje o żądaniu zasobu kontenera: ContainerResourceSettings

ContainerResourceSettings

Nazwa Opis Wartość
Procesora Liczba żądań/limitu procesorów wirtualnych dla kontenera. Więcej informacji:
https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/
ciąg
Gpu Liczba żądań/limitów kart gpu firmy Nvidia dla kontenera. Więcej informacji:
https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/
ciąg
pamięć Żądanie/limit rozmiaru pamięci dla kontenera. Więcej informacji:
https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/
ciąg

ManagedOnlineDeployment

Nazwa Opis Wartość
endpointComputeType [Wymagane] Typ obliczeniowy punktu końcowego. "Zarządzane" (wymagane)

SKU

Nazwa Opis Wartość
capacity Jeśli jednostka SKU obsługuje skalowanie w poziomie/w poziomie, należy uwzględnić liczbę całkowitą pojemności. Jeśli skalowanie w poziomie/w poziomie nie jest możliwe dla zasobu, może to zostać pominięte. int
rodzina Jeśli usługa ma różne generacje sprzętu, dla tej samej jednostki SKU, można je przechwycić tutaj. ciąg
name Nazwa jednostki SKU. Ex - P3. Zazwyczaj jest to kod litery i cyfry ciąg (wymagany)
size Rozmiar jednostki SKU. Jeśli pole nazwy jest kombinacją warstwy i innej wartości, będzie to autonomiczny kod. ciąg
tier To pole jest wymagane do zaimplementowania przez dostawcę zasobów, jeśli usługa ma więcej niż jedną warstwę, ale nie jest wymagana w funkcji PUT. "Podstawowa"
"Bezpłatna"
"Premium"
"Standardowa"