Microsoft.MachineLearningServices workspaces/onlineEndpoints/deployments 2021-03-01-preview
Definicja zasobu Bicep
Typ zasobu obszary robocze/onlineEndpoints/deployments można wdrożyć z operacjami docelowymi:
- Grupy zasobów — zobacz polecenia wdrażania grupy zasobów
Aby uzyskać listę zmienionych właściwości w każdej wersji interfejsu API, zobacz dziennik zmian.
Format zasobu
Aby utworzyć zasób Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments, dodaj następujący kod Bicep do szablonu.
resource symbolicname 'Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments@2021-03-01-preview' = {
name: 'string'
location: 'string'
tags: {
tagName1: 'tagValue1'
tagName2: 'tagValue2'
}
kind: 'string'
parent: resourceSymbolicName
identity: {
type: 'string'
userAssignedIdentities: {
{customized property}: {
clientId: 'string'
principalId: 'string'
}
}
}
properties: {
appInsightsEnabled: bool
codeConfiguration: {
codeId: 'string'
scoringScript: 'string'
}
description: 'string'
environmentId: 'string'
environmentVariables: {
{customized property}: 'string'
}
livenessProbe: {
failureThreshold: int
initialDelay: 'string'
period: 'string'
successThreshold: int
timeout: 'string'
}
model: {
referenceType: 'string'
// For remaining properties, see AssetReferenceBase objects
}
properties: {
{customized property}: 'string'
}
requestSettings: {
maxConcurrentRequestsPerInstance: int
maxQueueWait: 'string'
requestTimeout: 'string'
}
scaleSettings: {
maxInstances: int
minInstances: int
scaleType: 'string'
// For remaining properties, see OnlineScaleSettings objects
}
endpointComputeType: 'string'
// For remaining properties, see OnlineDeployment objects
}
}
Obiekty OnlineDeployment
Ustaw właściwość endpointComputeType , aby określić typ obiektu.
W przypadku usługi K8S użyj:
endpointComputeType: 'K8S'
containerResourceRequirements: {
cpu: int
cpuLimit: int
fpga: int
gpu: int
memoryInGB: int
memoryInGBLimit: int
}
W przypadku opcji Zarządzane użyj:
endpointComputeType: 'Managed'
instanceType: 'string'
readinessProbe: {
failureThreshold: int
initialDelay: 'string'
period: 'string'
successThreshold: int
timeout: 'string'
}
Obiekty AssetReferenceBase
Ustaw właściwość referenceType , aby określić typ obiektu.
W przypadku elementu DataPath użyj:
referenceType: 'DataPath'
datastoreId: 'string'
path: 'string'
W obszarze Identyfikator użyj:
referenceType: 'Id'
assetId: 'string'
W przypadku elementu OutputPath użyj:
referenceType: 'OutputPath'
jobId: 'string'
path: 'string'
Obiekty OnlineScaleSettings
Ustaw właściwość scaleType , aby określić typ obiektu.
W przypadku opcji Automatycznie użyj polecenia:
scaleType: 'Auto'
pollingInterval: 'string'
targetUtilizationPercentage: int
W przypadku instrukcji ręcznych użyj:
scaleType: 'Manual'
instanceCount: int
Wartości właściwości
obszary robocze/onlineEndpoints/deployments
Nazwa | Opis | Wartość |
---|---|---|
name | Nazwa zasobu Zobacz, jak ustawić nazwy i typy dla zasobów podrzędnych w aplikacji Bicep. |
ciąg (wymagany) |
location | Lokalizacja geograficzna, w której znajduje się zasób | ciąg (wymagany) |
tags | Tagi zasobów. | Słownik nazw tagów i wartości. Zobacz Tagi w szablonach |
Rodzaju | Metadane używane przez portal/narzędzia/itp. do renderowania różnych środowisk środowiska użytkownika dla zasobów tego samego typu. | ciąg |
Nadrzędny | W Bicep można określić zasób nadrzędny dla zasobu podrzędnego. Tę właściwość należy dodać tylko wtedy, gdy zasób podrzędny jest zadeklarowany poza zasobem nadrzędnym. Aby uzyskać więcej informacji, zobacz Zasób podrzędny poza zasobem nadrzędnym. |
Nazwa symboliczna zasobu typu: onlineEndpoints |
identity | Tożsamość usługi skojarzona z zasobem. | Identyfikator zasobu |
properties | [Wymagane] Dodatkowe atrybuty jednostki. | Wdrażanie online (wymagane) |
Identyfikator zasobu
Nazwa | Opis | Wartość |
---|---|---|
typ | Definiuje wartości typu ResourceIdentity. | "Brak" "SystemAssigned" "SystemAssigned,UserAssigned" "UserAssigned" |
userAssignedIdentities | Słownik tożsamości przypisanych przez użytkownika, klucz jest identyfikator zasobu ARM interfejsu użytkownika. | ResourceIdentityUserAssignedIdentities |
ResourceIdentityUserAssignedIdentities
Nazwa | Opis | Wartość |
---|---|---|
{niestandardowa właściwość} | UserAssignedIdentityMeta |
UserAssignedIdentityMeta
Nazwa | Opis | Wartość |
---|---|---|
clientId | Identyfikator aplikacji — unikatowy identyfikator wygenerowany przez Azure AD, który jest powiązany z aplikacją i jednostką usługi podczas początkowej aprowizacji. | ciąg |
principalId | Identyfikator obiektu jednostki usługi dla tożsamości zarządzanej, który służy do udzielania dostępu opartego na rolach do zasobu platformy Azure. | ciąg |
Wdrażanie online
Nazwa | Opis | Wartość |
---|---|---|
appInsightsEnabled | Jeśli wartość true, włączy rejestrowanie usługi Application Insights. | bool |
codeConfiguration | Konfiguracja kodu dla wdrożenia punktu końcowego. | Konfiguracja kodu |
description (opis) | Opis wdrożenia punktu końcowego. | ciąg |
environmentId | Identyfikator zasobu usługi ARM specyfikacji środowiska dla wdrożenia punktu końcowego. | ciąg |
environmentVariables | Konfiguracja zmiennych środowiskowych dla wdrożenia. | OnlineDeploymentEnvironmentVariables |
livenessProbe | Konfiguracja sondy liveness/readiness kontenera wdrożenia. | ProbeSettings |
model | Odwołanie do zasobu modelu dla wdrożenia punktu końcowego. | AssetReferenceBase |
properties | Słownik właściwości. Właściwości można dodać, ale nie usuwać ani zmieniać. | OnlineDeploymentProperties |
requestSettings | Konfiguracja żądań oceniania wdrożenia online. | OnlineRequestSettings |
scaleSettings | Konfiguracja skalowania wdrożenia online. | OnlineScaleSettings |
endpointComputeType | Ustawianie typu obiektu | K8S Zarządzane (wymagane) |
Konfiguracja kodu
Nazwa | Opis | Wartość |
---|---|---|
codeId | Identyfikator zasobu usługi ARM zasobu kodu. | ciąg |
scoringScript | [Wymagane] Skrypt do wykonania podczas uruchamiania. np. "score.py" | ciąg (wymagany) Ograniczenia: Minimalna długość = 1 Wzorzec = [a-zA-Z0-9_] |
OnlineDeploymentEnvironmentVariables
Nazwa | Opis | Wartość |
---|---|---|
{niestandardowa właściwość} | ciąg |
ProbeSettings
Nazwa | Opis | Wartość |
---|---|---|
failureThreshold | Liczba niepowodzeń, które mają być dozwolone przed zwróceniem stanu złej kondycji. | int |
initialDelay | Opóźnienie przed pierwszą sondą w formacie ISO 8601. | ciąg |
period | Długość czasu między sondami w formacie ISO 8601. | ciąg |
successThreshold | Liczba pomyślnych sond przed zwróceniem stanu w dobrej kondycji. | int |
timeout | Limit czasu sondy w formacie ISO 8601. | ciąg |
AssetReferenceBase
Nazwa | Opis | Wartość |
---|---|---|
referenceType | Ustawianie typu obiektu | DataPath Identyfikator OutputPath (wymagane) |
DataPathAssetReference
Nazwa | Opis | Wartość |
---|---|---|
referenceType | [Wymagane] Określa typ odwołania do zasobu. | "DataPath" (wymagane) |
datastoreId | Identyfikator zasobu usługi ARM magazynu danych, w którym znajduje się zasób. | ciąg |
path | Ścieżka pliku/katalogu w magazynie danych. | ciąg |
IdAssetReference
Nazwa | Opis | Wartość |
---|---|---|
referenceType | [Wymagane] Określa typ odwołania do zasobu. | "Id" (wymagany) |
assetId | [Wymagane] Identyfikator zasobu usługi ARM. | ciąg (wymagany) Ograniczenia: Wzorzec = [a-zA-Z0-9_] |
OutputPathAssetReference
Nazwa | Opis | Wartość |
---|---|---|
referenceType | [Wymagane] Określa typ odwołania do zasobu. | "OutputPath" (wymagane) |
Jobid | Identyfikator zasobu usługi ARM zadania. | ciąg |
path | Ścieżka pliku/katalogu w danych wyjściowych zadania. | ciąg |
OnlineDeploymentProperties
Nazwa | Opis | Wartość |
---|---|---|
{niestandardowa właściwość} | ciąg |
OnlineRequestSettings
Nazwa | Opis | Wartość |
---|---|---|
maxConcurrentRequestsPerInstance | Liczba żądań dozwolonych do kolejkowania jednocześnie dla tego wdrożenia. | int |
maxQueueWait | Maksymalny czas oczekiwania kolejki w formacie ISO 8601. Obsługuje precyzję milisekund. | ciąg |
requestTimeout | Limit czasu żądania w formacie ISO 8601. Obsługuje precyzję milisekund. | ciąg |
OnlineScaleSettings
Nazwa | Opis | Wartość |
---|---|---|
maxInstances | Maksymalna liczba wystąpień dla tego wdrożenia. | int |
minInstances | Minimalna liczba wystąpień dla tego wdrożenia. | int |
scaleType | Ustawianie typu obiektu | Automatycznie Ręczne (wymagane) |
AutoSkalowanieUstawienia
Nazwa | Opis | Wartość |
---|---|---|
scaleType | [Wymagane] Typ algorytmu skalowania wdrożenia | "Auto" (wymagane) |
Pollinginterval | Interwał sondowania w formacie ISO 8691. Obsługuje tylko czas trwania z dokładnością do sekund. | ciąg |
targetUscsiPercentage | Docelowe użycie procesora CPU dla narzędzia do skalowania automatycznego. | int |
ManualScaleSettings
Nazwa | Opis | Wartość |
---|---|---|
scaleType | [Wymagane] Typ algorytmu skalowania wdrożenia | "Ręczne" (wymagane) |
instanceCount | Stała liczba wystąpień dla tego wdrożenia. | int |
K8SOnlineDeployment
Nazwa | Opis | Wartość |
---|---|---|
endpointComputeType | [Wymagane] Typ obliczeniowy punktu końcowego. | "K8S" (wymagane) |
containerResourceRequirements | Wymagania dotyczące zasobów dla każdego wystąpienia kontenera we wdrożeniu online. | ContainerResourceRequirements |
ContainerResourceRequirements
Nazwa | Opis | Wartość |
---|---|---|
Procesora | Minimalna ilość rdzeni procesora CPU do użycia przez kontener. Więcej informacji: https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/ |
int |
cpuLimit | Maksymalna liczba rdzeni procesora CPU, które mogą być używane przez kontener. Więcej informacji: https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/ |
int |
Fpga | Liczba urządzeń PCIE FPGA uwidocznionych w kontenerze. Musi mieć wielokrotność 2. | int |
Gpu | Liczba rdzeni procesora GPU w kontenerze. | int |
memoryInGB | Minimalna ilość pamięci (w GB) do użycia przez kontener. Więcej informacji: https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/ |
int |
memoryInGBLimit | Maksymalna ilość pamięci (w GB) dozwolona do użycia przez kontener. Więcej informacji: https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/ |
int |
ManagedOnlineDeployment
Nazwa | Opis | Wartość |
---|---|---|
endpointComputeType | [Wymagane] Typ obliczeniowy punktu końcowego. | "Zarządzane" (wymagane) |
Instancetype | Typ wystąpienia obliczeniowego. | ciąg |
gotowośćProbe | Konfiguracja sondy kondycji/gotowości kontenera wdrożenia. | ProbeSettings |
Definicja zasobu szablonu usługi ARM
Typ zasobu obszary robocze/onlineEndpoints/deployments można wdrożyć z operacjami docelowymi:
- Grupy zasobów — zobacz polecenia wdrażania grupy zasobów
Aby uzyskać listę zmienionych właściwości w każdej wersji interfejsu API, zobacz dziennik zmian.
Format zasobu
Aby utworzyć zasób Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments, dodaj następujący kod JSON do szablonu.
{
"type": "Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments",
"apiVersion": "2021-03-01-preview",
"name": "string",
"location": "string",
"tags": {
"tagName1": "tagValue1",
"tagName2": "tagValue2"
},
"kind": "string",
"identity": {
"type": "string",
"userAssignedIdentities": {
"{customized property}": {
"clientId": "string",
"principalId": "string"
}
}
},
"properties": {
"appInsightsEnabled": "bool",
"codeConfiguration": {
"codeId": "string",
"scoringScript": "string"
},
"description": "string",
"environmentId": "string",
"environmentVariables": {
"{customized property}": "string"
},
"livenessProbe": {
"failureThreshold": "int",
"initialDelay": "string",
"period": "string",
"successThreshold": "int",
"timeout": "string"
},
"model": {
"referenceType": "string"
// For remaining properties, see AssetReferenceBase objects
},
"properties": {
"{customized property}": "string"
},
"requestSettings": {
"maxConcurrentRequestsPerInstance": "int",
"maxQueueWait": "string",
"requestTimeout": "string"
},
"scaleSettings": {
"maxInstances": "int",
"minInstances": "int",
"scaleType": "string"
// For remaining properties, see OnlineScaleSettings objects
},
"endpointComputeType": "string"
// For remaining properties, see OnlineDeployment objects
}
}
Obiekty OnlineDeployment
Ustaw właściwość endpointComputeType , aby określić typ obiektu.
W przypadku usługi K8S użyj:
"endpointComputeType": "K8S",
"containerResourceRequirements": {
"cpu": "int",
"cpuLimit": "int",
"fpga": "int",
"gpu": "int",
"memoryInGB": "int",
"memoryInGBLimit": "int"
}
W przypadku opcji Zarządzane użyj:
"endpointComputeType": "Managed",
"instanceType": "string",
"readinessProbe": {
"failureThreshold": "int",
"initialDelay": "string",
"period": "string",
"successThreshold": "int",
"timeout": "string"
}
Obiekty AssetReferenceBase
Ustaw właściwość referenceType , aby określić typ obiektu.
W przypadku elementu DataPath użyj:
"referenceType": "DataPath",
"datastoreId": "string",
"path": "string"
W obszarze Identyfikator użyj:
"referenceType": "Id",
"assetId": "string"
W przypadku elementu OutputPath użyj:
"referenceType": "OutputPath",
"jobId": "string",
"path": "string"
Obiekty OnlineScaleSettings
Ustaw właściwość scaleType , aby określić typ obiektu.
W przypadku opcji Automatycznie użyj polecenia:
"scaleType": "Auto",
"pollingInterval": "string",
"targetUtilizationPercentage": "int"
W przypadku instrukcji ręcznych użyj:
"scaleType": "Manual",
"instanceCount": "int"
Wartości właściwości
obszary robocze/onlineEndpoints/deployments
Nazwa | Opis | Wartość |
---|---|---|
typ | Typ zasobu | "Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments" |
apiVersion | Wersja interfejsu API zasobów | "2021-03-01-preview" |
name | Nazwa zasobu Zobacz, jak ustawić nazwy i typy dla zasobów podrzędnych w szablonach usługi ARM w formacie JSON. |
ciąg (wymagany) |
location | Lokalizacja geograficzna, w której znajduje się zasób | ciąg (wymagany) |
tags | Tagi zasobów. | Słownik nazw tagów i wartości. Zobacz Tagi w szablonach |
Rodzaju | Metadane używane przez portal/narzędzia/itp. do renderowania różnych środowisk środowiska użytkownika dla zasobów tego samego typu. | ciąg |
identity | Tożsamość usługi skojarzona z zasobem. | Identyfikator zasobu |
properties | [Wymagane] Dodatkowe atrybuty jednostki. | Wdrażanie online (wymagane) |
Identyfikator zasobu
Nazwa | Opis | Wartość |
---|---|---|
typ | Definiuje wartości typu ResourceIdentity. | "Brak" "SystemAssigned" "SystemAssigned,UserAssigned" "UserAssigned" |
userAssignedIdentities | Słownik tożsamości przypisanych przez użytkownika, klucz jest identyfikator zasobu ARM interfejsu użytkownika. | ResourceIdentityUserAssignedIdentities |
ResourceIdentityUserAssignedIdentities
Nazwa | Opis | Wartość |
---|---|---|
{niestandardowa właściwość} | UserAssignedIdentityMeta |
UserAssignedIdentityMeta
Nazwa | Opis | Wartość |
---|---|---|
clientId | Identyfikator aplikacji — unikatowy identyfikator wygenerowany przez Azure AD, który jest powiązany z aplikacją i jednostką usługi podczas początkowej aprowizacji. | ciąg |
principalId | Identyfikator obiektu jednostki usługi dla tożsamości zarządzanej, który służy do udzielania dostępu opartego na rolach do zasobu platformy Azure. | ciąg |
Wdrażanie online
Nazwa | Opis | Wartość |
---|---|---|
appInsightsEnabled | Jeśli to prawda, włącza rejestrowanie usługi Application Insights. | bool |
codeConfiguration | Konfiguracja kodu dla wdrożenia punktu końcowego. | Konfiguracja kodu |
description (opis) | Opis wdrożenia punktu końcowego. | ciąg |
environmentId | Identyfikator zasobu usługi ARM specyfikacji środowiska dla wdrożenia punktu końcowego. | ciąg |
environmentVariables | Konfiguracja zmiennych środowiskowych dla wdrożenia. | OnlineDeploymentEnvironmentVariables |
livenessProbe | Konfiguracja sondy kondycji/gotowości kontenera wdrożenia. | ProbeSettings |
model | Odwołanie do zasobu modelu dla wdrożenia punktu końcowego. | AssetReferenceBase |
properties | Słownik właściwości. Właściwości można dodawać, ale nie usuwać ani zmieniać. | Właściwości onlineDeploymentProperties |
requestSettings | Konfiguracja żądań oceniania wdrożenia online. | OnlineRequestSettings |
scaleSettings | Konfiguracja skalowania wdrożenia online. | OnlineScaleSettings |
endpointComputeType | Ustawianie typu obiektu | K8S Zarządzane (wymagane) |
Konfiguracja kodu
Nazwa | Opis | Wartość |
---|---|---|
codeId | Identyfikator zasobu usługi ARM zasobu kodu. | ciąg |
scoringScript | [Wymagane] Skrypt do wykonania podczas uruchamiania. np. "score.py" | ciąg (wymagany) Ograniczenia: Minimalna długość = 1 Wzorzec = [a-zA-Z0-9_] |
OnlineDeploymentEnvironmentVariables
Nazwa | Opis | Wartość |
---|---|---|
{niestandardowa właściwość} | ciąg |
ProbeSettings
Nazwa | Opis | Wartość |
---|---|---|
failureThreshold | Liczba niepowodzeń, które należy zezwolić przed zwróceniem stanu złej kondycji. | int |
initialDelay | Opóźnienie przed pierwszą sondą w formacie ISO 8601. | ciąg |
period | Czas między sondami w formacie ISO 8601. | ciąg |
successThreshold | Liczba pomyślnych sond przed zwróceniem stanu dobrej kondycji. | int |
timeout | Limit czasu sondy w formacie ISO 8601. | ciąg |
AssetReferenceBase
Nazwa | Opis | Wartość |
---|---|---|
referenceType | Ustawianie typu obiektu | DataPath Identyfikator OutputPath (wymagane) |
DataPathAssetReference
Nazwa | Opis | Wartość |
---|---|---|
referenceType | [Wymagane] Określa typ odwołania do zasobu. | "DataPath" (wymagane) |
datastoreId | Identyfikator zasobu usługi ARM magazynu danych, w którym znajduje się zasób. | ciąg |
path | Ścieżka pliku/katalogu w magazynie danych. | ciąg |
IdAssetReference
Nazwa | Opis | Wartość |
---|---|---|
referenceType | [Wymagane] Określa typ odwołania do zasobu. | "Id" (wymagany) |
assetId | [Wymagane] Identyfikator zasobu usługi ARM. | ciąg (wymagany) Ograniczenia: Wzorzec = [a-zA-Z0-9_] |
OutputPathAssetReference
Nazwa | Opis | Wartość |
---|---|---|
referenceType | [Wymagane] Określa typ odwołania do zasobu. | "OutputPath" (wymagane) |
Jobid | Identyfikator zasobu usługi ARM zadania. | ciąg |
path | Ścieżka pliku/katalogu w danych wyjściowych zadania. | ciąg |
Właściwości onlineDeploymentProperties
Nazwa | Opis | Wartość |
---|---|---|
{niestandardowa właściwość} | ciąg |
OnlineRequestSettings
Nazwa | Opis | Wartość |
---|---|---|
maxConcurrentRequestsPerInstance | Liczba żądań dozwolonych do kolejki jednocześnie dla tego wdrożenia. | int |
maxQueueWait | Maksymalny czas oczekiwania kolejki w formacie ISO 8601. Obsługuje precyzję milisekund. | ciąg |
requestTimeout | Limit czasu żądania w formacie ISO 8601. Obsługuje precyzję milisekund. | ciąg |
OnlineScaleSettings
Nazwa | Opis | Wartość |
---|---|---|
maxInstances | Maksymalna liczba wystąpień dla tego wdrożenia. | int |
minInstances | Minimalna liczba wystąpień dla tego wdrożenia. | int |
scaleType | Ustawianie typu obiektu | Automatycznie Ręczne (wymagane) |
AutoskalowanieUstawienia
Nazwa | Opis | Wartość |
---|---|---|
scaleType | [Wymagane] Typ algorytmu skalowania wdrożenia | "Auto" (wymagane) |
Pollinginterval | Interwał sondowania w formacie ISO 8691. Obsługuje tylko czas trwania z dokładnością do sekund. | ciąg |
targetUprzedażyPercentage | Docelowe użycie procesora CPU dla narzędzia do skalowania automatycznego. | int |
ManualScaleSettings
Nazwa | Opis | Wartość |
---|---|---|
scaleType | [Wymagane] Typ algorytmu skalowania wdrożenia | "Ręczne" (wymagane) |
instanceCount | Stała liczba wystąpień dla tego wdrożenia. | int |
K8SOnlineDeployment
Nazwa | Opis | Wartość |
---|---|---|
endpointComputeType | [Wymagane] Typ obliczeniowy punktu końcowego. | "K8S" (wymagane) |
containerResourceRequirements | Wymagania dotyczące zasobów dla każdego wystąpienia kontenera we wdrożeniu online. | ContainerResourceRequirements |
ContainerResourceRequirements
Nazwa | Opis | Wartość |
---|---|---|
Procesora | Minimalna ilość rdzeni procesora CPU do użycia przez kontener. Więcej informacji: https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/ |
int |
cpuLimit | Maksymalna ilość rdzeni procesora CPU może być używana przez kontener. Więcej informacji: https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/ |
int |
Fpga | Liczba urządzeń FPGA PCIE uwidocznionych w kontenerze. Musi być wielokrotna z 2. | int |
Gpu | Liczba rdzeni procesora GPU w kontenerze. | int |
memoryInGB | Minimalna ilość pamięci (w GB) do użycia przez kontener. Więcej informacji: https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/ |
int |
memoryInGBLimit | Maksymalna ilość pamięci (w GB) może być używana przez kontener. Więcej informacji: https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/ |
int |
ManagedOnlineDeployment
Nazwa | Opis | Wartość |
---|---|---|
endpointComputeType | [Wymagane] Typ obliczeniowy punktu końcowego. | "Zarządzane" (wymagane) |
Instancetype | Typ wystąpienia obliczeniowego. | ciąg |
gotowośćProbe | Konfiguracja sondy liveness/readiness kontenera wdrożenia. | ProbeSettings |
Definicja zasobu narzędzia Terraform (dostawcy AzAPI)
Typ zasobu workspaces/onlineEndpoints/deployments można wdrożyć przy użyciu operacji docelowych:
- Grupy zasobów
Aby uzyskać listę zmienionych właściwości w każdej wersji interfejsu API, zobacz dziennik zmian.
Format zasobu
Aby utworzyć zasób Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments, dodaj następujące narzędzie Terraform do szablonu.
resource "azapi_resource" "symbolicname" {
type = "Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments@2021-03-01-preview"
name = "string"
location = "string"
parent_id = "string"
tags = {
tagName1 = "tagValue1"
tagName2 = "tagValue2"
}
identity {
type = "string"
identity_ids = []
}
body = jsonencode({
properties = {
appInsightsEnabled = bool
codeConfiguration = {
codeId = "string"
scoringScript = "string"
}
description = "string"
environmentId = "string"
environmentVariables = {
{customized property} = "string"
}
livenessProbe = {
failureThreshold = int
initialDelay = "string"
period = "string"
successThreshold = int
timeout = "string"
}
model = {
referenceType = "string"
// For remaining properties, see AssetReferenceBase objects
}
properties = {
{customized property} = "string"
}
requestSettings = {
maxConcurrentRequestsPerInstance = int
maxQueueWait = "string"
requestTimeout = "string"
}
scaleSettings = {
maxInstances = int
minInstances = int
scaleType = "string"
// For remaining properties, see OnlineScaleSettings objects
}
endpointComputeType = "string"
// For remaining properties, see OnlineDeployment objects
}
kind = "string"
})
}
Obiekty OnlineDeployment
Ustaw właściwość endpointComputeType , aby określić typ obiektu.
W przypadku K8S użyj:
endpointComputeType = "K8S"
containerResourceRequirements = {
cpu = int
cpuLimit = int
fpga = int
gpu = int
memoryInGB = int
memoryInGBLimit = int
}
W przypadku opcji Zarządzane użyj:
endpointComputeType = "Managed"
instanceType = "string"
readinessProbe = {
failureThreshold = int
initialDelay = "string"
period = "string"
successThreshold = int
timeout = "string"
}
Obiekty AssetReferenceBase
Ustaw właściwość referenceType , aby określić typ obiektu.
W przypadku programu DataPath użyj:
referenceType = "DataPath"
datastoreId = "string"
path = "string"
W przypadku identyfikatora użyj:
referenceType = "Id"
assetId = "string"
W przypadku parametru OutputPath użyj:
referenceType = "OutputPath"
jobId = "string"
path = "string"
Obiekty OnlineScaleSettings
Ustaw właściwość scaleType , aby określić typ obiektu.
W przypadku opcji Auto użyj:
scaleType = "Auto"
pollingInterval = "string"
targetUtilizationPercentage = int
W przypadku opcji Ręczne użyj:
scaleType = "Manual"
instanceCount = int
Wartości właściwości
workspaces/onlineEndpoints/deployments
Nazwa | Opis | Wartość |
---|---|---|
typ | Typ zasobu | "Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments@2021-03-01-preview" |
name | Nazwa zasobu | ciąg (wymagany) |
location | Lokalizacja geograficzna, w której znajduje się zasób | ciąg (wymagany) |
parent_id | Identyfikator zasobu, który jest elementem nadrzędnym dla tego zasobu. | Identyfikator zasobu typu: onlineEndpoints |
tags | Tagi zasobów. | Słownik nazw tagów i wartości. |
Rodzaju | Metadane używane przez portal/narzędzia/itp. do renderowania różnych środowisk środowiska użytkownika dla zasobów tego samego typu. | ciąg |
identity | Tożsamość usługi skojarzona z zasobem. | Identyfikator zasobu |
properties | [Wymagane] Dodatkowe atrybuty jednostki. | OnlineDeployment (wymagane) |
Identyfikator zasobu
Nazwa | Opis | Wartość |
---|---|---|
typ | Definiuje wartości typu ResourceIdentity. | "SystemAssigned" "SystemAssigned,UserAssigned" "UserAssigned" |
identity_ids | Słownik tożsamości przypisanych przez użytkownika, klucz jest identyfikator zasobu ARM interfejsu użytkownika. | Tablica identyfikatorów tożsamości użytkowników. |
ResourceIdentityUserAssignedIdentities
Nazwa | Opis | Wartość |
---|---|---|
{niestandardowa właściwość} | UserAssignedIdentityMeta |
UserAssignedIdentityMeta
Nazwa | Opis | Wartość |
---|---|---|
clientId | Identyfikator aplikacji — unikatowy identyfikator wygenerowany przez Azure AD, który jest powiązany z aplikacją i jednostką usługi podczas początkowej aprowizacji. | ciąg |
principalId | Identyfikator obiektu jednostki usługi dla tożsamości zarządzanej, który służy do udzielania dostępu opartego na rolach do zasobu platformy Azure. | ciąg |
Wdrażanie online
Nazwa | Opis | Wartość |
---|---|---|
appInsightsEnabled | Jeśli to prawda, włącza rejestrowanie usługi Application Insights. | bool |
codeConfiguration | Konfiguracja kodu dla wdrożenia punktu końcowego. | Konfiguracja kodu |
description (opis) | Opis wdrożenia punktu końcowego. | ciąg |
environmentId | Identyfikator zasobu usługi ARM specyfikacji środowiska dla wdrożenia punktu końcowego. | ciąg |
environmentVariables | Konfiguracja zmiennych środowiskowych dla wdrożenia. | OnlineDeploymentEnvironmentVariables |
livenessProbe | Konfiguracja sondy kondycji/gotowości kontenera wdrożenia. | ProbeSettings |
model | Odwołanie do zasobu modelu dla wdrożenia punktu końcowego. | AssetReferenceBase |
properties | Słownik właściwości. Właściwości można dodawać, ale nie usuwać ani zmieniać. | Właściwości onlineDeploymentProperties |
requestSettings | Konfiguracja żądań oceniania wdrożenia online. | OnlineRequestSettings |
scaleSettings | Konfiguracja skalowania wdrożenia online. | OnlineScaleSettings |
endpointComputeType | Ustawianie typu obiektu | K8S Zarządzane (wymagane) |
Konfiguracja kodu
Nazwa | Opis | Wartość |
---|---|---|
codeId | Identyfikator zasobu usługi ARM zasobu kodu. | ciąg |
scoringScript | [Wymagane] Skrypt do wykonania podczas uruchamiania. np. "score.py" | ciąg (wymagany) Ograniczenia: Minimalna długość = 1 Wzorzec = [a-zA-Z0-9_] |
OnlineDeploymentEnvironmentVariables
Nazwa | Opis | Wartość |
---|---|---|
{niestandardowa właściwość} | ciąg |
ProbeSettings
Nazwa | Opis | Wartość |
---|---|---|
failureThreshold | Liczba niepowodzeń, które należy zezwolić przed zwróceniem stanu złej kondycji. | int |
initialDelay | Opóźnienie przed pierwszą sondą w formacie ISO 8601. | ciąg |
period | Czas między sondami w formacie ISO 8601. | ciąg |
successThreshold | Liczba pomyślnych sond przed zwróceniem stanu dobrej kondycji. | int |
timeout | Limit czasu sondy w formacie ISO 8601. | ciąg |
AssetReferenceBase
Nazwa | Opis | Wartość |
---|---|---|
referenceType | Ustawianie typu obiektu | DataPath Identyfikator OutputPath (wymagane) |
DataPathAssetReference
Nazwa | Opis | Wartość |
---|---|---|
referenceType | [Wymagane] Określa typ odwołania do zasobu. | "DataPath" (wymagany) |
datastoreId | Identyfikator zasobu usługi ARM magazynu danych, w którym znajduje się zasób. | ciąg |
path | Ścieżka pliku/katalogu w magazynie danych. | ciąg |
IdAssetReference
Nazwa | Opis | Wartość |
---|---|---|
referenceType | [Wymagane] Określa typ odwołania do zasobu. | "Id" (wymagany) |
assetId | [Wymagane] Identyfikator zasobu usługi ARM. | ciąg (wymagany) Ograniczenia: Wzorzec = [a-zA-Z0-9_] |
OutputPathAssetReference
Nazwa | Opis | Wartość |
---|---|---|
referenceType | [Wymagane] Określa typ odwołania do zasobu. | "OutputPath" (wymagane) |
Jobid | Identyfikator zasobu usługi ARM zadania. | ciąg |
path | Ścieżka pliku/katalogu w danych wyjściowych zadania. | ciąg |
OnlineDeploymentProperties
Nazwa | Opis | Wartość |
---|---|---|
{niestandardowa właściwość} | ciąg |
OnlineRequestSettings
Nazwa | Opis | Wartość |
---|---|---|
maxConcurrentRequestsPerInstance | Liczba żądań dozwolonych do kolejkowania jednocześnie dla tego wdrożenia. | int |
maxQueueWait | Maksymalny czas oczekiwania kolejki w formacie ISO 8601. Obsługuje precyzję milisekund. | ciąg |
requestTimeout | Limit czasu żądania w formacie ISO 8601. Obsługuje precyzję milisekund. | ciąg |
OnlineScaleSettings
Nazwa | Opis | Wartość |
---|---|---|
maxInstances | Maksymalna liczba wystąpień dla tego wdrożenia. | int |
minInstances | Minimalna liczba wystąpień dla tego wdrożenia. | int |
scaleType | Ustawianie typu obiektu | Automatycznie Ręczne (wymagane) |
AutoSkalowanieUstawienia
Nazwa | Opis | Wartość |
---|---|---|
scaleType | [Wymagane] Typ algorytmu skalowania wdrożenia | "Auto" (wymagane) |
Pollinginterval | Interwał sondowania w formacie ISO 8691. Obsługuje tylko czas trwania z dokładnością do sekund. | ciąg |
targetUscsiPercentage | Docelowe użycie procesora CPU dla narzędzia do skalowania automatycznego. | int |
ManualScaleSettings
Nazwa | Opis | Wartość |
---|---|---|
scaleType | [Wymagane] Typ algorytmu skalowania wdrożenia | "Ręczne" (wymagane) |
instanceCount | Stała liczba wystąpień dla tego wdrożenia. | int |
K8SOnlineDeployment
Nazwa | Opis | Wartość |
---|---|---|
endpointComputeType | [Wymagane] Typ obliczeniowy punktu końcowego. | "K8S" (wymagane) |
containerResourceRequirements | Wymagania dotyczące zasobów dla każdego wystąpienia kontenera we wdrożeniu online. | ContainerResourceRequirements |
ContainerResourceRequirements
Nazwa | Opis | Wartość |
---|---|---|
Procesora | Minimalna ilość rdzeni procesora CPU do użycia przez kontener. Więcej informacji: https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/ |
int |
cpuLimit | Maksymalna ilość rdzeni procesora CPU może być używana przez kontener. Więcej informacji: https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/ |
int |
Fpga | Liczba urządzeń FPGA PCIE uwidocznionych w kontenerze. Musi być wielokrotna z 2. | int |
Gpu | Liczba rdzeni procesora GPU w kontenerze. | int |
memoryInGB | Minimalna ilość pamięci (w GB) do użycia przez kontener. Więcej informacji: https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/ |
int |
memoryInGBLimit | Maksymalna ilość pamięci (w GB) może być używana przez kontener. Więcej informacji: https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/ |
int |
ManagedOnlineDeployment
Nazwa | Opis | Wartość |
---|---|---|
endpointComputeType | [Wymagane] Typ obliczeniowy punktu końcowego. | "Zarządzane" (wymagane) |
Instancetype | Typ wystąpienia obliczeniowego. | ciąg |
gotowośćProbe | Konfiguracja sondy liveness/readiness kontenera wdrożenia. | ProbeSettings |
Opinia
https://aka.ms/ContentUserFeedback.
Dostępne już wkrótce: W 2024 r. będziemy stopniowo wycofywać zgłoszenia z serwisu GitHub jako mechanizm przesyłania opinii na temat zawartości i zastępować go nowym systemem opinii. Aby uzyskać więcej informacji, sprawdź:Prześlij i wyświetl opinię dla