Microsoft.MachineLearningServices-Arbeitsbereiche/onlineEndpoints/deployments 2022-12-01-preview
- neueste
- 2024-07-01-Preview-
- 2024-04-01
- 2024-04-01-Preview-
- 2024-01-01-Preview-
- 2023-10-01
- 2023-08-01-Preview-
- 2023-06-01-Preview-
- 2023-04-01
- 2023-04-01-Preview-
- 2023-02-01-Vorschau-
- 2022-12-01-Vorschau-
- 2022-10-01
- 2022-10-01-Preview-
- 2022-06-01-Preview-
- 2022-05-01
- 2022-02-01-Preview-
- 2021-03-01-Preview-
Bicep-Ressourcendefinition
Der Ressourcentyp "workspaces/onlineEndpoints/deployments" kann mit Vorgängen bereitgestellt werden, die auf Folgendes abzielen:
- Ressourcengruppen – Siehe Ressourcengruppenbereitstellungsbefehle
Eine Liste der geänderten Eigenschaften in jeder API-Version finden Sie unter Änderungsprotokoll.
Ressourcenformat
Um eine Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments-Ressource zu erstellen, fügen Sie ihrer Vorlage die folgende Bicep hinzu.
resource symbolicname 'Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments@2022-12-01-preview' = {
name: 'string'
location: 'string'
tags: {
tagName1: 'tagValue1'
tagName2: 'tagValue2'
}
sku: {
capacity: int
family: 'string'
name: 'string'
size: 'string'
tier: 'string'
}
kind: 'string'
parent: resourceSymbolicName
identity: {
type: 'string'
userAssignedIdentities: {
{customized property}: {}
}
}
properties: {
appInsightsEnabled: bool
codeConfiguration: {
codeId: 'string'
scoringScript: 'string'
}
description: 'string'
egressPublicNetworkAccess: 'string'
environmentId: 'string'
environmentVariables: {
{customized property}: 'string'
}
instanceType: 'string'
livenessProbe: {
failureThreshold: int
initialDelay: 'string'
period: 'string'
successThreshold: int
timeout: 'string'
}
model: 'string'
modelMountPath: 'string'
properties: {
{customized property}: 'string'
}
readinessProbe: {
failureThreshold: int
initialDelay: 'string'
period: 'string'
successThreshold: int
timeout: 'string'
}
requestSettings: {
maxConcurrentRequestsPerInstance: int
maxQueueWait: 'string'
requestTimeout: 'string'
}
scaleSettings: {
scaleType: 'string'
// For remaining properties, see OnlineScaleSettings objects
}
endpointComputeType: 'string'
// For remaining properties, see OnlineDeploymentProperties objects
}
}
OnlineDeploymentProperties-Objekte
Legen Sie die eigenschaft endpointComputeType fest, um den Objekttyp anzugeben.
Verwenden Sie für Kubernetes:
endpointComputeType: 'Kubernetes'
containerResourceRequirements: {
containerResourceLimits: {
cpu: 'string'
gpu: 'string'
memory: 'string'
}
containerResourceRequests: {
cpu: 'string'
gpu: 'string'
memory: 'string'
}
}
Verwenden Sie für verwaltete:
endpointComputeType: 'Managed'
OnlineScaleSettings-Objekte
Legen Sie die scaleType--Eigenschaft fest, um den Objekttyp anzugeben.
Verwenden Sie für Standard-:
scaleType: 'Default'
Verwenden Sie für TargetUtilization-Folgendes:
scaleType: 'TargetUtilization'
maxInstances: int
minInstances: int
pollingInterval: 'string'
targetUtilizationPercentage: int
Eigenschaftswerte
workspaces/onlineEndpoints/deployments
Name | Beschreibung | Wert |
---|---|---|
Name | Der Ressourcenname Erfahren Sie, wie Sie Namen und Typen für untergeordnete Ressourcen in Bicep-festlegen. |
Zeichenfolge (erforderlich) |
Ort | Der geografische Standort, an dem sich die Ressource befindet | Zeichenfolge (erforderlich) |
Schilder | Ressourcentags. | Wörterbuch der Tagnamen und -werte. Siehe Tags in Vorlagen |
Sku | Sku-Details, die für den ARM-Vertrag für die automatische Skalierung erforderlich sind. | Sku- |
Art | Metadaten, die von Portal/Tooling/etc. verwendet werden, um unterschiedliche UX-Oberflächen für Ressourcen desselben Typs zu rendern. | Schnur |
Elternteil | In Bicep können Sie die übergeordnete Ressource für eine untergeordnete Ressource angeben. Sie müssen diese Eigenschaft nur hinzufügen, wenn die untergeordnete Ressource außerhalb der übergeordneten Ressource deklariert wird. Weitere Informationen finden Sie unter Untergeordnete Ressource außerhalb der übergeordneten Ressource. |
Symbolischer Name für Ressource des Typs: onlineEndpoints |
Identität | Verwaltete Dienstidentität (vom System zugewiesene und/oder vom Benutzer zugewiesene Identitäten) | ManagedServiceIdentity- |
Eigenschaften | [Erforderlich] Zusätzliche Attribute der Entität. | OnlineDeploymentProperties (erforderlich) |
ManagedServiceIdentity
Name | Beschreibung | Wert |
---|---|---|
Art | Typ der verwalteten Dienstidentität (wobei systemAssigned- und UserAssigned-Typen zulässig sind). | 'None' 'SystemAssigned' "SystemAssigned,UserAssigned" "UserAssigned" (erforderlich) |
userAssignedIdentities | Die Gruppe der benutzerzuweisungen Identitäten, die der Ressource zugeordnet sind. Die Wörterbuchschlüssel "userAssignedIdentities" sind ARM-Ressourcen-IDs im Formular: '/subscriptions/{subscriptionId}/resourceGroups/{resourceGroupName}/providers/Microsoft.ManagedIdentity/userAssignedIdentities/{identityName}. Die Wörterbuchwerte können leere Objekte ({}) in Anforderungen sein. | UserAssignedIdentities- |
UserAssignedIdentities
Name | Beschreibung | Wert |
---|---|---|
{angepasste Eigenschaft} | UserAssignedIdentity- |
UserAssignedIdentity
Dieses Objekt enthält keine Eigenschaften, die während der Bereitstellung festgelegt werden sollen. Alle Eigenschaften sind ReadOnly.
OnlineDeploymentProperties
Name | Beschreibung | Wert |
---|---|---|
appInsightsEnabled | Wenn wahr, aktiviert die Application Insights-Protokollierung. | Bool |
codeConfiguration | Codekonfiguration für die Endpunktbereitstellung. | CodeConfiguration- |
Beschreibung | Beschreibung der Endpunktbereitstellung. | Schnur |
egressPublicNetworkAccess | Wenn aktiviert, lassen Sie den Zugriff auf öffentliche Netzwerke zu. Wenn deaktiviert, wird dadurch ein sicherer Ausgang erstellt. Standard: Aktiviert. | "Deaktiviert" "Aktiviert" |
environmentId | ARM-Ressourcen-ID der Umgebungsspezifikation für die Endpunktbereitstellung. | Schnur |
environmentVariables | Umgebungsvariablenkonfiguration für die Bereitstellung. | EndpointDeploymentPropertiesBaseEnvironmentVariables |
instanceType | Computeinstanztyp. | Schnur |
livenessProbe | Liveness-Probe überwacht die Integrität des Containers regelmäßig. | ProbeSettings |
Modell | Der URI-Pfad zum Modell. | Schnur |
modelMountPath | Der Pfad zum Bereitstellen des Modells im benutzerdefinierten Container. | Schnur |
Eigenschaften | Eigenschaftenwörterbuch. Eigenschaften können hinzugefügt, aber nicht entfernt oder geändert werden. | EndpointDeploymentPropertiesBaseProperties |
readinessProbe | Die Bereitschaftssonde überprüft, ob der Container für den Datenverkehr bereit ist. Die Eigenschaften und Standardwerte sind identisch mit der Livenesssonde. | ProbeSettings |
requestSettings | Fordern Sie Einstellungen für die Bereitstellung an. | OnlineRequestSettings |
scaleSettings | Skalierungseinstellungen für die Bereitstellung. Wenn er null ist oder nicht angegeben wird, standardmäßig "TargetUtilizationScaleSettings" für KubernetesOnlineDeployment und in DefaultScaleSettings für ManagedOnlineDeployment. |
OnlineScaleSettings- |
endpointComputeType | Festlegen des Objekttyps |
Kubernetes Verwaltete (erforderlich) |
CodeConfiguration
Name | Beschreibung | Wert |
---|---|---|
codeId | ARM-Ressourcen-ID der Coderessource. | Schnur |
scoringScript | [Erforderlich] Das Skript, das beim Start ausgeführt werden soll. Zb. "score.py" | Zeichenfolge (erforderlich) Zwänge: Min. Länge = 1 Pattern = [a-zA-Z0-9_] |
EndpointDeploymentPropertiesBaseEnvironmentVariables
Name | Beschreibung | Wert |
---|---|---|
{angepasste Eigenschaft} | Schnur |
ProbeSettings
Name | Beschreibung | Wert |
---|---|---|
failureThreshold | Die Anzahl der Fehler, die zugelassen werden sollen, bevor ein fehlerhafter Status zurückgegeben wird. | Int |
initialDelay | Die Verzögerung vor der ersten Probe im ISO 8601-Format. | Schnur |
Periode | Die Dauer zwischen Probes im ISO 8601-Format. | Schnur |
successThreshold | Die Anzahl der erfolgreichen Probe, bevor ein fehlerfreier Status zurückgegeben wird. | Int |
Zeitüberschreitung | Das Timeout der Probe im ISO 8601-Format. | Schnur |
EndpointDeploymentPropertiesBaseProperties
Name | Beschreibung | Wert |
---|---|---|
{angepasste Eigenschaft} | Schnur |
OnlineRequestSettings
Name | Beschreibung | Wert |
---|---|---|
maxConcurrentRequestsPerInstance | Die Anzahl der maximalen gleichzeitigen Anforderungen pro Knoten pro Bereitstellung zulässig. Standardwert ist 1. | Int |
maxQueueWait | Die maximale Zeitspanne, die eine Anforderung in der Warteschlange im ISO 8601-Format verbleibt. Der Standardwert ist 500 ms. |
Schnur |
requestTimeout | Das Bewertungstimeout im ISO 8601-Format. Der Standardwert ist 5000 ms. |
Schnur |
OnlineScaleSettings
Name | Beschreibung | Wert |
---|---|---|
scaleType | Festlegen des Objekttyps |
Standard- TargetUtilization- (erforderlich) |
DefaultScaleSettings
Name | Beschreibung | Wert |
---|---|---|
scaleType | [Erforderlich] Art des Bereitstellungsskalierungsalgorithmus | 'Standard' (erforderlich) |
TargetUtilizationScaleSettings
Name | Beschreibung | Wert |
---|---|---|
scaleType | [Erforderlich] Art des Bereitstellungsskalierungsalgorithmus | 'TargetUtilization' (erforderlich) |
maxInstances | Die maximale Anzahl von Instanzen, auf die die Bereitstellung skaliert werden kann. Das Kontingent wird für max_instances reserviert. | Int |
minInstances | Die Mindestanzahl der Instanzen, die immer vorhanden sein sollen. | Int |
pollingInterval | Das Abrufintervall im ISO 8691-Format. Unterstützt nur die Dauer mit der Genauigkeit so niedrig wie Sekunden. | Schnur |
targetUtilizationPercentage | Die CPU-Zielauslastung für die Autoscaler. | Int |
KubernetesOnlineDeployment
Name | Beschreibung | Wert |
---|---|---|
endpointComputeType | [Erforderlich] Der Computetyp des Endpunkts. | 'Kubernetes' (erforderlich) |
containerResourceRequirements | Die Ressourcenanforderungen für den Container (CPU und Arbeitsspeicher). | ContainerResourceRequirements |
ContainerResourceRequirements
Name | Beschreibung | Wert |
---|---|---|
containerResourceLimits | Informationen zum Containerressourcengrenzwert: | ContainerResourceSettings- |
containerResourceRequests | Informationen zur Containerressourcenanforderung: | ContainerResourceSettings- |
ContainerResourceSettings
Name | Beschreibung | Wert |
---|---|---|
CPU | Anzahl der vCPUs-Anforderung/Grenzwert für Container. Weitere Informationen: https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/ |
Schnur |
gpu | Anzahl der Nvidia GPU-Kartenanforderung/-limit für Container. Weitere Informationen: https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/ |
Schnur |
Gedächtnis | Anforderung/Grenzwert für Speichergröße für Container. Weitere Informationen: https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/ |
Schnur |
ManagedOnlineDeployment
Name | Beschreibung | Wert |
---|---|---|
endpointComputeType | [Erforderlich] Der Computetyp des Endpunkts. | "Verwaltet" (erforderlich) |
Sku
Name | Beschreibung | Wert |
---|---|---|
Fassungsvermögen | Wenn die SKU skalierungs-/in unterstützt, sollte die Ganze Kapazität eingeschlossen werden. Wenn eine Skalierung für die Ressource nicht möglich ist, wird dies möglicherweise weggelassen. | Int |
Familie | Wenn der Dienst über unterschiedliche Hardwaregenerationen verfügt, kann dies für dieselbe SKU hier erfasst werden. | Schnur |
Name | Der Name der SKU. Ex - P3. Es handelt sich in der Regel um einen Buchstaben+Zahlencode. | Zeichenfolge (erforderlich) |
Größe | Die SKU-Größe. Wenn das Namensfeld die Kombination aus Ebene und einem anderen Wert ist, wäre dies der eigenständige Code. | Schnur |
Rang | Dieses Feld muss vom Ressourcenanbieter implementiert werden, wenn der Dienst mehr als eine Ebene aufweist, für einen PUT jedoch nicht erforderlich ist. | "Einfach" "Kostenlos" "Premium" "Standard" |
ARM-Vorlagenressourcendefinition
Der Ressourcentyp "workspaces/onlineEndpoints/deployments" kann mit Vorgängen bereitgestellt werden, die auf Folgendes abzielen:
- Ressourcengruppen – Siehe Ressourcengruppenbereitstellungsbefehle
Eine Liste der geänderten Eigenschaften in jeder API-Version finden Sie unter Änderungsprotokoll.
Ressourcenformat
Um eine Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments-Ressource zu erstellen, fügen Sie ihrer Vorlage den folgenden JSON-Code hinzu.
{
"type": "Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments",
"apiVersion": "2022-12-01-preview",
"name": "string",
"location": "string",
"tags": {
"tagName1": "tagValue1",
"tagName2": "tagValue2"
},
"sku": {
"capacity": "int",
"family": "string",
"name": "string",
"size": "string",
"tier": "string"
},
"kind": "string",
"identity": {
"type": "string",
"userAssignedIdentities": {
"{customized property}": {}
}
},
"properties": {
"appInsightsEnabled": "bool",
"codeConfiguration": {
"codeId": "string",
"scoringScript": "string"
},
"description": "string",
"egressPublicNetworkAccess": "string",
"environmentId": "string",
"environmentVariables": {
"{customized property}": "string"
},
"instanceType": "string",
"livenessProbe": {
"failureThreshold": "int",
"initialDelay": "string",
"period": "string",
"successThreshold": "int",
"timeout": "string"
},
"model": "string",
"modelMountPath": "string",
"properties": {
"{customized property}": "string"
},
"readinessProbe": {
"failureThreshold": "int",
"initialDelay": "string",
"period": "string",
"successThreshold": "int",
"timeout": "string"
},
"requestSettings": {
"maxConcurrentRequestsPerInstance": "int",
"maxQueueWait": "string",
"requestTimeout": "string"
},
"scaleSettings": {
"scaleType": "string"
// For remaining properties, see OnlineScaleSettings objects
},
"endpointComputeType": "string"
// For remaining properties, see OnlineDeploymentProperties objects
}
}
OnlineDeploymentProperties-Objekte
Legen Sie die eigenschaft endpointComputeType fest, um den Objekttyp anzugeben.
Verwenden Sie für Kubernetes:
"endpointComputeType": "Kubernetes",
"containerResourceRequirements": {
"containerResourceLimits": {
"cpu": "string",
"gpu": "string",
"memory": "string"
},
"containerResourceRequests": {
"cpu": "string",
"gpu": "string",
"memory": "string"
}
}
Verwenden Sie für verwaltete:
"endpointComputeType": "Managed"
OnlineScaleSettings-Objekte
Legen Sie die scaleType--Eigenschaft fest, um den Objekttyp anzugeben.
Verwenden Sie für Standard-:
"scaleType": "Default"
Verwenden Sie für TargetUtilization-Folgendes:
"scaleType": "TargetUtilization",
"maxInstances": "int",
"minInstances": "int",
"pollingInterval": "string",
"targetUtilizationPercentage": "int"
Eigenschaftswerte
workspaces/onlineEndpoints/deployments
Name | Beschreibung | Wert |
---|---|---|
Art | Der Ressourcentyp | "Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments" |
apiVersion | Die Ressourcen-API-Version | "2022-12-01-preview" |
Name | Der Ressourcenname Erfahren Sie, wie Sie Namen und Typen für untergeordnete Ressourcen in JSON ARM-Vorlagenfestlegen. |
Zeichenfolge (erforderlich) |
Ort | Der geografische Standort, an dem sich die Ressource befindet | Zeichenfolge (erforderlich) |
Schilder | Ressourcentags. | Wörterbuch der Tagnamen und -werte. Siehe Tags in Vorlagen |
Sku | Sku-Details, die für den ARM-Vertrag für die automatische Skalierung erforderlich sind. | Sku- |
Art | Metadaten, die von Portal/Tooling/etc. verwendet werden, um unterschiedliche UX-Oberflächen für Ressourcen desselben Typs zu rendern. | Schnur |
Identität | Verwaltete Dienstidentität (vom System zugewiesene und/oder vom Benutzer zugewiesene Identitäten) | ManagedServiceIdentity- |
Eigenschaften | [Erforderlich] Zusätzliche Attribute der Entität. | OnlineDeploymentProperties (erforderlich) |
ManagedServiceIdentity
Name | Beschreibung | Wert |
---|---|---|
Art | Typ der verwalteten Dienstidentität (wobei systemAssigned- und UserAssigned-Typen zulässig sind). | 'None' 'SystemAssigned' "SystemAssigned,UserAssigned" "UserAssigned" (erforderlich) |
userAssignedIdentities | Die Gruppe der benutzerzuweisungen Identitäten, die der Ressource zugeordnet sind. Die Wörterbuchschlüssel "userAssignedIdentities" sind ARM-Ressourcen-IDs im Formular: '/subscriptions/{subscriptionId}/resourceGroups/{resourceGroupName}/providers/Microsoft.ManagedIdentity/userAssignedIdentities/{identityName}. Die Wörterbuchwerte können leere Objekte ({}) in Anforderungen sein. | UserAssignedIdentities- |
UserAssignedIdentities
Name | Beschreibung | Wert |
---|---|---|
{angepasste Eigenschaft} | UserAssignedIdentity- |
UserAssignedIdentity
Dieses Objekt enthält keine Eigenschaften, die während der Bereitstellung festgelegt werden sollen. Alle Eigenschaften sind ReadOnly.
OnlineDeploymentProperties
Name | Beschreibung | Wert |
---|---|---|
appInsightsEnabled | Wenn wahr, aktiviert die Application Insights-Protokollierung. | Bool |
codeConfiguration | Codekonfiguration für die Endpunktbereitstellung. | CodeConfiguration- |
Beschreibung | Beschreibung der Endpunktbereitstellung. | Schnur |
egressPublicNetworkAccess | Wenn aktiviert, lassen Sie den Zugriff auf öffentliche Netzwerke zu. Wenn deaktiviert, wird dadurch ein sicherer Ausgang erstellt. Standard: Aktiviert. | "Deaktiviert" "Aktiviert" |
environmentId | ARM-Ressourcen-ID der Umgebungsspezifikation für die Endpunktbereitstellung. | Schnur |
environmentVariables | Umgebungsvariablenkonfiguration für die Bereitstellung. | EndpointDeploymentPropertiesBaseEnvironmentVariables |
instanceType | Computeinstanztyp. | Schnur |
livenessProbe | Liveness-Probe überwacht die Integrität des Containers regelmäßig. | ProbeSettings |
Modell | Der URI-Pfad zum Modell. | Schnur |
modelMountPath | Der Pfad zum Bereitstellen des Modells im benutzerdefinierten Container. | Schnur |
Eigenschaften | Eigenschaftenwörterbuch. Eigenschaften können hinzugefügt, aber nicht entfernt oder geändert werden. | EndpointDeploymentPropertiesBaseProperties |
readinessProbe | Die Bereitschaftssonde überprüft, ob der Container für den Datenverkehr bereit ist. Die Eigenschaften und Standardwerte sind identisch mit der Livenesssonde. | ProbeSettings |
requestSettings | Fordern Sie Einstellungen für die Bereitstellung an. | OnlineRequestSettings |
scaleSettings | Skalierungseinstellungen für die Bereitstellung. Wenn er null ist oder nicht angegeben wird, standardmäßig "TargetUtilizationScaleSettings" für KubernetesOnlineDeployment und in DefaultScaleSettings für ManagedOnlineDeployment. |
OnlineScaleSettings- |
endpointComputeType | Festlegen des Objekttyps |
Kubernetes Verwaltete (erforderlich) |
CodeConfiguration
Name | Beschreibung | Wert |
---|---|---|
codeId | ARM-Ressourcen-ID der Coderessource. | Schnur |
scoringScript | [Erforderlich] Das Skript, das beim Start ausgeführt werden soll. Zb. "score.py" | Zeichenfolge (erforderlich) Zwänge: Min. Länge = 1 Pattern = [a-zA-Z0-9_] |
EndpointDeploymentPropertiesBaseEnvironmentVariables
Name | Beschreibung | Wert |
---|---|---|
{angepasste Eigenschaft} | Schnur |
ProbeSettings
Name | Beschreibung | Wert |
---|---|---|
failureThreshold | Die Anzahl der Fehler, die zugelassen werden sollen, bevor ein fehlerhafter Status zurückgegeben wird. | Int |
initialDelay | Die Verzögerung vor der ersten Probe im ISO 8601-Format. | Schnur |
Periode | Die Dauer zwischen Probes im ISO 8601-Format. | Schnur |
successThreshold | Die Anzahl der erfolgreichen Probe, bevor ein fehlerfreier Status zurückgegeben wird. | Int |
Zeitüberschreitung | Das Timeout der Probe im ISO 8601-Format. | Schnur |
EndpointDeploymentPropertiesBaseProperties
Name | Beschreibung | Wert |
---|---|---|
{angepasste Eigenschaft} | Schnur |
OnlineRequestSettings
Name | Beschreibung | Wert |
---|---|---|
maxConcurrentRequestsPerInstance | Die Anzahl der maximalen gleichzeitigen Anforderungen pro Knoten pro Bereitstellung zulässig. Standardwert ist 1. | Int |
maxQueueWait | Die maximale Zeitspanne, die eine Anforderung in der Warteschlange im ISO 8601-Format verbleibt. Der Standardwert ist 500 ms. |
Schnur |
requestTimeout | Das Bewertungstimeout im ISO 8601-Format. Der Standardwert ist 5000 ms. |
Schnur |
OnlineScaleSettings
Name | Beschreibung | Wert |
---|---|---|
scaleType | Festlegen des Objekttyps |
Standard- TargetUtilization- (erforderlich) |
DefaultScaleSettings
Name | Beschreibung | Wert |
---|---|---|
scaleType | [Erforderlich] Art des Bereitstellungsskalierungsalgorithmus | 'Standard' (erforderlich) |
TargetUtilizationScaleSettings
Name | Beschreibung | Wert |
---|---|---|
scaleType | [Erforderlich] Art des Bereitstellungsskalierungsalgorithmus | 'TargetUtilization' (erforderlich) |
maxInstances | Die maximale Anzahl von Instanzen, auf die die Bereitstellung skaliert werden kann. Das Kontingent wird für max_instances reserviert. | Int |
minInstances | Die Mindestanzahl der Instanzen, die immer vorhanden sein sollen. | Int |
pollingInterval | Das Abrufintervall im ISO 8691-Format. Unterstützt nur die Dauer mit der Genauigkeit so niedrig wie Sekunden. | Schnur |
targetUtilizationPercentage | Die CPU-Zielauslastung für die Autoscaler. | Int |
KubernetesOnlineDeployment
Name | Beschreibung | Wert |
---|---|---|
endpointComputeType | [Erforderlich] Der Computetyp des Endpunkts. | 'Kubernetes' (erforderlich) |
containerResourceRequirements | Die Ressourcenanforderungen für den Container (CPU und Arbeitsspeicher). | ContainerResourceRequirements |
ContainerResourceRequirements
Name | Beschreibung | Wert |
---|---|---|
containerResourceLimits | Informationen zum Containerressourcengrenzwert: | ContainerResourceSettings- |
containerResourceRequests | Informationen zur Containerressourcenanforderung: | ContainerResourceSettings- |
ContainerResourceSettings
Name | Beschreibung | Wert |
---|---|---|
CPU | Anzahl der vCPUs-Anforderung/Grenzwert für Container. Weitere Informationen: https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/ |
Schnur |
gpu | Anzahl der Nvidia GPU-Kartenanforderung/-limit für Container. Weitere Informationen: https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/ |
Schnur |
Gedächtnis | Anforderung/Grenzwert für Speichergröße für Container. Weitere Informationen: https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/ |
Schnur |
ManagedOnlineDeployment
Name | Beschreibung | Wert |
---|---|---|
endpointComputeType | [Erforderlich] Der Computetyp des Endpunkts. | "Verwaltet" (erforderlich) |
Sku
Name | Beschreibung | Wert |
---|---|---|
Fassungsvermögen | Wenn die SKU skalierungs-/in unterstützt, sollte die Ganze Kapazität eingeschlossen werden. Wenn eine Skalierung für die Ressource nicht möglich ist, wird dies möglicherweise weggelassen. | Int |
Familie | Wenn der Dienst über unterschiedliche Hardwaregenerationen verfügt, kann dies für dieselbe SKU hier erfasst werden. | Schnur |
Name | Der Name der SKU. Ex - P3. Es handelt sich in der Regel um einen Buchstaben+Zahlencode. | Zeichenfolge (erforderlich) |
Größe | Die SKU-Größe. Wenn das Namensfeld die Kombination aus Ebene und einem anderen Wert ist, wäre dies der eigenständige Code. | Schnur |
Rang | Dieses Feld muss vom Ressourcenanbieter implementiert werden, wenn der Dienst mehr als eine Ebene aufweist, für einen PUT jedoch nicht erforderlich ist. | "Einfach" "Kostenlos" "Premium" "Standard" |
Terraform -Ressourcendefinition (AzAPI-Anbieter)
Der Ressourcentyp "workspaces/onlineEndpoints/deployments" kann mit Vorgängen bereitgestellt werden, die auf Folgendes abzielen:
- Ressourcengruppen
Eine Liste der geänderten Eigenschaften in jeder API-Version finden Sie unter Änderungsprotokoll.
Ressourcenformat
Um eine Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments-Ressource zu erstellen, fügen Sie Ihrer Vorlage die folgende Terraform hinzu.
resource "azapi_resource" "symbolicname" {
type = "Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments@2022-12-01-preview"
name = "string"
location = "string"
parent_id = "string"
tags = {
tagName1 = "tagValue1"
tagName2 = "tagValue2"
}
identity {
type = "string"
identity_ids = []
}
body = jsonencode({
properties = {
appInsightsEnabled = bool
codeConfiguration = {
codeId = "string"
scoringScript = "string"
}
description = "string"
egressPublicNetworkAccess = "string"
environmentId = "string"
environmentVariables = {
{customized property} = "string"
}
instanceType = "string"
livenessProbe = {
failureThreshold = int
initialDelay = "string"
period = "string"
successThreshold = int
timeout = "string"
}
model = "string"
modelMountPath = "string"
properties = {
{customized property} = "string"
}
readinessProbe = {
failureThreshold = int
initialDelay = "string"
period = "string"
successThreshold = int
timeout = "string"
}
requestSettings = {
maxConcurrentRequestsPerInstance = int
maxQueueWait = "string"
requestTimeout = "string"
}
scaleSettings = {
scaleType = "string"
// For remaining properties, see OnlineScaleSettings objects
}
endpointComputeType = "string"
// For remaining properties, see OnlineDeploymentProperties objects
}
sku = {
capacity = int
family = "string"
name = "string"
size = "string"
tier = "string"
}
kind = "string"
})
}
OnlineDeploymentProperties-Objekte
Legen Sie die eigenschaft endpointComputeType fest, um den Objekttyp anzugeben.
Verwenden Sie für Kubernetes:
endpointComputeType = "Kubernetes"
containerResourceRequirements = {
containerResourceLimits = {
cpu = "string"
gpu = "string"
memory = "string"
}
containerResourceRequests = {
cpu = "string"
gpu = "string"
memory = "string"
}
}
Verwenden Sie für verwaltete:
endpointComputeType = "Managed"
OnlineScaleSettings-Objekte
Legen Sie die scaleType--Eigenschaft fest, um den Objekttyp anzugeben.
Verwenden Sie für Standard-:
scaleType = "Default"
Verwenden Sie für TargetUtilization-Folgendes:
scaleType = "TargetUtilization"
maxInstances = int
minInstances = int
pollingInterval = "string"
targetUtilizationPercentage = int
Eigenschaftswerte
workspaces/onlineEndpoints/deployments
Name | Beschreibung | Wert |
---|---|---|
Art | Der Ressourcentyp | "Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments@2022-12-01-preview" |
Name | Der Ressourcenname | Zeichenfolge (erforderlich) |
Ort | Der geografische Standort, an dem sich die Ressource befindet | Zeichenfolge (erforderlich) |
parent_id | Die ID der Ressource, die das übergeordnete Element für diese Ressource ist. | ID für Ressource vom Typ: onlineEndpoints |
Schilder | Ressourcentags. | Wörterbuch der Tagnamen und -werte. |
Sku | Sku-Details, die für den ARM-Vertrag für die automatische Skalierung erforderlich sind. | Sku- |
Art | Metadaten, die von Portal/Tooling/etc. verwendet werden, um unterschiedliche UX-Oberflächen für Ressourcen desselben Typs zu rendern. | Schnur |
Identität | Verwaltete Dienstidentität (vom System zugewiesene und/oder vom Benutzer zugewiesene Identitäten) | ManagedServiceIdentity- |
Eigenschaften | [Erforderlich] Zusätzliche Attribute der Entität. | OnlineDeploymentProperties (erforderlich) |
ManagedServiceIdentity
Name | Beschreibung | Wert |
---|---|---|
Art | Typ der verwalteten Dienstidentität (wobei systemAssigned- und UserAssigned-Typen zulässig sind). | "SystemAssigned" "SystemAssigned,UserAssigned" "UserAssigned" (erforderlich) |
identity_ids | Die Gruppe der benutzerzuweisungen Identitäten, die der Ressource zugeordnet sind. Die Wörterbuchschlüssel "userAssignedIdentities" sind ARM-Ressourcen-IDs im Formular: '/subscriptions/{subscriptionId}/resourceGroups/{resourceGroupName}/providers/Microsoft.ManagedIdentity/userAssignedIdentities/{identityName}. Die Wörterbuchwerte können leere Objekte ({}) in Anforderungen sein. | Array von Benutzeridentitäts-IDs. |
UserAssignedIdentities
Name | Beschreibung | Wert |
---|---|---|
{angepasste Eigenschaft} | UserAssignedIdentity- |
UserAssignedIdentity
Dieses Objekt enthält keine Eigenschaften, die während der Bereitstellung festgelegt werden sollen. Alle Eigenschaften sind ReadOnly.
OnlineDeploymentProperties
Name | Beschreibung | Wert |
---|---|---|
appInsightsEnabled | Wenn wahr, aktiviert die Application Insights-Protokollierung. | Bool |
codeConfiguration | Codekonfiguration für die Endpunktbereitstellung. | CodeConfiguration- |
Beschreibung | Beschreibung der Endpunktbereitstellung. | Schnur |
egressPublicNetworkAccess | Wenn aktiviert, lassen Sie den Zugriff auf öffentliche Netzwerke zu. Wenn deaktiviert, wird dadurch ein sicherer Ausgang erstellt. Standard: Aktiviert. | "Deaktiviert" "Aktiviert" |
environmentId | ARM-Ressourcen-ID der Umgebungsspezifikation für die Endpunktbereitstellung. | Schnur |
environmentVariables | Umgebungsvariablenkonfiguration für die Bereitstellung. | EndpointDeploymentPropertiesBaseEnvironmentVariables |
instanceType | Computeinstanztyp. | Schnur |
livenessProbe | Liveness-Probe überwacht die Integrität des Containers regelmäßig. | ProbeSettings |
Modell | Der URI-Pfad zum Modell. | Schnur |
modelMountPath | Der Pfad zum Bereitstellen des Modells im benutzerdefinierten Container. | Schnur |
Eigenschaften | Eigenschaftenwörterbuch. Eigenschaften können hinzugefügt, aber nicht entfernt oder geändert werden. | EndpointDeploymentPropertiesBaseProperties |
readinessProbe | Die Bereitschaftssonde überprüft, ob der Container für den Datenverkehr bereit ist. Die Eigenschaften und Standardwerte sind identisch mit der Livenesssonde. | ProbeSettings |
requestSettings | Fordern Sie Einstellungen für die Bereitstellung an. | OnlineRequestSettings |
scaleSettings | Skalierungseinstellungen für die Bereitstellung. Wenn er null ist oder nicht angegeben wird, standardmäßig "TargetUtilizationScaleSettings" für KubernetesOnlineDeployment und in DefaultScaleSettings für ManagedOnlineDeployment. |
OnlineScaleSettings- |
endpointComputeType | Festlegen des Objekttyps |
Kubernetes Verwaltete (erforderlich) |
CodeConfiguration
Name | Beschreibung | Wert |
---|---|---|
codeId | ARM-Ressourcen-ID der Coderessource. | Schnur |
scoringScript | [Erforderlich] Das Skript, das beim Start ausgeführt werden soll. Zb. "score.py" | Zeichenfolge (erforderlich) Zwänge: Min. Länge = 1 Pattern = [a-zA-Z0-9_] |
EndpointDeploymentPropertiesBaseEnvironmentVariables
Name | Beschreibung | Wert |
---|---|---|
{angepasste Eigenschaft} | Schnur |
ProbeSettings
Name | Beschreibung | Wert |
---|---|---|
failureThreshold | Die Anzahl der Fehler, die zugelassen werden sollen, bevor ein fehlerhafter Status zurückgegeben wird. | Int |
initialDelay | Die Verzögerung vor der ersten Probe im ISO 8601-Format. | Schnur |
Periode | Die Dauer zwischen Probes im ISO 8601-Format. | Schnur |
successThreshold | Die Anzahl der erfolgreichen Probe, bevor ein fehlerfreier Status zurückgegeben wird. | Int |
Zeitüberschreitung | Das Timeout der Probe im ISO 8601-Format. | Schnur |
EndpointDeploymentPropertiesBaseProperties
Name | Beschreibung | Wert |
---|---|---|
{angepasste Eigenschaft} | Schnur |
OnlineRequestSettings
Name | Beschreibung | Wert |
---|---|---|
maxConcurrentRequestsPerInstance | Die Anzahl der maximalen gleichzeitigen Anforderungen pro Knoten pro Bereitstellung zulässig. Standardwert ist 1. | Int |
maxQueueWait | Die maximale Zeitspanne, die eine Anforderung in der Warteschlange im ISO 8601-Format verbleibt. Der Standardwert ist 500 ms. |
Schnur |
requestTimeout | Das Bewertungstimeout im ISO 8601-Format. Der Standardwert ist 5000 ms. |
Schnur |
OnlineScaleSettings
Name | Beschreibung | Wert |
---|---|---|
scaleType | Festlegen des Objekttyps |
Standard- TargetUtilization- (erforderlich) |
DefaultScaleSettings
Name | Beschreibung | Wert |
---|---|---|
scaleType | [Erforderlich] Art des Bereitstellungsskalierungsalgorithmus | "Standard" (erforderlich) |
TargetUtilizationScaleSettings
Name | Beschreibung | Wert |
---|---|---|
scaleType | [Erforderlich] Art des Bereitstellungsskalierungsalgorithmus | "TargetUtilization" (erforderlich) |
maxInstances | Die maximale Anzahl von Instanzen, auf die die Bereitstellung skaliert werden kann. Das Kontingent wird für max_instances reserviert. | Int |
minInstances | Die Mindestanzahl der Instanzen, die immer vorhanden sein sollen. | Int |
pollingInterval | Das Abrufintervall im ISO 8691-Format. Unterstützt nur die Dauer mit der Genauigkeit so niedrig wie Sekunden. | Schnur |
targetUtilizationPercentage | Die CPU-Zielauslastung für die Autoscaler. | Int |
KubernetesOnlineDeployment
Name | Beschreibung | Wert |
---|---|---|
endpointComputeType | [Erforderlich] Der Computetyp des Endpunkts. | "Kubernetes" (erforderlich) |
containerResourceRequirements | Die Ressourcenanforderungen für den Container (CPU und Arbeitsspeicher). | ContainerResourceRequirements |
ContainerResourceRequirements
Name | Beschreibung | Wert |
---|---|---|
containerResourceLimits | Informationen zum Containerressourcengrenzwert: | ContainerResourceSettings- |
containerResourceRequests | Informationen zur Containerressourcenanforderung: | ContainerResourceSettings- |
ContainerResourceSettings
Name | Beschreibung | Wert |
---|---|---|
CPU | Anzahl der vCPUs-Anforderung/Grenzwert für Container. Weitere Informationen: https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/ |
Schnur |
gpu | Anzahl der Nvidia GPU-Kartenanforderung/-limit für Container. Weitere Informationen: https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/ |
Schnur |
Gedächtnis | Anforderung/Grenzwert für Speichergröße für Container. Weitere Informationen: https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/ |
Schnur |
ManagedOnlineDeployment
Name | Beschreibung | Wert |
---|---|---|
endpointComputeType | [Erforderlich] Der Computetyp des Endpunkts. | "Verwaltet" (erforderlich) |
Sku
Name | Beschreibung | Wert |
---|---|---|
Fassungsvermögen | Wenn die SKU skalierungs-/in unterstützt, sollte die Ganze Kapazität eingeschlossen werden. Wenn eine Skalierung für die Ressource nicht möglich ist, wird dies möglicherweise weggelassen. | Int |
Familie | Wenn der Dienst über unterschiedliche Hardwaregenerationen verfügt, kann dies für dieselbe SKU hier erfasst werden. | Schnur |
Name | Der Name der SKU. Ex - P3. Es handelt sich in der Regel um einen Buchstaben+Zahlencode. | Zeichenfolge (erforderlich) |
Größe | Die SKU-Größe. Wenn das Namensfeld die Kombination aus Ebene und einem anderen Wert ist, wäre dies der eigenständige Code. | Schnur |
Rang | Dieses Feld muss vom Ressourcenanbieter implementiert werden, wenn der Dienst mehr als eine Ebene aufweist, für einen PUT jedoch nicht erforderlich ist. | "Einfach" "Kostenlos" "Premium" "Standard" |