Microsoft.MachineLearningServices workspaces/onlineEndpoints/deployments 2022-12-01-preview
Bicep-resourcedefinitie
Het resourcetype werkruimten/onlineEindpunten/implementaties kan worden geïmplementeerd met bewerkingen die zijn gericht op:
- Resourcegroepen - Zie opdrachten voor resourcegroepimplementatie
Zie wijzigingenlogboek voor een lijst met gewijzigde eigenschappen in elke API-versie.
Resource-indeling
Als u een resource Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments wilt maken, voegt u de volgende Bicep toe aan uw sjabloon.
resource symbolicname 'Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments@2022-12-01-preview' = {
name: 'string'
location: 'string'
tags: {
tagName1: 'tagValue1'
tagName2: 'tagValue2'
}
sku: {
capacity: int
family: 'string'
name: 'string'
size: 'string'
tier: 'string'
}
kind: 'string'
parent: resourceSymbolicName
identity: {
type: 'string'
userAssignedIdentities: {
{customized property}: {}
}
}
properties: {
appInsightsEnabled: bool
codeConfiguration: {
codeId: 'string'
scoringScript: 'string'
}
description: 'string'
egressPublicNetworkAccess: 'string'
environmentId: 'string'
environmentVariables: {
{customized property}: 'string'
{customized property}: 'string'
}
instanceType: 'string'
livenessProbe: {
failureThreshold: int
initialDelay: 'string'
period: 'string'
successThreshold: int
timeout: 'string'
}
model: 'string'
modelMountPath: 'string'
properties: {
{customized property}: 'string'
{customized property}: 'string'
}
readinessProbe: {
failureThreshold: int
initialDelay: 'string'
period: 'string'
successThreshold: int
timeout: 'string'
}
requestSettings: {
maxConcurrentRequestsPerInstance: int
maxQueueWait: 'string'
requestTimeout: 'string'
}
scaleSettings: {
scaleType: 'string'
// For remaining properties, see OnlineScaleSettings objects
}
endpointComputeType: 'string'
// For remaining properties, see OnlineDeploymentProperties objects
}
}
OnlineDeploymentProperties-objecten
Stel de eigenschap endpointComputeType in om het type object op te geven.
Gebruik voor Kubernetes:
endpointComputeType: 'Kubernetes'
containerResourceRequirements: {
containerResourceLimits: {
cpu: 'string'
gpu: 'string'
memory: 'string'
}
containerResourceRequests: {
cpu: 'string'
gpu: 'string'
memory: 'string'
}
}
Gebruik voor Beheerd:
endpointComputeType: 'Managed'
OnlineScaleSettings-objecten
Stel de eigenschap scaleType in om het type object op te geven.
Voor Standaard gebruikt u:
scaleType: 'Default'
Gebruik voor TargetUtilization:
scaleType: 'TargetUtilization'
maxInstances: int
minInstances: int
pollingInterval: 'string'
targetUtilizationPercentage: int
Eigenschapswaarden
werkruimten/onlineEindpunten/implementaties
Naam | Description | Waarde |
---|---|---|
naam | De resourcenaam Meer informatie over het instellen van namen en typen voor onderliggende resources in Bicep. |
tekenreeks (vereist) |
location | De geografische locatie waar de resource zich bevindt | tekenreeks (vereist) |
tags | Resourcetags. | Woordenlijst met tagnamen en -waarden. Tags in sjablonen bekijken |
sku | SKU-gegevens vereist voor het ARM-contract voor automatisch schalen. | SKU |
Soort | Metagegevens die worden gebruikt door portal/tooling/etc om verschillende UX-ervaringen weer te geven voor resources van hetzelfde type. | tekenreeks |
Bovenliggende | In Bicep kunt u de bovenliggende resource voor een onderliggende resource opgeven. U hoeft deze eigenschap alleen toe te voegen wanneer de onderliggende resource buiten de bovenliggende resource wordt gedeclareerd. Zie Onderliggende resource buiten bovenliggende resource voor meer informatie. |
Symbolische naam voor resource van het type: onlineEndpoints |
identity | Beheerde service-identiteit (door het systeem toegewezen en/of door de gebruiker toegewezen identiteiten) | ManagedServiceIdentity |
properties | [Vereist] Aanvullende kenmerken van de entiteit. | OnlineDeploymentEigenschappen (vereist) |
ManagedServiceIdentity
Naam | Description | Waarde |
---|---|---|
type | Type beheerde service-identiteit (waarbij zowel systemAssigned als UserAssigned zijn toegestaan). | 'Geen' 'SystemAssigned' 'SystemAssigned,UserAssigned' 'UserAssigned' (vereist) |
userAssignedIdentities | De set door de gebruiker toegewezen identiteiten die zijn gekoppeld aan de resource. De userAssignedIdentities-woordenlijstsleutels zijn ARM-resource-id's in de vorm: '/subscriptions/{subscriptionId}/resourceGroups/{resourceGroupName}/providers/Microsoft.ManagedIdentity/userAssignedIdentities/{identityName}. De woordenlijstwaarden kunnen lege objecten ({}) in aanvragen zijn. | UserAssignedId-entiteiten |
UserAssignedId-entiteiten
Naam | Description | Waarde |
---|---|---|
{aangepaste eigenschap} | UserAssignedIdentity |
UserAssignedIdentity
Dit object bevat geen eigenschappen die tijdens de implementatie moeten worden ingesteld. Alle eigenschappen zijn Alleen-lezen.
OnlineDeploymentEigenschappen
Naam | Description | Waarde |
---|---|---|
appInsightsEnabled | Als dit waar is, schakelt u Application Insights-logboekregistratie in. | booleaans |
codeConfiguration | Codeconfiguratie voor de eindpuntimplementatie. | CodeConfiguration |
beschrijving | Beschrijving van de eindpuntimplementatie. | tekenreeks |
egressPublicNetworkAccess | Als deze optie is ingeschakeld, staat u openbare netwerktoegang voor uitgaand verkeer toe. Als uitgeschakeld, wordt er een beveiligd uitgaand verkeer gemaakt. Standaardinstelling: ingeschakeld. | 'Uitgeschakeld' Ingeschakeld |
environmentId | ARM-resource-id van de omgevingsspecificatie voor de eindpuntimplementatie. | tekenreeks |
environmentVariables | Configuratie van omgevingsvariabelen voor de implementatie. | EndpointDeploymentPropertiesBaseEnvironmentVariables |
instanceType | Type rekenproces. | tekenreeks |
livenessProbe | De statustest controleert regelmatig de status van de container. | ProbeSettings |
model | Het URI-pad naar het model. | tekenreeks |
modelMountPath | Het pad voor het koppelen van het model in een aangepaste container. | tekenreeks |
properties | Eigenschappenwoordenlijst. Eigenschappen kunnen worden toegevoegd, maar niet worden verwijderd of gewijzigd. | EndpointDeploymentPropertiesBaseProperties |
readinessProbe | De gereedheidstest valideert of de container gereed is voor verkeer. De eigenschappen en standaardwaarden zijn hetzelfde als de statustest. | ProbeSettings |
requestSettings | Aanvraaginstellingen voor de implementatie. | OnlineRequestSettings |
scaleSettings | Schaalinstellingen voor de implementatie. Als deze null is of niet is opgegeven, standaard ingesteld op TargetUtilizationScaleSettings voor KubernetesOnlineDeployment en op DefaultScaleSettings voor ManagedOnlineDeployment. |
OnlineScaleSettings |
endpointComputeType | Het objecttype instellen | Kubernetes Beheerd (vereist) |
CodeConfiguration
Naam | Description | Waarde |
---|---|---|
codeId | ARM-resource-id van de code-asset. | tekenreeks |
scoringScript | [Vereist] Het script dat moet worden uitgevoerd bij het opstarten. bijvoorbeeld "score.py" | tekenreeks (vereist) Beperkingen: Minimale lengte = 1 Patroon = [a-zA-Z0-9_] |
EndpointDeploymentPropertiesBaseEnvironmentVariables
Naam | Description | Waarde |
---|---|---|
{aangepaste eigenschap} | tekenreeks | |
{aangepaste eigenschap} | tekenreeks |
ProbeSettings
Naam | Description | Waarde |
---|---|---|
failureThreshold | Het aantal fouten dat moet worden toegestaan voordat de status Niet in orde wordt geretourneerd. | int |
initialDelay | De vertraging voor de eerste test in ISO 8601-indeling. | tekenreeks |
period | De tijdsduur tussen tests in ISO 8601-indeling. | tekenreeks |
successThreshold | Het aantal geslaagde tests voordat de status In orde wordt geretourneerd. | int |
timeout | De testtime-out in ISO 8601-indeling. | tekenreeks |
EndpointDeploymentPropertiesBaseProperties
Naam | Description | Waarde |
---|---|---|
{aangepaste eigenschap} | tekenreeks | |
{aangepaste eigenschap} | tekenreeks |
OnlineRequestSettings
Naam | Description | Waarde |
---|---|---|
maxConcurrentRequestsPerInstance | Het aantal maximaal toegestane gelijktijdige aanvragen per knooppunt per implementatie. Standaardwaarde is 1. | int |
maxQueueWait | De maximale tijdsduur dat een aanvraag in de wachtrij blijft in ISO 8601-indeling. De standaardwaarde is 500 ms. |
tekenreeks |
requestTimeout | De scoretime-out in ISO 8601-indeling. De standaardwaarde is 5000 ms. |
tekenreeks |
OnlineScaleSettings
Naam | Description | Waarde |
---|---|---|
scaleType | Het objecttype instellen | Standaard Doelgebruik (vereist) |
DefaultScaleSettings
Naam | Description | Waarde |
---|---|---|
scaleType | [Vereist] Type algoritme voor het schalen van implementaties | 'Standaard' (vereist) |
TargetUtilizationScaleSettings
Naam | Description | Waarde |
---|---|---|
scaleType | [Vereist] Type algoritme voor het schalen van implementaties | 'Doelgebruik' (vereist) |
maxInstances | Het maximum aantal exemplaren waarnaar de implementatie kan worden geschaald. Het quotum wordt gereserveerd voor max_instances. | int |
minInstances | Het minimale aantal exemplaren dat altijd aanwezig moet zijn. | int |
pollingInterval | Het polling-interval in ISO 8691-indeling. Alleen ondersteuning voor duur met precisie zo laag als seconden. | tekenreeks |
targetUtilizationPercentage | Doel-CPU-gebruik voor de automatische schaalaanpassing. | int |
KubernetesOnlineDeployment
Naam | Description | Waarde |
---|---|---|
endpointComputeType | [Vereist] Het rekentype van het eindpunt. | 'Kubernetes' (vereist) |
containerResourceRequirements | De resourcevereisten voor de container (cpu en geheugen). | ContainerResourceRequirements |
ContainerResourceRequirements
Naam | Description | Waarde |
---|---|---|
containerResourceLimits | Informatie over limiet voor containerresources: | ContainerResourceSettings |
containerResourceRequests | Informatie over aanvraag van containerresource: | ContainerResourceSettings |
ContainerResourceSettings
Naam | Description | Waarde |
---|---|---|
Cpu | Aantal vCPU's aanvraag/limiet voor container. Meer informatie: https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/ |
tekenreeks |
Gpu | Aantal aanvraag/limiet voor Nvidia GPU-kaarten voor container. Meer informatie: https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/ |
tekenreeks |
geheugen | Aanvraag/limiet voor geheugengrootte voor container. Meer informatie: https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/ |
tekenreeks |
ManagedOnlineDeployment
Naam | Description | Waarde |
---|---|---|
endpointComputeType | [Vereist] Het rekentype van het eindpunt. | 'Beheerd' (vereist) |
Sku
Naam | Description | Waarde |
---|---|---|
capacity | Als de SKU uitschalen/inschalen ondersteunt, moet het gehele getal van de capaciteit worden opgenomen. Als uitschalen/inschalen niet mogelijk is voor de resource, wordt dit mogelijk weggelaten. | int |
gezin | Als de service verschillende generaties hardware voor dezelfde SKU heeft, kan die hier worden vastgelegd. | tekenreeks |
naam | De naam van de SKU. Ex - P3. Het is meestal een letter+cijfercode | tekenreeks (vereist) |
grootte | De SKU-grootte. Wanneer het naamveld de combinatie van laag en een andere waarde is, is dit de zelfstandige code. | tekenreeks |
laag | Dit veld moet worden geïmplementeerd door de resourceprovider als de service meer dan één laag heeft, maar niet vereist is voor een PUT. | 'Basic' 'Gratis' Premium 'Standaard' |
Resourcedefinitie van ARM-sjabloon
Het resourcetype werkruimten/onlineEindpunten/implementaties kan worden geïmplementeerd met bewerkingen die zijn gericht op:
- Resourcegroepen - Zie opdrachten voor resourcegroepimplementatie
Zie wijzigingenlogboek voor een lijst met gewijzigde eigenschappen in elke API-versie.
Resource-indeling
Als u een resource Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments wilt maken, voegt u de volgende JSON toe aan uw sjabloon.
{
"type": "Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments",
"apiVersion": "2022-12-01-preview",
"name": "string",
"location": "string",
"tags": {
"tagName1": "tagValue1",
"tagName2": "tagValue2"
},
"sku": {
"capacity": "int",
"family": "string",
"name": "string",
"size": "string",
"tier": "string"
},
"kind": "string",
"identity": {
"type": "string",
"userAssignedIdentities": {
"{customized property}": {}
}
},
"properties": {
"appInsightsEnabled": "bool",
"codeConfiguration": {
"codeId": "string",
"scoringScript": "string"
},
"description": "string",
"egressPublicNetworkAccess": "string",
"environmentId": "string",
"environmentVariables": {
"{customized property}": "string",
"{customized property}": "string"
},
"instanceType": "string",
"livenessProbe": {
"failureThreshold": "int",
"initialDelay": "string",
"period": "string",
"successThreshold": "int",
"timeout": "string"
},
"model": "string",
"modelMountPath": "string",
"properties": {
"{customized property}": "string",
"{customized property}": "string"
},
"readinessProbe": {
"failureThreshold": "int",
"initialDelay": "string",
"period": "string",
"successThreshold": "int",
"timeout": "string"
},
"requestSettings": {
"maxConcurrentRequestsPerInstance": "int",
"maxQueueWait": "string",
"requestTimeout": "string"
},
"scaleSettings": {
"scaleType": "string"
// For remaining properties, see OnlineScaleSettings objects
},
"endpointComputeType": "string"
// For remaining properties, see OnlineDeploymentProperties objects
}
}
OnlineDeploymentProperties-objecten
Stel de eigenschap endpointComputeType in om het type object op te geven.
Gebruik voor Kubernetes:
"endpointComputeType": "Kubernetes",
"containerResourceRequirements": {
"containerResourceLimits": {
"cpu": "string",
"gpu": "string",
"memory": "string"
},
"containerResourceRequests": {
"cpu": "string",
"gpu": "string",
"memory": "string"
}
}
Gebruik voor Beheerd:
"endpointComputeType": "Managed"
OnlineScaleSettings-objecten
Stel de eigenschap scaleType in om het type object op te geven.
Voor Standaard gebruikt u:
"scaleType": "Default"
Gebruik voor TargetUtilization:
"scaleType": "TargetUtilization",
"maxInstances": "int",
"minInstances": "int",
"pollingInterval": "string",
"targetUtilizationPercentage": "int"
Eigenschapswaarden
werkruimten/onlineEindpunten/implementaties
Naam | Description | Waarde |
---|---|---|
type | Het resourcetype | 'Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments' |
apiVersion | De resource-API-versie | '01-12-2022-preview' |
naam | De resourcenaam Meer informatie over het instellen van namen en typen voor onderliggende resources in JSON ARM-sjablonen. |
tekenreeks (vereist) |
location | De geografische locatie waar de resource zich bevindt | tekenreeks (vereist) |
tags | Resourcetags. | Woordenlijst met tagnamen en -waarden. Tags in sjablonen bekijken |
sku | SKU-gegevens vereist voor het ARM-contract voor automatisch schalen. | SKU |
Soort | Metagegevens die worden gebruikt door portal/hulpprogramma's/enzovoort om verschillende UX-ervaringen weer te geven voor resources van hetzelfde type. | tekenreeks |
identity | Beheerde service-identiteit (door het systeem toegewezen en/of door de gebruiker toegewezen identiteiten) | ManagedServiceIdentity |
properties | [Vereist] Aanvullende kenmerken van de entiteit. | OnlineDeploymentProperties (vereist) |
ManagedServiceIdentity
Naam | Description | Waarde |
---|---|---|
type | Type beheerde service-identiteit (waarbij zowel SystemAssigned als UserAssigned zijn toegestaan). | 'Geen' 'SystemAssigned' 'SystemAssigned,UserAssigned' 'UserAssigned' (vereist) |
userAssignedIdentities | De set door de gebruiker toegewezen identiteiten die aan de resource zijn gekoppeld. De userAssignedIdentities-woordenlijstsleutels zijn ARM-resource-id's in de volgende notatie: '/subscriptions/{subscriptionId}/resourceGroups/{resourceGroupName}/providers/Microsoft.ManagedIdentity/userAssignedIdentities/{identityName}. De woordenlijstwaarden kunnen lege objecten ({}) in aanvragen zijn. | UserAssignedId-entiteiten |
UserAssignedId-entiteiten
Naam | Description | Waarde |
---|---|---|
{aangepaste eigenschap} | UserAssignedIdentity |
UserAssignedIdentity
Dit object bevat geen eigenschappen die tijdens de implementatie moeten worden ingesteld. Alle eigenschappen zijn ReadOnly.
OnlineDeploymentEigenschappen
Naam | Description | Waarde |
---|---|---|
appInsightsEnabled | Als dit waar is, schakelt u Application Insights-logboekregistratie in. | booleaans |
codeConfiguration | Codeconfiguratie voor de eindpuntimplementatie. | CodeConfiguration |
beschrijving | Beschrijving van de eindpuntimplementatie. | tekenreeks |
egressPublicNetworkAccess | Als deze optie is ingeschakeld, staat u openbare netwerktoegang voor uitgaand verkeer toe. Als uitgeschakeld, wordt er een beveiligd uitgaand verkeer gemaakt. Standaardinstelling: ingeschakeld. | 'Uitgeschakeld' Ingeschakeld |
environmentId | ARM-resource-id van de omgevingsspecificatie voor de eindpuntimplementatie. | tekenreeks |
environmentVariables | Configuratie van omgevingsvariabelen voor de implementatie. | EndpointDeploymentPropertiesBaseEnvironmentVariables |
instanceType | Type rekenproces. | tekenreeks |
livenessProbe | De statustest controleert regelmatig de status van de container. | ProbeSettings |
model | Het URI-pad naar het model. | tekenreeks |
modelMountPath | Het pad voor het koppelen van het model in een aangepaste container. | tekenreeks |
properties | Eigenschappenwoordenlijst. Eigenschappen kunnen worden toegevoegd, maar niet worden verwijderd of gewijzigd. | EndpointDeploymentPropertiesBaseProperties |
readinessProbe | De gereedheidstest valideert of de container gereed is voor verkeer. De eigenschappen en standaardwaarden zijn hetzelfde als de statustest. | ProbeSettings |
requestSettings | Aanvraaginstellingen voor de implementatie. | OnlineRequestSettings |
scaleSettings | Schaalinstellingen voor de implementatie. Als deze null is of niet is opgegeven, standaard ingesteld op TargetUtilizationScaleSettings voor KubernetesOnlineDeployment en op DefaultScaleSettings voor ManagedOnlineDeployment. |
OnlineScaleSettings |
endpointComputeType | Het objecttype instellen | Kubernetes Beheerd (vereist) |
CodeConfiguration
Naam | Description | Waarde |
---|---|---|
codeId | ARM-resource-id van de code-asset. | tekenreeks |
scoringScript | [Vereist] Het script dat moet worden uitgevoerd bij het opstarten. bijvoorbeeld "score.py" | tekenreeks (vereist) Beperkingen: Minimale lengte = 1 Patroon = [a-zA-Z0-9_] |
EndpointDeploymentPropertiesBaseEnvironmentVariables
Naam | Description | Waarde |
---|---|---|
{aangepaste eigenschap} | tekenreeks | |
{aangepaste eigenschap} | tekenreeks |
ProbeSettings
Naam | Description | Waarde |
---|---|---|
failureThreshold | Het aantal fouten dat moet worden toegestaan voordat de status Niet in orde wordt geretourneerd. | int |
initialDelay | De vertraging voor de eerste test in ISO 8601-indeling. | tekenreeks |
period | De tijdsduur tussen tests in ISO 8601-indeling. | tekenreeks |
successThreshold | Het aantal geslaagde tests voordat de status In orde wordt geretourneerd. | int |
timeout | De testtime-out in ISO 8601-indeling. | tekenreeks |
EndpointDeploymentPropertiesBaseProperties
Naam | Description | Waarde |
---|---|---|
{aangepaste eigenschap} | tekenreeks | |
{aangepaste eigenschap} | tekenreeks |
OnlineRequestSettings
Naam | Description | Waarde |
---|---|---|
maxConcurrentRequestsPerInstance | Het aantal maximaal toegestane gelijktijdige aanvragen per knooppunt per implementatie. Standaardwaarde is 1. | int |
maxQueueWait | De maximale tijdsduur dat een aanvraag in de wachtrij blijft in ISO 8601-indeling. De standaardwaarde is 500 ms. |
tekenreeks |
requestTimeout | De scoretime-out in ISO 8601-indeling. De standaardwaarde is 5000 ms. |
tekenreeks |
OnlineScaleSettings
Naam | Description | Waarde |
---|---|---|
scaleType | Het objecttype instellen | Standaard Doelgebruik (vereist) |
DefaultScaleSettings
Naam | Description | Waarde |
---|---|---|
scaleType | [Vereist] Type algoritme voor het schalen van implementaties | 'Standaard' (vereist) |
TargetUtilizationScaleSettings
Naam | Description | Waarde |
---|---|---|
scaleType | [Vereist] Type algoritme voor het schalen van implementaties | 'Doelgebruik' (vereist) |
maxInstances | Het maximum aantal exemplaren waarnaar de implementatie kan worden geschaald. Het quotum wordt gereserveerd voor max_instances. | int |
minInstances | Het minimale aantal exemplaren dat altijd aanwezig moet zijn. | int |
pollingInterval | Het polling-interval in ISO 8691-indeling. Alleen ondersteuning voor duur met precisie zo laag als seconden. | tekenreeks |
targetUtilizationPercentage | Doel-CPU-gebruik voor de automatische schaalaanpassing. | int |
KubernetesOnlineDeployment
Naam | Description | Waarde |
---|---|---|
endpointComputeType | [Vereist] Het rekentype van het eindpunt. | 'Kubernetes' (vereist) |
containerResourceRequirements | De resourcevereisten voor de container (cpu en geheugen). | ContainerResourceRequirements |
ContainerResourceRequirements
Naam | Description | Waarde |
---|---|---|
containerResourceLimits | Informatie over limiet voor containerresources: | ContainerResourceSettings |
containerResourceRequests | Informatie over aanvraag van containerresource: | ContainerResourceSettings |
ContainerResourceSettings
Naam | Description | Waarde |
---|---|---|
Cpu | Aantal vCPU's aanvraag/limiet voor container. Meer informatie: https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/ |
tekenreeks |
Gpu | Aantal aanvraag/limiet voor Nvidia GPU-kaarten voor container. Meer informatie: https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/ |
tekenreeks |
geheugen | Aanvraag/limiet voor geheugengrootte voor container. Meer informatie: https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/ |
tekenreeks |
ManagedOnlineDeployment
Naam | Description | Waarde |
---|---|---|
endpointComputeType | [Vereist] Het rekentype van het eindpunt. | 'Beheerd' (vereist) |
Sku
Naam | Description | Waarde |
---|---|---|
capacity | Als de SKU uitschalen/inschalen ondersteunt, moet het gehele getal van de capaciteit worden opgenomen. Als uitschalen/inschalen niet mogelijk is voor de resource, wordt dit mogelijk weggelaten. | int |
gezin | Als de service verschillende generaties hardware voor dezelfde SKU heeft, kan die hier worden vastgelegd. | tekenreeks |
naam | De naam van de SKU. Ex - P3. Het is meestal een letter+cijfercode | tekenreeks (vereist) |
grootte | De SKU-grootte. Wanneer het naamveld de combinatie van laag en een andere waarde is, is dit de zelfstandige code. | tekenreeks |
laag | Dit veld moet worden geïmplementeerd door de resourceprovider als de service meer dan één laag heeft, maar niet vereist is voor een PUT. | 'Basic' 'Gratis' Premium 'Standaard' |
Resourcedefinitie van Terraform (AzAPI-provider)
Het resourcetype werkruimten/onlineEindpunten/implementaties kan worden geïmplementeerd met bewerkingen die zijn gericht op:
- Resourcegroepen
Zie wijzigingenlogboek voor een lijst met gewijzigde eigenschappen in elke API-versie.
Resource-indeling
Als u een resource Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments wilt maken, voegt u de volgende Terraform toe aan uw sjabloon.
resource "azapi_resource" "symbolicname" {
type = "Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments@2022-12-01-preview"
name = "string"
location = "string"
parent_id = "string"
tags = {
tagName1 = "tagValue1"
tagName2 = "tagValue2"
}
identity {
type = "string"
identity_ids = []
}
body = jsonencode({
properties = {
appInsightsEnabled = bool
codeConfiguration = {
codeId = "string"
scoringScript = "string"
}
description = "string"
egressPublicNetworkAccess = "string"
environmentId = "string"
environmentVariables = {
{customized property} = "string"
{customized property} = "string"
}
instanceType = "string"
livenessProbe = {
failureThreshold = int
initialDelay = "string"
period = "string"
successThreshold = int
timeout = "string"
}
model = "string"
modelMountPath = "string"
properties = {
{customized property} = "string"
{customized property} = "string"
}
readinessProbe = {
failureThreshold = int
initialDelay = "string"
period = "string"
successThreshold = int
timeout = "string"
}
requestSettings = {
maxConcurrentRequestsPerInstance = int
maxQueueWait = "string"
requestTimeout = "string"
}
scaleSettings = {
scaleType = "string"
// For remaining properties, see OnlineScaleSettings objects
}
endpointComputeType = "string"
// For remaining properties, see OnlineDeploymentProperties objects
}
sku = {
capacity = int
family = "string"
name = "string"
size = "string"
tier = "string"
}
kind = "string"
})
}
OnlineDeploymentProperties-objecten
Stel de eigenschap endpointComputeType in om het type object op te geven.
Gebruik voor Kubernetes:
endpointComputeType = "Kubernetes"
containerResourceRequirements = {
containerResourceLimits = {
cpu = "string"
gpu = "string"
memory = "string"
}
containerResourceRequests = {
cpu = "string"
gpu = "string"
memory = "string"
}
}
Gebruik voor Beheerd:
endpointComputeType = "Managed"
OnlineScaleSettings-objecten
Stel de eigenschap scaleType in om het type object op te geven.
Voor Standaard gebruikt u:
scaleType = "Default"
Gebruik voor TargetUtilization:
scaleType = "TargetUtilization"
maxInstances = int
minInstances = int
pollingInterval = "string"
targetUtilizationPercentage = int
Eigenschapswaarden
werkruimten/onlineEindpunten/implementaties
Naam | Description | Waarde |
---|---|---|
type | Het resourcetype | "Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments@2022-12-01-preview" |
naam | De resourcenaam | tekenreeks (vereist) |
location | De geografische locatie waar de resource zich bevindt | tekenreeks (vereist) |
parent_id | De id van de resource die het bovenliggende item voor deze resource is. | Id voor resource van het type: onlineEndpoints |
tags | Resourcetags. | Woordenlijst met tagnamen en -waarden. |
sku | SKU-gegevens vereist voor het ARM-contract voor automatisch schalen. | SKU |
Soort | Metagegevens die worden gebruikt door portal/hulpprogramma's/enzovoort om verschillende UX-ervaringen weer te geven voor resources van hetzelfde type. | tekenreeks |
identity | Beheerde service-identiteit (door het systeem toegewezen en/of door de gebruiker toegewezen identiteiten) | ManagedServiceIdentity |
properties | [Vereist] Aanvullende kenmerken van de entiteit. | OnlineDeploymentProperties (vereist) |
ManagedServiceIdentity
Naam | Description | Waarde |
---|---|---|
type | Type beheerde service-identiteit (waarbij zowel SystemAssigned als UserAssigned zijn toegestaan). | "SystemAssigned" "SystemAssigned,UserAssigned" 'UserAssigned' (vereist) |
identity_ids | De set door de gebruiker toegewezen identiteiten die aan de resource zijn gekoppeld. De userAssignedIdentities-woordenlijstsleutels zijn ARM-resource-id's in de volgende notatie: '/subscriptions/{subscriptionId}/resourceGroups/{resourceGroupName}/providers/Microsoft.ManagedIdentity/userAssignedIdentities/{identityName}. De woordenlijstwaarden kunnen lege objecten ({}) in aanvragen zijn. | Matrix met gebruikersidentiteits-id's. |
UserAssignedId-entiteiten
Naam | Description | Waarde |
---|---|---|
{aangepaste eigenschap} | UserAssignedIdentity |
UserAssignedIdentity
Dit object bevat geen eigenschappen die tijdens de implementatie moeten worden ingesteld. Alle eigenschappen zijn ReadOnly.
OnlineDeploymentEigenschappen
Naam | Description | Waarde |
---|---|---|
appInsightsEnabled | Als dit waar is, schakelt u Application Insights-logboekregistratie in. | booleaans |
codeConfiguration | Codeconfiguratie voor de eindpuntimplementatie. | CodeConfiguration |
beschrijving | Beschrijving van de eindpuntimplementatie. | tekenreeks |
egressPublicNetworkAccess | Als deze optie is ingeschakeld, staat u openbare netwerktoegang voor uitgaand verkeer toe. Als uitgeschakeld, zorgt dit voor een beveiligd uitgaand verkeer. Standaardinstelling: ingeschakeld. | "Uitgeschakeld" "Ingeschakeld" |
environmentId | ARM-resource-id van de omgevingsspecificatie voor de eindpuntimplementatie. | tekenreeks |
environmentVariables | Configuratie van omgevingsvariabelen voor de implementatie. | EndpointDeploymentPropertiesBaseEnvironmentVariables |
instanceType | Type rekenproces. | tekenreeks |
livenessProbe | De statustest controleert regelmatig de status van de container. | ProbeSettings |
model | Het URI-pad naar het model. | tekenreeks |
modelMountPath | Het pad voor het koppelen van het model in een aangepaste container. | tekenreeks |
properties | Woordenlijst met eigenschappen. Eigenschappen kunnen worden toegevoegd, maar niet worden verwijderd of gewijzigd. | EndpointDeploymentPropertiesBaseProperties |
readinessProbe | De gereedheidstest valideert of de container gereed is om verkeer te verwerken. De eigenschappen en standaardwaarden zijn hetzelfde als de activiteitstest. | ProbeSettings |
requestSettings | Aanvraaginstellingen voor de implementatie. | OnlineRequestSettings |
scaleSettings | Schaalinstellingen voor de implementatie. Als deze null is of niet is opgegeven, standaard ingesteld op TargetUtilizationScaleSettings voor KubernetesOnlineDeployment en naar DefaultScaleSettings voor ManagedOnlineDeployment. |
OnlineScaleSettings |
endpointComputeType | Het objecttype instellen | Kubernetes Beheerd (vereist) |
CodeConfiguration
Naam | Description | Waarde |
---|---|---|
codeId | ARM-resource-id van de code-asset. | tekenreeks |
scoringScript | [Vereist] Het script dat moet worden uitgevoerd bij het opstarten. bijvoorbeeld "score.py" | tekenreeks (vereist) Beperkingen: Minimale lengte = 1 Patroon = [a-zA-Z0-9_] |
EndpointDeploymentPropertiesBaseEnvironmentVariables
Naam | Description | Waarde |
---|---|---|
{aangepaste eigenschap} | tekenreeks | |
{aangepaste eigenschap} | tekenreeks |
ProbeSettings
Naam | Description | Waarde |
---|---|---|
failureThreshold | Het aantal fouten dat moet worden toegestaan voordat een beschadigde status wordt geretourneerd. | int |
initialDelay | De vertraging voor de eerste test in ISO 8601-indeling. | tekenreeks |
period | De tijdsduur tussen tests in ISO 8601-indeling. | tekenreeks |
successThreshold | Het aantal geslaagde tests voordat een status in orde wordt geretourneerd. | int |
timeout | De testtime-out in ISO 8601-indeling. | tekenreeks |
EndpointDeploymentPropertiesBaseProperties
Naam | Description | Waarde |
---|---|---|
{aangepaste eigenschap} | tekenreeks | |
{aangepaste eigenschap} | tekenreeks |
OnlineRequestSettings
Naam | Description | Waarde |
---|---|---|
maxConcurrentRequestsPerInstance | Het aantal maximaal toegestane gelijktijdige aanvragen per knooppunt per implementatie. Standaardwaarde is 1. | int |
maxQueueWait | De maximale tijdsduur dat een aanvraag in de wachtrij blijft in ISO 8601-indeling. De standaardwaarde is 500 ms. |
tekenreeks |
requestTimeout | De scoretime-out in ISO 8601-indeling. De standaardwaarde is 5000 ms. |
tekenreeks |
OnlineScaleSettings
Naam | Description | Waarde |
---|---|---|
scaleType | Het objecttype instellen | Standaard Doelgebruik (vereist) |
DefaultScaleSettings
Naam | Description | Waarde |
---|---|---|
scaleType | [Vereist] Type algoritme voor het schalen van implementaties | 'Standaard' (vereist) |
TargetUtilizationScaleSettings
Naam | Description | Waarde |
---|---|---|
scaleType | [Vereist] Type algoritme voor het schalen van implementaties | "Doelgebruik" (vereist) |
maxInstances | Het maximum aantal exemplaren waarnaar de implementatie kan worden geschaald. Het quotum wordt gereserveerd voor max_instances. | int |
minInstances | Het minimale aantal exemplaren dat altijd aanwezig moet zijn. | int |
pollingInterval | Het polling-interval in ISO 8691-indeling. Alleen ondersteuning voor duur met precisie zo laag als seconden. | tekenreeks |
targetUtilizationPercentage | Doel-CPU-gebruik voor de automatische schaalaanpassing. | int |
KubernetesOnlineDeployment
Naam | Description | Waarde |
---|---|---|
endpointComputeType | [Vereist] Het rekentype van het eindpunt. | "Kubernetes" (vereist) |
containerResourceRequirements | De resourcevereisten voor de container (cpu en geheugen). | ContainerResourceRequirements |
ContainerResourceRequirements
Naam | Description | Waarde |
---|---|---|
containerResourceLimits | Informatie over limiet voor containerresources: | ContainerResourceSettings |
containerResourceRequests | Informatie over aanvraag van containerresource: | ContainerResourceSettings |
ContainerResourceSettings
Naam | Description | Waarde |
---|---|---|
Cpu | Aantal vCPU's aanvraag/limiet voor container. Meer informatie: https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/ |
tekenreeks |
Gpu | Aantal aanvraag/limiet voor Nvidia GPU-kaarten voor container. Meer informatie: https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/ |
tekenreeks |
geheugen | Aanvraag/limiet voor geheugengrootte voor container. Meer informatie: https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/ |
tekenreeks |
ManagedOnlineDeployment
Naam | Description | Waarde |
---|---|---|
endpointComputeType | [Vereist] Het rekentype van het eindpunt. | 'Beheerd' (vereist) |
Sku
Naam | Description | Waarde |
---|---|---|
capacity | Als de SKU uitschalen/inschalen ondersteunt, moet het gehele getal van de capaciteit worden opgenomen. Als uitschalen/inschalen niet mogelijk is voor de resource, wordt dit mogelijk weggelaten. | int |
gezin | Als de service verschillende generaties hardware voor dezelfde SKU heeft, kan die hier worden vastgelegd. | tekenreeks |
naam | De naam van de SKU. Ex - P3. Het is meestal een letter+cijfercode | tekenreeks (vereist) |
grootte | De SKU-grootte. Wanneer het naamveld de combinatie van laag en een andere waarde is, is dit de zelfstandige code. | tekenreeks |
laag | Dit veld moet worden geïmplementeerd door de resourceprovider als de service meer dan één laag heeft, maar niet vereist is voor een PUT. | "Basis" "Gratis" "Premium" "Standaard" |
Feedback
https://aka.ms/ContentUserFeedback.
Binnenkort beschikbaar: In de loop van 2024 zullen we GitHub-problemen geleidelijk uitfaseren als het feedbackmechanisme voor inhoud en deze vervangen door een nieuw feedbacksysteem. Zie voor meer informatie:Feedback verzenden en weergeven voor