Microsoft.MachineLearningServices-werkruimten/onlineEndpoints/deployments 2022-06-01-preview

Bicep-resourcedefinitie

Het resourcetype werkruimten/onlineEindpunten/implementaties kan worden geïmplementeerd met bewerkingen die zijn gericht op:

Zie wijzigingenlogboek voor een lijst met gewijzigde eigenschappen in elke API-versie.

Resource-indeling

Als u een resource Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments wilt maken, voegt u de volgende Bicep toe aan uw sjabloon.

resource symbolicname 'Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments@2022-06-01-preview' = {
  name: 'string'
  location: 'string'
  tags: {
    tagName1: 'tagValue1'
    tagName2: 'tagValue2'
  }
  sku: {
    capacity: int
    family: 'string'
    name: 'string'
    size: 'string'
    tier: 'string'
  }
  kind: 'string'
  parent: resourceSymbolicName
  identity: {
    type: 'string'
    userAssignedIdentities: {
      {customized property}: {}
    }
  }
  properties: {
    appInsightsEnabled: bool
    codeConfiguration: {
      codeId: 'string'
      scoringScript: 'string'
    }
    description: 'string'
    egressPublicNetworkAccess: 'string'
    environmentId: 'string'
    environmentVariables: {
      {customized property}: 'string'
      {customized property}: 'string'
    }
    instanceType: 'string'
    livenessProbe: {
      failureThreshold: int
      initialDelay: 'string'
      period: 'string'
      successThreshold: int
      timeout: 'string'
    }
    model: 'string'
    modelMountPath: 'string'
    properties: {
      {customized property}: 'string'
      {customized property}: 'string'
    }
    readinessProbe: {
      failureThreshold: int
      initialDelay: 'string'
      period: 'string'
      successThreshold: int
      timeout: 'string'
    }
    requestSettings: {
      maxConcurrentRequestsPerInstance: int
      maxQueueWait: 'string'
      requestTimeout: 'string'
    }
    scaleSettings: {
      scaleType: 'string'
      // For remaining properties, see OnlineScaleSettings objects
    }
    endpointComputeType: 'string'
    // For remaining properties, see OnlineDeploymentProperties objects
  }
}

OnlineDeploymentProperties-objecten

Stel de eigenschap endpointComputeType in om het type object op te geven.

Gebruik voor Kubernetes:

  endpointComputeType: 'Kubernetes'
  containerResourceRequirements: {
    containerResourceLimits: {
      cpu: 'string'
      gpu: 'string'
      memory: 'string'
    }
    containerResourceRequests: {
      cpu: 'string'
      gpu: 'string'
      memory: 'string'
    }
  }

Gebruik voor Beheerd:

  endpointComputeType: 'Managed'

OnlineScaleSettings-objecten

Stel de eigenschap scaleType in om het type object op te geven.

Voor Standaard gebruikt u:

  scaleType: 'Default'

Gebruik voor TargetUtilization:

  scaleType: 'TargetUtilization'
  maxInstances: int
  minInstances: int
  pollingInterval: 'string'
  targetUtilizationPercentage: int

Eigenschapswaarden

werkruimten/onlineEindpunten/implementaties

Naam Description Waarde
naam De resourcenaam

Meer informatie over het instellen van namen en typen voor onderliggende resources in Bicep.
tekenreeks (vereist)
location De geografische locatie waar de resource zich bevindt tekenreeks (vereist)
tags Resourcetags. Woordenlijst met tagnamen en -waarden. Tags in sjablonen bekijken
sku SKU-gegevens vereist voor het ARM-contract voor automatisch schalen. SKU
Soort Metagegevens die worden gebruikt door portal/tooling/etc om verschillende UX-ervaringen weer te geven voor resources van hetzelfde type. tekenreeks
Bovenliggende In Bicep kunt u de bovenliggende resource voor een onderliggende resource opgeven. U hoeft deze eigenschap alleen toe te voegen wanneer de onderliggende resource buiten de bovenliggende resource wordt gedeclareerd.

Zie Onderliggende resource buiten bovenliggende resource voor meer informatie.
Symbolische naam voor resource van het type: onlineEndpoints
identity Beheerde service-identiteit (door het systeem toegewezen en/of door de gebruiker toegewezen identiteiten) ManagedServiceIdentity
properties [Vereist] Aanvullende kenmerken van de entiteit. OnlineDeploymentEigenschappen (vereist)

ManagedServiceIdentity

Naam Description Waarde
type Type beheerde service-identiteit (waarbij zowel systemAssigned als UserAssigned zijn toegestaan). 'Geen'
'SystemAssigned'
'SystemAssigned,UserAssigned'
'UserAssigned' (vereist)
userAssignedIdentities De set door de gebruiker toegewezen identiteiten die zijn gekoppeld aan de resource. De userAssignedIdentities-woordenlijstsleutels zijn ARM-resource-id's in de vorm: '/subscriptions/{subscriptionId}/resourceGroups/{resourceGroupName}/providers/Microsoft.ManagedIdentity/userAssignedIdentities/{identityName}. De woordenlijstwaarden kunnen lege objecten ({}) in aanvragen zijn. UserAssignedId-entiteiten

UserAssignedId-entiteiten

Naam Description Waarde
{aangepaste eigenschap} UserAssignedIdentity

UserAssignedIdentity

Dit object bevat geen eigenschappen die tijdens de implementatie moeten worden ingesteld. Alle eigenschappen zijn Alleen-lezen.

OnlineDeploymentEigenschappen

Naam Description Waarde
appInsightsEnabled Als dit waar is, schakelt u Application Insights-logboekregistratie in. booleaans
codeConfiguration Codeconfiguratie voor de eindpuntimplementatie. CodeConfiguration
beschrijving Beschrijving van de eindpuntimplementatie. tekenreeks
egressPublicNetworkAccess Als deze optie is ingeschakeld, staat u openbare netwerktoegang voor uitgaand verkeer toe. Als uitgeschakeld, wordt er een beveiligd uitgaand verkeer gemaakt. Standaardinstelling: ingeschakeld. 'Uitgeschakeld'
Ingeschakeld
environmentId ARM-resource-id van de omgevingsspecificatie voor de eindpuntimplementatie. tekenreeks
environmentVariables Configuratie van omgevingsvariabelen voor de implementatie. EndpointDeploymentPropertiesBaseEnvironmentVariables
instanceType Type rekenproces. tekenreeks
livenessProbe De statustest controleert regelmatig de status van de container. ProbeSettings
model Het URI-pad naar het model. tekenreeks
modelMountPath Het pad voor het koppelen van het model in een aangepaste container. tekenreeks
properties Eigenschappenwoordenlijst. Eigenschappen kunnen worden toegevoegd, maar niet worden verwijderd of gewijzigd. EndpointDeploymentPropertiesBaseProperties
readinessProbe De gereedheidstest valideert of de container gereed is voor verkeer. De eigenschappen en standaardwaarden zijn hetzelfde als de statustest. ProbeSettings
requestSettings Aanvraaginstellingen voor de implementatie. OnlineRequestSettings
scaleSettings Schaalinstellingen voor de implementatie.
Als deze null is of niet is opgegeven,
standaard ingesteld op TargetUtilizationScaleSettings voor KubernetesOnlineDeployment
en op DefaultScaleSettings voor ManagedOnlineDeployment.
OnlineScaleSettings
endpointComputeType Het objecttype instellen Kubernetes
Beheerd (vereist)

CodeConfiguration

Naam Description Waarde
codeId ARM-resource-id van de code-asset. tekenreeks
scoringScript [Vereist] Het script dat moet worden uitgevoerd bij het opstarten. bijvoorbeeld "score.py" tekenreeks (vereist)

Beperkingen:
Minimale lengte = 1
Patroon = [a-zA-Z0-9_]

EndpointDeploymentPropertiesBaseEnvironmentVariables

Naam Description Waarde
{aangepaste eigenschap} tekenreeks
{aangepaste eigenschap} tekenreeks

ProbeSettings

Naam Description Waarde
failureThreshold Het aantal fouten dat moet worden toegestaan voordat de status Niet in orde wordt geretourneerd. int
initialDelay De vertraging voor de eerste test in ISO 8601-indeling. tekenreeks
period De tijdsduur tussen tests in ISO 8601-indeling. tekenreeks
successThreshold Het aantal geslaagde tests voordat de status In orde wordt geretourneerd. int
timeout De testtime-out in ISO 8601-indeling. tekenreeks

EndpointDeploymentPropertiesBaseProperties

Naam Description Waarde
{aangepaste eigenschap} tekenreeks
{aangepaste eigenschap} tekenreeks

OnlineRequestSettings

Naam Description Waarde
maxConcurrentRequestsPerInstance Het aantal maximaal toegestane gelijktijdige aanvragen per knooppunt per implementatie. Standaardwaarde is 1. int
maxQueueWait De maximale tijdsduur dat een aanvraag in de wachtrij blijft in ISO 8601-indeling.
De standaardwaarde is 500 ms.
tekenreeks
requestTimeout De scoretime-out in ISO 8601-indeling.
De standaardwaarde is 5000 ms.
tekenreeks

OnlineScaleSettings

Naam Description Waarde
scaleType Het objecttype instellen Standaard
Doelgebruik (vereist)

DefaultScaleSettings

Naam Description Waarde
scaleType [Vereist] Type algoritme voor het schalen van implementaties 'Standaard' (vereist)

TargetUtilizationScaleSettings

Naam Description Waarde
scaleType [Vereist] Type algoritme voor het schalen van implementaties 'Doelgebruik' (vereist)
maxInstances Het maximum aantal exemplaren waarnaar de implementatie kan worden geschaald. Het quotum wordt gereserveerd voor max_instances. int
minInstances Het minimale aantal exemplaren dat altijd aanwezig moet zijn. int
pollingInterval Het polling-interval in ISO 8691-indeling. Alleen ondersteuning voor duur met precisie zo laag als seconden. tekenreeks
targetUtilizationPercentage Doel-CPU-gebruik voor de automatische schaalaanpassing. int

KubernetesOnlineDeployment

Naam Description Waarde
endpointComputeType [Vereist] Het rekentype van het eindpunt. 'Kubernetes' (vereist)
containerResourceRequirements De resourcevereisten voor de container (cpu en geheugen). ContainerResourceRequirements

ContainerResourceRequirements

Naam Description Waarde
containerResourceLimits Informatie over limiet voor containerresources: ContainerResourceSettings
containerResourceRequests Informatie over aanvraag van containerresource: ContainerResourceSettings

ContainerResourceSettings

Naam Description Waarde
Cpu Aantal vCPU's aanvraag/limiet voor container. Meer informatie:
https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/
tekenreeks
Gpu Aantal aanvraag/limiet voor Nvidia GPU-kaarten voor container. Meer informatie:
https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/
tekenreeks
geheugen Aanvraag/limiet voor geheugengrootte voor container. Meer informatie:
https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/
tekenreeks

ManagedOnlineDeployment

Naam Description Waarde
endpointComputeType [Vereist] Het rekentype van het eindpunt. 'Beheerd' (vereist)

Sku

Naam Description Waarde
capacity Als de SKU uitschalen/inschalen ondersteunt, moet het gehele getal van de capaciteit worden opgenomen. Als uitschalen/inschalen niet mogelijk is voor de resource, wordt dit mogelijk weggelaten. int
gezin Als de service verschillende generaties hardware voor dezelfde SKU heeft, kan die hier worden vastgelegd. tekenreeks
naam De naam van de SKU. Ex - P3. Het is meestal een letter+cijfercode tekenreeks (vereist)
grootte De SKU-grootte. Wanneer het naamveld de combinatie van laag en een andere waarde is, is dit de zelfstandige code. tekenreeks
laag Dit veld moet worden geïmplementeerd door de resourceprovider als de service meer dan één laag heeft, maar niet vereist is voor een PUT. 'Basic'
'Gratis'
Premium
'Standaard'

Resourcedefinitie van ARM-sjabloon

Het resourcetype werkruimten/onlineEindpunten/implementaties kan worden geïmplementeerd met bewerkingen die zijn gericht op:

Zie wijzigingenlogboek voor een lijst met gewijzigde eigenschappen in elke API-versie.

Resource-indeling

Als u een resource Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments wilt maken, voegt u de volgende JSON toe aan uw sjabloon.

{
  "type": "Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments",
  "apiVersion": "2022-06-01-preview",
  "name": "string",
  "location": "string",
  "tags": {
    "tagName1": "tagValue1",
    "tagName2": "tagValue2"
  },
  "sku": {
    "capacity": "int",
    "family": "string",
    "name": "string",
    "size": "string",
    "tier": "string"
  },
  "kind": "string",
  "identity": {
    "type": "string",
    "userAssignedIdentities": {
      "{customized property}": {}
    }
  },
  "properties": {
    "appInsightsEnabled": "bool",
    "codeConfiguration": {
      "codeId": "string",
      "scoringScript": "string"
    },
    "description": "string",
    "egressPublicNetworkAccess": "string",
    "environmentId": "string",
    "environmentVariables": {
      "{customized property}": "string",
      "{customized property}": "string"
    },
    "instanceType": "string",
    "livenessProbe": {
      "failureThreshold": "int",
      "initialDelay": "string",
      "period": "string",
      "successThreshold": "int",
      "timeout": "string"
    },
    "model": "string",
    "modelMountPath": "string",
    "properties": {
      "{customized property}": "string",
      "{customized property}": "string"
    },
    "readinessProbe": {
      "failureThreshold": "int",
      "initialDelay": "string",
      "period": "string",
      "successThreshold": "int",
      "timeout": "string"
    },
    "requestSettings": {
      "maxConcurrentRequestsPerInstance": "int",
      "maxQueueWait": "string",
      "requestTimeout": "string"
    },
    "scaleSettings": {
      "scaleType": "string"
      // For remaining properties, see OnlineScaleSettings objects
    },
    "endpointComputeType": "string"
    // For remaining properties, see OnlineDeploymentProperties objects
  }
}

OnlineDeploymentProperties-objecten

Stel de eigenschap endpointComputeType in om het type object op te geven.

Gebruik voor Kubernetes:

  "endpointComputeType": "Kubernetes",
  "containerResourceRequirements": {
    "containerResourceLimits": {
      "cpu": "string",
      "gpu": "string",
      "memory": "string"
    },
    "containerResourceRequests": {
      "cpu": "string",
      "gpu": "string",
      "memory": "string"
    }
  }

Gebruik voor Beheerd:

  "endpointComputeType": "Managed"

OnlineScaleSettings-objecten

Stel de eigenschap scaleType in om het type object op te geven.

Voor Standaard gebruikt u:

  "scaleType": "Default"

Gebruik voor TargetUtilization:

  "scaleType": "TargetUtilization",
  "maxInstances": "int",
  "minInstances": "int",
  "pollingInterval": "string",
  "targetUtilizationPercentage": "int"

Eigenschapswaarden

werkruimten/onlineEindpunten/implementaties

Naam Description Waarde
type Het resourcetype 'Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments'
apiVersion De resource-API-versie '2022-06-01-preview'
naam De resourcenaam

Meer informatie over het instellen van namen en typen voor onderliggende resources in JSON ARM-sjablonen.
tekenreeks (vereist)
location De geografische locatie waar de resource zich bevindt tekenreeks (vereist)
tags Resourcetags. Woordenlijst met tagnamen en -waarden. Tags in sjablonen bekijken
sku SKU-gegevens vereist voor het ARM-contract voor automatisch schalen. SKU
Soort Metagegevens die worden gebruikt door portal/hulpprogramma's/enzovoort om verschillende UX-ervaringen weer te geven voor resources van hetzelfde type. tekenreeks
identity Beheerde service-identiteit (door het systeem toegewezen en/of door de gebruiker toegewezen identiteiten) ManagedServiceIdentity
properties [Vereist] Aanvullende kenmerken van de entiteit. OnlineDeploymentProperties (vereist)

ManagedServiceIdentity

Naam Description Waarde
type Type beheerde service-identiteit (waarbij zowel SystemAssigned als UserAssigned zijn toegestaan). 'Geen'
'SystemAssigned'
'SystemAssigned,UserAssigned'
'UserAssigned' (vereist)
userAssignedIdentities De set door de gebruiker toegewezen identiteiten die aan de resource zijn gekoppeld. De userAssignedIdentities-woordenlijstsleutels zijn ARM-resource-id's in de volgende notatie: '/subscriptions/{subscriptionId}/resourceGroups/{resourceGroupName}/providers/Microsoft.ManagedIdentity/userAssignedIdentities/{identityName}. De woordenlijstwaarden kunnen lege objecten ({}) in aanvragen zijn. UserAssignedId-entiteiten

UserAssignedId-entiteiten

Naam Description Waarde
{aangepaste eigenschap} UserAssignedIdentity

UserAssignedIdentity

Dit object bevat geen eigenschappen die tijdens de implementatie moeten worden ingesteld. Alle eigenschappen zijn ReadOnly.

OnlineDeploymentEigenschappen

Naam Description Waarde
appInsightsEnabled Als dit waar is, schakelt u Application Insights-logboekregistratie in. booleaans
codeConfiguration Codeconfiguratie voor de eindpuntimplementatie. CodeConfiguration
beschrijving Beschrijving van de eindpuntimplementatie. tekenreeks
egressPublicNetworkAccess Als deze optie is ingeschakeld, staat u openbare netwerktoegang voor uitgaand verkeer toe. Als uitgeschakeld, zorgt dit voor een beveiligd uitgaand verkeer. Standaardinstelling: ingeschakeld. 'Uitgeschakeld'
Ingeschakeld
environmentId ARM-resource-id van de omgevingsspecificatie voor de eindpuntimplementatie. tekenreeks
environmentVariables Configuratie van omgevingsvariabelen voor de implementatie. EndpointDeploymentPropertiesBaseEnvironmentVariables
instanceType Type rekenproces. tekenreeks
livenessProbe De statustest controleert regelmatig de status van de container. ProbeSettings
model Het URI-pad naar het model. tekenreeks
modelMountPath Het pad voor het koppelen van het model in een aangepaste container. tekenreeks
properties Woordenlijst met eigenschappen. Eigenschappen kunnen worden toegevoegd, maar niet worden verwijderd of gewijzigd. EndpointDeploymentPropertiesBaseProperties
readinessProbe De gereedheidstest valideert of de container gereed is om verkeer te verwerken. De eigenschappen en standaardwaarden zijn hetzelfde als de activiteitstest. ProbeSettings
requestSettings Aanvraaginstellingen voor de implementatie. OnlineRequestSettings
scaleSettings Schaalinstellingen voor de implementatie.
Als deze null is of niet is opgegeven,
standaard ingesteld op TargetUtilizationScaleSettings voor KubernetesOnlineDeployment
en naar DefaultScaleSettings voor ManagedOnlineDeployment.
OnlineScaleSettings
endpointComputeType Het objecttype instellen Kubernetes
Beheerd (vereist)

CodeConfiguration

Naam Description Waarde
codeId ARM-resource-id van de code-asset. tekenreeks
scoringScript [Vereist] Het script dat moet worden uitgevoerd bij het opstarten. bijvoorbeeld "score.py" tekenreeks (vereist)

Beperkingen:
Minimale lengte = 1
Patroon = [a-zA-Z0-9_]

EndpointDeploymentPropertiesBaseEnvironmentVariables

Naam Description Waarde
{aangepaste eigenschap} tekenreeks
{aangepaste eigenschap} tekenreeks

ProbeSettings

Naam Description Waarde
failureThreshold Het aantal fouten dat moet worden toegestaan voordat een beschadigde status wordt geretourneerd. int
initialDelay De vertraging voor de eerste test in ISO 8601-indeling. tekenreeks
period De tijdsduur tussen tests in ISO 8601-indeling. tekenreeks
successThreshold Het aantal geslaagde tests voordat een status in orde wordt geretourneerd. int
timeout De testtime-out in ISO 8601-indeling. tekenreeks

EndpointDeploymentPropertiesBaseProperties

Naam Description Waarde
{aangepaste eigenschap} tekenreeks
{aangepaste eigenschap} tekenreeks

OnlineRequestSettings

Naam Description Waarde
maxConcurrentRequestsPerInstance Het aantal maximaal toegestane gelijktijdige aanvragen per knooppunt per implementatie. Standaardwaarde is 1. int
maxQueueWait De maximale hoeveelheid tijd dat een aanvraag in de wachtrij blijft in ISO 8601-indeling.
De standaardwaarde is 500 ms.
tekenreeks
requestTimeout De time-out voor scores in ISO 8601-indeling.
De standaardwaarde is 5000 ms.
tekenreeks

OnlineScaleSettings

Naam Description Waarde
scaleType Het objecttype instellen Standaard
TargetUtilization (vereist)

DefaultScaleSettings

Naam Description Waarde
scaleType [Vereist] Type algoritme voor het schalen van implementaties 'Standaard' (vereist)

TargetUtilizationScaleSettings

Naam Description Waarde
scaleType [Vereist] Type algoritme voor het schalen van implementaties 'TargetUtilization' (vereist)
maxInstances Het maximum aantal exemplaren waarnaar de implementatie kan worden geschaald. Het quotum wordt gereserveerd voor max_instances. int
minInstances Het minimale aantal exemplaren dat altijd aanwezig moet zijn. int
pollingInterval Het polling-interval in ISO 8691-indeling. Alleen ondersteuning voor duur met een nauwkeurigheid van slechts seconden. tekenreeks
targetUtilizationPercentage Doel-CPU-gebruik voor de automatische schaalaanpassing. int

KubernetesOnlineDeployment

Naam Description Waarde
endpointComputeType [Vereist] Het rekentype van het eindpunt. 'Kubernetes' (vereist)
containerResourceRequirements De resourcevereisten voor de container (CPU en geheugen). ContainerResourceRequirements

ContainerResourceRequirements

Naam Description Waarde
containerResourceLimits Informatie over containerresourcelimiet: ContainerResourceSettings
containerResourceRequests Informatie over aanvraag van containerresource: ContainerResourceSettings

ContainerResourceSettings

Naam Description Waarde
Cpu Aantal vCPU's aanvraag/limiet voor container. Meer informatie:
https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/
tekenreeks
Gpu Aantal Nvidia GPU-kaarten aanvraag/limiet voor container. Meer informatie:
https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/
tekenreeks
geheugen Aanvraag/limiet voor geheugengrootte voor container. Meer informatie:
https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/
tekenreeks

ManagedOnlineDeployment

Naam Description Waarde
endpointComputeType [Vereist] Het rekentype van het eindpunt. 'Beheerd' (vereist)

Sku

Naam Description Waarde
capacity Als de SKU uitschalen/inschalen ondersteunt, moet het gehele getal van de capaciteit worden opgenomen. Als uitschalen/inschalen niet mogelijk is voor de resource, kan dit worden weggelaten. int
gezin Als de service verschillende generaties hardware heeft, voor dezelfde SKU, kan dat hier worden vastgelegd. tekenreeks
naam De naam van de SKU. Ex - P3. Het is meestal een letter+cijfercode tekenreeks (vereist)
grootte De SKU-grootte. Wanneer het naamveld de combinatie van laag en een andere waarde is, is dit de zelfstandige code. tekenreeks
laag Dit veld moet worden geïmplementeerd door de resourceprovider als de service meer dan één laag heeft, maar niet vereist is voor een PUT. 'Basic'
'Gratis'
'Premium'
'Standaard'

Terraform-resourcedefinitie (AzAPI-provider)

Het resourcetype werkruimten/onlineEindpunten/implementaties kan worden geïmplementeerd met bewerkingen die zijn gericht op:

  • Resourcegroepen

Zie wijzigingenlogboek voor een lijst met gewijzigde eigenschappen in elke API-versie.

Resource-indeling

Als u een resource Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments wilt maken, voegt u de volgende Terraform toe aan uw sjabloon.

resource "azapi_resource" "symbolicname" {
  type = "Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments@2022-06-01-preview"
  name = "string"
  location = "string"
  parent_id = "string"
  tags = {
    tagName1 = "tagValue1"
    tagName2 = "tagValue2"
  }
  identity {
    type = "string"
    identity_ids = []
  }
  body = jsonencode({
    properties = {
      appInsightsEnabled = bool
      codeConfiguration = {
        codeId = "string"
        scoringScript = "string"
      }
      description = "string"
      egressPublicNetworkAccess = "string"
      environmentId = "string"
      environmentVariables = {
        {customized property} = "string"
        {customized property} = "string"
      }
      instanceType = "string"
      livenessProbe = {
        failureThreshold = int
        initialDelay = "string"
        period = "string"
        successThreshold = int
        timeout = "string"
      }
      model = "string"
      modelMountPath = "string"
      properties = {
        {customized property} = "string"
        {customized property} = "string"
      }
      readinessProbe = {
        failureThreshold = int
        initialDelay = "string"
        period = "string"
        successThreshold = int
        timeout = "string"
      }
      requestSettings = {
        maxConcurrentRequestsPerInstance = int
        maxQueueWait = "string"
        requestTimeout = "string"
      }
      scaleSettings = {
        scaleType = "string"
        // For remaining properties, see OnlineScaleSettings objects
      }
      endpointComputeType = "string"
      // For remaining properties, see OnlineDeploymentProperties objects
    }
    sku = {
      capacity = int
      family = "string"
      name = "string"
      size = "string"
      tier = "string"
    }
    kind = "string"
  })
}

OnlineDeploymentProperties-objecten

Stel de eigenschap endpointComputeType in om het type object op te geven.

Gebruik voor Kubernetes:

  endpointComputeType = "Kubernetes"
  containerResourceRequirements = {
    containerResourceLimits = {
      cpu = "string"
      gpu = "string"
      memory = "string"
    }
    containerResourceRequests = {
      cpu = "string"
      gpu = "string"
      memory = "string"
    }
  }

Gebruik voor Beheerd:

  endpointComputeType = "Managed"

OnlineScaleSettings-objecten

Stel de eigenschap scaleType in om het type object op te geven.

Voor Standaard gebruikt u:

  scaleType = "Default"

Gebruik voor TargetUtilization:

  scaleType = "TargetUtilization"
  maxInstances = int
  minInstances = int
  pollingInterval = "string"
  targetUtilizationPercentage = int

Eigenschapswaarden

werkruimten/onlineEindpunten/implementaties

Naam Description Waarde
type Het resourcetype "Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments@2022-06-01-preview"
naam De resourcenaam tekenreeks (vereist)
location De geografische locatie waar de resource zich bevindt tekenreeks (vereist)
parent_id De id van de resource die het bovenliggende item voor deze resource is. Id voor resource van het type: onlineEndpoints
tags Resourcetags. Woordenlijst met tagnamen en -waarden.
sku SKU-gegevens vereist voor het ARM-contract voor automatisch schalen. SKU
Soort Metagegevens die worden gebruikt door portal/tooling/etc om verschillende UX-ervaringen weer te geven voor resources van hetzelfde type. tekenreeks
identity Beheerde service-identiteit (door het systeem toegewezen en/of door de gebruiker toegewezen identiteiten) ManagedServiceIdentity
properties [Vereist] Aanvullende kenmerken van de entiteit. OnlineDeploymentEigenschappen (vereist)

ManagedServiceIdentity

Naam Description Waarde
type Type beheerde service-identiteit (waarbij zowel systemAssigned als UserAssigned zijn toegestaan). "SystemAssigned"
"SystemAssigned,UserAssigned"
'UserAssigned' (vereist)
identity_ids De set door de gebruiker toegewezen identiteiten die zijn gekoppeld aan de resource. De userAssignedIdentities-woordenlijstsleutels zijn ARM-resource-id's in de vorm: '/subscriptions/{subscriptionId}/resourceGroups/{resourceGroupName}/providers/Microsoft.ManagedIdentity/userAssignedIdentities/{identityName}. De woordenlijstwaarden kunnen lege objecten ({}) in aanvragen zijn. Matrix met gebruikersidentiteits-id's.

UserAssignedId-entiteiten

Naam Description Waarde
{aangepaste eigenschap} UserAssignedIdentity

UserAssignedIdentity

Dit object bevat geen eigenschappen die tijdens de implementatie moeten worden ingesteld. Alle eigenschappen zijn Alleen-lezen.

OnlineDeploymentEigenschappen

Naam Description Waarde
appInsightsEnabled Als dit waar is, schakelt u Application Insights-logboekregistratie in. booleaans
codeConfiguration Codeconfiguratie voor de eindpuntimplementatie. CodeConfiguration
beschrijving Beschrijving van de eindpuntimplementatie. tekenreeks
egressPublicNetworkAccess Als deze optie is ingeschakeld, staat u openbare netwerktoegang voor uitgaand verkeer toe. Als uitgeschakeld, zorgt dit voor een beveiligd uitgaand verkeer. Standaardinstelling: ingeschakeld. "Uitgeschakeld"
"Ingeschakeld"
environmentId ARM-resource-id van de omgevingsspecificatie voor de eindpuntimplementatie. tekenreeks
environmentVariables Configuratie van omgevingsvariabelen voor de implementatie. EndpointDeploymentPropertiesBaseEnvironmentVariables
instanceType Type rekenproces. tekenreeks
livenessProbe De statustest controleert regelmatig de status van de container. ProbeSettings
model Het URI-pad naar het model. tekenreeks
modelMountPath Het pad voor het koppelen van het model in een aangepaste container. tekenreeks
properties Woordenlijst met eigenschappen. Eigenschappen kunnen worden toegevoegd, maar niet worden verwijderd of gewijzigd. EndpointDeploymentPropertiesBaseProperties
readinessProbe De gereedheidstest valideert of de container gereed is om verkeer te verwerken. De eigenschappen en standaardwaarden zijn hetzelfde als de activiteitstest. ProbeSettings
requestSettings Aanvraaginstellingen voor de implementatie. OnlineRequestSettings
scaleSettings Schaalinstellingen voor de implementatie.
Als deze null is of niet is opgegeven,
standaard ingesteld op TargetUtilizationScaleSettings voor KubernetesOnlineDeployment
en naar DefaultScaleSettings voor ManagedOnlineDeployment.
OnlineScaleSettings
endpointComputeType Het objecttype instellen Kubernetes
Beheerd (vereist)

CodeConfiguration

Naam Description Waarde
codeId ARM-resource-id van de code-asset. tekenreeks
scoringScript [Vereist] Het script dat moet worden uitgevoerd bij het opstarten. bijvoorbeeld "score.py" tekenreeks (vereist)

Beperkingen:
Minimale lengte = 1
Patroon = [a-zA-Z0-9_]

EndpointDeploymentPropertiesBaseEnvironmentVariables

Naam Description Waarde
{aangepaste eigenschap} tekenreeks
{aangepaste eigenschap} tekenreeks

ProbeSettings

Naam Description Waarde
failureThreshold Het aantal fouten dat moet worden toegestaan voordat een beschadigde status wordt geretourneerd. int
initialDelay De vertraging voor de eerste test in ISO 8601-indeling. tekenreeks
period De tijdsduur tussen tests in ISO 8601-indeling. tekenreeks
successThreshold Het aantal geslaagde tests voordat een status in orde wordt geretourneerd. int
timeout De testtime-out in ISO 8601-indeling. tekenreeks

EndpointDeploymentPropertiesBaseProperties

Naam Description Waarde
{aangepaste eigenschap} tekenreeks
{aangepaste eigenschap} tekenreeks

OnlineRequestSettings

Naam Description Waarde
maxConcurrentRequestsPerInstance Het aantal maximaal toegestane gelijktijdige aanvragen per knooppunt per implementatie. Standaardwaarde is 1. int
maxQueueWait De maximale hoeveelheid tijd dat een aanvraag in de wachtrij blijft in ISO 8601-indeling.
De standaardwaarde is 500 ms.
tekenreeks
requestTimeout De time-out voor scores in ISO 8601-indeling.
De standaardwaarde is 5000 ms.
tekenreeks

OnlineScaleSettings

Naam Description Waarde
scaleType Het objecttype instellen Standaard
TargetUtilization (vereist)

DefaultScaleSettings

Naam Description Waarde
scaleType [Vereist] Type algoritme voor het schalen van implementaties 'Standaard' (vereist)

TargetUtilizationScaleSettings

Naam Description Waarde
scaleType [Vereist] Type algoritme voor het schalen van implementaties 'TargetUtilization' (vereist)
maxInstances Het maximum aantal exemplaren waarnaar de implementatie kan worden geschaald. Het quotum wordt gereserveerd voor max_instances. int
minInstances Het minimale aantal exemplaren dat altijd aanwezig moet zijn. int
pollingInterval Het polling-interval in ISO 8691-indeling. Alleen ondersteuning voor duur met een nauwkeurigheid van slechts seconden. tekenreeks
targetUtilizationPercentage Doel-CPU-gebruik voor de automatische schaalaanpassing. int

KubernetesOnlineDeployment

Naam Description Waarde
endpointComputeType [Vereist] Het rekentype van het eindpunt. 'Kubernetes' (vereist)
containerResourceRequirements De resourcevereisten voor de container (CPU en geheugen). ContainerResourceRequirements

ContainerResourceRequirements

Naam Description Waarde
containerResourceLimits Informatie over containerresourcelimiet: ContainerResourceSettings
containerResourceRequests Informatie over aanvraag van containerresource: ContainerResourceSettings

ContainerResourceSettings

Naam Description Waarde
Cpu Aantal vCPU's aanvraag/limiet voor container. Meer informatie:
https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/
tekenreeks
Gpu Aantal Nvidia GPU-kaarten aanvraag/limiet voor container. Meer informatie:
https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/
tekenreeks
geheugen Aanvraag/limiet voor geheugengrootte voor container. Meer informatie:
https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/
tekenreeks

ManagedOnlineDeployment

Naam Description Waarde
endpointComputeType [Vereist] Het rekentype van het eindpunt. 'Beheerd' (vereist)

Sku

Naam Description Waarde
capacity Als de SKU uitschalen/inschalen ondersteunt, moet het gehele getal van de capaciteit worden opgenomen. Als uitschalen/inschalen niet mogelijk is voor de resource, kan dit worden weggelaten. int
gezin Als de service verschillende generaties hardware voor dezelfde SKU heeft, kan die hier worden vastgelegd. tekenreeks
naam De naam van de SKU. Ex - P3. Het is meestal een letter+cijfercode tekenreeks (vereist)
grootte De SKU-grootte. Wanneer het naamveld de combinatie van laag en een andere waarde is, is dit de zelfstandige code. tekenreeks
laag Dit veld moet worden geïmplementeerd door de resourceprovider als de service meer dan één laag heeft, maar niet vereist is voor een PUT. "Basis"
"Gratis"
"Premium"
"Standaard"