Dela via


Microsoft.MachineLearningServices-arbetsytor/onlineEndpoints/deployments 2021-03-01-preview

Bicep-resursdefinition

Resurstypen arbetsytor/onlineEndpoints/distributioner kan distribueras med åtgärder som mål:

En lista över ändrade egenskaper i varje API-version finns i ändringsloggen.

Resursformat

Om du vill skapa en Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments-resurs lägger du till följande Bicep i mallen.

resource symbolicname 'Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments@2021-03-01-preview' = {
  parent: resourceSymbolicName
  identity: {
    type: 'string'
    userAssignedIdentities: {
      {customized property}: {
        clientId: 'string'
        principalId: 'string'
      }
    }
  }
  kind: 'string'
  location: 'string'
  name: 'string'
  properties: {
    appInsightsEnabled: bool
    codeConfiguration: {
      codeId: 'string'
      scoringScript: 'string'
    }
    description: 'string'
    environmentId: 'string'
    environmentVariables: {
      {customized property}: 'string'
    }
    livenessProbe: {
      failureThreshold: int
      initialDelay: 'string'
      period: 'string'
      successThreshold: int
      timeout: 'string'
    }
    model: {
      referenceType: 'string'
      // For remaining properties, see AssetReferenceBase objects
    }
    properties: {
      {customized property}: 'string'
    }
    requestSettings: {
      maxConcurrentRequestsPerInstance: int
      maxQueueWait: 'string'
      requestTimeout: 'string'
    }
    scaleSettings: {
      maxInstances: int
      minInstances: int
      scaleType: 'string'
      // For remaining properties, see OnlineScaleSettings objects
    }
    endpointComputeType: 'string'
    // For remaining properties, see OnlineDeployment objects
  }
  tags: {
    {customized property}: 'string'
  }
}

OnlineScaleSettings-objekt

Ange egenskapen scaleType för att ange typ av objekt.

För Auto använder du:

{
  pollingInterval: 'string'
  scaleType: 'Auto'
  targetUtilizationPercentage: int
}

För Manuell använder du:

{
  instanceCount: int
  scaleType: 'Manual'
}

OnlineDeployment-objekt

Ange egenskapen endpointComputeType för att ange typ av objekt.

För K8S använder du:

{
  containerResourceRequirements: {
    cpu: int
    cpuLimit: int
    fpga: int
    gpu: int
    memoryInGB: int
    memoryInGBLimit: int
  }
  endpointComputeType: 'K8S'
}

För Hanterad använder du:

{
  endpointComputeType: 'Managed'
  instanceType: 'string'
  readinessProbe: {
    failureThreshold: int
    initialDelay: 'string'
    period: 'string'
    successThreshold: int
    timeout: 'string'
  }
}

AssetReferenceBase-objekt

Ange egenskapen referenceType för att ange typ av objekt.

För DataPath använder du:

{
  datastoreId: 'string'
  path: 'string'
  referenceType: 'DataPath'
}

För ID använder du:

{
  assetId: 'string'
  referenceType: 'Id'
}

För OutputPath använder du:

{
  jobId: 'string'
  path: 'string'
  referenceType: 'OutputPath'
}

Egenskapsvärden

Microsoft.MachineLearningTjänster/arbetsytor/onlineSlutpunkter/utplaceringar

Namn Beskrivning Värde
identitet Tjänstidentitet som är associerad med en resurs. ResourceIdentity (på engelska)
typ Metadata som används av portal/verktyg/etc för att återge olika UX-funktioner för resurser av samma typ. snöre
läge Den geo-plats där resursen finns sträng (krävs)
namn Resursnamnet sträng

Begränsningar:
Mönster = ^[a-zA-Z0-9][a-zA-Z0-9\-_]{0,254}$ (krävs)
förälder I Bicep kan du ange den överordnade resursen för en underordnad resurs. Du behöver bara lägga till den här egenskapen när den underordnade resursen deklareras utanför den överordnade resursen.

Mer information finns i Underordnad resurs utanför den överordnade resursen.
Symboliskt namn för resurs av typen: arbetsytor/onlineSlutpunkter
egenskaper [Krävs] Ytterligare attribut för entiteten. OnlineDeployment (krävs)
Taggar Resursetiketter Ordlista med taggnamn och värden. Se Taggar i mallar

AssetReferenceBase (på engelska)

Namn Beskrivning Värde
referenstyp Ange till DataPath för typen DataPathAssetReference. Ange till ID för typ IdAssetReference. Ange till OutputPath för typen OutputPathAssetReference. "DataPath"
"ID"
"OutputPath" (krävs)

AutoskalningInställningar

Namn Beskrivning Värde
pollingInterval Avsökningsintervallet i ISO 8691-format. Stöder endast varaktighet med så låg precision som Sekunder. snöre
scaleType (på engelska) [Krävs] Typ av distributionsskalningsalgoritm "Auto" (krävs)
targetUtilizationPercentage Mål-CPU-användning för autoskalning. Int

CodeConfiguration (på engelska)

Namn Beskrivning Värde
codeId ARM-resurs-ID för kodtillgången. snöre
scoringscript [Krävs] Skriptet som ska köras vid start. T.ex. "score.py" sträng

Begränsningar:
Min längd = 1
Mönster = [a-zA-Z0-9_] (krävs)

ContainerResourceRequirements (på engelska)

Namn Beskrivning Värde
CPU Den minsta mängd processorkärnor som ska användas av containern. Mer information:
https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/
Int
cpuLimit Den maximala mängden processorkärnor som tillåts användas av containern. Mer information:
https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/
Int
FPGA Antalet FPGA PCIE-enheter som exponeras för containern. Måste vara flera av 2. Int
GPU Antalet GPU-kärnor i containern. Int
memoryInGB (på engelska) Den minsta mängd minne (i GB) som ska användas av containern. Mer information:
https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/
Int
memoryInGBLimit Den maximala mängden minne (i GB) som tillåts användas av containern. Mer information:
https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/
Int

DataPathAssetReference (på engelska)

Namn Beskrivning Värde
datastoreId ARM-resurs-ID för det datalager där tillgången finns. snöre
väg Sökvägen till filen/katalogen i dataarkivet. snöre
referenstyp [Krävs] Anger typ av tillgångsreferens. "DataPath" (krävs)

IdAssetReference (på engelska)

Namn Beskrivning Värde
assetId [Krävs] ARM-resurs-ID för tillgången. sträng

Begränsningar:
Mönster = [a-zA-Z0-9_] (krävs)
referenstyp [Krävs] Anger typ av tillgångsreferens. "ID" (krävs)

K8SOnlineDeployment

Namn Beskrivning Värde
containerResourceRequirements Resurskrav för varje containerinstans i en onlinedistribution. ContainerResourceRequirements (på engelska)
endpointComputeType [Krävs] Slutpunktens beräkningstyp. "K8S" (krävs)

ManagedOnlineDeployment (HanteradOnlineDistribution)

Namn Beskrivning Värde
endpointComputeType [Krävs] Slutpunktens beräkningstyp. "Hanterad" (krävs)
instanceType Typ av beräkningsinstans. snöre
beredskapSond Konfiguration av distributionscontainerns liveness/readiness probe. Sond-inställningar

ManuellScaleSettings (ManuellSkala)

Namn Beskrivning Värde
antal instanser Fast antal instanser för den här distributionen. Int
scaleType (på engelska) [Krävs] Typ av distributionsskalningsalgoritm "Manuell" (krävs)

Distribution på nätet

Namn Beskrivning Värde
appInsightsEnabled Om det är sant aktiverar du Application Insights-loggning. Bool
codeConfiguration Kodkonfiguration för slutpunktsdistributionen. CodeConfiguration (på engelska)
beskrivning Beskrivning av slutpunktsdistributionen. snöre
endpointComputeType Ange till K8S för typ K8SOnlineDeployment. Ange till Hanterad för typen ManagedOnlineDeployment. "K8S"
"Hanterad" (krävs)
environmentId ARM-resurs-ID för miljöspecifikationen för slutpunktsdistributionen. snöre
miljövariabler Konfiguration av miljövariabler för distributionen. OnlineDeploymentEnvironmentVariables
livenessProbe Konfiguration av distributionscontainerns liveness/readiness probe. Sond-inställningar
modell Referens till modelltillgången för slutpunktsdistributionen. AssetReferenceBase (på engelska)
egenskaper Egenskapsordlista. Egenskaper kan läggas till, men inte tas bort eller ändras. OnlineDeploymentProperties
requestSettings (begäran) Konfiguration av onlinedistributionsbedömningsbegäranden. OnlineRequestSettings (på engelska)
skalinställningar Skalningskonfiguration för onlinedistribution. OnlineScaleSettings (på engelska)

OnlineDeploymentEnvironmentVariables

Namn Beskrivning Värde

OnlineDeploymentProperties

Namn Beskrivning Värde

OnlineRequestSettings (på engelska)

Namn Beskrivning Värde
maxConcurrentRequestsPerInstance Antalet begäranden som tillåts köa samtidigt för den här distributionen. Int
maxQueueWait Den maximala köväntetiden i ISO 8601-format. Stöder millisekunders precision. snöre
requestTimeout Tidsgränsen för begäran i ISO 8601-format. Stöder millisekunders precision. snöre

OnlineScaleSettings (på engelska)

Namn Beskrivning Värde
maxInstances Maximalt antal instanser för den här distributionen. Int
minInstances (minInstanser) Minsta antal instanser för den här distributionen. Int
scaleType (på engelska) Ange till Auto för typen AutoScaleSettings. Ange till "Manuell" för typen ManualScaleSettings. "Auto"
"Manuell" (krävs)

OutputPathAssetReference (på engelska)

Namn Beskrivning Värde
jobId ARM-resurs-ID för jobbet. snöre
väg Sökvägen till filen/katalogen i jobbutdata. snöre
referenstyp [Krävs] Anger typ av tillgångsreferens. "OutputPath" (krävs)

Sond-inställningar

Namn Beskrivning Värde
failureThreshold (på engelska) Antalet fel som tillåts innan statusen inte är felfri returneras. Int
initialDelay (initialt) Fördröjningen före den första avsökningen i ISO 8601-format. snöre
punkt Tiden mellan avsökningar i ISO 8601-format. snöre
framgångströskel Antalet lyckade avsökningar innan en felfri status returneras. Int
vilopaus Tidsgränsen för avsökningen i ISO 8601-format. snöre

ResourceIdentity (på engelska)

Namn Beskrivning Värde
typ Definierar värden för en ResourceIdentity-typ. "Ingen"
"SystemAssigned"
"SystemAssigned,UserAssigned"
"UserAssigned"
användartilldelade identiteter Ordlista över användartilldelade identiteter, nyckeln är ARM-resurs-ID för UAI. ResourceIdentityUserAssignedIdentiteter

ResourceIdentityUserAssignedIdentiteter

Namn Beskrivning Värde

Spårade resurstaggar

Namn Beskrivning Värde

UserAssignedIdentityMeta

Namn Beskrivning Värde
clientId Även kallat program-ID, en unik identifierare som genereras av Azure AD och som är kopplad till ett program och tjänstens huvudnamn under den första etableringen. snöre
huvudId Objekt-ID för tjänstens huvudnamnsobjekt för din hanterade identitet som används för att bevilja rollbaserad åtkomst till en Azure-resurs. snöre

Resursdefinition för ARM-mall

Resurstypen arbetsytor/onlineEndpoints/distributioner kan distribueras med åtgärder som mål:

En lista över ändrade egenskaper i varje API-version finns i ändringsloggen.

Resursformat

Om du vill skapa en Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments-resurs lägger du till följande JSON i mallen.

{
  "type": "Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments",
  "apiVersion": "2021-03-01-preview",
  "name": "string",
  "identity": {
    "type": "string",
    "userAssignedIdentities": {
      "{customized property}": {
        "clientId": "string",
        "principalId": "string"
      }
    }
  },
  "kind": "string",
  "location": "string",
  "properties": {
    "appInsightsEnabled": "bool",
    "codeConfiguration": {
      "codeId": "string",
      "scoringScript": "string"
    },
    "description": "string",
    "environmentId": "string",
    "environmentVariables": {
      "{customized property}": "string"
    },
    "livenessProbe": {
      "failureThreshold": "int",
      "initialDelay": "string",
      "period": "string",
      "successThreshold": "int",
      "timeout": "string"
    },
    "model": {
      "referenceType": "string"
      // For remaining properties, see AssetReferenceBase objects
    },
    "properties": {
      "{customized property}": "string"
    },
    "requestSettings": {
      "maxConcurrentRequestsPerInstance": "int",
      "maxQueueWait": "string",
      "requestTimeout": "string"
    },
    "scaleSettings": {
      "maxInstances": "int",
      "minInstances": "int",
      "scaleType": "string"
      // For remaining properties, see OnlineScaleSettings objects
    },
    "endpointComputeType": "string"
    // For remaining properties, see OnlineDeployment objects
  },
  "tags": {
    "{customized property}": "string"
  }
}

OnlineScaleSettings-objekt

Ange egenskapen scaleType för att ange typ av objekt.

För Auto använder du:

{
  "pollingInterval": "string",
  "scaleType": "Auto",
  "targetUtilizationPercentage": "int"
}

För Manuell använder du:

{
  "instanceCount": "int",
  "scaleType": "Manual"
}

OnlineDeployment-objekt

Ange egenskapen endpointComputeType för att ange typ av objekt.

För K8S använder du:

{
  "containerResourceRequirements": {
    "cpu": "int",
    "cpuLimit": "int",
    "fpga": "int",
    "gpu": "int",
    "memoryInGB": "int",
    "memoryInGBLimit": "int"
  },
  "endpointComputeType": "K8S"
}

För Hanterad använder du:

{
  "endpointComputeType": "Managed",
  "instanceType": "string",
  "readinessProbe": {
    "failureThreshold": "int",
    "initialDelay": "string",
    "period": "string",
    "successThreshold": "int",
    "timeout": "string"
  }
}

AssetReferenceBase-objekt

Ange egenskapen referenceType för att ange typ av objekt.

För DataPath använder du:

{
  "datastoreId": "string",
  "path": "string",
  "referenceType": "DataPath"
}

För ID använder du:

{
  "assetId": "string",
  "referenceType": "Id"
}

För OutputPath använder du:

{
  "jobId": "string",
  "path": "string",
  "referenceType": "OutputPath"
}

Egenskapsvärden

Microsoft.MachineLearningTjänster/arbetsytor/onlineSlutpunkter/utplaceringar

Namn Beskrivning Värde
apiVersion API-versionen "2021-03-01-preview"
identitet Tjänstidentitet som är associerad med en resurs. ResourceIdentity (på engelska)
typ Metadata som används av portal/verktyg/etc för att återge olika UX-funktioner för resurser av samma typ. snöre
läge Den geo-plats där resursen finns sträng (krävs)
namn Resursnamnet sträng

Begränsningar:
Mönster = ^[a-zA-Z0-9][a-zA-Z0-9\-_]{0,254}$ (krävs)
egenskaper [Krävs] Ytterligare attribut för entiteten. OnlineDeployment (krävs)
Taggar Resursetiketter Ordlista med taggnamn och värden. Se Taggar i mallar
typ Resurstypen "Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments"

AssetReferenceBase (på engelska)

Namn Beskrivning Värde
referenstyp Ange till DataPath för typen DataPathAssetReference. Ange till ID för typ IdAssetReference. Ange till OutputPath för typen OutputPathAssetReference. "DataPath"
"ID"
"OutputPath" (krävs)

AutoskalningInställningar

Namn Beskrivning Värde
pollingInterval Avsökningsintervallet i ISO 8691-format. Stöder endast varaktighet med så låg precision som Sekunder. snöre
scaleType (på engelska) [Krävs] Typ av distributionsskalningsalgoritm "Auto" (krävs)
targetUtilizationPercentage Mål-CPU-användning för autoskalning. Int

CodeConfiguration (på engelska)

Namn Beskrivning Värde
codeId ARM-resurs-ID för kodtillgången. snöre
scoringscript [Krävs] Skriptet som ska köras vid start. T.ex. "score.py" sträng

Begränsningar:
Min längd = 1
Mönster = [a-zA-Z0-9_] (krävs)

ContainerResourceRequirements (på engelska)

Namn Beskrivning Värde
CPU Den minsta mängd processorkärnor som ska användas av containern. Mer information:
https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/
Int
cpuLimit Den maximala mängden processorkärnor som tillåts användas av containern. Mer information:
https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/
Int
FPGA Antalet FPGA PCIE-enheter som exponeras för containern. Måste vara flera av 2. Int
GPU Antalet GPU-kärnor i containern. Int
memoryInGB (på engelska) Den minsta mängd minne (i GB) som ska användas av containern. Mer information:
https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/
Int
memoryInGBLimit Den maximala mängden minne (i GB) som tillåts användas av containern. Mer information:
https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/
Int

DataPathAssetReference (på engelska)

Namn Beskrivning Värde
datastoreId ARM-resurs-ID för det datalager där tillgången finns. snöre
väg Sökvägen till filen/katalogen i dataarkivet. snöre
referenstyp [Krävs] Anger typ av tillgångsreferens. "DataPath" (krävs)

IdAssetReference (på engelska)

Namn Beskrivning Värde
assetId [Krävs] ARM-resurs-ID för tillgången. sträng

Begränsningar:
Mönster = [a-zA-Z0-9_] (krävs)
referenstyp [Krävs] Anger typ av tillgångsreferens. "ID" (krävs)

K8SOnlineDeployment

Namn Beskrivning Värde
containerResourceRequirements Resurskrav för varje containerinstans i en onlinedistribution. ContainerResourceRequirements (på engelska)
endpointComputeType [Krävs] Slutpunktens beräkningstyp. "K8S" (krävs)

ManagedOnlineDeployment (HanteradOnlineDistribution)

Namn Beskrivning Värde
endpointComputeType [Krävs] Slutpunktens beräkningstyp. "Hanterad" (krävs)
instanceType Typ av beräkningsinstans. snöre
beredskapSond Konfiguration av distributionscontainerns liveness/readiness probe. Sond-inställningar

ManuellScaleSettings (ManuellSkala)

Namn Beskrivning Värde
antal instanser Fast antal instanser för den här distributionen. Int
scaleType (på engelska) [Krävs] Typ av distributionsskalningsalgoritm "Manuell" (krävs)

Distribution på nätet

Namn Beskrivning Värde
appInsightsEnabled Om det är sant aktiverar du Application Insights-loggning. Bool
codeConfiguration Kodkonfiguration för slutpunktsdistributionen. CodeConfiguration (på engelska)
beskrivning Beskrivning av slutpunktsdistributionen. snöre
endpointComputeType Ange till K8S för typ K8SOnlineDeployment. Ange till Hanterad för typen ManagedOnlineDeployment. "K8S"
"Hanterad" (krävs)
environmentId ARM-resurs-ID för miljöspecifikationen för slutpunktsdistributionen. snöre
miljövariabler Konfiguration av miljövariabler för distributionen. OnlineDeploymentEnvironmentVariables
livenessProbe Konfiguration av distributionscontainerns liveness/readiness probe. Sond-inställningar
modell Referens till modelltillgången för slutpunktsdistributionen. AssetReferenceBase (på engelska)
egenskaper Egenskapsordlista. Egenskaper kan läggas till, men inte tas bort eller ändras. OnlineDeploymentProperties
requestSettings (begäran) Konfiguration av onlinedistributionsbedömningsbegäranden. OnlineRequestSettings (på engelska)
skalinställningar Skalningskonfiguration för onlinedistribution. OnlineScaleSettings (på engelska)

OnlineDeploymentEnvironmentVariables

Namn Beskrivning Värde

OnlineDeploymentProperties

Namn Beskrivning Värde

OnlineRequestSettings (på engelska)

Namn Beskrivning Värde
maxConcurrentRequestsPerInstance Antalet begäranden som tillåts köa samtidigt för den här distributionen. Int
maxQueueWait Den maximala köväntetiden i ISO 8601-format. Stöder millisekunders precision. snöre
requestTimeout Tidsgränsen för begäran i ISO 8601-format. Stöder millisekunders precision. snöre

OnlineScaleSettings (på engelska)

Namn Beskrivning Värde
maxInstances Maximalt antal instanser för den här distributionen. Int
minInstances (minInstanser) Minsta antal instanser för den här distributionen. Int
scaleType (på engelska) Ange till Auto för typen AutoScaleSettings. Ange till "Manuell" för typen ManualScaleSettings. "Auto"
"Manuell" (krävs)

OutputPathAssetReference (på engelska)

Namn Beskrivning Värde
jobId ARM-resurs-ID för jobbet. snöre
väg Sökvägen till filen/katalogen i jobbutdata. snöre
referenstyp [Krävs] Anger typ av tillgångsreferens. "OutputPath" (krävs)

Sond-inställningar

Namn Beskrivning Värde
failureThreshold (på engelska) Antalet fel som tillåts innan statusen inte är felfri returneras. Int
initialDelay (initialt) Fördröjningen före den första avsökningen i ISO 8601-format. snöre
punkt Tiden mellan avsökningar i ISO 8601-format. snöre
framgångströskel Antalet lyckade avsökningar innan en felfri status returneras. Int
vilopaus Tidsgränsen för avsökningen i ISO 8601-format. snöre

ResourceIdentity (på engelska)

Namn Beskrivning Värde
typ Definierar värden för en ResourceIdentity-typ. "Ingen"
"SystemAssigned"
"SystemAssigned,UserAssigned"
"UserAssigned"
användartilldelade identiteter Ordlista över användartilldelade identiteter, nyckeln är ARM-resurs-ID för UAI. ResourceIdentityUserAssignedIdentiteter

ResourceIdentityUserAssignedIdentiteter

Namn Beskrivning Värde

Spårade resurstaggar

Namn Beskrivning Värde

UserAssignedIdentityMeta

Namn Beskrivning Värde
clientId Även kallat program-ID, en unik identifierare som genereras av Azure AD och som är kopplad till ett program och tjänstens huvudnamn under den första etableringen. snöre
huvudId Objekt-ID för tjänstens huvudnamnsobjekt för din hanterade identitet som används för att bevilja rollbaserad åtkomst till en Azure-resurs. snöre

Användningsexempel

Resursdefinition för Terraform (AzAPI-provider)

Resurstypen arbetsytor/onlineEndpoints/distributioner kan distribueras med åtgärder som mål:

  • Resursgrupper

En lista över ändrade egenskaper i varje API-version finns i ändringsloggen.

Resursformat

Om du vill skapa en Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments-resurs lägger du till följande Terraform i mallen.

resource "azapi_resource" "symbolicname" {
  type = "Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments@2021-03-01-preview"
  name = "string"
  parent_id = "string"
  identity {
    type = "string"
    identity_ids = [
      "string"
    ]
  }
  location = "string"
  tags = {
    {customized property} = "string"
  }
  body = {
    kind = "string"
    properties = {
      appInsightsEnabled = bool
      codeConfiguration = {
        codeId = "string"
        scoringScript = "string"
      }
      description = "string"
      environmentId = "string"
      environmentVariables = {
        {customized property} = "string"
      }
      livenessProbe = {
        failureThreshold = int
        initialDelay = "string"
        period = "string"
        successThreshold = int
        timeout = "string"
      }
      model = {
        referenceType = "string"
        // For remaining properties, see AssetReferenceBase objects
      }
      properties = {
        {customized property} = "string"
      }
      requestSettings = {
        maxConcurrentRequestsPerInstance = int
        maxQueueWait = "string"
        requestTimeout = "string"
      }
      scaleSettings = {
        maxInstances = int
        minInstances = int
        scaleType = "string"
        // For remaining properties, see OnlineScaleSettings objects
      }
      endpointComputeType = "string"
      // For remaining properties, see OnlineDeployment objects
    }
  }
}

OnlineScaleSettings-objekt

Ange egenskapen scaleType för att ange typ av objekt.

För Auto använder du:

{
  pollingInterval = "string"
  scaleType = "Auto"
  targetUtilizationPercentage = int
}

För Manuell använder du:

{
  instanceCount = int
  scaleType = "Manual"
}

OnlineDeployment-objekt

Ange egenskapen endpointComputeType för att ange typ av objekt.

För K8S använder du:

{
  containerResourceRequirements = {
    cpu = int
    cpuLimit = int
    fpga = int
    gpu = int
    memoryInGB = int
    memoryInGBLimit = int
  }
  endpointComputeType = "K8S"
}

För Hanterad använder du:

{
  endpointComputeType = "Managed"
  instanceType = "string"
  readinessProbe = {
    failureThreshold = int
    initialDelay = "string"
    period = "string"
    successThreshold = int
    timeout = "string"
  }
}

AssetReferenceBase-objekt

Ange egenskapen referenceType för att ange typ av objekt.

För DataPath använder du:

{
  datastoreId = "string"
  path = "string"
  referenceType = "DataPath"
}

För ID använder du:

{
  assetId = "string"
  referenceType = "Id"
}

För OutputPath använder du:

{
  jobId = "string"
  path = "string"
  referenceType = "OutputPath"
}

Egenskapsvärden

Microsoft.MachineLearningTjänster/arbetsytor/onlineSlutpunkter/utplaceringar

Namn Beskrivning Värde
identitet Tjänstidentitet som är associerad med en resurs. ResourceIdentity (på engelska)
typ Metadata som används av portal/verktyg/etc för att återge olika UX-funktioner för resurser av samma typ. snöre
läge Den geo-plats där resursen finns sträng (krävs)
namn Resursnamnet sträng

Begränsningar:
Mönster = ^[a-zA-Z0-9][a-zA-Z0-9\-_]{0,254}$ (krävs)
föräldra_id ID för resursen som är överordnad för den här resursen. ID för resurs av typen: arbetsytor/onlineEndpoints
egenskaper [Krävs] Ytterligare attribut för entiteten. OnlineDeployment (krävs)
Taggar Resursetiketter Ordlista med taggnamn och värden.
typ Resurstypen "Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments@2021-03-01-preview"

AssetReferenceBase (på engelska)

Namn Beskrivning Värde
referenstyp Ange till DataPath för typen DataPathAssetReference. Ange till ID för typ IdAssetReference. Ange till OutputPath för typen OutputPathAssetReference. "DataPath"
"ID"
"OutputPath" (krävs)

AutoskalningInställningar

Namn Beskrivning Värde
pollingInterval Avsökningsintervallet i ISO 8691-format. Stöder endast varaktighet med så låg precision som Sekunder. snöre
scaleType (på engelska) [Krävs] Typ av distributionsskalningsalgoritm "Auto" (krävs)
targetUtilizationPercentage Mål-CPU-användning för autoskalning. Int

CodeConfiguration (på engelska)

Namn Beskrivning Värde
codeId ARM-resurs-ID för kodtillgången. snöre
scoringscript [Krävs] Skriptet som ska köras vid start. T.ex. "score.py" sträng

Begränsningar:
Min längd = 1
Mönster = [a-zA-Z0-9_] (krävs)

ContainerResourceRequirements (på engelska)

Namn Beskrivning Värde
CPU Den minsta mängd processorkärnor som ska användas av containern. Mer information:
https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/
Int
cpuLimit Den maximala mängden processorkärnor som tillåts användas av containern. Mer information:
https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/
Int
FPGA Antalet FPGA PCIE-enheter som exponeras för containern. Måste vara flera av 2. Int
GPU Antalet GPU-kärnor i containern. Int
memoryInGB (på engelska) Den minsta mängd minne (i GB) som ska användas av containern. Mer information:
https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/
Int
memoryInGBLimit Den maximala mängden minne (i GB) som tillåts användas av containern. Mer information:
https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/
Int

DataPathAssetReference (på engelska)

Namn Beskrivning Värde
datastoreId ARM-resurs-ID för det datalager där tillgången finns. snöre
väg Sökvägen till filen/katalogen i dataarkivet. snöre
referenstyp [Krävs] Anger typ av tillgångsreferens. "DataPath" (krävs)

IdAssetReference (på engelska)

Namn Beskrivning Värde
assetId [Krävs] ARM-resurs-ID för tillgången. sträng

Begränsningar:
Mönster = [a-zA-Z0-9_] (krävs)
referenstyp [Krävs] Anger typ av tillgångsreferens. "ID" (krävs)

K8SOnlineDeployment

Namn Beskrivning Värde
containerResourceRequirements Resurskrav för varje containerinstans i en onlinedistribution. ContainerResourceRequirements (på engelska)
endpointComputeType [Krävs] Slutpunktens beräkningstyp. "K8S" (krävs)

ManagedOnlineDeployment (HanteradOnlineDistribution)

Namn Beskrivning Värde
endpointComputeType [Krävs] Slutpunktens beräkningstyp. "Hanterad" (krävs)
instanceType Typ av beräkningsinstans. snöre
beredskapSond Konfiguration av distributionscontainerns liveness/readiness probe. Sond-inställningar

ManuellScaleSettings (ManuellSkala)

Namn Beskrivning Värde
antal instanser Fast antal instanser för den här distributionen. Int
scaleType (på engelska) [Krävs] Typ av distributionsskalningsalgoritm "Manuell" (krävs)

Distribution på nätet

Namn Beskrivning Värde
appInsightsEnabled Om det är sant aktiverar du Application Insights-loggning. Bool
codeConfiguration Kodkonfiguration för slutpunktsdistributionen. CodeConfiguration (på engelska)
beskrivning Beskrivning av slutpunktsdistributionen. snöre
endpointComputeType Ange till K8S för typ K8SOnlineDeployment. Ange till Hanterad för typen ManagedOnlineDeployment. "K8S"
"Hanterad" (krävs)
environmentId ARM-resurs-ID för miljöspecifikationen för slutpunktsdistributionen. snöre
miljövariabler Konfiguration av miljövariabler för distributionen. OnlineDeploymentEnvironmentVariables
livenessProbe Konfiguration av distributionscontainerns liveness/readiness probe. Sond-inställningar
modell Referens till modelltillgången för slutpunktsdistributionen. AssetReferenceBase (på engelska)
egenskaper Egenskapsordlista. Egenskaper kan läggas till, men inte tas bort eller ändras. OnlineDeploymentProperties
requestSettings (begäran) Konfiguration av onlinedistributionsbedömningsbegäranden. OnlineRequestSettings (på engelska)
skalinställningar Skalningskonfiguration för onlinedistribution. OnlineScaleSettings (på engelska)

OnlineDeploymentEnvironmentVariables

Namn Beskrivning Värde

OnlineDeploymentProperties

Namn Beskrivning Värde

OnlineRequestSettings (på engelska)

Namn Beskrivning Värde
maxConcurrentRequestsPerInstance Antalet begäranden som tillåts köa samtidigt för den här distributionen. Int
maxQueueWait Den maximala köväntetiden i ISO 8601-format. Stöder millisekunders precision. snöre
requestTimeout Tidsgränsen för begäran i ISO 8601-format. Stöder millisekunders precision. snöre

OnlineScaleSettings (på engelska)

Namn Beskrivning Värde
maxInstances Maximalt antal instanser för den här distributionen. Int
minInstances (minInstanser) Minsta antal instanser för den här distributionen. Int
scaleType (på engelska) Ange till Auto för typen AutoScaleSettings. Ange till "Manuell" för typen ManualScaleSettings. "Auto"
"Manuell" (krävs)

OutputPathAssetReference (på engelska)

Namn Beskrivning Värde
jobId ARM-resurs-ID för jobbet. snöre
väg Sökvägen till filen/katalogen i jobbutdata. snöre
referenstyp [Krävs] Anger typ av tillgångsreferens. "OutputPath" (krävs)

Sond-inställningar

Namn Beskrivning Värde
failureThreshold (på engelska) Antalet fel som tillåts innan statusen inte är felfri returneras. Int
initialDelay (initialt) Fördröjningen före den första avsökningen i ISO 8601-format. snöre
punkt Tiden mellan avsökningar i ISO 8601-format. snöre
framgångströskel Antalet lyckade avsökningar innan en felfri status returneras. Int
vilopaus Tidsgränsen för avsökningen i ISO 8601-format. snöre

ResourceIdentity (på engelska)

Namn Beskrivning Värde
typ Definierar värden för en ResourceIdentity-typ. "Ingen"
"SystemAssigned"
"SystemAssigned,UserAssigned"
"UserAssigned"
användartilldelade identiteter Ordlista över användartilldelade identiteter, nyckeln är ARM-resurs-ID för UAI. ResourceIdentityUserAssignedIdentiteter

ResourceIdentityUserAssignedIdentiteter

Namn Beskrivning Värde

Spårade resurstaggar

Namn Beskrivning Värde

UserAssignedIdentityMeta

Namn Beskrivning Värde
clientId Även kallat program-ID, en unik identifierare som genereras av Azure AD och som är kopplad till ett program och tjänstens huvudnamn under den första etableringen. snöre
huvudId Objekt-ID för tjänstens huvudnamnsobjekt för din hanterade identitet som används för att bevilja rollbaserad åtkomst till en Azure-resurs. snöre