Sdílet prostřednictvím


Pracovní prostory Microsoft.MachineLearningServices/ onlineEndpoints/deployments 2023-10-01

Definice prostředku Bicep

Pracovní prostory/ onlineEndpoints/deployments typ prostředku je možné nasadit s operacemi, které cílí:

Seznam změněných vlastností v jednotlivých verzích rozhraní API najdete v protokolu změn.

Formát prostředku

Pokud chcete vytvořit prostředek Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments, přidejte do šablony následující bicep.

resource symbolicname 'Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments@2023-10-01' = {
  parent: resourceSymbolicName
  identity: {
    type: 'string'
    userAssignedIdentities: {
      {customized property}: {}
    }
  }
  kind: 'string'
  location: 'string'
  name: 'string'
  properties: {
    appInsightsEnabled: bool
    codeConfiguration: {
      codeId: 'string'
      scoringScript: 'string'
    }
    description: 'string'
    egressPublicNetworkAccess: 'string'
    environmentId: 'string'
    environmentVariables: {
      {customized property}: 'string'
    }
    instanceType: 'string'
    livenessProbe: {
      failureThreshold: int
      initialDelay: 'string'
      period: 'string'
      successThreshold: int
      timeout: 'string'
    }
    model: 'string'
    modelMountPath: 'string'
    properties: {
      {customized property}: 'string'
    }
    readinessProbe: {
      failureThreshold: int
      initialDelay: 'string'
      period: 'string'
      successThreshold: int
      timeout: 'string'
    }
    requestSettings: {
      maxConcurrentRequestsPerInstance: int
      maxQueueWait: 'string'
      requestTimeout: 'string'
    }
    scaleSettings: {
      scaleType: 'string'
      // For remaining properties, see OnlineScaleSettings objects
    }
    endpointComputeType: 'string'
    // For remaining properties, see OnlineDeploymentProperties objects
  }
  sku: {
    capacity: int
    family: 'string'
    name: 'string'
    size: 'string'
    tier: 'string'
  }
  tags: {
    {customized property}: 'string'
  }
}

Objekty OnlineScaleSettings

Nastavte scaleType vlastnost určit typ objektu.

Pro Výchozípoužijte:

{
  scaleType: 'Default'
}

Pro cílové využitípoužijte:

{
  maxInstances: int
  minInstances: int
  pollingInterval: 'string'
  scaleType: 'TargetUtilization'
  targetUtilizationPercentage: int
}

Objekty OnlineDeploymentProperties

Nastavte endpointComputeType vlastnost určit typ objektu.

Pro Kubernetes použijte:

{
  containerResourceRequirements: {
    containerResourceLimits: {
      cpu: 'string'
      gpu: 'string'
      memory: 'string'
    }
    containerResourceRequests: {
      cpu: 'string'
      gpu: 'string'
      memory: 'string'
    }
  }
  endpointComputeType: 'Kubernetes'
}

Pro spravovanépoužijte:

{
  endpointComputeType: 'Managed'
}

Hodnoty vlastností

Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments

Název Popis Hodnota
identita Identita spravované služby (identita přiřazená systémem nebo identita přiřazená uživatelem) ManagedServiceIdentity
laskavý Metadata používaná portálem, nástroji atd. k vykreslení různých prostředí uživatelského rozhraní pro prostředky stejného typu. řetězec
poloha Geografické umístění, ve kterém se nachází zdroj string (povinné)
název Název prostředku řetězec

Omezení:
Model = ^[a-zA-Z0-9][a-zA-Z0-9\-_]{0,254}$ (povinné)
nadřazený objekt V bicep můžete zadat nadřazený prostředek pro podřízený prostředek. Tuto vlastnost je potřeba přidat pouze v případě, že je podřízený prostředek deklarován mimo nadřazený prostředek.

Další informace najdete v tématu Podřízený prostředek mimo nadřazený prostředek.
Symbolický název prostředku typu: pracovních prostorů/onlineEndpoints
vlastnosti [Povinné] Další atributy entity. OnlineDeploymentProperties (povinné)
SKU (identifikátor zboží) Podrobnosti skladové položky vyžadované pro kontrakt ARM pro automatické škálování Sku
štítky Štítky prostředků Slovník názvů a hodnot značek Viz Značky v šablonách

Konfigurace kódu

Název Popis Hodnota
ID kódu ID prostředku ARM prostředku kódu řetězec
BodováníScriptu [Povinné] Skript, který se má spustit při spuštění. Např. "score.py" řetězec

Omezení:
Minimální délka = 1
Model = [a-zA-Z0-9_] (povinné)

Požadavky na zdroje kontejneru

Název Popis Hodnota
containerResourceLimits Informace o limitu prostředků kontejneru: Nastavení zdroje kontejneru
containerResourceRequests Informace o požadavku na prostředek kontejneru: Nastavení zdroje kontejneru

Nastavení zdroje kontejneru

Název Popis Hodnota
procesor Počet požadavků nebo limitu počtu vCPU pro kontejner Více informací:
https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/
řetězec
GPU Počet požadavků nebo omezení karet Nvidia GPU pro kontejner Více informací:
https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/
řetězec
paměť Požadavek nebo limit velikosti paměti pro kontejner. Více informací:
https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/
řetězec

DefaultScaleSettings

Název Popis Hodnota
scaleType [Povinné] Typ algoritmu škálování nasazení Výchozí (povinné)

EndpointDeploymentPropertiesBaseEnvironmentVariables

Název Popis Hodnota

EndpointDeploymentPropertiesBaseProperties

Název Popis Hodnota

Nasazení KubernetesOnline

Název Popis Hodnota
containerResourceRequirements Požadavky na prostředky pro kontejner (procesor a paměť). Požadavky na zdroje kontejneru
koncový bod ComputeType [Povinné] Typ výpočetního objektu koncového bodu. Kubernetes (povinné)

ManagedOnlineDeployment

Název Popis Hodnota
koncový bod ComputeType [Povinné] Typ výpočetního objektu koncového bodu. Spravované (povinné)

Identita spravované služby

Název Popis Hodnota
typ Typ identity spravované služby (kde jsou povolené typy SystemAssigned i UserAssigned). None (Žádný)
SystemAssigned
SystemAssigned, UserAssigned
UserAssigned (povinné)
uživatelem přiřazené identity Sada identit přiřazených uživatelem přidružená k prostředku. Klíče slovníku userAssignedIdentities budou ID prostředků ARM ve formuláři: /subscriptions/{subscriptionId}/resourceGroups/{resourceGroupName}/providers/Microsoft.ManagedIdentity/userAssignedIdentities/{identityName}. Hodnoty slovníku můžou být prázdné objekty ({}) v požadavcích. userAssignedIdentities

Vlastnosti online nasazení

Název Popis Hodnota
appInsightsEnabled Pokud je pravda, povolí protokolování Application Insights. Booleova hodnota
CodeConfiguration Konfigurace kódu pro nasazení koncového bodu Konfigurace kódu
popis Popis nasazení koncového bodu řetězec
egressPublicNetworkAccess Pokud je tato možnost povolená, povolte přístup k veřejné síti pro výchozí přenos dat. Pokud je zakázáno, vytvoří se zabezpečený výchozí přenos dat. Výchozí hodnota: Povoleno. Zakázáno
Povoleno
koncový bod ComputeType Nastavte na Kubernetes pro typ KubernetesOnlineDeployment. U typu ManagedOnlineDeploymentna hodnotu ManagedOnlineDeployment . Kubernetes
Spravované (povinné)
ID prostředí ID prostředku ARM nebo AssetId specifikace prostředí pro nasazení koncového bodu řetězec
proměnné prostředí Konfigurace proměnných prostředí pro nasazení EndpointDeploymentPropertiesBaseEnvironmentVariables
typ instance Typ výpočetní instance. řetězec
livenessProbe Sonda aktivity pravidelně monitoruje stav kontejneru. Nastavení sondy
model Cesta URI k modelu. řetězec
ModelMountPath Cesta k připojení modelu ve vlastním kontejneru. řetězec
vlastnosti Slovník vlastností Vlastnosti lze přidat, ale ne odebrat nebo změnit. endpointDeploymentPropertiesBaseProperties
readinessProbe Sonda připravenosti ověří, jestli je kontejner připravený obsluhovat provoz. Vlastnosti a výchozí hodnoty jsou stejné jako sonda aktivity. Nastavení sondy
Nastavení požadavku Požádejte o nastavení nasazení. OnlineRequestSettings
nastavení škálování Nastavení škálování pro nasazení
Pokud je hodnota null nebo není zadaná,
Výchozí hodnota TargetUtilizationScaleSettings pro KubernetesOnlineDeployment
a do DefaultScaleSettings pro ManagedOnlineDeployment.
OnlineScaleSettings

Nastavení online požadavku

Název Popis Hodnota
maxConcurrentRequestsPerInstance Počet maximálních souběžných požadavků na uzel povolený pro každé nasazení. Výchozí hodnota je 1. int (integer)
maxQueueWait (Zastaralé pro spravované online koncové body) Maximální doba, po kterou požadavek zůstane ve frontě ve formátu ISO 8601.
Výchozí hodnota je 500 ms.
(Nyní zvyšte úroveň request_timeout_ms , aby se zohlednily případné zpoždění sítě nebo fronty)
řetězec
Časový limit požadavku Časový limit bodování ve formátu ISO 8601.
Výchozí hodnota je 5000 ms.
řetězec

Nastavení měřítka online

Název Popis Hodnota
scaleType Pro typ DefaultScaleSettingsnastavte na DefaultScaleSettings . Pro typ TargetUtilizationScaleSettings nastavte na TargetUtilizationSettings. Výchozí
Cílové využití (povinné)

Nastavení sondy

Název Popis Hodnota
prahová hodnota selhání Počet chyb, které se mají povolit před vrácením stavu, který není v pořádku. int (integer)
počáteční zpoždění Zpoždění před první sondou ve formátu ISO 8601. řetězec
období Doba mezi sondami ve formátu ISO 8601. řetězec
prahová hodnota úspěchu Počet úspěšných sond před vrácením stavu v pořádku. int (integer)
časový limit Časový limit sondy ve formátu ISO 8601. řetězec

Sku

Název Popis Hodnota
kapacita Pokud skladová položka podporuje horizontální navýšení/snížení kapacity, měla by být zahrnuta celá čísla kapacity. Pokud není pro prostředek možné horizontální navýšení kapacity nebo jeho snížení kapacity, může se tento parametr vynechat. int (integer)
rodina Pokud má služba různé generace hardwaru, pro stejnou skladovou položku, můžete ji zde zachytit. řetězec
název Název skladové položky. Ex - P3. Obvykle se jedná o písmeno+číslo. string (povinné)
velikost Velikost skladové položky. Pokud je pole název kombinací vrstvy a jiné hodnoty, jedná se o samostatný kód. řetězec
přesunout do jiné vrstvy Toto pole musí implementovat poskytovatel prostředků, pokud má služba více než jednu úroveň, ale nevyžaduje se u put. "Základní"
"Zdarma"
Premium
"Standardní"

TargetUtilizationScaleSettings

Název Popis Hodnota
maxInstances Maximální počet instancí, na které se může nasazení škálovat. Kvóta bude vyhrazena pro max_instances. int (integer)
minInstance Minimální početinstancíchch int (integer)
interval dotazování Interval dotazování ve formátu ISO 8691. Podporuje pouze dobu trvání s přesností v sekundách. řetězec
scaleType [Povinné] Typ algoritmu škálování nasazení Cílové využití (povinné)
targetUtilizationPercentage Cílové využití procesoru pro automatické škálování int (integer)

TrackedResourceTags

Název Popis Hodnota

Přiřazené identity uživatele

Název Popis Hodnota

Identita přiřazená uživatelem (UserAssignedIdentity)

Název Popis Hodnota

Definice prostředku šablony ARM

Pracovní prostory/ onlineEndpoints/deployments typ prostředku je možné nasadit s operacemi, které cílí:

Seznam změněných vlastností v jednotlivých verzích rozhraní API najdete v protokolu změn.

Formát prostředku

Pokud chcete vytvořit prostředek Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments, přidejte do šablony následující JSON.

{
  "type": "Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments",
  "apiVersion": "2023-10-01",
  "name": "string",
  "identity": {
    "type": "string",
    "userAssignedIdentities": {
      "{customized property}": {
      }
    }
  },
  "kind": "string",
  "location": "string",
  "properties": {
    "appInsightsEnabled": "bool",
    "codeConfiguration": {
      "codeId": "string",
      "scoringScript": "string"
    },
    "description": "string",
    "egressPublicNetworkAccess": "string",
    "environmentId": "string",
    "environmentVariables": {
      "{customized property}": "string"
    },
    "instanceType": "string",
    "livenessProbe": {
      "failureThreshold": "int",
      "initialDelay": "string",
      "period": "string",
      "successThreshold": "int",
      "timeout": "string"
    },
    "model": "string",
    "modelMountPath": "string",
    "properties": {
      "{customized property}": "string"
    },
    "readinessProbe": {
      "failureThreshold": "int",
      "initialDelay": "string",
      "period": "string",
      "successThreshold": "int",
      "timeout": "string"
    },
    "requestSettings": {
      "maxConcurrentRequestsPerInstance": "int",
      "maxQueueWait": "string",
      "requestTimeout": "string"
    },
    "scaleSettings": {
      "scaleType": "string"
      // For remaining properties, see OnlineScaleSettings objects
    },
    "endpointComputeType": "string"
    // For remaining properties, see OnlineDeploymentProperties objects
  },
  "sku": {
    "capacity": "int",
    "family": "string",
    "name": "string",
    "size": "string",
    "tier": "string"
  },
  "tags": {
    "{customized property}": "string"
  }
}

Objekty OnlineScaleSettings

Nastavte scaleType vlastnost určit typ objektu.

Pro Výchozípoužijte:

{
  "scaleType": "Default"
}

Pro cílové využitípoužijte:

{
  "maxInstances": "int",
  "minInstances": "int",
  "pollingInterval": "string",
  "scaleType": "TargetUtilization",
  "targetUtilizationPercentage": "int"
}

Objekty OnlineDeploymentProperties

Nastavte endpointComputeType vlastnost určit typ objektu.

Pro Kubernetes použijte:

{
  "containerResourceRequirements": {
    "containerResourceLimits": {
      "cpu": "string",
      "gpu": "string",
      "memory": "string"
    },
    "containerResourceRequests": {
      "cpu": "string",
      "gpu": "string",
      "memory": "string"
    }
  },
  "endpointComputeType": "Kubernetes"
}

Pro spravovanépoužijte:

{
  "endpointComputeType": "Managed"
}

Hodnoty vlastností

Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments

Název Popis Hodnota
Verze rozhraní apiVersion Verze rozhraní API '2023-10-01'
identita Identita spravované služby (identita přiřazená systémem nebo identita přiřazená uživatelem) ManagedServiceIdentity
laskavý Metadata používaná portálem, nástroji atd. k vykreslení různých prostředí uživatelského rozhraní pro prostředky stejného typu. řetězec
poloha Geografické umístění, ve kterém se nachází zdroj string (povinné)
název Název prostředku řetězec

Omezení:
Model = ^[a-zA-Z0-9][a-zA-Z0-9\-_]{0,254}$ (povinné)
vlastnosti [Povinné] Další atributy entity. OnlineDeploymentProperties (povinné)
SKU (identifikátor zboží) Podrobnosti skladové položky vyžadované pro kontrakt ARM pro automatické škálování Sku
štítky Štítky prostředků Slovník názvů a hodnot značek Viz Značky v šablonách
typ Typ prostředku Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments

Konfigurace kódu

Název Popis Hodnota
ID kódu ID prostředku ARM prostředku kódu řetězec
BodováníScriptu [Povinné] Skript, který se má spustit při spuštění. Např. "score.py" řetězec

Omezení:
Minimální délka = 1
Model = [a-zA-Z0-9_] (povinné)

Požadavky na zdroje kontejneru

Název Popis Hodnota
containerResourceLimits Informace o limitu prostředků kontejneru: Nastavení zdroje kontejneru
containerResourceRequests Informace o požadavku na prostředek kontejneru: Nastavení zdroje kontejneru

Nastavení zdroje kontejneru

Název Popis Hodnota
procesor Počet požadavků nebo limitu počtu vCPU pro kontejner Více informací:
https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/
řetězec
GPU Počet požadavků nebo omezení karet Nvidia GPU pro kontejner Více informací:
https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/
řetězec
paměť Požadavek nebo limit velikosti paměti pro kontejner. Více informací:
https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/
řetězec

DefaultScaleSettings

Název Popis Hodnota
scaleType [Povinné] Typ algoritmu škálování nasazení Výchozí (povinné)

EndpointDeploymentPropertiesBaseEnvironmentVariables

Název Popis Hodnota

EndpointDeploymentPropertiesBaseProperties

Název Popis Hodnota

Nasazení KubernetesOnline

Název Popis Hodnota
containerResourceRequirements Požadavky na prostředky pro kontejner (procesor a paměť). Požadavky na zdroje kontejneru
koncový bod ComputeType [Povinné] Typ výpočetního objektu koncového bodu. Kubernetes (povinné)

ManagedOnlineDeployment

Název Popis Hodnota
koncový bod ComputeType [Povinné] Typ výpočetního objektu koncového bodu. Spravované (povinné)

Identita spravované služby

Název Popis Hodnota
typ Typ identity spravované služby (kde jsou povolené typy SystemAssigned i UserAssigned). None (Žádný)
SystemAssigned
SystemAssigned, UserAssigned
UserAssigned (povinné)
uživatelem přiřazené identity Sada identit přiřazených uživatelem přidružená k prostředku. Klíče slovníku userAssignedIdentities budou ID prostředků ARM ve formuláři: /subscriptions/{subscriptionId}/resourceGroups/{resourceGroupName}/providers/Microsoft.ManagedIdentity/userAssignedIdentities/{identityName}. Hodnoty slovníku můžou být prázdné objekty ({}) v požadavcích. userAssignedIdentities

Vlastnosti online nasazení

Název Popis Hodnota
appInsightsEnabled Pokud je pravda, povolí protokolování Application Insights. Booleova hodnota
CodeConfiguration Konfigurace kódu pro nasazení koncového bodu Konfigurace kódu
popis Popis nasazení koncového bodu řetězec
egressPublicNetworkAccess Pokud je tato možnost povolená, povolte přístup k veřejné síti pro výchozí přenos dat. Pokud je zakázáno, vytvoří se zabezpečený výchozí přenos dat. Výchozí hodnota: Povoleno. Zakázáno
Povoleno
koncový bod ComputeType Nastavte na Kubernetes pro typ KubernetesOnlineDeployment. U typu ManagedOnlineDeploymentna hodnotu ManagedOnlineDeployment . Kubernetes
Spravované (povinné)
ID prostředí ID prostředku ARM nebo AssetId specifikace prostředí pro nasazení koncového bodu řetězec
proměnné prostředí Konfigurace proměnných prostředí pro nasazení EndpointDeploymentPropertiesBaseEnvironmentVariables
typ instance Typ výpočetní instance. řetězec
livenessProbe Sonda aktivity pravidelně monitoruje stav kontejneru. Nastavení sondy
model Cesta URI k modelu. řetězec
ModelMountPath Cesta k připojení modelu ve vlastním kontejneru. řetězec
vlastnosti Slovník vlastností Vlastnosti lze přidat, ale ne odebrat nebo změnit. endpointDeploymentPropertiesBaseProperties
readinessProbe Sonda připravenosti ověří, jestli je kontejner připravený obsluhovat provoz. Vlastnosti a výchozí hodnoty jsou stejné jako sonda aktivity. Nastavení sondy
Nastavení požadavku Požádejte o nastavení nasazení. OnlineRequestSettings
nastavení škálování Nastavení škálování pro nasazení
Pokud je hodnota null nebo není zadaná,
Výchozí hodnota TargetUtilizationScaleSettings pro KubernetesOnlineDeployment
a do DefaultScaleSettings pro ManagedOnlineDeployment.
OnlineScaleSettings

Nastavení online požadavku

Název Popis Hodnota
maxConcurrentRequestsPerInstance Počet maximálních souběžných požadavků na uzel povolený pro každé nasazení. Výchozí hodnota je 1. int (integer)
maxQueueWait (Zastaralé pro spravované online koncové body) Maximální doba, po kterou požadavek zůstane ve frontě ve formátu ISO 8601.
Výchozí hodnota je 500 ms.
(Nyní zvyšte úroveň request_timeout_ms , aby se zohlednily případné zpoždění sítě nebo fronty)
řetězec
Časový limit požadavku Časový limit bodování ve formátu ISO 8601.
Výchozí hodnota je 5000 ms.
řetězec

Nastavení měřítka online

Název Popis Hodnota
scaleType Pro typ DefaultScaleSettingsnastavte na DefaultScaleSettings . Pro typ TargetUtilizationScaleSettings nastavte na TargetUtilizationSettings. Výchozí
Cílové využití (povinné)

Nastavení sondy

Název Popis Hodnota
prahová hodnota selhání Počet chyb, které se mají povolit před vrácením stavu, který není v pořádku. int (integer)
počáteční zpoždění Zpoždění před první sondou ve formátu ISO 8601. řetězec
období Doba mezi sondami ve formátu ISO 8601. řetězec
prahová hodnota úspěchu Počet úspěšných sond před vrácením stavu v pořádku. int (integer)
časový limit Časový limit sondy ve formátu ISO 8601. řetězec

Sku

Název Popis Hodnota
kapacita Pokud skladová položka podporuje horizontální navýšení/snížení kapacity, měla by být zahrnuta celá čísla kapacity. Pokud není pro prostředek možné horizontální navýšení kapacity nebo jeho snížení kapacity, může se tento parametr vynechat. int (integer)
rodina Pokud má služba různé generace hardwaru, pro stejnou skladovou položku, můžete ji zde zachytit. řetězec
název Název skladové položky. Ex - P3. Obvykle se jedná o písmeno+číslo. string (povinné)
velikost Velikost skladové položky. Pokud je pole název kombinací vrstvy a jiné hodnoty, jedná se o samostatný kód. řetězec
přesunout do jiné vrstvy Toto pole musí implementovat poskytovatel prostředků, pokud má služba více než jednu úroveň, ale nevyžaduje se u put. "Základní"
"Zdarma"
Premium
"Standardní"

TargetUtilizationScaleSettings

Název Popis Hodnota
maxInstances Maximální počet instancí, na které se může nasazení škálovat. Kvóta bude vyhrazena pro max_instances. int (integer)
minInstance Minimální početinstancíchch int (integer)
interval dotazování Interval dotazování ve formátu ISO 8691. Podporuje pouze dobu trvání s přesností v sekundách. řetězec
scaleType [Povinné] Typ algoritmu škálování nasazení Cílové využití (povinné)
targetUtilizationPercentage Cílové využití procesoru pro automatické škálování int (integer)

TrackedResourceTags

Název Popis Hodnota

Přiřazené identity uživatele

Název Popis Hodnota

Identita přiřazená uživatelem (UserAssignedIdentity)

Název Popis Hodnota

Příklady použití

Definice prostředku Terraformu (poskytovatel AzAPI)

Pracovní prostory/ onlineEndpoints/deployments typ prostředku je možné nasadit s operacemi, které cílí:

  • skupiny prostředků

Seznam změněných vlastností v jednotlivých verzích rozhraní API najdete v protokolu změn.

Formát prostředku

Pokud chcete vytvořit prostředek Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments, přidejte do šablony následující Terraform.

resource "azapi_resource" "symbolicname" {
  type = "Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments@2023-10-01"
  name = "string"
  parent_id = "string"
  identity {
    type = "string"
    identity_ids = [
      "string"
    ]
  }
  location = "string"
  tags = {
    {customized property} = "string"
  }
  body = {
    kind = "string"
    properties = {
      appInsightsEnabled = bool
      codeConfiguration = {
        codeId = "string"
        scoringScript = "string"
      }
      description = "string"
      egressPublicNetworkAccess = "string"
      environmentId = "string"
      environmentVariables = {
        {customized property} = "string"
      }
      instanceType = "string"
      livenessProbe = {
        failureThreshold = int
        initialDelay = "string"
        period = "string"
        successThreshold = int
        timeout = "string"
      }
      model = "string"
      modelMountPath = "string"
      properties = {
        {customized property} = "string"
      }
      readinessProbe = {
        failureThreshold = int
        initialDelay = "string"
        period = "string"
        successThreshold = int
        timeout = "string"
      }
      requestSettings = {
        maxConcurrentRequestsPerInstance = int
        maxQueueWait = "string"
        requestTimeout = "string"
      }
      scaleSettings = {
        scaleType = "string"
        // For remaining properties, see OnlineScaleSettings objects
      }
      endpointComputeType = "string"
      // For remaining properties, see OnlineDeploymentProperties objects
    }
    sku = {
      capacity = int
      family = "string"
      name = "string"
      size = "string"
      tier = "string"
    }
  }
}

Objekty OnlineScaleSettings

Nastavte scaleType vlastnost určit typ objektu.

Pro Výchozípoužijte:

{
  scaleType = "Default"
}

Pro cílové využitípoužijte:

{
  maxInstances = int
  minInstances = int
  pollingInterval = "string"
  scaleType = "TargetUtilization"
  targetUtilizationPercentage = int
}

Objekty OnlineDeploymentProperties

Nastavte endpointComputeType vlastnost určit typ objektu.

Pro Kubernetes použijte:

{
  containerResourceRequirements = {
    containerResourceLimits = {
      cpu = "string"
      gpu = "string"
      memory = "string"
    }
    containerResourceRequests = {
      cpu = "string"
      gpu = "string"
      memory = "string"
    }
  }
  endpointComputeType = "Kubernetes"
}

Pro spravovanépoužijte:

{
  endpointComputeType = "Managed"
}

Hodnoty vlastností

Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments

Název Popis Hodnota
identita Identita spravované služby (identita přiřazená systémem nebo identita přiřazená uživatelem) ManagedServiceIdentity
laskavý Metadata používaná portálem, nástroji atd. k vykreslení různých prostředí uživatelského rozhraní pro prostředky stejného typu. řetězec
poloha Geografické umístění, ve kterém se nachází zdroj string (povinné)
název Název prostředku řetězec

Omezení:
Model = ^[a-zA-Z0-9][a-zA-Z0-9\-_]{0,254}$ (povinné)
ID rodiče ID prostředku, který je nadřazený pro tento prostředek. ID prostředku typu: pracovních prostorů/onlineEndpoints
vlastnosti [Povinné] Další atributy entity. OnlineDeploymentProperties (povinné)
SKU (identifikátor zboží) Podrobnosti skladové položky vyžadované pro kontrakt ARM pro automatické škálování Sku
štítky Štítky prostředků Slovník názvů a hodnot značek
typ Typ prostředku Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments@2023-10-01"

Konfigurace kódu

Název Popis Hodnota
ID kódu ID prostředku ARM prostředku kódu řetězec
BodováníScriptu [Povinné] Skript, který se má spustit při spuštění. Např. "score.py" řetězec

Omezení:
Minimální délka = 1
Model = [a-zA-Z0-9_] (povinné)

Požadavky na zdroje kontejneru

Název Popis Hodnota
containerResourceLimits Informace o limitu prostředků kontejneru: Nastavení zdroje kontejneru
containerResourceRequests Informace o požadavku na prostředek kontejneru: Nastavení zdroje kontejneru

Nastavení zdroje kontejneru

Název Popis Hodnota
procesor Počet požadavků nebo limitu počtu vCPU pro kontejner Více informací:
https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/
řetězec
GPU Počet požadavků nebo omezení karet Nvidia GPU pro kontejner Více informací:
https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/
řetězec
paměť Požadavek nebo limit velikosti paměti pro kontejner. Více informací:
https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/
řetězec

DefaultScaleSettings

Název Popis Hodnota
scaleType [Povinné] Typ algoritmu škálování nasazení Výchozí (povinné)

EndpointDeploymentPropertiesBaseEnvironmentVariables

Název Popis Hodnota

EndpointDeploymentPropertiesBaseProperties

Název Popis Hodnota

Nasazení KubernetesOnline

Název Popis Hodnota
containerResourceRequirements Požadavky na prostředky pro kontejner (procesor a paměť). Požadavky na zdroje kontejneru
koncový bod ComputeType [Povinné] Typ výpočetního objektu koncového bodu. Kubernetes (povinné)

ManagedOnlineDeployment

Název Popis Hodnota
koncový bod ComputeType [Povinné] Typ výpočetního objektu koncového bodu. Spravované (povinné)

Identita spravované služby

Název Popis Hodnota
typ Typ identity spravované služby (kde jsou povolené typy SystemAssigned i UserAssigned). None (Žádný)
SystemAssigned
SystemAssigned, UserAssigned
UserAssigned (povinné)
uživatelem přiřazené identity Sada identit přiřazených uživatelem přidružená k prostředku. Klíče slovníku userAssignedIdentities budou ID prostředků ARM ve formuláři: /subscriptions/{subscriptionId}/resourceGroups/{resourceGroupName}/providers/Microsoft.ManagedIdentity/userAssignedIdentities/{identityName}. Hodnoty slovníku můžou být prázdné objekty ({}) v požadavcích. userAssignedIdentities

Vlastnosti online nasazení

Název Popis Hodnota
appInsightsEnabled Pokud je pravda, povolí protokolování Application Insights. Booleova hodnota
CodeConfiguration Konfigurace kódu pro nasazení koncového bodu Konfigurace kódu
popis Popis nasazení koncového bodu řetězec
egressPublicNetworkAccess Pokud je tato možnost povolená, povolte přístup k veřejné síti pro výchozí přenos dat. Pokud je zakázáno, vytvoří se zabezpečený výchozí přenos dat. Výchozí hodnota: Povoleno. Zakázáno
Povoleno
koncový bod ComputeType Nastavte na Kubernetes pro typ KubernetesOnlineDeployment. U typu ManagedOnlineDeploymentna hodnotu ManagedOnlineDeployment . Kubernetes
Spravované (povinné)
ID prostředí ID prostředku ARM nebo AssetId specifikace prostředí pro nasazení koncového bodu řetězec
proměnné prostředí Konfigurace proměnných prostředí pro nasazení EndpointDeploymentPropertiesBaseEnvironmentVariables
typ instance Typ výpočetní instance. řetězec
livenessProbe Sonda aktivity pravidelně monitoruje stav kontejneru. Nastavení sondy
model Cesta URI k modelu. řetězec
ModelMountPath Cesta k připojení modelu ve vlastním kontejneru. řetězec
vlastnosti Slovník vlastností Vlastnosti lze přidat, ale ne odebrat nebo změnit. endpointDeploymentPropertiesBaseProperties
readinessProbe Sonda připravenosti ověří, jestli je kontejner připravený obsluhovat provoz. Vlastnosti a výchozí hodnoty jsou stejné jako sonda aktivity. Nastavení sondy
Nastavení požadavku Požádejte o nastavení nasazení. OnlineRequestSettings
nastavení škálování Nastavení škálování pro nasazení
Pokud je hodnota null nebo není zadaná,
Výchozí hodnota TargetUtilizationScaleSettings pro KubernetesOnlineDeployment
a do DefaultScaleSettings pro ManagedOnlineDeployment.
OnlineScaleSettings

Nastavení online požadavku

Název Popis Hodnota
maxConcurrentRequestsPerInstance Počet maximálních souběžných požadavků na uzel povolený pro každé nasazení. Výchozí hodnota je 1. int (integer)
maxQueueWait (Zastaralé pro spravované online koncové body) Maximální doba, po kterou požadavek zůstane ve frontě ve formátu ISO 8601.
Výchozí hodnota je 500 ms.
(Nyní zvyšte úroveň request_timeout_ms , aby se zohlednily případné zpoždění sítě nebo fronty)
řetězec
Časový limit požadavku Časový limit bodování ve formátu ISO 8601.
Výchozí hodnota je 5000 ms.
řetězec

Nastavení měřítka online

Název Popis Hodnota
scaleType Pro typ DefaultScaleSettingsnastavte na DefaultScaleSettings . Pro typ TargetUtilizationScaleSettings nastavte na TargetUtilizationSettings. Výchozí
Cílové využití (povinné)

Nastavení sondy

Název Popis Hodnota
prahová hodnota selhání Počet chyb, které se mají povolit před vrácením stavu, který není v pořádku. int (integer)
počáteční zpoždění Zpoždění před první sondou ve formátu ISO 8601. řetězec
období Doba mezi sondami ve formátu ISO 8601. řetězec
prahová hodnota úspěchu Počet úspěšných sond před vrácením stavu v pořádku. int (integer)
časový limit Časový limit sondy ve formátu ISO 8601. řetězec

Sku

Název Popis Hodnota
kapacita Pokud skladová položka podporuje horizontální navýšení/snížení kapacity, měla by být zahrnuta celá čísla kapacity. Pokud není pro prostředek možné horizontální navýšení kapacity nebo jeho snížení kapacity, může se tento parametr vynechat. int (integer)
rodina Pokud má služba různé generace hardwaru, pro stejnou skladovou položku, můžete ji zde zachytit. řetězec
název Název skladové položky. Ex - P3. Obvykle se jedná o písmeno+číslo. string (povinné)
velikost Velikost skladové položky. Pokud je pole název kombinací vrstvy a jiné hodnoty, jedná se o samostatný kód. řetězec
přesunout do jiné vrstvy Toto pole musí implementovat poskytovatel prostředků, pokud má služba více než jednu úroveň, ale nevyžaduje se u put. "Základní"
"Zdarma"
Premium
"Standardní"

TargetUtilizationScaleSettings

Název Popis Hodnota
maxInstances Maximální počet instancí, na které se může nasazení škálovat. Kvóta bude vyhrazena pro max_instances. int (integer)
minInstance Minimální početinstancíchch int (integer)
interval dotazování Interval dotazování ve formátu ISO 8691. Podporuje pouze dobu trvání s přesností v sekundách. řetězec
scaleType [Povinné] Typ algoritmu škálování nasazení Cílové využití (povinné)
targetUtilizationPercentage Cílové využití procesoru pro automatické škálování int (integer)

TrackedResourceTags

Název Popis Hodnota

Přiřazené identity uživatele

Název Popis Hodnota

Identita přiřazená uživatelem (UserAssignedIdentity)

Název Popis Hodnota