Share via


Microsoft.MachineLearningServices çalışma alanları/onlineEndpoints/deployments 2023-10-01

Bicep kaynak tanımı

Çalışma alanları/onlineEndpoints/deployments kaynak türü, aşağıdakileri hedefleyen işlemlerle dağıtılabilir:

Her API sürümünde değiştirilen özelliklerin listesi için bkz. değişiklik günlüğü.

Kaynak biçimi

Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments kaynağı oluşturmak için aşağıdaki Bicep'i şablonunuza ekleyin.

resource symbolicname 'Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments@2023-10-01' = {
  name: 'string'
  location: 'string'
  tags: {
    tagName1: 'tagValue1'
    tagName2: 'tagValue2'
  }
  sku: {
    capacity: int
    family: 'string'
    name: 'string'
    size: 'string'
    tier: 'string'
  }
  kind: 'string'
  parent: resourceSymbolicName
  identity: {
    type: 'string'
    userAssignedIdentities: {
      {customized property}: {}
    }
  }
  properties: {
    appInsightsEnabled: bool
    codeConfiguration: {
      codeId: 'string'
      scoringScript: 'string'
    }
    description: 'string'
    egressPublicNetworkAccess: 'string'
    environmentId: 'string'
    environmentVariables: {
      {customized property}: 'string'
      {customized property}: 'string'
    }
    instanceType: 'string'
    livenessProbe: {
      failureThreshold: int
      initialDelay: 'string'
      period: 'string'
      successThreshold: int
      timeout: 'string'
    }
    model: 'string'
    modelMountPath: 'string'
    properties: {
      {customized property}: 'string'
      {customized property}: 'string'
    }
    readinessProbe: {
      failureThreshold: int
      initialDelay: 'string'
      period: 'string'
      successThreshold: int
      timeout: 'string'
    }
    requestSettings: {
      maxConcurrentRequestsPerInstance: int
      maxQueueWait: 'string'
      requestTimeout: 'string'
    }
    scaleSettings: {
      scaleType: 'string'
      // For remaining properties, see OnlineScaleSettings objects
    }
    endpointComputeType: 'string'
    // For remaining properties, see OnlineDeploymentProperties objects
  }
}

OnlineDeploymentProperties nesneleri

nesne türünü belirtmek için endpointComputeType özelliğini ayarlayın.

Kubernetes için şunu kullanın:

  endpointComputeType: 'Kubernetes'
  containerResourceRequirements: {
    containerResourceLimits: {
      cpu: 'string'
      gpu: 'string'
      memory: 'string'
    }
    containerResourceRequests: {
      cpu: 'string'
      gpu: 'string'
      memory: 'string'
    }
  }

Yönetilen için şunu kullanın:

  endpointComputeType: 'Managed'

OnlineScaleSettings nesneleri

nesne türünü belirtmek için scaleType özelliğini ayarlayın.

Varsayılan için şunu kullanın:

  scaleType: 'Default'

TargetUtilization için şunu kullanın:

  scaleType: 'TargetUtilization'
  maxInstances: int
  minInstances: int
  pollingInterval: 'string'
  targetUtilizationPercentage: int

Özellik değerleri

workspaces/onlineEndpoints/deployments

Ad Açıklama Değer
name Kaynak adı

Bicep'te alt kaynaklar için adları ve türleri ayarlamayı öğrenin.
dize (gerekli)
location Kaynağın bulunduğu coğrafi konum dize (gerekli)
etiketler Kaynak etiketleri. Etiket adlarının ve değerlerinin sözlüğü. Bkz. Şablonlardaki etiketler
Sku Otomatik Ölçeklendirme için ARM sözleşmesi için gereken SKU ayrıntıları. Sku
Tür Portal/araçlar/vb. tarafından aynı türdeki kaynaklar için farklı UX deneyimlerini işlemek için kullanılan meta veriler. string
Üst Bicep'te alt kaynak için üst kaynağı belirtebilirsiniz. Bu özelliği yalnızca alt kaynak üst kaynağın dışında bildirildiğinde eklemeniz gerekir.

Daha fazla bilgi için bkz . Üst kaynağın dışındaki alt kaynak.
Kaynak türü için sembolik ad: onlineEndpoints
identity Yönetilen hizmet kimliği (sistem tarafından atanan ve/veya kullanıcı tarafından atanan kimlikler) ManagedServiceIdentity
properties [Gerekli] Varlığın ek öznitelikleri. OnlineDeploymentProperties (gerekli)

ManagedServiceIdentity

Ad Açıklama Değer
tür Yönetilen hizmet kimliğinin türü (hem SystemAssigned hem de UserAssigned türlerine izin verilir). 'Yok'
'SystemAssigned'
'SystemAssigned,UserAssigned'
'UserAssigned' (gerekli)
userAssignedIdentities Kaynakla ilişkili kullanıcı tarafından atanan kimlik kümesi. userAssignedIdentities sözlük anahtarları şu biçimde ARM kaynak kimlikleri olacaktır: '/subscriptions/{subscriptionId}/resourceGroups/{resourceGroupName}/providers/Microsoft.ManagedIdentity/userAssignedIdentities/{identityName}. Sözlük değerleri, isteklerdeki boş nesneler ({}) olabilir. UserAssignedIdentities

UserAssignedIdentities

Ad Açıklama Değer
{özelleştirilmiş özellik} UserAssignedIdentity

UserAssignedIdentity

Bu nesne dağıtım sırasında ayarlanacağı herhangi bir özellik içermiyor. Tüm özellikler ReadOnly'dır.

OnlineDeploymentProperties

Ad Açıklama Değer
appInsightsEnabled True ise Application Insights günlüğünü etkinleştirir. bool
codeConfiguration Uç nokta dağıtımı için kod yapılandırması. CodeConfiguration
açıklama Uç nokta dağıtımının açıklaması. string
egressPublicNetworkAccess Etkinse çıkış genel ağ erişimine izin verin. Devre dışı bırakılırsa güvenli çıkış oluşturulur. Varsayılan: Etkin. 'Devre Dışı'
'Etkin'
environmentId Uç nokta dağıtımı için ortam belirtiminin ARM kaynak kimliği veya AssetId değeri. string
environmentVariables Dağıtım için ortam değişkenleri yapılandırması. EndpointDeploymentPropertiesBaseEnvironmentVariables
instanceType İşlem örneği türü. string
livenessProbe Canlılık araştırması kapsayıcının durumunu düzenli olarak izler. ProbeSettings
model Modelin URI yolu. string
modelMountPath Modeli özel kapsayıcıya bağlama yolu. string
properties Özellik sözlüğü. Özellikler eklenebilir, ancak kaldırılamaz veya değiştirilemez. EndpointDeploymentPropertiesBaseProperties
readinessProbe Hazırlık yoklaması, kapsayıcının trafiğe hizmet etmeye hazır olup olmadığını doğrular. Özellikler ve varsayılanlar canlılık yoklaması ile aynıdır. ProbeSettings
requestSettings Dağıtım için istek ayarları. OnlineRequestSettings
scaleSettings Dağıtım için ayarları ölçeklendirin.
Null ise veya sağlanmadıysa,
KubernetesOnlineDeployment için varsayılan olarak TargetUtilizationScaleSettings olarak belirlenmiştir
ve ManagedOnlineDeployment için DefaultScaleSettings'e gidin.
OnlineScaleSettings
endpointComputeType Nesne türünü ayarlama Kubernetes
Yönetilen (gerekli)

CodeConfiguration

Ad Açıklama Değer
codeId Kod varlığının ARM kaynak kimliği. string
scoringScript [Gerekli] Başlangıçta yürütülecek betik. Örneğin "score.py" dize (gerekli)

Kısıtlama -ları:
En az uzunluk = 1
Desen = [a-zA-Z0-9_]

EndpointDeploymentPropertiesBaseEnvironmentVariables

Ad Açıklama Değer
{özelleştirilmiş özellik} string
{özelleştirilmiş özellik} string

ProbeSettings

Ad Açıklama Değer
failureThreshold İyi durumda olmayan bir durum döndürmeden önce izin verilmeyen hata sayısı. int
ınitialdelay ISO 8601 biçimindeki ilk araştırmadan önceki gecikme. string
dönem ISO 8601 biçimindeki yoklamalar arasındaki süre. string
successThreshold İyi durumda bir durum döndürmeden önce başarılı yoklamaların sayısı. int
timeout ISO 8601 biçiminde araştırma zaman aşımı. string

EndpointDeploymentPropertiesBaseProperties

Ad Açıklama Değer
{özelleştirilmiş özellik} string
{özelleştirilmiş özellik} string

OnlineRequestSettings

Ad Açıklama Değer
maxConcurrentRequestsPerInstance Dağıtım başına izin verilen düğüm başına en fazla eşzamanlı istek sayısı. Varsayılan olarak 1'e ayarlanır. int
maxQueueWait bir isteğin ISO 8601 biçiminde kuyrukta kalacağı en uzun süre.
Varsayılan değer 500ms'tir.
string
requestTimeout ISO 8601 biçiminde puanlama zaman aşımı.
Varsayılan değer 5000ms'tir.
string

OnlineScaleSettings

Ad Açıklama Değer
scaleType Nesne türünü ayarlama Default
TargetUtilization (gerekli)

DefaultScaleSettings

Ad Açıklama Değer
scaleType [Gerekli] Dağıtım ölçeklendirme algoritmasının türü 'Varsayılan' (gerekli)

TargetUtilizationScaleSettings

Ad Açıklama Değer
scaleType [Gerekli] Dağıtım ölçeklendirme algoritmasının türü 'TargetUtilization' (gerekli)
maxInstances Dağıtımın ölçeklendirilebileceği en fazla örnek sayısı. Kota max_instances için ayrılacaktır. int
minInstances Her zaman mevcut olacak en az örnek sayısı. int
Pollingınterval ISO 8691 biçimindeki yoklama aralığı. Yalnızca Saniye kadar düşük duyarlıkla süreyi destekler. string
targetUtilizationPercentage Otomatik ölçeklendirici için hedef CPU kullanımı. int

KubernetesOnlineDeployment

Ad Açıklama Değer
endpointComputeType [Gerekli] Uç noktanın işlem türü. 'Kubernetes' (gerekli)
containerResourceRequirements Kapsayıcı için kaynak gereksinimleri (cpu ve bellek). ContainerResourceRequirements

ContainerResourceRequirements

Ad Açıklama Değer
containerResourceLimits Kapsayıcı kaynak sınırı bilgileri: ContainerResourceSettings
containerResourceRequests Kapsayıcı kaynak isteği bilgileri: ContainerResourceSettings

ContainerResourceSettings

Ad Açıklama Değer
Cpu Kapsayıcı için vCPU isteği/sınırı sayısı. Daha fazla bilgi:
https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/
string
Gpu Kapsayıcı için Nvidia GPU kartı isteği/sınırı sayısı. Daha fazla bilgi:
https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/
string
bellek Kapsayıcı için bellek boyutu isteği/sınırı. Daha fazla bilgi:
https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/
string

ManagedOnlineDeployment

Ad Açıklama Değer
endpointComputeType [Gerekli] Uç noktanın işlem türü. 'Managed' (gerekli)

Sku

Ad Açıklama Değer
capacity SKU ölçeği genişletmeyi/daraltma işlemini destekliyorsa kapasite tamsayısı dahil edilmelidir. Kaynak için ölçeği genişletme/daraltma mümkün değilse bu atlanabilir. int
aile Hizmetin aynı SKU için farklı nesil donanımları varsa, bu burada yakalanabilir. string
name SKU'nun adı. Ex - P3. Bu genellikle letter+number kodudur dize (gerekli)
boyut SKU boyutu. Ad alanı katman ile başka bir değerin birleşimi olduğunda, bu tek başına kod olur. string
tier Hizmetin birden fazla katmanı varsa ancak PUT üzerinde gerekli değilse, bu alanın Kaynak Sağlayıcısı tarafından uygulanması gerekir. 'Temel'
'Ücretsiz'
'Premium'
'Standart'

ARM şablonu kaynak tanımı

Çalışma alanları/onlineEndpoints/deployments kaynak türü, aşağıdakileri hedefleyen işlemlerle dağıtılabilir:

Her API sürümünde değiştirilen özelliklerin listesi için bkz. değişiklik günlüğü.

Kaynak biçimi

Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments kaynağı oluşturmak için, şablonunuza aşağıdaki JSON'u ekleyin.

{
  "type": "Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments",
  "apiVersion": "2023-10-01",
  "name": "string",
  "location": "string",
  "tags": {
    "tagName1": "tagValue1",
    "tagName2": "tagValue2"
  },
  "sku": {
    "capacity": "int",
    "family": "string",
    "name": "string",
    "size": "string",
    "tier": "string"
  },
  "kind": "string",
  "identity": {
    "type": "string",
    "userAssignedIdentities": {
      "{customized property}": {}
    }
  },
  "properties": {
    "appInsightsEnabled": "bool",
    "codeConfiguration": {
      "codeId": "string",
      "scoringScript": "string"
    },
    "description": "string",
    "egressPublicNetworkAccess": "string",
    "environmentId": "string",
    "environmentVariables": {
      "{customized property}": "string",
      "{customized property}": "string"
    },
    "instanceType": "string",
    "livenessProbe": {
      "failureThreshold": "int",
      "initialDelay": "string",
      "period": "string",
      "successThreshold": "int",
      "timeout": "string"
    },
    "model": "string",
    "modelMountPath": "string",
    "properties": {
      "{customized property}": "string",
      "{customized property}": "string"
    },
    "readinessProbe": {
      "failureThreshold": "int",
      "initialDelay": "string",
      "period": "string",
      "successThreshold": "int",
      "timeout": "string"
    },
    "requestSettings": {
      "maxConcurrentRequestsPerInstance": "int",
      "maxQueueWait": "string",
      "requestTimeout": "string"
    },
    "scaleSettings": {
      "scaleType": "string"
      // For remaining properties, see OnlineScaleSettings objects
    },
    "endpointComputeType": "string"
    // For remaining properties, see OnlineDeploymentProperties objects
  }
}

OnlineDeploymentProperties nesneleri

nesne türünü belirtmek için endpointComputeType özelliğini ayarlayın.

Kubernetes için şunu kullanın:

  "endpointComputeType": "Kubernetes",
  "containerResourceRequirements": {
    "containerResourceLimits": {
      "cpu": "string",
      "gpu": "string",
      "memory": "string"
    },
    "containerResourceRequests": {
      "cpu": "string",
      "gpu": "string",
      "memory": "string"
    }
  }

Yönetilen için şunu kullanın:

  "endpointComputeType": "Managed"

OnlineScaleSettings nesneleri

nesne türünü belirtmek için scaleType özelliğini ayarlayın.

Varsayılan için şunu kullanın:

  "scaleType": "Default"

TargetUtilization için şunu kullanın:

  "scaleType": "TargetUtilization",
  "maxInstances": "int",
  "minInstances": "int",
  "pollingInterval": "string",
  "targetUtilizationPercentage": "int"

Özellik değerleri

workspaces/onlineEndpoints/deployments

Ad Açıklama Değer
tür Kaynak türü 'Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments'
apiVersion Kaynak API'sinin sürümü '2023-10-01'
name Kaynak adı

JSON ARM şablonlarında alt kaynaklar için adları ve türleri ayarlamayı öğrenin.
dize (gerekli)
location Kaynağın bulunduğu coğrafi konum dize (gerekli)
etiketler Kaynak etiketleri. Etiket adlarının ve değerlerinin sözlüğü. Bkz. Şablonlardaki etiketler
Sku Otomatik Ölçeklendirme için ARM sözleşmesi için gereken SKU ayrıntıları. Sku
Tür Portal/araçlar/vb. tarafından aynı türdeki kaynaklar için farklı UX deneyimlerini işlemek için kullanılan meta veriler. string
identity Yönetilen hizmet kimliği (sistem tarafından atanan ve/veya kullanıcı tarafından atanan kimlikler) ManagedServiceIdentity
properties [Gerekli] Varlığın ek öznitelikleri. OnlineDeploymentProperties (gerekli)

ManagedServiceIdentity

Ad Açıklama Değer
tür Yönetilen hizmet kimliğinin türü (hem SystemAssigned hem de UserAssigned türlerine izin verilir). 'Yok'
'SystemAssigned'
'SystemAssigned,UserAssigned'
'UserAssigned' (gerekli)
userAssignedIdentities Kaynakla ilişkili kullanıcı tarafından atanan kimlik kümesi. userAssignedIdentities sözlük anahtarları şu biçimde ARM kaynak kimlikleri olacaktır: '/subscriptions/{subscriptionId}/resourceGroups/{resourceGroupName}/providers/Microsoft.ManagedIdentity/userAssignedIdentities/{identityName}. Sözlük değerleri, isteklerdeki boş nesneler ({}) olabilir. UserAssignedIdentities

UserAssignedIdentities

Ad Açıklama Değer
{özelleştirilmiş özellik} UserAssignedIdentity

UserAssignedIdentity

Bu nesne dağıtım sırasında ayarlanacağı herhangi bir özellik içermiyor. Tüm özellikler ReadOnly'dır.

OnlineDeploymentProperties

Ad Açıklama Değer
appInsightsEnabled True ise Application Insights günlüğünü etkinleştirir. bool
codeConfiguration Uç nokta dağıtımı için kod yapılandırması. CodeConfiguration
açıklama Uç nokta dağıtımının açıklaması. string
egressPublicNetworkAccess Etkinse çıkış genel ağ erişimine izin verin. Devre dışı bırakılırsa, bu güvenli çıkış oluşturur. Varsayılan: Etkin. 'Devre Dışı'
'Etkin'
environmentId Uç nokta dağıtımı için ortam belirtiminin ARM kaynak kimliği veya AssetId değeri. string
environmentVariables Dağıtım için ortam değişkenleri yapılandırması. EndpointDeploymentPropertiesBaseEnvironmentVariables
instanceType İşlem örneği türü. string
canlılıkProbe Canlılık yoklaması kapsayıcının durumunu düzenli olarak izler. ProbeSettings
model Modelin URI yolu. string
modelMountPath Modeli özel kapsayıcıya bağlama yolu. string
properties Özellik sözlüğü. Özellikler eklenebilir, ancak kaldırılamaz veya değiştirilemez. EndpointDeploymentPropertiesBaseProperties
readinessProbe Hazır olma yoklaması, kapsayıcının trafiğe hizmet etmeye hazır olup olmadığını doğrular. Özellikler ve varsayılanlar canlılık yoklaması ile aynıdır. ProbeSettings
requestSettings Dağıtım için istek ayarları. OnlineRequestSettings
scaleSettings Dağıtım için ölçek ayarları.
Null ise veya sağlanmadıysa,
Varsayılan olarak KubernetesOnlineDeployment için TargetUtilizationScaleSettings olarak ayarlanır
ve ManagedOnlineDeployment için DefaultScaleSettings'e gidin.
OnlineScaleSettings
endpointComputeType Nesne türünü ayarlama Kubernetes
Yönetilen (gerekli)

CodeConfiguration

Ad Açıklama Değer
codeId Kod varlığının ARM kaynak kimliği. string
scoringScript [Gerekli] Başlangıçta yürütülecek betik. Örneğin "score.py" dize (gerekli)

Kısıtlama -ları:
En az uzunluk = 1
Desen = [a-zA-Z0-9_]

EndpointDeploymentPropertiesBaseEnvironmentVariables

Ad Açıklama Değer
{özelleştirilmiş özellik} string
{özelleştirilmiş özellik} string

ProbeSettings

Ad Açıklama Değer
failureThreshold İyi durumda olmayan bir durum döndürmeden önce izin verilmeyen hata sayısı. int
ınitialdelay ISO 8601 biçimindeki ilk yoklamadan önceki gecikme. string
dönem ISO 8601 biçimindeki yoklamalar arasındaki süre. string
successThreshold İyi durumda döndürmeden önce başarılı yoklamaların sayısı. int
timeout ISO 8601 biçiminde yoklama zaman aşımı. string

EndpointDeploymentPropertiesBaseProperties

Ad Açıklama Değer
{özelleştirilmiş özellik} string
{özelleştirilmiş özellik} string

OnlineRequestSettings

Ad Açıklama Değer
maxConcurrentRequestsPerInstance Dağıtım başına izin verilen düğüm başına en fazla eşzamanlı istek sayısı. Varsayılan değer 1'tir. int
maxQueueWait Bir isteğin ISO 8601 biçiminde kuyrukta kalacağı maksimum süre.
Varsayılan değer 500ms'tir.
string
requestTimeout ISO 8601 biçiminde puanlama zaman aşımı.
Varsayılan değer 5000ms'tir.
string

OnlineScaleSettings

Ad Açıklama Değer
scaleType Nesne türünü ayarlama Default
TargetUtilization (gerekli)

DefaultScaleSettings

Ad Açıklama Değer
scaleType [Gerekli] Dağıtım ölçeklendirme algoritmasının türü 'Varsayılan' (gerekli)

TargetUtilizationScaleSettings

Ad Açıklama Değer
scaleType [Gerekli] Dağıtım ölçeklendirme algoritmasının türü 'TargetUtilization' (gerekli)
maxInstances Dağıtımın ölçeklendirilebileceği en fazla örnek sayısı. Kota max_instances için ayrılacaktır. int
minInstances Her zaman mevcut olacak en az örnek sayısı. int
Pollingınterval ISO 8691 biçimindeki yoklama aralığı. Yalnızca Saniye kadar düşük duyarlıkla süreyi destekler. string
targetUtilizationPercentage Otomatik ölçeklendirici için hedef CPU kullanımı. int

KubernetesOnlineDeployment

Ad Açıklama Değer
endpointComputeType [Gerekli] Uç noktanın işlem türü. 'Kubernetes' (gerekli)
containerResourceRequirements Kapsayıcının kaynak gereksinimleri (cpu ve bellek). ContainerResourceRequirements

ContainerResourceRequirements

Ad Açıklama Değer
containerResourceLimits Kapsayıcı kaynak sınırı bilgileri: ContainerResourceSettings
containerResourceRequests Kapsayıcı kaynak isteği bilgileri: ContainerResourceSettings

ContainerResourceSettings

Ad Açıklama Değer
Cpu Kapsayıcı için vCPU isteği/sınırı sayısı. Daha fazla bilgi:
https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/
string
Gpu Kapsayıcı için Nvidia GPU kartı isteği/sınırı sayısı. Daha fazla bilgi:
https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/
string
bellek Kapsayıcı için bellek boyutu isteği/sınırı. Daha fazla bilgi:
https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/
string

ManagedOnlineDeployment

Ad Açıklama Değer
endpointComputeType [Gerekli] Uç noktanın işlem türü. 'Yönetilen' (gerekli)

Sku

Ad Açıklama Değer
capacity SKU ölçeği genişletmeyi/daraltma işlemini destekliyorsa kapasite tamsayısı dahil edilmelidir. Kaynak için ölçeği genişletme/daraltma mümkün değilse bu atlanabilir. int
aile Hizmetin aynı SKU için farklı nesil donanımları varsa, bu burada yakalanabilir. string
name SKU'nun adı. Ex - P3. Bu genellikle letter+number kodudur dize (gerekli)
boyut SKU boyutu. Ad alanı katman ile başka bir değerin birleşimi olduğunda, bu tek başına kod olur. string
tier Hizmetin birden fazla katmanı varsa ancak PUT üzerinde gerekli değilse, bu alanın Kaynak Sağlayıcısı tarafından uygulanması gerekir. 'Temel'
'Ücretsiz'
'Premium'
'Standart'

Terraform (AzAPI sağlayıcısı) kaynak tanımı

Çalışma alanları/onlineEndpoints/deployments kaynak türü, aşağıdakileri hedefleyen işlemlerle dağıtılabilir:

  • Kaynak grupları

Her API sürümünde değiştirilen özelliklerin listesi için bkz. değişiklik günlüğü.

Kaynak biçimi

Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments kaynağı oluşturmak için aşağıdaki Terraform'u şablonunuza ekleyin.

resource "azapi_resource" "symbolicname" {
  type = "Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments@2023-10-01"
  name = "string"
  location = "string"
  parent_id = "string"
  tags = {
    tagName1 = "tagValue1"
    tagName2 = "tagValue2"
  }
  identity {
    type = "string"
    identity_ids = []
  }
  body = jsonencode({
    properties = {
      appInsightsEnabled = bool
      codeConfiguration = {
        codeId = "string"
        scoringScript = "string"
      }
      description = "string"
      egressPublicNetworkAccess = "string"
      environmentId = "string"
      environmentVariables = {
        {customized property} = "string"
        {customized property} = "string"
      }
      instanceType = "string"
      livenessProbe = {
        failureThreshold = int
        initialDelay = "string"
        period = "string"
        successThreshold = int
        timeout = "string"
      }
      model = "string"
      modelMountPath = "string"
      properties = {
        {customized property} = "string"
        {customized property} = "string"
      }
      readinessProbe = {
        failureThreshold = int
        initialDelay = "string"
        period = "string"
        successThreshold = int
        timeout = "string"
      }
      requestSettings = {
        maxConcurrentRequestsPerInstance = int
        maxQueueWait = "string"
        requestTimeout = "string"
      }
      scaleSettings = {
        scaleType = "string"
        // For remaining properties, see OnlineScaleSettings objects
      }
      endpointComputeType = "string"
      // For remaining properties, see OnlineDeploymentProperties objects
    }
    sku = {
      capacity = int
      family = "string"
      name = "string"
      size = "string"
      tier = "string"
    }
    kind = "string"
  })
}

OnlineDeploymentProperties nesneleri

nesne türünü belirtmek için endpointComputeType özelliğini ayarlayın.

Kubernetes için şunu kullanın:

  endpointComputeType = "Kubernetes"
  containerResourceRequirements = {
    containerResourceLimits = {
      cpu = "string"
      gpu = "string"
      memory = "string"
    }
    containerResourceRequests = {
      cpu = "string"
      gpu = "string"
      memory = "string"
    }
  }

Yönetilen için şunu kullanın:

  endpointComputeType = "Managed"

OnlineScaleSettings nesneleri

nesne türünü belirtmek için scaleType özelliğini ayarlayın.

Varsayılan için şunu kullanın:

  scaleType = "Default"

TargetUtilization için şunu kullanın:

  scaleType = "TargetUtilization"
  maxInstances = int
  minInstances = int
  pollingInterval = "string"
  targetUtilizationPercentage = int

Özellik değerleri

workspaces/onlineEndpoints/deployments

Ad Açıklama Değer
tür Kaynak türü "Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments@2023-10-01"
name Kaynak adı dize (gerekli)
location Kaynağın bulunduğu coğrafi konum dize (gerekli)
parent_id Bu kaynağın üst öğesi olan kaynağın kimliği. Kaynak türü: onlineEndpoints kimliği
etiketler Kaynak etiketleri. Etiket adlarının ve değerlerinin sözlüğü.
Sku Otomatik Ölçeklendirme için ARM sözleşmesi için gereken SKU ayrıntıları. Sku
Tür Portal/araçlar/vb. tarafından aynı türdeki kaynaklar için farklı UX deneyimlerini işlemek için kullanılan meta veriler. string
identity Yönetilen hizmet kimliği (sistem tarafından atanan ve/veya kullanıcı tarafından atanan kimlikler) ManagedServiceIdentity
properties [Gerekli] Varlığın ek öznitelikleri. OnlineDeploymentProperties (gerekli)

ManagedServiceIdentity

Ad Açıklama Değer
tür Yönetilen hizmet kimliğinin türü (hem SystemAssigned hem de UserAssigned türlerine izin verilir). "SystemAssigned"
"SystemAssigned,UserAssigned"
"UserAssigned" (gerekli)
identity_ids Kaynakla ilişkili kullanıcı tarafından atanan kimlik kümesi. userAssignedIdentities sözlük anahtarları şu biçimde ARM kaynak kimlikleri olacaktır: '/subscriptions/{subscriptionId}/resourceGroups/{resourceGroupName}/providers/Microsoft.ManagedIdentity/userAssignedIdentities/{identityName}. Sözlük değerleri, isteklerdeki boş nesneler ({}) olabilir. Kullanıcı kimliği kimlikleri dizisi.

UserAssignedIdentities

Ad Açıklama Değer
{özelleştirilmiş özellik} UserAssignedIdentity

UserAssignedIdentity

Bu nesne dağıtım sırasında ayarlanacağı herhangi bir özellik içermiyor. Tüm özellikler ReadOnly'dır.

OnlineDeploymentProperties

Ad Açıklama Değer
appInsightsEnabled True ise Application Insights günlüğünü etkinleştirir. bool
codeConfiguration Uç nokta dağıtımı için kod yapılandırması. CodeConfiguration
açıklama Uç nokta dağıtımının açıklaması. string
egressPublicNetworkAccess Etkinse çıkış genel ağ erişimine izin verin. Devre dışı bırakılırsa güvenli çıkış oluşturulur. Varsayılan: Etkin. "Devre dışı"
"Etkin"
environmentId Uç nokta dağıtımı için ortam belirtiminin ARM kaynak kimliği veya AssetId değeri. string
environmentVariables Dağıtım için ortam değişkenleri yapılandırması. EndpointDeploymentPropertiesBaseEnvironmentVariables
instanceType İşlem örneği türü. string
livenessProbe Canlılık araştırması kapsayıcının durumunu düzenli olarak izler. ProbeSettings
model Modelin URI yolu. string
modelMountPath Modeli özel kapsayıcıya bağlama yolu. string
properties Özellik sözlüğü. Özellikler eklenebilir, ancak kaldırılamaz veya değiştirilemez. EndpointDeploymentPropertiesBaseProperties
readinessProbe Hazırlık yoklaması, kapsayıcının trafiğe hizmet etmeye hazır olup olmadığını doğrular. Özellikler ve varsayılanlar canlılık yoklaması ile aynıdır. ProbeSettings
requestSettings Dağıtım için istek ayarları. OnlineRequestSettings
scaleSettings Dağıtım için ayarları ölçeklendirin.
Null ise veya sağlanmadıysa,
KubernetesOnlineDeployment için varsayılan olarak TargetUtilizationScaleSettings olarak belirlenmiştir
ve ManagedOnlineDeployment için DefaultScaleSettings'e gidin.
OnlineScaleSettings
endpointComputeType Nesne türünü ayarlama Kubernetes
Yönetilen (gerekli)

CodeConfiguration

Ad Açıklama Değer
codeId Kod varlığının ARM kaynak kimliği. string
scoringScript [Gerekli] Başlangıçta yürütülecek betik. Örneğin "score.py" dize (gerekli)

Kısıtlama -ları:
En az uzunluk = 1
Desen = [a-zA-Z0-9_]

EndpointDeploymentPropertiesBaseEnvironmentVariables

Ad Açıklama Değer
{özelleştirilmiş özellik} string
{özelleştirilmiş özellik} string

ProbeSettings

Ad Açıklama Değer
failureThreshold İyi durumda olmayan bir durum döndürmeden önce izin verilmeyen hata sayısı. int
ınitialdelay ISO 8601 biçimindeki ilk araştırmadan önceki gecikme. string
dönem ISO 8601 biçimindeki yoklamalar arasındaki süre. string
successThreshold İyi durumda bir durum döndürmeden önce başarılı yoklamaların sayısı. int
timeout ISO 8601 biçiminde araştırma zaman aşımı. string

EndpointDeploymentPropertiesBaseProperties

Ad Açıklama Değer
{özelleştirilmiş özellik} string
{özelleştirilmiş özellik} string

OnlineRequestSettings

Ad Açıklama Değer
maxConcurrentRequestsPerInstance Dağıtım başına izin verilen düğüm başına en fazla eşzamanlı istek sayısı. Varsayılan değer 1'tir. int
maxQueueWait Bir isteğin ISO 8601 biçiminde kuyrukta kalacağı maksimum süre.
Varsayılan değer 500ms'tir.
string
requestTimeout ISO 8601 biçiminde puanlama zaman aşımı.
Varsayılan değer 5000ms'tir.
string

OnlineScaleSettings

Ad Açıklama Değer
scaleType Nesne türünü ayarlama Default
TargetUtilization (gerekli)

DefaultScaleSettings

Ad Açıklama Değer
scaleType [Gerekli] Dağıtım ölçeklendirme algoritmasının türü "Varsayılan" (gerekli)

TargetUtilizationScaleSettings

Ad Açıklama Değer
scaleType [Gerekli] Dağıtım ölçeklendirme algoritmasının türü "TargetUtilization" (gerekli)
maxInstances Dağıtımın ölçeklendirilebileceği en fazla örnek sayısı. Kota max_instances için ayrılacaktır. int
minInstances Her zaman mevcut olacak en az örnek sayısı. int
Pollingınterval ISO 8691 biçimindeki yoklama aralığı. Yalnızca Saniye kadar düşük duyarlıkla süreyi destekler. string
targetUtilizationPercentage Otomatik ölçeklendirici için hedef CPU kullanımı. int

KubernetesOnlineDeployment

Ad Açıklama Değer
endpointComputeType [Gerekli] Uç noktanın işlem türü. "Kubernetes" (gerekli)
containerResourceRequirements Kapsayıcının kaynak gereksinimleri (cpu ve bellek). ContainerResourceRequirements

ContainerResourceRequirements

Ad Açıklama Değer
containerResourceLimits Kapsayıcı kaynak sınırı bilgileri: ContainerResourceSettings
containerResourceRequests Kapsayıcı kaynak isteği bilgileri: ContainerResourceSettings

ContainerResourceSettings

Ad Açıklama Değer
Cpu Kapsayıcı için vCPU isteği/sınırı sayısı. Daha fazla bilgi:
https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/
string
Gpu Kapsayıcı için Nvidia GPU kartı isteği/sınırı sayısı. Daha fazla bilgi:
https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/
string
bellek Kapsayıcı için bellek boyutu isteği/sınırı. Daha fazla bilgi:
https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/
string

ManagedOnlineDeployment

Ad Açıklama Değer
endpointComputeType [Gerekli] Uç noktanın işlem türü. "Yönetilen" (gerekli)

Sku

Ad Açıklama Değer
capacity SKU ölçeği genişletmeyi/daraltma işlemini destekliyorsa kapasite tamsayısı dahil edilmelidir. Kaynak için ölçeği genişletme/daraltma mümkün değilse bu atlanabilir. int
aile Hizmetin aynı SKU için farklı nesil donanımları varsa, bu burada yakalanabilir. string
name SKU'nun adı. Ex - P3. Bu genellikle letter+number kodudur dize (gerekli)
boyut SKU boyutu. Ad alanı katman ile başka bir değerin birleşimi olduğunda, bu tek başına kod olur. string
tier Hizmetin birden fazla katmanı varsa ancak PUT üzerinde gerekli değilse, bu alanın Kaynak Sağlayıcısı tarafından uygulanması gerekir. "Temel"
"Ücretsiz"
"Premium"
"Standart"