Share via


Microsoft.MachineLearningServices çalışma alanları/onlineEndpoints/deployments 2023-04-01-preview

Bicep kaynak tanımı

Çalışma alanları/onlineEndpoints/deployments kaynak türü şunları hedefleyen işlemlerle dağıtılabilir:

Her API sürümünde değiştirilen özelliklerin listesi için bkz. değişiklik günlüğü.

Kaynak biçimi

Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments kaynağı oluşturmak için şablonunuza aşağıdaki Bicep'i ekleyin.

resource symbolicname 'Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments@2023-04-01-preview' = {
  name: 'string'
  location: 'string'
  tags: {
    tagName1: 'tagValue1'
    tagName2: 'tagValue2'
  }
  sku: {
    capacity: int
    family: 'string'
    name: 'string'
    size: 'string'
    tier: 'string'
  }
  kind: 'string'
  parent: resourceSymbolicName
  identity: {
    type: 'string'
    userAssignedIdentities: {
      {customized property}: {}
    }
  }
  properties: {
    appInsightsEnabled: bool
    codeConfiguration: {
      codeId: 'string'
      scoringScript: 'string'
    }
    dataCollector: {
      collections: {
        {customized property}: {
          clientId: 'string'
          dataCollectionMode: 'string'
          dataId: 'string'
          samplingRate: int
        }
      }
      requestLogging: {
        captureHeaders: [
          'string'
        ]
      }
      rollingRate: 'string'
    }
    description: 'string'
    egressPublicNetworkAccess: 'string'
    environmentId: 'string'
    environmentVariables: {
      {customized property}: 'string'
      {customized property}: 'string'
    }
    instanceType: 'string'
    livenessProbe: {
      failureThreshold: int
      initialDelay: 'string'
      period: 'string'
      successThreshold: int
      timeout: 'string'
    }
    model: 'string'
    modelMountPath: 'string'
    properties: {
      {customized property}: 'string'
      {customized property}: 'string'
    }
    readinessProbe: {
      failureThreshold: int
      initialDelay: 'string'
      period: 'string'
      successThreshold: int
      timeout: 'string'
    }
    requestSettings: {
      maxConcurrentRequestsPerInstance: int
      maxQueueWait: 'string'
      requestTimeout: 'string'
    }
    scaleSettings: {
      scaleType: 'string'
      // For remaining properties, see OnlineScaleSettings objects
    }
    endpointComputeType: 'string'
    // For remaining properties, see OnlineDeploymentProperties objects
  }
}

OnlineDeploymentProperties nesneleri

nesne türünü belirtmek için endpointComputeType özelliğini ayarlayın.

Kubernetes için şunu kullanın:

  endpointComputeType: 'Kubernetes'
  containerResourceRequirements: {
    containerResourceLimits: {
      cpu: 'string'
      gpu: 'string'
      memory: 'string'
    }
    containerResourceRequests: {
      cpu: 'string'
      gpu: 'string'
      memory: 'string'
    }
  }

Yönetilen için şunu kullanın:

  endpointComputeType: 'Managed'

OnlineScaleSettings nesneleri

nesne türünü belirtmek için scaleType özelliğini ayarlayın.

Varsayılan için şunu kullanın:

  scaleType: 'Default'

TargetUtilization için şunu kullanın:

  scaleType: 'TargetUtilization'
  maxInstances: int
  minInstances: int
  pollingInterval: 'string'
  targetUtilizationPercentage: int

Özellik değerleri

çalışma alanları/onlineEndpoints/dağıtımlar

Ad Açıklama Değer
name Kaynak adı

Bicep'te alt kaynaklar için adları ve türleri ayarlamayı öğrenin.
dize (gerekli)
location Kaynağın bulunduğu coğrafi konum dize (gerekli)
etiketler Kaynak etiketleri. Etiket adlarının ve değerlerinin sözlüğü. Bkz . Şablonlardaki etiketler
Sku Otomatik Ölçeklendirme için ARM sözleşmesi için gereken SKU ayrıntıları. Sku
Tür Portal/araçlar/vb. tarafından aynı türdeki kaynaklar için farklı UX deneyimlerini işlemek için kullanılan meta veriler. string
Üst Bicep'te bir alt kaynağın üst kaynağını belirtebilirsiniz. Bu özelliği yalnızca alt kaynak üst kaynağın dışında bildirildiğinde eklemeniz gerekir.

Daha fazla bilgi için bkz . Üst kaynağın dışındaki alt kaynak.
Kaynak türü için sembolik ad: onlineEndpoints
identity Yönetilen hizmet kimliği (sistem tarafından atanan ve/veya kullanıcı tarafından atanan kimlikler) ManagedServiceIdentity
properties [Gerekli] Varlığın ek öznitelikleri. OnlineDeploymentProperties (gerekli)

ManagedServiceIdentity

Ad Açıklama Değer
tür Yönetilen hizmet kimliği türü (hem SystemAssigned hem de UserAssigned türlerine izin verilir). 'Yok'
'SystemAssigned'
'SystemAssigned,UserAssigned'
'UserAssigned' (gerekli)
userAssignedIdentities Kaynakla ilişkilendirilmiş kullanıcı tarafından atanan kimlik kümesi. userAssignedIdentities sözlük anahtarları şu formda ARM kaynak kimlikleri olacaktır: '/subscriptions/{subscriptionId}/resourceGroups/{resourceGroupName}/providers/Microsoft.ManagedIdentity/userAssignedIdentities/{identityName}. Sözlük değerleri, isteklerdeki boş nesneler ({}) olabilir. UserAssignedIdentities

UserAssignedIdentities

Ad Açıklama Değer
{özelleştirilmiş özellik} UserAssignedIdentity

UserAssignedIdentity

Bu nesne dağıtım sırasında ayarlanacağı herhangi bir özellik içermez. Tüm özellikler Salt Okunur'dır.

OnlineDeploymentProperties

Ad Açıklama Değer
appInsightsEnabled True ise Application Insights günlüğünü etkinleştirir. bool
codeConfiguration Uç nokta dağıtımı için kod yapılandırması. CodeConfiguration
Datacollector mdc yapılandırması null olduğunda mdc'yi devre dışı bırakırız. Datacollector
açıklama Uç nokta dağıtımının açıklaması. string
egressPublicNetworkAccess Etkinse çıkış genel ağ erişimine izin verin. Devre dışı bırakılırsa, bu güvenli çıkış oluşturur. Varsayılan: Etkin. 'Devre Dışı'
'Etkin'
environmentId Uç nokta dağıtımı için ortam belirtiminin ARM kaynak kimliği. string
environmentVariables Dağıtım için ortam değişkenleri yapılandırması. EndpointDeploymentPropertiesBaseEnvironmentVariables
instanceType İşlem örneği türü. string
canlılıkProbe Canlılık yoklaması kapsayıcının durumunu düzenli olarak izler. ProbeSettings
model Modelin URI yolu. string
modelMountPath Modeli özel kapsayıcıya bağlama yolu. string
properties Özellik sözlüğü. Özellikler eklenebilir, ancak kaldırılamaz veya değiştirilemez. EndpointDeploymentPropertiesBaseProperties
readinessProbe Hazır olma yoklaması, kapsayıcının trafiğe hizmet etmeye hazır olup olmadığını doğrular. Özellikler ve varsayılanlar canlılık yoklaması ile aynıdır. ProbeSettings
requestSettings Dağıtım için istek ayarları. OnlineRequestSettings
scaleSettings Dağıtım için ölçek ayarları.
Null ise veya sağlanmadıysa,
Varsayılan olarak KubernetesOnlineDeployment için TargetUtilizationScaleSettings olarak ayarlanır
ve ManagedOnlineDeployment için DefaultScaleSettings'e gidin.
OnlineScaleSettings
endpointComputeType Nesne türünü ayarlama Kubernetes
Yönetilen (gerekli)

CodeConfiguration

Ad Açıklama Değer
codeId Kod varlığının ARM kaynak kimliği. string
scoringScript [Gerekli] Başlangıçta yürütülecek betik. Örneğin "score.py" dize (gerekli)

Kısıtlama -ları:
En az uzunluk = 1
Desen = [a-zA-Z0-9_]

Datacollector

Ad Açıklama Değer
Koleksiyon [Gerekli] Koleksiyon yapılandırması. Her koleksiyonun model verilerini toplamak için kendi yapılandırması vardır ve koleksiyonun adı rastgele dize olabilir.
Model veri toplayıcısı yük günlüğü veya özel günlük kaydı ya da her ikisi için kullanılabilir. Toplama isteği ve yanıtı yük günlüğü için, diğerleri ise özel günlük kaydı için ayrılmıştır.
DataCollectorCollections (gerekli)
requestLogging mdc için istek günlüğü yapılandırması, tüm koleksiyonlar için gelişmiş günlük ayarlarını içerir. İsteğe bağlıdır. RequestLogging
rollingRate Model verileri blob depolamaya toplandığında, tümünün tek bir blob dosyasında günlüğe kaydedilmesini önlemek için verileri farklı bir yola aktarmamız gerekir.
Sıralı hız saat ise, tüm veriler /y/AA/gg/SS/ blob yolunda toplanır.
Gün geldiyse, tüm veriler /y/AA/gg/ blob yolunda toplanır.
Sıralı yolun diğer avantajı, model izleme kullanıcı arabiriminin çok hızlı bir şekilde bir veri zaman aralığı seçebilmesidir.
'Gün'
'Saat'
'Dakika'
'Ay'
'Yıl'

DataCollectorCollections

Ad Açıklama Değer
{özelleştirilmiş özellik} Koleksiyon

Koleksiyon

Ad Açıklama Değer
clientId Blob depolamada günlüğe kaydetmeyi toplamak için kullanılan msi istemci kimliği. Null ise, arka uç kimlik doğrulaması için kayıtlı bir uç nokta kimliği seçer. string
dataCollectionMode Veri toplamayı etkinleştirin veya devre dışı bırakın. 'Devre Dışı'
'Etkin'
dataId Veri varlığı arm kaynak kimliği. İstemci tarafı, veri varlığının blob depolamaya işaret etmesini sağlar ve arka uç blob depolamaya veri toplar. string
samplingRate Toplama için örnekleme oranı. Örnekleme oranı 1,0, varsayılan olarak verilerin %100'ünün topladığımız anlamına gelir. int

RequestLogging

Ad Açıklama Değer
captureHeaders Yük günlüğü için yalnızca varsayılan olarak yük toplarız. Müşteriler de belirtilen üst bilgileri toplamak isterse, bunları captureHeaders içinde ayarlayabilirler, böylece arka uç bu üst bilgileri ve yükü toplar. string[]

EndpointDeploymentPropertiesBaseEnvironmentVariables

Ad Açıklama Değer
{özelleştirilmiş özellik} string
{özelleştirilmiş özellik} string

ProbeSettings

Ad Açıklama Değer
failureThreshold İyi durumda olmayan bir durum döndürmeden önce izin verilmeyen hata sayısı. int
ınitialdelay ISO 8601 biçimindeki ilk araştırmadan önceki gecikme. string
dönem ISO 8601 biçimindeki yoklamalar arasındaki süre. string
successThreshold İyi durumda bir durum döndürmeden önce başarılı yoklamaların sayısı. int
timeout ISO 8601 biçiminde araştırma zaman aşımı. string

EndpointDeploymentPropertiesBaseProperties

Ad Açıklama Değer
{özelleştirilmiş özellik} string
{özelleştirilmiş özellik} string

OnlineRequestSettings

Ad Açıklama Değer
maxConcurrentRequestsPerInstance Dağıtım başına izin verilen düğüm başına en fazla eşzamanlı istek sayısı. Varsayılan değer 1'tir. int
maxQueueWait Bir isteğin ISO 8601 biçiminde kuyrukta kalacağı maksimum süre.
Varsayılan değer 500ms'tir.
string
requestTimeout ISO 8601 biçiminde puanlama zaman aşımı.
Varsayılan değer 5000ms'tir.
string

OnlineScaleSettings

Ad Açıklama Değer
scaleType Nesne türünü ayarlama Default
TargetUtilization (gerekli)

DefaultScaleSettings

Ad Açıklama Değer
scaleType [Gerekli] Dağıtım ölçeklendirme algoritmasının türü 'Varsayılan' (gerekli)

TargetUtilizationScaleSettings

Ad Açıklama Değer
scaleType [Gerekli] Dağıtım ölçeklendirme algoritmasının türü 'TargetUtilization' (gerekli)
maxInstances Dağıtımın ölçeklendirilebileceği en fazla örnek sayısı. Kota max_instances için ayrılacaktır. int
minInstances Her zaman mevcut olacak en az örnek sayısı. int
Pollingınterval ISO 8691 biçimindeki yoklama aralığı. Yalnızca Saniye kadar düşük duyarlıkla süreyi destekler. string
targetUtilizationPercentage Otomatik ölçeklendirici için hedef CPU kullanımı. int

KubernetesOnlineDeployment

Ad Açıklama Değer
endpointComputeType [Gerekli] Uç noktanın işlem türü. 'Kubernetes' (gerekli)
containerResourceRequirements Kapsayıcı için kaynak gereksinimleri (cpu ve bellek). ContainerResourceRequirements

ContainerResourceRequirements

Ad Açıklama Değer
containerResourceLimits Kapsayıcı kaynak sınırı bilgileri: ContainerResourceSettings
containerResourceRequests Kapsayıcı kaynak isteği bilgileri: ContainerResourceSettings

ContainerResourceSettings

Ad Açıklama Değer
Cpu Kapsayıcı için vCPU isteği/sınırı sayısı. Daha fazla bilgi:
https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/
string
Gpu Kapsayıcı için Nvidia GPU kartı isteği/sınırı sayısı. Daha fazla bilgi:
https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/
string
bellek Kapsayıcı için bellek boyutu isteği/sınırı. Daha fazla bilgi:
https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/
string

ManagedOnlineDeployment

Ad Açıklama Değer
endpointComputeType [Gerekli] Uç noktanın işlem türü. 'Managed' (gerekli)

Sku

Ad Açıklama Değer
capacity SKU ölçeği genişletmeyi/daraltma işlemini destekliyorsa kapasite tamsayısı dahil edilmelidir. Kaynak için ölçeği genişletme/daraltma mümkün değilse bu atlanabilir. int
aile Hizmetin aynı SKU için farklı nesil donanımları varsa, bu burada yakalanabilir. string
name SKU'nun adı. Ex - P3. Bu genellikle letter+number kodudur dize (gerekli)
boyut SKU boyutu. Ad alanı katman ile başka bir değerin birleşimi olduğunda, bu tek başına kod olur. string
tier Hizmetin birden fazla katmanı varsa ancak PUT üzerinde gerekli değilse, bu alanın Kaynak Sağlayıcısı tarafından uygulanması gerekir. 'Temel'
'Ücretsiz'
'Premium'
'Standart'

ARM şablonu kaynak tanımı

Çalışma alanları/onlineEndpoints/deployments kaynak türü, aşağıdakileri hedefleyen işlemlerle dağıtılabilir:

Her API sürümünde değiştirilen özelliklerin listesi için bkz. değişiklik günlüğü.

Kaynak biçimi

Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments kaynağı oluşturmak için, şablonunuza aşağıdaki JSON'u ekleyin.

{
  "type": "Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments",
  "apiVersion": "2023-04-01-preview",
  "name": "string",
  "location": "string",
  "tags": {
    "tagName1": "tagValue1",
    "tagName2": "tagValue2"
  },
  "sku": {
    "capacity": "int",
    "family": "string",
    "name": "string",
    "size": "string",
    "tier": "string"
  },
  "kind": "string",
  "identity": {
    "type": "string",
    "userAssignedIdentities": {
      "{customized property}": {}
    }
  },
  "properties": {
    "appInsightsEnabled": "bool",
    "codeConfiguration": {
      "codeId": "string",
      "scoringScript": "string"
    },
    "dataCollector": {
      "collections": {
        "{customized property}": {
          "clientId": "string",
          "dataCollectionMode": "string",
          "dataId": "string",
          "samplingRate": "int"
        }
      },
      "requestLogging": {
        "captureHeaders": [ "string" ]
      },
      "rollingRate": "string"
    },
    "description": "string",
    "egressPublicNetworkAccess": "string",
    "environmentId": "string",
    "environmentVariables": {
      "{customized property}": "string",
      "{customized property}": "string"
    },
    "instanceType": "string",
    "livenessProbe": {
      "failureThreshold": "int",
      "initialDelay": "string",
      "period": "string",
      "successThreshold": "int",
      "timeout": "string"
    },
    "model": "string",
    "modelMountPath": "string",
    "properties": {
      "{customized property}": "string",
      "{customized property}": "string"
    },
    "readinessProbe": {
      "failureThreshold": "int",
      "initialDelay": "string",
      "period": "string",
      "successThreshold": "int",
      "timeout": "string"
    },
    "requestSettings": {
      "maxConcurrentRequestsPerInstance": "int",
      "maxQueueWait": "string",
      "requestTimeout": "string"
    },
    "scaleSettings": {
      "scaleType": "string"
      // For remaining properties, see OnlineScaleSettings objects
    },
    "endpointComputeType": "string"
    // For remaining properties, see OnlineDeploymentProperties objects
  }
}

OnlineDeploymentProperties nesneleri

nesne türünü belirtmek için endpointComputeType özelliğini ayarlayın.

Kubernetes için şunu kullanın:

  "endpointComputeType": "Kubernetes",
  "containerResourceRequirements": {
    "containerResourceLimits": {
      "cpu": "string",
      "gpu": "string",
      "memory": "string"
    },
    "containerResourceRequests": {
      "cpu": "string",
      "gpu": "string",
      "memory": "string"
    }
  }

Yönetilen için şunu kullanın:

  "endpointComputeType": "Managed"

OnlineScaleSettings nesneleri

nesne türünü belirtmek için scaleType özelliğini ayarlayın.

Varsayılan için şunu kullanın:

  "scaleType": "Default"

TargetUtilization için şunu kullanın:

  "scaleType": "TargetUtilization",
  "maxInstances": "int",
  "minInstances": "int",
  "pollingInterval": "string",
  "targetUtilizationPercentage": "int"

Özellik değerleri

workspaces/onlineEndpoints/deployments

Ad Açıklama Değer
tür Kaynak türü 'Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments'
apiVersion Kaynak API'sinin sürümü '2023-04-01-preview'
name Kaynak adı

JSON ARM şablonlarında alt kaynaklar için adları ve türleri ayarlamayı öğrenin.
dize (gerekli)
location Kaynağın bulunduğu coğrafi konum dize (gerekli)
etiketler Kaynak etiketleri. Etiket adlarının ve değerlerinin sözlüğü. Bkz. Şablonlardaki etiketler
Sku Otomatik Ölçeklendirme için ARM sözleşmesi için gereken SKU ayrıntıları. Sku
Tür Portal/araçlar/vb. tarafından aynı türdeki kaynaklar için farklı UX deneyimlerini işlemek için kullanılan meta veriler. string
identity Yönetilen hizmet kimliği (sistem tarafından atanan ve/veya kullanıcı tarafından atanan kimlikler) ManagedServiceIdentity
properties [Gerekli] Varlığın ek öznitelikleri. OnlineDeploymentProperties (gerekli)

ManagedServiceIdentity

Ad Açıklama Değer
tür Yönetilen hizmet kimliğinin türü (hem SystemAssigned hem de UserAssigned türlerine izin verilir). 'Yok'
'SystemAssigned'
'SystemAssigned,UserAssigned'
'UserAssigned' (gerekli)
userAssignedIdentities Kaynakla ilişkili kullanıcı tarafından atanan kimlik kümesi. userAssignedIdentities sözlük anahtarları şu biçimde ARM kaynak kimlikleri olacaktır: '/subscriptions/{subscriptionId}/resourceGroups/{resourceGroupName}/providers/Microsoft.ManagedIdentity/userAssignedIdentities/{identityName}. Sözlük değerleri, isteklerdeki boş nesneler ({}) olabilir. UserAssignedIdentities

UserAssignedIdentities

Ad Açıklama Değer
{özelleştirilmiş özellik} UserAssignedIdentity

UserAssignedIdentity

Bu nesne dağıtım sırasında ayarlanacağı herhangi bir özellik içermiyor. Tüm özellikler ReadOnly'dır.

OnlineDeploymentProperties

Ad Açıklama Değer
appInsightsEnabled True ise Application Insights günlüğünü etkinleştirir. bool
codeConfiguration Uç nokta dağıtımı için kod yapılandırması. CodeConfiguration
Datacollector mdc yapılandırması null olduğunda mdc'yi devre dışı bırakırız. Datacollector
açıklama Uç nokta dağıtımının açıklaması. string
egressPublicNetworkAccess Etkinse çıkış genel ağ erişimine izin verin. Devre dışı bırakılırsa, bu güvenli çıkış oluşturur. Varsayılan: Etkin. 'Devre Dışı'
'Etkin'
environmentId Uç nokta dağıtımı için ortam belirtiminin ARM kaynak kimliği. string
environmentVariables Dağıtım için ortam değişkenleri yapılandırması. EndpointDeploymentPropertiesBaseEnvironmentVariables
instanceType İşlem örneği türü. string
canlılıkProbe Canlılık yoklaması kapsayıcının durumunu düzenli olarak izler. ProbeSettings
model Modelin URI yolu. string
modelMountPath Modeli özel kapsayıcıya bağlama yolu. string
properties Özellik sözlüğü. Özellikler eklenebilir, ancak kaldırılamaz veya değiştirilemez. EndpointDeploymentPropertiesBaseProperties
readinessProbe Hazır olma yoklaması, kapsayıcının trafiğe hizmet etmeye hazır olup olmadığını doğrular. Özellikler ve varsayılanlar canlılık yoklaması ile aynıdır. ProbeSettings
requestSettings Dağıtım için istek ayarları. OnlineRequestSettings
scaleSettings Dağıtım için ölçek ayarları.
Null ise veya sağlanmadıysa,
Varsayılan olarak KubernetesOnlineDeployment için TargetUtilizationScaleSettings olarak ayarlanır
ve ManagedOnlineDeployment için DefaultScaleSettings'e gidin.
OnlineScaleSettings
endpointComputeType Nesne türünü ayarlama Kubernetes
Yönetilen (gerekli)

CodeConfiguration

Ad Açıklama Değer
codeId Kod varlığının ARM kaynak kimliği. string
scoringScript [Gerekli] Başlangıçta yürütülecek betik. Örneğin "score.py" dize (gerekli)

Kısıtlama -ları:
En az uzunluk = 1
Desen = [a-zA-Z0-9_]

Datacollector

Ad Açıklama Değer
Koleksiyon [Gerekli] Koleksiyon yapılandırması. Her koleksiyonun model verilerini toplamak için kendi yapılandırması vardır ve koleksiyonun adı rastgele dize olabilir.
Model veri toplayıcısı yük günlüğü veya özel günlük kaydı ya da her ikisi için kullanılabilir. Toplama isteği ve yanıtı yük günlüğü için, diğerleri ise özel günlük kaydı için ayrılmıştır.
DataCollectorCollections (gerekli)
requestLogging mdc için istek günlüğü yapılandırması, tüm koleksiyonlar için gelişmiş günlük ayarlarını içerir. İsteğe bağlıdır. RequestLogging
rollingRate Model verileri blob depolamaya toplandığında, tümünün tek bir blob dosyasında günlüğe kaydedilmesini önlemek için verileri farklı bir yola aktarmamız gerekir.
Sıralı hız saat ise, tüm veriler /y/AA/gg/SS/ blob yolunda toplanır.
Gün geldiyse, tüm veriler /y/AA/gg/ blob yolunda toplanır.
Sıralı yolun diğer avantajı, model izleme kullanıcı arabiriminin çok hızlı bir şekilde bir veri zaman aralığı seçebilmesidir.
'Gün'
'Saat'
'Dakika'
'Ay'
'Yıl'

DataCollectorCollections

Ad Açıklama Değer
{özelleştirilmiş özellik} Koleksiyon

Koleksiyon

Ad Açıklama Değer
clientId Blob depolamada günlüğe kaydetmeyi toplamak için kullanılan msi istemci kimliği. Null ise, arka uç kimlik doğrulaması için kayıtlı bir uç nokta kimliği seçer. string
dataCollectionMode Veri toplamayı etkinleştirin veya devre dışı bırakın. 'Devre Dışı'
'Etkin'
dataId Veri varlığı arm kaynak kimliği. İstemci tarafı, veri varlığının blob depolamaya işaret etmesini sağlar ve arka uç blob depolamaya veri toplar. string
örnekleme Hızı Toplama için örnekleme oranı. Örnekleme hızı 1,0, verilerin %100'ünün varsayılan olarak topladığımız anlamına gelir. int

RequestLogging

Ad Açıklama Değer
captureHeaders Yük günlüğü için yalnızca varsayılan olarak yük toplarız. Müşteriler de belirtilen üst bilgileri toplamak isterse, arka ucun bu üst bilgileri yükle birlikte toplaması için bunları captureHeaders içinde ayarlayabilir. dize[]

EndpointDeploymentPropertiesBaseEnvironmentVariables

Ad Açıklama Değer
{özelleştirilmiş özellik} string
{özelleştirilmiş özellik} string

ProbeSettings

Ad Açıklama Değer
failureThreshold İyi durumda olmayan bir durum döndürmeden önce izin verilmeyen hata sayısı. int
ınitialdelay ISO 8601 biçimindeki ilk yoklamadan önceki gecikme. string
dönem ISO 8601 biçimindeki yoklamalar arasındaki süre. string
successThreshold İyi durumda döndürmeden önce başarılı yoklamaların sayısı. int
timeout ISO 8601 biçiminde yoklama zaman aşımı. string

EndpointDeploymentPropertiesBaseProperties

Ad Açıklama Değer
{özelleştirilmiş özellik} string
{özelleştirilmiş özellik} string

OnlineRequestSettings

Ad Açıklama Değer
maxConcurrentRequestsPerInstance Dağıtım başına izin verilen düğüm başına en fazla eşzamanlı istek sayısı. Varsayılan olarak 1'e ayarlanır. int
maxQueueWait bir isteğin ISO 8601 biçiminde kuyrukta kalacağı en uzun süre.
Varsayılan değer 500ms'tir.
string
requestTimeout ISO 8601 biçiminde puanlama zaman aşımı.
Varsayılan değer 5000ms'tir.
string

OnlineScaleSettings

Ad Açıklama Değer
scaleType Nesne türünü ayarlama Default
TargetUtilization (gerekli)

DefaultScaleSettings

Ad Açıklama Değer
scaleType [Gerekli] Dağıtım ölçeklendirme algoritmasının türü 'Varsayılan' (gerekli)

TargetUtilizationScaleSettings

Ad Açıklama Değer
scaleType [Gerekli] Dağıtım ölçeklendirme algoritmasının türü 'TargetUtilization' (gerekli)
maxInstances Dağıtımın ölçeklendirilebileceği en fazla örnek sayısı. Kota max_instances için ayrılacaktır. int
minInstances Her zaman mevcut olacak en az örnek sayısı. int
Pollingınterval ISO 8691 biçimindeki yoklama aralığı. Yalnızca Saniye kadar düşük duyarlıkla süreyi destekler. string
targetUtilizationPercentage Otomatik ölçeklendirici için hedef CPU kullanımı. int

KubernetesOnlineDeployment

Ad Açıklama Değer
endpointComputeType [Gerekli] Uç noktanın işlem türü. 'Kubernetes' (gerekli)
containerResourceRequirements Kapsayıcı için kaynak gereksinimleri (cpu ve bellek). ContainerResourceRequirements

ContainerResourceRequirements

Ad Açıklama Değer
containerResourceLimits Kapsayıcı kaynak sınırı bilgileri: ContainerResourceSettings
containerResourceRequests Kapsayıcı kaynak isteği bilgileri: ContainerResourceSettings

ContainerResourceSettings

Ad Açıklama Değer
Cpu Kapsayıcı için vCPU isteği/sınırı sayısı. Daha fazla bilgi:
https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/
string
Gpu Kapsayıcı için Nvidia GPU kartı isteği/sınırı sayısı. Daha fazla bilgi:
https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/
string
bellek Kapsayıcı için bellek boyutu isteği/sınırı. Daha fazla bilgi:
https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/
string

ManagedOnlineDeployment

Ad Açıklama Değer
endpointComputeType [Gerekli] Uç noktanın işlem türü. 'Managed' (gerekli)

Sku

Ad Açıklama Değer
capacity SKU ölçeği genişletmeyi/daraltma işlemini destekliyorsa kapasite tamsayısı dahil edilmelidir. Kaynak için ölçeği genişletme/daraltma mümkün değilse bu atlanabilir. int
aile Hizmetin aynı SKU için farklı nesil donanımları varsa, bu burada yakalanabilir. string
name SKU'nun adı. Ex - P3. Bu genellikle letter+number kodudur dize (gerekli)
boyut SKU boyutu. Ad alanı katman ile başka bir değerin birleşimi olduğunda, bu tek başına kod olur. string
tier Hizmetin birden fazla katmanı varsa ancak PUT üzerinde gerekli değilse, bu alanın Kaynak Sağlayıcısı tarafından uygulanması gerekir. 'Temel'
'Ücretsiz'
'Premium'
'Standart'

Terraform (AzAPI sağlayıcısı) kaynak tanımı

Çalışma alanları/onlineEndpoints/deployments kaynak türü, aşağıdakileri hedefleyen işlemlerle dağıtılabilir:

  • Kaynak grupları

Her API sürümünde değiştirilen özelliklerin listesi için bkz. değişiklik günlüğü.

Kaynak biçimi

Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments kaynağı oluşturmak için aşağıdaki Terraform'u şablonunuza ekleyin.

resource "azapi_resource" "symbolicname" {
  type = "Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments@2023-04-01-preview"
  name = "string"
  location = "string"
  parent_id = "string"
  tags = {
    tagName1 = "tagValue1"
    tagName2 = "tagValue2"
  }
  identity {
    type = "string"
    identity_ids = []
  }
  body = jsonencode({
    properties = {
      appInsightsEnabled = bool
      codeConfiguration = {
        codeId = "string"
        scoringScript = "string"
      }
      dataCollector = {
        collections = {
          {customized property} = {
            clientId = "string"
            dataCollectionMode = "string"
            dataId = "string"
            samplingRate = int
          }
        }
        requestLogging = {
          captureHeaders = [
            "string"
          ]
        }
        rollingRate = "string"
      }
      description = "string"
      egressPublicNetworkAccess = "string"
      environmentId = "string"
      environmentVariables = {
        {customized property} = "string"
        {customized property} = "string"
      }
      instanceType = "string"
      livenessProbe = {
        failureThreshold = int
        initialDelay = "string"
        period = "string"
        successThreshold = int
        timeout = "string"
      }
      model = "string"
      modelMountPath = "string"
      properties = {
        {customized property} = "string"
        {customized property} = "string"
      }
      readinessProbe = {
        failureThreshold = int
        initialDelay = "string"
        period = "string"
        successThreshold = int
        timeout = "string"
      }
      requestSettings = {
        maxConcurrentRequestsPerInstance = int
        maxQueueWait = "string"
        requestTimeout = "string"
      }
      scaleSettings = {
        scaleType = "string"
        // For remaining properties, see OnlineScaleSettings objects
      }
      endpointComputeType = "string"
      // For remaining properties, see OnlineDeploymentProperties objects
    }
    sku = {
      capacity = int
      family = "string"
      name = "string"
      size = "string"
      tier = "string"
    }
    kind = "string"
  })
}

OnlineDeploymentProperties nesneleri

nesne türünü belirtmek için endpointComputeType özelliğini ayarlayın.

Kubernetes için şunu kullanın:

  endpointComputeType = "Kubernetes"
  containerResourceRequirements = {
    containerResourceLimits = {
      cpu = "string"
      gpu = "string"
      memory = "string"
    }
    containerResourceRequests = {
      cpu = "string"
      gpu = "string"
      memory = "string"
    }
  }

Yönetilen için şunu kullanın:

  endpointComputeType = "Managed"

OnlineScaleSettings nesneleri

nesne türünü belirtmek için scaleType özelliğini ayarlayın.

Varsayılan için şunu kullanın:

  scaleType = "Default"

TargetUtilization için şunu kullanın:

  scaleType = "TargetUtilization"
  maxInstances = int
  minInstances = int
  pollingInterval = "string"
  targetUtilizationPercentage = int

Özellik değerleri

workspaces/onlineEndpoints/deployments

Ad Açıklama Değer
tür Kaynak türü "Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments@2023-04-01-preview"
name Kaynak adı dize (gerekli)
location Kaynağın bulunduğu coğrafi konum dize (gerekli)
parent_id Bu kaynağın üst öğesi olan kaynağın kimliği. Kaynak türü: onlineEndpoints kimliği
etiketler Kaynak etiketleri. Etiket adlarının ve değerlerinin sözlüğü.
Sku Otomatik Ölçeklendirme için ARM sözleşmesi için gereken SKU ayrıntıları. Sku
Tür Portal/araçlar/vb. tarafından aynı türdeki kaynaklar için farklı UX deneyimlerini işlemek için kullanılan meta veriler. string
identity Yönetilen hizmet kimliği (sistem tarafından atanan ve/veya kullanıcı tarafından atanan kimlikler) ManagedServiceIdentity
properties [Gerekli] Varlığın ek öznitelikleri. OnlineDeploymentProperties (gerekli)

ManagedServiceIdentity

Ad Açıklama Değer
tür Yönetilen hizmet kimliğinin türü (hem SystemAssigned hem de UserAssigned türlerine izin verilir). "SystemAssigned"
"SystemAssigned,UserAssigned"
"UserAssigned" (gerekli)
identity_ids Kaynakla ilişkili kullanıcı tarafından atanan kimlik kümesi. userAssignedIdentities sözlük anahtarları şu biçimde ARM kaynak kimlikleri olacaktır: '/subscriptions/{subscriptionId}/resourceGroups/{resourceGroupName}/providers/Microsoft.ManagedIdentity/userAssignedIdentities/{identityName}. Sözlük değerleri, isteklerdeki boş nesneler ({}) olabilir. Kullanıcı kimliği kimlikleri dizisi.

UserAssignedIdentities

Ad Açıklama Değer
{özelleştirilmiş özellik} UserAssignedIdentity

UserAssignedIdentity

Bu nesne dağıtım sırasında ayarlanacağı herhangi bir özellik içermez. Tüm özellikler Salt Okunur'dır.

OnlineDeploymentProperties

Ad Açıklama Değer
appInsightsEnabled True ise Application Insights günlüğünü etkinleştirir. bool
codeConfiguration Uç nokta dağıtımı için kod yapılandırması. CodeConfiguration
Datacollector mdc yapılandırması null olduğunda mdc'yi devre dışı bırakırız. Datacollector
açıklama Uç nokta dağıtımının açıklaması. string
egressPublicNetworkAccess Etkinse çıkış genel ağ erişimine izin verin. Devre dışı bırakılırsa güvenli çıkış oluşturulur. Varsayılan: Etkin. "Devre dışı"
"Etkin"
environmentId Uç nokta dağıtımı için ortam belirtiminin ARM kaynak kimliği. string
environmentVariables Dağıtım için ortam değişkenleri yapılandırması. EndpointDeploymentPropertiesBaseEnvironmentVariables
instanceType İşlem örneği türü. string
livenessProbe Canlılık araştırması kapsayıcının durumunu düzenli olarak izler. ProbeSettings
model Modelin URI yolu. string
modelMountPath Modeli özel kapsayıcıya bağlama yolu. string
properties Özellik sözlüğü. Özellikler eklenebilir, ancak kaldırılamaz veya değiştirilemez. EndpointDeploymentPropertiesBaseProperties
readinessProbe Hazırlık yoklaması, kapsayıcının trafiğe hizmet etmeye hazır olup olmadığını doğrular. Özellikler ve varsayılanlar canlılık yoklaması ile aynıdır. ProbeSettings
requestSettings Dağıtım için istek ayarları. OnlineRequestSettings
scaleSettings Dağıtım için ayarları ölçeklendirin.
Null ise veya sağlanmadıysa,
KubernetesOnlineDeployment için varsayılan olarak TargetUtilizationScaleSettings olarak belirlenmiştir
ve ManagedOnlineDeployment için DefaultScaleSettings'e gidin.
OnlineScaleSettings
endpointComputeType Nesne türünü ayarlama Kubernetes
Yönetilen (gerekli)

CodeConfiguration

Ad Açıklama Değer
codeId Kod varlığının ARM kaynak kimliği. string
scoringScript [Gerekli] Başlangıçta yürütülecek betik. Örneğin "score.py" dize (gerekli)

Kısıtlama -ları:
En az uzunluk = 1
Desen = [a-zA-Z0-9_]

Datacollector

Ad Açıklama Değer
Koleksiyon [Gerekli] Koleksiyon yapılandırması. Her koleksiyonun model verilerini toplamak için kendi yapılandırması vardır ve koleksiyonun adı rastgele bir dize olabilir.
Model veri toplayıcısı yük günlüğü veya özel günlük kaydı ya da her ikisi için de kullanılabilir. Toplama isteği ve yanıtı yük günlüğü için, diğerleri ise özel günlük kaydı için ayrılmıştır.
DataCollectorCollections (gerekli)
requestLogging mdc için istek günlüğü yapılandırması, tüm koleksiyonlar için gelişmiş günlük ayarları içerir. İsteğe bağlıdır. RequestLogging
rollingRate Model verileri blob depolamaya toplandığında, tümünün tek bir blob dosyasında günlüğe kaydedilmesini önlemek için verileri farklı bir yola aktarmamız gerekir.
Sıralı hız saat ise, tüm veriler /y/AA/gg/SS/ blob yolunda toplanır.
Gün geldiyse, tüm veriler /y/AA/gg/ blob yolunda toplanır.
Sıralı yolun diğer avantajı, model izleme kullanıcı arabiriminin çok hızlı bir şekilde bir veri zaman aralığı seçebilmesidir.
"Gün"
"Saat"
"Dakika"
"Ay"
"Yıl"

DataCollectorCollections

Ad Açıklama Değer
{özelleştirilmiş özellik} Koleksiyon

Koleksiyon

Ad Açıklama Değer
clientId Blob depolamada günlüğe kaydetmeyi toplamak için kullanılan msi istemci kimliği. Null ise, arka uç kimlik doğrulaması için kayıtlı bir uç nokta kimliği seçer. string
dataCollectionMode Veri toplamayı etkinleştirin veya devre dışı bırakın. "Devre dışı"
"Etkin"
dataId Veri varlığı arm kaynak kimliği. İstemci tarafı, veri varlığının blob depolamaya işaret etmesini sağlar ve arka uç blob depolamaya veri toplar. string
örnekleme Hızı Toplama için örnekleme oranı. Örnekleme hızı 1,0, verilerin %100'ünün varsayılan olarak topladığımız anlamına gelir. int

RequestLogging

Ad Açıklama Değer
captureHeaders Yük günlüğü için yalnızca varsayılan olarak yük toplarız. Müşteriler de belirtilen üst bilgileri toplamak isterse, arka ucun bu üst bilgileri yükle birlikte toplaması için bunları captureHeaders içinde ayarlayabilir. dize[]

EndpointDeploymentPropertiesBaseEnvironmentVariables

Ad Açıklama Değer
{özelleştirilmiş özellik} string
{özelleştirilmiş özellik} string

ProbeSettings

Ad Açıklama Değer
failureThreshold İyi durumda olmayan bir durum döndürmeden önce izin verilmeyen hata sayısı. int
ınitialdelay ISO 8601 biçimindeki ilk yoklamadan önceki gecikme. string
dönem ISO 8601 biçimindeki yoklamalar arasındaki süre. string
successThreshold İyi durumda döndürmeden önce başarılı yoklamaların sayısı. int
timeout ISO 8601 biçiminde yoklama zaman aşımı. string

EndpointDeploymentPropertiesBaseProperties

Ad Açıklama Değer
{özelleştirilmiş özellik} string
{özelleştirilmiş özellik} string

OnlineRequestSettings

Ad Açıklama Değer
maxConcurrentRequestsPerInstance Dağıtım başına izin verilen düğüm başına en fazla eşzamanlı istek sayısı. Varsayılan olarak 1'e ayarlanır. int
maxQueueWait bir isteğin ISO 8601 biçiminde kuyrukta kalacağı en uzun süre.
Varsayılan değer 500ms'tir.
string
requestTimeout ISO 8601 biçiminde puanlama zaman aşımı.
Varsayılan değer 5000ms'tir.
string

OnlineScaleSettings

Ad Açıklama Değer
scaleType Nesne türünü ayarlama Default
TargetUtilization (gerekli)

DefaultScaleSettings

Ad Açıklama Değer
scaleType [Gerekli] Dağıtım ölçeklendirme algoritmasının türü "Varsayılan" (gerekli)

TargetUtilizationScaleSettings

Ad Açıklama Değer
scaleType [Gerekli] Dağıtım ölçeklendirme algoritmasının türü "TargetUtilization" (gerekli)
maxInstances Dağıtımın ölçeklendirilebileceği en fazla örnek sayısı. Kota max_instances için ayrılacaktır. int
minInstances Her zaman mevcut olacak en az örnek sayısı. int
Pollingınterval ISO 8691 biçimindeki yoklama aralığı. Yalnızca Saniye kadar düşük duyarlıkla süreyi destekler. string
targetUtilizationPercentage Otomatik ölçeklendirici için hedef CPU kullanımı. int

KubernetesOnlineDeployment

Ad Açıklama Değer
endpointComputeType [Gerekli] Uç noktanın işlem türü. "Kubernetes" (gerekli)
containerResourceRequirements Kapsayıcı için kaynak gereksinimleri (cpu ve bellek). ContainerResourceRequirements

ContainerResourceRequirements

Ad Açıklama Değer
containerResourceLimits Kapsayıcı kaynak sınırı bilgileri: ContainerResourceSettings
containerResourceRequests Kapsayıcı kaynak isteği bilgileri: ContainerResourceSettings

ContainerResourceSettings

Ad Açıklama Değer
Cpu Kapsayıcı için vCPU isteği/sınırı sayısı. Daha fazla bilgi:
https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/
string
Gpu Kapsayıcı için Nvidia GPU kartı isteği/sınırı sayısı. Daha fazla bilgi:
https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/
string
bellek Kapsayıcı için bellek boyutu isteği/sınırı. Daha fazla bilgi:
https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/
string

ManagedOnlineDeployment

Ad Açıklama Değer
endpointComputeType [Gerekli] Uç noktanın işlem türü. "Yönetilen" (gerekli)

Sku

Ad Açıklama Değer
capacity SKU ölçeği genişletmeyi/daraltma işlemini destekliyorsa kapasite tamsayısı dahil edilmelidir. Kaynak için ölçeği genişletme/daraltma mümkün değilse bu atlanabilir. int
aile Hizmetin aynı SKU için farklı nesil donanımları varsa, bu burada yakalanabilir. string
name SKU'nun adı. Ex - P3. Bu genellikle letter+number kodudur dize (gerekli)
boyut SKU boyutu. Ad alanı katman ile başka bir değerin birleşimi olduğunda, bu tek başına kod olur. string
tier Hizmetin birden fazla katmanı varsa ancak PUT üzerinde gerekli değilse, bu alanın Kaynak Sağlayıcısı tarafından uygulanması gerekir. "Temel"
"Ücretsiz"
"Premium"
"Standart"