Microsoft.MachineLearningServices çalışma alanları/onlineEndpoints/deployments 2023-04-01-preview
Bicep kaynak tanımı
Çalışma alanları/onlineEndpoints/deployments kaynak türü şunları hedefleyen işlemlerle dağıtılabilir:
- Kaynak grupları - Bkz. kaynak grubu dağıtım komutları
Her API sürümünde değiştirilen özelliklerin listesi için bkz. değişiklik günlüğü.
Kaynak biçimi
Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments kaynağı oluşturmak için şablonunuza aşağıdaki Bicep'i ekleyin.
resource symbolicname 'Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments@2023-04-01-preview' = {
name: 'string'
location: 'string'
tags: {
tagName1: 'tagValue1'
tagName2: 'tagValue2'
}
sku: {
capacity: int
family: 'string'
name: 'string'
size: 'string'
tier: 'string'
}
kind: 'string'
parent: resourceSymbolicName
identity: {
type: 'string'
userAssignedIdentities: {
{customized property}: {}
}
}
properties: {
appInsightsEnabled: bool
codeConfiguration: {
codeId: 'string'
scoringScript: 'string'
}
dataCollector: {
collections: {
{customized property}: {
clientId: 'string'
dataCollectionMode: 'string'
dataId: 'string'
samplingRate: int
}
}
requestLogging: {
captureHeaders: [
'string'
]
}
rollingRate: 'string'
}
description: 'string'
egressPublicNetworkAccess: 'string'
environmentId: 'string'
environmentVariables: {
{customized property}: 'string'
{customized property}: 'string'
}
instanceType: 'string'
livenessProbe: {
failureThreshold: int
initialDelay: 'string'
period: 'string'
successThreshold: int
timeout: 'string'
}
model: 'string'
modelMountPath: 'string'
properties: {
{customized property}: 'string'
{customized property}: 'string'
}
readinessProbe: {
failureThreshold: int
initialDelay: 'string'
period: 'string'
successThreshold: int
timeout: 'string'
}
requestSettings: {
maxConcurrentRequestsPerInstance: int
maxQueueWait: 'string'
requestTimeout: 'string'
}
scaleSettings: {
scaleType: 'string'
// For remaining properties, see OnlineScaleSettings objects
}
endpointComputeType: 'string'
// For remaining properties, see OnlineDeploymentProperties objects
}
}
OnlineDeploymentProperties nesneleri
nesne türünü belirtmek için endpointComputeType özelliğini ayarlayın.
Kubernetes için şunu kullanın:
endpointComputeType: 'Kubernetes'
containerResourceRequirements: {
containerResourceLimits: {
cpu: 'string'
gpu: 'string'
memory: 'string'
}
containerResourceRequests: {
cpu: 'string'
gpu: 'string'
memory: 'string'
}
}
Yönetilen için şunu kullanın:
endpointComputeType: 'Managed'
OnlineScaleSettings nesneleri
nesne türünü belirtmek için scaleType özelliğini ayarlayın.
Varsayılan için şunu kullanın:
scaleType: 'Default'
TargetUtilization için şunu kullanın:
scaleType: 'TargetUtilization'
maxInstances: int
minInstances: int
pollingInterval: 'string'
targetUtilizationPercentage: int
Özellik değerleri
çalışma alanları/onlineEndpoints/dağıtımlar
Ad | Açıklama | Değer |
---|---|---|
name | Kaynak adı Bicep'te alt kaynaklar için adları ve türleri ayarlamayı öğrenin. |
dize (gerekli) |
location | Kaynağın bulunduğu coğrafi konum | dize (gerekli) |
etiketler | Kaynak etiketleri. | Etiket adlarının ve değerlerinin sözlüğü. Bkz . Şablonlardaki etiketler |
Sku | Otomatik Ölçeklendirme için ARM sözleşmesi için gereken SKU ayrıntıları. | Sku |
Tür | Portal/araçlar/vb. tarafından aynı türdeki kaynaklar için farklı UX deneyimlerini işlemek için kullanılan meta veriler. | string |
Üst | Bicep'te bir alt kaynağın üst kaynağını belirtebilirsiniz. Bu özelliği yalnızca alt kaynak üst kaynağın dışında bildirildiğinde eklemeniz gerekir. Daha fazla bilgi için bkz . Üst kaynağın dışındaki alt kaynak. |
Kaynak türü için sembolik ad: onlineEndpoints |
identity | Yönetilen hizmet kimliği (sistem tarafından atanan ve/veya kullanıcı tarafından atanan kimlikler) | ManagedServiceIdentity |
properties | [Gerekli] Varlığın ek öznitelikleri. | OnlineDeploymentProperties (gerekli) |
ManagedServiceIdentity
Ad | Açıklama | Değer |
---|---|---|
tür | Yönetilen hizmet kimliği türü (hem SystemAssigned hem de UserAssigned türlerine izin verilir). | 'Yok' 'SystemAssigned' 'SystemAssigned,UserAssigned' 'UserAssigned' (gerekli) |
userAssignedIdentities | Kaynakla ilişkilendirilmiş kullanıcı tarafından atanan kimlik kümesi. userAssignedIdentities sözlük anahtarları şu formda ARM kaynak kimlikleri olacaktır: '/subscriptions/{subscriptionId}/resourceGroups/{resourceGroupName}/providers/Microsoft.ManagedIdentity/userAssignedIdentities/{identityName}. Sözlük değerleri, isteklerdeki boş nesneler ({}) olabilir. | UserAssignedIdentities |
UserAssignedIdentities
Ad | Açıklama | Değer |
---|---|---|
{özelleştirilmiş özellik} | UserAssignedIdentity |
UserAssignedIdentity
Bu nesne dağıtım sırasında ayarlanacağı herhangi bir özellik içermez. Tüm özellikler Salt Okunur'dır.
OnlineDeploymentProperties
Ad | Açıklama | Değer |
---|---|---|
appInsightsEnabled | True ise Application Insights günlüğünü etkinleştirir. | bool |
codeConfiguration | Uç nokta dağıtımı için kod yapılandırması. | CodeConfiguration |
Datacollector | mdc yapılandırması null olduğunda mdc'yi devre dışı bırakırız. | Datacollector |
açıklama | Uç nokta dağıtımının açıklaması. | string |
egressPublicNetworkAccess | Etkinse çıkış genel ağ erişimine izin verin. Devre dışı bırakılırsa, bu güvenli çıkış oluşturur. Varsayılan: Etkin. | 'Devre Dışı' 'Etkin' |
environmentId | Uç nokta dağıtımı için ortam belirtiminin ARM kaynak kimliği. | string |
environmentVariables | Dağıtım için ortam değişkenleri yapılandırması. | EndpointDeploymentPropertiesBaseEnvironmentVariables |
instanceType | İşlem örneği türü. | string |
canlılıkProbe | Canlılık yoklaması kapsayıcının durumunu düzenli olarak izler. | ProbeSettings |
model | Modelin URI yolu. | string |
modelMountPath | Modeli özel kapsayıcıya bağlama yolu. | string |
properties | Özellik sözlüğü. Özellikler eklenebilir, ancak kaldırılamaz veya değiştirilemez. | EndpointDeploymentPropertiesBaseProperties |
readinessProbe | Hazır olma yoklaması, kapsayıcının trafiğe hizmet etmeye hazır olup olmadığını doğrular. Özellikler ve varsayılanlar canlılık yoklaması ile aynıdır. | ProbeSettings |
requestSettings | Dağıtım için istek ayarları. | OnlineRequestSettings |
scaleSettings | Dağıtım için ölçek ayarları. Null ise veya sağlanmadıysa, Varsayılan olarak KubernetesOnlineDeployment için TargetUtilizationScaleSettings olarak ayarlanır ve ManagedOnlineDeployment için DefaultScaleSettings'e gidin. |
OnlineScaleSettings |
endpointComputeType | Nesne türünü ayarlama | Kubernetes Yönetilen (gerekli) |
CodeConfiguration
Ad | Açıklama | Değer |
---|---|---|
codeId | Kod varlığının ARM kaynak kimliği. | string |
scoringScript | [Gerekli] Başlangıçta yürütülecek betik. Örneğin "score.py" | dize (gerekli) Kısıtlama -ları: En az uzunluk = 1 Desen = [a-zA-Z0-9_] |
Datacollector
Ad | Açıklama | Değer |
---|---|---|
Koleksiyon | [Gerekli] Koleksiyon yapılandırması. Her koleksiyonun model verilerini toplamak için kendi yapılandırması vardır ve koleksiyonun adı rastgele dize olabilir. Model veri toplayıcısı yük günlüğü veya özel günlük kaydı ya da her ikisi için kullanılabilir. Toplama isteği ve yanıtı yük günlüğü için, diğerleri ise özel günlük kaydı için ayrılmıştır. |
DataCollectorCollections (gerekli) |
requestLogging | mdc için istek günlüğü yapılandırması, tüm koleksiyonlar için gelişmiş günlük ayarlarını içerir. İsteğe bağlıdır. | RequestLogging |
rollingRate | Model verileri blob depolamaya toplandığında, tümünün tek bir blob dosyasında günlüğe kaydedilmesini önlemek için verileri farklı bir yola aktarmamız gerekir. Sıralı hız saat ise, tüm veriler /y/AA/gg/SS/ blob yolunda toplanır. Gün geldiyse, tüm veriler /y/AA/gg/ blob yolunda toplanır. Sıralı yolun diğer avantajı, model izleme kullanıcı arabiriminin çok hızlı bir şekilde bir veri zaman aralığı seçebilmesidir. |
'Gün' 'Saat' 'Dakika' 'Ay' 'Yıl' |
DataCollectorCollections
Ad | Açıklama | Değer |
---|---|---|
{özelleştirilmiş özellik} | Koleksiyon |
Koleksiyon
Ad | Açıklama | Değer |
---|---|---|
clientId | Blob depolamada günlüğe kaydetmeyi toplamak için kullanılan msi istemci kimliği. Null ise, arka uç kimlik doğrulaması için kayıtlı bir uç nokta kimliği seçer. | string |
dataCollectionMode | Veri toplamayı etkinleştirin veya devre dışı bırakın. | 'Devre Dışı' 'Etkin' |
dataId | Veri varlığı arm kaynak kimliği. İstemci tarafı, veri varlığının blob depolamaya işaret etmesini sağlar ve arka uç blob depolamaya veri toplar. | string |
samplingRate | Toplama için örnekleme oranı. Örnekleme oranı 1,0, varsayılan olarak verilerin %100'ünün topladığımız anlamına gelir. | int |
RequestLogging
Ad | Açıklama | Değer |
---|---|---|
captureHeaders | Yük günlüğü için yalnızca varsayılan olarak yük toplarız. Müşteriler de belirtilen üst bilgileri toplamak isterse, bunları captureHeaders içinde ayarlayabilirler, böylece arka uç bu üst bilgileri ve yükü toplar. | string[] |
EndpointDeploymentPropertiesBaseEnvironmentVariables
Ad | Açıklama | Değer |
---|---|---|
{özelleştirilmiş özellik} | string | |
{özelleştirilmiş özellik} | string |
ProbeSettings
Ad | Açıklama | Değer |
---|---|---|
failureThreshold | İyi durumda olmayan bir durum döndürmeden önce izin verilmeyen hata sayısı. | int |
ınitialdelay | ISO 8601 biçimindeki ilk araştırmadan önceki gecikme. | string |
dönem | ISO 8601 biçimindeki yoklamalar arasındaki süre. | string |
successThreshold | İyi durumda bir durum döndürmeden önce başarılı yoklamaların sayısı. | int |
timeout | ISO 8601 biçiminde araştırma zaman aşımı. | string |
EndpointDeploymentPropertiesBaseProperties
Ad | Açıklama | Değer |
---|---|---|
{özelleştirilmiş özellik} | string | |
{özelleştirilmiş özellik} | string |
OnlineRequestSettings
Ad | Açıklama | Değer |
---|---|---|
maxConcurrentRequestsPerInstance | Dağıtım başına izin verilen düğüm başına en fazla eşzamanlı istek sayısı. Varsayılan değer 1'tir. | int |
maxQueueWait | Bir isteğin ISO 8601 biçiminde kuyrukta kalacağı maksimum süre. Varsayılan değer 500ms'tir. |
string |
requestTimeout | ISO 8601 biçiminde puanlama zaman aşımı. Varsayılan değer 5000ms'tir. |
string |
OnlineScaleSettings
Ad | Açıklama | Değer |
---|---|---|
scaleType | Nesne türünü ayarlama | Default TargetUtilization (gerekli) |
DefaultScaleSettings
Ad | Açıklama | Değer |
---|---|---|
scaleType | [Gerekli] Dağıtım ölçeklendirme algoritmasının türü | 'Varsayılan' (gerekli) |
TargetUtilizationScaleSettings
Ad | Açıklama | Değer |
---|---|---|
scaleType | [Gerekli] Dağıtım ölçeklendirme algoritmasının türü | 'TargetUtilization' (gerekli) |
maxInstances | Dağıtımın ölçeklendirilebileceği en fazla örnek sayısı. Kota max_instances için ayrılacaktır. | int |
minInstances | Her zaman mevcut olacak en az örnek sayısı. | int |
Pollingınterval | ISO 8691 biçimindeki yoklama aralığı. Yalnızca Saniye kadar düşük duyarlıkla süreyi destekler. | string |
targetUtilizationPercentage | Otomatik ölçeklendirici için hedef CPU kullanımı. | int |
KubernetesOnlineDeployment
Ad | Açıklama | Değer |
---|---|---|
endpointComputeType | [Gerekli] Uç noktanın işlem türü. | 'Kubernetes' (gerekli) |
containerResourceRequirements | Kapsayıcı için kaynak gereksinimleri (cpu ve bellek). | ContainerResourceRequirements |
ContainerResourceRequirements
Ad | Açıklama | Değer |
---|---|---|
containerResourceLimits | Kapsayıcı kaynak sınırı bilgileri: | ContainerResourceSettings |
containerResourceRequests | Kapsayıcı kaynak isteği bilgileri: | ContainerResourceSettings |
ContainerResourceSettings
Ad | Açıklama | Değer |
---|---|---|
Cpu | Kapsayıcı için vCPU isteği/sınırı sayısı. Daha fazla bilgi: https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/ |
string |
Gpu | Kapsayıcı için Nvidia GPU kartı isteği/sınırı sayısı. Daha fazla bilgi: https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/ |
string |
bellek | Kapsayıcı için bellek boyutu isteği/sınırı. Daha fazla bilgi: https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/ |
string |
ManagedOnlineDeployment
Ad | Açıklama | Değer |
---|---|---|
endpointComputeType | [Gerekli] Uç noktanın işlem türü. | 'Managed' (gerekli) |
Sku
Ad | Açıklama | Değer |
---|---|---|
capacity | SKU ölçeği genişletmeyi/daraltma işlemini destekliyorsa kapasite tamsayısı dahil edilmelidir. Kaynak için ölçeği genişletme/daraltma mümkün değilse bu atlanabilir. | int |
aile | Hizmetin aynı SKU için farklı nesil donanımları varsa, bu burada yakalanabilir. | string |
name | SKU'nun adı. Ex - P3. Bu genellikle letter+number kodudur | dize (gerekli) |
boyut | SKU boyutu. Ad alanı katman ile başka bir değerin birleşimi olduğunda, bu tek başına kod olur. | string |
tier | Hizmetin birden fazla katmanı varsa ancak PUT üzerinde gerekli değilse, bu alanın Kaynak Sağlayıcısı tarafından uygulanması gerekir. | 'Temel' 'Ücretsiz' 'Premium' 'Standart' |
ARM şablonu kaynak tanımı
Çalışma alanları/onlineEndpoints/deployments kaynak türü, aşağıdakileri hedefleyen işlemlerle dağıtılabilir:
- Kaynak grupları - Bkz. kaynak grubu dağıtım komutları
Her API sürümünde değiştirilen özelliklerin listesi için bkz. değişiklik günlüğü.
Kaynak biçimi
Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments kaynağı oluşturmak için, şablonunuza aşağıdaki JSON'u ekleyin.
{
"type": "Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments",
"apiVersion": "2023-04-01-preview",
"name": "string",
"location": "string",
"tags": {
"tagName1": "tagValue1",
"tagName2": "tagValue2"
},
"sku": {
"capacity": "int",
"family": "string",
"name": "string",
"size": "string",
"tier": "string"
},
"kind": "string",
"identity": {
"type": "string",
"userAssignedIdentities": {
"{customized property}": {}
}
},
"properties": {
"appInsightsEnabled": "bool",
"codeConfiguration": {
"codeId": "string",
"scoringScript": "string"
},
"dataCollector": {
"collections": {
"{customized property}": {
"clientId": "string",
"dataCollectionMode": "string",
"dataId": "string",
"samplingRate": "int"
}
},
"requestLogging": {
"captureHeaders": [ "string" ]
},
"rollingRate": "string"
},
"description": "string",
"egressPublicNetworkAccess": "string",
"environmentId": "string",
"environmentVariables": {
"{customized property}": "string",
"{customized property}": "string"
},
"instanceType": "string",
"livenessProbe": {
"failureThreshold": "int",
"initialDelay": "string",
"period": "string",
"successThreshold": "int",
"timeout": "string"
},
"model": "string",
"modelMountPath": "string",
"properties": {
"{customized property}": "string",
"{customized property}": "string"
},
"readinessProbe": {
"failureThreshold": "int",
"initialDelay": "string",
"period": "string",
"successThreshold": "int",
"timeout": "string"
},
"requestSettings": {
"maxConcurrentRequestsPerInstance": "int",
"maxQueueWait": "string",
"requestTimeout": "string"
},
"scaleSettings": {
"scaleType": "string"
// For remaining properties, see OnlineScaleSettings objects
},
"endpointComputeType": "string"
// For remaining properties, see OnlineDeploymentProperties objects
}
}
OnlineDeploymentProperties nesneleri
nesne türünü belirtmek için endpointComputeType özelliğini ayarlayın.
Kubernetes için şunu kullanın:
"endpointComputeType": "Kubernetes",
"containerResourceRequirements": {
"containerResourceLimits": {
"cpu": "string",
"gpu": "string",
"memory": "string"
},
"containerResourceRequests": {
"cpu": "string",
"gpu": "string",
"memory": "string"
}
}
Yönetilen için şunu kullanın:
"endpointComputeType": "Managed"
OnlineScaleSettings nesneleri
nesne türünü belirtmek için scaleType özelliğini ayarlayın.
Varsayılan için şunu kullanın:
"scaleType": "Default"
TargetUtilization için şunu kullanın:
"scaleType": "TargetUtilization",
"maxInstances": "int",
"minInstances": "int",
"pollingInterval": "string",
"targetUtilizationPercentage": "int"
Özellik değerleri
workspaces/onlineEndpoints/deployments
Ad | Açıklama | Değer |
---|---|---|
tür | Kaynak türü | 'Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments' |
apiVersion | Kaynak API'sinin sürümü | '2023-04-01-preview' |
name | Kaynak adı JSON ARM şablonlarında alt kaynaklar için adları ve türleri ayarlamayı öğrenin. |
dize (gerekli) |
location | Kaynağın bulunduğu coğrafi konum | dize (gerekli) |
etiketler | Kaynak etiketleri. | Etiket adlarının ve değerlerinin sözlüğü. Bkz. Şablonlardaki etiketler |
Sku | Otomatik Ölçeklendirme için ARM sözleşmesi için gereken SKU ayrıntıları. | Sku |
Tür | Portal/araçlar/vb. tarafından aynı türdeki kaynaklar için farklı UX deneyimlerini işlemek için kullanılan meta veriler. | string |
identity | Yönetilen hizmet kimliği (sistem tarafından atanan ve/veya kullanıcı tarafından atanan kimlikler) | ManagedServiceIdentity |
properties | [Gerekli] Varlığın ek öznitelikleri. | OnlineDeploymentProperties (gerekli) |
ManagedServiceIdentity
Ad | Açıklama | Değer |
---|---|---|
tür | Yönetilen hizmet kimliğinin türü (hem SystemAssigned hem de UserAssigned türlerine izin verilir). | 'Yok' 'SystemAssigned' 'SystemAssigned,UserAssigned' 'UserAssigned' (gerekli) |
userAssignedIdentities | Kaynakla ilişkili kullanıcı tarafından atanan kimlik kümesi. userAssignedIdentities sözlük anahtarları şu biçimde ARM kaynak kimlikleri olacaktır: '/subscriptions/{subscriptionId}/resourceGroups/{resourceGroupName}/providers/Microsoft.ManagedIdentity/userAssignedIdentities/{identityName}. Sözlük değerleri, isteklerdeki boş nesneler ({}) olabilir. | UserAssignedIdentities |
UserAssignedIdentities
Ad | Açıklama | Değer |
---|---|---|
{özelleştirilmiş özellik} | UserAssignedIdentity |
UserAssignedIdentity
Bu nesne dağıtım sırasında ayarlanacağı herhangi bir özellik içermiyor. Tüm özellikler ReadOnly'dır.
OnlineDeploymentProperties
Ad | Açıklama | Değer |
---|---|---|
appInsightsEnabled | True ise Application Insights günlüğünü etkinleştirir. | bool |
codeConfiguration | Uç nokta dağıtımı için kod yapılandırması. | CodeConfiguration |
Datacollector | mdc yapılandırması null olduğunda mdc'yi devre dışı bırakırız. | Datacollector |
açıklama | Uç nokta dağıtımının açıklaması. | string |
egressPublicNetworkAccess | Etkinse çıkış genel ağ erişimine izin verin. Devre dışı bırakılırsa, bu güvenli çıkış oluşturur. Varsayılan: Etkin. | 'Devre Dışı' 'Etkin' |
environmentId | Uç nokta dağıtımı için ortam belirtiminin ARM kaynak kimliği. | string |
environmentVariables | Dağıtım için ortam değişkenleri yapılandırması. | EndpointDeploymentPropertiesBaseEnvironmentVariables |
instanceType | İşlem örneği türü. | string |
canlılıkProbe | Canlılık yoklaması kapsayıcının durumunu düzenli olarak izler. | ProbeSettings |
model | Modelin URI yolu. | string |
modelMountPath | Modeli özel kapsayıcıya bağlama yolu. | string |
properties | Özellik sözlüğü. Özellikler eklenebilir, ancak kaldırılamaz veya değiştirilemez. | EndpointDeploymentPropertiesBaseProperties |
readinessProbe | Hazır olma yoklaması, kapsayıcının trafiğe hizmet etmeye hazır olup olmadığını doğrular. Özellikler ve varsayılanlar canlılık yoklaması ile aynıdır. | ProbeSettings |
requestSettings | Dağıtım için istek ayarları. | OnlineRequestSettings |
scaleSettings | Dağıtım için ölçek ayarları. Null ise veya sağlanmadıysa, Varsayılan olarak KubernetesOnlineDeployment için TargetUtilizationScaleSettings olarak ayarlanır ve ManagedOnlineDeployment için DefaultScaleSettings'e gidin. |
OnlineScaleSettings |
endpointComputeType | Nesne türünü ayarlama | Kubernetes Yönetilen (gerekli) |
CodeConfiguration
Ad | Açıklama | Değer |
---|---|---|
codeId | Kod varlığının ARM kaynak kimliği. | string |
scoringScript | [Gerekli] Başlangıçta yürütülecek betik. Örneğin "score.py" | dize (gerekli) Kısıtlama -ları: En az uzunluk = 1 Desen = [a-zA-Z0-9_] |
Datacollector
Ad | Açıklama | Değer |
---|---|---|
Koleksiyon | [Gerekli] Koleksiyon yapılandırması. Her koleksiyonun model verilerini toplamak için kendi yapılandırması vardır ve koleksiyonun adı rastgele dize olabilir. Model veri toplayıcısı yük günlüğü veya özel günlük kaydı ya da her ikisi için kullanılabilir. Toplama isteği ve yanıtı yük günlüğü için, diğerleri ise özel günlük kaydı için ayrılmıştır. |
DataCollectorCollections (gerekli) |
requestLogging | mdc için istek günlüğü yapılandırması, tüm koleksiyonlar için gelişmiş günlük ayarlarını içerir. İsteğe bağlıdır. | RequestLogging |
rollingRate | Model verileri blob depolamaya toplandığında, tümünün tek bir blob dosyasında günlüğe kaydedilmesini önlemek için verileri farklı bir yola aktarmamız gerekir. Sıralı hız saat ise, tüm veriler /y/AA/gg/SS/ blob yolunda toplanır. Gün geldiyse, tüm veriler /y/AA/gg/ blob yolunda toplanır. Sıralı yolun diğer avantajı, model izleme kullanıcı arabiriminin çok hızlı bir şekilde bir veri zaman aralığı seçebilmesidir. |
'Gün' 'Saat' 'Dakika' 'Ay' 'Yıl' |
DataCollectorCollections
Ad | Açıklama | Değer |
---|---|---|
{özelleştirilmiş özellik} | Koleksiyon |
Koleksiyon
Ad | Açıklama | Değer |
---|---|---|
clientId | Blob depolamada günlüğe kaydetmeyi toplamak için kullanılan msi istemci kimliği. Null ise, arka uç kimlik doğrulaması için kayıtlı bir uç nokta kimliği seçer. | string |
dataCollectionMode | Veri toplamayı etkinleştirin veya devre dışı bırakın. | 'Devre Dışı' 'Etkin' |
dataId | Veri varlığı arm kaynak kimliği. İstemci tarafı, veri varlığının blob depolamaya işaret etmesini sağlar ve arka uç blob depolamaya veri toplar. | string |
örnekleme Hızı | Toplama için örnekleme oranı. Örnekleme hızı 1,0, verilerin %100'ünün varsayılan olarak topladığımız anlamına gelir. | int |
RequestLogging
Ad | Açıklama | Değer |
---|---|---|
captureHeaders | Yük günlüğü için yalnızca varsayılan olarak yük toplarız. Müşteriler de belirtilen üst bilgileri toplamak isterse, arka ucun bu üst bilgileri yükle birlikte toplaması için bunları captureHeaders içinde ayarlayabilir. | dize[] |
EndpointDeploymentPropertiesBaseEnvironmentVariables
Ad | Açıklama | Değer |
---|---|---|
{özelleştirilmiş özellik} | string | |
{özelleştirilmiş özellik} | string |
ProbeSettings
Ad | Açıklama | Değer |
---|---|---|
failureThreshold | İyi durumda olmayan bir durum döndürmeden önce izin verilmeyen hata sayısı. | int |
ınitialdelay | ISO 8601 biçimindeki ilk yoklamadan önceki gecikme. | string |
dönem | ISO 8601 biçimindeki yoklamalar arasındaki süre. | string |
successThreshold | İyi durumda döndürmeden önce başarılı yoklamaların sayısı. | int |
timeout | ISO 8601 biçiminde yoklama zaman aşımı. | string |
EndpointDeploymentPropertiesBaseProperties
Ad | Açıklama | Değer |
---|---|---|
{özelleştirilmiş özellik} | string | |
{özelleştirilmiş özellik} | string |
OnlineRequestSettings
Ad | Açıklama | Değer |
---|---|---|
maxConcurrentRequestsPerInstance | Dağıtım başına izin verilen düğüm başına en fazla eşzamanlı istek sayısı. Varsayılan olarak 1'e ayarlanır. | int |
maxQueueWait | bir isteğin ISO 8601 biçiminde kuyrukta kalacağı en uzun süre. Varsayılan değer 500ms'tir. |
string |
requestTimeout | ISO 8601 biçiminde puanlama zaman aşımı. Varsayılan değer 5000ms'tir. |
string |
OnlineScaleSettings
Ad | Açıklama | Değer |
---|---|---|
scaleType | Nesne türünü ayarlama | Default TargetUtilization (gerekli) |
DefaultScaleSettings
Ad | Açıklama | Değer |
---|---|---|
scaleType | [Gerekli] Dağıtım ölçeklendirme algoritmasının türü | 'Varsayılan' (gerekli) |
TargetUtilizationScaleSettings
Ad | Açıklama | Değer |
---|---|---|
scaleType | [Gerekli] Dağıtım ölçeklendirme algoritmasının türü | 'TargetUtilization' (gerekli) |
maxInstances | Dağıtımın ölçeklendirilebileceği en fazla örnek sayısı. Kota max_instances için ayrılacaktır. | int |
minInstances | Her zaman mevcut olacak en az örnek sayısı. | int |
Pollingınterval | ISO 8691 biçimindeki yoklama aralığı. Yalnızca Saniye kadar düşük duyarlıkla süreyi destekler. | string |
targetUtilizationPercentage | Otomatik ölçeklendirici için hedef CPU kullanımı. | int |
KubernetesOnlineDeployment
Ad | Açıklama | Değer |
---|---|---|
endpointComputeType | [Gerekli] Uç noktanın işlem türü. | 'Kubernetes' (gerekli) |
containerResourceRequirements | Kapsayıcı için kaynak gereksinimleri (cpu ve bellek). | ContainerResourceRequirements |
ContainerResourceRequirements
Ad | Açıklama | Değer |
---|---|---|
containerResourceLimits | Kapsayıcı kaynak sınırı bilgileri: | ContainerResourceSettings |
containerResourceRequests | Kapsayıcı kaynak isteği bilgileri: | ContainerResourceSettings |
ContainerResourceSettings
Ad | Açıklama | Değer |
---|---|---|
Cpu | Kapsayıcı için vCPU isteği/sınırı sayısı. Daha fazla bilgi: https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/ |
string |
Gpu | Kapsayıcı için Nvidia GPU kartı isteği/sınırı sayısı. Daha fazla bilgi: https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/ |
string |
bellek | Kapsayıcı için bellek boyutu isteği/sınırı. Daha fazla bilgi: https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/ |
string |
ManagedOnlineDeployment
Ad | Açıklama | Değer |
---|---|---|
endpointComputeType | [Gerekli] Uç noktanın işlem türü. | 'Managed' (gerekli) |
Sku
Ad | Açıklama | Değer |
---|---|---|
capacity | SKU ölçeği genişletmeyi/daraltma işlemini destekliyorsa kapasite tamsayısı dahil edilmelidir. Kaynak için ölçeği genişletme/daraltma mümkün değilse bu atlanabilir. | int |
aile | Hizmetin aynı SKU için farklı nesil donanımları varsa, bu burada yakalanabilir. | string |
name | SKU'nun adı. Ex - P3. Bu genellikle letter+number kodudur | dize (gerekli) |
boyut | SKU boyutu. Ad alanı katman ile başka bir değerin birleşimi olduğunda, bu tek başına kod olur. | string |
tier | Hizmetin birden fazla katmanı varsa ancak PUT üzerinde gerekli değilse, bu alanın Kaynak Sağlayıcısı tarafından uygulanması gerekir. | 'Temel' 'Ücretsiz' 'Premium' 'Standart' |
Terraform (AzAPI sağlayıcısı) kaynak tanımı
Çalışma alanları/onlineEndpoints/deployments kaynak türü, aşağıdakileri hedefleyen işlemlerle dağıtılabilir:
- Kaynak grupları
Her API sürümünde değiştirilen özelliklerin listesi için bkz. değişiklik günlüğü.
Kaynak biçimi
Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments kaynağı oluşturmak için aşağıdaki Terraform'u şablonunuza ekleyin.
resource "azapi_resource" "symbolicname" {
type = "Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments@2023-04-01-preview"
name = "string"
location = "string"
parent_id = "string"
tags = {
tagName1 = "tagValue1"
tagName2 = "tagValue2"
}
identity {
type = "string"
identity_ids = []
}
body = jsonencode({
properties = {
appInsightsEnabled = bool
codeConfiguration = {
codeId = "string"
scoringScript = "string"
}
dataCollector = {
collections = {
{customized property} = {
clientId = "string"
dataCollectionMode = "string"
dataId = "string"
samplingRate = int
}
}
requestLogging = {
captureHeaders = [
"string"
]
}
rollingRate = "string"
}
description = "string"
egressPublicNetworkAccess = "string"
environmentId = "string"
environmentVariables = {
{customized property} = "string"
{customized property} = "string"
}
instanceType = "string"
livenessProbe = {
failureThreshold = int
initialDelay = "string"
period = "string"
successThreshold = int
timeout = "string"
}
model = "string"
modelMountPath = "string"
properties = {
{customized property} = "string"
{customized property} = "string"
}
readinessProbe = {
failureThreshold = int
initialDelay = "string"
period = "string"
successThreshold = int
timeout = "string"
}
requestSettings = {
maxConcurrentRequestsPerInstance = int
maxQueueWait = "string"
requestTimeout = "string"
}
scaleSettings = {
scaleType = "string"
// For remaining properties, see OnlineScaleSettings objects
}
endpointComputeType = "string"
// For remaining properties, see OnlineDeploymentProperties objects
}
sku = {
capacity = int
family = "string"
name = "string"
size = "string"
tier = "string"
}
kind = "string"
})
}
OnlineDeploymentProperties nesneleri
nesne türünü belirtmek için endpointComputeType özelliğini ayarlayın.
Kubernetes için şunu kullanın:
endpointComputeType = "Kubernetes"
containerResourceRequirements = {
containerResourceLimits = {
cpu = "string"
gpu = "string"
memory = "string"
}
containerResourceRequests = {
cpu = "string"
gpu = "string"
memory = "string"
}
}
Yönetilen için şunu kullanın:
endpointComputeType = "Managed"
OnlineScaleSettings nesneleri
nesne türünü belirtmek için scaleType özelliğini ayarlayın.
Varsayılan için şunu kullanın:
scaleType = "Default"
TargetUtilization için şunu kullanın:
scaleType = "TargetUtilization"
maxInstances = int
minInstances = int
pollingInterval = "string"
targetUtilizationPercentage = int
Özellik değerleri
workspaces/onlineEndpoints/deployments
Ad | Açıklama | Değer |
---|---|---|
tür | Kaynak türü | "Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments@2023-04-01-preview" |
name | Kaynak adı | dize (gerekli) |
location | Kaynağın bulunduğu coğrafi konum | dize (gerekli) |
parent_id | Bu kaynağın üst öğesi olan kaynağın kimliği. | Kaynak türü: onlineEndpoints kimliği |
etiketler | Kaynak etiketleri. | Etiket adlarının ve değerlerinin sözlüğü. |
Sku | Otomatik Ölçeklendirme için ARM sözleşmesi için gereken SKU ayrıntıları. | Sku |
Tür | Portal/araçlar/vb. tarafından aynı türdeki kaynaklar için farklı UX deneyimlerini işlemek için kullanılan meta veriler. | string |
identity | Yönetilen hizmet kimliği (sistem tarafından atanan ve/veya kullanıcı tarafından atanan kimlikler) | ManagedServiceIdentity |
properties | [Gerekli] Varlığın ek öznitelikleri. | OnlineDeploymentProperties (gerekli) |
ManagedServiceIdentity
Ad | Açıklama | Değer |
---|---|---|
tür | Yönetilen hizmet kimliğinin türü (hem SystemAssigned hem de UserAssigned türlerine izin verilir). | "SystemAssigned" "SystemAssigned,UserAssigned" "UserAssigned" (gerekli) |
identity_ids | Kaynakla ilişkili kullanıcı tarafından atanan kimlik kümesi. userAssignedIdentities sözlük anahtarları şu biçimde ARM kaynak kimlikleri olacaktır: '/subscriptions/{subscriptionId}/resourceGroups/{resourceGroupName}/providers/Microsoft.ManagedIdentity/userAssignedIdentities/{identityName}. Sözlük değerleri, isteklerdeki boş nesneler ({}) olabilir. | Kullanıcı kimliği kimlikleri dizisi. |
UserAssignedIdentities
Ad | Açıklama | Değer |
---|---|---|
{özelleştirilmiş özellik} | UserAssignedIdentity |
UserAssignedIdentity
Bu nesne dağıtım sırasında ayarlanacağı herhangi bir özellik içermez. Tüm özellikler Salt Okunur'dır.
OnlineDeploymentProperties
Ad | Açıklama | Değer |
---|---|---|
appInsightsEnabled | True ise Application Insights günlüğünü etkinleştirir. | bool |
codeConfiguration | Uç nokta dağıtımı için kod yapılandırması. | CodeConfiguration |
Datacollector | mdc yapılandırması null olduğunda mdc'yi devre dışı bırakırız. | Datacollector |
açıklama | Uç nokta dağıtımının açıklaması. | string |
egressPublicNetworkAccess | Etkinse çıkış genel ağ erişimine izin verin. Devre dışı bırakılırsa güvenli çıkış oluşturulur. Varsayılan: Etkin. | "Devre dışı" "Etkin" |
environmentId | Uç nokta dağıtımı için ortam belirtiminin ARM kaynak kimliği. | string |
environmentVariables | Dağıtım için ortam değişkenleri yapılandırması. | EndpointDeploymentPropertiesBaseEnvironmentVariables |
instanceType | İşlem örneği türü. | string |
livenessProbe | Canlılık araştırması kapsayıcının durumunu düzenli olarak izler. | ProbeSettings |
model | Modelin URI yolu. | string |
modelMountPath | Modeli özel kapsayıcıya bağlama yolu. | string |
properties | Özellik sözlüğü. Özellikler eklenebilir, ancak kaldırılamaz veya değiştirilemez. | EndpointDeploymentPropertiesBaseProperties |
readinessProbe | Hazırlık yoklaması, kapsayıcının trafiğe hizmet etmeye hazır olup olmadığını doğrular. Özellikler ve varsayılanlar canlılık yoklaması ile aynıdır. | ProbeSettings |
requestSettings | Dağıtım için istek ayarları. | OnlineRequestSettings |
scaleSettings | Dağıtım için ayarları ölçeklendirin. Null ise veya sağlanmadıysa, KubernetesOnlineDeployment için varsayılan olarak TargetUtilizationScaleSettings olarak belirlenmiştir ve ManagedOnlineDeployment için DefaultScaleSettings'e gidin. |
OnlineScaleSettings |
endpointComputeType | Nesne türünü ayarlama | Kubernetes Yönetilen (gerekli) |
CodeConfiguration
Ad | Açıklama | Değer |
---|---|---|
codeId | Kod varlığının ARM kaynak kimliği. | string |
scoringScript | [Gerekli] Başlangıçta yürütülecek betik. Örneğin "score.py" | dize (gerekli) Kısıtlama -ları: En az uzunluk = 1 Desen = [a-zA-Z0-9_] |
Datacollector
Ad | Açıklama | Değer |
---|---|---|
Koleksiyon | [Gerekli] Koleksiyon yapılandırması. Her koleksiyonun model verilerini toplamak için kendi yapılandırması vardır ve koleksiyonun adı rastgele bir dize olabilir. Model veri toplayıcısı yük günlüğü veya özel günlük kaydı ya da her ikisi için de kullanılabilir. Toplama isteği ve yanıtı yük günlüğü için, diğerleri ise özel günlük kaydı için ayrılmıştır. |
DataCollectorCollections (gerekli) |
requestLogging | mdc için istek günlüğü yapılandırması, tüm koleksiyonlar için gelişmiş günlük ayarları içerir. İsteğe bağlıdır. | RequestLogging |
rollingRate | Model verileri blob depolamaya toplandığında, tümünün tek bir blob dosyasında günlüğe kaydedilmesini önlemek için verileri farklı bir yola aktarmamız gerekir. Sıralı hız saat ise, tüm veriler /y/AA/gg/SS/ blob yolunda toplanır. Gün geldiyse, tüm veriler /y/AA/gg/ blob yolunda toplanır. Sıralı yolun diğer avantajı, model izleme kullanıcı arabiriminin çok hızlı bir şekilde bir veri zaman aralığı seçebilmesidir. |
"Gün" "Saat" "Dakika" "Ay" "Yıl" |
DataCollectorCollections
Ad | Açıklama | Değer |
---|---|---|
{özelleştirilmiş özellik} | Koleksiyon |
Koleksiyon
Ad | Açıklama | Değer |
---|---|---|
clientId | Blob depolamada günlüğe kaydetmeyi toplamak için kullanılan msi istemci kimliği. Null ise, arka uç kimlik doğrulaması için kayıtlı bir uç nokta kimliği seçer. | string |
dataCollectionMode | Veri toplamayı etkinleştirin veya devre dışı bırakın. | "Devre dışı" "Etkin" |
dataId | Veri varlığı arm kaynak kimliği. İstemci tarafı, veri varlığının blob depolamaya işaret etmesini sağlar ve arka uç blob depolamaya veri toplar. | string |
örnekleme Hızı | Toplama için örnekleme oranı. Örnekleme hızı 1,0, verilerin %100'ünün varsayılan olarak topladığımız anlamına gelir. | int |
RequestLogging
Ad | Açıklama | Değer |
---|---|---|
captureHeaders | Yük günlüğü için yalnızca varsayılan olarak yük toplarız. Müşteriler de belirtilen üst bilgileri toplamak isterse, arka ucun bu üst bilgileri yükle birlikte toplaması için bunları captureHeaders içinde ayarlayabilir. | dize[] |
EndpointDeploymentPropertiesBaseEnvironmentVariables
Ad | Açıklama | Değer |
---|---|---|
{özelleştirilmiş özellik} | string | |
{özelleştirilmiş özellik} | string |
ProbeSettings
Ad | Açıklama | Değer |
---|---|---|
failureThreshold | İyi durumda olmayan bir durum döndürmeden önce izin verilmeyen hata sayısı. | int |
ınitialdelay | ISO 8601 biçimindeki ilk yoklamadan önceki gecikme. | string |
dönem | ISO 8601 biçimindeki yoklamalar arasındaki süre. | string |
successThreshold | İyi durumda döndürmeden önce başarılı yoklamaların sayısı. | int |
timeout | ISO 8601 biçiminde yoklama zaman aşımı. | string |
EndpointDeploymentPropertiesBaseProperties
Ad | Açıklama | Değer |
---|---|---|
{özelleştirilmiş özellik} | string | |
{özelleştirilmiş özellik} | string |
OnlineRequestSettings
Ad | Açıklama | Değer |
---|---|---|
maxConcurrentRequestsPerInstance | Dağıtım başına izin verilen düğüm başına en fazla eşzamanlı istek sayısı. Varsayılan olarak 1'e ayarlanır. | int |
maxQueueWait | bir isteğin ISO 8601 biçiminde kuyrukta kalacağı en uzun süre. Varsayılan değer 500ms'tir. |
string |
requestTimeout | ISO 8601 biçiminde puanlama zaman aşımı. Varsayılan değer 5000ms'tir. |
string |
OnlineScaleSettings
Ad | Açıklama | Değer |
---|---|---|
scaleType | Nesne türünü ayarlama | Default TargetUtilization (gerekli) |
DefaultScaleSettings
Ad | Açıklama | Değer |
---|---|---|
scaleType | [Gerekli] Dağıtım ölçeklendirme algoritmasının türü | "Varsayılan" (gerekli) |
TargetUtilizationScaleSettings
Ad | Açıklama | Değer |
---|---|---|
scaleType | [Gerekli] Dağıtım ölçeklendirme algoritmasının türü | "TargetUtilization" (gerekli) |
maxInstances | Dağıtımın ölçeklendirilebileceği en fazla örnek sayısı. Kota max_instances için ayrılacaktır. | int |
minInstances | Her zaman mevcut olacak en az örnek sayısı. | int |
Pollingınterval | ISO 8691 biçimindeki yoklama aralığı. Yalnızca Saniye kadar düşük duyarlıkla süreyi destekler. | string |
targetUtilizationPercentage | Otomatik ölçeklendirici için hedef CPU kullanımı. | int |
KubernetesOnlineDeployment
Ad | Açıklama | Değer |
---|---|---|
endpointComputeType | [Gerekli] Uç noktanın işlem türü. | "Kubernetes" (gerekli) |
containerResourceRequirements | Kapsayıcı için kaynak gereksinimleri (cpu ve bellek). | ContainerResourceRequirements |
ContainerResourceRequirements
Ad | Açıklama | Değer |
---|---|---|
containerResourceLimits | Kapsayıcı kaynak sınırı bilgileri: | ContainerResourceSettings |
containerResourceRequests | Kapsayıcı kaynak isteği bilgileri: | ContainerResourceSettings |
ContainerResourceSettings
Ad | Açıklama | Değer |
---|---|---|
Cpu | Kapsayıcı için vCPU isteği/sınırı sayısı. Daha fazla bilgi: https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/ |
string |
Gpu | Kapsayıcı için Nvidia GPU kartı isteği/sınırı sayısı. Daha fazla bilgi: https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/ |
string |
bellek | Kapsayıcı için bellek boyutu isteği/sınırı. Daha fazla bilgi: https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/ |
string |
ManagedOnlineDeployment
Ad | Açıklama | Değer |
---|---|---|
endpointComputeType | [Gerekli] Uç noktanın işlem türü. | "Yönetilen" (gerekli) |
Sku
Ad | Açıklama | Değer |
---|---|---|
capacity | SKU ölçeği genişletmeyi/daraltma işlemini destekliyorsa kapasite tamsayısı dahil edilmelidir. Kaynak için ölçeği genişletme/daraltma mümkün değilse bu atlanabilir. | int |
aile | Hizmetin aynı SKU için farklı nesil donanımları varsa, bu burada yakalanabilir. | string |
name | SKU'nun adı. Ex - P3. Bu genellikle letter+number kodudur | dize (gerekli) |
boyut | SKU boyutu. Ad alanı katman ile başka bir değerin birleşimi olduğunda, bu tek başına kod olur. | string |
tier | Hizmetin birden fazla katmanı varsa ancak PUT üzerinde gerekli değilse, bu alanın Kaynak Sağlayıcısı tarafından uygulanması gerekir. | "Temel" "Ücretsiz" "Premium" "Standart" |
Geri Bildirim
https://aka.ms/ContentUserFeedback.
Çok yakında: 2024 boyunca, içerik için geri bildirim mekanizması olarak GitHub Sorunları’nı kullanımdan kaldıracak ve yeni bir geri bildirim sistemiyle değiştireceğiz. Daha fazla bilgi için bkz.Gönderin ve geri bildirimi görüntüleyin