Microsoft.MachineLearningServices çalışma alanları/onlineEndpoints/deployments 2022-10-01
Bicep kaynak tanımı
Çalışma alanları/onlineEndpoints/deployments kaynak türü, aşağıdakileri hedefleyen işlemlerle dağıtılabilir:
- Kaynak grupları - Bkz. kaynak grubu dağıtım komutları
Her API sürümünde değiştirilen özelliklerin listesi için bkz. değişiklik günlüğü.
Kaynak biçimi
Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments kaynağı oluşturmak için aşağıdaki Bicep'i şablonunuza ekleyin.
resource symbolicname 'Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments@2022-10-01' = {
name: 'string'
location: 'string'
tags: {
tagName1: 'tagValue1'
tagName2: 'tagValue2'
}
sku: {
capacity: int
family: 'string'
name: 'string'
size: 'string'
tier: 'string'
}
kind: 'string'
parent: resourceSymbolicName
identity: {
type: 'string'
userAssignedIdentities: {
{customized property}: {}
}
}
properties: {
appInsightsEnabled: bool
codeConfiguration: {
codeId: 'string'
scoringScript: 'string'
}
description: 'string'
egressPublicNetworkAccess: 'string'
environmentId: 'string'
environmentVariables: {
{customized property}: 'string'
{customized property}: 'string'
}
instanceType: 'string'
livenessProbe: {
failureThreshold: int
initialDelay: 'string'
period: 'string'
successThreshold: int
timeout: 'string'
}
model: 'string'
modelMountPath: 'string'
properties: {
{customized property}: 'string'
{customized property}: 'string'
}
readinessProbe: {
failureThreshold: int
initialDelay: 'string'
period: 'string'
successThreshold: int
timeout: 'string'
}
requestSettings: {
maxConcurrentRequestsPerInstance: int
maxQueueWait: 'string'
requestTimeout: 'string'
}
scaleSettings: {
scaleType: 'string'
// For remaining properties, see OnlineScaleSettings objects
}
endpointComputeType: 'string'
// For remaining properties, see OnlineDeploymentProperties objects
}
}
OnlineDeploymentProperties nesneleri
nesne türünü belirtmek için endpointComputeType özelliğini ayarlayın.
Kubernetes için şunu kullanın:
endpointComputeType: 'Kubernetes'
containerResourceRequirements: {
containerResourceLimits: {
cpu: 'string'
gpu: 'string'
memory: 'string'
}
containerResourceRequests: {
cpu: 'string'
gpu: 'string'
memory: 'string'
}
}
Yönetilen için şunu kullanın:
endpointComputeType: 'Managed'
OnlineScaleSettings nesneleri
nesne türünü belirtmek için scaleType özelliğini ayarlayın.
Varsayılan için şunu kullanın:
scaleType: 'Default'
TargetUtilization için şunu kullanın:
scaleType: 'TargetUtilization'
maxInstances: int
minInstances: int
pollingInterval: 'string'
targetUtilizationPercentage: int
Özellik değerleri
workspaces/onlineEndpoints/deployments
Ad | Açıklama | Değer |
---|---|---|
name | Kaynak adı Bicep'te alt kaynaklar için adları ve türleri ayarlamayı öğrenin. |
dize (gerekli) |
location | Kaynağın bulunduğu coğrafi konum | dize (gerekli) |
etiketler | Kaynak etiketleri. | Etiket adlarının ve değerlerinin sözlüğü. Bkz. Şablonlardaki etiketler |
Sku | Otomatik Ölçeklendirme için ARM sözleşmesi için gereken SKU ayrıntıları. | Sku |
Tür | Portal/araçlar/vb. tarafından aynı türdeki kaynaklar için farklı UX deneyimlerini işlemek için kullanılan meta veriler. | string |
Üst | Bicep'te alt kaynak için üst kaynağı belirtebilirsiniz. Bu özelliği yalnızca alt kaynak üst kaynağın dışında bildirildiğinde eklemeniz gerekir. Daha fazla bilgi için bkz . Üst kaynağın dışındaki alt kaynak. |
Kaynak türü için sembolik ad: onlineEndpoints |
identity | Yönetilen hizmet kimliği (sistem tarafından atanan ve/veya kullanıcı tarafından atanan kimlikler) | ManagedServiceIdentity |
properties | [Gerekli] Varlığın ek öznitelikleri. | OnlineDeploymentProperties (gerekli) |
ManagedServiceIdentity
Ad | Açıklama | Değer |
---|---|---|
tür | Yönetilen hizmet kimliğinin türü (hem SystemAssigned hem de UserAssigned türlerine izin verilir). | 'Yok' 'SystemAssigned' 'SystemAssigned,UserAssigned' 'UserAssigned' (gerekli) |
userAssignedIdentities | Kaynakla ilişkili kullanıcı tarafından atanan kimlik kümesi. userAssignedIdentities sözlük anahtarları şu biçimde ARM kaynak kimlikleri olacaktır: '/subscriptions/{subscriptionId}/resourceGroups/{resourceGroupName}/providers/Microsoft.ManagedIdentity/userAssignedIdentities/{identityName}. Sözlük değerleri, isteklerdeki boş nesneler ({}) olabilir. | UserAssignedIdentities |
UserAssignedIdentities
Ad | Açıklama | Değer |
---|---|---|
{özelleştirilmiş özellik} | UserAssignedIdentity |
UserAssignedIdentity
Bu nesne dağıtım sırasında ayarlanacağı herhangi bir özellik içermiyor. Tüm özellikler ReadOnly'dır.
OnlineDeploymentProperties
Ad | Açıklama | Değer |
---|---|---|
appInsightsEnabled | True ise Application Insights günlüğünü etkinleştirir. | bool |
codeConfiguration | Uç nokta dağıtımı için kod yapılandırması. | CodeConfiguration |
açıklama | Uç nokta dağıtımının açıklaması. | string |
egressPublicNetworkAccess | Etkinse çıkış genel ağ erişimine izin verin. Devre dışı bırakılırsa güvenli çıkış oluşturulur. Varsayılan: Etkin. | 'Devre Dışı' 'Etkin' |
environmentId | Uç nokta dağıtımı için ortam belirtiminin ARM kaynak kimliği veya AssetId değeri. | string |
environmentVariables | Dağıtım için ortam değişkenleri yapılandırması. | EndpointDeploymentPropertiesBaseEnvironmentVariables |
instanceType | İşlem örneği türü. | string |
livenessProbe | Canlılık araştırması kapsayıcının durumunu düzenli olarak izler. | ProbeSettings |
model | Modelin URI yolu. | string |
modelMountPath | Modeli özel kapsayıcıya bağlama yolu. | string |
properties | Özellik sözlüğü. Özellikler eklenebilir, ancak kaldırılamaz veya değiştirilemez. | EndpointDeploymentPropertiesBaseProperties |
readinessProbe | Hazırlık yoklaması, kapsayıcının trafiğe hizmet etmeye hazır olup olmadığını doğrular. Özellikler ve varsayılanlar canlılık yoklaması ile aynıdır. | ProbeSettings |
requestSettings | Dağıtım için istek ayarları. | OnlineRequestSettings |
scaleSettings | Dağıtım için ayarları ölçeklendirin. Null ise veya sağlanmadıysa, KubernetesOnlineDeployment için varsayılan olarak TargetUtilizationScaleSettings olarak belirlenmiştir ve ManagedOnlineDeployment için DefaultScaleSettings'e gidin. |
OnlineScaleSettings |
endpointComputeType | Nesne türünü ayarlama | Kubernetes Yönetilen (gerekli) |
CodeConfiguration
Ad | Açıklama | Değer |
---|---|---|
codeId | Kod varlığının ARM kaynak kimliği. | string |
scoringScript | [Gerekli] Başlangıçta yürütülecek betik. Örneğin "score.py" | dize (gerekli) Kısıtlama -ları: En az uzunluk = 1 Desen = [a-zA-Z0-9_] |
EndpointDeploymentPropertiesBaseEnvironmentVariables
Ad | Açıklama | Değer |
---|---|---|
{özelleştirilmiş özellik} | string | |
{özelleştirilmiş özellik} | string |
ProbeSettings
Ad | Açıklama | Değer |
---|---|---|
failureThreshold | İyi durumda olmayan bir durum döndürmeden önce izin verilmeyen hata sayısı. | int |
ınitialdelay | ISO 8601 biçimindeki ilk araştırmadan önceki gecikme. | string |
dönem | ISO 8601 biçimindeki yoklamalar arasındaki süre. | string |
successThreshold | İyi durumda bir durum döndürmeden önce başarılı yoklamaların sayısı. | int |
timeout | ISO 8601 biçiminde araştırma zaman aşımı. | string |
EndpointDeploymentPropertiesBaseProperties
Ad | Açıklama | Değer |
---|---|---|
{özelleştirilmiş özellik} | string | |
{özelleştirilmiş özellik} | string |
OnlineRequestSettings
Ad | Açıklama | Değer |
---|---|---|
maxConcurrentRequestsPerInstance | Dağıtım başına izin verilen düğüm başına en fazla eşzamanlı istek sayısı. Varsayılan değer 1'tir. | int |
maxQueueWait | Bir isteğin ISO 8601 biçiminde kuyrukta kalacağı maksimum süre. Varsayılan değer 500ms'tir. |
string |
requestTimeout | ISO 8601 biçiminde puanlama zaman aşımı. Varsayılan değer 5000ms'tir. |
string |
OnlineScaleSettings
Ad | Açıklama | Değer |
---|---|---|
scaleType | Nesne türünü ayarlama | Default TargetUtilization (gerekli) |
DefaultScaleSettings
Ad | Açıklama | Değer |
---|---|---|
scaleType | [Gerekli] Dağıtım ölçeklendirme algoritmasının türü | 'Varsayılan' (gerekli) |
TargetUtilizationScaleSettings
Ad | Açıklama | Değer |
---|---|---|
scaleType | [Gerekli] Dağıtım ölçeklendirme algoritmasının türü | 'TargetUtilization' (gerekli) |
maxInstances | Dağıtımın ölçeklendirilebileceği en fazla örnek sayısı. Kota max_instances için ayrılacaktır. | int |
minInstances | Her zaman mevcut olacak en az örnek sayısı. | int |
Pollingınterval | ISO 8691 biçimindeki yoklama aralığı. Yalnızca Saniye kadar düşük duyarlıkla süreyi destekler. | string |
targetUtilizationPercentage | Otomatik ölçeklendirici için hedef CPU kullanımı. | int |
KubernetesOnlineDeployment
Ad | Açıklama | Değer |
---|---|---|
endpointComputeType | [Gerekli] Uç noktanın işlem türü. | 'Kubernetes' (gerekli) |
containerResourceRequirements | Kapsayıcının kaynak gereksinimleri (cpu ve bellek). | ContainerResourceRequirements |
ContainerResourceRequirements
Ad | Açıklama | Değer |
---|---|---|
containerResourceLimits | Kapsayıcı kaynak sınırı bilgileri: | ContainerResourceSettings |
containerResourceRequests | Kapsayıcı kaynak isteği bilgileri: | ContainerResourceSettings |
ContainerResourceSettings
Ad | Açıklama | Değer |
---|---|---|
Cpu | Kapsayıcı için vCPU isteği/sınırı sayısı. Daha fazla bilgi: https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/ |
string |
Gpu | Kapsayıcı için Nvidia GPU kartı isteği/sınırı sayısı. Daha fazla bilgi: https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/ |
string |
bellek | Kapsayıcı için bellek boyutu isteği/sınırı. Daha fazla bilgi: https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/ |
string |
ManagedOnlineDeployment
Ad | Açıklama | Değer |
---|---|---|
endpointComputeType | [Gerekli] Uç noktanın işlem türü. | 'Yönetilen' (gerekli) |
Sku
Ad | Açıklama | Değer |
---|---|---|
capacity | SKU ölçeği genişletmeyi/daraltma işlemini destekliyorsa kapasite tamsayısı dahil edilmelidir. Kaynak için ölçeği genişletme/daraltma mümkün değilse bu atlanabilir. | int |
aile | Hizmetin aynı SKU için farklı nesil donanımları varsa, bu durum burada yakalanabilir. | string |
name | SKU'nun adı. Ex - P3. Bu genellikle bir harf+sayı kodudur | dize (gerekli) |
boyut | SKU boyutu. Ad alanı katman ve başka bir değerin birleşimi olduğunda, bu tek başına kod olacaktır. | string |
tier | Hizmetin birden fazla katmanı varsa ancak PUT üzerinde gerekli değilse, bu alanın Kaynak Sağlayıcısı tarafından uygulanması gerekir. | 'Temel' 'Ücretsiz' 'Premium' 'Standart' |
ARM şablonu kaynak tanımı
Çalışma alanları/onlineEndpoints/deployments kaynak türü şunları hedefleyen işlemlerle dağıtılabilir:
- Kaynak grupları - Bkz. kaynak grubu dağıtım komutları
Her API sürümünde değiştirilen özelliklerin listesi için bkz. değişiklik günlüğü.
Kaynak biçimi
Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments kaynağı oluşturmak için şablonunuza aşağıdaki JSON'u ekleyin.
{
"type": "Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments",
"apiVersion": "2022-10-01",
"name": "string",
"location": "string",
"tags": {
"tagName1": "tagValue1",
"tagName2": "tagValue2"
},
"sku": {
"capacity": "int",
"family": "string",
"name": "string",
"size": "string",
"tier": "string"
},
"kind": "string",
"identity": {
"type": "string",
"userAssignedIdentities": {
"{customized property}": {}
}
},
"properties": {
"appInsightsEnabled": "bool",
"codeConfiguration": {
"codeId": "string",
"scoringScript": "string"
},
"description": "string",
"egressPublicNetworkAccess": "string",
"environmentId": "string",
"environmentVariables": {
"{customized property}": "string",
"{customized property}": "string"
},
"instanceType": "string",
"livenessProbe": {
"failureThreshold": "int",
"initialDelay": "string",
"period": "string",
"successThreshold": "int",
"timeout": "string"
},
"model": "string",
"modelMountPath": "string",
"properties": {
"{customized property}": "string",
"{customized property}": "string"
},
"readinessProbe": {
"failureThreshold": "int",
"initialDelay": "string",
"period": "string",
"successThreshold": "int",
"timeout": "string"
},
"requestSettings": {
"maxConcurrentRequestsPerInstance": "int",
"maxQueueWait": "string",
"requestTimeout": "string"
},
"scaleSettings": {
"scaleType": "string"
// For remaining properties, see OnlineScaleSettings objects
},
"endpointComputeType": "string"
// For remaining properties, see OnlineDeploymentProperties objects
}
}
OnlineDeploymentProperties nesneleri
nesne türünü belirtmek için endpointComputeType özelliğini ayarlayın.
Kubernetes için şunu kullanın:
"endpointComputeType": "Kubernetes",
"containerResourceRequirements": {
"containerResourceLimits": {
"cpu": "string",
"gpu": "string",
"memory": "string"
},
"containerResourceRequests": {
"cpu": "string",
"gpu": "string",
"memory": "string"
}
}
Yönetilen için şunu kullanın:
"endpointComputeType": "Managed"
OnlineScaleSettings nesneleri
nesne türünü belirtmek için scaleType özelliğini ayarlayın.
Varsayılan için şunu kullanın:
"scaleType": "Default"
TargetUtilization için şunu kullanın:
"scaleType": "TargetUtilization",
"maxInstances": "int",
"minInstances": "int",
"pollingInterval": "string",
"targetUtilizationPercentage": "int"
Özellik değerleri
çalışma alanları/onlineEndpoints/dağıtımlar
Ad | Açıklama | Değer |
---|---|---|
tür | Kaynak türü | 'Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments' |
apiVersion | Kaynak API'sinin sürümü | '2022-10-01' |
name | Kaynak adı Bkz. JSON ARM şablonlarında alt kaynaklar için adları ve türleri ayarlama. |
dize (gerekli) |
location | Kaynağın bulunduğu coğrafi konum | dize (gerekli) |
etiketler | Kaynak etiketleri. | Etiket adlarının ve değerlerinin sözlüğü. Bkz . Şablonlardaki etiketler |
Sku | Otomatik Ölçeklendirme için ARM sözleşmesi için gereken SKU ayrıntıları. | Sku |
Tür | Portal/araçlar/vb. tarafından aynı türdeki kaynaklar için farklı UX deneyimlerini işlemek için kullanılan meta veriler. | string |
identity | Yönetilen hizmet kimliği (sistem tarafından atanan ve/veya kullanıcı tarafından atanan kimlikler) | ManagedServiceIdentity |
properties | [Gerekli] Varlığın ek öznitelikleri. | OnlineDeploymentProperties (gerekli) |
ManagedServiceIdentity
Ad | Açıklama | Değer |
---|---|---|
tür | Yönetilen hizmet kimliği türü (hem SystemAssigned hem de UserAssigned türlerine izin verilir). | 'Yok' 'SystemAssigned' 'SystemAssigned,UserAssigned' 'UserAssigned' (gerekli) |
userAssignedIdentities | Kaynakla ilişkilendirilmiş kullanıcı tarafından atanan kimlik kümesi. userAssignedIdentities sözlük anahtarları şu formda ARM kaynak kimlikleri olacaktır: '/subscriptions/{subscriptionId}/resourceGroups/{resourceGroupName}/providers/Microsoft.ManagedIdentity/userAssignedIdentities/{identityName}. Sözlük değerleri, isteklerdeki boş nesneler ({}) olabilir. | UserAssignedIdentities |
UserAssignedIdentities
Ad | Açıklama | Değer |
---|---|---|
{özelleştirilmiş özellik} | UserAssignedIdentity |
UserAssignedIdentity
Bu nesne dağıtım sırasında ayarlanacağı herhangi bir özellik içermez. Tüm özellikler Salt Okunur'dır.
OnlineDeploymentProperties
Ad | Açıklama | Değer |
---|---|---|
appInsightsEnabled | True ise Application Insights günlüğünü etkinleştirir. | bool |
codeConfiguration | Uç nokta dağıtımı için kod yapılandırması. | CodeConfiguration |
açıklama | Uç nokta dağıtımının açıklaması. | string |
egressPublicNetworkAccess | Etkinse çıkış genel ağ erişimine izin verin. Devre dışı bırakılırsa, bu güvenli çıkış oluşturur. Varsayılan: Etkin. | 'Devre Dışı' 'Etkin' |
environmentId | Uç nokta dağıtımı için ortam belirtiminin ARM kaynak kimliği veya AssetId değeri. | string |
environmentVariables | Dağıtım için ortam değişkenleri yapılandırması. | EndpointDeploymentPropertiesBaseEnvironmentVariables |
instanceType | İşlem örneği türü. | string |
canlılıkProbe | Canlılık yoklaması kapsayıcının durumunu düzenli olarak izler. | ProbeSettings |
model | Modelin URI yolu. | string |
modelMountPath | Modeli özel kapsayıcıya bağlama yolu. | string |
properties | Özellik sözlüğü. Özellikler eklenebilir, ancak kaldırılamaz veya değiştirilemez. | EndpointDeploymentPropertiesBaseProperties |
readinessProbe | Hazır olma yoklaması, kapsayıcının trafiğe hizmet etmeye hazır olup olmadığını doğrular. Özellikler ve varsayılanlar canlılık yoklaması ile aynıdır. | ProbeSettings |
requestSettings | Dağıtım için istek ayarları. | OnlineRequestSettings |
scaleSettings | Dağıtım için ölçek ayarları. Null ise veya sağlanmadıysa, Varsayılan olarak KubernetesOnlineDeployment için TargetUtilizationScaleSettings olarak ayarlanır ve ManagedOnlineDeployment için DefaultScaleSettings'e gidin. |
OnlineScaleSettings |
endpointComputeType | Nesne türünü ayarlama | Kubernetes Yönetilen (gerekli) |
CodeConfiguration
Ad | Açıklama | Değer |
---|---|---|
codeId | Kod varlığının ARM kaynak kimliği. | string |
scoringScript | [Gerekli] Başlangıçta yürütülecek betik. Örneğin "score.py" | dize (gerekli) Kısıtlama -ları: En az uzunluk = 1 Desen = [a-zA-Z0-9_] |
EndpointDeploymentPropertiesBaseEnvironmentVariables
Ad | Açıklama | Değer |
---|---|---|
{özelleştirilmiş özellik} | string | |
{özelleştirilmiş özellik} | string |
ProbeSettings
Ad | Açıklama | Değer |
---|---|---|
failureThreshold | İyi durumda olmayan bir durum döndürmeden önce izin verilmeyen hata sayısı. | int |
ınitialdelay | ISO 8601 biçimindeki ilk yoklamadan önceki gecikme. | string |
dönem | ISO 8601 biçimindeki yoklamalar arasındaki süre. | string |
successThreshold | İyi durumda döndürmeden önce başarılı yoklamaların sayısı. | int |
timeout | ISO 8601 biçiminde yoklama zaman aşımı. | string |
EndpointDeploymentPropertiesBaseProperties
Ad | Açıklama | Değer |
---|---|---|
{özelleştirilmiş özellik} | string | |
{özelleştirilmiş özellik} | string |
OnlineRequestSettings
Ad | Açıklama | Değer |
---|---|---|
maxConcurrentRequestsPerInstance | Dağıtım başına izin verilen düğüm başına en fazla eşzamanlı istek sayısı. Varsayılan olarak 1'e ayarlanır. | int |
maxQueueWait | bir isteğin ISO 8601 biçiminde kuyrukta kalacağı en uzun süre. Varsayılan değer 500ms'tir. |
string |
requestTimeout | ISO 8601 biçiminde puanlama zaman aşımı. Varsayılan değer 5000ms'tir. |
string |
OnlineScaleSettings
Ad | Açıklama | Değer |
---|---|---|
scaleType | Nesne türünü ayarlama | Default TargetUtilization (gerekli) |
DefaultScaleSettings
Ad | Açıklama | Değer |
---|---|---|
scaleType | [Gerekli] Dağıtım ölçeklendirme algoritmasının türü | 'Varsayılan' (gerekli) |
TargetUtilizationScaleSettings
Ad | Açıklama | Değer |
---|---|---|
scaleType | [Gerekli] Dağıtım ölçeklendirme algoritmasının türü | 'TargetUtilization' (gerekli) |
maxInstances | Dağıtımın ölçeklendirilebileceği en fazla örnek sayısı. Kota max_instances için ayrılacaktır. | int |
minInstances | Her zaman mevcut olacak en az örnek sayısı. | int |
Pollingınterval | ISO 8691 biçimindeki yoklama aralığı. Yalnızca Saniye kadar düşük duyarlıkla süreyi destekler. | string |
targetUtilizationPercentage | Otomatik ölçeklendirici için hedef CPU kullanımı. | int |
KubernetesOnlineDeployment
Ad | Açıklama | Değer |
---|---|---|
endpointComputeType | [Gerekli] Uç noktanın işlem türü. | 'Kubernetes' (gerekli) |
containerResourceRequirements | Kapsayıcı için kaynak gereksinimleri (cpu ve bellek). | ContainerResourceRequirements |
ContainerResourceRequirements
Ad | Açıklama | Değer |
---|---|---|
containerResourceLimits | Kapsayıcı kaynak sınırı bilgileri: | ContainerResourceSettings |
containerResourceRequests | Kapsayıcı kaynak isteği bilgileri: | ContainerResourceSettings |
ContainerResourceSettings
Ad | Açıklama | Değer |
---|---|---|
Cpu | Kapsayıcı için vCPU isteği/sınırı sayısı. Daha fazla bilgi: https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/ |
string |
Gpu | Kapsayıcı için Nvidia GPU kartı isteği/sınırı sayısı. Daha fazla bilgi: https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/ |
string |
bellek | Kapsayıcı için bellek boyutu isteği/sınırı. Daha fazla bilgi: https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/ |
string |
ManagedOnlineDeployment
Ad | Açıklama | Değer |
---|---|---|
endpointComputeType | [Gerekli] Uç noktanın işlem türü. | 'Managed' (gerekli) |
Sku
Ad | Açıklama | Değer |
---|---|---|
capacity | SKU ölçeği genişletmeyi/daraltma işlemini destekliyorsa kapasite tamsayısı dahil edilmelidir. Kaynak için ölçeği genişletme/daraltma mümkün değilse bu atlanabilir. | int |
aile | Hizmetin aynı SKU için farklı nesil donanımları varsa, bu burada yakalanabilir. | string |
name | SKU'nun adı. Ex - P3. Bu genellikle letter+number kodudur | dize (gerekli) |
boyut | SKU boyutu. Ad alanı katman ile başka bir değerin birleşimi olduğunda, bu tek başına kod olur. | string |
tier | Hizmetin birden fazla katmanı varsa ancak PUT üzerinde gerekli değilse, bu alanın Kaynak Sağlayıcısı tarafından uygulanması gerekir. | 'Temel' 'Ücretsiz' 'Premium' 'Standart' |
Terraform (AzAPI sağlayıcısı) kaynak tanımı
Çalışma alanları/onlineEndpoints/deployments kaynak türü, aşağıdakileri hedefleyen işlemlerle dağıtılabilir:
- Kaynak grupları
Her API sürümünde değiştirilen özelliklerin listesi için bkz. değişiklik günlüğü.
Kaynak biçimi
Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments kaynağı oluşturmak için aşağıdaki Terraform'u şablonunuza ekleyin.
resource "azapi_resource" "symbolicname" {
type = "Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments@2022-10-01"
name = "string"
location = "string"
parent_id = "string"
tags = {
tagName1 = "tagValue1"
tagName2 = "tagValue2"
}
identity {
type = "string"
identity_ids = []
}
body = jsonencode({
properties = {
appInsightsEnabled = bool
codeConfiguration = {
codeId = "string"
scoringScript = "string"
}
description = "string"
egressPublicNetworkAccess = "string"
environmentId = "string"
environmentVariables = {
{customized property} = "string"
{customized property} = "string"
}
instanceType = "string"
livenessProbe = {
failureThreshold = int
initialDelay = "string"
period = "string"
successThreshold = int
timeout = "string"
}
model = "string"
modelMountPath = "string"
properties = {
{customized property} = "string"
{customized property} = "string"
}
readinessProbe = {
failureThreshold = int
initialDelay = "string"
period = "string"
successThreshold = int
timeout = "string"
}
requestSettings = {
maxConcurrentRequestsPerInstance = int
maxQueueWait = "string"
requestTimeout = "string"
}
scaleSettings = {
scaleType = "string"
// For remaining properties, see OnlineScaleSettings objects
}
endpointComputeType = "string"
// For remaining properties, see OnlineDeploymentProperties objects
}
sku = {
capacity = int
family = "string"
name = "string"
size = "string"
tier = "string"
}
kind = "string"
})
}
OnlineDeploymentProperties nesneleri
nesne türünü belirtmek için endpointComputeType özelliğini ayarlayın.
Kubernetes için şunu kullanın:
endpointComputeType = "Kubernetes"
containerResourceRequirements = {
containerResourceLimits = {
cpu = "string"
gpu = "string"
memory = "string"
}
containerResourceRequests = {
cpu = "string"
gpu = "string"
memory = "string"
}
}
Yönetilen için şunu kullanın:
endpointComputeType = "Managed"
OnlineScaleSettings nesneleri
nesne türünü belirtmek için scaleType özelliğini ayarlayın.
Varsayılan için şunu kullanın:
scaleType = "Default"
TargetUtilization için şunu kullanın:
scaleType = "TargetUtilization"
maxInstances = int
minInstances = int
pollingInterval = "string"
targetUtilizationPercentage = int
Özellik değerleri
workspaces/onlineEndpoints/deployments
Ad | Açıklama | Değer |
---|---|---|
tür | Kaynak türü | "Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments@2022-10-01" |
name | Kaynak adı | dize (gerekli) |
location | Kaynağın bulunduğu coğrafi konum | dize (gerekli) |
parent_id | Bu kaynağın üst öğesi olan kaynağın kimliği. | Kaynak türü: onlineEndpoints kimliği |
etiketler | Kaynak etiketleri. | Etiket adlarının ve değerlerinin sözlüğü. |
Sku | Otomatik Ölçeklendirme için ARM sözleşmesi için gereken SKU ayrıntıları. | Sku |
Tür | Portal/araçlar/vb. tarafından aynı türdeki kaynaklar için farklı UX deneyimlerini işlemek için kullanılan meta veriler. | string |
identity | Yönetilen hizmet kimliği (sistem tarafından atanan ve/veya kullanıcı tarafından atanan kimlikler) | ManagedServiceIdentity |
properties | [Gerekli] Varlığın ek öznitelikleri. | OnlineDeploymentProperties (gerekli) |
ManagedServiceIdentity
Ad | Açıklama | Değer |
---|---|---|
tür | Yönetilen hizmet kimliğinin türü (hem SystemAssigned hem de UserAssigned türlerine izin verilir). | "SystemAssigned" "SystemAssigned,UserAssigned" "UserAssigned" (gerekli) |
identity_ids | Kaynakla ilişkili kullanıcı tarafından atanan kimlik kümesi. userAssignedIdentities sözlük anahtarları şu biçimde ARM kaynak kimlikleri olacaktır: '/subscriptions/{subscriptionId}/resourceGroups/{resourceGroupName}/providers/Microsoft.ManagedIdentity/userAssignedIdentities/{identityName}. Sözlük değerleri, isteklerdeki boş nesneler ({}) olabilir. | Kullanıcı kimliği kimlikleri dizisi. |
UserAssignedIdentities
Ad | Açıklama | Değer |
---|---|---|
{özelleştirilmiş özellik} | UserAssignedIdentity |
UserAssignedIdentity
Bu nesne dağıtım sırasında ayarlanacağı herhangi bir özellik içermiyor. Tüm özellikler ReadOnly'dır.
OnlineDeploymentProperties
Ad | Açıklama | Değer |
---|---|---|
appInsightsEnabled | True ise Application Insights günlüğünü etkinleştirir. | bool |
codeConfiguration | Uç nokta dağıtımı için kod yapılandırması. | CodeConfiguration |
açıklama | Uç nokta dağıtımının açıklaması. | string |
egressPublicNetworkAccess | Etkinse çıkış genel ağ erişimine izin verin. Devre dışı bırakılırsa güvenli çıkış oluşturulur. Varsayılan: Etkin. | "Devre dışı" "Etkin" |
environmentId | Uç nokta dağıtımı için ortam belirtiminin ARM kaynak kimliği veya AssetId değeri. | string |
environmentVariables | Dağıtım için ortam değişkenleri yapılandırması. | EndpointDeploymentPropertiesBaseEnvironmentVariables |
instanceType | İşlem örneği türü. | string |
livenessProbe | Canlılık araştırması kapsayıcının durumunu düzenli olarak izler. | ProbeSettings |
model | Modelin URI yolu. | string |
modelMountPath | Modeli özel kapsayıcıya bağlama yolu. | string |
properties | Özellik sözlüğü. Özellikler eklenebilir, ancak kaldırılamaz veya değiştirilemez. | EndpointDeploymentPropertiesBaseProperties |
readinessProbe | Hazırlık yoklaması, kapsayıcının trafiğe hizmet etmeye hazır olup olmadığını doğrular. Özellikler ve varsayılanlar canlılık yoklaması ile aynıdır. | ProbeSettings |
requestSettings | Dağıtım için istek ayarları. | OnlineRequestSettings |
scaleSettings | Dağıtım için ayarları ölçeklendirin. Null ise veya sağlanmadıysa, KubernetesOnlineDeployment için varsayılan olarak TargetUtilizationScaleSettings olarak belirlenmiştir ve ManagedOnlineDeployment için DefaultScaleSettings'e gidin. |
OnlineScaleSettings |
endpointComputeType | Nesne türünü ayarlama | Kubernetes Yönetilen (gerekli) |
CodeConfiguration
Ad | Açıklama | Değer |
---|---|---|
codeId | Kod varlığının ARM kaynak kimliği. | string |
scoringScript | [Gerekli] Başlangıçta yürütülecek betik. Örneğin "score.py" | dize (gerekli) Kısıtlama -ları: En az uzunluk = 1 Desen = [a-zA-Z0-9_] |
EndpointDeploymentPropertiesBaseEnvironmentVariables
Ad | Açıklama | Değer |
---|---|---|
{özelleştirilmiş özellik} | string | |
{özelleştirilmiş özellik} | string |
ProbeSettings
Ad | Açıklama | Değer |
---|---|---|
failureThreshold | İyi durumda olmayan bir durum döndürmeden önce izin verilmeyen hata sayısı. | int |
ınitialdelay | ISO 8601 biçimindeki ilk araştırmadan önceki gecikme. | string |
dönem | ISO 8601 biçimindeki yoklamalar arasındaki süre. | string |
successThreshold | İyi durumda bir durum döndürmeden önce başarılı yoklamaların sayısı. | int |
timeout | ISO 8601 biçiminde araştırma zaman aşımı. | string |
EndpointDeploymentPropertiesBaseProperties
Ad | Açıklama | Değer |
---|---|---|
{özelleştirilmiş özellik} | string | |
{özelleştirilmiş özellik} | string |
OnlineRequestSettings
Ad | Açıklama | Değer |
---|---|---|
maxConcurrentRequestsPerInstance | Dağıtım başına izin verilen düğüm başına en fazla eşzamanlı istek sayısı. Varsayılan olarak 1'e ayarlanır. | int |
maxQueueWait | bir isteğin ISO 8601 biçiminde kuyrukta kalacağı en uzun süre. Varsayılan değer 500ms'tir. |
string |
requestTimeout | ISO 8601 biçiminde puanlama zaman aşımı. Varsayılan değer 5000ms'tir. |
string |
OnlineScaleSettings
Ad | Açıklama | Değer |
---|---|---|
scaleType | Nesne türünü ayarlama | Default TargetUtilization (gerekli) |
DefaultScaleSettings
Ad | Açıklama | Değer |
---|---|---|
scaleType | [Gerekli] Dağıtım ölçeklendirme algoritmasının türü | "Varsayılan" (gerekli) |
TargetUtilizationScaleSettings
Ad | Açıklama | Değer |
---|---|---|
scaleType | [Gerekli] Dağıtım ölçeklendirme algoritmasının türü | "TargetUtilization" (gerekli) |
maxInstances | Dağıtımın ölçeklendirilebileceği en fazla örnek sayısı. Kota max_instances için ayrılacaktır. | int |
minInstances | Her zaman mevcut olacak en az örnek sayısı. | int |
Pollingınterval | ISO 8691 biçimindeki yoklama aralığı. Yalnızca Saniye kadar düşük duyarlıkla süreyi destekler. | string |
targetUtilizationPercentage | Otomatik ölçeklendirici için hedef CPU kullanımı. | int |
KubernetesOnlineDeployment
Ad | Açıklama | Değer |
---|---|---|
endpointComputeType | [Gerekli] Uç noktanın işlem türü. | "Kubernetes" (gerekli) |
containerResourceRequirements | Kapsayıcı için kaynak gereksinimleri (cpu ve bellek). | ContainerResourceRequirements |
ContainerResourceRequirements
Ad | Açıklama | Değer |
---|---|---|
containerResourceLimits | Kapsayıcı kaynak sınırı bilgileri: | ContainerResourceSettings |
containerResourceRequests | Kapsayıcı kaynak isteği bilgileri: | ContainerResourceSettings |
ContainerResourceSettings
Ad | Açıklama | Değer |
---|---|---|
Cpu | Kapsayıcı için vCPU isteği/sınırı sayısı. Daha fazla bilgi: https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/ |
string |
Gpu | Kapsayıcı için Nvidia GPU kartı isteği/sınırı sayısı. Daha fazla bilgi: https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/ |
string |
bellek | Kapsayıcı için bellek boyutu isteği/sınırı. Daha fazla bilgi: https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/ |
string |
ManagedOnlineDeployment
Ad | Açıklama | Değer |
---|---|---|
endpointComputeType | [Gerekli] Uç noktanın işlem türü. | "Yönetilen" (gerekli) |
Sku
Ad | Açıklama | Değer |
---|---|---|
capacity | SKU ölçeği genişletmeyi/daraltma işlemini destekliyorsa kapasite tamsayısı dahil edilmelidir. Kaynak için ölçeği genişletme/daraltma mümkün değilse bu atlanabilir. | int |
aile | Hizmetin aynı SKU için farklı nesil donanımları varsa, bu durum burada yakalanabilir. | string |
name | SKU'nun adı. Ex - P3. Bu genellikle bir harf+sayı kodudur | dize (gerekli) |
boyut | SKU boyutu. Ad alanı katman ve başka bir değerin birleşimi olduğunda, bu tek başına kod olacaktır. | string |
tier | Hizmetin birden fazla katmanı varsa ancak PUT üzerinde gerekli değilse, bu alanın Kaynak Sağlayıcısı tarafından uygulanması gerekir. | "Temel" "Ücretsiz" "Premium" "Standart" |
Geri Bildirim
https://aka.ms/ContentUserFeedback.
Çok yakında: 2024 boyunca, içerik için geri bildirim mekanizması olarak GitHub Sorunları’nı kullanımdan kaldıracak ve yeni bir geri bildirim sistemiyle değiştireceğiz. Daha fazla bilgi için bkz.Gönderin ve geri bildirimi görüntüleyin