Ruang kerja Microsoft.MachineLearningServices/onlineEndpoints/deployments 2023-06-01-preview
Definisi sumber daya Bicep
Jenis sumber daya workspaces/onlineEndpoints/deployments dapat disebarkan dengan operasi yang menargetkan:
- Grup sumber daya - Lihat perintah penyebaran grup sumber daya
Untuk daftar properti yang diubah di setiap versi API, lihat mengubah log.
Format sumber daya
Untuk membuat sumber daya Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments, tambahkan Bicep berikut ke templat Anda.
resource symbolicname 'Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments@2023-06-01-preview' = {
name: 'string'
location: 'string'
tags: {
tagName1: 'tagValue1'
tagName2: 'tagValue2'
}
sku: {
capacity: int
family: 'string'
name: 'string'
size: 'string'
tier: 'string'
}
kind: 'string'
parent: resourceSymbolicName
identity: {
type: 'string'
userAssignedIdentities: {
{customized property}: {}
}
}
properties: {
appInsightsEnabled: bool
codeConfiguration: {
codeId: 'string'
scoringScript: 'string'
}
dataCollector: {
collections: {
{customized property}: {
clientId: 'string'
dataCollectionMode: 'string'
dataId: 'string'
samplingRate: int
}
}
requestLogging: {
captureHeaders: [
'string'
]
}
rollingRate: 'string'
}
description: 'string'
egressPublicNetworkAccess: 'string'
environmentId: 'string'
environmentVariables: {
{customized property}: 'string'
{customized property}: 'string'
}
instanceType: 'string'
livenessProbe: {
failureThreshold: int
initialDelay: 'string'
period: 'string'
successThreshold: int
timeout: 'string'
}
model: 'string'
modelMountPath: 'string'
properties: {
{customized property}: 'string'
{customized property}: 'string'
}
readinessProbe: {
failureThreshold: int
initialDelay: 'string'
period: 'string'
successThreshold: int
timeout: 'string'
}
requestSettings: {
maxConcurrentRequestsPerInstance: int
maxQueueWait: 'string'
requestTimeout: 'string'
}
scaleSettings: {
scaleType: 'string'
// For remaining properties, see OnlineScaleSettings objects
}
endpointComputeType: 'string'
// For remaining properties, see OnlineDeploymentProperties objects
}
}
Objek OnlineDeploymentProperties
Atur properti endpointComputeType untuk menentukan jenis objek.
Untuk Kubernetes, gunakan:
endpointComputeType: 'Kubernetes'
containerResourceRequirements: {
containerResourceLimits: {
cpu: 'string'
gpu: 'string'
memory: 'string'
}
containerResourceRequests: {
cpu: 'string'
gpu: 'string'
memory: 'string'
}
}
Untuk Terkelola, gunakan:
endpointComputeType: 'Managed'
Objek OnlineScaleSettings
Atur properti scaleType untuk menentukan jenis objek.
Untuk Default, gunakan:
scaleType: 'Default'
Untuk TargetUtilization, gunakan:
scaleType: 'TargetUtilization'
maxInstances: int
minInstances: int
pollingInterval: 'string'
targetUtilizationPercentage: int
Nilai properti
workspaces/onlineEndpoints/deployments
Nama | Deskripsi | Nilai |
---|---|---|
nama | Nama sumber daya Lihat cara mengatur nama dan jenis untuk sumber daya anak di Bicep. |
string (diperlukan) |
lokasi | Lokasi geografis tempat sumber daya berada | string (diperlukan) |
tag | Tag sumber daya. | Kamus nama dan nilai tag. Lihat Tag dalam templat |
sku | Detail Sku diperlukan untuk kontrak ARM untuk Autoscaling. | Sku |
jenis | Metadata yang digunakan oleh portal/peralatan/dll untuk merender pengalaman UX yang berbeda untuk sumber daya dengan jenis yang sama. | string |
induk | Di Bicep, Anda dapat menentukan sumber daya induk untuk sumber daya anak. Anda hanya perlu menambahkan properti ini ketika sumber daya anak dideklarasikan di luar sumber daya induk. Untuk informasi selengkapnya, lihat Sumber daya anak di luar sumber daya induk. |
Nama simbolis untuk sumber daya jenis: onlineEndpoints |
identitas | Identitas layanan terkelola (identitas yang ditetapkan sistem dan/atau pengguna) | ManagedServiceIdentity |
properti | [Diperlukan] Atribut tambahan entitas. | OnlineDeploymentProperties (diperlukan) |
ManagedServiceIdentity
Nama | Deskripsi | Nilai |
---|---|---|
jenis | Jenis identitas layanan terkelola (di mana jenis SystemAssigned dan UserAssigned diizinkan). | 'Tidak Ada' 'SystemAssigned' 'SystemAssigned,UserAssigned' 'UserAssigned' (diperlukan) |
userAssignedIdentities | Kumpulan identitas yang ditetapkan pengguna yang terkait dengan sumber daya. Kunci kamus userAssignedIdentities akan menjadi id sumber daya ARM dalam formulir: '/subscriptions/{subscriptionId}/resourceGroups/{resourceGroupName}/providers/Microsoft.ManagedIdentity/userAssignedIdentities/{identityName}. Nilai kamus dapat berupa objek kosong ({}) dalam permintaan. | UserAssignedIdentities |
UserAssignedIdentities
Nama | Deskripsi | Nilai |
---|---|---|
{properti yang disesuaikan} | UserAssignedIdentity |
UserAssignedIdentity
Objek ini tidak berisi properti apa pun untuk diatur selama penyebaran. Semua properti adalah ReadOnly.
OnlineDeploymentProperties
Nama | Deskripsi | Nilai |
---|---|---|
appInsightsEnabled | Jika true, mengaktifkan pengelogan Application Insights. | bool |
codeConfiguration | Konfigurasi kode untuk penyebaran titik akhir. | CodeConfiguration |
dataCollector | Konfigurasi mdc, kami menonaktifkan mdc saat null. | DataCollector |
deskripsi | Deskripsi penyebaran titik akhir. | string |
egressPublicNetworkAccess | Jika Diaktifkan, izinkan akses jaringan publik keluar. Jika Dinonaktifkan, ini akan membuat jalan keluar yang aman. Default: Diaktifkan. | 'Dinonaktifkan' 'Diaktifkan' |
environmentId | ID sumber daya ARM dari spesifikasi lingkungan untuk penyebaran titik akhir. | string |
environmentVariables | Konfigurasi variabel lingkungan untuk penyebaran. | EndpointDeploymentPropertiesBaseEnvironmentVariables |
instanceType | Jenis instans komputasi. | string |
livenessProbe | Pemeriksaan keaktifan memantau kesehatan kontainer secara teratur. | ProbeSettings |
model | Jalur URI ke model. | string |
modelMountPath | Jalur untuk memasang model dalam kontainer kustom. | string |
properti | Kamus properti. Properti dapat ditambahkan, tetapi tidak dihapus atau diubah. | EndpointDeploymentPropertiesBaseProperties |
readinessProbe | Pemeriksaan kesiapan memvalidasi jika kontainer siap melayani lalu lintas. Properti dan defaultnya sama dengan pemeriksaan keaktifan. | ProbeSettings |
requestSettings | Minta pengaturan untuk penyebaran. | OnlineRequestSettings |
scaleSettings | Pengaturan skala untuk penyebaran. Jika null atau tidak disediakan, defaultnya ke TargetUtilizationScaleSettings untuk KubernetesOnlineDeployment dan ke DefaultScaleSettings untuk ManagedOnlineDeployment. |
OnlineScaleSettings |
endpointComputeType | Mengatur jenis objek | Kubernetes Terkelola (diperlukan) |
CodeConfiguration
Nama | Deskripsi | Nilai |
---|---|---|
codeId | ID sumber daya ARM dari aset kode. | string |
scoringScript | [Diperlukan] Skrip yang akan dijalankan saat startup. misalnya. "score.py" | string (diperlukan) Batasan: Panjang min = 1 Pola = [a-zA-Z0-9_] |
DataCollector
Nama | Deskripsi | Nilai |
---|---|---|
Koleksi | [Diperlukan] Konfigurasi koleksi. Setiap koleksi memiliki konfigurasinya sendiri untuk mengumpulkan data model dan nama koleksi dapat berupa string arbitrer. Pengumpul data model dapat digunakan untuk pengelogan payload atau pengelogan kustom atau keduanya. Permintaan dan respons pengumpulan dicadangkan untuk pengelogan payload, yang lain adalah untuk pengelogan kustom. |
DataCollectorCollections (diperlukan) |
requestLogging | Konfigurasi pengelogan permintaan untuk mdc, ini mencakup pengaturan pengelogan tingkat lanjut untuk semua koleksi. Ini opsional. | RequestLogging |
rollingRate | Ketika data model dikumpulkan ke penyimpanan blob, kita perlu menggulung data ke jalur yang berbeda untuk menghindari pengelogan semuanya dalam satu file blob. Jika laju bergulir adalah jam, semua data akan dikumpulkan di jalur blob /yyyy/MM/dd/HH/. Jika hari ini, semua data akan dikumpulkan dalam jalur blob /yyyy/MM/dd/. Manfaat lain dari jalur bergulir adalah bahwa ui pemantauan model mampu memilih rentang waktu data dengan sangat cepat. |
'Hari' 'Jam' 'Menit' 'Bulan' 'Tahun' |
DataCollectorCollections
Nama | Deskripsi | Nilai |
---|---|---|
{customized property} | Koleksi |
Koleksi
Nama | Deskripsi | Nilai |
---|---|---|
clientId | Id klien msi digunakan untuk mengumpulkan pengelogan ke penyimpanan blob. Jika null, backend akan memilih identitas titik akhir terdaftar untuk autentikasi. | string |
dataCollectionMode | Mengaktifkan atau menonaktifkan pengumpulan data. | 'Dinonaktifkan' 'Diaktifkan' |
dataId | Id sumber daya arm aset data. Sisi klien akan memastikan aset data menunjuk ke penyimpanan blob, dan backend akan mengumpulkan data ke penyimpanan blob. | string |
samplingRate | Laju pengambilan sampel untuk pengumpulan. Laju pengambilan sampel 1,0 berarti kami mengumpulkan 100% data secara default. | int |
RequestLogging
Nama | Deskripsi | Nilai |
---|---|---|
captureHeaders | Untuk pengelogan payload, kami hanya mengumpulkan payload secara default. Jika pelanggan juga ingin mengumpulkan header yang ditentukan, mereka dapat mengaturnya di captureHeaders sehingga backend akan mengumpulkan header tersebut bersama dengan payload. | string[] |
EndpointDeploymentPropertiesBaseEnvironmentVariables
Nama | Deskripsi | Nilai |
---|---|---|
{customized property} | string | |
{customized property} | string |
ProbeSettings
Nama | Deskripsi | Nilai |
---|---|---|
failureThreshold | Jumlah kegagalan yang diizinkan sebelum mengembalikan status tidak sehat. | int |
initialDelay | Penundaan sebelum pemeriksaan pertama dalam format ISO 8601. | string |
periode | Lamanya waktu antara pemeriksaan dalam format ISO 8601. | string |
successThreshold | Jumlah pemeriksaan yang berhasil sebelum mengembalikan status sehat. | int |
waktu habis | Batas waktu pemeriksaan dalam format ISO 8601. | string |
EndpointDeploymentPropertiesBaseProperties
Nama | Deskripsi | Nilai |
---|---|---|
{customized property} | string | |
{customized property} | string |
OnlineRequestSettings
Nama | Deskripsi | Nilai |
---|---|---|
maxConcurrentRequestsPerInstance | Jumlah permintaan bersamaan maksimum per simpul yang diizinkan per penyebaran. Default ke 1. | int |
maxQueueWait | Jumlah maksimum waktu permintaan akan tetap dalam antrean dalam format ISO 8601. Default ke 500ms. |
string |
requestTimeout | Batas waktu penilaian dalam format ISO 8601. Default ke 5000ms. |
string |
OnlineScaleSettings
Nama | Deskripsi | Nilai |
---|---|---|
scaleType | Mengatur jenis objek | Default TargetUtilization (diperlukan) |
DefaultScaleSettings
Nama | Deskripsi | Nilai |
---|---|---|
scaleType | [Diperlukan] Jenis algoritma penskalaan penyebaran | 'Default' (diperlukan) |
TargetUtilizationScaleSettings
Nama | Deskripsi | Nilai |
---|---|---|
scaleType | [Diperlukan] Jenis algoritma penskalaan penyebaran | 'TargetUtilization' (diperlukan) |
maxInstances | Jumlah instans maksimum yang dapat diperluas skalanya oleh penyebaran. Kuota akan dicadangkan untuk max_instances. | int |
minInstances | Jumlah instans minimum untuk selalu ada. | int |
pollingInterval | Interval polling dalam format ISO 8691. Hanya mendukung durasi dengan presisi serendah Detik. | string |
targetUtilizationPercentage | Penggunaan CPU target untuk autoscaler. | int |
KubernetesOnlineDeployment
Nama | Deskripsi | Nilai |
---|---|---|
endpointComputeType | [Diperlukan] Jenis komputasi titik akhir. | 'Kubernetes' (diperlukan) |
containerResourceRequirements | Persyaratan sumber daya untuk kontainer (cpu dan memori). | ContainerResourceRequirements |
ContainerResourceRequirements
Nama | Deskripsi | Nilai |
---|---|---|
containerResourceLimits | Info batas sumber daya kontainer: | ContainerResourceSettings |
containerResourceRequests | Info permintaan sumber daya kontainer: | ContainerResourceSettings |
ContainerResourceSettings
Nama | Deskripsi | Nilai |
---|---|---|
cpu | Jumlah permintaan/batas vCPU untuk kontainer. Info selengkapnya: https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/ |
string |
gpu | Jumlah permintaan/batas kartu GPU Nvidia untuk kontainer. Info selengkapnya: https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/ |
string |
memory | Permintaan/batas ukuran memori untuk kontainer. Info selengkapnya: https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/ |
string |
ManagedOnlineDeployment
Nama | Deskripsi | Nilai |
---|---|---|
endpointComputeType | [Diperlukan] Jenis komputasi titik akhir. | 'Terkelola' (diperlukan) |
SKU
Nama | Deskripsi | Nilai |
---|---|---|
kapasitas | Jika SKU mendukung peluasan skala/masuk, bilangan bulat kapasitas harus disertakan. Jika peluasan/penyempurnaan skala tidak dimungkinkan untuk sumber daya, ini dapat dihilangkan. | int |
keluarga | Jika layanan memiliki generasi perangkat keras yang berbeda, untuk SKU yang sama, maka itu dapat ditangkap di sini. | string |
nama | Nama SKUnya. Mantan - P3. Biasanya kode huruf+angka | string (diperlukan) |
Ukuran | Ukuran SKU. Ketika bidang nama adalah kombinasi tingkat dan beberapa nilai lainnya, ini akan menjadi kode mandiri. | string |
Tier | Bidang ini diperlukan untuk diimplementasikan oleh Penyedia Sumber Jika layanan memiliki lebih dari satu tingkat, tetapi tidak diperlukan pada PUT. | 'Dasar' 'Gratis' 'Premium' 'Standar' |
Definisi sumber daya templat ARM
Jenis sumber daya workspaces/onlineEndpoints/deployments dapat disebarkan dengan operasi yang menargetkan:
- Grup sumber daya - Lihat perintah penyebaran grup sumber daya
Untuk daftar properti yang diubah di setiap versi API, lihat log perubahan.
Format sumber daya
Untuk membuat sumber daya Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments, tambahkan JSON berikut ke templat Anda.
{
"type": "Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments",
"apiVersion": "2023-06-01-preview",
"name": "string",
"location": "string",
"tags": {
"tagName1": "tagValue1",
"tagName2": "tagValue2"
},
"sku": {
"capacity": "int",
"family": "string",
"name": "string",
"size": "string",
"tier": "string"
},
"kind": "string",
"identity": {
"type": "string",
"userAssignedIdentities": {
"{customized property}": {}
}
},
"properties": {
"appInsightsEnabled": "bool",
"codeConfiguration": {
"codeId": "string",
"scoringScript": "string"
},
"dataCollector": {
"collections": {
"{customized property}": {
"clientId": "string",
"dataCollectionMode": "string",
"dataId": "string",
"samplingRate": "int"
}
},
"requestLogging": {
"captureHeaders": [ "string" ]
},
"rollingRate": "string"
},
"description": "string",
"egressPublicNetworkAccess": "string",
"environmentId": "string",
"environmentVariables": {
"{customized property}": "string",
"{customized property}": "string"
},
"instanceType": "string",
"livenessProbe": {
"failureThreshold": "int",
"initialDelay": "string",
"period": "string",
"successThreshold": "int",
"timeout": "string"
},
"model": "string",
"modelMountPath": "string",
"properties": {
"{customized property}": "string",
"{customized property}": "string"
},
"readinessProbe": {
"failureThreshold": "int",
"initialDelay": "string",
"period": "string",
"successThreshold": "int",
"timeout": "string"
},
"requestSettings": {
"maxConcurrentRequestsPerInstance": "int",
"maxQueueWait": "string",
"requestTimeout": "string"
},
"scaleSettings": {
"scaleType": "string"
// For remaining properties, see OnlineScaleSettings objects
},
"endpointComputeType": "string"
// For remaining properties, see OnlineDeploymentProperties objects
}
}
Objek OnlineDeploymentProperties
Atur properti endpointComputeType untuk menentukan jenis objek.
Untuk Kubernetes, gunakan:
"endpointComputeType": "Kubernetes",
"containerResourceRequirements": {
"containerResourceLimits": {
"cpu": "string",
"gpu": "string",
"memory": "string"
},
"containerResourceRequests": {
"cpu": "string",
"gpu": "string",
"memory": "string"
}
}
Untuk Dikelola, gunakan:
"endpointComputeType": "Managed"
Objek OnlineScaleSettings
Atur properti scaleType untuk menentukan jenis objek.
Untuk Default, gunakan:
"scaleType": "Default"
Untuk TargetUtilization, gunakan:
"scaleType": "TargetUtilization",
"maxInstances": "int",
"minInstances": "int",
"pollingInterval": "string",
"targetUtilizationPercentage": "int"
Nilai properti
workspaces/onlineEndpoints/deployments
Nama | Deskripsi | Nilai |
---|---|---|
jenis | Jenis sumber daya | 'Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments' |
apiVersion | Versi api sumber daya | '2023-06-01-preview' |
nama | Nama sumber daya Lihat cara mengatur nama dan jenis untuk sumber daya anak dalam templat JSON ARM. |
string (diperlukan) |
lokasi | Lokasi geografis tempat sumber daya berada | string (diperlukan) |
tag | Tag sumber daya. | Kamus nama dan nilai tag. Lihat Tag dalam templat |
sku | Detail Sku diperlukan untuk kontrak ARM untuk Autoscaling. | Sku |
jenis | Metadata yang digunakan oleh portal/peralatan/dll untuk merender pengalaman UX yang berbeda untuk sumber daya dengan jenis yang sama. | string |
identitas | Identitas layanan terkelola (identitas yang ditetapkan sistem dan/atau pengguna) | ManagedServiceIdentity |
properti | [Diperlukan] Atribut tambahan entitas. | OnlineDeploymentProperties (diperlukan) |
ManagedServiceIdentity
Nama | Deskripsi | Nilai |
---|---|---|
jenis | Jenis identitas layanan terkelola (di mana jenis SystemAssigned dan UserAssigned diizinkan). | 'Tidak Ada' 'SystemAssigned' 'SystemAssigned,UserAssigned' 'UserAssigned' (diperlukan) |
userAssignedIdentities | Kumpulan identitas yang ditetapkan pengguna yang terkait dengan sumber daya. Kunci kamus userAssignedIdentities akan menjadi id sumber daya ARM dalam formulir: '/subscriptions/{subscriptionId}/resourceGroups/{resourceGroupName}/providers/Microsoft.ManagedIdentity/userAssignedIdentities/{identityName}. Nilai kamus dapat berupa objek kosong ({}) dalam permintaan. | UserAssignedIdentities |
UserAssignedIdentities
Nama | Deskripsi | Nilai |
---|---|---|
{customized property} | UserAssignedIdentity |
UserAssignedIdentity
Objek ini tidak berisi properti apa pun untuk diatur selama penyebaran. Semua properti adalah ReadOnly.
OnlineDeploymentProperties
Nama | Deskripsi | Nilai |
---|---|---|
appInsightsEnabled | Jika true, mengaktifkan pengelogan Application Insights. | bool |
codeConfiguration | Konfigurasi kode untuk penyebaran titik akhir. | CodeConfiguration |
dataCollector | Konfigurasi mdc, kami menonaktifkan mdc saat null. | DataCollector |
deskripsi | Deskripsi penyebaran titik akhir. | string |
egressPublicNetworkAccess | Jika Diaktifkan, izinkan akses jaringan publik keluar. Jika Dinonaktifkan, ini akan membuat jalan keluar yang aman. Default: Diaktifkan. | 'Dinonaktifkan' 'Diaktifkan' |
environmentId | ID sumber daya ARM dari spesifikasi lingkungan untuk penyebaran titik akhir. | string |
environmentVariables | Konfigurasi variabel lingkungan untuk penyebaran. | EndpointDeploymentPropertiesBaseEnvironmentVariables |
instanceType | Jenis instans komputasi. | string |
livenessProbe | Pemeriksaan keaktifan memantau kesehatan kontainer secara teratur. | ProbeSettings |
model | Jalur URI ke model. | string |
modelMountPath | Jalur untuk memasang model dalam kontainer kustom. | string |
properti | Kamus properti. Properti dapat ditambahkan, tetapi tidak dihapus atau diubah. | EndpointDeploymentPropertiesBaseProperties |
readinessProbe | Pemeriksaan kesiapan memvalidasi jika kontainer siap melayani lalu lintas. Properti dan defaultnya sama dengan pemeriksaan keaktifan. | ProbeSettings |
requestSettings | Minta pengaturan untuk penyebaran. | OnlineRequestSettings |
scaleSettings | Pengaturan skala untuk penyebaran. Jika null atau tidak disediakan, defaultnya ke TargetUtilizationScaleSettings untuk KubernetesOnlineDeployment dan ke DefaultScaleSettings untuk ManagedOnlineDeployment. |
OnlineScaleSettings |
endpointComputeType | Mengatur jenis objek | Kubernetes Terkelola (diperlukan) |
CodeConfiguration
Nama | Deskripsi | Nilai |
---|---|---|
codeId | ID sumber daya ARM dari aset kode. | string |
scoringScript | [Diperlukan] Skrip yang akan dijalankan saat startup. misalnya. "score.py" | string (diperlukan) Batasan: Panjang min = 1 Pola = [a-zA-Z0-9_] |
DataCollector
Nama | Deskripsi | Nilai |
---|---|---|
Koleksi | [Diperlukan] Konfigurasi koleksi. Setiap koleksi memiliki konfigurasinya sendiri untuk mengumpulkan data model dan nama koleksi dapat berupa string arbitrer. Pengumpul data model dapat digunakan untuk pengelogan payload atau pengelogan kustom atau keduanya. Permintaan dan respons pengumpulan dicadangkan untuk pengelogan payload, yang lain adalah untuk pengelogan kustom. |
DataCollectorCollections (diperlukan) |
requestLogging | Konfigurasi pengelogan permintaan untuk mdc, ini mencakup pengaturan pengelogan tingkat lanjut untuk semua koleksi. Ini opsional. | RequestLogging |
rollingRate | Ketika data model dikumpulkan ke penyimpanan blob, kita perlu menggulung data ke jalur yang berbeda untuk menghindari pengelogan semuanya dalam satu file blob. Jika laju bergulir adalah jam, semua data akan dikumpulkan di jalur blob /yyyy/MM/dd/HH/. Jika hari ini, semua data akan dikumpulkan dalam jalur blob /yyyy/MM/dd/. Manfaat lain dari jalur bergulir adalah bahwa ui pemantauan model mampu memilih rentang waktu data dengan sangat cepat. |
'Hari' 'Jam' 'Menit' 'Bulan' 'Tahun' |
DataCollectorCollections
Nama | Deskripsi | Nilai |
---|---|---|
{customized property} | Koleksi |
Koleksi
Nama | Deskripsi | Nilai |
---|---|---|
clientId | Id klien msi digunakan untuk mengumpulkan pengelogan ke penyimpanan blob. Jika null, backend akan memilih identitas titik akhir terdaftar untuk autentikasi. | string |
dataCollectionMode | Mengaktifkan atau menonaktifkan pengumpulan data. | 'Dinonaktifkan' 'Diaktifkan' |
dataId | Id sumber daya arm aset data. Sisi klien akan memastikan aset data menunjuk ke penyimpanan blob, dan backend akan mengumpulkan data ke penyimpanan blob. | string |
samplingRate | Laju pengambilan sampel untuk pengumpulan. Laju pengambilan sampel 1,0 berarti kami mengumpulkan 100% data secara default. | int |
RequestLogging
Nama | Deskripsi | Nilai |
---|---|---|
captureHeaders | Untuk pengelogan payload, kami hanya mengumpulkan payload secara default. Jika pelanggan juga ingin mengumpulkan header yang ditentukan, mereka dapat mengaturnya di captureHeaders sehingga backend akan mengumpulkan header tersebut bersama dengan payload. | string[] |
EndpointDeploymentPropertiesBaseEnvironmentVariables
Nama | Deskripsi | Nilai |
---|---|---|
{customized property} | string | |
{customized property} | string |
ProbeSettings
Nama | Deskripsi | Nilai |
---|---|---|
failureThreshold | Jumlah kegagalan yang diizinkan sebelum mengembalikan status tidak sehat. | int |
initialDelay | Penundaan sebelum pemeriksaan pertama dalam format ISO 8601. | string |
periode | Lamanya waktu antara pemeriksaan dalam format ISO 8601. | string |
successThreshold | Jumlah pemeriksaan yang berhasil sebelum mengembalikan status sehat. | int |
waktu habis | Batas waktu pemeriksaan dalam format ISO 8601. | string |
EndpointDeploymentPropertiesBaseProperties
Nama | Deskripsi | Nilai |
---|---|---|
{properti yang disesuaikan} | string | |
{properti yang disesuaikan} | string |
OnlineRequestSettings
Nama | Deskripsi | Nilai |
---|---|---|
maxConcurrentRequestsPerInstance | Jumlah permintaan bersamaan maksimum per simpul yang diizinkan per penyebaran. Default ke 1. | int |
maxQueueWait | Jumlah maksimum waktu permintaan akan tetap berada dalam antrean dalam format ISO 8601. Defaultnya adalah 500ms. |
string |
requestTimeout | Batas waktu penilaian dalam format ISO 8601. Default ke 5000ms. |
string |
OnlineScaleSettings
Nama | Deskripsi | Nilai |
---|---|---|
scaleType | Mengatur jenis objek | Default TargetUtilization (diperlukan) |
DefaultScaleSettings
Nama | Deskripsi | Nilai |
---|---|---|
scaleType | [Diperlukan] Jenis algoritma penskalaan penyebaran | 'Default' (diperlukan) |
TargetUtilizationScaleSettings
Nama | Deskripsi | Nilai |
---|---|---|
scaleType | [Diperlukan] Jenis algoritma penskalaan penyebaran | 'TargetUtilization' (diperlukan) |
maxInstances | Jumlah instans maksimum yang dapat diperluas skalanya oleh penyebaran. Kuota akan dicadangkan untuk max_instances. | int |
minInstances | Jumlah instans minimum untuk selalu ada. | int |
pollingInterval | Interval polling dalam format ISO 8691. Hanya mendukung durasi dengan presisi serendah Detik. | string |
targetUtilizationPercentage | Menargetkan penggunaan CPU untuk autoscaler. | int |
KubernetesOnlineDeployment
Nama | Deskripsi | Nilai |
---|---|---|
endpointComputeType | [Diperlukan] Jenis komputasi titik akhir. | 'Kubernetes' (diperlukan) |
containerResourceRequirements | Persyaratan sumber daya untuk kontainer (cpu dan memori). | ContainerResourceRequirements |
ContainerResourceRequirements
Nama | Deskripsi | Nilai |
---|---|---|
containerResourceLimits | Info batas sumber daya kontainer: | ContainerResourceSettings |
containerResourceRequests | Info permintaan sumber daya kontainer: | ContainerResourceSettings |
ContainerResourceSettings
Nama | Deskripsi | Nilai |
---|---|---|
cpu | Jumlah permintaan/batas vCPU untuk kontainer. Info selengkapnya: https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/ |
string |
gpu | Jumlah permintaan/batas kartu GPU Nvidia untuk kontainer. Info selengkapnya: https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/ |
string |
memory | Permintaan/batas ukuran memori untuk kontainer. Info selengkapnya: https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/ |
string |
ManagedOnlineDeployment
Nama | Deskripsi | Nilai |
---|---|---|
endpointComputeType | [Diperlukan] Jenis komputasi titik akhir. | 'Terkelola' (diperlukan) |
SKU
Nama | Deskripsi | Nilai |
---|---|---|
kapasitas | Jika SKU mendukung peluasan skala/masuk, bilangan bulat kapasitas harus disertakan. Jika peluasan/penyempurnaan skala tidak dimungkinkan untuk sumber daya, ini dapat dihilangkan. | int |
keluarga | Jika layanan memiliki generasi perangkat keras yang berbeda, untuk SKU yang sama, maka itu dapat ditangkap di sini. | string |
nama | Nama SKUnya. Mantan - P3. Biasanya kode huruf+angka | string (diperlukan) |
Ukuran | Ukuran SKU. Ketika bidang nama adalah kombinasi tingkat dan beberapa nilai lainnya, ini akan menjadi kode mandiri. | string |
Tier | Bidang ini diperlukan untuk diimplementasikan oleh Penyedia Sumber Jika layanan memiliki lebih dari satu tingkat, tetapi tidak diperlukan pada PUT. | 'Dasar' 'Gratis' 'Premium' 'Standar' |
Definisi sumber daya Terraform (penyedia AzAPI)
Jenis sumber daya workspaces/onlineEndpoints/deployments dapat disebarkan dengan operasi yang menargetkan:
- Grup sumber daya
Untuk daftar properti yang diubah di setiap versi API, lihat log perubahan.
Format sumber daya
Untuk membuat sumber daya Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments, tambahkan Terraform berikut ke templat Anda.
resource "azapi_resource" "symbolicname" {
type = "Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments@2023-06-01-preview"
name = "string"
location = "string"
parent_id = "string"
tags = {
tagName1 = "tagValue1"
tagName2 = "tagValue2"
}
identity {
type = "string"
identity_ids = []
}
body = jsonencode({
properties = {
appInsightsEnabled = bool
codeConfiguration = {
codeId = "string"
scoringScript = "string"
}
dataCollector = {
collections = {
{customized property} = {
clientId = "string"
dataCollectionMode = "string"
dataId = "string"
samplingRate = int
}
}
requestLogging = {
captureHeaders = [
"string"
]
}
rollingRate = "string"
}
description = "string"
egressPublicNetworkAccess = "string"
environmentId = "string"
environmentVariables = {
{customized property} = "string"
{customized property} = "string"
}
instanceType = "string"
livenessProbe = {
failureThreshold = int
initialDelay = "string"
period = "string"
successThreshold = int
timeout = "string"
}
model = "string"
modelMountPath = "string"
properties = {
{customized property} = "string"
{customized property} = "string"
}
readinessProbe = {
failureThreshold = int
initialDelay = "string"
period = "string"
successThreshold = int
timeout = "string"
}
requestSettings = {
maxConcurrentRequestsPerInstance = int
maxQueueWait = "string"
requestTimeout = "string"
}
scaleSettings = {
scaleType = "string"
// For remaining properties, see OnlineScaleSettings objects
}
endpointComputeType = "string"
// For remaining properties, see OnlineDeploymentProperties objects
}
sku = {
capacity = int
family = "string"
name = "string"
size = "string"
tier = "string"
}
kind = "string"
})
}
Objek OnlineDeploymentProperties
Atur properti endpointComputeType untuk menentukan jenis objek.
Untuk Kubernetes, gunakan:
endpointComputeType = "Kubernetes"
containerResourceRequirements = {
containerResourceLimits = {
cpu = "string"
gpu = "string"
memory = "string"
}
containerResourceRequests = {
cpu = "string"
gpu = "string"
memory = "string"
}
}
Untuk Dikelola, gunakan:
endpointComputeType = "Managed"
Objek OnlineScaleSettings
Atur properti scaleType untuk menentukan jenis objek.
Untuk Default, gunakan:
scaleType = "Default"
Untuk TargetUtilization, gunakan:
scaleType = "TargetUtilization"
maxInstances = int
minInstances = int
pollingInterval = "string"
targetUtilizationPercentage = int
Nilai properti
workspaces/onlineEndpoints/deployments
Nama | Deskripsi | Nilai |
---|---|---|
jenis | Jenis sumber daya | "Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments@2023-06-01-preview" |
nama | Nama sumber daya | string (diperlukan) |
lokasi | Lokasi geografis tempat sumber daya berada | string (diperlukan) |
parent_id | ID sumber daya yang merupakan induk untuk sumber daya ini. | ID untuk sumber daya jenis: onlineEndpoints |
tag | Tag sumber daya. | Kamus nama dan nilai tag. |
sku | Detail Sku diperlukan untuk kontrak ARM untuk Autoscaling. | Sku |
jenis | Metadata yang digunakan oleh portal/peralatan/dll untuk merender pengalaman UX yang berbeda untuk sumber daya dengan jenis yang sama. | string |
identitas | Identitas layanan terkelola (identitas yang ditetapkan sistem dan/atau pengguna) | ManagedServiceIdentity |
properti | [Diperlukan] Atribut tambahan entitas. | OnlineDeploymentProperties (diperlukan) |
ManagedServiceIdentity
Nama | Deskripsi | Nilai |
---|---|---|
jenis | Jenis identitas layanan terkelola (di mana jenis SystemAssigned dan UserAssigned diizinkan). | "SystemAssigned" "SystemAssigned,UserAssigned" "UserAssigned" (diperlukan) |
identity_ids | Kumpulan identitas yang ditetapkan pengguna yang terkait dengan sumber daya. Kunci kamus userAssignedIdentities akan menjadi id sumber daya ARM dalam formulir: '/subscriptions/{subscriptionId}/resourceGroups/{resourceGroupName}/providers/Microsoft.ManagedIdentity/userAssignedIdentities/{identityName}. Nilai kamus dapat berupa objek kosong ({}) dalam permintaan. | Array ID identitas pengguna. |
UserAssignedIdentities
Nama | Deskripsi | Nilai |
---|---|---|
{properti yang disesuaikan} | UserAssignedIdentity |
UserAssignedIdentity
Objek ini tidak berisi properti apa pun untuk diatur selama penyebaran. Semua properti adalah ReadOnly.
OnlineDeploymentProperties
Nama | Deskripsi | Nilai |
---|---|---|
appInsightsEnabled | Jika true, mengaktifkan pengelogan Application Insights. | bool |
codeConfiguration | Konfigurasi kode untuk penyebaran titik akhir. | CodeConfiguration |
dataCollector | Konfigurasi mdc, kami menonaktifkan mdc saat null. | DataCollector |
deskripsi | Deskripsi penyebaran titik akhir. | string |
egressPublicNetworkAccess | Jika Diaktifkan, izinkan akses jaringan publik keluar. Jika Dinonaktifkan, ini akan membuat jalan keluar yang aman. Default: Diaktifkan. | "Dinonaktifkan" "Diaktifkan" |
environmentId | ID sumber daya ARM dari spesifikasi lingkungan untuk penyebaran titik akhir. | string |
environmentVariables | Konfigurasi variabel lingkungan untuk penyebaran. | EndpointDeploymentPropertiesBaseEnvironmentVariables |
instanceType | Jenis instans komputasi. | string |
livenessProbe | Pemeriksaan keaktifan memantau kesehatan kontainer secara teratur. | ProbeSettings |
model | Jalur URI ke model. | string |
modelMountPath | Jalur untuk memasang model dalam kontainer kustom. | string |
properti | Kamus properti. Properti dapat ditambahkan, tetapi tidak dihapus atau diubah. | EndpointDeploymentPropertiesBaseProperties |
readinessProbe | Pemeriksaan kesiapan memvalidasi jika kontainer siap melayani lalu lintas. Properti dan defaultnya sama dengan pemeriksaan keaktifan. | ProbeSettings |
requestSettings | Minta pengaturan untuk penyebaran. | OnlineRequestSettings |
scaleSettings | Pengaturan skala untuk penyebaran. Jika null atau tidak disediakan, defaultnya ke TargetUtilizationScaleSettings untuk KubernetesOnlineDeployment dan ke DefaultScaleSettings untuk ManagedOnlineDeployment. |
OnlineScaleSettings |
endpointComputeType | Mengatur jenis objek | Kubernetes Terkelola (diperlukan) |
CodeConfiguration
Nama | Deskripsi | Nilai |
---|---|---|
codeId | ID sumber daya ARM dari aset kode. | string |
scoringScript | [Diperlukan] Skrip yang akan dijalankan saat startup. misalnya. "score.py" | string (diperlukan) Batasan: Panjang min = 1 Pola = [a-zA-Z0-9_] |
DataCollector
Nama | Deskripsi | Nilai |
---|---|---|
Koleksi | [Diperlukan] Konfigurasi pengumpulan. Setiap koleksi memiliki konfigurasinya sendiri untuk mengumpulkan data model dan nama koleksi dapat berupa string arbitrer. Pengumpul data model dapat digunakan untuk pengelogan payload atau pengelogan kustom atau keduanya. Permintaan dan respons pengumpulan dicadangkan untuk pengelogan payload, yang lain adalah untuk pengelogan kustom. |
DataCollectorCollections (diperlukan) |
requestLogging | Konfigurasi pengelogan permintaan untuk mdc, mencakup pengaturan pengelogan tingkat lanjut untuk semua koleksi. Ini opsional. | RequestLogging |
rollingRate | Ketika data model dikumpulkan ke penyimpanan blob, kita perlu menggulung data ke jalur yang berbeda untuk menghindari pengelogan semuanya dalam satu file blob. Jika laju bergulir adalah jam, semua data akan dikumpulkan di jalur blob /yyyy/MM/dd/HH/. Jika hari ini, semua data akan dikumpulkan dalam jalur blob /yyyy/MM/dd/. Manfaat lain dari jalur bergulir adalah bahwa ui pemantauan model mampu memilih rentang waktu data dengan sangat cepat. |
"Hari" "Jam" "Menit" "Bulan" "Tahun" |
DataCollectorCollections
Nama | Deskripsi | Nilai |
---|---|---|
{customized property} | Koleksi |
Koleksi
Nama | Deskripsi | Nilai |
---|---|---|
clientId | Id klien msi digunakan untuk mengumpulkan pengelogan ke penyimpanan blob. Jika null, backend akan memilih identitas titik akhir terdaftar untuk autentikasi. | string |
dataCollectionMode | Mengaktifkan atau menonaktifkan pengumpulan data. | "Dinonaktifkan" "Diaktifkan" |
dataId | Id sumber daya arm aset data. Sisi klien akan memastikan aset data menunjuk ke penyimpanan blob, dan backend akan mengumpulkan data ke penyimpanan blob. | string |
samplingRate | Laju pengambilan sampel untuk pengumpulan. Laju pengambilan sampel 1,0 berarti kami mengumpulkan 100% data secara default. | int |
RequestLogging
Nama | Deskripsi | Nilai |
---|---|---|
captureHeaders | Untuk pengelogan payload, kami hanya mengumpulkan payload secara default. Jika pelanggan juga ingin mengumpulkan header yang ditentukan, mereka dapat mengaturnya di captureHeaders sehingga backend akan mengumpulkan header tersebut bersama dengan payload. | string[] |
EndpointDeploymentPropertiesBaseEnvironmentVariables
Nama | Deskripsi | Nilai |
---|---|---|
{customized property} | string | |
{customized property} | string |
ProbeSettings
Nama | Deskripsi | Nilai |
---|---|---|
failureThreshold | Jumlah kegagalan yang diizinkan sebelum mengembalikan status tidak sehat. | int |
initialDelay | Penundaan sebelum pemeriksaan pertama dalam format ISO 8601. | string |
periode | Lamanya waktu antara pemeriksaan dalam format ISO 8601. | string |
successThreshold | Jumlah pemeriksaan yang berhasil sebelum mengembalikan status sehat. | int |
waktu habis | Batas waktu pemeriksaan dalam format ISO 8601. | string |
EndpointDeploymentPropertiesBaseProperties
Nama | Deskripsi | Nilai |
---|---|---|
{customized property} | string | |
{customized property} | string |
OnlineRequestSettings
Nama | Deskripsi | Nilai |
---|---|---|
maxConcurrentRequestsPerInstance | Jumlah permintaan bersamaan maksimum per simpul yang diizinkan per penyebaran. Default ke 1. | int |
maxQueueWait | Jumlah maksimum waktu permintaan akan tetap dalam antrean dalam format ISO 8601. Default ke 500ms. |
string |
requestTimeout | Batas waktu penilaian dalam format ISO 8601. Default ke 5000ms. |
string |
OnlineScaleSettings
Nama | Deskripsi | Nilai |
---|---|---|
scaleType | Mengatur jenis objek | Default TargetUtilization (diperlukan) |
DefaultScaleSettings
Nama | Deskripsi | Nilai |
---|---|---|
scaleType | [Diperlukan] Jenis algoritma penskalaan penyebaran | "Default" (diperlukan) |
TargetUtilizationScaleSettings
Nama | Deskripsi | Nilai |
---|---|---|
scaleType | [Diperlukan] Jenis algoritma penskalaan penyebaran | "TargetUtilization" (diperlukan) |
maxInstances | Jumlah instans maksimum yang dapat diperluas skalanya oleh penyebaran. Kuota akan dicadangkan untuk max_instances. | int |
minInstances | Jumlah instans minimum untuk selalu ada. | int |
pollingInterval | Interval polling dalam format ISO 8691. Hanya mendukung durasi dengan presisi serendah Detik. | string |
targetUtilizationPercentage | Penggunaan CPU target untuk autoscaler. | int |
KubernetesOnlineDeployment
Nama | Deskripsi | Nilai |
---|---|---|
endpointComputeType | [Diperlukan] Jenis komputasi titik akhir. | "Kubernetes" (diperlukan) |
containerResourceRequirements | Persyaratan sumber daya untuk kontainer (cpu dan memori). | ContainerResourceRequirements |
ContainerResourceRequirements
Nama | Deskripsi | Nilai |
---|---|---|
containerResourceLimits | Info batas sumber daya kontainer: | ContainerResourceSettings |
containerResourceRequests | Info permintaan sumber daya kontainer: | ContainerResourceSettings |
ContainerResourceSettings
Nama | Deskripsi | Nilai |
---|---|---|
cpu | Jumlah permintaan/batas vCPU untuk kontainer. Info selengkapnya: https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/ |
string |
gpu | Jumlah permintaan/batas kartu GPU Nvidia untuk kontainer. Info selengkapnya: https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/ |
string |
memory | Permintaan/batas ukuran memori untuk kontainer. Info selengkapnya: https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/ |
string |
ManagedOnlineDeployment
Nama | Deskripsi | Nilai |
---|---|---|
endpointComputeType | [Diperlukan] Jenis komputasi titik akhir. | "Dikelola" (diperlukan) |
SKU
Nama | Deskripsi | Nilai |
---|---|---|
kapasitas | Jika SKU mendukung peluasan skala/masuk, bilangan bulat kapasitas harus disertakan. Jika peluasan/penyempurnaan skala tidak dimungkinkan untuk sumber daya, ini dapat dihilangkan. | int |
keluarga | Jika layanan memiliki generasi perangkat keras yang berbeda, untuk SKU yang sama, maka itu dapat ditangkap di sini. | string |
nama | Nama SKUnya. Mantan - P3. Biasanya kode huruf+angka | string (diperlukan) |
Ukuran | Ukuran SKU. Ketika bidang nama adalah kombinasi tingkat dan beberapa nilai lainnya, ini akan menjadi kode mandiri. | string |
Tier | Bidang ini diperlukan untuk diimplementasikan oleh Penyedia Sumber Jika layanan memiliki lebih dari satu tingkat, tetapi tidak diperlukan pada PUT. | "Dasar" "Gratis" "Premium" "Standar" |
Saran dan Komentar
https://aka.ms/ContentUserFeedback.
Segera hadir: Sepanjang tahun 2024 kami akan menghentikan penggunaan GitHub Issues sebagai mekanisme umpan balik untuk konten dan menggantinya dengan sistem umpan balik baru. Untuk mengetahui informasi selengkapnya, lihat:Kirim dan lihat umpan balik untuk