Ruang kerja Microsoft.MachineLearningServices/onlineEndpoints/deployments 2023-06-01-preview

Definisi sumber daya Bicep

Jenis sumber daya workspaces/onlineEndpoints/deployments dapat disebarkan dengan operasi yang menargetkan:

Untuk daftar properti yang diubah di setiap versi API, lihat mengubah log.

Format sumber daya

Untuk membuat sumber daya Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments, tambahkan Bicep berikut ke templat Anda.

resource symbolicname 'Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments@2023-06-01-preview' = {
  name: 'string'
  location: 'string'
  tags: {
    tagName1: 'tagValue1'
    tagName2: 'tagValue2'
  }
  sku: {
    capacity: int
    family: 'string'
    name: 'string'
    size: 'string'
    tier: 'string'
  }
  kind: 'string'
  parent: resourceSymbolicName
  identity: {
    type: 'string'
    userAssignedIdentities: {
      {customized property}: {}
    }
  }
  properties: {
    appInsightsEnabled: bool
    codeConfiguration: {
      codeId: 'string'
      scoringScript: 'string'
    }
    dataCollector: {
      collections: {
        {customized property}: {
          clientId: 'string'
          dataCollectionMode: 'string'
          dataId: 'string'
          samplingRate: int
        }
      }
      requestLogging: {
        captureHeaders: [
          'string'
        ]
      }
      rollingRate: 'string'
    }
    description: 'string'
    egressPublicNetworkAccess: 'string'
    environmentId: 'string'
    environmentVariables: {
      {customized property}: 'string'
      {customized property}: 'string'
    }
    instanceType: 'string'
    livenessProbe: {
      failureThreshold: int
      initialDelay: 'string'
      period: 'string'
      successThreshold: int
      timeout: 'string'
    }
    model: 'string'
    modelMountPath: 'string'
    properties: {
      {customized property}: 'string'
      {customized property}: 'string'
    }
    readinessProbe: {
      failureThreshold: int
      initialDelay: 'string'
      period: 'string'
      successThreshold: int
      timeout: 'string'
    }
    requestSettings: {
      maxConcurrentRequestsPerInstance: int
      maxQueueWait: 'string'
      requestTimeout: 'string'
    }
    scaleSettings: {
      scaleType: 'string'
      // For remaining properties, see OnlineScaleSettings objects
    }
    endpointComputeType: 'string'
    // For remaining properties, see OnlineDeploymentProperties objects
  }
}

Objek OnlineDeploymentProperties

Atur properti endpointComputeType untuk menentukan jenis objek.

Untuk Kubernetes, gunakan:

  endpointComputeType: 'Kubernetes'
  containerResourceRequirements: {
    containerResourceLimits: {
      cpu: 'string'
      gpu: 'string'
      memory: 'string'
    }
    containerResourceRequests: {
      cpu: 'string'
      gpu: 'string'
      memory: 'string'
    }
  }

Untuk Terkelola, gunakan:

  endpointComputeType: 'Managed'

Objek OnlineScaleSettings

Atur properti scaleType untuk menentukan jenis objek.

Untuk Default, gunakan:

  scaleType: 'Default'

Untuk TargetUtilization, gunakan:

  scaleType: 'TargetUtilization'
  maxInstances: int
  minInstances: int
  pollingInterval: 'string'
  targetUtilizationPercentage: int

Nilai properti

workspaces/onlineEndpoints/deployments

Nama Deskripsi Nilai
nama Nama sumber daya

Lihat cara mengatur nama dan jenis untuk sumber daya anak di Bicep.
string (diperlukan)
lokasi Lokasi geografis tempat sumber daya berada string (diperlukan)
tag Tag sumber daya. Kamus nama dan nilai tag. Lihat Tag dalam templat
sku Detail Sku diperlukan untuk kontrak ARM untuk Autoscaling. Sku
jenis Metadata yang digunakan oleh portal/peralatan/dll untuk merender pengalaman UX yang berbeda untuk sumber daya dengan jenis yang sama. string
induk Di Bicep, Anda dapat menentukan sumber daya induk untuk sumber daya anak. Anda hanya perlu menambahkan properti ini ketika sumber daya anak dideklarasikan di luar sumber daya induk.

Untuk informasi selengkapnya, lihat Sumber daya anak di luar sumber daya induk.
Nama simbolis untuk sumber daya jenis: onlineEndpoints
identitas Identitas layanan terkelola (identitas yang ditetapkan sistem dan/atau pengguna) ManagedServiceIdentity
properti [Diperlukan] Atribut tambahan entitas. OnlineDeploymentProperties (diperlukan)

ManagedServiceIdentity

Nama Deskripsi Nilai
jenis Jenis identitas layanan terkelola (di mana jenis SystemAssigned dan UserAssigned diizinkan). 'Tidak Ada'
'SystemAssigned'
'SystemAssigned,UserAssigned'
'UserAssigned' (diperlukan)
userAssignedIdentities Kumpulan identitas yang ditetapkan pengguna yang terkait dengan sumber daya. Kunci kamus userAssignedIdentities akan menjadi id sumber daya ARM dalam formulir: '/subscriptions/{subscriptionId}/resourceGroups/{resourceGroupName}/providers/Microsoft.ManagedIdentity/userAssignedIdentities/{identityName}. Nilai kamus dapat berupa objek kosong ({}) dalam permintaan. UserAssignedIdentities

UserAssignedIdentities

Nama Deskripsi Nilai
{properti yang disesuaikan} UserAssignedIdentity

UserAssignedIdentity

Objek ini tidak berisi properti apa pun untuk diatur selama penyebaran. Semua properti adalah ReadOnly.

OnlineDeploymentProperties

Nama Deskripsi Nilai
appInsightsEnabled Jika true, mengaktifkan pengelogan Application Insights. bool
codeConfiguration Konfigurasi kode untuk penyebaran titik akhir. CodeConfiguration
dataCollector Konfigurasi mdc, kami menonaktifkan mdc saat null. DataCollector
deskripsi Deskripsi penyebaran titik akhir. string
egressPublicNetworkAccess Jika Diaktifkan, izinkan akses jaringan publik keluar. Jika Dinonaktifkan, ini akan membuat jalan keluar yang aman. Default: Diaktifkan. 'Dinonaktifkan'
'Diaktifkan'
environmentId ID sumber daya ARM dari spesifikasi lingkungan untuk penyebaran titik akhir. string
environmentVariables Konfigurasi variabel lingkungan untuk penyebaran. EndpointDeploymentPropertiesBaseEnvironmentVariables
instanceType Jenis instans komputasi. string
livenessProbe Pemeriksaan keaktifan memantau kesehatan kontainer secara teratur. ProbeSettings
model Jalur URI ke model. string
modelMountPath Jalur untuk memasang model dalam kontainer kustom. string
properti Kamus properti. Properti dapat ditambahkan, tetapi tidak dihapus atau diubah. EndpointDeploymentPropertiesBaseProperties
readinessProbe Pemeriksaan kesiapan memvalidasi jika kontainer siap melayani lalu lintas. Properti dan defaultnya sama dengan pemeriksaan keaktifan. ProbeSettings
requestSettings Minta pengaturan untuk penyebaran. OnlineRequestSettings
scaleSettings Pengaturan skala untuk penyebaran.
Jika null atau tidak disediakan,
defaultnya ke TargetUtilizationScaleSettings untuk KubernetesOnlineDeployment
dan ke DefaultScaleSettings untuk ManagedOnlineDeployment.
OnlineScaleSettings
endpointComputeType Mengatur jenis objek Kubernetes
Terkelola (diperlukan)

CodeConfiguration

Nama Deskripsi Nilai
codeId ID sumber daya ARM dari aset kode. string
scoringScript [Diperlukan] Skrip yang akan dijalankan saat startup. misalnya. "score.py" string (diperlukan)

Batasan:
Panjang min = 1
Pola = [a-zA-Z0-9_]

DataCollector

Nama Deskripsi Nilai
Koleksi [Diperlukan] Konfigurasi koleksi. Setiap koleksi memiliki konfigurasinya sendiri untuk mengumpulkan data model dan nama koleksi dapat berupa string arbitrer.
Pengumpul data model dapat digunakan untuk pengelogan payload atau pengelogan kustom atau keduanya. Permintaan dan respons pengumpulan dicadangkan untuk pengelogan payload, yang lain adalah untuk pengelogan kustom.
DataCollectorCollections (diperlukan)
requestLogging Konfigurasi pengelogan permintaan untuk mdc, ini mencakup pengaturan pengelogan tingkat lanjut untuk semua koleksi. Ini opsional. RequestLogging
rollingRate Ketika data model dikumpulkan ke penyimpanan blob, kita perlu menggulung data ke jalur yang berbeda untuk menghindari pengelogan semuanya dalam satu file blob.
Jika laju bergulir adalah jam, semua data akan dikumpulkan di jalur blob /yyyy/MM/dd/HH/.
Jika hari ini, semua data akan dikumpulkan dalam jalur blob /yyyy/MM/dd/.
Manfaat lain dari jalur bergulir adalah bahwa ui pemantauan model mampu memilih rentang waktu data dengan sangat cepat.
'Hari'
'Jam'
'Menit'
'Bulan'
'Tahun'

DataCollectorCollections

Nama Deskripsi Nilai
{customized property} Koleksi

Koleksi

Nama Deskripsi Nilai
clientId Id klien msi digunakan untuk mengumpulkan pengelogan ke penyimpanan blob. Jika null, backend akan memilih identitas titik akhir terdaftar untuk autentikasi. string
dataCollectionMode Mengaktifkan atau menonaktifkan pengumpulan data. 'Dinonaktifkan'
'Diaktifkan'
dataId Id sumber daya arm aset data. Sisi klien akan memastikan aset data menunjuk ke penyimpanan blob, dan backend akan mengumpulkan data ke penyimpanan blob. string
samplingRate Laju pengambilan sampel untuk pengumpulan. Laju pengambilan sampel 1,0 berarti kami mengumpulkan 100% data secara default. int

RequestLogging

Nama Deskripsi Nilai
captureHeaders Untuk pengelogan payload, kami hanya mengumpulkan payload secara default. Jika pelanggan juga ingin mengumpulkan header yang ditentukan, mereka dapat mengaturnya di captureHeaders sehingga backend akan mengumpulkan header tersebut bersama dengan payload. string[]

EndpointDeploymentPropertiesBaseEnvironmentVariables

Nama Deskripsi Nilai
{customized property} string
{customized property} string

ProbeSettings

Nama Deskripsi Nilai
failureThreshold Jumlah kegagalan yang diizinkan sebelum mengembalikan status tidak sehat. int
initialDelay Penundaan sebelum pemeriksaan pertama dalam format ISO 8601. string
periode Lamanya waktu antara pemeriksaan dalam format ISO 8601. string
successThreshold Jumlah pemeriksaan yang berhasil sebelum mengembalikan status sehat. int
waktu habis Batas waktu pemeriksaan dalam format ISO 8601. string

EndpointDeploymentPropertiesBaseProperties

Nama Deskripsi Nilai
{customized property} string
{customized property} string

OnlineRequestSettings

Nama Deskripsi Nilai
maxConcurrentRequestsPerInstance Jumlah permintaan bersamaan maksimum per simpul yang diizinkan per penyebaran. Default ke 1. int
maxQueueWait Jumlah maksimum waktu permintaan akan tetap dalam antrean dalam format ISO 8601.
Default ke 500ms.
string
requestTimeout Batas waktu penilaian dalam format ISO 8601.
Default ke 5000ms.
string

OnlineScaleSettings

Nama Deskripsi Nilai
scaleType Mengatur jenis objek Default
TargetUtilization (diperlukan)

DefaultScaleSettings

Nama Deskripsi Nilai
scaleType [Diperlukan] Jenis algoritma penskalaan penyebaran 'Default' (diperlukan)

TargetUtilizationScaleSettings

Nama Deskripsi Nilai
scaleType [Diperlukan] Jenis algoritma penskalaan penyebaran 'TargetUtilization' (diperlukan)
maxInstances Jumlah instans maksimum yang dapat diperluas skalanya oleh penyebaran. Kuota akan dicadangkan untuk max_instances. int
minInstances Jumlah instans minimum untuk selalu ada. int
pollingInterval Interval polling dalam format ISO 8691. Hanya mendukung durasi dengan presisi serendah Detik. string
targetUtilizationPercentage Penggunaan CPU target untuk autoscaler. int

KubernetesOnlineDeployment

Nama Deskripsi Nilai
endpointComputeType [Diperlukan] Jenis komputasi titik akhir. 'Kubernetes' (diperlukan)
containerResourceRequirements Persyaratan sumber daya untuk kontainer (cpu dan memori). ContainerResourceRequirements

ContainerResourceRequirements

Nama Deskripsi Nilai
containerResourceLimits Info batas sumber daya kontainer: ContainerResourceSettings
containerResourceRequests Info permintaan sumber daya kontainer: ContainerResourceSettings

ContainerResourceSettings

Nama Deskripsi Nilai
cpu Jumlah permintaan/batas vCPU untuk kontainer. Info selengkapnya:
https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/
string
gpu Jumlah permintaan/batas kartu GPU Nvidia untuk kontainer. Info selengkapnya:
https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/
string
memory Permintaan/batas ukuran memori untuk kontainer. Info selengkapnya:
https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/
string

ManagedOnlineDeployment

Nama Deskripsi Nilai
endpointComputeType [Diperlukan] Jenis komputasi titik akhir. 'Terkelola' (diperlukan)

SKU

Nama Deskripsi Nilai
kapasitas Jika SKU mendukung peluasan skala/masuk, bilangan bulat kapasitas harus disertakan. Jika peluasan/penyempurnaan skala tidak dimungkinkan untuk sumber daya, ini dapat dihilangkan. int
keluarga Jika layanan memiliki generasi perangkat keras yang berbeda, untuk SKU yang sama, maka itu dapat ditangkap di sini. string
nama Nama SKUnya. Mantan - P3. Biasanya kode huruf+angka string (diperlukan)
Ukuran Ukuran SKU. Ketika bidang nama adalah kombinasi tingkat dan beberapa nilai lainnya, ini akan menjadi kode mandiri. string
Tier Bidang ini diperlukan untuk diimplementasikan oleh Penyedia Sumber Jika layanan memiliki lebih dari satu tingkat, tetapi tidak diperlukan pada PUT. 'Dasar'
'Gratis'
'Premium'
'Standar'

Definisi sumber daya templat ARM

Jenis sumber daya workspaces/onlineEndpoints/deployments dapat disebarkan dengan operasi yang menargetkan:

Untuk daftar properti yang diubah di setiap versi API, lihat log perubahan.

Format sumber daya

Untuk membuat sumber daya Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments, tambahkan JSON berikut ke templat Anda.

{
  "type": "Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments",
  "apiVersion": "2023-06-01-preview",
  "name": "string",
  "location": "string",
  "tags": {
    "tagName1": "tagValue1",
    "tagName2": "tagValue2"
  },
  "sku": {
    "capacity": "int",
    "family": "string",
    "name": "string",
    "size": "string",
    "tier": "string"
  },
  "kind": "string",
  "identity": {
    "type": "string",
    "userAssignedIdentities": {
      "{customized property}": {}
    }
  },
  "properties": {
    "appInsightsEnabled": "bool",
    "codeConfiguration": {
      "codeId": "string",
      "scoringScript": "string"
    },
    "dataCollector": {
      "collections": {
        "{customized property}": {
          "clientId": "string",
          "dataCollectionMode": "string",
          "dataId": "string",
          "samplingRate": "int"
        }
      },
      "requestLogging": {
        "captureHeaders": [ "string" ]
      },
      "rollingRate": "string"
    },
    "description": "string",
    "egressPublicNetworkAccess": "string",
    "environmentId": "string",
    "environmentVariables": {
      "{customized property}": "string",
      "{customized property}": "string"
    },
    "instanceType": "string",
    "livenessProbe": {
      "failureThreshold": "int",
      "initialDelay": "string",
      "period": "string",
      "successThreshold": "int",
      "timeout": "string"
    },
    "model": "string",
    "modelMountPath": "string",
    "properties": {
      "{customized property}": "string",
      "{customized property}": "string"
    },
    "readinessProbe": {
      "failureThreshold": "int",
      "initialDelay": "string",
      "period": "string",
      "successThreshold": "int",
      "timeout": "string"
    },
    "requestSettings": {
      "maxConcurrentRequestsPerInstance": "int",
      "maxQueueWait": "string",
      "requestTimeout": "string"
    },
    "scaleSettings": {
      "scaleType": "string"
      // For remaining properties, see OnlineScaleSettings objects
    },
    "endpointComputeType": "string"
    // For remaining properties, see OnlineDeploymentProperties objects
  }
}

Objek OnlineDeploymentProperties

Atur properti endpointComputeType untuk menentukan jenis objek.

Untuk Kubernetes, gunakan:

  "endpointComputeType": "Kubernetes",
  "containerResourceRequirements": {
    "containerResourceLimits": {
      "cpu": "string",
      "gpu": "string",
      "memory": "string"
    },
    "containerResourceRequests": {
      "cpu": "string",
      "gpu": "string",
      "memory": "string"
    }
  }

Untuk Dikelola, gunakan:

  "endpointComputeType": "Managed"

Objek OnlineScaleSettings

Atur properti scaleType untuk menentukan jenis objek.

Untuk Default, gunakan:

  "scaleType": "Default"

Untuk TargetUtilization, gunakan:

  "scaleType": "TargetUtilization",
  "maxInstances": "int",
  "minInstances": "int",
  "pollingInterval": "string",
  "targetUtilizationPercentage": "int"

Nilai properti

workspaces/onlineEndpoints/deployments

Nama Deskripsi Nilai
jenis Jenis sumber daya 'Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments'
apiVersion Versi api sumber daya '2023-06-01-preview'
nama Nama sumber daya

Lihat cara mengatur nama dan jenis untuk sumber daya anak dalam templat JSON ARM.
string (diperlukan)
lokasi Lokasi geografis tempat sumber daya berada string (diperlukan)
tag Tag sumber daya. Kamus nama dan nilai tag. Lihat Tag dalam templat
sku Detail Sku diperlukan untuk kontrak ARM untuk Autoscaling. Sku
jenis Metadata yang digunakan oleh portal/peralatan/dll untuk merender pengalaman UX yang berbeda untuk sumber daya dengan jenis yang sama. string
identitas Identitas layanan terkelola (identitas yang ditetapkan sistem dan/atau pengguna) ManagedServiceIdentity
properti [Diperlukan] Atribut tambahan entitas. OnlineDeploymentProperties (diperlukan)

ManagedServiceIdentity

Nama Deskripsi Nilai
jenis Jenis identitas layanan terkelola (di mana jenis SystemAssigned dan UserAssigned diizinkan). 'Tidak Ada'
'SystemAssigned'
'SystemAssigned,UserAssigned'
'UserAssigned' (diperlukan)
userAssignedIdentities Kumpulan identitas yang ditetapkan pengguna yang terkait dengan sumber daya. Kunci kamus userAssignedIdentities akan menjadi id sumber daya ARM dalam formulir: '/subscriptions/{subscriptionId}/resourceGroups/{resourceGroupName}/providers/Microsoft.ManagedIdentity/userAssignedIdentities/{identityName}. Nilai kamus dapat berupa objek kosong ({}) dalam permintaan. UserAssignedIdentities

UserAssignedIdentities

Nama Deskripsi Nilai
{customized property} UserAssignedIdentity

UserAssignedIdentity

Objek ini tidak berisi properti apa pun untuk diatur selama penyebaran. Semua properti adalah ReadOnly.

OnlineDeploymentProperties

Nama Deskripsi Nilai
appInsightsEnabled Jika true, mengaktifkan pengelogan Application Insights. bool
codeConfiguration Konfigurasi kode untuk penyebaran titik akhir. CodeConfiguration
dataCollector Konfigurasi mdc, kami menonaktifkan mdc saat null. DataCollector
deskripsi Deskripsi penyebaran titik akhir. string
egressPublicNetworkAccess Jika Diaktifkan, izinkan akses jaringan publik keluar. Jika Dinonaktifkan, ini akan membuat jalan keluar yang aman. Default: Diaktifkan. 'Dinonaktifkan'
'Diaktifkan'
environmentId ID sumber daya ARM dari spesifikasi lingkungan untuk penyebaran titik akhir. string
environmentVariables Konfigurasi variabel lingkungan untuk penyebaran. EndpointDeploymentPropertiesBaseEnvironmentVariables
instanceType Jenis instans komputasi. string
livenessProbe Pemeriksaan keaktifan memantau kesehatan kontainer secara teratur. ProbeSettings
model Jalur URI ke model. string
modelMountPath Jalur untuk memasang model dalam kontainer kustom. string
properti Kamus properti. Properti dapat ditambahkan, tetapi tidak dihapus atau diubah. EndpointDeploymentPropertiesBaseProperties
readinessProbe Pemeriksaan kesiapan memvalidasi jika kontainer siap melayani lalu lintas. Properti dan defaultnya sama dengan pemeriksaan keaktifan. ProbeSettings
requestSettings Minta pengaturan untuk penyebaran. OnlineRequestSettings
scaleSettings Pengaturan skala untuk penyebaran.
Jika null atau tidak disediakan,
defaultnya ke TargetUtilizationScaleSettings untuk KubernetesOnlineDeployment
dan ke DefaultScaleSettings untuk ManagedOnlineDeployment.
OnlineScaleSettings
endpointComputeType Mengatur jenis objek Kubernetes
Terkelola (diperlukan)

CodeConfiguration

Nama Deskripsi Nilai
codeId ID sumber daya ARM dari aset kode. string
scoringScript [Diperlukan] Skrip yang akan dijalankan saat startup. misalnya. "score.py" string (diperlukan)

Batasan:
Panjang min = 1
Pola = [a-zA-Z0-9_]

DataCollector

Nama Deskripsi Nilai
Koleksi [Diperlukan] Konfigurasi koleksi. Setiap koleksi memiliki konfigurasinya sendiri untuk mengumpulkan data model dan nama koleksi dapat berupa string arbitrer.
Pengumpul data model dapat digunakan untuk pengelogan payload atau pengelogan kustom atau keduanya. Permintaan dan respons pengumpulan dicadangkan untuk pengelogan payload, yang lain adalah untuk pengelogan kustom.
DataCollectorCollections (diperlukan)
requestLogging Konfigurasi pengelogan permintaan untuk mdc, ini mencakup pengaturan pengelogan tingkat lanjut untuk semua koleksi. Ini opsional. RequestLogging
rollingRate Ketika data model dikumpulkan ke penyimpanan blob, kita perlu menggulung data ke jalur yang berbeda untuk menghindari pengelogan semuanya dalam satu file blob.
Jika laju bergulir adalah jam, semua data akan dikumpulkan di jalur blob /yyyy/MM/dd/HH/.
Jika hari ini, semua data akan dikumpulkan dalam jalur blob /yyyy/MM/dd/.
Manfaat lain dari jalur bergulir adalah bahwa ui pemantauan model mampu memilih rentang waktu data dengan sangat cepat.
'Hari'
'Jam'
'Menit'
'Bulan'
'Tahun'

DataCollectorCollections

Nama Deskripsi Nilai
{customized property} Koleksi

Koleksi

Nama Deskripsi Nilai
clientId Id klien msi digunakan untuk mengumpulkan pengelogan ke penyimpanan blob. Jika null, backend akan memilih identitas titik akhir terdaftar untuk autentikasi. string
dataCollectionMode Mengaktifkan atau menonaktifkan pengumpulan data. 'Dinonaktifkan'
'Diaktifkan'
dataId Id sumber daya arm aset data. Sisi klien akan memastikan aset data menunjuk ke penyimpanan blob, dan backend akan mengumpulkan data ke penyimpanan blob. string
samplingRate Laju pengambilan sampel untuk pengumpulan. Laju pengambilan sampel 1,0 berarti kami mengumpulkan 100% data secara default. int

RequestLogging

Nama Deskripsi Nilai
captureHeaders Untuk pengelogan payload, kami hanya mengumpulkan payload secara default. Jika pelanggan juga ingin mengumpulkan header yang ditentukan, mereka dapat mengaturnya di captureHeaders sehingga backend akan mengumpulkan header tersebut bersama dengan payload. string[]

EndpointDeploymentPropertiesBaseEnvironmentVariables

Nama Deskripsi Nilai
{customized property} string
{customized property} string

ProbeSettings

Nama Deskripsi Nilai
failureThreshold Jumlah kegagalan yang diizinkan sebelum mengembalikan status tidak sehat. int
initialDelay Penundaan sebelum pemeriksaan pertama dalam format ISO 8601. string
periode Lamanya waktu antara pemeriksaan dalam format ISO 8601. string
successThreshold Jumlah pemeriksaan yang berhasil sebelum mengembalikan status sehat. int
waktu habis Batas waktu pemeriksaan dalam format ISO 8601. string

EndpointDeploymentPropertiesBaseProperties

Nama Deskripsi Nilai
{properti yang disesuaikan} string
{properti yang disesuaikan} string

OnlineRequestSettings

Nama Deskripsi Nilai
maxConcurrentRequestsPerInstance Jumlah permintaan bersamaan maksimum per simpul yang diizinkan per penyebaran. Default ke 1. int
maxQueueWait Jumlah maksimum waktu permintaan akan tetap berada dalam antrean dalam format ISO 8601.
Defaultnya adalah 500ms.
string
requestTimeout Batas waktu penilaian dalam format ISO 8601.
Default ke 5000ms.
string

OnlineScaleSettings

Nama Deskripsi Nilai
scaleType Mengatur jenis objek Default
TargetUtilization (diperlukan)

DefaultScaleSettings

Nama Deskripsi Nilai
scaleType [Diperlukan] Jenis algoritma penskalaan penyebaran 'Default' (diperlukan)

TargetUtilizationScaleSettings

Nama Deskripsi Nilai
scaleType [Diperlukan] Jenis algoritma penskalaan penyebaran 'TargetUtilization' (diperlukan)
maxInstances Jumlah instans maksimum yang dapat diperluas skalanya oleh penyebaran. Kuota akan dicadangkan untuk max_instances. int
minInstances Jumlah instans minimum untuk selalu ada. int
pollingInterval Interval polling dalam format ISO 8691. Hanya mendukung durasi dengan presisi serendah Detik. string
targetUtilizationPercentage Menargetkan penggunaan CPU untuk autoscaler. int

KubernetesOnlineDeployment

Nama Deskripsi Nilai
endpointComputeType [Diperlukan] Jenis komputasi titik akhir. 'Kubernetes' (diperlukan)
containerResourceRequirements Persyaratan sumber daya untuk kontainer (cpu dan memori). ContainerResourceRequirements

ContainerResourceRequirements

Nama Deskripsi Nilai
containerResourceLimits Info batas sumber daya kontainer: ContainerResourceSettings
containerResourceRequests Info permintaan sumber daya kontainer: ContainerResourceSettings

ContainerResourceSettings

Nama Deskripsi Nilai
cpu Jumlah permintaan/batas vCPU untuk kontainer. Info selengkapnya:
https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/
string
gpu Jumlah permintaan/batas kartu GPU Nvidia untuk kontainer. Info selengkapnya:
https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/
string
memory Permintaan/batas ukuran memori untuk kontainer. Info selengkapnya:
https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/
string

ManagedOnlineDeployment

Nama Deskripsi Nilai
endpointComputeType [Diperlukan] Jenis komputasi titik akhir. 'Terkelola' (diperlukan)

SKU

Nama Deskripsi Nilai
kapasitas Jika SKU mendukung peluasan skala/masuk, bilangan bulat kapasitas harus disertakan. Jika peluasan/penyempurnaan skala tidak dimungkinkan untuk sumber daya, ini dapat dihilangkan. int
keluarga Jika layanan memiliki generasi perangkat keras yang berbeda, untuk SKU yang sama, maka itu dapat ditangkap di sini. string
nama Nama SKUnya. Mantan - P3. Biasanya kode huruf+angka string (diperlukan)
Ukuran Ukuran SKU. Ketika bidang nama adalah kombinasi tingkat dan beberapa nilai lainnya, ini akan menjadi kode mandiri. string
Tier Bidang ini diperlukan untuk diimplementasikan oleh Penyedia Sumber Jika layanan memiliki lebih dari satu tingkat, tetapi tidak diperlukan pada PUT. 'Dasar'
'Gratis'
'Premium'
'Standar'

Definisi sumber daya Terraform (penyedia AzAPI)

Jenis sumber daya workspaces/onlineEndpoints/deployments dapat disebarkan dengan operasi yang menargetkan:

  • Grup sumber daya

Untuk daftar properti yang diubah di setiap versi API, lihat log perubahan.

Format sumber daya

Untuk membuat sumber daya Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments, tambahkan Terraform berikut ke templat Anda.

resource "azapi_resource" "symbolicname" {
  type = "Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments@2023-06-01-preview"
  name = "string"
  location = "string"
  parent_id = "string"
  tags = {
    tagName1 = "tagValue1"
    tagName2 = "tagValue2"
  }
  identity {
    type = "string"
    identity_ids = []
  }
  body = jsonencode({
    properties = {
      appInsightsEnabled = bool
      codeConfiguration = {
        codeId = "string"
        scoringScript = "string"
      }
      dataCollector = {
        collections = {
          {customized property} = {
            clientId = "string"
            dataCollectionMode = "string"
            dataId = "string"
            samplingRate = int
          }
        }
        requestLogging = {
          captureHeaders = [
            "string"
          ]
        }
        rollingRate = "string"
      }
      description = "string"
      egressPublicNetworkAccess = "string"
      environmentId = "string"
      environmentVariables = {
        {customized property} = "string"
        {customized property} = "string"
      }
      instanceType = "string"
      livenessProbe = {
        failureThreshold = int
        initialDelay = "string"
        period = "string"
        successThreshold = int
        timeout = "string"
      }
      model = "string"
      modelMountPath = "string"
      properties = {
        {customized property} = "string"
        {customized property} = "string"
      }
      readinessProbe = {
        failureThreshold = int
        initialDelay = "string"
        period = "string"
        successThreshold = int
        timeout = "string"
      }
      requestSettings = {
        maxConcurrentRequestsPerInstance = int
        maxQueueWait = "string"
        requestTimeout = "string"
      }
      scaleSettings = {
        scaleType = "string"
        // For remaining properties, see OnlineScaleSettings objects
      }
      endpointComputeType = "string"
      // For remaining properties, see OnlineDeploymentProperties objects
    }
    sku = {
      capacity = int
      family = "string"
      name = "string"
      size = "string"
      tier = "string"
    }
    kind = "string"
  })
}

Objek OnlineDeploymentProperties

Atur properti endpointComputeType untuk menentukan jenis objek.

Untuk Kubernetes, gunakan:

  endpointComputeType = "Kubernetes"
  containerResourceRequirements = {
    containerResourceLimits = {
      cpu = "string"
      gpu = "string"
      memory = "string"
    }
    containerResourceRequests = {
      cpu = "string"
      gpu = "string"
      memory = "string"
    }
  }

Untuk Dikelola, gunakan:

  endpointComputeType = "Managed"

Objek OnlineScaleSettings

Atur properti scaleType untuk menentukan jenis objek.

Untuk Default, gunakan:

  scaleType = "Default"

Untuk TargetUtilization, gunakan:

  scaleType = "TargetUtilization"
  maxInstances = int
  minInstances = int
  pollingInterval = "string"
  targetUtilizationPercentage = int

Nilai properti

workspaces/onlineEndpoints/deployments

Nama Deskripsi Nilai
jenis Jenis sumber daya "Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments@2023-06-01-preview"
nama Nama sumber daya string (diperlukan)
lokasi Lokasi geografis tempat sumber daya berada string (diperlukan)
parent_id ID sumber daya yang merupakan induk untuk sumber daya ini. ID untuk sumber daya jenis: onlineEndpoints
tag Tag sumber daya. Kamus nama dan nilai tag.
sku Detail Sku diperlukan untuk kontrak ARM untuk Autoscaling. Sku
jenis Metadata yang digunakan oleh portal/peralatan/dll untuk merender pengalaman UX yang berbeda untuk sumber daya dengan jenis yang sama. string
identitas Identitas layanan terkelola (identitas yang ditetapkan sistem dan/atau pengguna) ManagedServiceIdentity
properti [Diperlukan] Atribut tambahan entitas. OnlineDeploymentProperties (diperlukan)

ManagedServiceIdentity

Nama Deskripsi Nilai
jenis Jenis identitas layanan terkelola (di mana jenis SystemAssigned dan UserAssigned diizinkan). "SystemAssigned"
"SystemAssigned,UserAssigned"
"UserAssigned" (diperlukan)
identity_ids Kumpulan identitas yang ditetapkan pengguna yang terkait dengan sumber daya. Kunci kamus userAssignedIdentities akan menjadi id sumber daya ARM dalam formulir: '/subscriptions/{subscriptionId}/resourceGroups/{resourceGroupName}/providers/Microsoft.ManagedIdentity/userAssignedIdentities/{identityName}. Nilai kamus dapat berupa objek kosong ({}) dalam permintaan. Array ID identitas pengguna.

UserAssignedIdentities

Nama Deskripsi Nilai
{properti yang disesuaikan} UserAssignedIdentity

UserAssignedIdentity

Objek ini tidak berisi properti apa pun untuk diatur selama penyebaran. Semua properti adalah ReadOnly.

OnlineDeploymentProperties

Nama Deskripsi Nilai
appInsightsEnabled Jika true, mengaktifkan pengelogan Application Insights. bool
codeConfiguration Konfigurasi kode untuk penyebaran titik akhir. CodeConfiguration
dataCollector Konfigurasi mdc, kami menonaktifkan mdc saat null. DataCollector
deskripsi Deskripsi penyebaran titik akhir. string
egressPublicNetworkAccess Jika Diaktifkan, izinkan akses jaringan publik keluar. Jika Dinonaktifkan, ini akan membuat jalan keluar yang aman. Default: Diaktifkan. "Dinonaktifkan"
"Diaktifkan"
environmentId ID sumber daya ARM dari spesifikasi lingkungan untuk penyebaran titik akhir. string
environmentVariables Konfigurasi variabel lingkungan untuk penyebaran. EndpointDeploymentPropertiesBaseEnvironmentVariables
instanceType Jenis instans komputasi. string
livenessProbe Pemeriksaan keaktifan memantau kesehatan kontainer secara teratur. ProbeSettings
model Jalur URI ke model. string
modelMountPath Jalur untuk memasang model dalam kontainer kustom. string
properti Kamus properti. Properti dapat ditambahkan, tetapi tidak dihapus atau diubah. EndpointDeploymentPropertiesBaseProperties
readinessProbe Pemeriksaan kesiapan memvalidasi jika kontainer siap melayani lalu lintas. Properti dan defaultnya sama dengan pemeriksaan keaktifan. ProbeSettings
requestSettings Minta pengaturan untuk penyebaran. OnlineRequestSettings
scaleSettings Pengaturan skala untuk penyebaran.
Jika null atau tidak disediakan,
defaultnya ke TargetUtilizationScaleSettings untuk KubernetesOnlineDeployment
dan ke DefaultScaleSettings untuk ManagedOnlineDeployment.
OnlineScaleSettings
endpointComputeType Mengatur jenis objek Kubernetes
Terkelola (diperlukan)

CodeConfiguration

Nama Deskripsi Nilai
codeId ID sumber daya ARM dari aset kode. string
scoringScript [Diperlukan] Skrip yang akan dijalankan saat startup. misalnya. "score.py" string (diperlukan)

Batasan:
Panjang min = 1
Pola = [a-zA-Z0-9_]

DataCollector

Nama Deskripsi Nilai
Koleksi [Diperlukan] Konfigurasi pengumpulan. Setiap koleksi memiliki konfigurasinya sendiri untuk mengumpulkan data model dan nama koleksi dapat berupa string arbitrer.
Pengumpul data model dapat digunakan untuk pengelogan payload atau pengelogan kustom atau keduanya. Permintaan dan respons pengumpulan dicadangkan untuk pengelogan payload, yang lain adalah untuk pengelogan kustom.
DataCollectorCollections (diperlukan)
requestLogging Konfigurasi pengelogan permintaan untuk mdc, mencakup pengaturan pengelogan tingkat lanjut untuk semua koleksi. Ini opsional. RequestLogging
rollingRate Ketika data model dikumpulkan ke penyimpanan blob, kita perlu menggulung data ke jalur yang berbeda untuk menghindari pengelogan semuanya dalam satu file blob.
Jika laju bergulir adalah jam, semua data akan dikumpulkan di jalur blob /yyyy/MM/dd/HH/.
Jika hari ini, semua data akan dikumpulkan dalam jalur blob /yyyy/MM/dd/.
Manfaat lain dari jalur bergulir adalah bahwa ui pemantauan model mampu memilih rentang waktu data dengan sangat cepat.
"Hari"
"Jam"
"Menit"
"Bulan"
"Tahun"

DataCollectorCollections

Nama Deskripsi Nilai
{customized property} Koleksi

Koleksi

Nama Deskripsi Nilai
clientId Id klien msi digunakan untuk mengumpulkan pengelogan ke penyimpanan blob. Jika null, backend akan memilih identitas titik akhir terdaftar untuk autentikasi. string
dataCollectionMode Mengaktifkan atau menonaktifkan pengumpulan data. "Dinonaktifkan"
"Diaktifkan"
dataId Id sumber daya arm aset data. Sisi klien akan memastikan aset data menunjuk ke penyimpanan blob, dan backend akan mengumpulkan data ke penyimpanan blob. string
samplingRate Laju pengambilan sampel untuk pengumpulan. Laju pengambilan sampel 1,0 berarti kami mengumpulkan 100% data secara default. int

RequestLogging

Nama Deskripsi Nilai
captureHeaders Untuk pengelogan payload, kami hanya mengumpulkan payload secara default. Jika pelanggan juga ingin mengumpulkan header yang ditentukan, mereka dapat mengaturnya di captureHeaders sehingga backend akan mengumpulkan header tersebut bersama dengan payload. string[]

EndpointDeploymentPropertiesBaseEnvironmentVariables

Nama Deskripsi Nilai
{customized property} string
{customized property} string

ProbeSettings

Nama Deskripsi Nilai
failureThreshold Jumlah kegagalan yang diizinkan sebelum mengembalikan status tidak sehat. int
initialDelay Penundaan sebelum pemeriksaan pertama dalam format ISO 8601. string
periode Lamanya waktu antara pemeriksaan dalam format ISO 8601. string
successThreshold Jumlah pemeriksaan yang berhasil sebelum mengembalikan status sehat. int
waktu habis Batas waktu pemeriksaan dalam format ISO 8601. string

EndpointDeploymentPropertiesBaseProperties

Nama Deskripsi Nilai
{customized property} string
{customized property} string

OnlineRequestSettings

Nama Deskripsi Nilai
maxConcurrentRequestsPerInstance Jumlah permintaan bersamaan maksimum per simpul yang diizinkan per penyebaran. Default ke 1. int
maxQueueWait Jumlah maksimum waktu permintaan akan tetap dalam antrean dalam format ISO 8601.
Default ke 500ms.
string
requestTimeout Batas waktu penilaian dalam format ISO 8601.
Default ke 5000ms.
string

OnlineScaleSettings

Nama Deskripsi Nilai
scaleType Mengatur jenis objek Default
TargetUtilization (diperlukan)

DefaultScaleSettings

Nama Deskripsi Nilai
scaleType [Diperlukan] Jenis algoritma penskalaan penyebaran "Default" (diperlukan)

TargetUtilizationScaleSettings

Nama Deskripsi Nilai
scaleType [Diperlukan] Jenis algoritma penskalaan penyebaran "TargetUtilization" (diperlukan)
maxInstances Jumlah instans maksimum yang dapat diperluas skalanya oleh penyebaran. Kuota akan dicadangkan untuk max_instances. int
minInstances Jumlah instans minimum untuk selalu ada. int
pollingInterval Interval polling dalam format ISO 8691. Hanya mendukung durasi dengan presisi serendah Detik. string
targetUtilizationPercentage Penggunaan CPU target untuk autoscaler. int

KubernetesOnlineDeployment

Nama Deskripsi Nilai
endpointComputeType [Diperlukan] Jenis komputasi titik akhir. "Kubernetes" (diperlukan)
containerResourceRequirements Persyaratan sumber daya untuk kontainer (cpu dan memori). ContainerResourceRequirements

ContainerResourceRequirements

Nama Deskripsi Nilai
containerResourceLimits Info batas sumber daya kontainer: ContainerResourceSettings
containerResourceRequests Info permintaan sumber daya kontainer: ContainerResourceSettings

ContainerResourceSettings

Nama Deskripsi Nilai
cpu Jumlah permintaan/batas vCPU untuk kontainer. Info selengkapnya:
https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/
string
gpu Jumlah permintaan/batas kartu GPU Nvidia untuk kontainer. Info selengkapnya:
https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/
string
memory Permintaan/batas ukuran memori untuk kontainer. Info selengkapnya:
https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/
string

ManagedOnlineDeployment

Nama Deskripsi Nilai
endpointComputeType [Diperlukan] Jenis komputasi titik akhir. "Dikelola" (diperlukan)

SKU

Nama Deskripsi Nilai
kapasitas Jika SKU mendukung peluasan skala/masuk, bilangan bulat kapasitas harus disertakan. Jika peluasan/penyempurnaan skala tidak dimungkinkan untuk sumber daya, ini dapat dihilangkan. int
keluarga Jika layanan memiliki generasi perangkat keras yang berbeda, untuk SKU yang sama, maka itu dapat ditangkap di sini. string
nama Nama SKUnya. Mantan - P3. Biasanya kode huruf+angka string (diperlukan)
Ukuran Ukuran SKU. Ketika bidang nama adalah kombinasi tingkat dan beberapa nilai lainnya, ini akan menjadi kode mandiri. string
Tier Bidang ini diperlukan untuk diimplementasikan oleh Penyedia Sumber Jika layanan memiliki lebih dari satu tingkat, tetapi tidak diperlukan pada PUT. "Dasar"
"Gratis"
"Premium"
"Standar"