Partilhar via


Áreas de trabalho Microsoft.MachineLearningServices/inferencePools 2023-08-01-preview

Definição de recurso do Bicep

O tipo de recurso áreas de trabalho/inferencePools pode ser implementado com operações que visam:

Para obter uma lista de propriedades alteradas em cada versão da API, veja registo de alterações.

Formato do recurso

Para criar um recurso Microsoft.MachineLearningServices/workspaces/inferencePools, adicione o seguinte Bicep ao seu modelo.

resource symbolicname 'Microsoft.MachineLearningServices/workspaces/inferencePools@2023-08-01-preview' = {
  name: 'string'
  location: 'string'
  tags: {
    tagName1: 'tagValue1'
    tagName2: 'tagValue2'
  }
  sku: {
    capacity: int
    family: 'string'
    name: 'string'
    size: 'string'
    tier: 'string'
  }
  kind: 'string'
  parent: resourceSymbolicName
  identity: {
    type: 'string'
    userAssignedIdentities: {
      {customized property}: {}
    }
  }
  properties: {
    codeConfiguration: {
      codeId: 'string'
      scoringScript: 'string'
    }
    description: 'string'
    environmentConfiguration: {
      environmentId: 'string'
      environmentVariables: {
        {customized property}: 'string'
      }
      livenessProbe: {
        failureThreshold: int
        initialDelay: 'string'
        period: 'string'
        successThreshold: int
        timeout: 'string'
      }
      readinessProbe: {
        failureThreshold: int
        initialDelay: 'string'
        period: 'string'
        successThreshold: int
        timeout: 'string'
      }
      startupProbe: {
        failureThreshold: int
        initialDelay: 'string'
        period: 'string'
        successThreshold: int
        timeout: 'string'
      }
    }
    modelConfiguration: {
      modelId: 'string'
    }
    nodeSkuType: 'string'
    properties: {
      {customized property}: 'string'
      {customized property}: 'string'
      {customized property}: 'string'
    }
    requestConfiguration: {
      maxConcurrentRequestsPerInstance: int
      requestTimeout: 'string'
    }
  }
}

Valores de propriedade

áreas de trabalho/inferencePools

Nome Descrição Valor
name O nome do recurso

Veja como definir nomes e tipos para recursos subordinados no Bicep.
cadeia (obrigatório)
localização A localização geográfica onde o recurso se encontra cadeia (obrigatório)
etiquetas Etiquetas de recursos. Dicionário de nomes e valores de etiquetas. Ver Etiquetas em modelos
sku Detalhes do SKU necessários para o contrato arm para dimensionamento automático. SKU
tipo Metadados utilizados pelo portal/ferramentas/etc. para compor diferentes experiências de UX para recursos do mesmo tipo. string
principal No Bicep, pode especificar o recurso principal de um recurso subordinado. Só precisa de adicionar esta propriedade quando o recurso subordinado for declarado fora do recurso principal.

Para obter mais informações, veja Recurso subordinado fora do recurso principal.
Nome simbólico para recurso do tipo: áreas de trabalho
identidade Identidade de serviço gerida (identidades atribuídas pelo sistema e/ou pelo utilizador) ManagedServiceIdentity
propriedades [Obrigatório] Atributos adicionais da entidade. InferencePoolProperties (obrigatório)

ManagedServiceIdentity

Nome Descrição Valor
tipo Tipo de identidade de serviço gerida (onde os tipos SystemAssigned e UserAssigned são permitidos). "Nenhum"
"SystemAssigned"
"SystemAssigned,UserAssigned"
"UserAssigned" (obrigatório)
userAssignedIdentities O conjunto de identidades atribuídas pelo utilizador associadas ao recurso. As chaves de dicionário userAssignedIdentities serão IDs de recursos do ARM no formulário: '/subscriptions/{subscriptionId}/resourceGroups/{resourceGroupName}/providers/Microsoft.ManagedIdentity/userAssignedIdentities/{identityName}. Os valores do dicionário podem ser objetos vazios ({}) nos pedidos. UserAssignedIdentities

UserAssignedIdentities

Nome Descrição Valor
{customized property} UserAssignedIdentity

UserAssignedIdentity

Este objeto não contém quaisquer propriedades a definir durante a implementação. Todas as propriedades são ReadOnly.

InferencePoolProperties

Nome Descrição Valor
codeConfiguration Configuração de código para o conjunto de inferências. CodeConfiguration
descrição Descrição do recurso. string
environmentConfiguration EnvironmentConfiguration para o conjunto de inferência. PoolEnvironmentConfiguration
modelConfiguration ModelConfiguration para o conjunto de inferência. PoolModelConfiguration
nodeSkuType [Obrigatório] Tipo de instância de computação. cadeia (obrigatório)

Restrições:
Comprimento mínimo = 1
Padrão = [a-zA-Z0-9_]
propriedades Dicionário de propriedades. As propriedades podem ser adicionadas, mas não removidas ou alteradas. PropertiesBaseProperties
requestConfiguration Pedir configuração para o conjunto de inferências. RequestConfiguration

CodeConfiguration

Nome Descrição Valor
codeId ID do recurso arm do recurso de código. string
scoreScript [Obrigatório] O script a executar no arranque. Por exemplo, "score.py" cadeia (obrigatório)

Restrições:
Comprimento mínimo = 1
Padrão = [a-zA-Z0-9_]

PoolEnvironmentConfiguration

Nome Descrição Valor
environmentId ID do recurso arm da especificação do ambiente para o conjunto de inferência. string
environmentVariables Configuração de variáveis de ambiente para o conjunto de inferência. PoolEnvironmentConfigurationEnvironmentVariables
livenessProbe A sonda liveness monitoriza regularmente o estado de funcionamento do contentor. ProbeSettings
readinessProbe A sonda de preparação valida se o contentor está pronto para servir o tráfego. As propriedades e predefinições são as mesmas que a pesquisa liveness. ProbeSettings
startupProbe Isto verifica se a aplicação num contentor foi iniciada. As sondas de arranque são executadas antes de qualquer outra sonda e, a menos que seja concluída com êxito, desativa outras pesquisas. ProbeSettings

PoolEnvironmentConfigurationEnvironmentVariables

Nome Descrição Valor
{customized property} string

ProbeSettings

Nome Descrição Valor
failureThreshold O número de falhas a permitir antes de devolver um mau estado de funcionamento. int
initialDelay O atraso antes da primeira pesquisa no formato ISO 8601. string
period O período de tempo entre sondas no formato ISO 8601. string
successThreshold O número de pesquisas bem-sucedidas antes de devolver um bom estado de funcionamento. int
tempo limite O tempo limite da sonda no formato ISO 8601. string

PoolModelConfiguration

Nome Descrição Valor
modelId O caminho do URI para o modelo. string

PropriedadesBasePropriedades

Nome Descrição Valor
{customized property} string
{customized property} string
{customized property} string

RequestConfiguration

Nome Descrição Valor
maxConcurrentRequestsPerInstance O número máximo de pedidos simultâneos por nó permitidos por implementação. A predefinição é 1. int
requestTimeout O tempo limite de classificação no formato ISO 8601.
A predefinição é 5000ms.
string

Sku

Nome Descrição Valor
capacidade Se o SKU suportar o aumento/aumento horizontal, o número inteiro da capacidade deve ser incluído. Se não for possível aumentar/reduzir horizontalmente para o recurso, tal poderá ser omitido. int
família Se o serviço tiver diferentes gerações de hardware, para o mesmo SKU, isso pode ser capturado aqui. string
name O nome do SKU. Ex - P3. Normalmente, é um código letter+number cadeia (obrigatório)
size O tamanho do SKU. Quando o campo de nome é a combinação de camada e outro valor, este seria o código autónomo. string
tier Este campo tem de ser implementado pelo Fornecedor de Recursos se o serviço tiver mais do que um escalão, mas não for necessário num PUT. "Básico"
'Gratuito'
"Premium"
'Standard'

Definição de recurso de modelo do ARM

O tipo de recurso áreas de trabalho/inferencePools pode ser implementado com operações que visam:

Para obter uma lista de propriedades alteradas em cada versão da API, veja registo de alterações.

Formato do recurso

Para criar um recurso Microsoft.MachineLearningServices/workspaces/inferencePools, adicione o seguinte JSON ao seu modelo.

{
  "type": "Microsoft.MachineLearningServices/workspaces/inferencePools",
  "apiVersion": "2023-08-01-preview",
  "name": "string",
  "location": "string",
  "tags": {
    "tagName1": "tagValue1",
    "tagName2": "tagValue2"
  },
  "sku": {
    "capacity": "int",
    "family": "string",
    "name": "string",
    "size": "string",
    "tier": "string"
  },
  "kind": "string",
  "identity": {
    "type": "string",
    "userAssignedIdentities": {
      "{customized property}": {}
    }
  },
  "properties": {
    "codeConfiguration": {
      "codeId": "string",
      "scoringScript": "string"
    },
    "description": "string",
    "environmentConfiguration": {
      "environmentId": "string",
      "environmentVariables": {
        "{customized property}": "string"
      },
      "livenessProbe": {
        "failureThreshold": "int",
        "initialDelay": "string",
        "period": "string",
        "successThreshold": "int",
        "timeout": "string"
      },
      "readinessProbe": {
        "failureThreshold": "int",
        "initialDelay": "string",
        "period": "string",
        "successThreshold": "int",
        "timeout": "string"
      },
      "startupProbe": {
        "failureThreshold": "int",
        "initialDelay": "string",
        "period": "string",
        "successThreshold": "int",
        "timeout": "string"
      }
    },
    "modelConfiguration": {
      "modelId": "string"
    },
    "nodeSkuType": "string",
    "properties": {
      "{customized property}": "string",
      "{customized property}": "string",
      "{customized property}": "string"
    },
    "requestConfiguration": {
      "maxConcurrentRequestsPerInstance": "int",
      "requestTimeout": "string"
    }
  }
}

Valores de propriedade

áreas de trabalho/inferencePools

Nome Descrição Valor
tipo O tipo de recurso "Microsoft.MachineLearningServices/workspaces/inferencePools"
apiVersion A versão da API de recursos "2023-08-01-preview"
name O nome do recurso

Veja como definir nomes e tipos para recursos subordinados em modelos do ARM JSON.
cadeia (obrigatório)
localização A localização geográfica onde o recurso se encontra cadeia (obrigatório)
etiquetas Etiquetas de recursos. Dicionário de nomes e valores de etiquetas. Ver Etiquetas em modelos
sku Detalhes do SKU necessários para o contrato arm para dimensionamento automático. SKU
tipo Metadados utilizados pelo portal/ferramentas/etc. para compor diferentes experiências de UX para recursos do mesmo tipo. string
identidade Identidade de serviço gerida (identidades atribuídas pelo sistema e/ou pelo utilizador) ManagedServiceIdentity
propriedades [Obrigatório] Atributos adicionais da entidade. InferencePoolProperties (obrigatório)

ManagedServiceIdentity

Nome Descrição Valor
tipo Tipo de identidade de serviço gerida (onde os tipos SystemAssigned e UserAssigned são permitidos). "Nenhum"
"SystemAssigned"
"SystemAssigned,UserAssigned"
"UserAssigned" (obrigatório)
userAssignedIdentities O conjunto de identidades atribuídas pelo utilizador associadas ao recurso. As chaves de dicionário userAssignedIdentities serão IDs de recursos do ARM no formulário: '/subscriptions/{subscriptionId}/resourceGroups/{resourceGroupName}/providers/Microsoft.ManagedIdentity/userAssignedIdentities/{identityName}. Os valores do dicionário podem ser objetos vazios ({}) nos pedidos. UserAssignedIdentities

UserAssignedIdentities

Nome Descrição Valor
{customized property} UserAssignedIdentity

UserAssignedIdentity

Este objeto não contém quaisquer propriedades a definir durante a implementação. Todas as propriedades são ReadOnly.

InferencePoolProperties

Nome Descrição Valor
codeConfiguration Configuração de código para o conjunto de inferências. CodeConfiguration
descrição Descrição do recurso. string
environmentConfiguration EnvironmentConfiguration para o conjunto de inferência. PoolEnvironmentConfiguration
modelConfiguration ModelConfiguration para o conjunto de inferência. PoolModelConfiguration
nodeSkuType [Obrigatório] Tipo de instância de computação. cadeia (obrigatório)

Restrições:
Comprimento mínimo = 1
Padrão = [a-zA-Z0-9_]
propriedades Dicionário de propriedades. As propriedades podem ser adicionadas, mas não removidas ou alteradas. PropertiesBaseProperties
requestConfiguration Pedir configuração para o conjunto de inferências. RequestConfiguration

CodeConfiguration

Nome Descrição Valor
codeId ID do recurso arm do recurso de código. string
scoreScript [Obrigatório] O script a executar no arranque. Por exemplo, "score.py" cadeia (obrigatório)

Restrições:
Comprimento mínimo = 1
Padrão = [a-zA-Z0-9_]

PoolEnvironmentConfiguration

Nome Descrição Valor
environmentId ID do recurso arm da especificação do ambiente para o conjunto de inferência. string
environmentVariables Configuração de variáveis de ambiente para o conjunto de inferências. PoolEnvironmentConfigurationEnvironmentVariables
livenessProbe A sonda liveness monitoriza regularmente o estado de funcionamento do contentor. ProbeSettings
readinessProbe A sonda de preparação valida se o contentor está pronto para servir o tráfego. As propriedades e predefinições são as mesmas que a pesquisa liveness. ProbeSettings
startupProbe Isto verifica se a aplicação num contentor foi iniciada. As sondas de arranque são executadas antes de qualquer outra sonda e, a menos que seja concluída com êxito, desativa outras sondas. ProbeSettings

PoolEnvironmentConfigurationEnvironmentVariables

Nome Descrição Valor
{customized property} string

ProbeSettings

Nome Descrição Valor
failureThreshold O número de falhas a permitir antes de devolver um estado de mau estado de funcionamento. int
initialDelay O atraso antes da primeira pesquisa no formato ISO 8601. string
period O período de tempo entre sondas no formato ISO 8601. string
successThreshold O número de pesquisas bem-sucedidas antes de devolver um estado de funcionamento. int
tempo limite O tempo limite da sonda no formato ISO 8601. string

PoolModelConfiguration

Nome Descrição Valor
modelId O caminho do URI para o modelo. string

PropertiesBaseProperties

Nome Descrição Valor
{customized property} string
{customized property} string
{customized property} string

RequestConfiguration

Nome Descrição Valor
maxConcurrentRequestsPerInstance O número máximo de pedidos simultâneos por nó permitido por implementação. A predefinição é 1. int
requestTimeout O tempo limite de classificação no formato ISO 8601.
A predefinição é de 5000ms.
string

Sku

Nome Descrição Valor
capacidade Se o SKU suportar o aumento horizontal/in, o número inteiro de capacidade deve ser incluído. Se não for possível aumentar/reduzir horizontalmente o recurso, tal poderá ser omitido. int
família Se o serviço tiver diferentes gerações de hardware, para o mesmo SKU, isso pode ser capturado aqui. string
name O nome do SKU. Ex - P3. Normalmente, é um código letter+number cadeia (obrigatório)
size O tamanho do SKU. Quando o campo de nome é a combinação de camada e outro valor, este seria o código autónomo. string
tier Este campo tem de ser implementado pelo Fornecedor de Recursos se o serviço tiver mais do que um escalão, mas não for necessário num PUT. "Básico"
'Gratuito'
"Premium"
'Standard'

Definição de recurso do Terraform (fornecedor AzAPI)

O tipo de recurso áreas de trabalho/inferencePools pode ser implementado com operações que visam:

  • Grupos de recursos

Para obter uma lista de propriedades alteradas em cada versão da API, veja registo de alterações.

Formato do recurso

Para criar um recurso Microsoft.MachineLearningServices/workspaces/inferencePools, adicione o seguinte Terraform ao seu modelo.

resource "azapi_resource" "symbolicname" {
  type = "Microsoft.MachineLearningServices/workspaces/inferencePools@2023-08-01-preview"
  name = "string"
  location = "string"
  parent_id = "string"
  tags = {
    tagName1 = "tagValue1"
    tagName2 = "tagValue2"
  }
  identity {
    type = "string"
    identity_ids = []
  }
  body = jsonencode({
    properties = {
      codeConfiguration = {
        codeId = "string"
        scoringScript = "string"
      }
      description = "string"
      environmentConfiguration = {
        environmentId = "string"
        environmentVariables = {
          {customized property} = "string"
        }
        livenessProbe = {
          failureThreshold = int
          initialDelay = "string"
          period = "string"
          successThreshold = int
          timeout = "string"
        }
        readinessProbe = {
          failureThreshold = int
          initialDelay = "string"
          period = "string"
          successThreshold = int
          timeout = "string"
        }
        startupProbe = {
          failureThreshold = int
          initialDelay = "string"
          period = "string"
          successThreshold = int
          timeout = "string"
        }
      }
      modelConfiguration = {
        modelId = "string"
      }
      nodeSkuType = "string"
      properties = {
        {customized property} = "string"
        {customized property} = "string"
        {customized property} = "string"
      }
      requestConfiguration = {
        maxConcurrentRequestsPerInstance = int
        requestTimeout = "string"
      }
    }
    sku = {
      capacity = int
      family = "string"
      name = "string"
      size = "string"
      tier = "string"
    }
    kind = "string"
  })
}

Valores de propriedade

áreas de trabalho/inferencePools

Nome Descrição Valor
tipo O tipo de recurso "Microsoft.MachineLearningServices/workspaces/inferencePools@2023-08-01-preview"
name O nome do recurso cadeia (obrigatório)
localização A localização geográfica onde o recurso se encontra cadeia (obrigatório)
parent_id O ID do recurso que é o principal para este recurso. ID para recurso do tipo: áreas de trabalho
etiquetas Etiquetas de recursos. Dicionário de nomes e valores de etiquetas.
sku Detalhes do SKU necessários para o contrato arm para dimensionamento automático. SKU
tipo Metadados utilizados pelo portal/ferramentas/etc. para compor diferentes experiências de UX para recursos do mesmo tipo. string
identidade Identidade de serviço gerida (identidades atribuídas pelo sistema e/ou pelo utilizador) ManagedServiceIdentity
propriedades [Obrigatório] Atributos adicionais da entidade. InferencePoolProperties (obrigatório)

ManagedServiceIdentity

Nome Descrição Valor
tipo Tipo de identidade de serviço gerida (onde os tipos SystemAssigned e UserAssigned são permitidos). "SystemAssigned"
"SystemAssigned,UserAssigned"
"UserAssigned" (obrigatório)
identity_ids O conjunto de identidades atribuídas pelo utilizador associadas ao recurso. As chaves de dicionário userAssignedIdentities serão IDs de recursos do ARM no formulário: '/subscriptions/{subscriptionId}/resourceGroups/{resourceGroupName}/providers/Microsoft.ManagedIdentity/userAssignedIdentities/{identityName}. Os valores do dicionário podem ser objetos vazios ({}) nos pedidos. Matriz de IDs de identidade de utilizador.

UserAssignedIdentities

Nome Descrição Valor
{customized property} UserAssignedIdentity

UserAssignedIdentity

Este objeto não contém quaisquer propriedades a definir durante a implementação. Todas as propriedades são ReadOnly.

InferencePoolProperties

Nome Descrição Valor
codeConfiguration Configuração de código para o conjunto de inferências. CodeConfiguration
descrição Descrição do recurso. string
environmentConfiguration EnvironmentConfiguration para o conjunto de inferência. PoolEnvironmentConfiguration
modelConfiguration ModelConfiguration para o conjunto de inferência. PoolModelConfiguration
nodeSkuType [Obrigatório] Tipo de instância de computação. cadeia (obrigatório)

Restrições:
Comprimento mínimo = 1
Padrão = [a-zA-Z0-9_]
propriedades Dicionário de propriedades. As propriedades podem ser adicionadas, mas não removidas ou alteradas. PropertiesBaseProperties
requestConfiguration Pedir configuração para o conjunto de inferências. RequestConfiguration

CodeConfiguration

Nome Descrição Valor
codeId ID do recurso arm do recurso de código. string
scoreScript [Obrigatório] O script a executar no arranque. Por exemplo, "score.py" cadeia (obrigatório)

Restrições:
Comprimento mínimo = 1
Padrão = [a-zA-Z0-9_]

PoolEnvironmentConfiguration

Nome Descrição Valor
environmentId ID do recurso arm da especificação do ambiente para o conjunto de inferência. string
environmentVariables Configuração de variáveis de ambiente para o conjunto de inferências. PoolEnvironmentConfigurationEnvironmentVariables
livenessProbe A sonda liveness monitoriza regularmente o estado de funcionamento do contentor. ProbeSettings
readinessProbe A sonda de preparação valida se o contentor está pronto para servir o tráfego. As propriedades e predefinições são as mesmas que a pesquisa liveness. ProbeSettings
startupProbe Isto verifica se a aplicação num contentor foi iniciada. As sondas de arranque são executadas antes de qualquer outra sonda e, a menos que seja concluída com êxito, desativa outras sondas. ProbeSettings

PoolEnvironmentConfigurationEnvironmentVariables

Nome Descrição Valor
{customized property} string

ProbeSettings

Nome Descrição Valor
failureThreshold O número de falhas a permitir antes de devolver um estado de mau estado de funcionamento. int
initialDelay O atraso antes da primeira pesquisa no formato ISO 8601. string
period O período de tempo entre sondas no formato ISO 8601. string
successThreshold O número de pesquisas bem-sucedidas antes de devolver um estado de funcionamento. int
tempo limite O tempo limite da sonda no formato ISO 8601. string

PoolModelConfiguration

Nome Descrição Valor
modelId O caminho do URI para o modelo. string

PropertiesBaseProperties

Nome Descrição Valor
{customized property} string
{customized property} string
{customized property} string

RequestConfiguration

Nome Descrição Valor
maxConcurrentRequestsPerInstance O número máximo de pedidos simultâneos por nó permitido por implementação. A predefinição é 1. int
requestTimeout O tempo limite de classificação no formato ISO 8601.
A predefinição é 5000ms.
string

Sku

Nome Descrição Valor
capacidade Se o SKU suportar o aumento/aumento horizontal, o número inteiro da capacidade deve ser incluído. Se não for possível aumentar/reduzir horizontalmente para o recurso, tal poderá ser omitido. int
família Se o serviço tiver diferentes gerações de hardware, para o mesmo SKU, isso pode ser capturado aqui. string
name O nome do SKU. Ex - P3. Normalmente, é um código letter+number cadeia (obrigatório)
size O tamanho do SKU. Quando o campo de nome é a combinação de camada e outro valor, este seria o código autónomo. string
tier Este campo tem de ser implementado pelo Fornecedor de Recursos se o serviço tiver mais do que um escalão, mas não for necessário num PUT. "Básico"
"Gratuito"
"Premium"
"Standard"