Batch Deployments - Update
Atualize uma implantação de inferência em lote (assíncrona).
PATCH https://management.azure.com/subscriptions/{subscriptionId}/resourceGroups/{resourceGroupName}/providers/Microsoft.MachineLearningServices/workspaces/{workspaceName}/batchEndpoints/{endpointName}/deployments/{deploymentName}?api-version=2025-12-01
Parâmetros do URI
| Name | Em | Necessário | Tipo | Description |
|---|---|---|---|---|
|
deployment
|
path | True |
string |
O identificador para as implantações em lote. |
|
endpoint
|
path | True |
string |
Nome para o ponto de extremidade do lote. |
|
resource
|
path | True |
string minLength: 1maxLength: 90 |
O nome do grupo de recursos. O nome não diferencia maiúsculas de minúsculas. |
|
subscription
|
path | True |
string minLength: 1 |
A ID da assinatura de destino. |
|
workspace
|
path | True |
string pattern: ^[a-zA-Z0-9][a-zA-Z0-9_-]{2,32}$ |
Nome do Espaço de Trabalho do Azure Machine Learning |
|
api-version
|
query | True |
string minLength: 1 |
A versão da API a utilizar para esta operação. |
Corpo do Pedido
| Name | Tipo | Description |
|---|---|---|
| properties |
Atributos adicionais da entidade. |
|
| tags |
object |
Tags de recursos. |
Respostas
| Name | Tipo | Description |
|---|---|---|
| 200 OK |
O pedido foi bem-sucedido. |
|
| 202 Accepted |
O pedido foi aceite para processamento, mas o processamento ainda não foi concluído. Cabeçalhos
|
|
| Other Status Codes |
Uma resposta de erro inesperada. |
Segurança
azure_auth
Fluxo OAuth2 do Azure Ative Directory.
Tipo:
oauth2
Fluxo:
implicit
URL de Autorização:
https://login.microsoftonline.com/common/oauth2/authorize
Âmbitos
| Name | Description |
|---|---|
| user_impersonation | personificar a sua conta de utilizador |
Exemplos
Update Workspace Batch Deployment.
Pedido de amostra
PATCH https://management.azure.com/subscriptions/00000000-1111-2222-3333-444444444444/resourceGroups/test-rg/providers/Microsoft.MachineLearningServices/workspaces/my-aml-workspace/batchEndpoints/testEndpointName/deployments/testDeploymentName?api-version=2025-12-01
{
"properties": {
"description": "string"
},
"tags": {}
}
Resposta da amostra
Location: example_location
{
"name": "string",
"type": "string",
"id": "string",
"identity": {
"type": "SystemAssigned",
"principalId": "00000000-1111-2222-3333-444444444444",
"tenantId": "00000000-1111-2222-3333-444444444444",
"userAssignedIdentities": {
"string": {
"clientId": "00000000-1111-2222-3333-444444444444",
"principalId": "00000000-1111-2222-3333-444444444444"
}
}
},
"kind": "string",
"location": "string",
"properties": {
"description": "string",
"codeConfiguration": {
"codeId": "string",
"scoringScript": "string"
},
"compute": "string",
"environmentId": "string",
"environmentVariables": {
"string": "string"
},
"errorThreshold": 1,
"loggingLevel": "Info",
"maxConcurrencyPerInstance": 1,
"miniBatchSize": 1,
"model": {
"assetId": "string",
"referenceType": "Id"
},
"outputAction": "SummaryOnly",
"outputFileName": "string",
"properties": {
"string": "string"
},
"provisioningState": "Creating",
"resources": {
"instanceCount": 1,
"instanceType": "string",
"properties": {
"string": {
"1e5e1cf9-b0ea-4cf6-9764-e750bf85c10a": null
}
}
},
"retrySettings": {
"maxRetries": 1,
"timeout": "PT5M"
}
},
"sku": {
"name": "string",
"capacity": 1,
"family": "string",
"size": "string",
"tier": "Free"
},
"systemData": {
"createdAt": "2020-01-01T12:34:56.999Z",
"createdBy": "string",
"createdByType": "User",
"lastModifiedAt": "2020-01-01T12:34:56.999Z",
"lastModifiedBy": "string",
"lastModifiedByType": "User"
},
"tags": {}
}
Location: example_location
Definições
| Name | Description |
|---|---|
|
Batch |
Tipos de recursos controlados concretos podem ser criados aliasing esse tipo usando um tipo de propriedade específico. |
|
Batch |
Os tipos de propriedade enumerados para implantações em lote. |
|
Batch |
Configurações de inferência em lote por implantação. |
|
Batch |
Detalhamento do log para inferência em lote. Aumentar a ordem de detalhamento para registro é: Aviso, Informações e Depuração. O valor predefinido é Info. |
|
Batch |
Enum para determinar como a inferência em lote lidará com a saída |
|
Batch |
Propriedades para uma implantação de componente de pipeline em lote. |
|
Batch |
Repita as configurações para uma operação de inferência em lote. |
|
Code |
Configuração para um ativo de código de pontuação. |
|
created |
O tipo de identidade que criou o recurso. |
|
Data |
Referência a um ativo por meio de seu caminho em um armazenamento de dados. |
|
Deployment |
Valores possíveis para DeploymentProvisioningState. |
|
Deployment |
|
|
Error |
O erro de gerenciamento de recursos informações adicionais. |
|
Error |
O detalhe do erro. |
|
Error |
Resposta de erro |
|
Id |
Referência a um ativo através do seu ID de recurso ARM. |
|
Managed |
Identidade do serviço gerenciado (identidades atribuídas pelo sistema e/ou pelo usuário) |
|
Managed |
Tipo de identidade de serviço gerenciado (onde os tipos SystemAssigned e UserAssigned são permitidos). |
|
Output |
Referência a um ativo através de seu caminho em uma saída de trabalho. |
|
Partial |
Configurações de inferência em lote mutáveis por implantação. |
|
Partial |
Estritamente utilizado em pedidos de atualização. |
|
Reference |
Enum para determinar qual método de referência usar para um ativo. |
| Sku |
A definição do modelo de recursos que representa a SKU |
|
Sku |
Este campo deve ser implementado pelo Provedor de Recursos se o serviço tiver mais de uma camada, mas não é obrigatório em um PUT. |
|
system |
Metadados referentes à criação e última modificação do recurso. |
|
User |
Propriedades de identidade atribuídas pelo usuário |
BatchDeployment
Tipos de recursos controlados concretos podem ser criados aliasing esse tipo usando um tipo de propriedade específico.
| Name | Tipo | Description |
|---|---|---|
| id |
string |
ID de recurso totalmente qualificado para o recurso. Ex - /subscriptions/{subscriptionId}/resourceGroups/{resourceGroupName}/providers/{resourceProviderNamespace}/{resourceType}/{resourceName} |
| identity |
Identidade do serviço gerenciado (identidades atribuídas pelo sistema e/ou pelo usuário) |
|
| kind |
string |
Metadados usados pelo portal/ferramenta/etc para renderizar diferentes experiências de UX para recursos do mesmo tipo. |
| location |
string |
A geolocalização onde o recurso vive |
| name |
string |
O nome do recurso |
| properties |
[Obrigatório] Atributos adicionais da entidade. |
|
| sku |
Detalhes de sku necessários para o contrato ARM para Autoscaling. |
|
| systemData |
Metadados do Azure Resource Manager contendo informações createdBy e modifiedBy. |
|
| tags |
object |
Tags de recursos. |
| type |
string |
O tipo do recurso. Por exemplo, "Microsoft.Compute/virtualMachines" ou "Microsoft.Storage/storageAccounts" |
BatchDeploymentConfigurationType
Os tipos de propriedade enumerados para implantações em lote.
| Valor | Description |
|---|---|
| Model | |
| PipelineComponent |
BatchDeploymentProperties
Configurações de inferência em lote por implantação.
| Name | Tipo | Default value | Description |
|---|---|---|---|
| codeConfiguration |
Configuração de código para a implantação do ponto de extremidade. |
||
| compute |
string |
Destino de computação para operação de inferência em lote. |
|
| deploymentConfiguration | BatchDeploymentConfiguration: |
Propriedades relevantes para diferentes tipos de implantação. |
|
| description |
string |
Descrição da implantação do ponto de extremidade. |
|
| environmentId |
string |
ID de recurso ARM ou AssetId da especificação de ambiente para a implantação do ponto de extremidade. |
|
| environmentVariables |
object |
Configuração de variáveis de ambiente para a implantação. |
|
| errorThreshold |
integer (int32) |
-1 |
Limite de erro, se a contagem de erros para toda a entrada ultrapassar esse valor, a inferência em lote será anulada. O intervalo é [-1, int. ValorMáximo]. Para FileDataset, esse valor é a contagem de falhas de arquivo. Para TabularDataset, esse valor é a contagem de falhas de registro. Se definido como -1 (o limite inferior), todas as falhas durante a inferência em lote serão ignoradas. |
| loggingLevel | Info |
Detalhamento do log para inferência em lote. Aumentar a ordem de detalhamento para registro é: Aviso, Informações e Depuração. O valor predefinido é Info. |
|
| maxConcurrencyPerInstance |
integer (int32) |
1 |
Indica o número máximo de paralelismo por instância. |
| miniBatchSize |
integer (int64) |
10 |
Tamanho do minilote passado para cada chamada de lote. Para FileDataset, este é o número de arquivos por minilote. Para TabularDataset, esse é o tamanho dos registros em bytes, por minilote. |
| model | AssetReferenceBase: |
Referência ao ativo de modelo para a implantação do ponto de extremidade. |
|
| outputAction | AppendRow |
Enum para determinar como a inferência em lote lidará com a saída |
|
| outputFileName |
string |
predictions.csv |
Nome do arquivo de saída personalizado para append_row ação de saída. |
| properties |
object |
Dicionário de propriedades. As propriedades podem ser adicionadas, mas não removidas ou alteradas. |
|
| provisioningState |
Estado de provisionamento para a implantação do ponto de extremidade. |
||
| resources |
Indica a configuração de computação para o trabalho. Se não for fornecido, o padrão será definido como padrão para os padrões definidos em ResourceConfiguration. |
||
| retrySettings |
Configurações de repetição para a operação de inferência em lote. Se não for fornecido, o padrão será definido como padrão em BatchRetrySettings. |
BatchLoggingLevel
Detalhamento do log para inferência em lote. Aumentar a ordem de detalhamento para registro é: Aviso, Informações e Depuração. O valor predefinido é Info.
| Valor | Description |
|---|---|
| Info | |
| Warning | |
| Debug |
BatchOutputAction
Enum para determinar como a inferência em lote lidará com a saída
| Valor | Description |
|---|---|
| SummaryOnly | |
| AppendRow |
BatchPipelineComponentDeploymentConfiguration
Propriedades para uma implantação de componente de pipeline em lote.
| Name | Tipo | Description |
|---|---|---|
| componentId |
A ID ARM do componente a ser executado. |
|
| deploymentConfigurationType |
string:
Pipeline |
[Obrigatório] O tipo de implantação |
| description |
string |
A descrição que será aplicada ao trabalho. |
| settings |
object |
Configurações de tempo de execução para o trabalho de pipeline. |
| tags |
object |
As tags que serão aplicadas ao trabalho. |
BatchRetrySettings
Repita as configurações para uma operação de inferência em lote.
| Name | Tipo | Default value | Description |
|---|---|---|---|
| maxRetries |
integer (int32) |
3 |
Contagem máxima de tentativas para um minilote |
| timeout |
string (duration) |
PT30S |
Tempo limite de invocação para um minilote, no formato ISO 8601. |
CodeConfiguration
Configuração para um ativo de código de pontuação.
| Name | Tipo | Description |
|---|---|---|
| codeId |
string |
ID do recurso ARM do ativo de código. |
| scoringScript |
string minLength: 1pattern: [a-zA-Z0-9_] |
[Obrigatório] O script a ser executado na inicialização. eg. "score.py" |
createdByType
O tipo de identidade que criou o recurso.
| Valor | Description |
|---|---|
| User | |
| Application | |
| ManagedIdentity | |
| Key |
DataPathAssetReference
Referência a um ativo por meio de seu caminho em um armazenamento de dados.
| Name | Tipo | Description |
|---|---|---|
| datastoreId |
string |
ID do recurso ARM do armazenamento de dados onde o ativo está localizado. |
| path |
string |
O caminho do arquivo/diretório no armazenamento de dados. |
| referenceType |
string:
Data |
[Obrigatório] Especifica o tipo de referência de ativo. |
DeploymentProvisioningState
Valores possíveis para DeploymentProvisioningState.
| Valor | Description |
|---|---|
| Creating | |
| Deleting | |
| Scaling | |
| Updating | |
| Succeeded | |
| Failed | |
| Canceled |
DeploymentResourceConfiguration
| Name | Tipo | Default value | Description |
|---|---|---|---|
| instanceCount |
integer (int32) |
1 |
Número opcional de instâncias ou nós usados pelo destino de computação. |
| instanceType |
string |
Tipo opcional de VM usado conforme suportado pelo destino de computação. |
|
| properties |
Saco de propriedades adicionais. |
ErrorAdditionalInfo
O erro de gerenciamento de recursos informações adicionais.
| Name | Tipo | Description |
|---|---|---|
| info |
object |
As informações adicionais. |
| type |
string |
O tipo de informação adicional. |
ErrorDetail
O detalhe do erro.
| Name | Tipo | Description |
|---|---|---|
| additionalInfo |
O erro informações adicionais. |
|
| code |
string |
O código de erro. |
| details |
Os detalhes do erro. |
|
| message |
string |
A mensagem de erro. |
| target |
string |
O destino do erro. |
ErrorResponse
Resposta de erro
| Name | Tipo | Description |
|---|---|---|
| error |
O objeto de erro. |
IdAssetReference
Referência a um ativo através do seu ID de recurso ARM.
| Name | Tipo | Description |
|---|---|---|
| assetId |
string minLength: 1pattern: [a-zA-Z0-9_] |
[Obrigatório] ID do recurso ARM do ativo. |
| referenceType |
string:
Id |
[Obrigatório] Especifica o tipo de referência de ativo. |
ManagedServiceIdentity
Identidade do serviço gerenciado (identidades atribuídas pelo sistema e/ou pelo usuário)
| Name | Tipo | Description |
|---|---|---|
| principalId |
string (uuid) |
O ID da entidade de serviço da identidade atribuída ao sistema. Esta propriedade só será fornecida para uma identidade atribuída ao sistema. |
| tenantId |
string (uuid) |
O ID do locatário da identidade atribuída ao sistema. Esta propriedade só será fornecida para uma identidade atribuída ao sistema. |
| type |
Tipo de identidade de serviço gerenciado (onde os tipos SystemAssigned e UserAssigned são permitidos). |
|
| userAssignedIdentities |
<string,
User |
User-Assigned Identidades |
ManagedServiceIdentityType
Tipo de identidade de serviço gerenciado (onde os tipos SystemAssigned e UserAssigned são permitidos).
| Valor | Description |
|---|---|
| None | |
| SystemAssigned | |
| UserAssigned | |
| SystemAssigned,UserAssigned |
OutputPathAssetReference
Referência a um ativo através de seu caminho em uma saída de trabalho.
| Name | Tipo | Description |
|---|---|---|
| jobId |
string |
ID do recurso ARM do trabalho. |
| path |
string |
O caminho do arquivo/diretório na saída do trabalho. |
| referenceType |
string:
Output |
[Obrigatório] Especifica o tipo de referência de ativo. |
PartialBatchDeployment
Configurações de inferência em lote mutáveis por implantação.
| Name | Tipo | Description |
|---|---|---|
| description |
string |
Descrição da implantação do ponto de extremidade. |
PartialBatchDeploymentPartialMinimalTrackedResourceWithProperties
Estritamente utilizado em pedidos de atualização.
| Name | Tipo | Description |
|---|---|---|
| properties |
Atributos adicionais da entidade. |
|
| tags |
object |
Tags de recursos. |
ReferenceType
Enum para determinar qual método de referência usar para um ativo.
| Valor | Description |
|---|---|
| Id | |
| DataPath | |
| OutputPath |
Sku
A definição do modelo de recursos que representa a SKU
| Name | Tipo | Description |
|---|---|---|
| capacity |
integer (int32) |
Se a SKU suportar scaleout/in, o inteiro de capacidade deve ser incluído. Se a expansão/entrada não for possível para o recurso, isso poderá ser omitido. |
| family |
string |
Se o serviço tiver diferentes gerações de hardware, para o mesmo SKU, isso pode ser capturado aqui. |
| name |
string |
O nome do SKU. Ex - P3. Normalmente, é um código de letra + número |
| size |
string |
O tamanho do SKU. Quando o campo de nome é a combinação de camada e algum outro valor, este seria o código autônomo. |
| tier |
Este campo deve ser implementado pelo Provedor de Recursos se o serviço tiver mais de uma camada, mas não é obrigatório em um PUT. |
SkuTier
Este campo deve ser implementado pelo Provedor de Recursos se o serviço tiver mais de uma camada, mas não é obrigatório em um PUT.
| Valor | Description |
|---|---|
| Free | |
| Basic | |
| Standard | |
| Premium |
systemData
Metadados referentes à criação e última modificação do recurso.
| Name | Tipo | Description |
|---|---|---|
| createdAt |
string (date-time) |
O carimbo de data/hora da criação de recursos (UTC). |
| createdBy |
string |
A identidade que criou o recurso. |
| createdByType |
O tipo de identidade que criou o recurso. |
|
| lastModifiedAt |
string (date-time) |
O carimbo de data/hora da última modificação do recurso (UTC) |
| lastModifiedBy |
string |
A identidade que modificou o recurso pela última vez. |
| lastModifiedByType |
O tipo de identidade que modificou o recurso pela última vez. |
UserAssignedIdentity
Propriedades de identidade atribuídas pelo usuário
| Name | Tipo | Description |
|---|---|---|
| clientId |
string (uuid) |
O ID do cliente da identidade atribuída. |
| principalId |
string (uuid) |
O ID principal da identidade atribuída. |