通过


你当前正在访问 Microsoft Azure Global Edition 技术文档网站。 如果需要访问由世纪互联运营的 Microsoft Azure 中国技术文档网站,请访问 https://docs.azure.cn

Jobs - Create Or Update

创建并执行作业。 对于更新情况,传入的定义中的 Tags 将替换现有作业中的 Tags。
创建并执行作业。 对于更新情况,传入的定义中的 Tags 将替换现有作业中的 Tags。

PUT https://management.azure.com/subscriptions/{subscriptionId}/resourceGroups/{resourceGroupName}/providers/Microsoft.MachineLearningServices/workspaces/{workspaceName}/jobs/{id}?api-version=2025-12-01

URI 参数

名称 必需 类型 说明
id
path True

string

作业的名称和标识符。 这是区分大小写的。

resourceGroupName
path True

string

minLength: 1
maxLength: 90

资源组的名称。 此名称不区分大小写。

subscriptionId
path True

string

minLength: 1

目标订阅的 ID。

workspaceName
path True

string

pattern: ^[a-zA-Z0-9][a-zA-Z0-9_-]{2,32}$

Azure 机器学习工作区名称

api-version
query True

string

minLength: 1

要用于此操作的 API 版本。

请求正文

名称 必需 类型 说明
properties True JobBaseProperties:

[必需]实体的其他属性。

响应

名称 类型 说明
200 OK

JobBase

资源“JobBase”更新作成功

201 Created

JobBase

资源“JobBase”创建作成功

Other Status Codes

ErrorResponse

意外错误响应。

安全性

azure_auth

Azure Active Directory OAuth2 流。

类型: oauth2
流向: implicit
授权 URL: https://login.microsoftonline.com/common/oauth2/authorize

作用域

名称 说明
user_impersonation 模拟用户帐户

示例

CreateOrUpdate AutoML Job.
CreateOrUpdate Command Job.
CreateOrUpdate Pipeline Job.
CreateOrUpdate Sweep Job.

CreateOrUpdate AutoML Job.

示例请求

PUT https://management.azure.com/subscriptions/00000000-1111-2222-3333-444444444444/resourceGroups/test-rg/providers/Microsoft.MachineLearningServices/workspaces/my-aml-workspace/jobs/string?api-version=2025-12-01

{
  "properties": {
    "description": "string",
    "computeId": "string",
    "displayName": "string",
    "environmentId": "string",
    "environmentVariables": {
      "string": "string"
    },
    "experimentName": "string",
    "identity": {
      "identityType": "AMLToken"
    },
    "isArchived": false,
    "jobType": "AutoML",
    "outputs": {
      "string": {
        "description": "string",
        "jobOutputType": "uri_file",
        "mode": "ReadWriteMount",
        "uri": "string"
      }
    },
    "properties": {
      "string": "string"
    },
    "resources": {
      "instanceCount": 1,
      "instanceType": "string",
      "properties": {
        "string": {
          "9bec0ab0-c62f-4fa9-a97c-7b24bbcc90ad": null
        }
      }
    },
    "services": {
      "string": {
        "endpoint": "string",
        "jobServiceType": "string",
        "port": 1,
        "properties": {
          "string": "string"
        }
      }
    },
    "tags": {
      "string": "string"
    },
    "taskDetails": {
      "limitSettings": {
        "maxTrials": 2
      },
      "modelSettings": {
        "validationCropSize": 2
      },
      "searchSpace": [
        {
          "validationCropSize": "choice(2, 360)"
        }
      ],
      "targetColumnName": "string",
      "taskType": "ImageClassification",
      "trainingData": {
        "jobInputType": "mltable",
        "uri": "string"
      }
    }
  }
}

示例响应

{
  "name": "string",
  "type": "string",
  "id": "string",
  "properties": {
    "description": "string",
    "computeId": "string",
    "displayName": "string",
    "environmentId": "string",
    "environmentVariables": {
      "string": "string"
    },
    "experimentName": "string",
    "identity": {
      "identityType": "AMLToken"
    },
    "isArchived": false,
    "jobType": "AutoML",
    "outputs": {
      "string": {
        "description": "string",
        "jobOutputType": "uri_file",
        "mode": "ReadWriteMount",
        "uri": "string"
      }
    },
    "properties": {
      "string": "string"
    },
    "resources": {
      "instanceCount": 1,
      "instanceType": "string",
      "properties": {
        "string": {
          "9bec0ab0-c62f-4fa9-a97c-7b24bbcc90ad": null
        }
      }
    },
    "services": {
      "string": {
        "endpoint": "string",
        "errorMessage": "string",
        "jobServiceType": "string",
        "port": 1,
        "properties": {
          "string": "string"
        },
        "status": "string"
      }
    },
    "status": "Scheduled",
    "tags": {
      "string": "string"
    },
    "taskDetails": {
      "limitSettings": {
        "maxTrials": 2
      },
      "modelSettings": {
        "validationCropSize": 2
      },
      "searchSpace": [
        {
          "validationCropSize": "choice(2, 360)"
        }
      ],
      "targetColumnName": "string",
      "taskType": "ImageClassification",
      "trainingData": {
        "jobInputType": "mltable",
        "uri": "string"
      }
    }
  },
  "systemData": {
    "createdAt": "2020-01-01T12:34:56.999Z",
    "createdBy": "string",
    "createdByType": "User",
    "lastModifiedAt": "2020-01-01T12:34:56.999Z",
    "lastModifiedBy": "string",
    "lastModifiedByType": "ManagedIdentity"
  }
}
{
  "name": "string",
  "type": "string",
  "id": "string",
  "properties": {
    "description": "string",
    "computeId": "string",
    "displayName": "string",
    "environmentId": "string",
    "environmentVariables": {
      "string": "string"
    },
    "experimentName": "string",
    "identity": {
      "identityType": "AMLToken"
    },
    "isArchived": false,
    "jobType": "AutoML",
    "outputs": {
      "string": {
        "description": "string",
        "jobOutputType": "uri_file",
        "mode": "ReadWriteMount",
        "uri": "string"
      }
    },
    "properties": {
      "string": "string"
    },
    "resources": {
      "instanceCount": 1,
      "instanceType": "string",
      "properties": {
        "string": {
          "9bec0ab0-c62f-4fa9-a97c-7b24bbcc90ad": null
        }
      }
    },
    "services": {
      "string": {
        "endpoint": "string",
        "errorMessage": "string",
        "jobServiceType": "string",
        "port": 1,
        "properties": {
          "string": "string"
        },
        "status": "string"
      }
    },
    "status": "Scheduled",
    "tags": {
      "string": "string"
    },
    "taskDetails": {
      "limitSettings": {
        "maxTrials": 2
      },
      "modelSettings": {
        "validationCropSize": 2
      },
      "searchSpace": [
        {
          "validationCropSize": "choice(2, 360)"
        }
      ],
      "targetColumnName": "string",
      "taskType": "ImageClassification",
      "trainingData": {
        "jobInputType": "mltable",
        "uri": "string"
      }
    }
  },
  "systemData": {
    "createdAt": "2020-01-01T12:34:56.999Z",
    "createdBy": "string",
    "createdByType": "User",
    "lastModifiedAt": "2020-01-01T12:34:56.999Z",
    "lastModifiedBy": "string",
    "lastModifiedByType": "ManagedIdentity"
  }
}

CreateOrUpdate Command Job.

示例请求

PUT https://management.azure.com/subscriptions/00000000-1111-2222-3333-444444444444/resourceGroups/test-rg/providers/Microsoft.MachineLearningServices/workspaces/my-aml-workspace/jobs/string?api-version=2025-12-01

{
  "properties": {
    "description": "string",
    "codeId": "string",
    "command": "string",
    "computeId": "string",
    "displayName": "string",
    "distribution": {
      "distributionType": "TensorFlow",
      "parameterServerCount": 1,
      "workerCount": 1
    },
    "environmentId": "string",
    "environmentVariables": {
      "string": "string"
    },
    "experimentName": "string",
    "identity": {
      "identityType": "AMLToken"
    },
    "inputs": {
      "string": {
        "description": "string",
        "jobInputType": "literal",
        "value": "string"
      }
    },
    "jobType": "Command",
    "limits": {
      "jobLimitsType": "Command",
      "timeout": "PT5M"
    },
    "outputs": {
      "string": {
        "description": "string",
        "jobOutputType": "uri_file",
        "mode": "ReadWriteMount",
        "uri": "string"
      }
    },
    "properties": {
      "string": "string"
    },
    "resources": {
      "instanceCount": 1,
      "instanceType": "string",
      "properties": {
        "string": {
          "e6b6493e-7d5e-4db3-be1e-306ec641327e": null
        }
      }
    },
    "services": {
      "string": {
        "endpoint": "string",
        "jobServiceType": "string",
        "port": 1,
        "properties": {
          "string": "string"
        }
      }
    },
    "tags": {
      "string": "string"
    }
  }
}

示例响应

{
  "name": "string",
  "type": "string",
  "id": "string",
  "properties": {
    "description": "string",
    "codeId": "string",
    "command": "string",
    "computeId": "string",
    "displayName": "string",
    "distribution": {
      "distributionType": "TensorFlow",
      "parameterServerCount": 1,
      "workerCount": 1
    },
    "environmentId": "string",
    "environmentVariables": {
      "string": "string"
    },
    "experimentName": "string",
    "identity": {
      "identityType": "AMLToken"
    },
    "inputs": {
      "string": {
        "description": "string",
        "jobInputType": "literal",
        "value": "string"
      }
    },
    "jobType": "Command",
    "limits": {
      "jobLimitsType": "Command",
      "timeout": "PT5M"
    },
    "outputs": {
      "string": {
        "description": "string",
        "jobOutputType": "uri_file",
        "mode": "ReadWriteMount",
        "uri": "string"
      }
    },
    "parameters": {
      "string": "string"
    },
    "properties": {
      "string": "string"
    },
    "resources": {
      "instanceCount": 1,
      "instanceType": "string",
      "properties": {
        "string": {
          "a0847709-f5aa-4561-8ba5-d915d403fdcf": null
        }
      }
    },
    "services": {
      "string": {
        "endpoint": "string",
        "errorMessage": "string",
        "jobServiceType": "string",
        "port": 1,
        "properties": {
          "string": "string"
        },
        "status": "string"
      }
    },
    "status": "NotStarted",
    "tags": {
      "string": "string"
    }
  },
  "systemData": {
    "createdAt": "2020-01-01T12:34:56.999Z",
    "createdBy": "string",
    "createdByType": "User",
    "lastModifiedAt": "2020-01-01T12:34:56.999Z",
    "lastModifiedBy": "string",
    "lastModifiedByType": "User"
  }
}
{
  "name": "string",
  "type": "string",
  "id": "string",
  "properties": {
    "description": "string",
    "codeId": "string",
    "command": "string",
    "computeId": "string",
    "displayName": "string",
    "distribution": {
      "distributionType": "TensorFlow",
      "parameterServerCount": 1,
      "workerCount": 1
    },
    "environmentId": "string",
    "environmentVariables": {
      "string": "string"
    },
    "experimentName": "string",
    "identity": {
      "identityType": "AMLToken"
    },
    "inputs": {
      "string": {
        "description": "string",
        "jobInputType": "literal",
        "value": "string"
      }
    },
    "jobType": "Command",
    "limits": {
      "jobLimitsType": "Command",
      "timeout": "PT5M"
    },
    "outputs": {
      "string": {
        "description": "string",
        "jobOutputType": "uri_file",
        "mode": "ReadWriteMount",
        "uri": "string"
      }
    },
    "parameters": {
      "string": "string"
    },
    "properties": {
      "string": "string"
    },
    "resources": {
      "instanceCount": 1,
      "instanceType": "string",
      "properties": {
        "string": {
          "b8163d40-c351-43d6-8a34-d0cd895b8a5a": null
        }
      }
    },
    "services": {
      "string": {
        "endpoint": "string",
        "errorMessage": "string",
        "jobServiceType": "string",
        "port": 1,
        "properties": {
          "string": "string"
        },
        "status": "string"
      }
    },
    "status": "NotStarted",
    "tags": {
      "string": "string"
    }
  },
  "systemData": {
    "createdAt": "2020-01-01T12:34:56.999Z",
    "createdBy": "string",
    "createdByType": "User",
    "lastModifiedAt": "2020-01-01T12:34:56.999Z",
    "lastModifiedBy": "string",
    "lastModifiedByType": "User"
  }
}

CreateOrUpdate Pipeline Job.

示例请求

PUT https://management.azure.com/subscriptions/00000000-1111-2222-3333-444444444444/resourceGroups/test-rg/providers/Microsoft.MachineLearningServices/workspaces/my-aml-workspace/jobs/string?api-version=2025-12-01

{
  "properties": {
    "description": "string",
    "computeId": "string",
    "displayName": "string",
    "experimentName": "string",
    "inputs": {
      "string": {
        "description": "string",
        "jobInputType": "literal",
        "value": "string"
      }
    },
    "jobType": "Pipeline",
    "outputs": {
      "string": {
        "description": "string",
        "jobOutputType": "uri_file",
        "mode": "Upload",
        "uri": "string"
      }
    },
    "properties": {
      "string": "string"
    },
    "services": {
      "string": {
        "endpoint": "string",
        "jobServiceType": "string",
        "port": 1,
        "properties": {
          "string": "string"
        }
      }
    },
    "settings": {},
    "tags": {
      "string": "string"
    }
  }
}

示例响应

{
  "name": "string",
  "type": "string",
  "id": "string",
  "properties": {
    "description": "string",
    "computeId": "string",
    "displayName": "string",
    "experimentName": "string",
    "inputs": {
      "string": {
        "description": "string",
        "jobInputType": "literal",
        "value": "string"
      }
    },
    "jobType": "Pipeline",
    "outputs": {
      "string": {
        "description": "string",
        "jobOutputType": "uri_file",
        "mode": "Upload",
        "uri": "string"
      }
    },
    "properties": {
      "string": "string"
    },
    "services": {
      "string": {
        "endpoint": "string",
        "errorMessage": "string",
        "jobServiceType": "string",
        "port": 1,
        "properties": {
          "string": "string"
        },
        "status": "string"
      }
    },
    "settings": {},
    "status": "NotStarted",
    "tags": {
      "string": "string"
    }
  },
  "systemData": {
    "createdAt": "2020-01-01T12:34:56.999Z",
    "createdBy": "string",
    "createdByType": "User",
    "lastModifiedAt": "2020-01-01T12:34:56.999Z",
    "lastModifiedBy": "string",
    "lastModifiedByType": "User"
  }
}
{
  "name": "string",
  "type": "string",
  "id": "string",
  "properties": {
    "description": "string",
    "computeId": "string",
    "displayName": "string",
    "experimentName": "string",
    "inputs": {
      "string": {
        "description": "string",
        "jobInputType": "literal",
        "value": "string"
      }
    },
    "jobType": "Pipeline",
    "outputs": {
      "string": {
        "description": "string",
        "jobOutputType": "uri_file",
        "mode": "Upload",
        "uri": "string"
      }
    },
    "properties": {
      "string": "string"
    },
    "services": {
      "string": {
        "endpoint": "string",
        "errorMessage": "string",
        "jobServiceType": "string",
        "port": 1,
        "properties": {
          "string": "string"
        },
        "status": "string"
      }
    },
    "settings": {},
    "status": "NotStarted",
    "tags": {
      "string": "string"
    }
  },
  "systemData": {
    "createdAt": "2020-01-01T12:34:56.999Z",
    "createdBy": "string",
    "createdByType": "User",
    "lastModifiedAt": "2020-01-01T12:34:56.999Z",
    "lastModifiedBy": "string",
    "lastModifiedByType": "User"
  }
}

CreateOrUpdate Sweep Job.

示例请求

PUT https://management.azure.com/subscriptions/00000000-1111-2222-3333-444444444444/resourceGroups/test-rg/providers/Microsoft.MachineLearningServices/workspaces/my-aml-workspace/jobs/string?api-version=2025-12-01

{
  "properties": {
    "description": "string",
    "computeId": "string",
    "displayName": "string",
    "earlyTermination": {
      "delayEvaluation": 1,
      "evaluationInterval": 1,
      "policyType": "MedianStopping"
    },
    "experimentName": "string",
    "jobType": "Sweep",
    "limits": {
      "jobLimitsType": "Sweep",
      "maxConcurrentTrials": 1,
      "maxTotalTrials": 1,
      "trialTimeout": "PT1S"
    },
    "objective": {
      "goal": "Minimize",
      "primaryMetric": "string"
    },
    "properties": {
      "string": "string"
    },
    "samplingAlgorithm": {
      "samplingAlgorithmType": "Grid"
    },
    "searchSpace": {
      "string": {}
    },
    "services": {
      "string": {
        "endpoint": "string",
        "jobServiceType": "string",
        "port": 1,
        "properties": {
          "string": "string"
        }
      }
    },
    "tags": {
      "string": "string"
    },
    "trial": {
      "codeId": "string",
      "command": "string",
      "distribution": {
        "distributionType": "Mpi",
        "processCountPerInstance": 1
      },
      "environmentId": "string",
      "environmentVariables": {
        "string": "string"
      },
      "resources": {
        "instanceCount": 1,
        "instanceType": "string",
        "properties": {
          "string": {
            "e6b6493e-7d5e-4db3-be1e-306ec641327e": null
          }
        }
      }
    }
  }
}

示例响应

{
  "name": "string",
  "type": "string",
  "id": "string",
  "properties": {
    "description": "string",
    "computeId": "string",
    "displayName": "string",
    "earlyTermination": {
      "delayEvaluation": 1,
      "evaluationInterval": 1,
      "policyType": "MedianStopping"
    },
    "experimentName": "string",
    "jobType": "Sweep",
    "limits": {
      "jobLimitsType": "Sweep",
      "maxConcurrentTrials": 1,
      "maxTotalTrials": 1,
      "trialTimeout": "PT1S"
    },
    "objective": {
      "goal": "Minimize",
      "primaryMetric": "string"
    },
    "properties": {
      "string": "string"
    },
    "samplingAlgorithm": {
      "samplingAlgorithmType": "Grid"
    },
    "searchSpace": {
      "string": {}
    },
    "services": {
      "string": {
        "endpoint": "string",
        "errorMessage": "string",
        "jobServiceType": "string",
        "port": 1,
        "properties": {
          "string": "string"
        },
        "status": "string"
      }
    },
    "status": "NotStarted",
    "tags": {
      "string": "string"
    },
    "trial": {
      "codeId": "string",
      "command": "string",
      "distribution": {
        "distributionType": "Mpi",
        "processCountPerInstance": 1
      },
      "environmentId": "string",
      "environmentVariables": {
        "string": "string"
      },
      "resources": {
        "instanceCount": 1,
        "instanceType": "string",
        "properties": {
          "string": {
            "e6b6493e-7d5e-4db3-be1e-306ec641327e": null
          }
        }
      }
    }
  },
  "systemData": {
    "createdAt": "2020-01-01T12:34:56.999Z",
    "createdBy": "string",
    "createdByType": "User",
    "lastModifiedAt": "2020-01-01T12:34:56.999Z",
    "lastModifiedBy": "string",
    "lastModifiedByType": "User"
  }
}
{
  "name": "string",
  "type": "string",
  "id": "string",
  "properties": {
    "description": "string",
    "computeId": "string",
    "displayName": "string",
    "earlyTermination": {
      "delayEvaluation": 1,
      "evaluationInterval": 1,
      "policyType": "MedianStopping"
    },
    "experimentName": "string",
    "jobType": "Sweep",
    "limits": {
      "jobLimitsType": "Sweep",
      "maxConcurrentTrials": 1,
      "maxTotalTrials": 1,
      "trialTimeout": "PT1S"
    },
    "objective": {
      "goal": "Minimize",
      "primaryMetric": "string"
    },
    "properties": {
      "string": "string"
    },
    "samplingAlgorithm": {
      "samplingAlgorithmType": "Grid"
    },
    "searchSpace": {
      "string": {}
    },
    "services": {
      "string": {
        "endpoint": "string",
        "errorMessage": "string",
        "jobServiceType": "string",
        "port": 1,
        "properties": {
          "string": "string"
        },
        "status": "string"
      }
    },
    "status": "NotStarted",
    "tags": {
      "string": "string"
    },
    "trial": {
      "codeId": "string",
      "command": "string",
      "distribution": {
        "distributionType": "Mpi",
        "processCountPerInstance": 1
      },
      "environmentId": "string",
      "environmentVariables": {
        "string": "string"
      },
      "resources": {
        "instanceCount": 1,
        "instanceType": "string",
        "properties": {
          "string": {
            "e6b6493e-7d5e-4db3-be1e-306ec641327e": null
          }
        }
      }
    }
  },
  "systemData": {
    "createdAt": "2020-01-01T12:34:56.999Z",
    "createdBy": "string",
    "createdByType": "User",
    "lastModifiedAt": "2020-01-01T12:34:56.999Z",
    "lastModifiedBy": "string",
    "lastModifiedByType": "User"
  }
}

定义

名称 说明
AllNodes

所有节点表示服务将在作业的所有节点上运行

AmlToken

AML 令牌身份配置。

AutoForecastHorizon

由系统自动确定的预测范围。

AutoMLJob

AutoMLJob 类。 使用此类执行 AutoML 任务,如分类/回归等。有关支持的所有任务,请参阅 TaskType 枚举。

AutoNCrossValidations

自动确定 N-Cross 验证。

AutoSeasonality
AutoTargetLags
AutoTargetRollingWindowSize

目标滞后滚动窗口自动确定。

AzureDevOpsWebhook

特定于 Azure DevOps 的 Webhook 详细信息

BanditPolicy

根据松弛标准定义提前终止策略,以及用于评估的频率和延迟间隔

BayesianSamplingAlgorithm

定义一个采样算法,该算法根据以前的值生成值

BlockedTransformers

AutoML 支持的所有分类模型的枚举。

Classification

AutoML Table 垂直中的分类任务。

ClassificationModels

AutoML 支持的所有分类模型的枚举。

ClassificationMultilabelPrimaryMetrics

分类多标签任务的主要指标。

ClassificationPrimaryMetrics

分类任务的主要指标。

ClassificationTrainingSettings

分类训练相关配置。

CommandJob

命令作业定义。

CommandJobLimits

命令作业限制类。

createdByType

创建资源的标识的类型。

CustomForecastHorizon

所需最大预测范围(以时序频率单位为单位)。

CustomModelJobInput
CustomModelJobOutput
CustomNCrossValidations

N-Cross 验证由用户指定。

CustomSeasonality
CustomTargetLags
CustomTargetRollingWindowSize
DistributionType

枚举以确定作业分布类型。

EarlyTerminationPolicyType
EmailNotificationEnableType

枚举以确定电子邮件通知类型。

ErrorAdditionalInfo

资源管理错误附加信息。

ErrorDetail

错误详细信息。

ErrorResponse

错误响应

FeatureLags

用于为数值特征生成滞后的标志。

FeaturizationMode

特征化模式 - 用户可以保留默认的“自动”模式,AutoML 将负责在特征化阶段对数据进行必要的转换。 如果选择了“关闭”,则不会完成特征化。 如果选择“自定义”,则用户可以指定其他输入以自定义特征化完成方式。

ForecastHorizonMode

枚举以确定预测范围选择模式。

Forecasting

AutoML Table 垂直中的预测任务。

ForecastingModels

AutoML 支持的所有预测模型的枚举。

ForecastingPrimaryMetrics

预测任务的主要指标。

ForecastingSettings

预测特定参数。

ForecastingTrainingSettings

预测培训相关配置。

Goal

定义超参数优化支持的指标目标

GridSamplingAlgorithm

定义一个采样算法,该算法详尽地生成空间中的每个值组合

IdentityConfigurationType

枚举来确定标识框架。

ImageClassification

图像分类。 当图像仅使用一组类中的单个标签进行分类时,使用多类图像分类 - 例如,每个图像被分类为“猫”或“狗”或“鸭子”的图像。

ImageClassificationMultilabel

图像分类多标签。 当图像可以具有一组标签中的一个或多个标签时,使用多标签图像分类 - 例如,图像可以同时标记为“猫”和“狗”。

ImageInstanceSegmentation

图像实例分割。 实例分割用于在像素级别识别图像中的对象,在图像中的每个对象周围绘制一个多边形。

ImageLimitSettings

限制 AutoML 作业的设置。

ImageModelDistributionSettingsClassification

用于扫描模型设置值的分布表达式。 <示例> 一些例子是:

ModelName = "choice('seresnext', 'resnest50')";
LearningRate = "uniform(0.001, 0.01)";
LayersToFreeze = "choice(0, 2)";
```</example>
For more details on how to compose distribution expressions please check the documentation:
https://docs.microsoft.com/en-us/azure/machine-learning/how-to-tune-hyperparameters
For more information on the available settings please visit the official documentation:
https://docs.microsoft.com/en-us/azure/machine-learning/how-to-auto-train-image-models.
ImageModelDistributionSettingsObjectDetection

用于扫描模型设置值的分布表达式。 <示例> 一些例子是:

ModelName = "choice('seresnext', 'resnest50')";
LearningRate = "uniform(0.001, 0.01)";
LayersToFreeze = "choice(0, 2)";
```</example>
For more details on how to compose distribution expressions please check the documentation:
https://docs.microsoft.com/en-us/azure/machine-learning/how-to-tune-hyperparameters
For more information on the available settings please visit the official documentation:
https://docs.microsoft.com/en-us/azure/machine-learning/how-to-auto-train-image-models.
ImageModelSettingsClassification

用于训练模型的设置。 有关可用设置的更多信息,请访问官方文档: https://docs.microsoft.com/en-us/azure/machine-learning/how-to-auto-train-image-models

ImageModelSettingsObjectDetection

用于训练模型的设置。 有关可用设置的更多信息,请访问官方文档: https://docs.microsoft.com/en-us/azure/machine-learning/how-to-auto-train-image-models

ImageObjectDetection

图像对象检测。 对象检测用于识别图像中的对象并使用边界框定位每个对象,例如定位图像中的所有狗和猫,并在每个对象周围绘制一个边界框。

ImageSweepSettings

模型扫描和超参数扫描相关设置。

InputDeliveryMode

枚举以确定输入数据传递模式。

InstanceSegmentationPrimaryMetrics

InstanceSegmentation 任务的主要指标。

JobBase

Azure 资源管理器资源信封。

JobInputType

枚举以确定作业输入类型。

JobLimitsType
JobOutputType

枚举以确定作业输出类型。

JobResourceConfiguration
JobService

作业端点定义

JobStatus

作业的状态。

JobTier

用于确定作业层的枚举。

JobType

枚举以确定作业类型。

LearningRateScheduler

学习率调度程序枚举。

LiteralJobInput

文字输入类型。

LogVerbosity

用于设置日志详细程度的枚举。

ManagedIdentity

托管标识配置。

MedianStoppingPolicy

根据所有运行的主要指标的运行平均值定义提前终止策略

MLFlowModelJobInput
MLFlowModelJobOutput
MLTableJobInput
MLTableJobOutput
ModelSize

图像模型大小。

Mpi

MPI 分发配置。

NCrossValidationsMode

确定如何确定 N-Cross 验证值。

NlpVerticalFeaturizationSettings
NlpVerticalLimitSettings

作业执行约束。

NodesValueType

节点值的枚举类型

NotificationSetting

通知的配置。

ObjectDetectionPrimaryMetrics

图像对象检测任务的主要指标。

Objective

优化目标。

OutputDeliveryMode

输出数据传递模式枚举。

PipelineJob

管道作业定义:定义通用到 MFE 属性。

PyTorch

PyTorch 分发配置。

QueueSettings
RandomSamplingAlgorithm

定义随机生成值的采样算法

RandomSamplingAlgorithmRule

随机算法的特定类型

Regression

AutoML Table 垂直中的回归任务。

RegressionModels

AutoML 支持的所有回归模型的枚举。

RegressionPrimaryMetrics

回归任务的主要指标。

RegressionTrainingSettings

回归训练相关配置。

SamplingAlgorithmType
SeasonalityMode

预测季节性模式。

ShortSeriesHandlingConfiguration

定义 AutoML 如何处理短时序的参数。

SparkJob

Spark 作业定义。

SparkJobEntryType
SparkJobPythonEntry
SparkJobScalaEntry
SparkResourceConfiguration
StackEnsembleSettings

用于自定义 StackEnsemble 运行的高级设置。

StackMetaLearnerType

元学习器是一个基于各个异构模型输出训练的模型。\r\n默认的元学习器是用于分类任务的LogisticRegression(如果启用交叉验证则用LogisticRegressionCV),用于回归/预测任务的ElasticNet(或启用交叉验证则用ElasticNetCV)。\r\n该参数可以是以下字符串之一:LogisticRegression、LogisticRegressionCV、LightGBMClassifier、ElasticNet、ElasticNetCV、LightGBMRegressor 或 LinearRegression

StochasticOptimizer

图像模型的随机优化器。

SweepJob

扫描作业定义。

SweepJobLimits

扫描作业限制类。

systemData

与创建和上次修改资源相关的元数据。

TableVerticalFeaturizationSettings

特征化配置。

TableVerticalLimitSettings

作业执行约束。

TargetAggregationFunction

目标聚合函数。

TargetLagsMode

目标滞后选择模式。

TargetRollingWindowSizeMode

目标滚动窗口大小模式。

TaskType

AutoMLJob 任务类型。

TensorFlow

TensorFlow 分布配置。

TextClassification

AutoML NLP 垂直版中的文本分类任务。 NLP - 自然语言处理。

TextClassificationMultilabel

AutoML NLP 垂直领域的文本分类多标签任务。 NLP - 自然语言处理。

TextNer

AutoML NLP 垂直 Text-NER 任务。 NER - 命名实体识别。 NLP - 自然语言处理。

TrialComponent

试用组件定义。

TritonModelJobInput
TritonModelJobOutput
TruncationSelectionPolicy

定义提前终止策略,该策略在每个评估间隔内取消给定百分比的运行。

UriFileJobInput
UriFileJobOutput
UriFolderJobInput
UriFolderJobOutput
UserIdentity

用户标识配置。

UseStl

配置时序目标列的 STL 分解。

ValidationMetricType

用于图像任务中验证指标的指标计算方法。

WebhookType

枚举来确定 Webhook 回调服务类型。

AllNodes

所有节点表示服务将在作业的所有节点上运行

名称 类型 说明
nodesValueType string:

All

[必需]Nodes 值的类型

AmlToken

AML 令牌身份配置。

名称 类型 说明
identityType string:

AMLToken

[必需]指定标识框架的类型。

AutoForecastHorizon

由系统自动确定的预测范围。

名称 类型 说明
mode string:

Auto

[必需]设置预测地平线值选择模式。

AutoMLJob

AutoMLJob 类。 使用此类执行 AutoML 任务,如分类/回归等。有关支持的所有任务,请参阅 TaskType 枚举。

名称 类型 默认值 说明
componentId

string

组件资源的 ARM 资源 ID。

computeId

string

计算资源的 ARM 资源 ID。

description

string

资产说明文本。

displayName

string

作业的显示名称。

environmentId

string

作业的环境规范的 ARM 资源 ID。 这是一个可选值,如果未提供,AutoML 将在运行作业时将其默认为生产 AutoML 特选环境版本。

environmentVariables

object

作业中包含的环境变量。

experimentName

string

Default

作业所属的试验的名称。 如果未设置,作业将放置在“默认”试验中。

identity IdentityConfiguration:

标识配置。 如果已设置,则应为 AmlToken、ManagedIdentity、UserIdentity 或 null 之一。 如果为 null,则默认为 AmlToken。

isArchived

boolean

False

资产是否已存档?

jobType string:

AutoML

[必需]指定作业的类型。

notificationSetting

NotificationSetting

作业的通知设置

outputs

object

作业中使用的输出数据绑定的映射。

properties

object

资产属性字典。

queueSettings

QueueSettings

作业的队列设置

resources

JobResourceConfiguration

作业的计算资源配置。

services

<string,  JobService>

JobEndpoints 列表。 对于本地作业,作业终结点的终结点值为 FileStreamObject。

status

JobStatus

作业状态。

tags

object

标记字典。 可以添加、删除和更新标记。

taskDetails AutoMLVertical:

[必需]这表示可以是表/NLP/Image 之一的方案

AutoNCrossValidations

自动确定 N-Cross 验证。

名称 类型 说明
mode string:

Auto

[必需]用于确定 N 交叉验证的模式。

AutoSeasonality

名称 类型 说明
mode string:

Auto

[必需]季节性模式。

AutoTargetLags

名称 类型 说明
mode string:

Auto

[必需]设置目标滞后模式 - 自动/自定义

AutoTargetRollingWindowSize

目标滞后滚动窗口自动确定。

名称 类型 说明
mode string:

Auto

[必需]TargetRollingWindowSiz 检测模式。

AzureDevOpsWebhook

特定于 Azure DevOps 的 Webhook 详细信息

名称 类型 说明
eventType

string

对指定的通知事件发送回调

webhookType string:

AzureDevOps

[必需]指定要发送回调的服务的类型

BanditPolicy

根据松弛标准定义提前终止策略,以及用于评估的频率和延迟间隔

名称 类型 默认值 说明
delayEvaluation

integer (int32)

0

延迟第一次计算的间隔数。

evaluationInterval

integer (int32)

0

策略评估之间的间隔(运行数)。

policyType string:

Bandit

[必需]策略配置的名称

slackAmount

number (float)

0

从性能最佳的运行中允许的绝对距离。

slackFactor

number (float)

0

与性能最佳的运行距离的允许距离比率。

BayesianSamplingAlgorithm

定义一个采样算法,该算法根据以前的值生成值

名称 类型 说明
samplingAlgorithmType string:

Bayesian

[必需]用于生成超参数值的算法以及配置属性

BlockedTransformers

AutoML 支持的所有分类模型的枚举。

说明
TextTargetEncoder

文本数据的目标编码。

OneHotEncoder

Ohe 热编码创建二进制特征转换。

CatTargetEncoder

分类数据的目标编码。

TfIdf

Tf-Idf 代表术语-频率乘以反文档-频率。 这是用于从文档中识别信息的常用术语加权方案。

WoETargetEncoder

证据权重编码是一种用于编码分类变量的技术。 它使用 P(1)/P(0) 的自然对数来创建权重。

LabelEncoder

标签编码器以数字形式转换标签/分类变量。

WordEmbedding

单词嵌入有助于将单词或短语表示为向量或一系列数字。

NaiveBayes

朴素贝叶斯是一种分类,用于分类分布的离散特征的分类。

CountVectorizer

计数矢量化器将文本文档的集合转换为标记计数矩阵。

HashOneHotEncoder

对一个热编码器进行哈希处理可以将分类变量转换为有限数量的新功能。 这通常用于高基数分类特征。

Classification

AutoML Table 垂直中的分类任务。

名称 类型 默认值 说明
cvSplitColumnNames

string[]

用于 CVSplit 数据的列。

featurizationSettings

TableVerticalFeaturizationSettings

AutoML 作业所需的特征化输入。

limitSettings

TableVerticalLimitSettings

AutoMLJob 的执行约束。

logVerbosity

LogVerbosity

Info

用于设置日志详细程度的枚举。

nCrossValidations NCrossValidations:

未提供验证数据集时要应用于训练数据集的交叉验证折叠数。

positiveLabel

string

二进制指标计算的正标签。

primaryMetric

ClassificationPrimaryMetrics

AUCWeighted

分类任务的主要指标。

targetColumnName

string

目标列名称:这是预测值列。 也称为分类任务的上下文中的标签列名称。

taskType string:

Classification

[必需]AutoMLJob 的任务类型。

testData

MLTableJobInput

测试数据输入。

testDataSize

number (double)

需要为验证目的预留的测试数据集的分数。 介于 (0.0 , 1.0) 之间的值 未提供验证数据集时应用。

trainingData

MLTableJobInput

[必需]训练数据输入。

trainingSettings

ClassificationTrainingSettings

AutoML 作业训练阶段的输入。

validationData

MLTableJobInput

验证数据输入。

validationDataSize

number (double)

需要留出用于验证的定型数据集的分数。 介于 (0.0 , 1.0) 之间的值 未提供验证数据集时应用。

weightColumnName

string

示例权重列的名称。 自动化 ML 支持加权列作为输入,导致数据中的行向上或向下加权。

ClassificationModels

AutoML 支持的所有分类模型的枚举。

说明
LogisticRegression

逻辑回归是一种基本的分类技术。 它属于线性分类器组,有点类似于多项式和线性回归。 逻辑回归速度快,相对简单,方便您解释结果。 虽然它本质上是一种二元分类方法,但它也可以应用于多类问题。

SGD

SGD:随机梯度下降是一种优化算法,常用于机器学习应用,用于找到与预测输出和实际输出之间最佳拟合相对应的模型参数。

MultinomialNaiveBayes

多项朴素贝叶斯分类器适用于具有离散特征的分类(例如,文本分类的字数统计)。 多项式分布通常需要整数特征计数。 然而,在实践中,诸如 tf-idf 之类的小数计数也可能有效。

BernoulliNaiveBayes

多元伯努利模型的朴素贝叶斯分类器。

SVM

支持向量机 (SVM) 是一种监督机器学习模型,它使用分类算法来解决两组分类问题。 在为 SVM 模型提供每个类别的标记训练数据集后,他们能够对新文本进行分类。

LinearSVM

支持向量机 (SVM) 是一种监督机器学习模型,它使用分类算法来解决两组分类问题。 在为 SVM 模型提供每个类别的标记训练数据集后,他们能够对新文本进行分类。 当输入数据是线性的时,线性 SVM 的性能最佳,即可以通过在绘制的图形上绘制分类值之间的直线来轻松对数据进行分类。

KNN

K 最近邻 (KNN) 算法使用“特征相似性”来预测新数据点的值,这进一步意味着新数据点将根据它与训练集中点的匹配程度分配一个值。

DecisionTree

决策树是一种非参数监督学习方法,用于分类和回归任务。 目标是创建一个模型,通过学习从数据特征推断的简单决策规则来预测目标变量的值。

RandomForest

随机森林是一种监督学习算法。 它构建的“森林”是决策树的集合,通常使用“装袋”方法进行训练。 套袋方法的总体思路是学习模型的组合增加了整体结果。

ExtremeRandomTrees

Extreme Trees 是一种集成机器学习算法,它结合了许多决策树的预测。 它与广泛使用的随机森林算法有关。

LightGBM

LightGBM 是一个梯度提升框架,它使用基于树的学习算法。

GradientBoosting

将周学习者转变为强学习者的技术称为提升。 梯度提升算法过程基于这种执行理论。

XGBoostClassifier

XGBoost:极限梯度提升算法。 此算法用于结构化数据,其中目标列值可以划分为不同的类值。

ClassificationMultilabelPrimaryMetrics

分类多标签任务的主要指标。

说明
AUCWeighted

AUC 是曲线下面积。 该指标表示每个类的分数的算术平均值,按每个类中的真实实例数加权。

Accuracy

Accuracy 是与真实类标签完全匹配的预测比率。

NormMacroRecall

规范化宏召回率是对宏召回率进行规范化和平均化,因此,随机性能的评分为 0,完美性能的评分为 1。

AveragePrecisionScoreWeighted

每个类的平均精度分数的算术平均值,按每个类中的真实实例数加权。

PrecisionScoreWeighted

每个类的精度算术平均值,按每个类中的真实实例数加权。

IOU

交集越联合。 预测除以预测并集的交集。

ClassificationPrimaryMetrics

分类任务的主要指标。

说明
AUCWeighted

AUC 是曲线下面积。 该指标表示每个类的分数的算术平均值,按每个类中的真实实例数加权。

Accuracy

Accuracy 是与真实类标签完全匹配的预测比率。

NormMacroRecall

规范化宏召回率是对宏召回率进行规范化和平均化,因此,随机性能的评分为 0,完美性能的评分为 1。

AveragePrecisionScoreWeighted

每个类的平均精度分数的算术平均值,按每个类中的真实实例数加权。

PrecisionScoreWeighted

每个类的精度算术平均值,按每个类中的真实实例数加权。

ClassificationTrainingSettings

分类训练相关配置。

名称 类型 默认值 说明
allowedTrainingAlgorithms

ClassificationModels[]

分类任务的允许模型。

blockedTrainingAlgorithms

ClassificationModels[]

分类任务的阻止模型。

enableDnnTraining

boolean

False

启用 DNN 模型的建议。

enableModelExplainability

boolean

True

标志以在最佳模型上启用可解释性。

enableOnnxCompatibleModels

boolean

False

用于启用 onnx 兼容模型的标志。

enableStackEnsemble

boolean

True

启用堆栈合奏运行。

enableVoteEnsemble

boolean

True

启用投票合奏运行。

ensembleModelDownloadTimeout

string (duration)

PT5M

在 VotingEnsemble 和 StackEnsemble 模型生成期间,将下载先前子运行中的多个拟合模型。 如果需要更多时间,请将此参数配置为大于 300 秒的值。

stackEnsembleSettings

StackEnsembleSettings

堆栈合奏的堆栈合奏设置。

CommandJob

命令作业定义。

名称 类型 默认值 说明
codeId

string

代码资产的 ARM 资源 ID。

command

string

minLength: 1
pattern: [a-zA-Z0-9_]

[必需]在启动作业时执行的命令。 eg. “python train.py”

componentId

string

组件资源的 ARM 资源 ID。

computeId

string

计算资源的 ARM 资源 ID。

description

string

资产说明文本。

displayName

string

作业的显示名称。

distribution DistributionConfiguration:

作业的分发配置。 如果已设置,则应为 Mpi、Tensorflow、PyTorch 或 null 之一。

environmentId

string

minLength: 1
pattern: [a-zA-Z0-9_]

[必需]作业的环境规范的 ARM 资源 ID。

environmentVariables

object

作业中包含的环境变量。

experimentName

string

Default

作业所属的试验的名称。 如果未设置,作业将放置在“默认”试验中。

identity IdentityConfiguration:

标识配置。 如果已设置,则应为 AmlToken、ManagedIdentity、UserIdentity 或 null 之一。 如果为 null,则默认为 AmlToken。

inputs

object

作业中使用的输入数据绑定的映射。

isArchived

boolean

False

资产是否已存档?

jobType string:

Command

[必需]指定作业的类型。

limits

CommandJobLimits

命令作业限制。

notificationSetting

NotificationSetting

作业的通知设置

outputs

object

作业中使用的输出数据绑定的映射。

parameters

输入参数。

properties

object

资产属性字典。

queueSettings

QueueSettings

作业的队列设置

resources

JobResourceConfiguration

作业的计算资源配置。

services

<string,  JobService>

JobEndpoints 列表。 对于本地作业,作业终结点的终结点值为 FileStreamObject。

status

JobStatus

作业状态。

tags

object

标记字典。 可以添加、删除和更新标记。

CommandJobLimits

命令作业限制类。

名称 类型 说明
jobLimitsType string:

Command

[必需]JobLimit 类型。

timeout

string (duration)

ISO 8601 格式的最大运行持续时间,之后作业将被取消。 仅支持精度为秒的持续时间。

createdByType

创建资源的标识的类型。

说明
User
Application
ManagedIdentity
Key

CustomForecastHorizon

所需最大预测范围(以时序频率单位为单位)。

名称 类型 说明
mode string:

Custom

[必需]设置预测地平线值选择模式。

value

integer (int32)

[必需]预测地平线值。

CustomModelJobInput

名称 类型 默认值 说明
description

string

输入的说明。

jobInputType string:

custom_model

[必需]指定作业的类型。

mode

InputDeliveryMode

ReadOnlyMount

枚举以确定输入数据传递模式。

uri

string

minLength: 1
pattern: [a-zA-Z0-9_]

[必需]输入资产 URI。

CustomModelJobOutput

名称 类型 默认值 说明
assetName

string

输出资产名称。

description

string

输出的说明。

jobOutputType string:

custom_model

[必需]指定作业的类型。

mode

OutputDeliveryMode

ReadWriteMount

输出数据传递模式枚举。

uri

string

输出资产 URI。

CustomNCrossValidations

N-Cross 验证由用户指定。

名称 类型 说明
mode string:

Custom

[必需]用于确定 N 交叉验证的模式。

value

integer (int32)

[必需]N 交叉验证值。

CustomSeasonality

名称 类型 说明
mode string:

Custom

[必需]季节性模式。

value

integer (int32)

[必需]季节性值。

CustomTargetLags

名称 类型 说明
mode string:

Custom

[必需]设置目标滞后模式 - 自动/自定义

values

integer[] (int32)

[必需]设置目标滞后值。

CustomTargetRollingWindowSize

名称 类型 说明
mode string:

Custom

[必需]TargetRollingWindowSiz 检测模式。

value

integer (int32)

[必需]TargetRollingWindowSize 值。

DistributionType

枚举以确定作业分布类型。

说明
PyTorch
TensorFlow
Mpi

EarlyTerminationPolicyType

说明
Bandit
MedianStopping
TruncationSelection

EmailNotificationEnableType

枚举以确定电子邮件通知类型。

说明
JobCompleted
JobFailed
JobCancelled

ErrorAdditionalInfo

资源管理错误附加信息。

名称 类型 说明
info

object

其他信息。

type

string

其他信息类型。

ErrorDetail

错误详细信息。

名称 类型 说明
additionalInfo

ErrorAdditionalInfo[]

错误附加信息。

code

string

错误代码。

details

ErrorDetail[]

错误详细信息。

message

string

错误消息。

target

string

错误目标。

ErrorResponse

错误响应

名称 类型 说明
error

ErrorDetail

错误对象。

FeatureLags

用于为数值特征生成滞后的标志。

说明
None

不会生成特征滞后。

Auto

系统自动生成功能滞后。

FeaturizationMode

特征化模式 - 用户可以保留默认的“自动”模式,AutoML 将负责在特征化阶段对数据进行必要的转换。 如果选择了“关闭”,则不会完成特征化。 如果选择“自定义”,则用户可以指定其他输入以自定义特征化完成方式。

说明
Auto

自动模式下,系统执行特征化,无需任何自定义特征化输入。

Custom

自定义特征化。

Off

特征化关闭。 “预测”任务不能使用此值。

ForecastHorizonMode

枚举以确定预测范围选择模式。

说明
Auto

预测范围将自动确定。

Custom

使用自定义预测范围。

Forecasting

AutoML Table 垂直中的预测任务。

名称 类型 默认值 说明
cvSplitColumnNames

string[]

用于 CVSplit 数据的列。

featurizationSettings

TableVerticalFeaturizationSettings

AutoML 作业所需的特征化输入。

forecastingSettings

ForecastingSettings

预测任务特定的输入。

limitSettings

TableVerticalLimitSettings

AutoMLJob 的执行约束。

logVerbosity

LogVerbosity

Info

用于设置日志详细程度的枚举。

nCrossValidations NCrossValidations:

未提供验证数据集时要应用于训练数据集的交叉验证折叠数。

primaryMetric

ForecastingPrimaryMetrics

NormalizedRootMeanSquaredError

预测任务的主要指标。

targetColumnName

string

目标列名称:这是预测值列。 也称为分类任务的上下文中的标签列名称。

taskType string:

Forecasting

[必需]AutoMLJob 的任务类型。

testData

MLTableJobInput

测试数据输入。

testDataSize

number (double)

需要为验证目的预留的测试数据集的分数。 介于 (0.0 , 1.0) 之间的值 未提供验证数据集时应用。

trainingData

MLTableJobInput

[必需]训练数据输入。

trainingSettings

ForecastingTrainingSettings

AutoML 作业训练阶段的输入。

validationData

MLTableJobInput

验证数据输入。

validationDataSize

number (double)

需要留出用于验证的定型数据集的分数。 介于 (0.0 , 1.0) 之间的值 未提供验证数据集时应用。

weightColumnName

string

示例权重列的名称。 自动化 ML 支持加权列作为输入,导致数据中的行向上或向下加权。

ForecastingModels

AutoML 支持的所有预测模型的枚举。

说明
AutoArima

自动自回归综合移动平均线 (ARIMA) 模型使用时间序列数据和统计分析来解释数据并做出未来预测。 该模型旨在通过使用过去值的时间序列数据来解释数据,并使用线性回归进行预测。

Prophet

Prophet 是一种基于加法模型预测时间序列数据的过程,其中非线性趋势与年度、每周和每日季节性以及假期效应拟合。 它最适合具有强烈季节性影响的时间序列和多个季节的历史数据。 Prophet 对缺失数据和趋势变化具有鲁棒性,并且通常可以很好地处理异常值。

Naive

朴素预测模型通过结转训练数据中每个时间序列的最新目标值来进行预测。

SeasonalNaive

季节性朴素预测模型通过结转训练数据中每个时间序列的最新季节目标值来进行预测。

Average

平均预测模型通过结转训练数据中每个时间序列的目标值的平均值来进行预测。

SeasonalAverage

季节性平均预测模型通过结转训练数据中每个时间序列的最新季节数据的平均值来进行预测。

ExponentialSmoothing

指数平滑是一种针对单变量数据的时间序列预测方法,可以扩展以支持具有系统趋势或季节性成分的数据。

Arimax

具有解释变量的自回归综合移动平均线 (ARIMAX) 模型可以被视为具有一个或多个自回归 (AR) 项和/或一个或多个移动平均线 (MA) 项的多元回归模型。 该方法适用于数据为平稳/非平稳时的预测,以及具有任何类型数据模式(即水平/趋势/季节性/周期性)的多变量。

TCNForecaster

TCNForecaster:时态卷积网络预报器。 TODO:向预测团队询问简要介绍。

ElasticNet

弹性网络是一种流行的正则化线性回归类型,它结合了两种流行的惩罚,特别是 L1 和 L2 惩罚函数。

GradientBoosting

将周学习者转变为强学习者的技术称为提升。 梯度提升算法过程基于这种执行理论。

DecisionTree

决策树是一种非参数监督学习方法,用于分类和回归任务。 目标是创建一个模型,通过学习从数据特征推断的简单决策规则来预测目标变量的值。

KNN

K 最近邻 (KNN) 算法使用“特征相似性”来预测新数据点的值,这进一步意味着新数据点将根据它与训练集中点的匹配程度分配一个值。

LassoLars

套索模型拟合最小角度回归又名 Lars。 它是一个线性模型,使用 L1 先验作为正则化器进行训练。

SGD

SGD:随机梯度下降是一种优化算法,常用于机器学习应用,用于找到与预测输出和实际输出之间最佳拟合相对应的模型参数。 这是一种不精确但强大的技术。

RandomForest

随机森林是一种监督学习算法。 它构建的“森林”是决策树的集合,通常使用“装袋”方法进行训练。 套袋方法的总体思路是学习模型的组合增加了整体结果。

ExtremeRandomTrees

Extreme Trees 是一种集成机器学习算法,它结合了许多决策树的预测。 它与广泛使用的随机森林算法有关。

LightGBM

LightGBM 是一个梯度提升框架,它使用基于树的学习算法。

XGBoostRegressor

XGBoostRegressor:Extreme Gradient Boosting Regressor 是一种使用基本学习器集成的监督机器学习模型。

ForecastingPrimaryMetrics

预测任务的主要指标。

说明
SpearmanCorrelation

斯皮尔曼秩相关系数是秩相关性的非参数度量。

NormalizedRootMeanSquaredError

归一化均方根误差 (NRMSE) RMSE 有助于不同尺度模型之间的比较。

R2Score

R2 分数是基于预测的机器学习模型的性能评估度量之一。

NormalizedMeanAbsoluteError

归一化平均绝对误差 (NMAE) 是一种验证指标,用于比较不同尺度的(时间)序列的平均绝对误差 (MAE)。

ForecastingSettings

预测特定参数。

名称 类型 默认值 说明
countryOrRegionForHolidays

string

用于预测任务的假日国家或地区。 这些代码应为 ISO 3166 双字母国家/地区代码,例如“US”或“GB”。

cvStepSize

integer (int32)

一个 CV 折叠的起始时间与下一个折叠之间的句点数。 例如,如果每日数据为 = 3,则 CVStepSize 每个折叠的起始时间将相隔三天。

featureLags

FeatureLags

None

用于为数值特征生成滞后的标志。

forecastHorizon ForecastHorizon:

所需最大预测范围(以时序频率单位为单位)。

frequency

string

预测时,此参数表示需要预测的时间段,例如每日、每周、每年等。默认情况下,预测频率为数据集频率。

seasonality Seasonality:

将时序季节性设置为序列频率的整数倍数。 如果季节性设置为“auto”,则会推断它。

shortSeriesHandlingConfig

ShortSeriesHandlingConfiguration

Auto

定义 AutoML 如何处理短时序的参数。

targetAggregateFunction

TargetAggregationFunction

None

目标聚合函数。

targetLags TargetLags:

要从目标列滞后的过去时间段数。

targetRollingWindowSize TargetRollingWindowSize:

用于创建目标列的滚动窗口平均值的过去时间段数。

timeColumnName

string

时间列的名称。 当预测在用于生成时序并推断其频率的输入数据中指定日期/时间列时,此参数是必需的。

timeSeriesIdColumnNames

string[]

用于对时间序列进行分组的列的名称。 它可用于创建多个序列。 如果未定义粒度,则假定数据集为一个时序。 此参数用于任务类型预测。

useStl

UseStl

None

配置时序目标列的 STL 分解。

ForecastingTrainingSettings

预测培训相关配置。

名称 类型 默认值 说明
allowedTrainingAlgorithms

ForecastingModels[]

允许用于预测任务的模型。

blockedTrainingAlgorithms

ForecastingModels[]

用于预测任务的阻止模型。

enableDnnTraining

boolean

False

启用 DNN 模型的建议。

enableModelExplainability

boolean

True

标志以在最佳模型上启用可解释性。

enableOnnxCompatibleModels

boolean

False

用于启用 onnx 兼容模型的标志。

enableStackEnsemble

boolean

True

启用堆栈合奏运行。

enableVoteEnsemble

boolean

True

启用投票合奏运行。

ensembleModelDownloadTimeout

string (duration)

PT5M

在 VotingEnsemble 和 StackEnsemble 模型生成期间,将下载先前子运行中的多个拟合模型。 如果需要更多时间,请将此参数配置为大于 300 秒的值。

stackEnsembleSettings

StackEnsembleSettings

堆栈合奏的堆栈合奏设置。

Goal

定义超参数优化支持的指标目标

说明
Minimize
Maximize

GridSamplingAlgorithm

定义一个采样算法,该算法详尽地生成空间中的每个值组合

名称 类型 说明
samplingAlgorithmType string:

Grid

[必需]用于生成超参数值的算法以及配置属性

IdentityConfigurationType

枚举来确定标识框架。

说明
Managed
AMLToken
UserIdentity

ImageClassification

图像分类。 当图像仅使用一组类中的单个标签进行分类时,使用多类图像分类 - 例如,每个图像被分类为“猫”或“狗”或“鸭子”的图像。

名称 类型 默认值 说明
limitSettings

ImageLimitSettings

[必需]限制 AutoML 作业的设置。

logVerbosity

LogVerbosity

Info

用于设置日志详细程度的枚举。

modelSettings

ImageModelSettingsClassification

用于训练模型的设置。

primaryMetric

ClassificationPrimaryMetrics

Accuracy

分类任务的主要指标。

searchSpace

ImageModelDistributionSettingsClassification[]

用于采样模型及其超参数的不同组合的搜索空间。

sweepSettings

ImageSweepSettings

模型扫描和超参数扫描相关设置。

targetColumnName

string

目标列名称:这是预测值列。 也称为分类任务的上下文中的标签列名称。

taskType string:

ImageClassification

[必需]AutoMLJob 的任务类型。

trainingData

MLTableJobInput

[必需]训练数据输入。

validationData

MLTableJobInput

验证数据输入。

validationDataSize

number (double)

需要留出用于验证的定型数据集的分数。 介于 (0.0 , 1.0) 之间的值 未提供验证数据集时应用。

ImageClassificationMultilabel

图像分类多标签。 当图像可以具有一组标签中的一个或多个标签时,使用多标签图像分类 - 例如,图像可以同时标记为“猫”和“狗”。

名称 类型 默认值 说明
limitSettings

ImageLimitSettings

[必需]限制 AutoML 作业的设置。

logVerbosity

LogVerbosity

Info

用于设置日志详细程度的枚举。

modelSettings

ImageModelSettingsClassification

用于训练模型的设置。

primaryMetric

ClassificationMultilabelPrimaryMetrics

IOU

分类多标签任务的主要指标。

searchSpace

ImageModelDistributionSettingsClassification[]

用于采样模型及其超参数的不同组合的搜索空间。

sweepSettings

ImageSweepSettings

模型扫描和超参数扫描相关设置。

targetColumnName

string

目标列名称:这是预测值列。 也称为分类任务的上下文中的标签列名称。

taskType string:

ImageClassificationMultilabel

[必需]AutoMLJob 的任务类型。

trainingData

MLTableJobInput

[必需]训练数据输入。

validationData

MLTableJobInput

验证数据输入。

validationDataSize

number (double)

需要留出用于验证的定型数据集的分数。 介于 (0.0 , 1.0) 之间的值 未提供验证数据集时应用。

ImageInstanceSegmentation

图像实例分割。 实例分割用于在像素级别识别图像中的对象,在图像中的每个对象周围绘制一个多边形。

名称 类型 默认值 说明
limitSettings

ImageLimitSettings

[必需]限制 AutoML 作业的设置。

logVerbosity

LogVerbosity

Info

用于设置日志详细程度的枚举。

modelSettings

ImageModelSettingsObjectDetection

用于训练模型的设置。

primaryMetric

InstanceSegmentationPrimaryMetrics

MeanAveragePrecision

InstanceSegmentation 任务的主要指标。

searchSpace

ImageModelDistributionSettingsObjectDetection[]

用于采样模型及其超参数的不同组合的搜索空间。

sweepSettings

ImageSweepSettings

模型扫描和超参数扫描相关设置。

targetColumnName

string

目标列名称:这是预测值列。 也称为分类任务的上下文中的标签列名称。

taskType string:

ImageInstanceSegmentation

[必需]AutoMLJob 的任务类型。

trainingData

MLTableJobInput

[必需]训练数据输入。

validationData

MLTableJobInput

验证数据输入。

validationDataSize

number (double)

需要留出用于验证的定型数据集的分数。 介于 (0.0 , 1.0) 之间的值 未提供验证数据集时应用。

ImageLimitSettings

限制 AutoML 作业的设置。

名称 类型 默认值 说明
maxConcurrentTrials

integer (int32)

1

最大并发 AutoML 迭代数。

maxTrials

integer (int32)

1

AutoML 迭代的最大数目。

timeout

string (duration)

P7D

AutoML 作业超时。

ImageModelDistributionSettingsClassification

用于扫描模型设置值的分布表达式。 <示例> 一些例子是:

ModelName = "choice('seresnext', 'resnest50')";
LearningRate = "uniform(0.001, 0.01)";
LayersToFreeze = "choice(0, 2)";
```</example>
For more details on how to compose distribution expressions please check the documentation:
https://docs.microsoft.com/en-us/azure/machine-learning/how-to-tune-hyperparameters
For more information on the available settings please visit the official documentation:
https://docs.microsoft.com/en-us/azure/machine-learning/how-to-auto-train-image-models.
名称 类型 说明
amsGradient

string

优化器为“adam”或“adamw”时启用 AMSGrad。

augmentations

string

使用扩充的设置。

beta1

string

优化器为“adam”或“adamw”时“beta1”的值。 必须是 [0, 1] 范围内的浮点。

beta2

string

优化器为“adam”或“adamw”时“beta2”的值。 必须是 [0, 1] 范围内的浮点。

distributed

string

是否使用分布式程序训练。

earlyStopping

string

在训练期间启用提前停止逻辑。

earlyStoppingDelay

string

在跟踪主要指标改进以提前停止之前要等待的最小纪元或验证评估数。 必须是正整数。

earlyStoppingPatience

string

在停止运行之前没有主要指标改进的最小纪元或验证评估数。 必须是正整数。

enableOnnxNormalization

string

导出 ONNX 模型时启用规范化。

evaluationFrequency

string

评估验证数据集以获取指标分数的频率。 必须是正整数。

gradientAccumulationStep

string

梯度累积是指在累积这些步骤的梯度时运行配置数量的“GradAccumulationStep”步骤,而不更新模型权重,然后使用累积的梯度来计算权重更新。 必须是正整数。

layersToFreeze

string

要冻结模型的层数。 必须是正整数。 例如,传递 2 作为 'seresnext' 的值意味着冻结 layer0 和 layer1。 有关支持的模型的完整列表和图层冻结的详细信息,请参阅: https://docs.microsoft.com/en-us/azure/machine-learning/how-to-auto-train-image-models

learningRate

string

初始学习速率。 必须是 [0, 1] 范围内的浮点。

learningRateScheduler

string

学习速率计划程序的类型。 必须是“warmup_cosine”或“step”。

modelName

string

要用于训练的模型的名称。 有关可用型号的更多信息,请访问官方文档: https://docs.microsoft.com/en-us/azure/machine-learning/how-to-auto-train-image-models

momentum

string

优化器为“zn”时的动量值。 必须是 [0, 1] 范围内的浮点。

nesterov

string

优化器为“zn”时启用 nesterov。

numberOfEpochs

string

训练纪元数。 必须是正整数。

numberOfWorkers

string

数据加载程序辅助角色数。 必须是非负整数。

optimizer

string

优化器的类型。 必须是“zn”、“adam”或“adamw”。

randomSeed

string

使用确定性训练时要使用的随机种子。

stepLRGamma

string

当学习速率计划程序为“step”时,gamma 的值。 必须是 [0, 1] 范围内的浮点。

stepLRStepSize

string

学习速率计划程序为“step”时步骤大小的值。 必须是正整数。

trainingBatchSize

string

训练批大小。 必须是正整数。

trainingCropSize

string

训练数据集的神经网络输入的图像裁剪大小。 必须是正整数。

validationBatchSize

string

验证批大小。 必须是正整数。

validationCropSize

string

输入到神经网络的验证数据集的图像裁剪大小。 必须是正整数。

validationResizeSize

string

在裁剪验证数据集之前要调整其大小的图像大小。 必须是正整数。

warmupCosineLRCycles

string

学习速率计划程序为“warmup_cosine”时的余弦周期值。 必须是 [0, 1] 范围内的浮点。

warmupCosineLRWarmupEpochs

string

当学习速率计划程序为“warmup_cosine”时,预热时期的值。 必须是正整数。

weightDecay

string

优化器为“zn”、“adam”或“adamw”时的权重衰减值。 必须是范围[0, 1] 中的浮点。

weightedLoss

string

减肥。 对于无加权损失,接受的值为 0。 1 用于与 sqrt 一起减肥。(class_weights)。 2 用于减肥与class_weights。 必须为 0 或 1 或 2。

ImageModelDistributionSettingsObjectDetection

用于扫描模型设置值的分布表达式。 <示例> 一些例子是:

ModelName = "choice('seresnext', 'resnest50')";
LearningRate = "uniform(0.001, 0.01)";
LayersToFreeze = "choice(0, 2)";
```</example>
For more details on how to compose distribution expressions please check the documentation:
https://docs.microsoft.com/en-us/azure/machine-learning/how-to-tune-hyperparameters
For more information on the available settings please visit the official documentation:
https://docs.microsoft.com/en-us/azure/machine-learning/how-to-auto-train-image-models.
名称 类型 说明
amsGradient

string

优化器为“adam”或“adamw”时启用 AMSGrad。

augmentations

string

使用扩充的设置。

beta1

string

优化器为“adam”或“adamw”时“beta1”的值。 必须是 [0, 1] 范围内的浮点。

beta2

string

优化器为“adam”或“adamw”时“beta2”的值。 必须是 [0, 1] 范围内的浮点。

boxDetectionsPerImage

string

每个图像的最大检测数,适用于所有类。 必须是正整数。 注意:“yolov5”算法不支持此设置。

boxScoreThreshold

string

在推理过程中,仅返回分类分数大于 BoxScoreThreshold 的建议。 必须是范围[0, 1] 中的浮点。

distributed

string

是否使用分布式程序训练。

earlyStopping

string

在训练期间启用提前停止逻辑。

earlyStoppingDelay

string

在跟踪主要指标改进以提前停止之前要等待的最小纪元或验证评估数。 必须是正整数。

earlyStoppingPatience

string

在停止运行之前没有主要指标改进的最小纪元或验证评估数。 必须是正整数。

enableOnnxNormalization

string

导出 ONNX 模型时启用规范化。

evaluationFrequency

string

评估验证数据集以获取指标分数的频率。 必须是正整数。

gradientAccumulationStep

string

梯度累积是指在累积这些步骤的梯度时运行配置数量的“GradAccumulationStep”步骤,而不更新模型权重,然后使用累积的梯度来计算权重更新。 必须是正整数。

imageSize

string

用于训练和验证的图像大小。 必须是正整数。 注意:如果大小太大,训练运行可能会进入 CUDA OOM。 注意:仅“yolov5”算法支持此设置。

layersToFreeze

string

要冻结模型的层数。 必须是正整数。 例如,传递 2 作为 'seresnext' 的值意味着冻结 layer0 和 layer1。 有关支持的模型的完整列表和图层冻结的详细信息,请参阅: https://docs.microsoft.com/en-us/azure/machine-learning/how-to-auto-train-image-models

learningRate

string

初始学习速率。 必须是 [0, 1] 范围内的浮点。

learningRateScheduler

string

学习速率计划程序的类型。 必须是“warmup_cosine”或“step”。

maxSize

string

将图像馈送至主干之前要重新缩放的最大大小。 必须是正整数。 注意:如果大小太大,训练运行可能会进入 CUDA OOM。 注意:“yolov5”算法不支持此设置。

minSize

string

将图像馈送到主干之前要重新缩放的最小大小。 必须是正整数。 注意:如果大小太大,训练运行可能会进入 CUDA OOM。 注意:“yolov5”算法不支持此设置。

modelName

string

要用于训练的模型的名称。 有关可用型号的更多信息,请访问官方文档: https://docs.microsoft.com/en-us/azure/machine-learning/how-to-auto-train-image-models

modelSize

string

模型大小。 必须是“small”、“medium”、“large”或“xlarge”。 注意:如果模型大小太大,训练运行可能会进入 CUDA OOM。 注意:仅“yolov5”算法支持此设置。

momentum

string

优化器为“zn”时的动量值。 必须是 [0, 1] 范围内的浮点。

multiScale

string

按 +/- 50%的不同图像大小启用多缩放图像。 注意:如果没有足够的 GPU 内存,训练运行可能会进入 CUDA OOM。 注意:仅“yolov5”算法支持此设置。

nesterov

string

优化器为“zn”时启用 nesterov。

nmsIouThreshold

string

在 NMS 后期处理的推理期间使用的 IOU 阈值。 必须在 [0, 1] 范围内浮动。

numberOfEpochs

string

训练纪元数。 必须是正整数。

numberOfWorkers

string

数据加载程序辅助角色数。 必须是非负整数。

optimizer

string

优化器的类型。 必须是“zn”、“adam”或“adamw”。

randomSeed

string

使用确定性训练时要使用的随机种子。

stepLRGamma

string

当学习速率计划程序为“step”时,gamma 的值。 必须是 [0, 1] 范围内的浮点。

stepLRStepSize

string

学习速率计划程序为“step”时步骤大小的值。 必须是正整数。

tileGridSize

string

用于平铺每个图像的网格大小。 注意:TileGridSize 不得为 None 才能启用小对象检测逻辑。 一个字符串,其中包含两个整数(采用格式)。 注意:“yolov5”算法不支持此设置。

tileOverlapRatio

string

每个维度中相邻磁贴之间的重叠比率。 必须在 [0, 1] 范围内浮动。 注意:“yolov5”算法不支持此设置。

tilePredictionsNmsThreshold

string

用于执行 NMS 的 IOU 阈值,同时合并来自磁贴和图像的预测。 用于验证/推理。 必须在 [0, 1] 范围内浮动。 注意:“yolov5”算法不支持此设置。 NMS:非最大抑制

trainingBatchSize

string

训练批大小。 必须是正整数。

validationBatchSize

string

验证批大小。 必须是正整数。

validationIouThreshold

string

计算验证指标时要使用的 IOU 阈值。 必须在 [0, 1] 范围内浮动。

validationMetricType

string

用于验证指标的指标计算方法。 必须是“none”、“coco”、“voc”或“coco_voc”。

warmupCosineLRCycles

string

学习速率计划程序为“warmup_cosine”时的余弦周期值。 必须是 [0, 1] 范围内的浮点。

warmupCosineLRWarmupEpochs

string

当学习速率计划程序为“warmup_cosine”时,预热时期的值。 必须是正整数。

weightDecay

string

优化器为“zn”、“adam”或“adamw”时的权重衰减值。 必须是范围[0, 1] 中的浮点。

ImageModelSettingsClassification

用于训练模型的设置。 有关可用设置的更多信息,请访问官方文档: https://docs.microsoft.com/en-us/azure/machine-learning/how-to-auto-train-image-models

名称 类型 默认值 说明
advancedSettings

string

高级方案的设置。

amsGradient

boolean

优化器为“adam”或“adamw”时启用 AMSGrad。

augmentations

string

使用扩充的设置。

beta1

number (float)

优化器为“adam”或“adamw”时“beta1”的值。 必须是 [0, 1] 范围内的浮点。

beta2

number (float)

优化器为“adam”或“adamw”时“beta2”的值。 必须是 [0, 1] 范围内的浮点。

checkpointFrequency

integer (int32)

存储模型检查点的频率。 必须是正整数。

checkpointModel

MLFlowModelJobInput

用于增量训练的预先训练检查点模型。

checkpointRunId

string

上一次运行的 ID,该运行具有用于增量训练的预先训练检查点。

distributed

boolean

是否使用分布式训练。

earlyStopping

boolean

在训练期间启用提前停止逻辑。

earlyStoppingDelay

integer (int32)

在跟踪主要指标改进以提前停止之前要等待的最小纪元或验证评估数。 必须是正整数。

earlyStoppingPatience

integer (int32)

在停止运行之前没有主要指标改进的最小纪元或验证评估数。 必须是正整数。

enableOnnxNormalization

boolean

导出 ONNX 模型时启用规范化。

evaluationFrequency

integer (int32)

评估验证数据集以获取指标分数的频率。 必须是正整数。

gradientAccumulationStep

integer (int32)

梯度累积是指在累积这些步骤的梯度时运行配置数量的“GradAccumulationStep”步骤,而不更新模型权重,然后使用累积的梯度来计算权重更新。 必须是正整数。

layersToFreeze

integer (int32)

要冻结模型的层数。 必须是正整数。 例如,传递 2 作为 'seresnext' 的值意味着冻结 layer0 和 layer1。 有关支持的模型的完整列表和图层冻结的详细信息,请参阅: https://docs.microsoft.com/en-us/azure/machine-learning/how-to-auto-train-image-models

learningRate

number (float)

初始学习速率。 必须是 [0, 1] 范围内的浮点。

learningRateScheduler

LearningRateScheduler

None

学习率调度程序枚举。

modelName

string

要用于训练的模型的名称。 有关可用型号的更多信息,请访问官方文档: https://docs.microsoft.com/en-us/azure/machine-learning/how-to-auto-train-image-models

momentum

number (float)

优化器为“zn”时的动量值。 必须是 [0, 1] 范围内的浮点。

nesterov

boolean

优化器为“zn”时启用 nesterov。

numberOfEpochs

integer (int32)

训练纪元数。 必须是正整数。

numberOfWorkers

integer (int32)

数据加载程序辅助角色数。 必须是非负整数。

optimizer

StochasticOptimizer

None

图像模型的随机优化器。

randomSeed

integer (int32)

使用确定性训练时要使用的随机种子。

stepLRGamma

number (float)

当学习速率计划程序为“step”时,gamma 的值。 必须是 [0, 1] 范围内的浮点。

stepLRStepSize

integer (int32)

学习速率计划程序为“step”时步骤大小的值。 必须是正整数。

trainingBatchSize

integer (int32)

训练批大小。 必须是正整数。

trainingCropSize

integer (int32)

训练数据集的神经网络输入的图像裁剪大小。 必须是正整数。

validationBatchSize

integer (int32)

验证批大小。 必须是正整数。

validationCropSize

integer (int32)

输入到神经网络的验证数据集的图像裁剪大小。 必须是正整数。

validationResizeSize

integer (int32)

在裁剪验证数据集之前要调整其大小的图像大小。 必须是正整数。

warmupCosineLRCycles

number (float)

学习速率计划程序为“warmup_cosine”时的余弦周期值。 必须是 [0, 1] 范围内的浮点。

warmupCosineLRWarmupEpochs

integer (int32)

当学习速率计划程序为“warmup_cosine”时,预热时期的值。 必须是正整数。

weightDecay

number (float)

优化器为“zn”、“adam”或“adamw”时的权重衰减值。 必须是范围[0, 1] 中的浮点。

weightedLoss

integer (int32)

减肥。 对于无加权损失,接受的值为 0。 1 用于与 sqrt 一起减肥。(class_weights)。 2 用于减肥与class_weights。 必须为 0 或 1 或 2。

ImageModelSettingsObjectDetection

用于训练模型的设置。 有关可用设置的更多信息,请访问官方文档: https://docs.microsoft.com/en-us/azure/machine-learning/how-to-auto-train-image-models

名称 类型 默认值 说明
advancedSettings

string

高级方案的设置。

amsGradient

boolean

优化器为“adam”或“adamw”时启用 AMSGrad。

augmentations

string

使用扩充的设置。

beta1

number (float)

优化器为“adam”或“adamw”时“beta1”的值。 必须是 [0, 1] 范围内的浮点。

beta2

number (float)

优化器为“adam”或“adamw”时“beta2”的值。 必须是 [0, 1] 范围内的浮点。

boxDetectionsPerImage

integer (int32)

每个图像的最大检测数,适用于所有类。 必须是正整数。 注意:“yolov5”算法不支持此设置。

boxScoreThreshold

number (float)

在推理过程中,仅返回分类分数大于 BoxScoreThreshold 的建议。 必须是范围[0, 1] 中的浮点。

checkpointFrequency

integer (int32)

存储模型检查点的频率。 必须是正整数。

checkpointModel

MLFlowModelJobInput

用于增量训练的预先训练检查点模型。

checkpointRunId

string

上一次运行的 ID,该运行具有用于增量训练的预先训练检查点。

distributed

boolean

是否使用分布式训练。

earlyStopping

boolean

在训练期间启用提前停止逻辑。

earlyStoppingDelay

integer (int32)

在跟踪主要指标改进以提前停止之前要等待的最小纪元或验证评估数。 必须是正整数。

earlyStoppingPatience

integer (int32)

在停止运行之前没有主要指标改进的最小纪元或验证评估数。 必须是正整数。

enableOnnxNormalization

boolean

导出 ONNX 模型时启用规范化。

evaluationFrequency

integer (int32)

评估验证数据集以获取指标分数的频率。 必须是正整数。

gradientAccumulationStep

integer (int32)

梯度累积是指在累积这些步骤的梯度时运行配置数量的“GradAccumulationStep”步骤,而不更新模型权重,然后使用累积的梯度来计算权重更新。 必须是正整数。

imageSize

integer (int32)

用于训练和验证的图像大小。 必须是正整数。 注意:如果大小太大,训练运行可能会进入 CUDA OOM。 注意:仅“yolov5”算法支持此设置。

layersToFreeze

integer (int32)

要冻结模型的层数。 必须是正整数。 例如,传递 2 作为 'seresnext' 的值意味着冻结 layer0 和 layer1。 有关支持的模型的完整列表和图层冻结的详细信息,请参阅: https://docs.microsoft.com/en-us/azure/machine-learning/how-to-auto-train-image-models

learningRate

number (float)

初始学习速率。 必须是 [0, 1] 范围内的浮点。

learningRateScheduler

LearningRateScheduler

None

学习率调度程序枚举。

maxSize

integer (int32)

将图像馈送至主干之前要重新缩放的最大大小。 必须是正整数。 注意:如果大小太大,训练运行可能会进入 CUDA OOM。 注意:“yolov5”算法不支持此设置。

minSize

integer (int32)

将图像馈送到主干之前要重新缩放的最小大小。 必须是正整数。 注意:如果大小太大,训练运行可能会进入 CUDA OOM。 注意:“yolov5”算法不支持此设置。

modelName

string

要用于训练的模型的名称。 有关可用型号的更多信息,请访问官方文档: https://docs.microsoft.com/en-us/azure/machine-learning/how-to-auto-train-image-models

modelSize

ModelSize

None

图像模型大小。

momentum

number (float)

优化器为“zn”时的动量值。 必须是 [0, 1] 范围内的浮点。

multiScale

boolean

按 +/- 50%的不同图像大小启用多缩放图像。 注意:如果没有足够的 GPU 内存,训练运行可能会进入 CUDA OOM。 注意:仅“yolov5”算法支持此设置。

nesterov

boolean

优化器为“zn”时启用 nesterov。

nmsIouThreshold

number (float)

在 NMS 后期处理的推理期间使用的 IOU 阈值。 必须是 [0, 1] 范围内的浮点。

numberOfEpochs

integer (int32)

训练纪元数。 必须是正整数。

numberOfWorkers

integer (int32)

数据加载程序辅助角色数。 必须是非负整数。

optimizer

StochasticOptimizer

None

图像模型的随机优化器。

randomSeed

integer (int32)

使用确定性训练时要使用的随机种子。

stepLRGamma

number (float)

当学习速率计划程序为“step”时,gamma 的值。 必须是 [0, 1] 范围内的浮点。

stepLRStepSize

integer (int32)

学习速率计划程序为“step”时步骤大小的值。 必须是正整数。

tileGridSize

string

用于平铺每个图像的网格大小。 注意:TileGridSize 不得为 None 才能启用小对象检测逻辑。 一个字符串,其中包含两个整数(采用格式)。 注意:“yolov5”算法不支持此设置。

tileOverlapRatio

number (float)

每个维度中相邻磁贴之间的重叠比率。 必须在 [0, 1] 范围内浮动。 注意:“yolov5”算法不支持此设置。

tilePredictionsNmsThreshold

number (float)

用于执行 NMS 的 IOU 阈值,同时合并来自磁贴和图像的预测。 用于验证/推理。 必须在 [0, 1] 范围内浮动。 注意:“yolov5”算法不支持此设置。

trainingBatchSize

integer (int32)

训练批大小。 必须是正整数。

validationBatchSize

integer (int32)

验证批大小。 必须是正整数。

validationIouThreshold

number (float)

计算验证指标时要使用的 IOU 阈值。 必须在 [0, 1] 范围内浮动。

validationMetricType

ValidationMetricType

None

用于图像任务中验证指标的指标计算方法。

warmupCosineLRCycles

number (float)

学习速率计划程序为“warmup_cosine”时的余弦周期值。 必须是 [0, 1] 范围内的浮点。

warmupCosineLRWarmupEpochs

integer (int32)

当学习速率计划程序为“warmup_cosine”时,预热时期的值。 必须是正整数。

weightDecay

number (float)

优化器为“zn”、“adam”或“adamw”时的权重衰减值。 必须是范围[0, 1] 中的浮点。

ImageObjectDetection

图像对象检测。 对象检测用于识别图像中的对象并使用边界框定位每个对象,例如定位图像中的所有狗和猫,并在每个对象周围绘制一个边界框。

名称 类型 默认值 说明
limitSettings

ImageLimitSettings

[必需]限制 AutoML 作业的设置。

logVerbosity

LogVerbosity

Info

用于设置日志详细程度的枚举。

modelSettings

ImageModelSettingsObjectDetection

用于训练模型的设置。

primaryMetric

ObjectDetectionPrimaryMetrics

MeanAveragePrecision

图像对象检测任务的主要指标。

searchSpace

ImageModelDistributionSettingsObjectDetection[]

用于采样模型及其超参数的不同组合的搜索空间。

sweepSettings

ImageSweepSettings

模型扫描和超参数扫描相关设置。

targetColumnName

string

目标列名称:这是预测值列。 也称为分类任务的上下文中的标签列名称。

taskType string:

ImageObjectDetection

[必需]AutoMLJob 的任务类型。

trainingData

MLTableJobInput

[必需]训练数据输入。

validationData

MLTableJobInput

验证数据输入。

validationDataSize

number (double)

需要留出用于验证的定型数据集的分数。 介于 (0.0 , 1.0) 之间的值 未提供验证数据集时应用。

ImageSweepSettings

模型扫描和超参数扫描相关设置。

名称 类型 说明
earlyTermination EarlyTerminationPolicy:

提前终止策略的类型。

samplingAlgorithm

SamplingAlgorithmType

[必需]超参数采样算法的类型。

InputDeliveryMode

枚举以确定输入数据传递模式。

说明
ReadOnlyMount
ReadWriteMount
Download
Direct
EvalMount
EvalDownload

InstanceSegmentationPrimaryMetrics

InstanceSegmentation 任务的主要指标。

说明
MeanAveragePrecision

平均精度 (MAP) 是 AP(平均精度)的平均值。 计算每个类的 AP 并取平均值以获得 MAP。

JobBase

Azure 资源管理器资源信封。

名称 类型 说明
id

string

资源的完全限定资源 ID。 示例 - /subscriptions/{subscriptionId}/resourceGroups/{resourceGroupName}/providers/{resourceProviderNamespace}/{resourceType}/{resourceName}

name

string

资源的名称

properties JobBaseProperties:

[必需]实体的其他属性。

systemData

systemData

包含 createdBy 和 modifiedBy 信息的 Azure 资源管理器元数据。

type

string

资源类型。 例如“Microsoft.Compute/virtualMachines”或“Microsoft.Storage/storageAccounts”

JobInputType

枚举以确定作业输入类型。

说明
literal
uri_file
uri_folder
mltable
custom_model
mlflow_model
triton_model

JobLimitsType

说明
Command
Sweep

JobOutputType

枚举以确定作业输出类型。

说明
uri_file
uri_folder
mltable
custom_model
mlflow_model
triton_model

JobResourceConfiguration

名称 类型 默认值 说明
dockerArgs

string

要传递给 Docker run 命令的额外参数。 这将替代系统设置的任何参数,或在本部分中。 此参数仅支持 Azure ML 计算类型。

dockerArgsList

string[]

作为集合传递给 Docker run 命令的额外参数。 这将替代系统设置的任何参数,或在本部分中。 此参数仅支持 Azure ML 计算类型。

instanceCount

integer (int32)

1

计算目标使用的实例或节点数可选。

instanceType

string

计算目标支持的可选 VM 类型。

properties

其他属性包。

shmSize

string

pattern: \d+[bBkKmMgG]
2g

docker 容器的共享内存块的大小。 这应采用 (number)(unit) 格式,其中数字大于 0,单位可以是 b(字节)、k(千字节)、m(兆字节)或 g(GB)。

JobService

作业端点定义

名称 类型 说明
endpoint

string

终结点的 URL。

errorMessage

string

服务中的任何错误。

jobServiceType

string

终结点类型。

nodes Nodes:

AllNodes

用户希望启动服务的节点。 如果未将 Nodes 设置为 null,则服务将仅在领导节点上启动。

port

integer (int32)

终结点的端口。

properties

object

在终结点上设置的其他属性。

status

string

终结点的状态。

JobStatus

作业的状态。

说明
NotStarted

跑步还没有开始。

Starting

跑步已经开始了。 用户具有运行 ID。

Provisioning

(目前未使用)如果 ES 正在创建计算目标,则将使用它。

Preparing

运行环境正在准备中。

Queued

作业在计算目标中排队。 例如,在 BatchAI 中,作业处于排队状态,同时等待所有必需的节点准备就绪。

Running

作业开始在计算目标中运行。

Finalizing

作业在目标中完成。 它现在处于输出收集状态。

CancelRequested

已请求取消该作业。

Completed

作业已成功完成。 这反映了作业本身和输出收集状态都已成功完成

Failed

作业失败。

Canceled

在取消请求之后,作业现在已成功取消。

NotResponding

启用检测信号后,如果运行未将任何信息更新到 RunHistory,则运行将进入 NotResponding 状态。 NotResponding 是唯一不受严格转换命令约束的状态。 运行可以从 NotResponding 转到之前的任何状态。

Paused

作业由用户暂停。 只能在暂停状态下对标记作业进行一些调整。

Unknown

默认作业状态(如果未映射到所有其他状态)

JobTier

用于确定作业层的枚举。

说明
Null
Spot
Basic
Standard
Premium

JobType

枚举以确定作业类型。

说明
AutoML
Command
Sweep
Pipeline
Spark

LearningRateScheduler

学习率调度程序枚举。

说明
None

未选择学习率调度程序。

WarmupCosine

余弦退火与预热。

Step

步进学习率调度器。

LiteralJobInput

文字输入类型。

名称 类型 说明
description

string

输入的说明。

jobInputType string:

literal

[必需]指定作业的类型。

value

string

minLength: 1
pattern: [a-zA-Z0-9_]

[必需]输入的文本值。

LogVerbosity

用于设置日志详细程度的枚举。

说明
NotSet

不发出任何日志。

Debug

已记录 Debug 及以上日志语句。

Info

Info 和上述日志语句。

Warning

已记录警告及以上日志语句。

Error

记录了错误和上述日志语句。

Critical

仅记录关键语句。

ManagedIdentity

托管标识配置。

名称 类型 说明
clientId

string (uuid)

按客户端 ID 指定用户分配的标识。 对于系统分配,请不要设置此字段。

identityType string:

Managed

[必需]指定标识框架的类型。

objectId

string (uuid)

按对象 ID 指定用户分配的标识。 对于系统分配,请不要设置此字段。

resourceId

string

按 ARM 资源 ID 指定用户分配的标识。 对于系统分配,请不要设置此字段。

MedianStoppingPolicy

根据所有运行的主要指标的运行平均值定义提前终止策略

名称 类型 默认值 说明
delayEvaluation

integer (int32)

0

延迟第一次计算的间隔数。

evaluationInterval

integer (int32)

0

策略评估之间的间隔(运行数)。

policyType string:

MedianStopping

[必需]策略配置的名称

MLFlowModelJobInput

名称 类型 默认值 说明
description

string

输入的说明。

jobInputType string:

mlflow_model

[必需]指定作业的类型。

mode

InputDeliveryMode

ReadOnlyMount

枚举以确定输入数据传递模式。

uri

string

minLength: 1
pattern: [a-zA-Z0-9_]

[必需]输入资产 URI。

MLFlowModelJobOutput

名称 类型 默认值 说明
assetName

string

输出资产名称。

description

string

输出的说明。

jobOutputType string:

mlflow_model

[必需]指定作业的类型。

mode

OutputDeliveryMode

ReadWriteMount

输出数据传递模式枚举。

uri

string

输出资产 URI。

MLTableJobInput

名称 类型 默认值 说明
description

string

输入的说明。

jobInputType string:

mltable

[必需]指定作业的类型。

mode

InputDeliveryMode

ReadOnlyMount

枚举以确定输入数据传递模式。

uri

string

minLength: 1
pattern: [a-zA-Z0-9_]

[必需]输入资产 URI。

MLTableJobOutput

名称 类型 默认值 说明
assetName

string

输出资产名称。

description

string

输出的说明。

jobOutputType string:

mltable

[必需]指定作业的类型。

mode

OutputDeliveryMode

ReadWriteMount

输出数据传递模式枚举。

uri

string

输出资产 URI。

ModelSize

图像模型大小。

说明
None

未选择任何值。

Small

体积小。

Medium

中等尺寸。

Large

大尺寸。

ExtraLarge

超大尺寸。

Mpi

MPI 分发配置。

名称 类型 说明
distributionType string:

Mpi

[必需]指定分发框架的类型。

processCountPerInstance

integer (int32)

每个 MPI 节点的进程数。

NCrossValidationsMode

确定如何确定 N-Cross 验证值。

说明
Auto

自动确定 N-Cross 验证值。 仅支持“预测”AutoML 任务。

Custom

使用自定义 N-Cross 验证值。

NlpVerticalFeaturizationSettings

名称 类型 说明
datasetLanguage

string

数据集语言,适用于文本数据。

NlpVerticalLimitSettings

作业执行约束。

名称 类型 默认值 说明
maxConcurrentTrials

integer (int32)

1

最大并发 AutoML 迭代次数。

maxTrials

integer (int32)

1

AutoML 迭代数。

timeout

string (duration)

P7D

AutoML 作业超时。

NodesValueType

节点值的枚举类型

说明
All

NotificationSetting

通知的配置。

名称 类型 说明
emailOn

EmailNotificationEnableType[]

在指定的通知类型上向用户发送电子邮件通知

emails

string[]

这是电子邮件收件人列表,限制为 499 个字符的总 concat 和逗号分隔符

webhooks

object

将 Webhook 回调发送到服务。 密钥是 Webhook 的用户提供的名称。

ObjectDetectionPrimaryMetrics

图像对象检测任务的主要指标。

说明
MeanAveragePrecision

平均精度 (MAP) 是 AP(平均精度)的平均值。 计算每个类的 AP 并取平均值以获得 MAP。

Objective

优化目标。

名称 类型 说明
goal

Goal

[必需]定义超参数优化支持的指标目标

primaryMetric

string

minLength: 1
pattern: [a-zA-Z0-9_]

[必需]要优化的指标的名称。

OutputDeliveryMode

输出数据传递模式枚举。

说明
ReadWriteMount
Upload
Direct

PipelineJob

管道作业定义:定义通用到 MFE 属性。

名称 类型 默认值 说明
componentId

string

组件资源的 ARM 资源 ID。

computeId

string

计算资源的 ARM 资源 ID。

description

string

资产说明文本。

displayName

string

作业的显示名称。

experimentName

string

Default

作业所属的试验的名称。 如果未设置,作业将放置在“默认”试验中。

identity IdentityConfiguration:

标识配置。 如果已设置,则应为 AmlToken、ManagedIdentity、UserIdentity 或 null 之一。 如果为 null,则默认为 AmlToken。

inputs

object

管道作业的输入。

isArchived

boolean

False

资产是否已存档?

jobType string:

Pipeline

[必需]指定作业的类型。

jobs

作业构造管道作业。

notificationSetting

NotificationSetting

作业的通知设置

outputs

object

管道作业的输出

properties

object

资产属性字典。

services

<string,  JobService>

JobEndpoints 列表。 对于本地作业,作业终结点的终结点值为 FileStreamObject。

settings

管道设置,例如 ContinueRunOnStepFailure 等。

sourceJobId

string

源作业的 ARM 资源 ID。

status

JobStatus

作业状态。

tags

object

标记字典。 可以添加、删除和更新标记。

PyTorch

PyTorch 分发配置。

名称 类型 说明
distributionType string:

PyTorch

[必需]指定分发框架的类型。

processCountPerInstance

integer (int32)

每个节点的进程数。

QueueSettings

名称 类型 默认值 说明
jobTier

JobTier

Null

用于确定作业层的枚举。

RandomSamplingAlgorithm

定义随机生成值的采样算法

名称 类型 默认值 说明
rule

RandomSamplingAlgorithmRule

Random

随机算法的特定类型

samplingAlgorithmType string:

Random

[必需]用于生成超参数值的算法以及配置属性

seed

integer (int32)

用作随机数生成的种子的可选整数

RandomSamplingAlgorithmRule

随机算法的特定类型

说明
Random
Sobol

Regression

AutoML Table 垂直中的回归任务。

名称 类型 默认值 说明
cvSplitColumnNames

string[]

用于 CVSplit 数据的列。

featurizationSettings

TableVerticalFeaturizationSettings

AutoML 作业所需的特征化输入。

limitSettings

TableVerticalLimitSettings

AutoMLJob 的执行约束。

logVerbosity

LogVerbosity

Info

用于设置日志详细程度的枚举。

nCrossValidations NCrossValidations:

未提供验证数据集时要应用于训练数据集的交叉验证折叠数。

primaryMetric

RegressionPrimaryMetrics

NormalizedRootMeanSquaredError

回归任务的主要指标。

targetColumnName

string

目标列名称:这是预测值列。 也称为分类任务的上下文中的标签列名称。

taskType string:

Regression

[必需]AutoMLJob 的任务类型。

testData

MLTableJobInput

测试数据输入。

testDataSize

number (double)

需要为验证目的预留的测试数据集的分数。 介于 (0.0 , 1.0) 之间的值 未提供验证数据集时应用。

trainingData

MLTableJobInput

[必需]训练数据输入。

trainingSettings

RegressionTrainingSettings

AutoML 作业训练阶段的输入。

validationData

MLTableJobInput

验证数据输入。

validationDataSize

number (double)

需要留出用于验证的定型数据集的分数。 介于 (0.0 , 1.0) 之间的值 未提供验证数据集时应用。

weightColumnName

string

示例权重列的名称。 自动化 ML 支持加权列作为输入,导致数据中的行向上或向下加权。

RegressionModels

AutoML 支持的所有回归模型的枚举。

说明
ElasticNet

弹性网络是一种流行的正则化线性回归类型,它结合了两种流行的惩罚,特别是 L1 和 L2 惩罚函数。

GradientBoosting

将周学习者转变为强学习者的技术称为提升。 梯度提升算法过程基于这种执行理论。

DecisionTree

决策树是一种非参数监督学习方法,用于分类和回归任务。 目标是创建一个模型,通过学习从数据特征推断的简单决策规则来预测目标变量的值。

KNN

K 最近邻 (KNN) 算法使用“特征相似性”来预测新数据点的值,这进一步意味着新数据点将根据它与训练集中点的匹配程度分配一个值。

LassoLars

套索模型拟合最小角度回归又名 Lars。 它是一个线性模型,使用 L1 先验作为正则化器进行训练。

SGD

SGD:随机梯度下降是一种优化算法,常用于机器学习应用,用于找到与预测输出和实际输出之间最佳拟合相对应的模型参数。 这是一种不精确但强大的技术。

RandomForest

随机森林是一种监督学习算法。 它构建的“森林”是决策树的集合,通常使用“装袋”方法进行训练。 套袋方法的总体思路是学习模型的组合增加了整体结果。

ExtremeRandomTrees

Extreme Trees 是一种集成机器学习算法,它结合了许多决策树的预测。 它与广泛使用的随机森林算法有关。

LightGBM

LightGBM 是一个梯度提升框架,它使用基于树的学习算法。

XGBoostRegressor

XGBoostRegressor:Extreme Gradient Boosting Regressor 是一种使用基本学习器集成的监督机器学习模型。

RegressionPrimaryMetrics

回归任务的主要指标。

说明
SpearmanCorrelation

斯皮尔曼秩相关系数是秩相关性的非参数度量。

NormalizedRootMeanSquaredError

归一化均方根误差 (NRMSE) RMSE 有助于不同尺度模型之间的比较。

R2Score

R2 分数是基于预测的机器学习模型的性能评估度量之一。

NormalizedMeanAbsoluteError

归一化平均绝对误差 (NMAE) 是一种验证指标,用于比较不同尺度的(时间)序列的平均绝对误差 (MAE)。

RegressionTrainingSettings

回归训练相关配置。

名称 类型 默认值 说明
allowedTrainingAlgorithms

RegressionModels[]

回归任务的允许模型。

blockedTrainingAlgorithms

RegressionModels[]

回归任务的阻止模型。

enableDnnTraining

boolean

False

启用 DNN 模型的建议。

enableModelExplainability

boolean

True

标志以在最佳模型上启用可解释性。

enableOnnxCompatibleModels

boolean

False

用于启用 onnx 兼容模型的标志。

enableStackEnsemble

boolean

True

启用堆栈合奏运行。

enableVoteEnsemble

boolean

True

启用投票合奏运行。

ensembleModelDownloadTimeout

string (duration)

PT5M

在 VotingEnsemble 和 StackEnsemble 模型生成期间,将下载先前子运行中的多个拟合模型。 如果需要更多时间,请将此参数配置为大于 300 秒的值。

stackEnsembleSettings

StackEnsembleSettings

堆栈合奏的堆栈合奏设置。

SamplingAlgorithmType

说明
Grid
Random
Bayesian

SeasonalityMode

预测季节性模式。

说明
Auto

季节性将自动确定。

Custom

使用自定义季节性值。

ShortSeriesHandlingConfiguration

定义 AutoML 如何处理短时序的参数。

说明
None

表示无/空值。

Auto

如果没有长系列,短系列将被填充,否则短系列将被删除。

Pad

所有短剧都将被填充。

Drop

所有短剧都将被删除。

SparkJob

Spark 作业定义。

名称 类型 默认值 说明
archives

string[]

存档作业中使用的文件。

args

string

作业的参数。

codeId

string (arm-id)

minLength: 1
pattern: [a-zA-Z0-9_]

[必需] 代码资产的 arm-id。

componentId

string

组件资源的 ARM 资源 ID。

computeId

string

计算资源的 ARM 资源 ID。

conf

object

Spark 配置的属性。

description

string

资产说明文本。

displayName

string

作业的显示名称。

entry SparkJobEntry:

[必需]在启动作业时要执行的条目。

environmentId

string (arm-id)

作业的环境规范的 ARM 资源 ID。

environmentVariables

object

作业中包含的环境变量。

experimentName

string

Default

作业所属的试验的名称。 如果未设置,作业将放置在“默认”试验中。

files

string[]

作业中使用的文件。

identity IdentityConfiguration:

标识配置。 如果已设置,则应为 AmlToken、ManagedIdentity、UserIdentity 或 null 之一。 如果为 null,则默认为 AmlToken。

inputs

object

作业中使用的输入数据绑定的映射。

isArchived

boolean

False

资产是否已存档?

jars

string[]

作业中使用的 Jar 文件。

jobType string:

Spark

[必需]指定作业的类型。

notificationSetting

NotificationSetting

作业的通知设置

outputs

object

作业中使用的输出数据绑定的映射。

properties

object

资产属性字典。

pyFiles

string[]

作业中使用的 Python 文件。

queueSettings

QueueSettings

作业的队列设置

resources

SparkResourceConfiguration

作业的计算资源配置。

services

<string,  JobService>

JobEndpoints 列表。 对于本地作业,作业终结点的终结点值为 FileStreamObject。

status

JobStatus

作业状态。

tags

object

标记字典。 可以添加、删除和更新标记。

SparkJobEntryType

说明
SparkJobPythonEntry
SparkJobScalaEntry

SparkJobPythonEntry

名称 类型 说明
file

string

minLength: 1
pattern: [a-zA-Z0-9_]

[必需]作业入口点的相对 python 文件路径。

sparkJobEntryType string:

SparkJobPythonEntry

[必需]作业入口点的类型。

SparkJobScalaEntry

名称 类型 说明
className

string

minLength: 1
pattern: [a-zA-Z0-9_]

[必需]用作入口点的 Scala 类名称。

sparkJobEntryType string:

SparkJobScalaEntry

[必需]作业入口点的类型。

SparkResourceConfiguration

名称 类型 默认值 说明
instanceType

string

计算目标支持的可选 VM 类型。

runtimeVersion

string

3.1

用于作业的 spark 运行时的版本。

StackEnsembleSettings

用于自定义 StackEnsemble 运行的高级设置。

名称 类型 默认值 说明
stackMetaLearnerKWargs

要传递给元学习器初始值设定项的可选参数。

stackMetaLearnerTrainPercentage

number (double)

0.2

指定要保留用于训练元学习者的训练集(选择训练和训练类型的训练)的比例。 默认值为 0.2。

stackMetaLearnerType

StackMetaLearnerType

None

元学习器是一个基于各个异构模型输出训练的模型。\r\n默认的元学习器是用于分类任务的LogisticRegression(如果启用交叉验证则用LogisticRegressionCV),用于回归/预测任务的ElasticNet(或启用交叉验证则用ElasticNetCV)。\r\n该参数可以是以下字符串之一:LogisticRegression、LogisticRegressionCV、LightGBMClassifier、ElasticNet、ElasticNetCV、LightGBMRegressor 或 LinearRegression

StackMetaLearnerType

元学习器是一个基于各个异构模型输出训练的模型。\r\n默认的元学习器是用于分类任务的LogisticRegression(如果启用交叉验证则用LogisticRegressionCV),用于回归/预测任务的ElasticNet(或启用交叉验证则用ElasticNetCV)。\r\n该参数可以是以下字符串之一:LogisticRegression、LogisticRegressionCV、LightGBMClassifier、ElasticNet、ElasticNetCV、LightGBMRegressor 或 LinearRegression

说明
None
LogisticRegression

默认元学习器是用于分类任务的 LogisticRegression。

LogisticRegressionCV

当 CV 打开时,默认元学习器是分类任务的 LogisticRegression。

LightGBMClassifier
ElasticNet

默认元学习器是回归任务的 LogisticRegression。

ElasticNetCV

当 CV 打开时,默认元学习器是回归任务的 LogisticRegression。

LightGBMRegressor
LinearRegression

StochasticOptimizer

图像模型的随机优化器。

说明
None

未选择优化器。

Sgd

随机梯度下降优化器。

Adam

Adam 是一种基于矩的自适应估计优化随机目标函数的算法

Adamw

AdamW 是优化器 Adam 的变体,它改进了权重衰减的实现。

SweepJob

扫描作业定义。

名称 类型 默认值 说明
componentId

string

组件资源的 ARM 资源 ID。

computeId

string

计算资源的 ARM 资源 ID。

description

string

资产说明文本。

displayName

string

作业的显示名称。

earlyTermination EarlyTerminationPolicy:

提前终止策略可在完成之前取消性能不佳的运行

experimentName

string

Default

作业所属的试验的名称。 如果未设置,作业将放置在“默认”试验中。

identity IdentityConfiguration:

标识配置。 如果已设置,则应为 AmlToken、ManagedIdentity、UserIdentity 或 null 之一。 如果为 null,则默认为 AmlToken。

inputs

object

作业中使用的输入数据绑定的映射。

isArchived

boolean

False

资产是否已存档?

jobType string:

Sweep

[必需]指定作业的类型。

limits

SweepJobLimits

扫描作业限制。

notificationSetting

NotificationSetting

作业的通知设置

objective

Objective

[必需]优化目标。

outputs

object

作业中使用的输出数据绑定的映射。

properties

object

资产属性字典。

queueSettings

QueueSettings

作业的队列设置

samplingAlgorithm SamplingAlgorithm:

[必需]超参数采样算法

searchSpace

[必需]包含每个参数及其分布的字典。 字典键是参数的名称

services

<string,  JobService>

JobEndpoints 列表。 对于本地作业,作业终结点的终结点值为 FileStreamObject。

status

JobStatus

作业状态。

tags

object

标记字典。 可以添加、删除和更新标记。

trial

TrialComponent

[必需]试用组件定义。

SweepJobLimits

扫描作业限制类。

名称 类型 说明
jobLimitsType string:

Sweep

[必需]JobLimit 类型。

maxConcurrentTrials

integer (int32)

扫描作业最大并发试用版。

maxTotalTrials

integer (int32)

扫描作业最大总试用版数。

timeout

string (duration)

ISO 8601 格式的最大运行持续时间,之后作业将被取消。 仅支持精度为秒的持续时间。

trialTimeout

string (duration)

扫描作业试用超时值。

systemData

与创建和上次修改资源相关的元数据。

名称 类型 说明
createdAt

string (date-time)

资源创建时间戳(UTC)。

createdBy

string

创建资源的标识。

createdByType

createdByType

创建资源的标识的类型。

lastModifiedAt

string (date-time)

资源上次修改的时间戳 (UTC)

lastModifiedBy

string

上次修改资源的标识。

lastModifiedByType

createdByType

上次修改资源的标识的类型。

TableVerticalFeaturizationSettings

特征化配置。

名称 类型 默认值 说明
blockedTransformers

BlockedTransformers[]

这些转换器不应用于特征化。

columnNameAndTypes

object

列名及其类型(int、float、string、datetime 等)的字典。

datasetLanguage

string

数据集语言,适用于文本数据。

enableDnnFeaturization

boolean

False

确定是否使用基于 Dnn 的特征化器进行数据特征化。

mode

FeaturizationMode

Auto

特征化模式 - 用户可以保留默认的“自动”模式,AutoML 将负责在特征化阶段对数据进行必要的转换。 如果选择了“关闭”,则不会完成特征化。 如果选择“自定义”,则用户可以指定其他输入以自定义特征化完成方式。

transformerParams

object

用户可以指定要用于的其他转换器以及要向其应用它的列以及转换器构造函数的参数。

TableVerticalLimitSettings

作业执行约束。

名称 类型 默认值 说明
enableEarlyTermination

boolean

True

启用提前终止,确定如果最近 20 次迭代中没有分数改进,AutoMLJob 是否会提前终止。

exitScore

number (double)

AutoML 作业的退出分数。

maxConcurrentTrials

integer (int32)

1

最大并发迭代数。

maxCoresPerTrial

integer (int32)

-1

每次迭代的最大核心数。

maxTrials

integer (int32)

1000

迭代数。

timeout

string (duration)

PT6H

AutoML 作业超时。

trialTimeout

string (duration)

PT30M

迭代超时。

TargetAggregationFunction

目标聚合函数。

说明
None

表示没有值集。

Sum
Max
Min
Mean

TargetLagsMode

目标滞后选择模式。

说明
Auto

目标滞后将自动确定。

Custom

使用自定义目标滞后。

TargetRollingWindowSizeMode

目标滚动窗口大小模式。

说明
Auto

自动确定滚动窗口大小。

Custom

使用指定的滚动窗口大小。

TaskType

AutoMLJob 任务类型。

说明
Classification

机器学习和统计学中的分类是一种监督学习方法,其中计算机程序从给定给它的数据中学习并做出新的观察或分类。

Regression

回归是指使用输入数据预测值。 回归模型用于预测连续值。

Forecasting

预测是一种特殊的回归任务,它处理时间序列数据并创建预测模型,该模型可用于根据输入预测近期的值。

ImageClassification

图像分类。 当图像仅使用一组类中的单个标签进行分类时,使用多类图像分类 - 例如,每个图像被分类为“猫”或“狗”或“鸭子”的图像。

ImageClassificationMultilabel

图像分类多标签。 当图像可以具有一组标签中的一个或多个标签时,使用多标签图像分类 - 例如,图像可以同时标记为“猫”和“狗”。

ImageObjectDetection

图像对象检测。 对象检测用于识别图像中的对象并使用边界框定位每个对象,例如定位图像中的所有狗和猫,并在每个对象周围绘制一个边界框。

ImageInstanceSegmentation

图像实例分割。 实例分割用于在像素级别识别图像中的对象,在图像中的每个对象周围绘制一个多边形。

TextClassification

文本分类(也称为文本标记或文本分类)是将文本分类的过程。 类别是相互排斥的。

TextClassificationMultilabel

多标签分类任务将每个样本分配给一组(零个或多个)目标标签。

TextNER

文本命名实体识别,又名 TextNER。 命名实体识别 (NER) 是获取自由格式文本并识别人员、位置、组织等实体出现的能力。

TensorFlow

TensorFlow 分布配置。

名称 类型 默认值 说明
distributionType string:

TensorFlow

[必需]指定分发框架的类型。

parameterServerCount

integer (int32)

0

参数服务器任务数。

workerCount

integer (int32)

工人数。 如果未指定,则默认为实例计数。

TextClassification

AutoML NLP 垂直版中的文本分类任务。 NLP - 自然语言处理。

名称 类型 默认值 说明
featurizationSettings

NlpVerticalFeaturizationSettings

AutoML 作业所需的特征化输入。

limitSettings

NlpVerticalLimitSettings

AutoMLJob 的执行约束。

logVerbosity

LogVerbosity

Info

用于设置日志详细程度的枚举。

primaryMetric

ClassificationPrimaryMetrics

Accuracy

分类任务的主要指标。

targetColumnName

string

目标列名称:这是预测值列。 也称为分类任务的上下文中的标签列名称。

taskType string:

TextClassification

[必需]AutoMLJob 的任务类型。

trainingData

MLTableJobInput

[必需]训练数据输入。

validationData

MLTableJobInput

验证数据输入。

TextClassificationMultilabel

AutoML NLP 垂直领域的文本分类多标签任务。 NLP - 自然语言处理。

名称 类型 默认值 说明
featurizationSettings

NlpVerticalFeaturizationSettings

AutoML 作业所需的特征化输入。

limitSettings

NlpVerticalLimitSettings

AutoMLJob 的执行约束。

logVerbosity

LogVerbosity

Info

用于设置日志详细程度的枚举。

primaryMetric

ClassificationMultilabelPrimaryMetrics

文本 -Classification-Multilabel 任务的主要指标。 目前仅支持准确度作为主要指标,因此用户无需显式设置。

targetColumnName

string

目标列名称:这是预测值列。 也称为分类任务的上下文中的标签列名称。

taskType string:

TextClassificationMultilabel

[必需]AutoMLJob 的任务类型。

trainingData

MLTableJobInput

[必需]训练数据输入。

validationData

MLTableJobInput

验证数据输入。

TextNer

AutoML NLP 垂直 Text-NER 任务。 NER - 命名实体识别。 NLP - 自然语言处理。

名称 类型 默认值 说明
featurizationSettings

NlpVerticalFeaturizationSettings

AutoML 作业所需的特征化输入。

limitSettings

NlpVerticalLimitSettings

AutoMLJob 的执行约束。

logVerbosity

LogVerbosity

Info

用于设置日志详细程度的枚举。

primaryMetric

ClassificationPrimaryMetrics

Text-NER 任务的主要指标。 Text-NER 仅支持“准确性”,因此用户无需显式设置。

targetColumnName

string

目标列名称:这是预测值列。 也称为分类任务的上下文中的标签列名称。

taskType string:

TextNER

[必需]AutoMLJob 的任务类型。

trainingData

MLTableJobInput

[必需]训练数据输入。

validationData

MLTableJobInput

验证数据输入。

TrialComponent

试用组件定义。

名称 类型 说明
codeId

string

代码资产的 ARM 资源 ID。

command

string

minLength: 1
pattern: [a-zA-Z0-9_]

[必需]在启动作业时执行的命令。 eg. “python train.py”

distribution DistributionConfiguration:

作业的分发配置。 如果已设置,则应为 Mpi、Tensorflow、PyTorch 或 null 之一。

environmentId

string

minLength: 1
pattern: [a-zA-Z0-9_]

[必需]作业的环境规范的 ARM 资源 ID。

environmentVariables

object

作业中包含的环境变量。

resources

JobResourceConfiguration

作业的计算资源配置。

TritonModelJobInput

名称 类型 默认值 说明
description

string

输入的说明。

jobInputType string:

triton_model

[必需]指定作业的类型。

mode

InputDeliveryMode

ReadOnlyMount

枚举以确定输入数据传递模式。

uri

string

minLength: 1
pattern: [a-zA-Z0-9_]

[必需]输入资产 URI。

TritonModelJobOutput

名称 类型 默认值 说明
assetName

string

输出资产名称。

description

string

输出的说明。

jobOutputType string:

triton_model

[必需]指定作业的类型。

mode

OutputDeliveryMode

ReadWriteMount

输出数据传递模式枚举。

uri

string

输出资产 URI。

TruncationSelectionPolicy

定义提前终止策略,该策略在每个评估间隔内取消给定百分比的运行。

名称 类型 默认值 说明
delayEvaluation

integer (int32)

0

延迟第一次计算的间隔数。

evaluationInterval

integer (int32)

0

策略评估之间的间隔(运行数)。

policyType string:

TruncationSelection

[必需]策略配置的名称

truncationPercentage

integer (int32)

0

要在每个评估间隔取消的运行百分比。

UriFileJobInput

名称 类型 默认值 说明
description

string

输入的说明。

jobInputType string:

uri_file

[必需]指定作业的类型。

mode

InputDeliveryMode

ReadOnlyMount

枚举以确定输入数据传递模式。

uri

string

minLength: 1
pattern: [a-zA-Z0-9_]

[必需]输入资产 URI。

UriFileJobOutput

名称 类型 默认值 说明
assetName

string

输出资产名称。

description

string

输出的说明。

jobOutputType string:

uri_file

[必需]指定作业的类型。

mode

OutputDeliveryMode

ReadWriteMount

输出数据传递模式枚举。

uri

string

输出资产 URI。

UriFolderJobInput

名称 类型 默认值 说明
description

string

输入的说明。

jobInputType string:

uri_folder

[必需]指定作业的类型。

mode

InputDeliveryMode

ReadOnlyMount

枚举以确定输入数据传递模式。

uri

string

minLength: 1
pattern: [a-zA-Z0-9_]

[必需]输入资产 URI。

UriFolderJobOutput

名称 类型 默认值 说明
assetName

string

输出资产名称。

description

string

输出的说明。

jobOutputType string:

uri_folder

[必需]指定作业的类型。

mode

OutputDeliveryMode

ReadWriteMount

输出数据传递模式枚举。

uri

string

输出资产 URI。

UserIdentity

用户标识配置。

名称 类型 说明
identityType string:

UserIdentity

[必需]指定标识框架的类型。

UseStl

配置时序目标列的 STL 分解。

说明
None

无 stl 分解。

Season
SeasonTrend

ValidationMetricType

用于图像任务中验证指标的指标计算方法。

说明
None

没有指标。

Coco

可可度量。

Voc

VOC 指标。

CocoVoc

CocoVoc 指标。

WebhookType

枚举来确定 Webhook 回调服务类型。

说明
AzureDevOps