Jobs - Create Or Update
创建并执行作业。
对于更新情况,传入的定义中的 Tags 将替换现有作业中的 Tags。
创建并执行作业。
对于更新情况,传入的定义中的 Tags 将替换现有作业中的 Tags。
PUT https://management.azure.com/subscriptions/{subscriptionId}/resourceGroups/{resourceGroupName}/providers/Microsoft.MachineLearningServices/workspaces/{workspaceName}/jobs/{id}?api-version=2025-12-01
URI 参数
| 名称 | 在 | 必需 | 类型 | 说明 |
|---|---|---|---|---|
|
id
|
path | True |
string |
作业的名称和标识符。 这是区分大小写的。 |
|
resource
|
path | True |
string minLength: 1maxLength: 90 |
资源组的名称。 此名称不区分大小写。 |
|
subscription
|
path | True |
string minLength: 1 |
目标订阅的 ID。 |
|
workspace
|
path | True |
string pattern: ^[a-zA-Z0-9][a-zA-Z0-9_-]{2,32}$ |
Azure 机器学习工作区名称 |
|
api-version
|
query | True |
string minLength: 1 |
要用于此操作的 API 版本。 |
请求正文
| 名称 | 必需 | 类型 | 说明 |
|---|---|---|---|
| properties | True | JobBaseProperties: |
[必需]实体的其他属性。 |
响应
| 名称 | 类型 | 说明 |
|---|---|---|
| 200 OK |
资源“JobBase”更新作成功 |
|
| 201 Created |
资源“JobBase”创建作成功 |
|
| Other Status Codes |
意外错误响应。 |
安全性
azure_auth
Azure Active Directory OAuth2 流。
类型:
oauth2
流向:
implicit
授权 URL:
https://login.microsoftonline.com/common/oauth2/authorize
作用域
| 名称 | 说明 |
|---|---|
| user_impersonation | 模拟用户帐户 |
示例
|
Create |
|
Create |
|
Create |
|
Create |
CreateOrUpdate AutoML Job.
示例请求
PUT https://management.azure.com/subscriptions/00000000-1111-2222-3333-444444444444/resourceGroups/test-rg/providers/Microsoft.MachineLearningServices/workspaces/my-aml-workspace/jobs/string?api-version=2025-12-01
{
"properties": {
"description": "string",
"computeId": "string",
"displayName": "string",
"environmentId": "string",
"environmentVariables": {
"string": "string"
},
"experimentName": "string",
"identity": {
"identityType": "AMLToken"
},
"isArchived": false,
"jobType": "AutoML",
"outputs": {
"string": {
"description": "string",
"jobOutputType": "uri_file",
"mode": "ReadWriteMount",
"uri": "string"
}
},
"properties": {
"string": "string"
},
"resources": {
"instanceCount": 1,
"instanceType": "string",
"properties": {
"string": {
"9bec0ab0-c62f-4fa9-a97c-7b24bbcc90ad": null
}
}
},
"services": {
"string": {
"endpoint": "string",
"jobServiceType": "string",
"port": 1,
"properties": {
"string": "string"
}
}
},
"tags": {
"string": "string"
},
"taskDetails": {
"limitSettings": {
"maxTrials": 2
},
"modelSettings": {
"validationCropSize": 2
},
"searchSpace": [
{
"validationCropSize": "choice(2, 360)"
}
],
"targetColumnName": "string",
"taskType": "ImageClassification",
"trainingData": {
"jobInputType": "mltable",
"uri": "string"
}
}
}
}
示例响应
{
"name": "string",
"type": "string",
"id": "string",
"properties": {
"description": "string",
"computeId": "string",
"displayName": "string",
"environmentId": "string",
"environmentVariables": {
"string": "string"
},
"experimentName": "string",
"identity": {
"identityType": "AMLToken"
},
"isArchived": false,
"jobType": "AutoML",
"outputs": {
"string": {
"description": "string",
"jobOutputType": "uri_file",
"mode": "ReadWriteMount",
"uri": "string"
}
},
"properties": {
"string": "string"
},
"resources": {
"instanceCount": 1,
"instanceType": "string",
"properties": {
"string": {
"9bec0ab0-c62f-4fa9-a97c-7b24bbcc90ad": null
}
}
},
"services": {
"string": {
"endpoint": "string",
"errorMessage": "string",
"jobServiceType": "string",
"port": 1,
"properties": {
"string": "string"
},
"status": "string"
}
},
"status": "Scheduled",
"tags": {
"string": "string"
},
"taskDetails": {
"limitSettings": {
"maxTrials": 2
},
"modelSettings": {
"validationCropSize": 2
},
"searchSpace": [
{
"validationCropSize": "choice(2, 360)"
}
],
"targetColumnName": "string",
"taskType": "ImageClassification",
"trainingData": {
"jobInputType": "mltable",
"uri": "string"
}
}
},
"systemData": {
"createdAt": "2020-01-01T12:34:56.999Z",
"createdBy": "string",
"createdByType": "User",
"lastModifiedAt": "2020-01-01T12:34:56.999Z",
"lastModifiedBy": "string",
"lastModifiedByType": "ManagedIdentity"
}
}
{
"name": "string",
"type": "string",
"id": "string",
"properties": {
"description": "string",
"computeId": "string",
"displayName": "string",
"environmentId": "string",
"environmentVariables": {
"string": "string"
},
"experimentName": "string",
"identity": {
"identityType": "AMLToken"
},
"isArchived": false,
"jobType": "AutoML",
"outputs": {
"string": {
"description": "string",
"jobOutputType": "uri_file",
"mode": "ReadWriteMount",
"uri": "string"
}
},
"properties": {
"string": "string"
},
"resources": {
"instanceCount": 1,
"instanceType": "string",
"properties": {
"string": {
"9bec0ab0-c62f-4fa9-a97c-7b24bbcc90ad": null
}
}
},
"services": {
"string": {
"endpoint": "string",
"errorMessage": "string",
"jobServiceType": "string",
"port": 1,
"properties": {
"string": "string"
},
"status": "string"
}
},
"status": "Scheduled",
"tags": {
"string": "string"
},
"taskDetails": {
"limitSettings": {
"maxTrials": 2
},
"modelSettings": {
"validationCropSize": 2
},
"searchSpace": [
{
"validationCropSize": "choice(2, 360)"
}
],
"targetColumnName": "string",
"taskType": "ImageClassification",
"trainingData": {
"jobInputType": "mltable",
"uri": "string"
}
}
},
"systemData": {
"createdAt": "2020-01-01T12:34:56.999Z",
"createdBy": "string",
"createdByType": "User",
"lastModifiedAt": "2020-01-01T12:34:56.999Z",
"lastModifiedBy": "string",
"lastModifiedByType": "ManagedIdentity"
}
}
CreateOrUpdate Command Job.
示例请求
PUT https://management.azure.com/subscriptions/00000000-1111-2222-3333-444444444444/resourceGroups/test-rg/providers/Microsoft.MachineLearningServices/workspaces/my-aml-workspace/jobs/string?api-version=2025-12-01
{
"properties": {
"description": "string",
"codeId": "string",
"command": "string",
"computeId": "string",
"displayName": "string",
"distribution": {
"distributionType": "TensorFlow",
"parameterServerCount": 1,
"workerCount": 1
},
"environmentId": "string",
"environmentVariables": {
"string": "string"
},
"experimentName": "string",
"identity": {
"identityType": "AMLToken"
},
"inputs": {
"string": {
"description": "string",
"jobInputType": "literal",
"value": "string"
}
},
"jobType": "Command",
"limits": {
"jobLimitsType": "Command",
"timeout": "PT5M"
},
"outputs": {
"string": {
"description": "string",
"jobOutputType": "uri_file",
"mode": "ReadWriteMount",
"uri": "string"
}
},
"properties": {
"string": "string"
},
"resources": {
"instanceCount": 1,
"instanceType": "string",
"properties": {
"string": {
"e6b6493e-7d5e-4db3-be1e-306ec641327e": null
}
}
},
"services": {
"string": {
"endpoint": "string",
"jobServiceType": "string",
"port": 1,
"properties": {
"string": "string"
}
}
},
"tags": {
"string": "string"
}
}
}
示例响应
{
"name": "string",
"type": "string",
"id": "string",
"properties": {
"description": "string",
"codeId": "string",
"command": "string",
"computeId": "string",
"displayName": "string",
"distribution": {
"distributionType": "TensorFlow",
"parameterServerCount": 1,
"workerCount": 1
},
"environmentId": "string",
"environmentVariables": {
"string": "string"
},
"experimentName": "string",
"identity": {
"identityType": "AMLToken"
},
"inputs": {
"string": {
"description": "string",
"jobInputType": "literal",
"value": "string"
}
},
"jobType": "Command",
"limits": {
"jobLimitsType": "Command",
"timeout": "PT5M"
},
"outputs": {
"string": {
"description": "string",
"jobOutputType": "uri_file",
"mode": "ReadWriteMount",
"uri": "string"
}
},
"parameters": {
"string": "string"
},
"properties": {
"string": "string"
},
"resources": {
"instanceCount": 1,
"instanceType": "string",
"properties": {
"string": {
"a0847709-f5aa-4561-8ba5-d915d403fdcf": null
}
}
},
"services": {
"string": {
"endpoint": "string",
"errorMessage": "string",
"jobServiceType": "string",
"port": 1,
"properties": {
"string": "string"
},
"status": "string"
}
},
"status": "NotStarted",
"tags": {
"string": "string"
}
},
"systemData": {
"createdAt": "2020-01-01T12:34:56.999Z",
"createdBy": "string",
"createdByType": "User",
"lastModifiedAt": "2020-01-01T12:34:56.999Z",
"lastModifiedBy": "string",
"lastModifiedByType": "User"
}
}
{
"name": "string",
"type": "string",
"id": "string",
"properties": {
"description": "string",
"codeId": "string",
"command": "string",
"computeId": "string",
"displayName": "string",
"distribution": {
"distributionType": "TensorFlow",
"parameterServerCount": 1,
"workerCount": 1
},
"environmentId": "string",
"environmentVariables": {
"string": "string"
},
"experimentName": "string",
"identity": {
"identityType": "AMLToken"
},
"inputs": {
"string": {
"description": "string",
"jobInputType": "literal",
"value": "string"
}
},
"jobType": "Command",
"limits": {
"jobLimitsType": "Command",
"timeout": "PT5M"
},
"outputs": {
"string": {
"description": "string",
"jobOutputType": "uri_file",
"mode": "ReadWriteMount",
"uri": "string"
}
},
"parameters": {
"string": "string"
},
"properties": {
"string": "string"
},
"resources": {
"instanceCount": 1,
"instanceType": "string",
"properties": {
"string": {
"b8163d40-c351-43d6-8a34-d0cd895b8a5a": null
}
}
},
"services": {
"string": {
"endpoint": "string",
"errorMessage": "string",
"jobServiceType": "string",
"port": 1,
"properties": {
"string": "string"
},
"status": "string"
}
},
"status": "NotStarted",
"tags": {
"string": "string"
}
},
"systemData": {
"createdAt": "2020-01-01T12:34:56.999Z",
"createdBy": "string",
"createdByType": "User",
"lastModifiedAt": "2020-01-01T12:34:56.999Z",
"lastModifiedBy": "string",
"lastModifiedByType": "User"
}
}
CreateOrUpdate Pipeline Job.
示例请求
PUT https://management.azure.com/subscriptions/00000000-1111-2222-3333-444444444444/resourceGroups/test-rg/providers/Microsoft.MachineLearningServices/workspaces/my-aml-workspace/jobs/string?api-version=2025-12-01
{
"properties": {
"description": "string",
"computeId": "string",
"displayName": "string",
"experimentName": "string",
"inputs": {
"string": {
"description": "string",
"jobInputType": "literal",
"value": "string"
}
},
"jobType": "Pipeline",
"outputs": {
"string": {
"description": "string",
"jobOutputType": "uri_file",
"mode": "Upload",
"uri": "string"
}
},
"properties": {
"string": "string"
},
"services": {
"string": {
"endpoint": "string",
"jobServiceType": "string",
"port": 1,
"properties": {
"string": "string"
}
}
},
"settings": {},
"tags": {
"string": "string"
}
}
}
示例响应
{
"name": "string",
"type": "string",
"id": "string",
"properties": {
"description": "string",
"computeId": "string",
"displayName": "string",
"experimentName": "string",
"inputs": {
"string": {
"description": "string",
"jobInputType": "literal",
"value": "string"
}
},
"jobType": "Pipeline",
"outputs": {
"string": {
"description": "string",
"jobOutputType": "uri_file",
"mode": "Upload",
"uri": "string"
}
},
"properties": {
"string": "string"
},
"services": {
"string": {
"endpoint": "string",
"errorMessage": "string",
"jobServiceType": "string",
"port": 1,
"properties": {
"string": "string"
},
"status": "string"
}
},
"settings": {},
"status": "NotStarted",
"tags": {
"string": "string"
}
},
"systemData": {
"createdAt": "2020-01-01T12:34:56.999Z",
"createdBy": "string",
"createdByType": "User",
"lastModifiedAt": "2020-01-01T12:34:56.999Z",
"lastModifiedBy": "string",
"lastModifiedByType": "User"
}
}
{
"name": "string",
"type": "string",
"id": "string",
"properties": {
"description": "string",
"computeId": "string",
"displayName": "string",
"experimentName": "string",
"inputs": {
"string": {
"description": "string",
"jobInputType": "literal",
"value": "string"
}
},
"jobType": "Pipeline",
"outputs": {
"string": {
"description": "string",
"jobOutputType": "uri_file",
"mode": "Upload",
"uri": "string"
}
},
"properties": {
"string": "string"
},
"services": {
"string": {
"endpoint": "string",
"errorMessage": "string",
"jobServiceType": "string",
"port": 1,
"properties": {
"string": "string"
},
"status": "string"
}
},
"settings": {},
"status": "NotStarted",
"tags": {
"string": "string"
}
},
"systemData": {
"createdAt": "2020-01-01T12:34:56.999Z",
"createdBy": "string",
"createdByType": "User",
"lastModifiedAt": "2020-01-01T12:34:56.999Z",
"lastModifiedBy": "string",
"lastModifiedByType": "User"
}
}
CreateOrUpdate Sweep Job.
示例请求
PUT https://management.azure.com/subscriptions/00000000-1111-2222-3333-444444444444/resourceGroups/test-rg/providers/Microsoft.MachineLearningServices/workspaces/my-aml-workspace/jobs/string?api-version=2025-12-01
{
"properties": {
"description": "string",
"computeId": "string",
"displayName": "string",
"earlyTermination": {
"delayEvaluation": 1,
"evaluationInterval": 1,
"policyType": "MedianStopping"
},
"experimentName": "string",
"jobType": "Sweep",
"limits": {
"jobLimitsType": "Sweep",
"maxConcurrentTrials": 1,
"maxTotalTrials": 1,
"trialTimeout": "PT1S"
},
"objective": {
"goal": "Minimize",
"primaryMetric": "string"
},
"properties": {
"string": "string"
},
"samplingAlgorithm": {
"samplingAlgorithmType": "Grid"
},
"searchSpace": {
"string": {}
},
"services": {
"string": {
"endpoint": "string",
"jobServiceType": "string",
"port": 1,
"properties": {
"string": "string"
}
}
},
"tags": {
"string": "string"
},
"trial": {
"codeId": "string",
"command": "string",
"distribution": {
"distributionType": "Mpi",
"processCountPerInstance": 1
},
"environmentId": "string",
"environmentVariables": {
"string": "string"
},
"resources": {
"instanceCount": 1,
"instanceType": "string",
"properties": {
"string": {
"e6b6493e-7d5e-4db3-be1e-306ec641327e": null
}
}
}
}
}
}
示例响应
{
"name": "string",
"type": "string",
"id": "string",
"properties": {
"description": "string",
"computeId": "string",
"displayName": "string",
"earlyTermination": {
"delayEvaluation": 1,
"evaluationInterval": 1,
"policyType": "MedianStopping"
},
"experimentName": "string",
"jobType": "Sweep",
"limits": {
"jobLimitsType": "Sweep",
"maxConcurrentTrials": 1,
"maxTotalTrials": 1,
"trialTimeout": "PT1S"
},
"objective": {
"goal": "Minimize",
"primaryMetric": "string"
},
"properties": {
"string": "string"
},
"samplingAlgorithm": {
"samplingAlgorithmType": "Grid"
},
"searchSpace": {
"string": {}
},
"services": {
"string": {
"endpoint": "string",
"errorMessage": "string",
"jobServiceType": "string",
"port": 1,
"properties": {
"string": "string"
},
"status": "string"
}
},
"status": "NotStarted",
"tags": {
"string": "string"
},
"trial": {
"codeId": "string",
"command": "string",
"distribution": {
"distributionType": "Mpi",
"processCountPerInstance": 1
},
"environmentId": "string",
"environmentVariables": {
"string": "string"
},
"resources": {
"instanceCount": 1,
"instanceType": "string",
"properties": {
"string": {
"e6b6493e-7d5e-4db3-be1e-306ec641327e": null
}
}
}
}
},
"systemData": {
"createdAt": "2020-01-01T12:34:56.999Z",
"createdBy": "string",
"createdByType": "User",
"lastModifiedAt": "2020-01-01T12:34:56.999Z",
"lastModifiedBy": "string",
"lastModifiedByType": "User"
}
}
{
"name": "string",
"type": "string",
"id": "string",
"properties": {
"description": "string",
"computeId": "string",
"displayName": "string",
"earlyTermination": {
"delayEvaluation": 1,
"evaluationInterval": 1,
"policyType": "MedianStopping"
},
"experimentName": "string",
"jobType": "Sweep",
"limits": {
"jobLimitsType": "Sweep",
"maxConcurrentTrials": 1,
"maxTotalTrials": 1,
"trialTimeout": "PT1S"
},
"objective": {
"goal": "Minimize",
"primaryMetric": "string"
},
"properties": {
"string": "string"
},
"samplingAlgorithm": {
"samplingAlgorithmType": "Grid"
},
"searchSpace": {
"string": {}
},
"services": {
"string": {
"endpoint": "string",
"errorMessage": "string",
"jobServiceType": "string",
"port": 1,
"properties": {
"string": "string"
},
"status": "string"
}
},
"status": "NotStarted",
"tags": {
"string": "string"
},
"trial": {
"codeId": "string",
"command": "string",
"distribution": {
"distributionType": "Mpi",
"processCountPerInstance": 1
},
"environmentId": "string",
"environmentVariables": {
"string": "string"
},
"resources": {
"instanceCount": 1,
"instanceType": "string",
"properties": {
"string": {
"e6b6493e-7d5e-4db3-be1e-306ec641327e": null
}
}
}
}
},
"systemData": {
"createdAt": "2020-01-01T12:34:56.999Z",
"createdBy": "string",
"createdByType": "User",
"lastModifiedAt": "2020-01-01T12:34:56.999Z",
"lastModifiedBy": "string",
"lastModifiedByType": "User"
}
}
定义
| 名称 | 说明 |
|---|---|
|
All |
所有节点表示服务将在作业的所有节点上运行 |
|
Aml |
AML 令牌身份配置。 |
|
Auto |
由系统自动确定的预测范围。 |
|
Auto |
AutoMLJob 类。 使用此类执行 AutoML 任务,如分类/回归等。有关支持的所有任务,请参阅 TaskType 枚举。 |
|
Auto |
自动确定 N-Cross 验证。 |
|
Auto |
|
|
Auto |
|
|
Auto |
目标滞后滚动窗口自动确定。 |
|
Azure |
特定于 Azure DevOps 的 Webhook 详细信息 |
|
Bandit |
根据松弛标准定义提前终止策略,以及用于评估的频率和延迟间隔 |
|
Bayesian |
定义一个采样算法,该算法根据以前的值生成值 |
|
Blocked |
AutoML 支持的所有分类模型的枚举。 |
| Classification |
AutoML Table 垂直中的分类任务。 |
|
Classification |
AutoML 支持的所有分类模型的枚举。 |
|
Classification |
分类多标签任务的主要指标。 |
|
Classification |
分类任务的主要指标。 |
|
Classification |
分类训练相关配置。 |
|
Command |
命令作业定义。 |
|
Command |
命令作业限制类。 |
|
created |
创建资源的标识的类型。 |
|
Custom |
所需最大预测范围(以时序频率单位为单位)。 |
|
Custom |
|
|
Custom |
|
|
Custom |
N-Cross 验证由用户指定。 |
|
Custom |
|
|
Custom |
|
|
Custom |
|
|
Distribution |
枚举以确定作业分布类型。 |
|
Early |
|
|
Email |
枚举以确定电子邮件通知类型。 |
|
Error |
资源管理错误附加信息。 |
|
Error |
错误详细信息。 |
|
Error |
错误响应 |
|
Feature |
用于为数值特征生成滞后的标志。 |
|
Featurization |
特征化模式 - 用户可以保留默认的“自动”模式,AutoML 将负责在特征化阶段对数据进行必要的转换。 如果选择了“关闭”,则不会完成特征化。 如果选择“自定义”,则用户可以指定其他输入以自定义特征化完成方式。 |
|
Forecast |
枚举以确定预测范围选择模式。 |
| Forecasting |
AutoML Table 垂直中的预测任务。 |
|
Forecasting |
AutoML 支持的所有预测模型的枚举。 |
|
Forecasting |
预测任务的主要指标。 |
|
Forecasting |
预测特定参数。 |
|
Forecasting |
预测培训相关配置。 |
| Goal |
定义超参数优化支持的指标目标 |
|
Grid |
定义一个采样算法,该算法详尽地生成空间中的每个值组合 |
|
Identity |
枚举来确定标识框架。 |
|
Image |
图像分类。 当图像仅使用一组类中的单个标签进行分类时,使用多类图像分类 - 例如,每个图像被分类为“猫”或“狗”或“鸭子”的图像。 |
|
Image |
图像分类多标签。 当图像可以具有一组标签中的一个或多个标签时,使用多标签图像分类 - 例如,图像可以同时标记为“猫”和“狗”。 |
|
Image |
图像实例分割。 实例分割用于在像素级别识别图像中的对象,在图像中的每个对象周围绘制一个多边形。 |
|
Image |
限制 AutoML 作业的设置。 |
|
Image |
用于扫描模型设置值的分布表达式。 <示例> 一些例子是:
|
|
Image |
用于扫描模型设置值的分布表达式。 <示例> 一些例子是:
|
|
Image |
用于训练模型的设置。 有关可用设置的更多信息,请访问官方文档: https://docs.microsoft.com/en-us/azure/machine-learning/how-to-auto-train-image-models。 |
|
Image |
用于训练模型的设置。 有关可用设置的更多信息,请访问官方文档: https://docs.microsoft.com/en-us/azure/machine-learning/how-to-auto-train-image-models。 |
|
Image |
图像对象检测。 对象检测用于识别图像中的对象并使用边界框定位每个对象,例如定位图像中的所有狗和猫,并在每个对象周围绘制一个边界框。 |
|
Image |
模型扫描和超参数扫描相关设置。 |
|
Input |
枚举以确定输入数据传递模式。 |
|
Instance |
InstanceSegmentation 任务的主要指标。 |
|
Job |
Azure 资源管理器资源信封。 |
|
Job |
枚举以确定作业输入类型。 |
|
Job |
|
|
Job |
枚举以确定作业输出类型。 |
|
Job |
|
|
Job |
作业端点定义 |
|
Job |
作业的状态。 |
|
Job |
用于确定作业层的枚举。 |
|
Job |
枚举以确定作业类型。 |
|
Learning |
学习率调度程序枚举。 |
|
Literal |
文字输入类型。 |
|
Log |
用于设置日志详细程度的枚举。 |
|
Managed |
托管标识配置。 |
|
Median |
根据所有运行的主要指标的运行平均值定义提前终止策略 |
|
MLFlow |
|
|
MLFlow |
|
|
MLTable |
|
|
MLTable |
|
|
Model |
图像模型大小。 |
| Mpi |
MPI 分发配置。 |
|
NCross |
确定如何确定 N-Cross 验证值。 |
|
Nlp |
|
|
Nlp |
作业执行约束。 |
|
Nodes |
节点值的枚举类型 |
|
Notification |
通知的配置。 |
|
Object |
图像对象检测任务的主要指标。 |
| Objective |
优化目标。 |
|
Output |
输出数据传递模式枚举。 |
|
Pipeline |
管道作业定义:定义通用到 MFE 属性。 |
|
Py |
PyTorch 分发配置。 |
|
Queue |
|
|
Random |
定义随机生成值的采样算法 |
|
Random |
随机算法的特定类型 |
| Regression |
AutoML Table 垂直中的回归任务。 |
|
Regression |
AutoML 支持的所有回归模型的枚举。 |
|
Regression |
回归任务的主要指标。 |
|
Regression |
回归训练相关配置。 |
|
Sampling |
|
|
Seasonality |
预测季节性模式。 |
|
Short |
定义 AutoML 如何处理短时序的参数。 |
|
Spark |
Spark 作业定义。 |
|
Spark |
|
|
Spark |
|
|
Spark |
|
|
Spark |
|
|
Stack |
用于自定义 StackEnsemble 运行的高级设置。 |
|
Stack |
元学习器是一个基于各个异构模型输出训练的模型。\r\n默认的元学习器是用于分类任务的LogisticRegression(如果启用交叉验证则用LogisticRegressionCV),用于回归/预测任务的ElasticNet(或启用交叉验证则用ElasticNetCV)。\r\n该参数可以是以下字符串之一:LogisticRegression、LogisticRegressionCV、LightGBMClassifier、ElasticNet、ElasticNetCV、LightGBMRegressor 或 LinearRegression |
|
Stochastic |
图像模型的随机优化器。 |
|
Sweep |
扫描作业定义。 |
|
Sweep |
扫描作业限制类。 |
|
system |
与创建和上次修改资源相关的元数据。 |
|
Table |
特征化配置。 |
|
Table |
作业执行约束。 |
|
Target |
目标聚合函数。 |
|
Target |
目标滞后选择模式。 |
|
Target |
目标滚动窗口大小模式。 |
|
Task |
AutoMLJob 任务类型。 |
|
Tensor |
TensorFlow 分布配置。 |
|
Text |
AutoML NLP 垂直版中的文本分类任务。 NLP - 自然语言处理。 |
|
Text |
AutoML NLP 垂直领域的文本分类多标签任务。 NLP - 自然语言处理。 |
|
Text |
AutoML NLP 垂直 Text-NER 任务。 NER - 命名实体识别。 NLP - 自然语言处理。 |
|
Trial |
试用组件定义。 |
|
Triton |
|
|
Triton |
|
|
Truncation |
定义提前终止策略,该策略在每个评估间隔内取消给定百分比的运行。 |
|
Uri |
|
|
Uri |
|
|
Uri |
|
|
Uri |
|
|
User |
用户标识配置。 |
|
Use |
配置时序目标列的 STL 分解。 |
|
Validation |
用于图像任务中验证指标的指标计算方法。 |
|
Webhook |
枚举来确定 Webhook 回调服务类型。 |
AllNodes
所有节点表示服务将在作业的所有节点上运行
| 名称 | 类型 | 说明 |
|---|---|---|
| nodesValueType |
string:
All |
[必需]Nodes 值的类型 |
AmlToken
AML 令牌身份配置。
| 名称 | 类型 | 说明 |
|---|---|---|
| identityType |
string:
AMLToken |
[必需]指定标识框架的类型。 |
AutoForecastHorizon
由系统自动确定的预测范围。
| 名称 | 类型 | 说明 |
|---|---|---|
| mode |
string:
Auto |
[必需]设置预测地平线值选择模式。 |
AutoMLJob
AutoMLJob 类。 使用此类执行 AutoML 任务,如分类/回归等。有关支持的所有任务,请参阅 TaskType 枚举。
| 名称 | 类型 | 默认值 | 说明 |
|---|---|---|---|
| componentId |
string |
组件资源的 ARM 资源 ID。 |
|
| computeId |
string |
计算资源的 ARM 资源 ID。 |
|
| description |
string |
资产说明文本。 |
|
| displayName |
string |
作业的显示名称。 |
|
| environmentId |
string |
作业的环境规范的 ARM 资源 ID。 这是一个可选值,如果未提供,AutoML 将在运行作业时将其默认为生产 AutoML 特选环境版本。 |
|
| environmentVariables |
object |
作业中包含的环境变量。 |
|
| experimentName |
string |
Default |
作业所属的试验的名称。 如果未设置,作业将放置在“默认”试验中。 |
| identity | IdentityConfiguration: |
标识配置。 如果已设置,则应为 AmlToken、ManagedIdentity、UserIdentity 或 null 之一。 如果为 null,则默认为 AmlToken。 |
|
| isArchived |
boolean |
False |
资产是否已存档? |
| jobType |
string:
AutoML |
[必需]指定作业的类型。 |
|
| notificationSetting |
作业的通知设置 |
||
| outputs |
object |
作业中使用的输出数据绑定的映射。 |
|
| properties |
object |
资产属性字典。 |
|
| queueSettings |
作业的队列设置 |
||
| resources |
作业的计算资源配置。 |
||
| services |
<string,
Job |
JobEndpoints 列表。 对于本地作业,作业终结点的终结点值为 FileStreamObject。 |
|
| status |
作业状态。 |
||
| tags |
object |
标记字典。 可以添加、删除和更新标记。 |
|
| taskDetails | AutoMLVertical: |
[必需]这表示可以是表/NLP/Image 之一的方案 |
AutoNCrossValidations
自动确定 N-Cross 验证。
| 名称 | 类型 | 说明 |
|---|---|---|
| mode |
string:
Auto |
[必需]用于确定 N 交叉验证的模式。 |
AutoSeasonality
| 名称 | 类型 | 说明 |
|---|---|---|
| mode |
string:
Auto |
[必需]季节性模式。 |
AutoTargetLags
| 名称 | 类型 | 说明 |
|---|---|---|
| mode |
string:
Auto |
[必需]设置目标滞后模式 - 自动/自定义 |
AutoTargetRollingWindowSize
目标滞后滚动窗口自动确定。
| 名称 | 类型 | 说明 |
|---|---|---|
| mode |
string:
Auto |
[必需]TargetRollingWindowSiz 检测模式。 |
AzureDevOpsWebhook
特定于 Azure DevOps 的 Webhook 详细信息
| 名称 | 类型 | 说明 |
|---|---|---|
| eventType |
string |
对指定的通知事件发送回调 |
| webhookType |
string:
Azure |
[必需]指定要发送回调的服务的类型 |
BanditPolicy
根据松弛标准定义提前终止策略,以及用于评估的频率和延迟间隔
| 名称 | 类型 | 默认值 | 说明 |
|---|---|---|---|
| delayEvaluation |
integer (int32) |
0 |
延迟第一次计算的间隔数。 |
| evaluationInterval |
integer (int32) |
0 |
策略评估之间的间隔(运行数)。 |
| policyType |
string:
Bandit |
[必需]策略配置的名称 |
|
| slackAmount |
number (float) |
0 |
从性能最佳的运行中允许的绝对距离。 |
| slackFactor |
number (float) |
0 |
与性能最佳的运行距离的允许距离比率。 |
BayesianSamplingAlgorithm
定义一个采样算法,该算法根据以前的值生成值
| 名称 | 类型 | 说明 |
|---|---|---|
| samplingAlgorithmType |
string:
Bayesian |
[必需]用于生成超参数值的算法以及配置属性 |
BlockedTransformers
AutoML 支持的所有分类模型的枚举。
| 值 | 说明 |
|---|---|
| TextTargetEncoder |
文本数据的目标编码。 |
| OneHotEncoder |
Ohe 热编码创建二进制特征转换。 |
| CatTargetEncoder |
分类数据的目标编码。 |
| TfIdf |
Tf-Idf 代表术语-频率乘以反文档-频率。 这是用于从文档中识别信息的常用术语加权方案。 |
| WoETargetEncoder |
证据权重编码是一种用于编码分类变量的技术。 它使用 P(1)/P(0) 的自然对数来创建权重。 |
| LabelEncoder |
标签编码器以数字形式转换标签/分类变量。 |
| WordEmbedding |
单词嵌入有助于将单词或短语表示为向量或一系列数字。 |
| NaiveBayes |
朴素贝叶斯是一种分类,用于分类分布的离散特征的分类。 |
| CountVectorizer |
计数矢量化器将文本文档的集合转换为标记计数矩阵。 |
| HashOneHotEncoder |
对一个热编码器进行哈希处理可以将分类变量转换为有限数量的新功能。 这通常用于高基数分类特征。 |
Classification
AutoML Table 垂直中的分类任务。
| 名称 | 类型 | 默认值 | 说明 |
|---|---|---|---|
| cvSplitColumnNames |
string[] |
用于 CVSplit 数据的列。 |
|
| featurizationSettings |
AutoML 作业所需的特征化输入。 |
||
| limitSettings |
AutoMLJob 的执行约束。 |
||
| logVerbosity | Info |
用于设置日志详细程度的枚举。 |
|
| nCrossValidations | NCrossValidations: |
未提供验证数据集时要应用于训练数据集的交叉验证折叠数。 |
|
| positiveLabel |
string |
二进制指标计算的正标签。 |
|
| primaryMetric | AUCWeighted |
分类任务的主要指标。 |
|
| targetColumnName |
string |
目标列名称:这是预测值列。 也称为分类任务的上下文中的标签列名称。 |
|
| taskType | string: |
[必需]AutoMLJob 的任务类型。 |
|
| testData |
测试数据输入。 |
||
| testDataSize |
number (double) |
需要为验证目的预留的测试数据集的分数。 介于 (0.0 , 1.0) 之间的值 未提供验证数据集时应用。 |
|
| trainingData |
[必需]训练数据输入。 |
||
| trainingSettings |
AutoML 作业训练阶段的输入。 |
||
| validationData |
验证数据输入。 |
||
| validationDataSize |
number (double) |
需要留出用于验证的定型数据集的分数。 介于 (0.0 , 1.0) 之间的值 未提供验证数据集时应用。 |
|
| weightColumnName |
string |
示例权重列的名称。 自动化 ML 支持加权列作为输入,导致数据中的行向上或向下加权。 |
ClassificationModels
AutoML 支持的所有分类模型的枚举。
| 值 | 说明 |
|---|---|
| LogisticRegression |
逻辑回归是一种基本的分类技术。 它属于线性分类器组,有点类似于多项式和线性回归。 逻辑回归速度快,相对简单,方便您解释结果。 虽然它本质上是一种二元分类方法,但它也可以应用于多类问题。 |
| SGD |
SGD:随机梯度下降是一种优化算法,常用于机器学习应用,用于找到与预测输出和实际输出之间最佳拟合相对应的模型参数。 |
| MultinomialNaiveBayes |
多项朴素贝叶斯分类器适用于具有离散特征的分类(例如,文本分类的字数统计)。 多项式分布通常需要整数特征计数。 然而,在实践中,诸如 tf-idf 之类的小数计数也可能有效。 |
| BernoulliNaiveBayes |
多元伯努利模型的朴素贝叶斯分类器。 |
| SVM |
支持向量机 (SVM) 是一种监督机器学习模型,它使用分类算法来解决两组分类问题。 在为 SVM 模型提供每个类别的标记训练数据集后,他们能够对新文本进行分类。 |
| LinearSVM |
支持向量机 (SVM) 是一种监督机器学习模型,它使用分类算法来解决两组分类问题。 在为 SVM 模型提供每个类别的标记训练数据集后,他们能够对新文本进行分类。 当输入数据是线性的时,线性 SVM 的性能最佳,即可以通过在绘制的图形上绘制分类值之间的直线来轻松对数据进行分类。 |
| KNN |
K 最近邻 (KNN) 算法使用“特征相似性”来预测新数据点的值,这进一步意味着新数据点将根据它与训练集中点的匹配程度分配一个值。 |
| DecisionTree |
决策树是一种非参数监督学习方法,用于分类和回归任务。 目标是创建一个模型,通过学习从数据特征推断的简单决策规则来预测目标变量的值。 |
| RandomForest |
随机森林是一种监督学习算法。 它构建的“森林”是决策树的集合,通常使用“装袋”方法进行训练。 套袋方法的总体思路是学习模型的组合增加了整体结果。 |
| ExtremeRandomTrees |
Extreme Trees 是一种集成机器学习算法,它结合了许多决策树的预测。 它与广泛使用的随机森林算法有关。 |
| LightGBM |
LightGBM 是一个梯度提升框架,它使用基于树的学习算法。 |
| GradientBoosting |
将周学习者转变为强学习者的技术称为提升。 梯度提升算法过程基于这种执行理论。 |
| XGBoostClassifier |
XGBoost:极限梯度提升算法。 此算法用于结构化数据,其中目标列值可以划分为不同的类值。 |
ClassificationMultilabelPrimaryMetrics
分类多标签任务的主要指标。
| 值 | 说明 |
|---|---|
| AUCWeighted |
AUC 是曲线下面积。 该指标表示每个类的分数的算术平均值,按每个类中的真实实例数加权。 |
| Accuracy |
Accuracy 是与真实类标签完全匹配的预测比率。 |
| NormMacroRecall |
规范化宏召回率是对宏召回率进行规范化和平均化,因此,随机性能的评分为 0,完美性能的评分为 1。 |
| AveragePrecisionScoreWeighted |
每个类的平均精度分数的算术平均值,按每个类中的真实实例数加权。 |
| PrecisionScoreWeighted |
每个类的精度算术平均值,按每个类中的真实实例数加权。 |
| IOU |
交集越联合。 预测除以预测并集的交集。 |
ClassificationPrimaryMetrics
分类任务的主要指标。
| 值 | 说明 |
|---|---|
| AUCWeighted |
AUC 是曲线下面积。 该指标表示每个类的分数的算术平均值,按每个类中的真实实例数加权。 |
| Accuracy |
Accuracy 是与真实类标签完全匹配的预测比率。 |
| NormMacroRecall |
规范化宏召回率是对宏召回率进行规范化和平均化,因此,随机性能的评分为 0,完美性能的评分为 1。 |
| AveragePrecisionScoreWeighted |
每个类的平均精度分数的算术平均值,按每个类中的真实实例数加权。 |
| PrecisionScoreWeighted |
每个类的精度算术平均值,按每个类中的真实实例数加权。 |
ClassificationTrainingSettings
分类训练相关配置。
| 名称 | 类型 | 默认值 | 说明 |
|---|---|---|---|
| allowedTrainingAlgorithms |
分类任务的允许模型。 |
||
| blockedTrainingAlgorithms |
分类任务的阻止模型。 |
||
| enableDnnTraining |
boolean |
False |
启用 DNN 模型的建议。 |
| enableModelExplainability |
boolean |
True |
标志以在最佳模型上启用可解释性。 |
| enableOnnxCompatibleModels |
boolean |
False |
用于启用 onnx 兼容模型的标志。 |
| enableStackEnsemble |
boolean |
True |
启用堆栈合奏运行。 |
| enableVoteEnsemble |
boolean |
True |
启用投票合奏运行。 |
| ensembleModelDownloadTimeout |
string (duration) |
PT5M |
在 VotingEnsemble 和 StackEnsemble 模型生成期间,将下载先前子运行中的多个拟合模型。 如果需要更多时间,请将此参数配置为大于 300 秒的值。 |
| stackEnsembleSettings |
堆栈合奏的堆栈合奏设置。 |
CommandJob
命令作业定义。
| 名称 | 类型 | 默认值 | 说明 |
|---|---|---|---|
| codeId |
string |
代码资产的 ARM 资源 ID。 |
|
| command |
string minLength: 1pattern: [a-zA-Z0-9_] |
[必需]在启动作业时执行的命令。 eg. “python train.py” |
|
| componentId |
string |
组件资源的 ARM 资源 ID。 |
|
| computeId |
string |
计算资源的 ARM 资源 ID。 |
|
| description |
string |
资产说明文本。 |
|
| displayName |
string |
作业的显示名称。 |
|
| distribution | DistributionConfiguration: |
作业的分发配置。 如果已设置,则应为 Mpi、Tensorflow、PyTorch 或 null 之一。 |
|
| environmentId |
string minLength: 1pattern: [a-zA-Z0-9_] |
[必需]作业的环境规范的 ARM 资源 ID。 |
|
| environmentVariables |
object |
作业中包含的环境变量。 |
|
| experimentName |
string |
Default |
作业所属的试验的名称。 如果未设置,作业将放置在“默认”试验中。 |
| identity | IdentityConfiguration: |
标识配置。 如果已设置,则应为 AmlToken、ManagedIdentity、UserIdentity 或 null 之一。 如果为 null,则默认为 AmlToken。 |
|
| inputs |
object |
作业中使用的输入数据绑定的映射。 |
|
| isArchived |
boolean |
False |
资产是否已存档? |
| jobType |
string:
Command |
[必需]指定作业的类型。 |
|
| limits |
命令作业限制。 |
||
| notificationSetting |
作业的通知设置 |
||
| outputs |
object |
作业中使用的输出数据绑定的映射。 |
|
| parameters |
输入参数。 |
||
| properties |
object |
资产属性字典。 |
|
| queueSettings |
作业的队列设置 |
||
| resources |
作业的计算资源配置。 |
||
| services |
<string,
Job |
JobEndpoints 列表。 对于本地作业,作业终结点的终结点值为 FileStreamObject。 |
|
| status |
作业状态。 |
||
| tags |
object |
标记字典。 可以添加、删除和更新标记。 |
CommandJobLimits
命令作业限制类。
| 名称 | 类型 | 说明 |
|---|---|---|
| jobLimitsType |
string:
Command |
[必需]JobLimit 类型。 |
| timeout |
string (duration) |
ISO 8601 格式的最大运行持续时间,之后作业将被取消。 仅支持精度为秒的持续时间。 |
createdByType
创建资源的标识的类型。
| 值 | 说明 |
|---|---|
| User | |
| Application | |
| ManagedIdentity | |
| Key |
CustomForecastHorizon
所需最大预测范围(以时序频率单位为单位)。
| 名称 | 类型 | 说明 |
|---|---|---|
| mode |
string:
Custom |
[必需]设置预测地平线值选择模式。 |
| value |
integer (int32) |
[必需]预测地平线值。 |
CustomModelJobInput
| 名称 | 类型 | 默认值 | 说明 |
|---|---|---|---|
| description |
string |
输入的说明。 |
|
| jobInputType |
string:
custom_model |
[必需]指定作业的类型。 |
|
| mode | ReadOnlyMount |
枚举以确定输入数据传递模式。 |
|
| uri |
string minLength: 1pattern: [a-zA-Z0-9_] |
[必需]输入资产 URI。 |
CustomModelJobOutput
| 名称 | 类型 | 默认值 | 说明 |
|---|---|---|---|
| assetName |
string |
输出资产名称。 |
|
| description |
string |
输出的说明。 |
|
| jobOutputType |
string:
custom_model |
[必需]指定作业的类型。 |
|
| mode | ReadWriteMount |
输出数据传递模式枚举。 |
|
| uri |
string |
输出资产 URI。 |
CustomNCrossValidations
N-Cross 验证由用户指定。
| 名称 | 类型 | 说明 |
|---|---|---|
| mode |
string:
Custom |
[必需]用于确定 N 交叉验证的模式。 |
| value |
integer (int32) |
[必需]N 交叉验证值。 |
CustomSeasonality
| 名称 | 类型 | 说明 |
|---|---|---|
| mode |
string:
Custom |
[必需]季节性模式。 |
| value |
integer (int32) |
[必需]季节性值。 |
CustomTargetLags
| 名称 | 类型 | 说明 |
|---|---|---|
| mode |
string:
Custom |
[必需]设置目标滞后模式 - 自动/自定义 |
| values |
integer[] (int32) |
[必需]设置目标滞后值。 |
CustomTargetRollingWindowSize
| 名称 | 类型 | 说明 |
|---|---|---|
| mode |
string:
Custom |
[必需]TargetRollingWindowSiz 检测模式。 |
| value |
integer (int32) |
[必需]TargetRollingWindowSize 值。 |
DistributionType
枚举以确定作业分布类型。
| 值 | 说明 |
|---|---|
| PyTorch | |
| TensorFlow | |
| Mpi |
EarlyTerminationPolicyType
| 值 | 说明 |
|---|---|
| Bandit | |
| MedianStopping | |
| TruncationSelection |
EmailNotificationEnableType
枚举以确定电子邮件通知类型。
| 值 | 说明 |
|---|---|
| JobCompleted | |
| JobFailed | |
| JobCancelled |
ErrorAdditionalInfo
资源管理错误附加信息。
| 名称 | 类型 | 说明 |
|---|---|---|
| info |
object |
其他信息。 |
| type |
string |
其他信息类型。 |
ErrorDetail
错误详细信息。
| 名称 | 类型 | 说明 |
|---|---|---|
| additionalInfo |
错误附加信息。 |
|
| code |
string |
错误代码。 |
| details |
错误详细信息。 |
|
| message |
string |
错误消息。 |
| target |
string |
错误目标。 |
ErrorResponse
错误响应
| 名称 | 类型 | 说明 |
|---|---|---|
| error |
错误对象。 |
FeatureLags
用于为数值特征生成滞后的标志。
| 值 | 说明 |
|---|---|
| None |
不会生成特征滞后。 |
| Auto |
系统自动生成功能滞后。 |
FeaturizationMode
特征化模式 - 用户可以保留默认的“自动”模式,AutoML 将负责在特征化阶段对数据进行必要的转换。 如果选择了“关闭”,则不会完成特征化。 如果选择“自定义”,则用户可以指定其他输入以自定义特征化完成方式。
| 值 | 说明 |
|---|---|
| Auto |
自动模式下,系统执行特征化,无需任何自定义特征化输入。 |
| Custom |
自定义特征化。 |
| Off |
特征化关闭。 “预测”任务不能使用此值。 |
ForecastHorizonMode
枚举以确定预测范围选择模式。
| 值 | 说明 |
|---|---|
| Auto |
预测范围将自动确定。 |
| Custom |
使用自定义预测范围。 |
Forecasting
AutoML Table 垂直中的预测任务。
| 名称 | 类型 | 默认值 | 说明 |
|---|---|---|---|
| cvSplitColumnNames |
string[] |
用于 CVSplit 数据的列。 |
|
| featurizationSettings |
AutoML 作业所需的特征化输入。 |
||
| forecastingSettings |
预测任务特定的输入。 |
||
| limitSettings |
AutoMLJob 的执行约束。 |
||
| logVerbosity | Info |
用于设置日志详细程度的枚举。 |
|
| nCrossValidations | NCrossValidations: |
未提供验证数据集时要应用于训练数据集的交叉验证折叠数。 |
|
| primaryMetric | NormalizedRootMeanSquaredError |
预测任务的主要指标。 |
|
| targetColumnName |
string |
目标列名称:这是预测值列。 也称为分类任务的上下文中的标签列名称。 |
|
| taskType | string: |
[必需]AutoMLJob 的任务类型。 |
|
| testData |
测试数据输入。 |
||
| testDataSize |
number (double) |
需要为验证目的预留的测试数据集的分数。 介于 (0.0 , 1.0) 之间的值 未提供验证数据集时应用。 |
|
| trainingData |
[必需]训练数据输入。 |
||
| trainingSettings |
AutoML 作业训练阶段的输入。 |
||
| validationData |
验证数据输入。 |
||
| validationDataSize |
number (double) |
需要留出用于验证的定型数据集的分数。 介于 (0.0 , 1.0) 之间的值 未提供验证数据集时应用。 |
|
| weightColumnName |
string |
示例权重列的名称。 自动化 ML 支持加权列作为输入,导致数据中的行向上或向下加权。 |
ForecastingModels
AutoML 支持的所有预测模型的枚举。
| 值 | 说明 |
|---|---|
| AutoArima |
自动自回归综合移动平均线 (ARIMA) 模型使用时间序列数据和统计分析来解释数据并做出未来预测。 该模型旨在通过使用过去值的时间序列数据来解释数据,并使用线性回归进行预测。 |
| Prophet |
Prophet 是一种基于加法模型预测时间序列数据的过程,其中非线性趋势与年度、每周和每日季节性以及假期效应拟合。 它最适合具有强烈季节性影响的时间序列和多个季节的历史数据。 Prophet 对缺失数据和趋势变化具有鲁棒性,并且通常可以很好地处理异常值。 |
| Naive |
朴素预测模型通过结转训练数据中每个时间序列的最新目标值来进行预测。 |
| SeasonalNaive |
季节性朴素预测模型通过结转训练数据中每个时间序列的最新季节目标值来进行预测。 |
| Average |
平均预测模型通过结转训练数据中每个时间序列的目标值的平均值来进行预测。 |
| SeasonalAverage |
季节性平均预测模型通过结转训练数据中每个时间序列的最新季节数据的平均值来进行预测。 |
| ExponentialSmoothing |
指数平滑是一种针对单变量数据的时间序列预测方法,可以扩展以支持具有系统趋势或季节性成分的数据。 |
| Arimax |
具有解释变量的自回归综合移动平均线 (ARIMAX) 模型可以被视为具有一个或多个自回归 (AR) 项和/或一个或多个移动平均线 (MA) 项的多元回归模型。 该方法适用于数据为平稳/非平稳时的预测,以及具有任何类型数据模式(即水平/趋势/季节性/周期性)的多变量。 |
| TCNForecaster |
TCNForecaster:时态卷积网络预报器。 TODO:向预测团队询问简要介绍。 |
| ElasticNet |
弹性网络是一种流行的正则化线性回归类型,它结合了两种流行的惩罚,特别是 L1 和 L2 惩罚函数。 |
| GradientBoosting |
将周学习者转变为强学习者的技术称为提升。 梯度提升算法过程基于这种执行理论。 |
| DecisionTree |
决策树是一种非参数监督学习方法,用于分类和回归任务。 目标是创建一个模型,通过学习从数据特征推断的简单决策规则来预测目标变量的值。 |
| KNN |
K 最近邻 (KNN) 算法使用“特征相似性”来预测新数据点的值,这进一步意味着新数据点将根据它与训练集中点的匹配程度分配一个值。 |
| LassoLars |
套索模型拟合最小角度回归又名 Lars。 它是一个线性模型,使用 L1 先验作为正则化器进行训练。 |
| SGD |
SGD:随机梯度下降是一种优化算法,常用于机器学习应用,用于找到与预测输出和实际输出之间最佳拟合相对应的模型参数。 这是一种不精确但强大的技术。 |
| RandomForest |
随机森林是一种监督学习算法。 它构建的“森林”是决策树的集合,通常使用“装袋”方法进行训练。 套袋方法的总体思路是学习模型的组合增加了整体结果。 |
| ExtremeRandomTrees |
Extreme Trees 是一种集成机器学习算法,它结合了许多决策树的预测。 它与广泛使用的随机森林算法有关。 |
| LightGBM |
LightGBM 是一个梯度提升框架,它使用基于树的学习算法。 |
| XGBoostRegressor |
XGBoostRegressor:Extreme Gradient Boosting Regressor 是一种使用基本学习器集成的监督机器学习模型。 |
ForecastingPrimaryMetrics
预测任务的主要指标。
| 值 | 说明 |
|---|---|
| SpearmanCorrelation |
斯皮尔曼秩相关系数是秩相关性的非参数度量。 |
| NormalizedRootMeanSquaredError |
归一化均方根误差 (NRMSE) RMSE 有助于不同尺度模型之间的比较。 |
| R2Score |
R2 分数是基于预测的机器学习模型的性能评估度量之一。 |
| NormalizedMeanAbsoluteError |
归一化平均绝对误差 (NMAE) 是一种验证指标,用于比较不同尺度的(时间)序列的平均绝对误差 (MAE)。 |
ForecastingSettings
预测特定参数。
| 名称 | 类型 | 默认值 | 说明 |
|---|---|---|---|
| countryOrRegionForHolidays |
string |
用于预测任务的假日国家或地区。 这些代码应为 ISO 3166 双字母国家/地区代码,例如“US”或“GB”。 |
|
| cvStepSize |
integer (int32) |
一个 CV 折叠的起始时间与下一个折叠之间的句点数。 例如,如果每日数据为 = 3,则 |
|
| featureLags | None |
用于为数值特征生成滞后的标志。 |
|
| forecastHorizon | ForecastHorizon: |
所需最大预测范围(以时序频率单位为单位)。 |
|
| frequency |
string |
预测时,此参数表示需要预测的时间段,例如每日、每周、每年等。默认情况下,预测频率为数据集频率。 |
|
| seasonality | Seasonality: |
将时序季节性设置为序列频率的整数倍数。 如果季节性设置为“auto”,则会推断它。 |
|
| shortSeriesHandlingConfig | Auto |
定义 AutoML 如何处理短时序的参数。 |
|
| targetAggregateFunction | None |
目标聚合函数。 |
|
| targetLags | TargetLags: |
要从目标列滞后的过去时间段数。 |
|
| targetRollingWindowSize | TargetRollingWindowSize: |
用于创建目标列的滚动窗口平均值的过去时间段数。 |
|
| timeColumnName |
string |
时间列的名称。 当预测在用于生成时序并推断其频率的输入数据中指定日期/时间列时,此参数是必需的。 |
|
| timeSeriesIdColumnNames |
string[] |
用于对时间序列进行分组的列的名称。 它可用于创建多个序列。 如果未定义粒度,则假定数据集为一个时序。 此参数用于任务类型预测。 |
|
| useStl | None |
配置时序目标列的 STL 分解。 |
ForecastingTrainingSettings
预测培训相关配置。
| 名称 | 类型 | 默认值 | 说明 |
|---|---|---|---|
| allowedTrainingAlgorithms |
允许用于预测任务的模型。 |
||
| blockedTrainingAlgorithms |
用于预测任务的阻止模型。 |
||
| enableDnnTraining |
boolean |
False |
启用 DNN 模型的建议。 |
| enableModelExplainability |
boolean |
True |
标志以在最佳模型上启用可解释性。 |
| enableOnnxCompatibleModels |
boolean |
False |
用于启用 onnx 兼容模型的标志。 |
| enableStackEnsemble |
boolean |
True |
启用堆栈合奏运行。 |
| enableVoteEnsemble |
boolean |
True |
启用投票合奏运行。 |
| ensembleModelDownloadTimeout |
string (duration) |
PT5M |
在 VotingEnsemble 和 StackEnsemble 模型生成期间,将下载先前子运行中的多个拟合模型。 如果需要更多时间,请将此参数配置为大于 300 秒的值。 |
| stackEnsembleSettings |
堆栈合奏的堆栈合奏设置。 |
Goal
定义超参数优化支持的指标目标
| 值 | 说明 |
|---|---|
| Minimize | |
| Maximize |
GridSamplingAlgorithm
定义一个采样算法,该算法详尽地生成空间中的每个值组合
| 名称 | 类型 | 说明 |
|---|---|---|
| samplingAlgorithmType |
string:
Grid |
[必需]用于生成超参数值的算法以及配置属性 |
IdentityConfigurationType
枚举来确定标识框架。
| 值 | 说明 |
|---|---|
| Managed | |
| AMLToken | |
| UserIdentity |
ImageClassification
图像分类。 当图像仅使用一组类中的单个标签进行分类时,使用多类图像分类 - 例如,每个图像被分类为“猫”或“狗”或“鸭子”的图像。
| 名称 | 类型 | 默认值 | 说明 |
|---|---|---|---|
| limitSettings |
[必需]限制 AutoML 作业的设置。 |
||
| logVerbosity | Info |
用于设置日志详细程度的枚举。 |
|
| modelSettings |
用于训练模型的设置。 |
||
| primaryMetric | Accuracy |
分类任务的主要指标。 |
|
| searchSpace |
用于采样模型及其超参数的不同组合的搜索空间。 |
||
| sweepSettings |
模型扫描和超参数扫描相关设置。 |
||
| targetColumnName |
string |
目标列名称:这是预测值列。 也称为分类任务的上下文中的标签列名称。 |
|
| taskType | string: |
[必需]AutoMLJob 的任务类型。 |
|
| trainingData |
[必需]训练数据输入。 |
||
| validationData |
验证数据输入。 |
||
| validationDataSize |
number (double) |
需要留出用于验证的定型数据集的分数。 介于 (0.0 , 1.0) 之间的值 未提供验证数据集时应用。 |
ImageClassificationMultilabel
图像分类多标签。 当图像可以具有一组标签中的一个或多个标签时,使用多标签图像分类 - 例如,图像可以同时标记为“猫”和“狗”。
| 名称 | 类型 | 默认值 | 说明 |
|---|---|---|---|
| limitSettings |
[必需]限制 AutoML 作业的设置。 |
||
| logVerbosity | Info |
用于设置日志详细程度的枚举。 |
|
| modelSettings |
用于训练模型的设置。 |
||
| primaryMetric | IOU |
分类多标签任务的主要指标。 |
|
| searchSpace |
用于采样模型及其超参数的不同组合的搜索空间。 |
||
| sweepSettings |
模型扫描和超参数扫描相关设置。 |
||
| targetColumnName |
string |
目标列名称:这是预测值列。 也称为分类任务的上下文中的标签列名称。 |
|
| taskType | string: |
[必需]AutoMLJob 的任务类型。 |
|
| trainingData |
[必需]训练数据输入。 |
||
| validationData |
验证数据输入。 |
||
| validationDataSize |
number (double) |
需要留出用于验证的定型数据集的分数。 介于 (0.0 , 1.0) 之间的值 未提供验证数据集时应用。 |
ImageInstanceSegmentation
图像实例分割。 实例分割用于在像素级别识别图像中的对象,在图像中的每个对象周围绘制一个多边形。
| 名称 | 类型 | 默认值 | 说明 |
|---|---|---|---|
| limitSettings |
[必需]限制 AutoML 作业的设置。 |
||
| logVerbosity | Info |
用于设置日志详细程度的枚举。 |
|
| modelSettings |
用于训练模型的设置。 |
||
| primaryMetric | MeanAveragePrecision |
InstanceSegmentation 任务的主要指标。 |
|
| searchSpace |
用于采样模型及其超参数的不同组合的搜索空间。 |
||
| sweepSettings |
模型扫描和超参数扫描相关设置。 |
||
| targetColumnName |
string |
目标列名称:这是预测值列。 也称为分类任务的上下文中的标签列名称。 |
|
| taskType | string: |
[必需]AutoMLJob 的任务类型。 |
|
| trainingData |
[必需]训练数据输入。 |
||
| validationData |
验证数据输入。 |
||
| validationDataSize |
number (double) |
需要留出用于验证的定型数据集的分数。 介于 (0.0 , 1.0) 之间的值 未提供验证数据集时应用。 |
ImageLimitSettings
限制 AutoML 作业的设置。
| 名称 | 类型 | 默认值 | 说明 |
|---|---|---|---|
| maxConcurrentTrials |
integer (int32) |
1 |
最大并发 AutoML 迭代数。 |
| maxTrials |
integer (int32) |
1 |
AutoML 迭代的最大数目。 |
| timeout |
string (duration) |
P7D |
AutoML 作业超时。 |
ImageModelDistributionSettingsClassification
用于扫描模型设置值的分布表达式。 <示例> 一些例子是:
ModelName = "choice('seresnext', 'resnest50')";
LearningRate = "uniform(0.001, 0.01)";
LayersToFreeze = "choice(0, 2)";
```</example>
For more details on how to compose distribution expressions please check the documentation:
https://docs.microsoft.com/en-us/azure/machine-learning/how-to-tune-hyperparameters
For more information on the available settings please visit the official documentation:
https://docs.microsoft.com/en-us/azure/machine-learning/how-to-auto-train-image-models.
| 名称 | 类型 | 说明 |
|---|---|---|
| amsGradient |
string |
优化器为“adam”或“adamw”时启用 AMSGrad。 |
| augmentations |
string |
使用扩充的设置。 |
| beta1 |
string |
优化器为“adam”或“adamw”时“beta1”的值。 必须是 [0, 1] 范围内的浮点。 |
| beta2 |
string |
优化器为“adam”或“adamw”时“beta2”的值。 必须是 [0, 1] 范围内的浮点。 |
| distributed |
string |
是否使用分布式程序训练。 |
| earlyStopping |
string |
在训练期间启用提前停止逻辑。 |
| earlyStoppingDelay |
string |
在跟踪主要指标改进以提前停止之前要等待的最小纪元或验证评估数。 必须是正整数。 |
| earlyStoppingPatience |
string |
在停止运行之前没有主要指标改进的最小纪元或验证评估数。 必须是正整数。 |
| enableOnnxNormalization |
string |
导出 ONNX 模型时启用规范化。 |
| evaluationFrequency |
string |
评估验证数据集以获取指标分数的频率。 必须是正整数。 |
| gradientAccumulationStep |
string |
梯度累积是指在累积这些步骤的梯度时运行配置数量的“GradAccumulationStep”步骤,而不更新模型权重,然后使用累积的梯度来计算权重更新。 必须是正整数。 |
| layersToFreeze |
string |
要冻结模型的层数。 必须是正整数。 例如,传递 2 作为 'seresnext' 的值意味着冻结 layer0 和 layer1。 有关支持的模型的完整列表和图层冻结的详细信息,请参阅: https://docs.microsoft.com/en-us/azure/machine-learning/how-to-auto-train-image-models。 |
| learningRate |
string |
初始学习速率。 必须是 [0, 1] 范围内的浮点。 |
| learningRateScheduler |
string |
学习速率计划程序的类型。 必须是“warmup_cosine”或“step”。 |
| modelName |
string |
要用于训练的模型的名称。 有关可用型号的更多信息,请访问官方文档: https://docs.microsoft.com/en-us/azure/machine-learning/how-to-auto-train-image-models。 |
| momentum |
string |
优化器为“zn”时的动量值。 必须是 [0, 1] 范围内的浮点。 |
| nesterov |
string |
优化器为“zn”时启用 nesterov。 |
| numberOfEpochs |
string |
训练纪元数。 必须是正整数。 |
| numberOfWorkers |
string |
数据加载程序辅助角色数。 必须是非负整数。 |
| optimizer |
string |
优化器的类型。 必须是“zn”、“adam”或“adamw”。 |
| randomSeed |
string |
使用确定性训练时要使用的随机种子。 |
| stepLRGamma |
string |
当学习速率计划程序为“step”时,gamma 的值。 必须是 [0, 1] 范围内的浮点。 |
| stepLRStepSize |
string |
学习速率计划程序为“step”时步骤大小的值。 必须是正整数。 |
| trainingBatchSize |
string |
训练批大小。 必须是正整数。 |
| trainingCropSize |
string |
训练数据集的神经网络输入的图像裁剪大小。 必须是正整数。 |
| validationBatchSize |
string |
验证批大小。 必须是正整数。 |
| validationCropSize |
string |
输入到神经网络的验证数据集的图像裁剪大小。 必须是正整数。 |
| validationResizeSize |
string |
在裁剪验证数据集之前要调整其大小的图像大小。 必须是正整数。 |
| warmupCosineLRCycles |
string |
学习速率计划程序为“warmup_cosine”时的余弦周期值。 必须是 [0, 1] 范围内的浮点。 |
| warmupCosineLRWarmupEpochs |
string |
当学习速率计划程序为“warmup_cosine”时,预热时期的值。 必须是正整数。 |
| weightDecay |
string |
优化器为“zn”、“adam”或“adamw”时的权重衰减值。 必须是范围[0, 1] 中的浮点。 |
| weightedLoss |
string |
减肥。 对于无加权损失,接受的值为 0。 1 用于与 sqrt 一起减肥。(class_weights)。 2 用于减肥与class_weights。 必须为 0 或 1 或 2。 |
ImageModelDistributionSettingsObjectDetection
用于扫描模型设置值的分布表达式。 <示例> 一些例子是:
ModelName = "choice('seresnext', 'resnest50')";
LearningRate = "uniform(0.001, 0.01)";
LayersToFreeze = "choice(0, 2)";
```</example>
For more details on how to compose distribution expressions please check the documentation:
https://docs.microsoft.com/en-us/azure/machine-learning/how-to-tune-hyperparameters
For more information on the available settings please visit the official documentation:
https://docs.microsoft.com/en-us/azure/machine-learning/how-to-auto-train-image-models.
| 名称 | 类型 | 说明 |
|---|---|---|
| amsGradient |
string |
优化器为“adam”或“adamw”时启用 AMSGrad。 |
| augmentations |
string |
使用扩充的设置。 |
| beta1 |
string |
优化器为“adam”或“adamw”时“beta1”的值。 必须是 [0, 1] 范围内的浮点。 |
| beta2 |
string |
优化器为“adam”或“adamw”时“beta2”的值。 必须是 [0, 1] 范围内的浮点。 |
| boxDetectionsPerImage |
string |
每个图像的最大检测数,适用于所有类。 必须是正整数。 注意:“yolov5”算法不支持此设置。 |
| boxScoreThreshold |
string |
在推理过程中,仅返回分类分数大于 BoxScoreThreshold 的建议。 必须是范围[0, 1] 中的浮点。 |
| distributed |
string |
是否使用分布式程序训练。 |
| earlyStopping |
string |
在训练期间启用提前停止逻辑。 |
| earlyStoppingDelay |
string |
在跟踪主要指标改进以提前停止之前要等待的最小纪元或验证评估数。 必须是正整数。 |
| earlyStoppingPatience |
string |
在停止运行之前没有主要指标改进的最小纪元或验证评估数。 必须是正整数。 |
| enableOnnxNormalization |
string |
导出 ONNX 模型时启用规范化。 |
| evaluationFrequency |
string |
评估验证数据集以获取指标分数的频率。 必须是正整数。 |
| gradientAccumulationStep |
string |
梯度累积是指在累积这些步骤的梯度时运行配置数量的“GradAccumulationStep”步骤,而不更新模型权重,然后使用累积的梯度来计算权重更新。 必须是正整数。 |
| imageSize |
string |
用于训练和验证的图像大小。 必须是正整数。 注意:如果大小太大,训练运行可能会进入 CUDA OOM。 注意:仅“yolov5”算法支持此设置。 |
| layersToFreeze |
string |
要冻结模型的层数。 必须是正整数。 例如,传递 2 作为 'seresnext' 的值意味着冻结 layer0 和 layer1。 有关支持的模型的完整列表和图层冻结的详细信息,请参阅: https://docs.microsoft.com/en-us/azure/machine-learning/how-to-auto-train-image-models。 |
| learningRate |
string |
初始学习速率。 必须是 [0, 1] 范围内的浮点。 |
| learningRateScheduler |
string |
学习速率计划程序的类型。 必须是“warmup_cosine”或“step”。 |
| maxSize |
string |
将图像馈送至主干之前要重新缩放的最大大小。 必须是正整数。 注意:如果大小太大,训练运行可能会进入 CUDA OOM。 注意:“yolov5”算法不支持此设置。 |
| minSize |
string |
将图像馈送到主干之前要重新缩放的最小大小。 必须是正整数。 注意:如果大小太大,训练运行可能会进入 CUDA OOM。 注意:“yolov5”算法不支持此设置。 |
| modelName |
string |
要用于训练的模型的名称。 有关可用型号的更多信息,请访问官方文档: https://docs.microsoft.com/en-us/azure/machine-learning/how-to-auto-train-image-models。 |
| modelSize |
string |
模型大小。 必须是“small”、“medium”、“large”或“xlarge”。 注意:如果模型大小太大,训练运行可能会进入 CUDA OOM。 注意:仅“yolov5”算法支持此设置。 |
| momentum |
string |
优化器为“zn”时的动量值。 必须是 [0, 1] 范围内的浮点。 |
| multiScale |
string |
按 +/- 50%的不同图像大小启用多缩放图像。 注意:如果没有足够的 GPU 内存,训练运行可能会进入 CUDA OOM。 注意:仅“yolov5”算法支持此设置。 |
| nesterov |
string |
优化器为“zn”时启用 nesterov。 |
| nmsIouThreshold |
string |
在 NMS 后期处理的推理期间使用的 IOU 阈值。 必须在 [0, 1] 范围内浮动。 |
| numberOfEpochs |
string |
训练纪元数。 必须是正整数。 |
| numberOfWorkers |
string |
数据加载程序辅助角色数。 必须是非负整数。 |
| optimizer |
string |
优化器的类型。 必须是“zn”、“adam”或“adamw”。 |
| randomSeed |
string |
使用确定性训练时要使用的随机种子。 |
| stepLRGamma |
string |
当学习速率计划程序为“step”时,gamma 的值。 必须是 [0, 1] 范围内的浮点。 |
| stepLRStepSize |
string |
学习速率计划程序为“step”时步骤大小的值。 必须是正整数。 |
| tileGridSize |
string |
用于平铺每个图像的网格大小。 注意:TileGridSize 不得为 None 才能启用小对象检测逻辑。 一个字符串,其中包含两个整数(采用格式)。 注意:“yolov5”算法不支持此设置。 |
| tileOverlapRatio |
string |
每个维度中相邻磁贴之间的重叠比率。 必须在 [0, 1] 范围内浮动。 注意:“yolov5”算法不支持此设置。 |
| tilePredictionsNmsThreshold |
string |
用于执行 NMS 的 IOU 阈值,同时合并来自磁贴和图像的预测。 用于验证/推理。 必须在 [0, 1] 范围内浮动。 注意:“yolov5”算法不支持此设置。 NMS:非最大抑制 |
| trainingBatchSize |
string |
训练批大小。 必须是正整数。 |
| validationBatchSize |
string |
验证批大小。 必须是正整数。 |
| validationIouThreshold |
string |
计算验证指标时要使用的 IOU 阈值。 必须在 [0, 1] 范围内浮动。 |
| validationMetricType |
string |
用于验证指标的指标计算方法。 必须是“none”、“coco”、“voc”或“coco_voc”。 |
| warmupCosineLRCycles |
string |
学习速率计划程序为“warmup_cosine”时的余弦周期值。 必须是 [0, 1] 范围内的浮点。 |
| warmupCosineLRWarmupEpochs |
string |
当学习速率计划程序为“warmup_cosine”时,预热时期的值。 必须是正整数。 |
| weightDecay |
string |
优化器为“zn”、“adam”或“adamw”时的权重衰减值。 必须是范围[0, 1] 中的浮点。 |
ImageModelSettingsClassification
用于训练模型的设置。 有关可用设置的更多信息,请访问官方文档: https://docs.microsoft.com/en-us/azure/machine-learning/how-to-auto-train-image-models。
| 名称 | 类型 | 默认值 | 说明 |
|---|---|---|---|
| advancedSettings |
string |
高级方案的设置。 |
|
| amsGradient |
boolean |
优化器为“adam”或“adamw”时启用 AMSGrad。 |
|
| augmentations |
string |
使用扩充的设置。 |
|
| beta1 |
number (float) |
优化器为“adam”或“adamw”时“beta1”的值。 必须是 [0, 1] 范围内的浮点。 |
|
| beta2 |
number (float) |
优化器为“adam”或“adamw”时“beta2”的值。 必须是 [0, 1] 范围内的浮点。 |
|
| checkpointFrequency |
integer (int32) |
存储模型检查点的频率。 必须是正整数。 |
|
| checkpointModel |
用于增量训练的预先训练检查点模型。 |
||
| checkpointRunId |
string |
上一次运行的 ID,该运行具有用于增量训练的预先训练检查点。 |
|
| distributed |
boolean |
是否使用分布式训练。 |
|
| earlyStopping |
boolean |
在训练期间启用提前停止逻辑。 |
|
| earlyStoppingDelay |
integer (int32) |
在跟踪主要指标改进以提前停止之前要等待的最小纪元或验证评估数。 必须是正整数。 |
|
| earlyStoppingPatience |
integer (int32) |
在停止运行之前没有主要指标改进的最小纪元或验证评估数。 必须是正整数。 |
|
| enableOnnxNormalization |
boolean |
导出 ONNX 模型时启用规范化。 |
|
| evaluationFrequency |
integer (int32) |
评估验证数据集以获取指标分数的频率。 必须是正整数。 |
|
| gradientAccumulationStep |
integer (int32) |
梯度累积是指在累积这些步骤的梯度时运行配置数量的“GradAccumulationStep”步骤,而不更新模型权重,然后使用累积的梯度来计算权重更新。 必须是正整数。 |
|
| layersToFreeze |
integer (int32) |
要冻结模型的层数。 必须是正整数。 例如,传递 2 作为 'seresnext' 的值意味着冻结 layer0 和 layer1。 有关支持的模型的完整列表和图层冻结的详细信息,请参阅: https://docs.microsoft.com/en-us/azure/machine-learning/how-to-auto-train-image-models。 |
|
| learningRate |
number (float) |
初始学习速率。 必须是 [0, 1] 范围内的浮点。 |
|
| learningRateScheduler | None |
学习率调度程序枚举。 |
|
| modelName |
string |
要用于训练的模型的名称。 有关可用型号的更多信息,请访问官方文档: https://docs.microsoft.com/en-us/azure/machine-learning/how-to-auto-train-image-models。 |
|
| momentum |
number (float) |
优化器为“zn”时的动量值。 必须是 [0, 1] 范围内的浮点。 |
|
| nesterov |
boolean |
优化器为“zn”时启用 nesterov。 |
|
| numberOfEpochs |
integer (int32) |
训练纪元数。 必须是正整数。 |
|
| numberOfWorkers |
integer (int32) |
数据加载程序辅助角色数。 必须是非负整数。 |
|
| optimizer | None |
图像模型的随机优化器。 |
|
| randomSeed |
integer (int32) |
使用确定性训练时要使用的随机种子。 |
|
| stepLRGamma |
number (float) |
当学习速率计划程序为“step”时,gamma 的值。 必须是 [0, 1] 范围内的浮点。 |
|
| stepLRStepSize |
integer (int32) |
学习速率计划程序为“step”时步骤大小的值。 必须是正整数。 |
|
| trainingBatchSize |
integer (int32) |
训练批大小。 必须是正整数。 |
|
| trainingCropSize |
integer (int32) |
训练数据集的神经网络输入的图像裁剪大小。 必须是正整数。 |
|
| validationBatchSize |
integer (int32) |
验证批大小。 必须是正整数。 |
|
| validationCropSize |
integer (int32) |
输入到神经网络的验证数据集的图像裁剪大小。 必须是正整数。 |
|
| validationResizeSize |
integer (int32) |
在裁剪验证数据集之前要调整其大小的图像大小。 必须是正整数。 |
|
| warmupCosineLRCycles |
number (float) |
学习速率计划程序为“warmup_cosine”时的余弦周期值。 必须是 [0, 1] 范围内的浮点。 |
|
| warmupCosineLRWarmupEpochs |
integer (int32) |
当学习速率计划程序为“warmup_cosine”时,预热时期的值。 必须是正整数。 |
|
| weightDecay |
number (float) |
优化器为“zn”、“adam”或“adamw”时的权重衰减值。 必须是范围[0, 1] 中的浮点。 |
|
| weightedLoss |
integer (int32) |
减肥。 对于无加权损失,接受的值为 0。 1 用于与 sqrt 一起减肥。(class_weights)。 2 用于减肥与class_weights。 必须为 0 或 1 或 2。 |
ImageModelSettingsObjectDetection
用于训练模型的设置。 有关可用设置的更多信息,请访问官方文档: https://docs.microsoft.com/en-us/azure/machine-learning/how-to-auto-train-image-models。
| 名称 | 类型 | 默认值 | 说明 |
|---|---|---|---|
| advancedSettings |
string |
高级方案的设置。 |
|
| amsGradient |
boolean |
优化器为“adam”或“adamw”时启用 AMSGrad。 |
|
| augmentations |
string |
使用扩充的设置。 |
|
| beta1 |
number (float) |
优化器为“adam”或“adamw”时“beta1”的值。 必须是 [0, 1] 范围内的浮点。 |
|
| beta2 |
number (float) |
优化器为“adam”或“adamw”时“beta2”的值。 必须是 [0, 1] 范围内的浮点。 |
|
| boxDetectionsPerImage |
integer (int32) |
每个图像的最大检测数,适用于所有类。 必须是正整数。 注意:“yolov5”算法不支持此设置。 |
|
| boxScoreThreshold |
number (float) |
在推理过程中,仅返回分类分数大于 BoxScoreThreshold 的建议。 必须是范围[0, 1] 中的浮点。 |
|
| checkpointFrequency |
integer (int32) |
存储模型检查点的频率。 必须是正整数。 |
|
| checkpointModel |
用于增量训练的预先训练检查点模型。 |
||
| checkpointRunId |
string |
上一次运行的 ID,该运行具有用于增量训练的预先训练检查点。 |
|
| distributed |
boolean |
是否使用分布式训练。 |
|
| earlyStopping |
boolean |
在训练期间启用提前停止逻辑。 |
|
| earlyStoppingDelay |
integer (int32) |
在跟踪主要指标改进以提前停止之前要等待的最小纪元或验证评估数。 必须是正整数。 |
|
| earlyStoppingPatience |
integer (int32) |
在停止运行之前没有主要指标改进的最小纪元或验证评估数。 必须是正整数。 |
|
| enableOnnxNormalization |
boolean |
导出 ONNX 模型时启用规范化。 |
|
| evaluationFrequency |
integer (int32) |
评估验证数据集以获取指标分数的频率。 必须是正整数。 |
|
| gradientAccumulationStep |
integer (int32) |
梯度累积是指在累积这些步骤的梯度时运行配置数量的“GradAccumulationStep”步骤,而不更新模型权重,然后使用累积的梯度来计算权重更新。 必须是正整数。 |
|
| imageSize |
integer (int32) |
用于训练和验证的图像大小。 必须是正整数。 注意:如果大小太大,训练运行可能会进入 CUDA OOM。 注意:仅“yolov5”算法支持此设置。 |
|
| layersToFreeze |
integer (int32) |
要冻结模型的层数。 必须是正整数。 例如,传递 2 作为 'seresnext' 的值意味着冻结 layer0 和 layer1。 有关支持的模型的完整列表和图层冻结的详细信息,请参阅: https://docs.microsoft.com/en-us/azure/machine-learning/how-to-auto-train-image-models。 |
|
| learningRate |
number (float) |
初始学习速率。 必须是 [0, 1] 范围内的浮点。 |
|
| learningRateScheduler | None |
学习率调度程序枚举。 |
|
| maxSize |
integer (int32) |
将图像馈送至主干之前要重新缩放的最大大小。 必须是正整数。 注意:如果大小太大,训练运行可能会进入 CUDA OOM。 注意:“yolov5”算法不支持此设置。 |
|
| minSize |
integer (int32) |
将图像馈送到主干之前要重新缩放的最小大小。 必须是正整数。 注意:如果大小太大,训练运行可能会进入 CUDA OOM。 注意:“yolov5”算法不支持此设置。 |
|
| modelName |
string |
要用于训练的模型的名称。 有关可用型号的更多信息,请访问官方文档: https://docs.microsoft.com/en-us/azure/machine-learning/how-to-auto-train-image-models。 |
|
| modelSize | None |
图像模型大小。 |
|
| momentum |
number (float) |
优化器为“zn”时的动量值。 必须是 [0, 1] 范围内的浮点。 |
|
| multiScale |
boolean |
按 +/- 50%的不同图像大小启用多缩放图像。 注意:如果没有足够的 GPU 内存,训练运行可能会进入 CUDA OOM。 注意:仅“yolov5”算法支持此设置。 |
|
| nesterov |
boolean |
优化器为“zn”时启用 nesterov。 |
|
| nmsIouThreshold |
number (float) |
在 NMS 后期处理的推理期间使用的 IOU 阈值。 必须是 [0, 1] 范围内的浮点。 |
|
| numberOfEpochs |
integer (int32) |
训练纪元数。 必须是正整数。 |
|
| numberOfWorkers |
integer (int32) |
数据加载程序辅助角色数。 必须是非负整数。 |
|
| optimizer | None |
图像模型的随机优化器。 |
|
| randomSeed |
integer (int32) |
使用确定性训练时要使用的随机种子。 |
|
| stepLRGamma |
number (float) |
当学习速率计划程序为“step”时,gamma 的值。 必须是 [0, 1] 范围内的浮点。 |
|
| stepLRStepSize |
integer (int32) |
学习速率计划程序为“step”时步骤大小的值。 必须是正整数。 |
|
| tileGridSize |
string |
用于平铺每个图像的网格大小。 注意:TileGridSize 不得为 None 才能启用小对象检测逻辑。 一个字符串,其中包含两个整数(采用格式)。 注意:“yolov5”算法不支持此设置。 |
|
| tileOverlapRatio |
number (float) |
每个维度中相邻磁贴之间的重叠比率。 必须在 [0, 1] 范围内浮动。 注意:“yolov5”算法不支持此设置。 |
|
| tilePredictionsNmsThreshold |
number (float) |
用于执行 NMS 的 IOU 阈值,同时合并来自磁贴和图像的预测。 用于验证/推理。 必须在 [0, 1] 范围内浮动。 注意:“yolov5”算法不支持此设置。 |
|
| trainingBatchSize |
integer (int32) |
训练批大小。 必须是正整数。 |
|
| validationBatchSize |
integer (int32) |
验证批大小。 必须是正整数。 |
|
| validationIouThreshold |
number (float) |
计算验证指标时要使用的 IOU 阈值。 必须在 [0, 1] 范围内浮动。 |
|
| validationMetricType | None |
用于图像任务中验证指标的指标计算方法。 |
|
| warmupCosineLRCycles |
number (float) |
学习速率计划程序为“warmup_cosine”时的余弦周期值。 必须是 [0, 1] 范围内的浮点。 |
|
| warmupCosineLRWarmupEpochs |
integer (int32) |
当学习速率计划程序为“warmup_cosine”时,预热时期的值。 必须是正整数。 |
|
| weightDecay |
number (float) |
优化器为“zn”、“adam”或“adamw”时的权重衰减值。 必须是范围[0, 1] 中的浮点。 |
ImageObjectDetection
图像对象检测。 对象检测用于识别图像中的对象并使用边界框定位每个对象,例如定位图像中的所有狗和猫,并在每个对象周围绘制一个边界框。
| 名称 | 类型 | 默认值 | 说明 |
|---|---|---|---|
| limitSettings |
[必需]限制 AutoML 作业的设置。 |
||
| logVerbosity | Info |
用于设置日志详细程度的枚举。 |
|
| modelSettings |
用于训练模型的设置。 |
||
| primaryMetric | MeanAveragePrecision |
图像对象检测任务的主要指标。 |
|
| searchSpace |
用于采样模型及其超参数的不同组合的搜索空间。 |
||
| sweepSettings |
模型扫描和超参数扫描相关设置。 |
||
| targetColumnName |
string |
目标列名称:这是预测值列。 也称为分类任务的上下文中的标签列名称。 |
|
| taskType | string: |
[必需]AutoMLJob 的任务类型。 |
|
| trainingData |
[必需]训练数据输入。 |
||
| validationData |
验证数据输入。 |
||
| validationDataSize |
number (double) |
需要留出用于验证的定型数据集的分数。 介于 (0.0 , 1.0) 之间的值 未提供验证数据集时应用。 |
ImageSweepSettings
模型扫描和超参数扫描相关设置。
| 名称 | 类型 | 说明 |
|---|---|---|
| earlyTermination | EarlyTerminationPolicy: |
提前终止策略的类型。 |
| samplingAlgorithm |
[必需]超参数采样算法的类型。 |
InputDeliveryMode
枚举以确定输入数据传递模式。
| 值 | 说明 |
|---|---|
| ReadOnlyMount | |
| ReadWriteMount | |
| Download | |
| Direct | |
| EvalMount | |
| EvalDownload |
InstanceSegmentationPrimaryMetrics
InstanceSegmentation 任务的主要指标。
| 值 | 说明 |
|---|---|
| MeanAveragePrecision |
平均精度 (MAP) 是 AP(平均精度)的平均值。 计算每个类的 AP 并取平均值以获得 MAP。 |
JobBase
Azure 资源管理器资源信封。
| 名称 | 类型 | 说明 |
|---|---|---|
| id |
string |
资源的完全限定资源 ID。 示例 - /subscriptions/{subscriptionId}/resourceGroups/{resourceGroupName}/providers/{resourceProviderNamespace}/{resourceType}/{resourceName} |
| name |
string |
资源的名称 |
| properties | JobBaseProperties: |
[必需]实体的其他属性。 |
| systemData |
包含 createdBy 和 modifiedBy 信息的 Azure 资源管理器元数据。 |
|
| type |
string |
资源类型。 例如“Microsoft.Compute/virtualMachines”或“Microsoft.Storage/storageAccounts” |
JobInputType
枚举以确定作业输入类型。
| 值 | 说明 |
|---|---|
| literal | |
| uri_file | |
| uri_folder | |
| mltable | |
| custom_model | |
| mlflow_model | |
| triton_model |
JobLimitsType
| 值 | 说明 |
|---|---|
| Command | |
| Sweep |
JobOutputType
枚举以确定作业输出类型。
| 值 | 说明 |
|---|---|
| uri_file | |
| uri_folder | |
| mltable | |
| custom_model | |
| mlflow_model | |
| triton_model |
JobResourceConfiguration
| 名称 | 类型 | 默认值 | 说明 |
|---|---|---|---|
| dockerArgs |
string |
要传递给 Docker run 命令的额外参数。 这将替代系统设置的任何参数,或在本部分中。 此参数仅支持 Azure ML 计算类型。 |
|
| dockerArgsList |
string[] |
作为集合传递给 Docker run 命令的额外参数。 这将替代系统设置的任何参数,或在本部分中。 此参数仅支持 Azure ML 计算类型。 |
|
| instanceCount |
integer (int32) |
1 |
计算目标使用的实例或节点数可选。 |
| instanceType |
string |
计算目标支持的可选 VM 类型。 |
|
| properties |
其他属性包。 |
||
| shmSize |
string pattern: \d+[bBkKmMgG] |
2g |
docker 容器的共享内存块的大小。 这应采用 (number)(unit) 格式,其中数字大于 0,单位可以是 b(字节)、k(千字节)、m(兆字节)或 g(GB)。 |
JobService
作业端点定义
| 名称 | 类型 | 说明 |
|---|---|---|
| endpoint |
string |
终结点的 URL。 |
| errorMessage |
string |
服务中的任何错误。 |
| jobServiceType |
string |
终结点类型。 |
| nodes | Nodes: |
用户希望启动服务的节点。 如果未将 Nodes 设置为 null,则服务将仅在领导节点上启动。 |
| port |
integer (int32) |
终结点的端口。 |
| properties |
object |
在终结点上设置的其他属性。 |
| status |
string |
终结点的状态。 |
JobStatus
作业的状态。
| 值 | 说明 |
|---|---|
| NotStarted |
跑步还没有开始。 |
| Starting |
跑步已经开始了。 用户具有运行 ID。 |
| Provisioning |
(目前未使用)如果 ES 正在创建计算目标,则将使用它。 |
| Preparing |
运行环境正在准备中。 |
| Queued |
作业在计算目标中排队。 例如,在 BatchAI 中,作业处于排队状态,同时等待所有必需的节点准备就绪。 |
| Running |
作业开始在计算目标中运行。 |
| Finalizing |
作业在目标中完成。 它现在处于输出收集状态。 |
| CancelRequested |
已请求取消该作业。 |
| Completed |
作业已成功完成。 这反映了作业本身和输出收集状态都已成功完成 |
| Failed |
作业失败。 |
| Canceled |
在取消请求之后,作业现在已成功取消。 |
| NotResponding |
启用检测信号后,如果运行未将任何信息更新到 RunHistory,则运行将进入 NotResponding 状态。 NotResponding 是唯一不受严格转换命令约束的状态。 运行可以从 NotResponding 转到之前的任何状态。 |
| Paused |
作业由用户暂停。 只能在暂停状态下对标记作业进行一些调整。 |
| Unknown |
默认作业状态(如果未映射到所有其他状态) |
JobTier
用于确定作业层的枚举。
| 值 | 说明 |
|---|---|
| Null | |
| Spot | |
| Basic | |
| Standard | |
| Premium |
JobType
枚举以确定作业类型。
| 值 | 说明 |
|---|---|
| AutoML | |
| Command | |
| Sweep | |
| Pipeline | |
| Spark |
LearningRateScheduler
学习率调度程序枚举。
| 值 | 说明 |
|---|---|
| None |
未选择学习率调度程序。 |
| WarmupCosine |
余弦退火与预热。 |
| Step |
步进学习率调度器。 |
LiteralJobInput
文字输入类型。
| 名称 | 类型 | 说明 |
|---|---|---|
| description |
string |
输入的说明。 |
| jobInputType |
string:
literal |
[必需]指定作业的类型。 |
| value |
string minLength: 1pattern: [a-zA-Z0-9_] |
[必需]输入的文本值。 |
LogVerbosity
用于设置日志详细程度的枚举。
| 值 | 说明 |
|---|---|
| NotSet |
不发出任何日志。 |
| Debug |
已记录 Debug 及以上日志语句。 |
| Info |
Info 和上述日志语句。 |
| Warning |
已记录警告及以上日志语句。 |
| Error |
记录了错误和上述日志语句。 |
| Critical |
仅记录关键语句。 |
ManagedIdentity
托管标识配置。
| 名称 | 类型 | 说明 |
|---|---|---|
| clientId |
string (uuid) |
按客户端 ID 指定用户分配的标识。 对于系统分配,请不要设置此字段。 |
| identityType |
string:
Managed |
[必需]指定标识框架的类型。 |
| objectId |
string (uuid) |
按对象 ID 指定用户分配的标识。 对于系统分配,请不要设置此字段。 |
| resourceId |
string |
按 ARM 资源 ID 指定用户分配的标识。 对于系统分配,请不要设置此字段。 |
MedianStoppingPolicy
根据所有运行的主要指标的运行平均值定义提前终止策略
| 名称 | 类型 | 默认值 | 说明 |
|---|---|---|---|
| delayEvaluation |
integer (int32) |
0 |
延迟第一次计算的间隔数。 |
| evaluationInterval |
integer (int32) |
0 |
策略评估之间的间隔(运行数)。 |
| policyType |
string:
Median |
[必需]策略配置的名称 |
MLFlowModelJobInput
| 名称 | 类型 | 默认值 | 说明 |
|---|---|---|---|
| description |
string |
输入的说明。 |
|
| jobInputType |
string:
mlflow_model |
[必需]指定作业的类型。 |
|
| mode | ReadOnlyMount |
枚举以确定输入数据传递模式。 |
|
| uri |
string minLength: 1pattern: [a-zA-Z0-9_] |
[必需]输入资产 URI。 |
MLFlowModelJobOutput
| 名称 | 类型 | 默认值 | 说明 |
|---|---|---|---|
| assetName |
string |
输出资产名称。 |
|
| description |
string |
输出的说明。 |
|
| jobOutputType |
string:
mlflow_model |
[必需]指定作业的类型。 |
|
| mode | ReadWriteMount |
输出数据传递模式枚举。 |
|
| uri |
string |
输出资产 URI。 |
MLTableJobInput
| 名称 | 类型 | 默认值 | 说明 |
|---|---|---|---|
| description |
string |
输入的说明。 |
|
| jobInputType |
string:
mltable |
[必需]指定作业的类型。 |
|
| mode | ReadOnlyMount |
枚举以确定输入数据传递模式。 |
|
| uri |
string minLength: 1pattern: [a-zA-Z0-9_] |
[必需]输入资产 URI。 |
MLTableJobOutput
| 名称 | 类型 | 默认值 | 说明 |
|---|---|---|---|
| assetName |
string |
输出资产名称。 |
|
| description |
string |
输出的说明。 |
|
| jobOutputType |
string:
mltable |
[必需]指定作业的类型。 |
|
| mode | ReadWriteMount |
输出数据传递模式枚举。 |
|
| uri |
string |
输出资产 URI。 |
ModelSize
图像模型大小。
| 值 | 说明 |
|---|---|
| None |
未选择任何值。 |
| Small |
体积小。 |
| Medium |
中等尺寸。 |
| Large |
大尺寸。 |
| ExtraLarge |
超大尺寸。 |
Mpi
MPI 分发配置。
| 名称 | 类型 | 说明 |
|---|---|---|
| distributionType | string: |
[必需]指定分发框架的类型。 |
| processCountPerInstance |
integer (int32) |
每个 MPI 节点的进程数。 |
NCrossValidationsMode
确定如何确定 N-Cross 验证值。
| 值 | 说明 |
|---|---|
| Auto |
自动确定 N-Cross 验证值。 仅支持“预测”AutoML 任务。 |
| Custom |
使用自定义 N-Cross 验证值。 |
NlpVerticalFeaturizationSettings
| 名称 | 类型 | 说明 |
|---|---|---|
| datasetLanguage |
string |
数据集语言,适用于文本数据。 |
NlpVerticalLimitSettings
作业执行约束。
| 名称 | 类型 | 默认值 | 说明 |
|---|---|---|---|
| maxConcurrentTrials |
integer (int32) |
1 |
最大并发 AutoML 迭代次数。 |
| maxTrials |
integer (int32) |
1 |
AutoML 迭代数。 |
| timeout |
string (duration) |
P7D |
AutoML 作业超时。 |
NodesValueType
节点值的枚举类型
| 值 | 说明 |
|---|---|
| All |
NotificationSetting
通知的配置。
| 名称 | 类型 | 说明 |
|---|---|---|
| emailOn |
在指定的通知类型上向用户发送电子邮件通知 |
|
| emails |
string[] |
这是电子邮件收件人列表,限制为 499 个字符的总 concat 和逗号分隔符 |
| webhooks |
object |
将 Webhook 回调发送到服务。 密钥是 Webhook 的用户提供的名称。 |
ObjectDetectionPrimaryMetrics
图像对象检测任务的主要指标。
| 值 | 说明 |
|---|---|
| MeanAveragePrecision |
平均精度 (MAP) 是 AP(平均精度)的平均值。 计算每个类的 AP 并取平均值以获得 MAP。 |
Objective
优化目标。
| 名称 | 类型 | 说明 |
|---|---|---|
| goal |
[必需]定义超参数优化支持的指标目标 |
|
| primaryMetric |
string minLength: 1pattern: [a-zA-Z0-9_] |
[必需]要优化的指标的名称。 |
OutputDeliveryMode
输出数据传递模式枚举。
| 值 | 说明 |
|---|---|
| ReadWriteMount | |
| Upload | |
| Direct |
PipelineJob
管道作业定义:定义通用到 MFE 属性。
| 名称 | 类型 | 默认值 | 说明 |
|---|---|---|---|
| componentId |
string |
组件资源的 ARM 资源 ID。 |
|
| computeId |
string |
计算资源的 ARM 资源 ID。 |
|
| description |
string |
资产说明文本。 |
|
| displayName |
string |
作业的显示名称。 |
|
| experimentName |
string |
Default |
作业所属的试验的名称。 如果未设置,作业将放置在“默认”试验中。 |
| identity | IdentityConfiguration: |
标识配置。 如果已设置,则应为 AmlToken、ManagedIdentity、UserIdentity 或 null 之一。 如果为 null,则默认为 AmlToken。 |
|
| inputs |
object |
管道作业的输入。 |
|
| isArchived |
boolean |
False |
资产是否已存档? |
| jobType |
string:
Pipeline |
[必需]指定作业的类型。 |
|
| jobs |
作业构造管道作业。 |
||
| notificationSetting |
作业的通知设置 |
||
| outputs |
object |
管道作业的输出 |
|
| properties |
object |
资产属性字典。 |
|
| services |
<string,
Job |
JobEndpoints 列表。 对于本地作业,作业终结点的终结点值为 FileStreamObject。 |
|
| settings |
管道设置,例如 ContinueRunOnStepFailure 等。 |
||
| sourceJobId |
string |
源作业的 ARM 资源 ID。 |
|
| status |
作业状态。 |
||
| tags |
object |
标记字典。 可以添加、删除和更新标记。 |
PyTorch
PyTorch 分发配置。
| 名称 | 类型 | 说明 |
|---|---|---|
| distributionType | string: |
[必需]指定分发框架的类型。 |
| processCountPerInstance |
integer (int32) |
每个节点的进程数。 |
QueueSettings
| 名称 | 类型 | 默认值 | 说明 |
|---|---|---|---|
| jobTier | Null |
用于确定作业层的枚举。 |
RandomSamplingAlgorithm
定义随机生成值的采样算法
| 名称 | 类型 | 默认值 | 说明 |
|---|---|---|---|
| rule | Random |
随机算法的特定类型 |
|
| samplingAlgorithmType |
string:
Random |
[必需]用于生成超参数值的算法以及配置属性 |
|
| seed |
integer (int32) |
用作随机数生成的种子的可选整数 |
RandomSamplingAlgorithmRule
随机算法的特定类型
| 值 | 说明 |
|---|---|
| Random | |
| Sobol |
Regression
AutoML Table 垂直中的回归任务。
| 名称 | 类型 | 默认值 | 说明 |
|---|---|---|---|
| cvSplitColumnNames |
string[] |
用于 CVSplit 数据的列。 |
|
| featurizationSettings |
AutoML 作业所需的特征化输入。 |
||
| limitSettings |
AutoMLJob 的执行约束。 |
||
| logVerbosity | Info |
用于设置日志详细程度的枚举。 |
|
| nCrossValidations | NCrossValidations: |
未提供验证数据集时要应用于训练数据集的交叉验证折叠数。 |
|
| primaryMetric | NormalizedRootMeanSquaredError |
回归任务的主要指标。 |
|
| targetColumnName |
string |
目标列名称:这是预测值列。 也称为分类任务的上下文中的标签列名称。 |
|
| taskType | string: |
[必需]AutoMLJob 的任务类型。 |
|
| testData |
测试数据输入。 |
||
| testDataSize |
number (double) |
需要为验证目的预留的测试数据集的分数。 介于 (0.0 , 1.0) 之间的值 未提供验证数据集时应用。 |
|
| trainingData |
[必需]训练数据输入。 |
||
| trainingSettings |
AutoML 作业训练阶段的输入。 |
||
| validationData |
验证数据输入。 |
||
| validationDataSize |
number (double) |
需要留出用于验证的定型数据集的分数。 介于 (0.0 , 1.0) 之间的值 未提供验证数据集时应用。 |
|
| weightColumnName |
string |
示例权重列的名称。 自动化 ML 支持加权列作为输入,导致数据中的行向上或向下加权。 |
RegressionModels
AutoML 支持的所有回归模型的枚举。
| 值 | 说明 |
|---|---|
| ElasticNet |
弹性网络是一种流行的正则化线性回归类型,它结合了两种流行的惩罚,特别是 L1 和 L2 惩罚函数。 |
| GradientBoosting |
将周学习者转变为强学习者的技术称为提升。 梯度提升算法过程基于这种执行理论。 |
| DecisionTree |
决策树是一种非参数监督学习方法,用于分类和回归任务。 目标是创建一个模型,通过学习从数据特征推断的简单决策规则来预测目标变量的值。 |
| KNN |
K 最近邻 (KNN) 算法使用“特征相似性”来预测新数据点的值,这进一步意味着新数据点将根据它与训练集中点的匹配程度分配一个值。 |
| LassoLars |
套索模型拟合最小角度回归又名 Lars。 它是一个线性模型,使用 L1 先验作为正则化器进行训练。 |
| SGD |
SGD:随机梯度下降是一种优化算法,常用于机器学习应用,用于找到与预测输出和实际输出之间最佳拟合相对应的模型参数。 这是一种不精确但强大的技术。 |
| RandomForest |
随机森林是一种监督学习算法。 它构建的“森林”是决策树的集合,通常使用“装袋”方法进行训练。 套袋方法的总体思路是学习模型的组合增加了整体结果。 |
| ExtremeRandomTrees |
Extreme Trees 是一种集成机器学习算法,它结合了许多决策树的预测。 它与广泛使用的随机森林算法有关。 |
| LightGBM |
LightGBM 是一个梯度提升框架,它使用基于树的学习算法。 |
| XGBoostRegressor |
XGBoostRegressor:Extreme Gradient Boosting Regressor 是一种使用基本学习器集成的监督机器学习模型。 |
RegressionPrimaryMetrics
回归任务的主要指标。
| 值 | 说明 |
|---|---|
| SpearmanCorrelation |
斯皮尔曼秩相关系数是秩相关性的非参数度量。 |
| NormalizedRootMeanSquaredError |
归一化均方根误差 (NRMSE) RMSE 有助于不同尺度模型之间的比较。 |
| R2Score |
R2 分数是基于预测的机器学习模型的性能评估度量之一。 |
| NormalizedMeanAbsoluteError |
归一化平均绝对误差 (NMAE) 是一种验证指标,用于比较不同尺度的(时间)序列的平均绝对误差 (MAE)。 |
RegressionTrainingSettings
回归训练相关配置。
| 名称 | 类型 | 默认值 | 说明 |
|---|---|---|---|
| allowedTrainingAlgorithms |
回归任务的允许模型。 |
||
| blockedTrainingAlgorithms |
回归任务的阻止模型。 |
||
| enableDnnTraining |
boolean |
False |
启用 DNN 模型的建议。 |
| enableModelExplainability |
boolean |
True |
标志以在最佳模型上启用可解释性。 |
| enableOnnxCompatibleModels |
boolean |
False |
用于启用 onnx 兼容模型的标志。 |
| enableStackEnsemble |
boolean |
True |
启用堆栈合奏运行。 |
| enableVoteEnsemble |
boolean |
True |
启用投票合奏运行。 |
| ensembleModelDownloadTimeout |
string (duration) |
PT5M |
在 VotingEnsemble 和 StackEnsemble 模型生成期间,将下载先前子运行中的多个拟合模型。 如果需要更多时间,请将此参数配置为大于 300 秒的值。 |
| stackEnsembleSettings |
堆栈合奏的堆栈合奏设置。 |
SamplingAlgorithmType
| 值 | 说明 |
|---|---|
| Grid | |
| Random | |
| Bayesian |
SeasonalityMode
预测季节性模式。
| 值 | 说明 |
|---|---|
| Auto |
季节性将自动确定。 |
| Custom |
使用自定义季节性值。 |
ShortSeriesHandlingConfiguration
定义 AutoML 如何处理短时序的参数。
| 值 | 说明 |
|---|---|
| None |
表示无/空值。 |
| Auto |
如果没有长系列,短系列将被填充,否则短系列将被删除。 |
| Pad |
所有短剧都将被填充。 |
| Drop |
所有短剧都将被删除。 |
SparkJob
Spark 作业定义。
| 名称 | 类型 | 默认值 | 说明 |
|---|---|---|---|
| archives |
string[] |
存档作业中使用的文件。 |
|
| args |
string |
作业的参数。 |
|
| codeId |
string (arm-id) minLength: 1pattern: [a-zA-Z0-9_] |
[必需] 代码资产的 arm-id。 |
|
| componentId |
string |
组件资源的 ARM 资源 ID。 |
|
| computeId |
string |
计算资源的 ARM 资源 ID。 |
|
| conf |
object |
Spark 配置的属性。 |
|
| description |
string |
资产说明文本。 |
|
| displayName |
string |
作业的显示名称。 |
|
| entry | SparkJobEntry: |
[必需]在启动作业时要执行的条目。 |
|
| environmentId |
string (arm-id) |
作业的环境规范的 ARM 资源 ID。 |
|
| environmentVariables |
object |
作业中包含的环境变量。 |
|
| experimentName |
string |
Default |
作业所属的试验的名称。 如果未设置,作业将放置在“默认”试验中。 |
| files |
string[] |
作业中使用的文件。 |
|
| identity | IdentityConfiguration: |
标识配置。 如果已设置,则应为 AmlToken、ManagedIdentity、UserIdentity 或 null 之一。 如果为 null,则默认为 AmlToken。 |
|
| inputs |
object |
作业中使用的输入数据绑定的映射。 |
|
| isArchived |
boolean |
False |
资产是否已存档? |
| jars |
string[] |
作业中使用的 Jar 文件。 |
|
| jobType |
string:
Spark |
[必需]指定作业的类型。 |
|
| notificationSetting |
作业的通知设置 |
||
| outputs |
object |
作业中使用的输出数据绑定的映射。 |
|
| properties |
object |
资产属性字典。 |
|
| pyFiles |
string[] |
作业中使用的 Python 文件。 |
|
| queueSettings |
作业的队列设置 |
||
| resources |
作业的计算资源配置。 |
||
| services |
<string,
Job |
JobEndpoints 列表。 对于本地作业,作业终结点的终结点值为 FileStreamObject。 |
|
| status |
作业状态。 |
||
| tags |
object |
标记字典。 可以添加、删除和更新标记。 |
SparkJobEntryType
| 值 | 说明 |
|---|---|
| SparkJobPythonEntry | |
| SparkJobScalaEntry |
SparkJobPythonEntry
| 名称 | 类型 | 说明 |
|---|---|---|
| file |
string minLength: 1pattern: [a-zA-Z0-9_] |
[必需]作业入口点的相对 python 文件路径。 |
| sparkJobEntryType | string: |
[必需]作业入口点的类型。 |
SparkJobScalaEntry
| 名称 | 类型 | 说明 |
|---|---|---|
| className |
string minLength: 1pattern: [a-zA-Z0-9_] |
[必需]用作入口点的 Scala 类名称。 |
| sparkJobEntryType | string: |
[必需]作业入口点的类型。 |
SparkResourceConfiguration
| 名称 | 类型 | 默认值 | 说明 |
|---|---|---|---|
| instanceType |
string |
计算目标支持的可选 VM 类型。 |
|
| runtimeVersion |
string |
3.1 |
用于作业的 spark 运行时的版本。 |
StackEnsembleSettings
用于自定义 StackEnsemble 运行的高级设置。
| 名称 | 类型 | 默认值 | 说明 |
|---|---|---|---|
| stackMetaLearnerKWargs |
要传递给元学习器初始值设定项的可选参数。 |
||
| stackMetaLearnerTrainPercentage |
number (double) |
0.2 |
指定要保留用于训练元学习者的训练集(选择训练和训练类型的训练)的比例。 默认值为 0.2。 |
| stackMetaLearnerType | None |
元学习器是一个基于各个异构模型输出训练的模型。\r\n默认的元学习器是用于分类任务的LogisticRegression(如果启用交叉验证则用LogisticRegressionCV),用于回归/预测任务的ElasticNet(或启用交叉验证则用ElasticNetCV)。\r\n该参数可以是以下字符串之一:LogisticRegression、LogisticRegressionCV、LightGBMClassifier、ElasticNet、ElasticNetCV、LightGBMRegressor 或 LinearRegression |
StackMetaLearnerType
元学习器是一个基于各个异构模型输出训练的模型。\r\n默认的元学习器是用于分类任务的LogisticRegression(如果启用交叉验证则用LogisticRegressionCV),用于回归/预测任务的ElasticNet(或启用交叉验证则用ElasticNetCV)。\r\n该参数可以是以下字符串之一:LogisticRegression、LogisticRegressionCV、LightGBMClassifier、ElasticNet、ElasticNetCV、LightGBMRegressor 或 LinearRegression
| 值 | 说明 |
|---|---|
| None | |
| LogisticRegression |
默认元学习器是用于分类任务的 LogisticRegression。 |
| LogisticRegressionCV |
当 CV 打开时,默认元学习器是分类任务的 LogisticRegression。 |
| LightGBMClassifier | |
| ElasticNet |
默认元学习器是回归任务的 LogisticRegression。 |
| ElasticNetCV |
当 CV 打开时,默认元学习器是回归任务的 LogisticRegression。 |
| LightGBMRegressor | |
| LinearRegression |
StochasticOptimizer
图像模型的随机优化器。
| 值 | 说明 |
|---|---|
| None |
未选择优化器。 |
| Sgd |
随机梯度下降优化器。 |
| Adam |
Adam 是一种基于矩的自适应估计优化随机目标函数的算法 |
| Adamw |
AdamW 是优化器 Adam 的变体,它改进了权重衰减的实现。 |
SweepJob
扫描作业定义。
| 名称 | 类型 | 默认值 | 说明 |
|---|---|---|---|
| componentId |
string |
组件资源的 ARM 资源 ID。 |
|
| computeId |
string |
计算资源的 ARM 资源 ID。 |
|
| description |
string |
资产说明文本。 |
|
| displayName |
string |
作业的显示名称。 |
|
| earlyTermination | EarlyTerminationPolicy: |
提前终止策略可在完成之前取消性能不佳的运行 |
|
| experimentName |
string |
Default |
作业所属的试验的名称。 如果未设置,作业将放置在“默认”试验中。 |
| identity | IdentityConfiguration: |
标识配置。 如果已设置,则应为 AmlToken、ManagedIdentity、UserIdentity 或 null 之一。 如果为 null,则默认为 AmlToken。 |
|
| inputs |
object |
作业中使用的输入数据绑定的映射。 |
|
| isArchived |
boolean |
False |
资产是否已存档? |
| jobType |
string:
Sweep |
[必需]指定作业的类型。 |
|
| limits |
扫描作业限制。 |
||
| notificationSetting |
作业的通知设置 |
||
| objective |
[必需]优化目标。 |
||
| outputs |
object |
作业中使用的输出数据绑定的映射。 |
|
| properties |
object |
资产属性字典。 |
|
| queueSettings |
作业的队列设置 |
||
| samplingAlgorithm | SamplingAlgorithm: |
[必需]超参数采样算法 |
|
| searchSpace |
[必需]包含每个参数及其分布的字典。 字典键是参数的名称 |
||
| services |
<string,
Job |
JobEndpoints 列表。 对于本地作业,作业终结点的终结点值为 FileStreamObject。 |
|
| status |
作业状态。 |
||
| tags |
object |
标记字典。 可以添加、删除和更新标记。 |
|
| trial |
[必需]试用组件定义。 |
SweepJobLimits
扫描作业限制类。
| 名称 | 类型 | 说明 |
|---|---|---|
| jobLimitsType |
string:
Sweep |
[必需]JobLimit 类型。 |
| maxConcurrentTrials |
integer (int32) |
扫描作业最大并发试用版。 |
| maxTotalTrials |
integer (int32) |
扫描作业最大总试用版数。 |
| timeout |
string (duration) |
ISO 8601 格式的最大运行持续时间,之后作业将被取消。 仅支持精度为秒的持续时间。 |
| trialTimeout |
string (duration) |
扫描作业试用超时值。 |
systemData
与创建和上次修改资源相关的元数据。
| 名称 | 类型 | 说明 |
|---|---|---|
| createdAt |
string (date-time) |
资源创建时间戳(UTC)。 |
| createdBy |
string |
创建资源的标识。 |
| createdByType |
创建资源的标识的类型。 |
|
| lastModifiedAt |
string (date-time) |
资源上次修改的时间戳 (UTC) |
| lastModifiedBy |
string |
上次修改资源的标识。 |
| lastModifiedByType |
上次修改资源的标识的类型。 |
TableVerticalFeaturizationSettings
特征化配置。
| 名称 | 类型 | 默认值 | 说明 |
|---|---|---|---|
| blockedTransformers |
这些转换器不应用于特征化。 |
||
| columnNameAndTypes |
object |
列名及其类型(int、float、string、datetime 等)的字典。 |
|
| datasetLanguage |
string |
数据集语言,适用于文本数据。 |
|
| enableDnnFeaturization |
boolean |
False |
确定是否使用基于 Dnn 的特征化器进行数据特征化。 |
| mode | Auto |
特征化模式 - 用户可以保留默认的“自动”模式,AutoML 将负责在特征化阶段对数据进行必要的转换。 如果选择了“关闭”,则不会完成特征化。 如果选择“自定义”,则用户可以指定其他输入以自定义特征化完成方式。 |
|
| transformerParams |
object |
用户可以指定要用于的其他转换器以及要向其应用它的列以及转换器构造函数的参数。 |
TableVerticalLimitSettings
作业执行约束。
| 名称 | 类型 | 默认值 | 说明 |
|---|---|---|---|
| enableEarlyTermination |
boolean |
True |
启用提前终止,确定如果最近 20 次迭代中没有分数改进,AutoMLJob 是否会提前终止。 |
| exitScore |
number (double) |
AutoML 作业的退出分数。 |
|
| maxConcurrentTrials |
integer (int32) |
1 |
最大并发迭代数。 |
| maxCoresPerTrial |
integer (int32) |
-1 |
每次迭代的最大核心数。 |
| maxTrials |
integer (int32) |
1000 |
迭代数。 |
| timeout |
string (duration) |
PT6H |
AutoML 作业超时。 |
| trialTimeout |
string (duration) |
PT30M |
迭代超时。 |
TargetAggregationFunction
目标聚合函数。
| 值 | 说明 |
|---|---|
| None |
表示没有值集。 |
| Sum | |
| Max | |
| Min | |
| Mean |
TargetLagsMode
目标滞后选择模式。
| 值 | 说明 |
|---|---|
| Auto |
目标滞后将自动确定。 |
| Custom |
使用自定义目标滞后。 |
TargetRollingWindowSizeMode
目标滚动窗口大小模式。
| 值 | 说明 |
|---|---|
| Auto |
自动确定滚动窗口大小。 |
| Custom |
使用指定的滚动窗口大小。 |
TaskType
AutoMLJob 任务类型。
| 值 | 说明 |
|---|---|
| Classification |
机器学习和统计学中的分类是一种监督学习方法,其中计算机程序从给定给它的数据中学习并做出新的观察或分类。 |
| Regression |
回归是指使用输入数据预测值。 回归模型用于预测连续值。 |
| Forecasting |
预测是一种特殊的回归任务,它处理时间序列数据并创建预测模型,该模型可用于根据输入预测近期的值。 |
| ImageClassification |
图像分类。 当图像仅使用一组类中的单个标签进行分类时,使用多类图像分类 - 例如,每个图像被分类为“猫”或“狗”或“鸭子”的图像。 |
| ImageClassificationMultilabel |
图像分类多标签。 当图像可以具有一组标签中的一个或多个标签时,使用多标签图像分类 - 例如,图像可以同时标记为“猫”和“狗”。 |
| ImageObjectDetection |
图像对象检测。 对象检测用于识别图像中的对象并使用边界框定位每个对象,例如定位图像中的所有狗和猫,并在每个对象周围绘制一个边界框。 |
| ImageInstanceSegmentation |
图像实例分割。 实例分割用于在像素级别识别图像中的对象,在图像中的每个对象周围绘制一个多边形。 |
| TextClassification |
文本分类(也称为文本标记或文本分类)是将文本分类的过程。 类别是相互排斥的。 |
| TextClassificationMultilabel |
多标签分类任务将每个样本分配给一组(零个或多个)目标标签。 |
| TextNER |
文本命名实体识别,又名 TextNER。 命名实体识别 (NER) 是获取自由格式文本并识别人员、位置、组织等实体出现的能力。 |
TensorFlow
TensorFlow 分布配置。
| 名称 | 类型 | 默认值 | 说明 |
|---|---|---|---|
| distributionType | string: |
[必需]指定分发框架的类型。 |
|
| parameterServerCount |
integer (int32) |
0 |
参数服务器任务数。 |
| workerCount |
integer (int32) |
工人数。 如果未指定,则默认为实例计数。 |
TextClassification
AutoML NLP 垂直版中的文本分类任务。 NLP - 自然语言处理。
| 名称 | 类型 | 默认值 | 说明 |
|---|---|---|---|
| featurizationSettings |
AutoML 作业所需的特征化输入。 |
||
| limitSettings |
AutoMLJob 的执行约束。 |
||
| logVerbosity | Info |
用于设置日志详细程度的枚举。 |
|
| primaryMetric | Accuracy |
分类任务的主要指标。 |
|
| targetColumnName |
string |
目标列名称:这是预测值列。 也称为分类任务的上下文中的标签列名称。 |
|
| taskType | string: |
[必需]AutoMLJob 的任务类型。 |
|
| trainingData |
[必需]训练数据输入。 |
||
| validationData |
验证数据输入。 |
TextClassificationMultilabel
AutoML NLP 垂直领域的文本分类多标签任务。 NLP - 自然语言处理。
| 名称 | 类型 | 默认值 | 说明 |
|---|---|---|---|
| featurizationSettings |
AutoML 作业所需的特征化输入。 |
||
| limitSettings |
AutoMLJob 的执行约束。 |
||
| logVerbosity | Info |
用于设置日志详细程度的枚举。 |
|
| primaryMetric |
文本 -Classification-Multilabel 任务的主要指标。 目前仅支持准确度作为主要指标,因此用户无需显式设置。 |
||
| targetColumnName |
string |
目标列名称:这是预测值列。 也称为分类任务的上下文中的标签列名称。 |
|
| taskType | string: |
[必需]AutoMLJob 的任务类型。 |
|
| trainingData |
[必需]训练数据输入。 |
||
| validationData |
验证数据输入。 |
TextNer
AutoML NLP 垂直 Text-NER 任务。 NER - 命名实体识别。 NLP - 自然语言处理。
| 名称 | 类型 | 默认值 | 说明 |
|---|---|---|---|
| featurizationSettings |
AutoML 作业所需的特征化输入。 |
||
| limitSettings |
AutoMLJob 的执行约束。 |
||
| logVerbosity | Info |
用于设置日志详细程度的枚举。 |
|
| primaryMetric |
Text-NER 任务的主要指标。 Text-NER 仅支持“准确性”,因此用户无需显式设置。 |
||
| targetColumnName |
string |
目标列名称:这是预测值列。 也称为分类任务的上下文中的标签列名称。 |
|
| taskType |
string:
TextNER |
[必需]AutoMLJob 的任务类型。 |
|
| trainingData |
[必需]训练数据输入。 |
||
| validationData |
验证数据输入。 |
TrialComponent
试用组件定义。
| 名称 | 类型 | 说明 |
|---|---|---|
| codeId |
string |
代码资产的 ARM 资源 ID。 |
| command |
string minLength: 1pattern: [a-zA-Z0-9_] |
[必需]在启动作业时执行的命令。 eg. “python train.py” |
| distribution | DistributionConfiguration: |
作业的分发配置。 如果已设置,则应为 Mpi、Tensorflow、PyTorch 或 null 之一。 |
| environmentId |
string minLength: 1pattern: [a-zA-Z0-9_] |
[必需]作业的环境规范的 ARM 资源 ID。 |
| environmentVariables |
object |
作业中包含的环境变量。 |
| resources |
作业的计算资源配置。 |
TritonModelJobInput
| 名称 | 类型 | 默认值 | 说明 |
|---|---|---|---|
| description |
string |
输入的说明。 |
|
| jobInputType |
string:
triton_model |
[必需]指定作业的类型。 |
|
| mode | ReadOnlyMount |
枚举以确定输入数据传递模式。 |
|
| uri |
string minLength: 1pattern: [a-zA-Z0-9_] |
[必需]输入资产 URI。 |
TritonModelJobOutput
| 名称 | 类型 | 默认值 | 说明 |
|---|---|---|---|
| assetName |
string |
输出资产名称。 |
|
| description |
string |
输出的说明。 |
|
| jobOutputType |
string:
triton_model |
[必需]指定作业的类型。 |
|
| mode | ReadWriteMount |
输出数据传递模式枚举。 |
|
| uri |
string |
输出资产 URI。 |
TruncationSelectionPolicy
定义提前终止策略,该策略在每个评估间隔内取消给定百分比的运行。
| 名称 | 类型 | 默认值 | 说明 |
|---|---|---|---|
| delayEvaluation |
integer (int32) |
0 |
延迟第一次计算的间隔数。 |
| evaluationInterval |
integer (int32) |
0 |
策略评估之间的间隔(运行数)。 |
| policyType |
string:
Truncation |
[必需]策略配置的名称 |
|
| truncationPercentage |
integer (int32) |
0 |
要在每个评估间隔取消的运行百分比。 |
UriFileJobInput
| 名称 | 类型 | 默认值 | 说明 |
|---|---|---|---|
| description |
string |
输入的说明。 |
|
| jobInputType |
string:
uri_file |
[必需]指定作业的类型。 |
|
| mode | ReadOnlyMount |
枚举以确定输入数据传递模式。 |
|
| uri |
string minLength: 1pattern: [a-zA-Z0-9_] |
[必需]输入资产 URI。 |
UriFileJobOutput
| 名称 | 类型 | 默认值 | 说明 |
|---|---|---|---|
| assetName |
string |
输出资产名称。 |
|
| description |
string |
输出的说明。 |
|
| jobOutputType |
string:
uri_file |
[必需]指定作业的类型。 |
|
| mode | ReadWriteMount |
输出数据传递模式枚举。 |
|
| uri |
string |
输出资产 URI。 |
UriFolderJobInput
| 名称 | 类型 | 默认值 | 说明 |
|---|---|---|---|
| description |
string |
输入的说明。 |
|
| jobInputType |
string:
uri_folder |
[必需]指定作业的类型。 |
|
| mode | ReadOnlyMount |
枚举以确定输入数据传递模式。 |
|
| uri |
string minLength: 1pattern: [a-zA-Z0-9_] |
[必需]输入资产 URI。 |
UriFolderJobOutput
| 名称 | 类型 | 默认值 | 说明 |
|---|---|---|---|
| assetName |
string |
输出资产名称。 |
|
| description |
string |
输出的说明。 |
|
| jobOutputType |
string:
uri_folder |
[必需]指定作业的类型。 |
|
| mode | ReadWriteMount |
输出数据传递模式枚举。 |
|
| uri |
string |
输出资产 URI。 |
UserIdentity
用户标识配置。
| 名称 | 类型 | 说明 |
|---|---|---|
| identityType | string: |
[必需]指定标识框架的类型。 |
UseStl
配置时序目标列的 STL 分解。
| 值 | 说明 |
|---|---|
| None |
无 stl 分解。 |
| Season | |
| SeasonTrend |
ValidationMetricType
用于图像任务中验证指标的指标计算方法。
| 值 | 说明 |
|---|---|
| None |
没有指标。 |
| Coco |
可可度量。 |
| Voc |
VOC 指标。 |
| CocoVoc |
CocoVoc 指标。 |
WebhookType
枚举来确定 Webhook 回调服务类型。
| 值 | 说明 |
|---|---|
| AzureDevOps |