Schedules - Create Or Update
创建或更新计划。
PUT https://management.azure.com/subscriptions/{subscriptionId}/resourceGroups/{resourceGroupName}/providers/Microsoft.MachineLearningServices/workspaces/{workspaceName}/schedules/{name}?api-version=2025-04-01
URI 参数
名称 | 在 | 必需 | 类型 | 说明 |
---|---|---|---|---|
name
|
path | True |
string pattern: ^[a-zA-Z0-9][a-zA-Z0-9\-_]{0,254}$ |
计划名称。 |
resource
|
path | True |
string minLength: 1maxLength: 90 |
资源组的名称。 此名称不区分大小写。 |
subscription
|
path | True |
string minLength: 1 |
目标订阅的 ID。 |
workspace
|
path | True |
string pattern: ^[a-zA-Z0-9][a-zA-Z0-9_-]{2,32}$ |
Azure 机器学习工作区的名称。 |
api-version
|
query | True |
string minLength: 1 |
要用于此操作的 API 版本。 |
请求正文
名称 | 必需 | 类型 | 说明 |
---|---|---|---|
properties | True |
[必需]实体的其他属性。 |
响应
名称 | 类型 | 说明 |
---|---|---|
200 OK |
创建或更新请求成功。 |
|
201 Created |
已创建 标头
|
|
Other Status Codes |
错误 |
示例
CreateOrUpdate Schedule.
示例请求
PUT https://management.azure.com/subscriptions/00000000-1111-2222-3333-444444444444/resourceGroups/test-rg/providers/Microsoft.MachineLearningServices/workspaces/my-aml-workspace/schedules/string?api-version=2025-04-01
{
"properties": {
"description": "string",
"tags": {
"string": "string"
},
"properties": {
"string": "string"
},
"displayName": "string",
"isEnabled": false,
"trigger": {
"endTime": "string",
"startTime": "string",
"timeZone": "string",
"triggerType": "Cron",
"expression": "string"
},
"action": {
"actionType": "InvokeBatchEndpoint",
"endpointInvocationDefinition": {
"9965593e-526f-4b89-bb36-761138cf2794": null
}
}
}
}
示例响应
{
"id": "string",
"name": "string",
"type": "string",
"properties": {
"description": "string",
"tags": {
"string": "string"
},
"properties": {
"string": "string"
},
"displayName": "string",
"isEnabled": false,
"trigger": {
"endTime": "string",
"startTime": "string",
"timeZone": "string",
"triggerType": "Cron",
"expression": "string"
},
"action": {
"actionType": "InvokeBatchEndpoint",
"endpointInvocationDefinition": {
"d77a9a9a-4bb5-4c0c-8a77-459be8b82b9f": null
}
},
"provisioningState": "Succeeded"
},
"systemData": {
"createdAt": "2020-01-01T12:34:56.999Z",
"createdBy": "string",
"createdByType": "Key",
"lastModifiedAt": "2020-01-01T12:34:56.999Z",
"lastModifiedBy": "string",
"lastModifiedByType": "Application"
}
}
{
"id": "string",
"name": "string",
"type": "string",
"properties": {
"description": "string",
"tags": {
"string": "string"
},
"properties": {
"string": "string"
},
"displayName": "string",
"isEnabled": false,
"trigger": {
"endTime": "string",
"startTime": "string",
"timeZone": "string",
"triggerType": "Cron",
"expression": "string"
},
"action": {
"actionType": "InvokeBatchEndpoint",
"endpointInvocationDefinition": {
"13ea51e0-ff28-49c3-a85d-9b5199eb14e5": null
}
},
"provisioningState": "Failed"
},
"systemData": {
"createdAt": "2020-01-01T12:34:56.999Z",
"createdBy": "string",
"createdByType": "Key",
"lastModifiedAt": "2020-01-01T12:34:56.999Z",
"lastModifiedBy": "string",
"lastModifiedByType": "User"
}
}
定义
AllFeatures
名称 | 类型 | 说明 |
---|---|---|
filterType | string: |
[必需]指定要在选择要计算指标的功能时利用的功能筛选器。 |
AllNodes
所有节点表示服务将在作业的所有节点上运行
名称 | 类型 | 说明 |
---|---|---|
nodesValueType |
string:
All |
[必需]Nodes 值的类型 |
AmlToken
AML 令牌标识配置。
名称 | 类型 | 说明 |
---|---|---|
identityType |
string:
AMLToken |
[必需]指定标识框架的类型。 |
AmlTokenComputeIdentity
AML 令牌计算标识定义。
名称 | 类型 | 说明 |
---|---|---|
computeIdentityType | string: |
[必需]指定要在监视作业中使用的标识类型。 |
AutoForecastHorizon
预测范围由系统自动确定。
名称 | 类型 | 说明 |
---|---|---|
mode |
string:
Auto |
[必需]设置预测地平线值选择模式。 |
AutoMLJob
AutoMLJob 类。 使用此类执行 AutoML 任务,例如分类/回归等。有关支持的所有任务,请参阅 TaskType 枚举。
名称 | 类型 | 默认值 | 说明 |
---|---|---|---|
componentId |
string |
组件资源的 ARM 资源 ID。 |
|
computeId |
string |
计算资源的 ARM 资源 ID。 |
|
description |
string |
资产说明文本。 |
|
displayName |
string |
作业的显示名称。 |
|
environmentId |
string |
作业的环境规范的 ARM 资源 ID。 这是一个可选值,如果未提供,AutoML 将在运行作业时将其默认为生产 AutoML 特选环境版本。 |
|
environmentVariables |
object |
作业中包含的环境变量。 |
|
experimentName |
string |
Default |
作业所属的试验的名称。 如果未设置,作业将放置在“默认”试验中。 |
identity | IdentityConfiguration: |
标识配置。 如果已设置,则应为 AmlToken、ManagedIdentity、UserIdentity 或 null 之一。 如果为 null,则默认为 AmlToken。 |
|
isArchived |
boolean |
False |
资产是否已存档? |
jobType |
string:
AutoML |
[必需]指定作业的类型。 |
|
notificationSetting |
作业的通知设置 |
||
outputs |
object |
作业中使用的输出数据绑定的映射。 |
|
properties |
object |
资产属性字典。 |
|
queueSettings |
作业的队列设置 |
||
resources | {} |
作业的计算资源配置。 |
|
services |
<string,
Job |
JobEndpoints 列表。 对于本地作业,作业终结点的终结点值为 FileStreamObject。 |
|
status |
作业的状态。 |
||
tags |
object |
标记字典。 可以添加、删除和更新标记。 |
|
taskDetails | AutoMLVertical: |
[必需]这表示可以是表/NLP/Image 之一的方案 |
AutoNCrossValidations
自动确定 N 交叉验证。
名称 | 类型 | 说明 |
---|---|---|
mode |
string:
Auto |
[必需]用于确定 N 交叉验证的模式。 |
AutoSeasonality
名称 | 类型 | 说明 |
---|---|---|
mode |
string:
Auto |
[必需]季节性模式。 |
AutoTargetLags
名称 | 类型 | 说明 |
---|---|---|
mode |
string:
Auto |
[必需]设置目标滞后模式 - 自动/自定义 |
AutoTargetRollingWindowSize
自动确定目标滞后滚动窗口。
名称 | 类型 | 说明 |
---|---|---|
mode |
string:
Auto |
[必需]TargetRollingWindowSiz 检测模式。 |
AzureDevOpsWebhook
特定于 Azure DevOps 的 Webhook 详细信息
名称 | 类型 | 说明 |
---|---|---|
eventType |
string |
对指定的通知事件发送回调 |
webhookType |
string:
Azure |
[必需]指定要发送回调的服务的类型 |
BanditPolicy
根据可宽延条件定义提前终止策略,以及评估的频率和延迟间隔
名称 | 类型 | 默认值 | 说明 |
---|---|---|---|
delayEvaluation |
integer (int32) |
0 |
延迟第一次计算的间隔数。 |
evaluationInterval |
integer (int32) |
0 |
策略评估之间的间隔(运行数)。 |
policyType |
string:
Bandit |
[必需]策略配置的名称 |
|
slackAmount |
number (float) |
0 |
从性能最佳的运行中允许的绝对距离。 |
slackFactor |
number (float) |
0 |
与性能最佳的运行距离的允许距离比率。 |
BayesianSamplingAlgorithm
定义一个采样算法,该算法基于以前的值生成值
名称 | 类型 | 说明 |
---|---|---|
samplingAlgorithmType |
string:
Bayesian |
[必需]用于生成超参数值的算法以及配置属性 |
BlockedTransformers
AutoML 支持的所有分类模型的枚举。
值 | 说明 |
---|---|
CatTargetEncoder |
分类数据的目标编码。 |
CountVectorizer |
Count Vectorizer 将文本文档集合转换为令牌计数矩阵。 |
HashOneHotEncoder |
哈希一个热编码器可以将分类变量转换为有限数量的新功能。 这通常用于高基数分类特征。 |
LabelEncoder |
标签编码器以数字形式转换标签/分类变量。 |
NaiveBayes |
Naive Bayes 是一种分类,用于分类明确分布的离散特征。 |
OneHotEncoder |
Ohe 热编码创建二进制特征转换。 |
TextTargetEncoder |
文本数据的目标编码。 |
TfIdf |
Tf-Idf 代表术语频率时间反转文档频率。 这是一种常见的术语加权方案,用于识别来自文档的信息。 |
WoETargetEncoder |
证据编码的权重是用于对分类变量进行编码的技术。 它使用 P(1)/P(0)的自然日志来创建权重。 |
WordEmbedding |
Word 嵌入有助于将字词或短语表示为向量或一系列数字。 |
CategoricalDataDriftMetric
值 | 说明 |
---|---|
JensenShannonDistance |
詹森香农距离 (JSD) 指标。 |
PearsonsChiSquaredTest |
皮尔逊奇平方测试指标。 |
PopulationStabilityIndex |
总体稳定性索引 (PSI) 指标。 |
CategoricalDataDriftMetricThreshold
名称 | 类型 | 说明 |
---|---|---|
dataType |
string:
Categorical |
[必需]指定指标阈值的数据类型。 |
metric |
[必需]要计算的分类数据偏移指标。 |
|
threshold |
阈值。 如果为 null,则会根据所选指标设置默认值。 |
CategoricalDataQualityMetric
值 | 说明 |
---|---|
DataTypeErrorRate |
计算数据类型错误的速率。 |
NullValueRate |
计算 null 值的速率。 |
OutOfBoundsRate |
计算速率值超出边界。 |
CategoricalDataQualityMetricThreshold
名称 | 类型 | 说明 |
---|---|---|
dataType |
string:
Categorical |
[必需]指定指标阈值的数据类型。 |
metric |
[必需]要计算的分类数据质量指标。 |
|
threshold |
阈值。 如果为 null,则会根据所选指标设置默认值。 |
CategoricalPredictionDriftMetric
值 | 说明 |
---|---|
JensenShannonDistance |
詹森香农距离 (JSD) 指标。 |
PearsonsChiSquaredTest |
皮尔逊奇平方测试指标。 |
PopulationStabilityIndex |
总体稳定性索引 (PSI) 指标。 |
CategoricalPredictionDriftMetricThreshold
名称 | 类型 | 说明 |
---|---|---|
dataType |
string:
Categorical |
[必需]指定指标阈值的数据类型。 |
metric |
[必需]要计算的分类预测偏移指标。 |
|
threshold |
阈值。 如果为 null,则会根据所选指标设置默认值。 |
Classification
AutoML 表垂直中的分类任务。
名称 | 类型 | 默认值 | 说明 |
---|---|---|---|
cvSplitColumnNames |
string[] |
用于 CVSplit 数据的列。 |
|
featurizationSettings |
AutoML 作业所需的特征化输入。 |
||
limitSettings |
AutoMLJob 的执行约束。 |
||
logVerbosity | Info |
作业的详细记录。 |
|
nCrossValidations | NCrossValidations: |
未提供验证数据集时要应用于训练数据集的交叉验证折叠数。 |
|
positiveLabel |
string |
二进制指标计算的正标签。 |
|
primaryMetric | AUCWeighted |
任务的主要指标。 |
|
targetColumnName |
string |
目标列名称:这是预测值列。 也称为分类任务的上下文中的标签列名称。 |
|
taskType | string: |
[必需]AutoMLJob 的任务类型。 |
|
testData |
测试数据输入。 |
||
testDataSize |
number (double) |
需要为验证目的预留的测试数据集的分数。 未提供验证数据集时应用的值(0.0、1.0)。 |
|
trainingData |
[必需]训练数据输入。 |
||
trainingSettings |
AutoML 作业训练阶段的输入。 |
||
validationData |
验证数据输入。 |
||
validationDataSize |
number (double) |
需要留出用于验证的定型数据集的分数。 未提供验证数据集时应用的值(0.0、1.0)。 |
|
weightColumnName |
string |
示例权重列的名称。 自动化 ML 支持加权列作为输入,导致数据中的行向上或向下加权。 |
ClassificationModels
AutoML 支持的所有分类模型的枚举。
值 | 说明 |
---|---|
BernoulliNaiveBayes |
多变量伯努利模型的 Naive Bayes 分类器。 |
DecisionTree |
决策树是一种用于分类和回归任务的非参数监督式学习方法。 目标是创建一个模型,通过学习从数据特征推断的简单决策规则来预测目标变量的值。 |
ExtremeRandomTrees |
极端树是一种组合机器学习算法,它结合了许多决策树的预测。 它与广泛使用的随机林算法相关。 |
GradientBoosting |
将周学习者转移到强学习者的技术称为“提升”。 梯度提升算法过程适用于此执行理论。 |
KNN |
K 最近的邻居 (KNN) 算法使用“特征相似性”来预测新数据点的值,这进一步意味着新数据点将基于它与训练集中的点匹配程度分配一个值。 |
LightGBM |
LightGBM 是一种梯度提升框架,它使用基于树的学习算法。 |
LinearSVM |
支持向量机(SVM)是一种监督机器学习模型,它使用分类算法解决两组分类问题。 为每个类别提供一组已标记训练数据的 SVM 模型集后,它们能够对新文本进行分类。 当输入数据是线性的时,线性 SVM 的性能最佳,即通过在绘制的图形上的分类值之间绘制直线,可以轻松对数据进行分类。 |
LogisticRegression |
逻辑回归是一种基本的分类技术。 它属于线性分类器组,有点类似于多项式和线性回归。 逻辑回归快速且相对不复杂,便于解释结果。 虽然它本质上是二元分类的方法,但它也可以应用于多类问题。 |
MultinomialNaiveBayes |
多项式 Naive Bayes 分类器适用于具有离散特征的分类(例如文本分类的字数)。 多项式分布通常需要整数特征计数。 但是,在实践中,小数计数(如 tf-idf)也可能起作用。 |
RandomForest |
随机林是一种监督式学习算法。 它构建的 “森林” 是决策树的集合,通常使用 “bagging” 方法进行训练。 装袋方法的一般思路是,学习模型的组合会增加整体结果。 |
SGD |
ZN:随机梯度下降是机器学习应用程序中常用的优化算法,用于查找与预测输出和实际输出之间的最佳拟合的模型参数。 |
SVM |
支持向量机(SVM)是一种监督机器学习模型,它使用分类算法解决两组分类问题。 为每个类别提供一组已标记训练数据的 SVM 模型集后,它们能够对新文本进行分类。 |
XGBoostClassifier |
XGBoost:极端梯度提升算法。 此算法用于结构化数据,其中目标列值可以划分为不同的类值。 |
ClassificationMultilabelPrimaryMetrics
分类多标签任务的主要指标。
值 | 说明 |
---|---|
AUCWeighted |
AUC 是曲线下的区域。 此指标表示每个类的分数的算术平均值,按每个类中的真实实例数加权。 |
Accuracy |
Accuracy 是与真实类标签完全匹配的预测比率。 |
AveragePrecisionScoreWeighted |
每个类的平均精度分数的算术平均值,按每个类中的真实实例数加权。 |
IOU |
通过联合交集。 预测的交集除以预测联合。 |
NormMacroRecall |
规范化宏召回率是对宏召回率进行规范化和平均化,因此,随机性能的评分为 0,完美性能的评分为 1。 |
PrecisionScoreWeighted |
每个类的精度算术平均值,按每个类中的真实实例数加权。 |
ClassificationPrimaryMetrics
分类任务的主要指标。
值 | 说明 |
---|---|
AUCWeighted |
AUC 是曲线下的区域。 此指标表示每个类的分数的算术平均值,按每个类中的真实实例数加权。 |
Accuracy |
Accuracy 是与真实类标签完全匹配的预测比率。 |
AveragePrecisionScoreWeighted |
每个类的平均精度分数的算术平均值,按每个类中的真实实例数加权。 |
NormMacroRecall |
规范化宏召回率是对宏召回率进行规范化和平均化,因此,随机性能的评分为 0,完美性能的评分为 1。 |
PrecisionScoreWeighted |
每个类的精度算术平均值,按每个类中的真实实例数加权。 |
ClassificationTrainingSettings
分类训练相关配置。
名称 | 类型 | 默认值 | 说明 |
---|---|---|---|
allowedTrainingAlgorithms |
分类任务的允许模型。 |
||
blockedTrainingAlgorithms |
分类任务的阻止模型。 |
||
enableDnnTraining |
boolean |
False |
启用 DNN 模型的建议。 |
enableModelExplainability |
boolean |
True |
标志以在最佳模型上启用可解释性。 |
enableOnnxCompatibleModels |
boolean |
False |
用于启用 onnx 兼容模型的标志。 |
enableStackEnsemble |
boolean |
True |
启用堆栈合奏运行。 |
enableVoteEnsemble |
boolean |
True |
启用投票合奏运行。 |
ensembleModelDownloadTimeout |
string (duration) |
PT5M |
在 VotingEnsemble 和 StackEnsemble 模型生成期间,将下载先前子运行中的多个拟合模型。 如果需要更多时间,请将此参数配置为大于 300 秒的值。 |
stackEnsembleSettings |
堆栈合奏的堆栈合奏设置。 |
CommandJob
命令作业定义。
名称 | 类型 | 默认值 | 说明 |
---|---|---|---|
codeId |
string |
代码资产的 ARM 资源 ID。 |
|
command |
string minLength: 1pattern: [a-zA-Z0-9_] |
[必需]在启动作业时执行的命令。 例如 “python train.py” |
|
componentId |
string |
组件资源的 ARM 资源 ID。 |
|
computeId |
string |
计算资源的 ARM 资源 ID。 |
|
description |
string |
资产说明文本。 |
|
displayName |
string |
作业的显示名称。 |
|
distribution | DistributionConfiguration: |
作业的分发配置。 如果已设置,则应为 Mpi、Tensorflow、PyTorch 或 null 之一。 |
|
environmentId |
string minLength: 1pattern: [a-zA-Z0-9_] |
[必需]作业的环境规范的 ARM 资源 ID。 |
|
environmentVariables |
object |
作业中包含的环境变量。 |
|
experimentName |
string |
Default |
作业所属的试验的名称。 如果未设置,作业将放置在“默认”试验中。 |
identity | IdentityConfiguration: |
标识配置。 如果已设置,则应为 AmlToken、ManagedIdentity、UserIdentity 或 null 之一。 如果为 null,则默认为 AmlToken。 |
|
inputs |
object |
作业中使用的输入数据绑定的映射。 |
|
isArchived |
boolean |
False |
资产是否已存档? |
jobType |
string:
Command |
[必需]指定作业的类型。 |
|
limits |
命令作业限制。 |
||
notificationSetting |
作业的通知设置 |
||
outputs |
object |
作业中使用的输出数据绑定的映射。 |
|
parameters |
object |
输入参数。 |
|
properties |
object |
资产属性字典。 |
|
queueSettings |
作业的队列设置 |
||
resources | {} |
作业的计算资源配置。 |
|
services |
<string,
Job |
JobEndpoints 列表。 对于本地作业,作业终结点的终结点值为 FileStreamObject。 |
|
status |
作业的状态。 |
||
tags |
object |
标记字典。 可以添加、删除和更新标记。 |
CommandJobLimits
Command Job limit 类。
名称 | 类型 | 说明 |
---|---|---|
jobLimitsType |
string:
Command |
[必需]JobLimit 类型。 |
timeout |
string (duration) |
ISO 8601 格式的最大运行持续时间,之后作业将被取消。 仅支持精度为秒的持续时间。 |
createdByType
创建资源的标识的类型。
值 | 说明 |
---|---|
Application | |
Key | |
ManagedIdentity | |
User |
CreateMonitorAction
名称 | 类型 | 说明 |
---|---|---|
actionType |
string:
Create |
[必需]指定计划的作类型 |
monitorDefinition |
[必需]定义监视器。 |
CronTrigger
名称 | 类型 | 默认值 | 说明 |
---|---|---|---|
endTime |
string |
以 ISO 8601 指定计划的结束时间,但不指定 UTC 偏移量。 请参阅 https://en.wikipedia.org/wiki/ISO_8601。 重新注释的格式将为“2022-06-01T00:00:01”(如果不存在),计划将无限期运行 |
|
expression |
string minLength: 1pattern: [a-zA-Z0-9_] |
[必需]指定计划的 cron 表达式。 表达式应遵循 NCronTab 格式。 |
|
startTime |
string |
以 ISO 8601 格式指定计划的开始时间,但没有 UTC 偏移量。 |
|
timeZone |
string |
UTC |
指定运行计划的时区。 TimeZone 应遵循 Windows 时区格式。 指: https://docs.microsoft.com/en-us/windows-hardware/manufacture/desktop/default-time-zones?view=windows-11 |
triggerType |
string:
Cron |
[必需] |
CustomForecastHorizon
所需最大预测范围(以时序频率单位为单位)。
名称 | 类型 | 说明 |
---|---|---|
mode |
string:
Custom |
[必需]设置预测地平线值选择模式。 |
value |
integer (int32) |
[必需]预测地平线值。 |
CustomMetricThreshold
名称 | 类型 | 说明 |
---|---|---|
metric |
string minLength: 1pattern: [a-zA-Z0-9_] |
[必需]要计算的用户定义指标。 |
threshold |
阈值。 如果为 null,则会根据所选指标设置默认值。 |
CustomModelJobInput
名称 | 类型 | 默认值 | 说明 |
---|---|---|---|
description |
string |
输入的说明。 |
|
jobInputType |
string:
custom_model |
[必需]指定作业的类型。 |
|
mode | ReadOnlyMount |
输入资产传送模式。 |
|
uri |
string minLength: 1pattern: [a-zA-Z0-9_] |
[必需]输入资产 URI。 |
CustomModelJobOutput
名称 | 类型 | 默认值 | 说明 |
---|---|---|---|
description |
string |
输出的说明。 |
|
jobOutputType |
string:
custom_model |
[必需]指定作业的类型。 |
|
mode | ReadWriteMount |
输出资产传送模式。 |
|
uri |
string |
输出资产 URI。 |
CustomMonitoringSignal
名称 | 类型 | 说明 |
---|---|---|
componentId |
string minLength: 1pattern: [a-zA-Z0-9_] |
[必需]对用于计算自定义指标的组件资产的引用。 |
inputAssets |
object |
监视要用作输入的资产。 键是组件输入端口名称,值为数据资产。 |
inputs |
object |
要用作输入的额外组件参数。 键是组件文本输入端口名称,值为参数值。 |
metricThresholds |
[必需]要计算的指标列表及其关联的阈值。 |
|
notificationTypes |
此信号的当前通知模式。 |
|
properties |
object |
属性字典。 可以添加属性,但不能删除或更改属性。 |
signalType |
string:
Custom |
[必需]指定要监视的信号类型。 |
CustomNCrossValidations
N 交叉验证由用户指定。
名称 | 类型 | 说明 |
---|---|---|
mode |
string:
Custom |
[必需]用于确定 N 交叉验证的模式。 |
value |
integer (int32) |
[必需]N 交叉验证值。 |
CustomSeasonality
名称 | 类型 | 说明 |
---|---|---|
mode |
string:
Custom |
[必需]季节性模式。 |
value |
integer (int32) |
[必需]季节性值。 |
CustomTargetLags
名称 | 类型 | 说明 |
---|---|---|
mode |
string:
Custom |
[必需]设置目标滞后模式 - 自动/自定义 |
values |
integer[] (int32) |
[必需]设置目标滞后值。 |
CustomTargetRollingWindowSize
名称 | 类型 | 说明 |
---|---|---|
mode |
string:
Custom |
[必需]TargetRollingWindowSiz 检测模式。 |
value |
integer (int32) |
[必需]TargetRollingWindowSize 值。 |
DataDriftMonitoringSignal
名称 | 类型 | 说明 |
---|---|---|
featureDataTypeOverride |
object |
一个字典,用于将特征名称映射到各自的数据类型。 |
featureImportanceSettings |
计算特征重要性的设置。 |
|
features | MonitoringFeatureFilterBase: |
特征筛选器,用于标识要计算偏移量的功能。 |
metricThresholds | DataDriftMetricThresholdBase[]: |
[必需]要计算的指标列表及其关联的阈值。 |
notificationTypes |
此信号的当前通知模式。 |
|
productionData | MonitoringInputDataBase: |
[必需]将计算偏移的数据。 |
properties |
object |
属性字典。 可以添加属性,但不能删除或更改属性。 |
referenceData | MonitoringInputDataBase: |
[必需]要计算偏移的数据。 |
signalType |
string:
Data |
[必需]指定要监视的信号类型。 |
DataQualityMonitoringSignal
名称 | 类型 | 说明 |
---|---|---|
featureDataTypeOverride |
object |
一个字典,用于将特征名称映射到各自的数据类型。 |
featureImportanceSettings |
计算特征重要性的设置。 |
|
features | MonitoringFeatureFilterBase: |
要计算偏移的特征。 |
metricThresholds | DataQualityMetricThresholdBase[]: |
[必需]要计算的指标列表及其关联的阈值。 |
notificationTypes |
此信号的当前通知模式。 |
|
productionData | MonitoringInputDataBase: |
[必需]将为其计算偏移的生产服务生成的数据。 |
properties |
object |
属性字典。 可以添加属性,但不能删除或更改属性。 |
referenceData | MonitoringInputDataBase: |
[必需]要计算偏移的数据。 |
signalType |
string:
Data |
[必需]指定要监视的信号类型。 |
DistributionType
用于确定作业分发类型的枚举。
值 | 说明 |
---|---|
Mpi | |
PyTorch | |
TensorFlow |
EarlyTerminationPolicyType
值 | 说明 |
---|---|
Bandit | |
MedianStopping | |
TruncationSelection |
EmailNotificationEnableType
用于确定电子邮件通知类型的枚举。
值 | 说明 |
---|---|
JobCancelled | |
JobCompleted | |
JobFailed |
EndpointScheduleAction
名称 | 类型 | 说明 |
---|---|---|
actionType |
string:
Invoke |
[必需]指定计划的作类型 |
endpointInvocationDefinition |
object |
[必需]定义计划作定义详细信息。 |
ErrorAdditionalInfo
资源管理错误附加信息。
名称 | 类型 | 说明 |
---|---|---|
info |
object |
其他信息。 |
type |
string |
其他信息类型。 |
ErrorDetail
错误详细信息。
名称 | 类型 | 说明 |
---|---|---|
additionalInfo |
错误附加信息。 |
|
code |
string |
错误代码。 |
details |
错误详细信息。 |
|
message |
string |
错误消息。 |
target |
string |
错误目标。 |
ErrorResponse
错误响应
名称 | 类型 | 说明 |
---|---|---|
error |
错误对象。 |
FeatureAttributionDriftMonitoringSignal
名称 | 类型 | 说明 |
---|---|---|
featureDataTypeOverride |
object |
一个字典,用于将特征名称映射到各自的数据类型。 |
featureImportanceSettings |
[必需]计算特征重要性的设置。 |
|
metricThreshold |
[必需]要计算的指标列表及其关联的阈值。 |
|
notificationTypes |
此信号的当前通知模式。 |
|
productionData | MonitoringInputDataBase[]: |
[必需]将计算偏移的数据。 |
properties |
object |
属性字典。 可以添加属性,但不能删除或更改属性。 |
referenceData | MonitoringInputDataBase: |
[必需]要计算偏移的数据。 |
signalType |
string:
Feature |
[必需]指定要监视的信号类型。 |
FeatureAttributionMetric
值 | 说明 |
---|---|
NormalizedDiscountedCumulativeGain |
规范化折扣累积增益指标。 |
FeatureAttributionMetricThreshold
名称 | 类型 | 说明 |
---|---|---|
metric |
[必需]要计算的功能归因指标。 |
|
threshold |
阈值。 如果为 null,则会根据所选指标设置默认值。 |
FeatureImportanceMode
计算特征重要性的作模式。
值 | 说明 |
---|---|
Disabled |
禁用信号中的计算特征重要性。 |
Enabled |
启用信号中的计算特征重要性。 |
FeatureImportanceSettings
名称 | 类型 | 默认值 | 说明 |
---|---|---|---|
mode | Disabled |
计算特征重要性的作模式。 |
|
targetColumn |
string |
输入数据资产中目标列的名称。 |
FeatureLags
用于生成数值特征滞后的标志。
值 | 说明 |
---|---|
Auto |
系统自动生成功能滞后。 |
None |
未生成任何功能延迟。 |
FeatureSubset
名称 | 类型 | 说明 |
---|---|---|
features |
string[] |
[必需]要包含的功能列表。 |
filterType | string: |
[必需]指定要在选择要计算指标的功能时利用的功能筛选器。 |
FeaturizationMode
特征化模式 - 确定数据特征化模式。
值 | 说明 |
---|---|
Auto |
自动模式,系统无需任何自定义特征化输入即可执行特征化。 |
Custom |
自定义特征化。 |
Off |
特征化关闭。 “预测”任务不能使用此值。 |
FixedInputData
修复了输入数据定义。
名称 | 类型 | 说明 |
---|---|---|
columns |
object |
将列名映射到特殊用途。 |
dataContext |
string |
数据源的上下文元数据。 |
inputDataType |
string:
Fixed |
[必需]指定要监视的信号类型。 |
jobInputType |
[必需]指定作业的类型。 |
|
uri |
string minLength: 1pattern: [a-zA-Z0-9_] |
[必需]输入资产 URI。 |
ForecastHorizonMode
用于确定预测地平线选择模式的枚举。
值 | 说明 |
---|---|
Auto |
要自动确定的预测范围。 |
Custom |
使用自定义预测范围。 |
Forecasting
AutoML 表垂直中的预测任务。
名称 | 类型 | 默认值 | 说明 |
---|---|---|---|
cvSplitColumnNames |
string[] |
用于 CVSplit 数据的列。 |
|
featurizationSettings |
AutoML 作业所需的特征化输入。 |
||
forecastingSettings |
预测任务特定的输入。 |
||
limitSettings |
AutoMLJob 的执行约束。 |
||
logVerbosity | Info |
作业的详细记录。 |
|
nCrossValidations | NCrossValidations: |
未提供验证数据集时要应用于训练数据集的交叉验证折叠数。 |
|
primaryMetric | NormalizedRootMeanSquaredError |
预测任务的主要指标。 |
|
targetColumnName |
string |
目标列名称:这是预测值列。 也称为分类任务的上下文中的标签列名称。 |
|
taskType | string: |
[必需]AutoMLJob 的任务类型。 |
|
testData |
测试数据输入。 |
||
testDataSize |
number (double) |
需要为验证目的预留的测试数据集的分数。 未提供验证数据集时应用的值(0.0、1.0)。 |
|
trainingData |
[必需]训练数据输入。 |
||
trainingSettings |
AutoML 作业训练阶段的输入。 |
||
validationData |
验证数据输入。 |
||
validationDataSize |
number (double) |
需要留出用于验证的定型数据集的分数。 未提供验证数据集时应用的值(0.0、1.0)。 |
|
weightColumnName |
string |
示例权重列的名称。 自动化 ML 支持加权列作为输入,导致数据中的行向上或向下加权。 |
ForecastingModels
AutoML 支持的所有预测模型的枚举。
值 | 说明 |
---|---|
Arimax |
使用解释变量(ARIMAX)模型的自动回归集成移动平均值可被视为具有一个或多个自动回归(AR)术语和/或一个或多个移动平均值(MA)字词的多个回归模型。 此方法适用于在数据是固定/非固定数据时进行预测,并且与任何类型的数据模式(即级别/趋势/季节性/周期性)多变量一起使用。 |
AutoArima |
自动自动回归集成移动平均值(ARIMA)模型使用时序数据和统计分析来解释数据并做出未来的预测。 此模型旨在通过对其过去的值使用时序数据来解释数据,并使用线性回归进行预测。 |
Average |
平均预测模型通过转发训练数据中每个时序的目标值的平均值来进行预测。 |
DecisionTree |
决策树是一种用于分类和回归任务的非参数监督式学习方法。 目标是创建一个模型,通过学习从数据特征推断的简单决策规则来预测目标变量的值。 |
ElasticNet |
弹性网是一种常用的正则化线性回归,它结合了两种常用点数,特别是 L1 和 L2 惩罚函数。 |
ExponentialSmoothing |
指数平滑是单变量数据的时序预测方法,可以扩展为具有系统趋势或季节性组件的数据提供支持。 |
ExtremeRandomTrees |
极端树是一种组合机器学习算法,它结合了许多决策树的预测。 它与广泛使用的随机林算法相关。 |
GradientBoosting |
将周学习者转移到强学习者的技术称为“提升”。 梯度提升算法过程适用于此执行理论。 |
KNN |
K 最近的邻居 (KNN) 算法使用“特征相似性”来预测新数据点的值,这进一步意味着新数据点将基于它与训练集中的点匹配程度分配一个值。 |
LassoLars |
套索模型适合与最小角度回归 a.k.a. Lars。 它是使用 L1 训练的线性模型,之前用作正则器。 |
LightGBM |
LightGBM 是一种梯度提升框架,它使用基于树的学习算法。 |
Naive |
Naive 预测模型通过针对训练数据中每个时序的最新目标值进行预测。 |
Prophet |
先知是基于累加模型预测时序数据的过程,其中非线性趋势适合每年、每周和每日季节性,以及假日效果。 它最适合具有强烈的季节性影响和几个季节的历史数据的时序。 先知对缺少数据并改变趋势非常可靠,通常处理离群值。 |
RandomForest |
随机林是一种监督式学习算法。 它构建的 “森林” 是决策树的集合,通常使用 “bagging” 方法进行训练。 装袋方法的一般思路是,学习模型的组合会增加整体结果。 |
SGD |
ZN:随机梯度下降是机器学习应用程序中常用的优化算法,用于查找与预测输出和实际输出之间的最佳拟合的模型参数。 这是一种无所事事但强大的技术。 |
SeasonalAverage |
季节性平均预测模型通过转发训练数据中每个时序的最新季度数据的平均值来进行预测。 |
SeasonalNaive |
季节性 Naive 预测模型通过针对训练数据中每个时序的最新目标值季节进行预测。 |
TCNForecaster |
TCNForecaster:临时卷积网络预测器。 TODO:询问预测团队简要简介。 |
XGBoostRegressor |
XGBoostRegressor:极端梯度提升回归器是一种使用基础学习器合奏的监督机器学习模型。 |
ForecastingPrimaryMetrics
预测任务的主要指标。
值 | 说明 |
---|---|
NormalizedMeanAbsoluteError |
规范化平均绝对误差(NMAE)是一个验证指标,用于比较具有不同比例的(时序)平均绝对误差(MAE)。 |
NormalizedRootMeanSquaredError |
RMSE 的规范化根均方误差(NRMSE)有助于在不同比例的模型之间进行比较。 |
R2Score |
R2 分数是基于预测的机器学习模型的性能评估度量值之一。 |
SpearmanCorrelation |
Spearman 的相关性排名系数是排名相关性的非参数度量值。 |
ForecastingSettings
预测特定参数。
名称 | 类型 | 默认值 | 说明 |
---|---|---|---|
countryOrRegionForHolidays |
string |
用于预测任务的假日国家或地区。 这些代码应为 ISO 3166 双字母国家/地区代码,例如“US”或“GB”。 |
|
cvStepSize |
integer (int32) |
一个 CV 折叠的起始时间与下一个折叠之间的句点数。 例如,如果 |
|
featureLags | None |
使用“auto”或 null 为数值特征生成滞后的标志。 |
|
forecastHorizon | ForecastHorizon: | {"Mode": "Custom", "Value": 1} |
所需最大预测范围(以时序频率单位为单位)。 |
frequency |
string |
预测时,此参数表示需要预测的时间段,例如每日、每周、每年等。默认情况下,预测频率为数据集频率。 |
|
seasonality | Seasonality: | {"Mode": "Auto"} |
将时序季节性设置为序列频率的整数倍数。 如果季节性设置为“auto”,则会推断它。 |
shortSeriesHandlingConfig | Auto |
定义 AutoML 如何处理短时序的参数。 |
|
targetAggregateFunction | None |
用于聚合符合用户指定频率的时序目标列的函数。 如果设置了 TargetAggregateFunction,即不是“None”,但未设置 freq 参数,则会引发错误。 可能的目标聚合函数包括:“sum”、“max”、“min”和“mean”。 |
|
targetLags | TargetLags: |
要从目标列滞后的过去时间段数。 |
|
targetRollingWindowSize | TargetRollingWindowSize: |
用于创建目标列的滚动窗口平均值的过去时间段数。 |
|
timeColumnName |
string |
时间列的名称。 当预测在用于生成时序并推断其频率的输入数据中指定日期/时间列时,此参数是必需的。 |
|
timeSeriesIdColumnNames |
string[] |
用于对时间序列进行分组的列的名称。 它可用于创建多个序列。 如果未定义粒度,则假定数据集为一个时序。 此参数用于任务类型预测。 |
|
useStl | None |
配置时序目标列的 STL 分解。 |
ForecastingTrainingSettings
预测与训练相关的配置。
名称 | 类型 | 默认值 | 说明 |
---|---|---|---|
allowedTrainingAlgorithms |
允许用于预测任务的模型。 |
||
blockedTrainingAlgorithms |
用于预测任务的阻止模型。 |
||
enableDnnTraining |
boolean |
False |
启用 DNN 模型的建议。 |
enableModelExplainability |
boolean |
True |
标志以在最佳模型上启用可解释性。 |
enableOnnxCompatibleModels |
boolean |
False |
用于启用 onnx 兼容模型的标志。 |
enableStackEnsemble |
boolean |
True |
启用堆栈合奏运行。 |
enableVoteEnsemble |
boolean |
True |
启用投票合奏运行。 |
ensembleModelDownloadTimeout |
string (duration) |
PT5M |
在 VotingEnsemble 和 StackEnsemble 模型生成期间,将下载先前子运行中的多个拟合模型。 如果需要更多时间,请将此参数配置为大于 300 秒的值。 |
stackEnsembleSettings |
堆栈合奏的堆栈合奏设置。 |
Goal
定义超参数优化支持的指标目标
值 | 说明 |
---|---|
Maximize | |
Minimize |
GridSamplingAlgorithm
定义一个采样算法,该算法会详尽地生成空间中的每个值组合
名称 | 类型 | 说明 |
---|---|---|
samplingAlgorithmType |
string:
Grid |
[必需]用于生成超参数值的算法以及配置属性 |
IdentityConfigurationType
用于确定标识框架的枚举。
值 | 说明 |
---|---|
AMLToken | |
Managed | |
UserIdentity |
ImageClassification
图像分类。 当图像仅使用一组类中的单个标签进行分类(例如,每个图像被分类为“猫”或“狗”或“鸭子”的图像)时,将使用多类图像分类。
名称 | 类型 | 默认值 | 说明 |
---|---|---|---|
limitSettings |
[必需]限制 AutoML 作业的设置。 |
||
logVerbosity | Info |
作业的详细记录。 |
|
modelSettings |
用于训练模型的设置。 |
||
primaryMetric | Accuracy |
要针对此任务进行优化的主要指标。 |
|
searchSpace |
用于采样模型及其超参数的不同组合的搜索空间。 |
||
sweepSettings |
模型扫描和超参数扫描相关设置。 |
||
targetColumnName |
string |
目标列名称:这是预测值列。 也称为分类任务的上下文中的标签列名称。 |
|
taskType | string: |
[必需]AutoMLJob 的任务类型。 |
|
trainingData |
[必需]训练数据输入。 |
||
validationData |
验证数据输入。 |
||
validationDataSize |
number (double) |
需要留出用于验证的定型数据集的分数。 未提供验证数据集时应用的值(0.0、1.0)。 |
ImageClassificationMultilabel
图像分类多标签。 当图像可能具有一组标签中的一个或多个标签时,将使用多标签图像分类,例如图像可以同时标有“cat”和“dog”。
名称 | 类型 | 默认值 | 说明 |
---|---|---|---|
limitSettings |
[必需]限制 AutoML 作业的设置。 |
||
logVerbosity | Info |
作业的详细记录。 |
|
modelSettings |
用于训练模型的设置。 |
||
primaryMetric | IOU |
要针对此任务进行优化的主要指标。 |
|
searchSpace |
用于采样模型及其超参数的不同组合的搜索空间。 |
||
sweepSettings |
模型扫描和超参数扫描相关设置。 |
||
targetColumnName |
string |
目标列名称:这是预测值列。 也称为分类任务的上下文中的标签列名称。 |
|
taskType | string: |
[必需]AutoMLJob 的任务类型。 |
|
trainingData |
[必需]训练数据输入。 |
||
validationData |
验证数据输入。 |
||
validationDataSize |
number (double) |
需要留出用于验证的定型数据集的分数。 未提供验证数据集时应用的值(0.0、1.0)。 |
ImageInstanceSegmentation
图像实例分段。 实例分段用于标识像素级别图像中的对象,在图像中的每个对象周围绘制多边形。
名称 | 类型 | 默认值 | 说明 |
---|---|---|---|
limitSettings |
[必需]限制 AutoML 作业的设置。 |
||
logVerbosity | Info |
作业的详细记录。 |
|
modelSettings |
用于训练模型的设置。 |
||
primaryMetric | MeanAveragePrecision |
要针对此任务进行优化的主要指标。 |
|
searchSpace |
用于采样模型及其超参数的不同组合的搜索空间。 |
||
sweepSettings |
模型扫描和超参数扫描相关设置。 |
||
targetColumnName |
string |
目标列名称:这是预测值列。 也称为分类任务的上下文中的标签列名称。 |
|
taskType | string: |
[必需]AutoMLJob 的任务类型。 |
|
trainingData |
[必需]训练数据输入。 |
||
validationData |
验证数据输入。 |
||
validationDataSize |
number (double) |
需要留出用于验证的定型数据集的分数。 未提供验证数据集时应用的值(0.0、1.0)。 |
ImageLimitSettings
限制 AutoML 作业的设置。
名称 | 类型 | 默认值 | 说明 |
---|---|---|---|
maxConcurrentTrials |
integer (int32) |
1 |
最大并发 AutoML 迭代数。 |
maxTrials |
integer (int32) |
1 |
AutoML 迭代的最大数目。 |
timeout |
string (duration) |
P7D |
AutoML 作业超时。 |
ImageModelDistributionSettingsClassification
用于扫描模型设置值的分布表达式。 一些示例包括:
ModelName = "choice('seresnext', 'resnest50')";
LearningRate = "uniform(0.001, 0.01)";
LayersToFreeze = "choice(0, 2)";
```</example>
For more details on how to compose distribution expressions please check the documentation:
https://docs.microsoft.com/en-us/azure/machine-learning/how-to-tune-hyperparameters
For more information on the available settings please visit the official documentation:
https://docs.microsoft.com/en-us/azure/machine-learning/how-to-auto-train-image-models.
名称 | 类型 | 说明 |
---|---|---|
amsGradient |
string |
优化器为“adam”或“adamw”时启用 AMSGrad。 |
augmentations |
string |
使用扩充的设置。 |
beta1 |
string |
优化器为“adam”或“adamw”时“beta1”的值。 必须是 [0, 1] 范围内的浮点。 |
beta2 |
string |
优化器为“adam”或“adamw”时“beta2”的值。 必须是 [0, 1] 范围内的浮点。 |
distributed |
string |
是否使用分布式程序训练。 |
earlyStopping |
string |
在训练期间启用提前停止逻辑。 |
earlyStoppingDelay |
string |
跟踪主要指标改进之前要等待的最小纪元或验证评估数,以便提前停止。 必须是正整数。 |
earlyStoppingPatience |
string |
在停止运行之前,没有主要指标改进的最小纪元或验证评估数。 必须是正整数。 |
enableOnnxNormalization |
string |
导出 ONNX 模型时启用规范化。 |
evaluationFrequency |
string |
评估验证数据集以获取指标分数的频率。 必须是正整数。 |
gradientAccumulationStep |
string |
渐变累积意味着在不更新模型权重的情况下运行配置的“GradAccumulationStep”步骤,同时累积这些步骤的渐变,然后使用累积的渐变来计算权重更新。 必须是正整数。 |
layersToFreeze |
string |
要冻结模型的层数。 必须是正整数。 例如,将 2 作为“seresnext”的值传递意味着冻结 layer0 和 layer1。 有关支持模型的完整列表以及层冻结的详细信息,请参阅:https://docs.microsoft.com/en-us/azure/machine-learning/how-to-auto-train-image-models。 |
learningRate |
string |
初始学习速率。 必须是 [0, 1] 范围内的浮点。 |
learningRateScheduler |
string |
学习速率计划程序的类型。 必须是“warmup_cosine”或“step”。 |
modelName |
string |
要用于训练的模型的名称。 有关可用模型的详细信息,请访问官方文档:https://docs.microsoft.com/en-us/azure/machine-learning/how-to-auto-train-image-models。 |
momentum |
string |
优化器为“zn”时的动量值。 必须是 [0, 1] 范围内的浮点。 |
nesterov |
string |
优化器为“zn”时启用 nesterov。 |
numberOfEpochs |
string |
训练纪元数。 必须是正整数。 |
numberOfWorkers |
string |
数据加载程序辅助角色数。 必须是非负整数。 |
optimizer |
string |
优化器的类型。 必须是“zn”、“adam”或“adamw”。 |
randomSeed |
string |
使用确定性训练时要使用的随机种子。 |
stepLRGamma |
string |
当学习速率计划程序为“step”时,gamma 的值。 必须是 [0, 1] 范围内的浮点。 |
stepLRStepSize |
string |
学习速率计划程序为“step”时步骤大小的值。 必须是正整数。 |
trainingBatchSize |
string |
训练批大小。 必须是正整数。 |
trainingCropSize |
string |
训练数据集的神经网络输入的图像裁剪大小。 必须是正整数。 |
validationBatchSize |
string |
验证批大小。 必须是正整数。 |
validationCropSize |
string |
输入到神经网络的验证数据集的图像裁剪大小。 必须是正整数。 |
validationResizeSize |
string |
在裁剪验证数据集之前要调整其大小的图像大小。 必须是正整数。 |
warmupCosineLRCycles |
string |
学习速率计划程序为“warmup_cosine”时的余弦周期值。 必须是 [0, 1] 范围内的浮点。 |
warmupCosineLRWarmupEpochs |
string |
当学习速率计划程序为“warmup_cosine”时,预热时期的值。 必须是正整数。 |
weightDecay |
string |
优化器为“zn”、“adam”或“adamw”时的权重衰减值。 必须是范围[0, 1] 中的浮点。 |
weightedLoss |
string |
减肥。 对于无加权损失,接受的值为 0。 1 用于与 sqrt 一起减肥。(class_weights)。 2 用于减肥与class_weights。 必须为 0 或 1 或 2。 |
ImageModelDistributionSettingsObjectDetection
用于扫描模型设置值的分布表达式。 一些示例包括:
ModelName = "choice('seresnext', 'resnest50')";
LearningRate = "uniform(0.001, 0.01)";
LayersToFreeze = "choice(0, 2)";
```</example>
For more details on how to compose distribution expressions please check the documentation:
https://docs.microsoft.com/en-us/azure/machine-learning/how-to-tune-hyperparameters
For more information on the available settings please visit the official documentation:
https://docs.microsoft.com/en-us/azure/machine-learning/how-to-auto-train-image-models.
名称 | 类型 | 说明 |
---|---|---|
amsGradient |
string |
优化器为“adam”或“adamw”时启用 AMSGrad。 |
augmentations |
string |
使用扩充的设置。 |
beta1 |
string |
优化器为“adam”或“adamw”时“beta1”的值。 必须是 [0, 1] 范围内的浮点。 |
beta2 |
string |
优化器为“adam”或“adamw”时“beta2”的值。 必须是 [0, 1] 范围内的浮点。 |
boxDetectionsPerImage |
string |
每个图像的最大检测数,适用于所有类。 必须是正整数。 注意:“yolov5”算法不支持此设置。 |
boxScoreThreshold |
string |
在推理期间,仅返回分类分数大于 BoxScoreThreshold 的建议。 必须是范围[0, 1] 中的浮点。 |
distributed |
string |
是否使用分布式程序训练。 |
earlyStopping |
string |
在训练期间启用提前停止逻辑。 |
earlyStoppingDelay |
string |
跟踪主要指标改进之前要等待的最小纪元或验证评估数,以便提前停止。 必须是正整数。 |
earlyStoppingPatience |
string |
在停止运行之前,没有主要指标改进的最小纪元或验证评估数。 必须是正整数。 |
enableOnnxNormalization |
string |
导出 ONNX 模型时启用规范化。 |
evaluationFrequency |
string |
评估验证数据集以获取指标分数的频率。 必须是正整数。 |
gradientAccumulationStep |
string |
渐变累积意味着在不更新模型权重的情况下运行配置的“GradAccumulationStep”步骤,同时累积这些步骤的渐变,然后使用累积的渐变来计算权重更新。 必须是正整数。 |
imageSize |
string |
用于训练和验证的图像大小。 必须是正整数。 注意:如果大小太大,训练运行可能会进入 CUDA OOM。 注意:仅“yolov5”算法支持此设置。 |
layersToFreeze |
string |
要冻结模型的层数。 必须是正整数。 例如,将 2 作为“seresnext”的值传递意味着冻结 layer0 和 layer1。 有关支持模型的完整列表以及层冻结的详细信息,请参阅:https://docs.microsoft.com/en-us/azure/machine-learning/how-to-auto-train-image-models。 |
learningRate |
string |
初始学习速率。 必须是 [0, 1] 范围内的浮点。 |
learningRateScheduler |
string |
学习速率计划程序的类型。 必须是“warmup_cosine”或“step”。 |
maxSize |
string |
将图像馈送至主干之前要重新缩放的最大大小。 必须是正整数。 注意:如果大小太大,训练运行可能会进入 CUDA OOM。 注意:“yolov5”算法不支持此设置。 |
minSize |
string |
将图像馈送到主干之前要重新缩放的最小大小。 必须是正整数。 注意:如果大小太大,训练运行可能会进入 CUDA OOM。 注意:“yolov5”算法不支持此设置。 |
modelName |
string |
要用于训练的模型的名称。 有关可用模型的详细信息,请访问官方文档:https://docs.microsoft.com/en-us/azure/machine-learning/how-to-auto-train-image-models。 |
modelSize |
string |
模型大小。 必须是“small”、“medium”、“large”或“xlarge”。 注意:如果模型大小太大,训练运行可能会进入 CUDA OOM。 注意:仅“yolov5”算法支持此设置。 |
momentum |
string |
优化器为“zn”时的动量值。 必须是 [0, 1] 范围内的浮点。 |
multiScale |
string |
按 +/- 50%的不同图像大小启用多缩放图像。 注意:如果没有足够的 GPU 内存,训练运行可能会进入 CUDA OOM。 注意:仅“yolov5”算法支持此设置。 |
nesterov |
string |
优化器为“zn”时启用 nesterov。 |
nmsIouThreshold |
string |
在 NMS 后期处理的推理期间使用的 IOU 阈值。 必须在 [0, 1] 范围内浮动。 |
numberOfEpochs |
string |
训练纪元数。 必须是正整数。 |
numberOfWorkers |
string |
数据加载程序辅助角色数。 必须是非负整数。 |
optimizer |
string |
优化器的类型。 必须是“zn”、“adam”或“adamw”。 |
randomSeed |
string |
使用确定性训练时要使用的随机种子。 |
stepLRGamma |
string |
当学习速率计划程序为“step”时,gamma 的值。 必须是 [0, 1] 范围内的浮点。 |
stepLRStepSize |
string |
学习速率计划程序为“step”时步骤大小的值。 必须是正整数。 |
tileGridSize |
string |
用于平铺每个图像的网格大小。 注意:TileGridSize 不得为 None 才能启用小型对象检测逻辑。 一个字符串,其中包含两个整数(采用格式)。 注意:“yolov5”算法不支持此设置。 |
tileOverlapRatio |
string |
每个维度中相邻磁贴之间的重叠比率。 必须在 [0, 1] 范围内浮动。 注意:“yolov5”算法不支持此设置。 |
tilePredictionsNmsThreshold |
string |
用于执行 NMS 的 IOU 阈值,同时合并来自磁贴和图像的预测。 用于验证/推理。 必须在 [0, 1] 范围内浮动。 注意:“yolov5”算法不支持此设置。 NMS:非最大抑制 |
trainingBatchSize |
string |
训练批大小。 必须是正整数。 |
validationBatchSize |
string |
验证批大小。 必须是正整数。 |
validationIouThreshold |
string |
计算验证指标时要使用的 IOU 阈值。 必须在 [0, 1] 范围内浮动。 |
validationMetricType |
string |
用于验证指标的指标计算方法。 必须是“none”、“coco”、“voc”或“coco_voc”。 |
warmupCosineLRCycles |
string |
学习速率计划程序为“warmup_cosine”时的余弦周期值。 必须是 [0, 1] 范围内的浮点。 |
warmupCosineLRWarmupEpochs |
string |
当学习速率计划程序为“warmup_cosine”时,预热时期的值。 必须是正整数。 |
weightDecay |
string |
优化器为“zn”、“adam”或“adamw”时的权重衰减值。 必须是范围[0, 1] 中的浮点。 |
ImageModelSettingsClassification
用于训练模型的设置。 有关可用设置的详细信息,请访问官方文档:https://docs.microsoft.com/en-us/azure/machine-learning/how-to-auto-train-image-models。
名称 | 类型 | 默认值 | 说明 |
---|---|---|---|
advancedSettings |
string |
高级方案的设置。 |
|
amsGradient |
boolean |
优化器为“adam”或“adamw”时启用 AMSGrad。 |
|
augmentations |
string |
使用扩充的设置。 |
|
beta1 |
number (float) |
优化器为“adam”或“adamw”时“beta1”的值。 必须是 [0, 1] 范围内的浮点。 |
|
beta2 |
number (float) |
优化器为“adam”或“adamw”时“beta2”的值。 必须是 [0, 1] 范围内的浮点。 |
|
checkpointFrequency |
integer (int32) |
存储模型检查点的频率。 必须是正整数。 |
|
checkpointModel |
用于增量训练的预先训练检查点模型。 |
||
checkpointRunId |
string |
上一次运行的 ID,该运行具有用于增量训练的预先训练检查点。 |
|
distributed |
boolean |
是否使用分布式训练。 |
|
earlyStopping |
boolean |
在训练期间启用提前停止逻辑。 |
|
earlyStoppingDelay |
integer (int32) |
跟踪主要指标改进之前要等待的最小纪元或验证评估数,以便提前停止。 必须是正整数。 |
|
earlyStoppingPatience |
integer (int32) |
在停止运行之前,没有主要指标改进的最小纪元或验证评估数。 必须是正整数。 |
|
enableOnnxNormalization |
boolean |
导出 ONNX 模型时启用规范化。 |
|
evaluationFrequency |
integer (int32) |
评估验证数据集以获取指标分数的频率。 必须是正整数。 |
|
gradientAccumulationStep |
integer (int32) |
渐变累积意味着在不更新模型权重的情况下运行配置的“GradAccumulationStep”步骤,同时累积这些步骤的渐变,然后使用累积的渐变来计算权重更新。 必须是正整数。 |
|
layersToFreeze |
integer (int32) |
要冻结模型的层数。 必须是正整数。 例如,将 2 作为“seresnext”的值传递意味着冻结 layer0 和 layer1。 有关支持模型的完整列表以及层冻结的详细信息,请参阅:https://docs.microsoft.com/en-us/azure/machine-learning/how-to-auto-train-image-models。 |
|
learningRate |
number (float) |
初始学习速率。 必须是 [0, 1] 范围内的浮点。 |
|
learningRateScheduler | None |
学习速率计划程序的类型。 必须是“warmup_cosine”或“step”。 |
|
modelName |
string |
要用于训练的模型的名称。 有关可用模型的详细信息,请访问官方文档:https://docs.microsoft.com/en-us/azure/machine-learning/how-to-auto-train-image-models。 |
|
momentum |
number (float) |
优化器为“zn”时的动量值。 必须是 [0, 1] 范围内的浮点。 |
|
nesterov |
boolean |
优化器为“zn”时启用 nesterov。 |
|
numberOfEpochs |
integer (int32) |
训练纪元数。 必须是正整数。 |
|
numberOfWorkers |
integer (int32) |
数据加载程序辅助角色数。 必须是非负整数。 |
|
optimizer | None |
优化器的类型。 |
|
randomSeed |
integer (int32) |
使用确定性训练时要使用的随机种子。 |
|
stepLRGamma |
number (float) |
当学习速率计划程序为“step”时,gamma 的值。 必须是 [0, 1] 范围内的浮点。 |
|
stepLRStepSize |
integer (int32) |
学习速率计划程序为“step”时步骤大小的值。 必须是正整数。 |
|
trainingBatchSize |
integer (int32) |
训练批大小。 必须是正整数。 |
|
trainingCropSize |
integer (int32) |
训练数据集的神经网络输入的图像裁剪大小。 必须是正整数。 |
|
validationBatchSize |
integer (int32) |
验证批大小。 必须是正整数。 |
|
validationCropSize |
integer (int32) |
输入到神经网络的验证数据集的图像裁剪大小。 必须是正整数。 |
|
validationResizeSize |
integer (int32) |
在裁剪验证数据集之前要调整其大小的图像大小。 必须是正整数。 |
|
warmupCosineLRCycles |
number (float) |
学习速率计划程序为“warmup_cosine”时的余弦周期值。 必须是 [0, 1] 范围内的浮点。 |
|
warmupCosineLRWarmupEpochs |
integer (int32) |
当学习速率计划程序为“warmup_cosine”时,预热时期的值。 必须是正整数。 |
|
weightDecay |
number (float) |
优化器为“zn”、“adam”或“adamw”时的权重衰减值。 必须是范围[0, 1] 中的浮点。 |
|
weightedLoss |
integer (int32) |
减肥。 对于无加权损失,接受的值为 0。 1 用于与 sqrt 一起减肥。(class_weights)。 2 用于减肥与class_weights。 必须为 0 或 1 或 2。 |
ImageModelSettingsObjectDetection
用于训练模型的设置。 有关可用设置的详细信息,请访问官方文档:https://docs.microsoft.com/en-us/azure/machine-learning/how-to-auto-train-image-models。
名称 | 类型 | 默认值 | 说明 |
---|---|---|---|
advancedSettings |
string |
高级方案的设置。 |
|
amsGradient |
boolean |
优化器为“adam”或“adamw”时启用 AMSGrad。 |
|
augmentations |
string |
使用扩充的设置。 |
|
beta1 |
number (float) |
优化器为“adam”或“adamw”时“beta1”的值。 必须是 [0, 1] 范围内的浮点。 |
|
beta2 |
number (float) |
优化器为“adam”或“adamw”时“beta2”的值。 必须是 [0, 1] 范围内的浮点。 |
|
boxDetectionsPerImage |
integer (int32) |
每个图像的最大检测数,适用于所有类。 必须是正整数。 注意:“yolov5”算法不支持此设置。 |
|
boxScoreThreshold |
number (float) |
在推理期间,仅返回分类分数大于 BoxScoreThreshold 的建议。 必须是范围[0, 1] 中的浮点。 |
|
checkpointFrequency |
integer (int32) |
存储模型检查点的频率。 必须是正整数。 |
|
checkpointModel |
用于增量训练的预先训练检查点模型。 |
||
checkpointRunId |
string |
上一次运行的 ID,该运行具有用于增量训练的预先训练检查点。 |
|
distributed |
boolean |
是否使用分布式训练。 |
|
earlyStopping |
boolean |
在训练期间启用提前停止逻辑。 |
|
earlyStoppingDelay |
integer (int32) |
跟踪主要指标改进之前要等待的最小纪元或验证评估数,以便提前停止。 必须是正整数。 |
|
earlyStoppingPatience |
integer (int32) |
在停止运行之前,没有主要指标改进的最小纪元或验证评估数。 必须是正整数。 |
|
enableOnnxNormalization |
boolean |
导出 ONNX 模型时启用规范化。 |
|
evaluationFrequency |
integer (int32) |
评估验证数据集以获取指标分数的频率。 必须是正整数。 |
|
gradientAccumulationStep |
integer (int32) |
渐变累积意味着在不更新模型权重的情况下运行配置的“GradAccumulationStep”步骤,同时累积这些步骤的渐变,然后使用累积的渐变来计算权重更新。 必须是正整数。 |
|
imageSize |
integer (int32) |
用于训练和验证的图像大小。 必须是正整数。 注意:如果大小太大,训练运行可能会进入 CUDA OOM。 注意:仅“yolov5”算法支持此设置。 |
|
layersToFreeze |
integer (int32) |
要冻结模型的层数。 必须是正整数。 例如,将 2 作为“seresnext”的值传递意味着冻结 layer0 和 layer1。 有关支持模型的完整列表以及层冻结的详细信息,请参阅:https://docs.microsoft.com/en-us/azure/machine-learning/how-to-auto-train-image-models。 |
|
learningRate |
number (float) |
初始学习速率。 必须是 [0, 1] 范围内的浮点。 |
|
learningRateScheduler | None |
学习速率计划程序的类型。 必须是“warmup_cosine”或“step”。 |
|
maxSize |
integer (int32) |
将图像馈送至主干之前要重新缩放的最大大小。 必须是正整数。 注意:如果大小太大,训练运行可能会进入 CUDA OOM。 注意:“yolov5”算法不支持此设置。 |
|
minSize |
integer (int32) |
将图像馈送到主干之前要重新缩放的最小大小。 必须是正整数。 注意:如果大小太大,训练运行可能会进入 CUDA OOM。 注意:“yolov5”算法不支持此设置。 |
|
modelName |
string |
要用于训练的模型的名称。 有关可用模型的详细信息,请访问官方文档:https://docs.microsoft.com/en-us/azure/machine-learning/how-to-auto-train-image-models。 |
|
modelSize | None |
模型大小。 必须是“small”、“medium”、“large”或“xlarge”。 注意:如果模型大小太大,训练运行可能会进入 CUDA OOM。 注意:仅“yolov5”算法支持此设置。 |
|
momentum |
number (float) |
优化器为“zn”时的动量值。 必须是 [0, 1] 范围内的浮点。 |
|
multiScale |
boolean |
按 +/- 50%的不同图像大小启用多缩放图像。 注意:如果没有足够的 GPU 内存,训练运行可能会进入 CUDA OOM。 注意:仅“yolov5”算法支持此设置。 |
|
nesterov |
boolean |
优化器为“zn”时启用 nesterov。 |
|
nmsIouThreshold |
number (float) |
在 NMS 后期处理的推理期间使用的 IOU 阈值。 必须是 [0, 1] 范围内的浮点。 |
|
numberOfEpochs |
integer (int32) |
训练纪元数。 必须是正整数。 |
|
numberOfWorkers |
integer (int32) |
数据加载程序辅助角色数。 必须是非负整数。 |
|
optimizer | None |
优化器的类型。 |
|
randomSeed |
integer (int32) |
使用确定性训练时要使用的随机种子。 |
|
stepLRGamma |
number (float) |
当学习速率计划程序为“step”时,gamma 的值。 必须是 [0, 1] 范围内的浮点。 |
|
stepLRStepSize |
integer (int32) |
学习速率计划程序为“step”时步骤大小的值。 必须是正整数。 |
|
tileGridSize |
string |
用于平铺每个图像的网格大小。 注意:TileGridSize 不得为 None 才能启用小型对象检测逻辑。 一个字符串,其中包含两个整数(采用格式)。 注意:“yolov5”算法不支持此设置。 |
|
tileOverlapRatio |
number (float) |
每个维度中相邻磁贴之间的重叠比率。 必须在 [0, 1] 范围内浮动。 注意:“yolov5”算法不支持此设置。 |
|
tilePredictionsNmsThreshold |
number (float) |
用于执行 NMS 的 IOU 阈值,同时合并来自磁贴和图像的预测。 用于验证/推理。 必须在 [0, 1] 范围内浮动。 注意:“yolov5”算法不支持此设置。 |
|
trainingBatchSize |
integer (int32) |
训练批大小。 必须是正整数。 |
|
validationBatchSize |
integer (int32) |
验证批大小。 必须是正整数。 |
|
validationIouThreshold |
number (float) |
计算验证指标时要使用的 IOU 阈值。 必须在 [0, 1] 范围内浮动。 |
|
validationMetricType | None |
用于验证指标的指标计算方法。 |
|
warmupCosineLRCycles |
number (float) |
学习速率计划程序为“warmup_cosine”时的余弦周期值。 必须是 [0, 1] 范围内的浮点。 |
|
warmupCosineLRWarmupEpochs |
integer (int32) |
当学习速率计划程序为“warmup_cosine”时,预热时期的值。 必须是正整数。 |
|
weightDecay |
number (float) |
优化器为“zn”、“adam”或“adamw”时的权重衰减值。 必须是范围[0, 1] 中的浮点。 |
ImageObjectDetection
图像对象检测。 对象检测用于识别图像中的对象,并使用边界框定位每个对象,例如在图像中定位所有狗和猫,并在每个对象周围绘制边界框。
名称 | 类型 | 默认值 | 说明 |
---|---|---|---|
limitSettings |
[必需]限制 AutoML 作业的设置。 |
||
logVerbosity | Info |
作业的详细记录。 |
|
modelSettings |
用于训练模型的设置。 |
||
primaryMetric | MeanAveragePrecision |
要针对此任务进行优化的主要指标。 |
|
searchSpace |
用于采样模型及其超参数的不同组合的搜索空间。 |
||
sweepSettings |
模型扫描和超参数扫描相关设置。 |
||
targetColumnName |
string |
目标列名称:这是预测值列。 也称为分类任务的上下文中的标签列名称。 |
|
taskType | string: |
[必需]AutoMLJob 的任务类型。 |
|
trainingData |
[必需]训练数据输入。 |
||
validationData |
验证数据输入。 |
||
validationDataSize |
number (double) |
需要留出用于验证的定型数据集的分数。 未提供验证数据集时应用的值(0.0、1.0)。 |
ImageSweepSettings
模型扫描和超参数扫描相关设置。
名称 | 类型 | 说明 |
---|---|---|
earlyTermination | EarlyTerminationPolicy: |
提前终止策略的类型。 |
samplingAlgorithm |
[必需]超参数采样算法的类型。 |
InputDeliveryMode
用于确定输入数据传送模式的枚举。
值 | 说明 |
---|---|
Direct | |
Download | |
EvalDownload | |
EvalMount | |
ReadOnlyMount | |
ReadWriteMount |
InstanceSegmentationPrimaryMetrics
InstanceSegmentation 任务的主要指标。
值 | 说明 |
---|---|
MeanAveragePrecision |
平均平均精度 (MAP) 是 AP (平均精度) 的平均值。 针对每个类计算 AP,并求平均值以获取 MAP。 |
JobInputType
用于确定作业输入类型的枚举。
值 | 说明 |
---|---|
custom_model | |
literal | |
mlflow_model | |
mltable | |
triton_model | |
uri_file | |
uri_folder |
JobLimitsType
值 | 说明 |
---|---|
Command | |
Sweep |
JobOutputType
用于确定作业输出类型的枚举。
值 | 说明 |
---|---|
custom_model | |
mlflow_model | |
mltable | |
triton_model | |
uri_file | |
uri_folder |
JobResourceConfiguration
名称 | 类型 | 默认值 | 说明 |
---|---|---|---|
dockerArgs |
string |
要传递给 Docker run 命令的额外参数。 这将替代系统设置的任何参数,或在本部分中。 此参数仅支持 Azure ML 计算类型。 |
|
instanceCount |
integer (int32) |
1 |
计算目标使用的实例或节点数可选。 |
instanceType |
string |
计算目标支持的可选 VM 类型。 |
|
properties |
object |
其他属性包。 |
|
shmSize |
string pattern: \d+[bBkKmMgG] |
2g |
docker 容器的共享内存块的大小。 这应采用 (number)(unit) 格式,其中数字大于 0,单位可以是 b(字节)、k(千字节)、m(兆字节)或 g(GB)。 |
JobScheduleAction
名称 | 类型 | 说明 |
---|---|---|
actionType |
string:
Create |
[必需]指定计划的作类型 |
jobDefinition | JobBase: |
[必需]定义计划作定义详细信息。 |
JobService
作业终结点定义
名称 | 类型 | 说明 |
---|---|---|
endpoint |
string |
终结点的 URL。 |
errorMessage |
string |
服务中的任何错误。 |
jobServiceType |
string |
终结点类型。 |
nodes | Nodes: |
用户希望启动服务的节点。 如果未将 Nodes 设置为 null,则服务将仅在领导节点上启动。 |
port |
integer (int32) |
终结点的端口。 |
properties |
object |
在终结点上设置的其他属性。 |
status |
string |
终结点的状态。 |
JobStatus
作业的状态。
值 | 说明 |
---|---|
CancelRequested |
已请求取消作业。 |
Canceled |
取消请求后,作业现已成功取消。 |
Completed |
作业成功完成。 这反映了作业本身和输出集合状态都成功完成 |
Failed |
作业失败。 |
Finalizing |
作业在目标中完成。 它现在处于输出集合状态。 |
NotResponding |
启用检测信号后,如果运行未将任何信息更新到 RunHistory,则运行将转到 NotResponding 状态。 NotResponding 是唯一免除严格转换订单的状态。 运行可以从 NotResponding 转到任何以前的状态。 |
NotStarted |
运行尚未启动。 |
Paused |
作业由用户暂停。 对标记作业的一些调整只能处于暂停状态。 |
Preparing |
正在准备运行环境。 |
Provisioning |
(当前未使用)如果 ES 正在创建计算目标,将使用它。 |
Queued |
作业在计算目标中排队。 例如,在 BatchAI 中,作业处于排队状态,同时等待所有必需的节点准备就绪。 |
Running |
作业开始在计算目标中运行。 |
Starting |
已启动运行。 用户具有运行 ID。 |
Unknown |
如果未映射到所有其他状态,则默认作业状态 |
JobTier
用于确定作业层的枚举。
值 | 说明 |
---|---|
Basic | |
Null | |
Premium | |
Spot | |
Standard |
JobType
用于确定作业类型的枚举。
值 | 说明 |
---|---|
AutoML | |
Command | |
Pipeline | |
Spark | |
Sweep |
LearningRateScheduler
学习速率计划程序枚举。
值 | 说明 |
---|---|
None |
未选择学习速率计划程序。 |
Step |
步骤学习速率计划程序。 |
WarmupCosine |
余弦退火与热身。 |
LiteralJobInput
文本输入类型。
名称 | 类型 | 说明 |
---|---|---|
description |
string |
输入的说明。 |
jobInputType |
string:
literal |
[必需]指定作业的类型。 |
value |
string minLength: 1pattern: [a-zA-Z0-9_] |
[必需]输入的文本值。 |
LogVerbosity
用于设置日志详细性的枚举。
值 | 说明 |
---|---|
Critical |
仅记录关键语句。 |
Debug |
记录的调试和上述日志语句。 |
Error |
记录的错误和上述日志语句。 |
Info |
记录的信息和上述日志语句。 |
NotSet |
未发出任何日志。 |
Warning |
记录的警告和上述日志语句。 |
ManagedComputeIdentity
托管计算标识定义。
名称 | 类型 | 说明 |
---|---|---|
computeIdentityType | string: |
[必需]指定要在监视作业中使用的标识类型。 |
identity |
监视作业将利用的标识。 |
ManagedIdentity
托管标识配置。
名称 | 类型 | 说明 |
---|---|---|
clientId |
string (uuid) |
按客户端 ID 指定用户分配的标识。 对于系统分配,请不要设置此字段。 |
identityType |
string:
Managed |
[必需]指定标识框架的类型。 |
objectId |
string (uuid) |
按对象 ID 指定用户分配的标识。 对于系统分配,请不要设置此字段。 |
resourceId |
string |
按 ARM 资源 ID 指定用户分配的标识。 对于系统分配,请不要设置此字段。 |
ManagedServiceIdentity
托管服务标识(系统分配和/或用户分配的标识)
名称 | 类型 | 说明 |
---|---|---|
principalId |
string (uuid) |
系统分配标识的服务主体 ID。 此属性仅针对系统分配的标识提供。 |
tenantId |
string (uuid) |
系统分配标识的租户 ID。 此属性仅针对系统分配的标识提供。 |
type |
托管服务标识的类型(其中允许 SystemAssigned 和 UserAssigned 类型)。 |
|
userAssignedIdentities |
<string,
User |
User-Assigned 标识 |
ManagedServiceIdentityType
托管服务标识的类型(其中允许 SystemAssigned 和 UserAssigned 类型)。
值 | 说明 |
---|---|
None | |
SystemAssigned | |
SystemAssigned,UserAssigned | |
UserAssigned |
MedianStoppingPolicy
根据所有运行的主要指标的运行平均值定义提前终止策略
名称 | 类型 | 默认值 | 说明 |
---|---|---|---|
delayEvaluation |
integer (int32) |
0 |
延迟第一次计算的间隔数。 |
evaluationInterval |
integer (int32) |
0 |
策略评估之间的间隔(运行数)。 |
policyType |
string:
Median |
[必需]策略配置的名称 |
MLFlowModelJobInput
名称 | 类型 | 默认值 | 说明 |
---|---|---|---|
description |
string |
输入的说明。 |
|
jobInputType |
string:
mlflow_model |
[必需]指定作业的类型。 |
|
mode | ReadOnlyMount |
输入资产传送模式。 |
|
uri |
string minLength: 1pattern: [a-zA-Z0-9_] |
[必需]输入资产 URI。 |
MLFlowModelJobOutput
名称 | 类型 | 默认值 | 说明 |
---|---|---|---|
description |
string |
输出的说明。 |
|
jobOutputType |
string:
mlflow_model |
[必需]指定作业的类型。 |
|
mode | ReadWriteMount |
输出资产传送模式。 |
|
uri |
string |
输出资产 URI。 |
MLTableJobInput
名称 | 类型 | 默认值 | 说明 |
---|---|---|---|
description |
string |
输入的说明。 |
|
jobInputType |
string:
mltable |
[必需]指定作业的类型。 |
|
mode | ReadOnlyMount |
输入资产传送模式。 |
|
uri |
string minLength: 1pattern: [a-zA-Z0-9_] |
[必需]输入资产 URI。 |
MLTableJobOutput
名称 | 类型 | 默认值 | 说明 |
---|---|---|---|
description |
string |
输出的说明。 |
|
jobOutputType |
string:
mltable |
[必需]指定作业的类型。 |
|
mode | ReadWriteMount |
输出资产传送模式。 |
|
uri |
string |
输出资产 URI。 |
ModelSize
图像模型大小。
值 | 说明 |
---|---|
ExtraLarge |
特大大小。 |
Large |
大尺寸。 |
Medium |
中等大小。 |
None |
未选择任何值。 |
Small |
大小较小。 |
ModelTaskType
模型任务类型枚举。
值 | 说明 |
---|---|
Classification | |
Regression |
MonitorComputeIdentityType
监视计算标识类型枚举。
值 | 说明 |
---|---|
AmlToken |
通过用户的 AML 令牌进行身份验证。 |
ManagedIdentity |
通过用户提供的托管标识进行身份验证。 |
MonitorComputeType
监视计算类型枚举。
值 | 说明 |
---|---|
ServerlessSpark |
无服务器 Spark 计算。 |
MonitorDefinition
名称 | 类型 | 说明 |
---|---|---|
alertNotificationSettings |
监视器的通知设置。 |
|
computeConfiguration | MonitorComputeConfigurationBase: |
[必需]要运行监视作业的计算资源的 ARM 资源 ID。 |
monitoringTarget |
监视器针对的实体。 |
|
signals |
object |
[必需]要监视的信号。 |
MonitorEmailNotificationSettings
名称 | 类型 | 说明 |
---|---|---|
emails |
string[] |
总共限制为 499 个字符的电子邮件收件人列表。 |
MonitoringFeatureDataType
值 | 说明 |
---|---|
Categorical |
用于分类数据类型的功能。 |
Numerical |
用于数值数据类型的特征。 |
MonitoringFeatureFilterType
值 | 说明 |
---|---|
AllFeatures |
包括所有功能。 |
FeatureSubset |
包括用户定义的功能子集。 |
TopNByAttribution |
仅包括按特征归因度量的顶级贡献特征。 |
MonitoringInputDataType
监视输入数据类型枚举。
值 | 说明 |
---|---|
Fixed |
具有表格格式的输入数据,不需要预处理。 |
Rolling |
相对于监视器的当前运行时滚动的输入数据。 |
Static |
具有固定窗口大小的输入数据。 |
MonitoringNotificationType
值 | 说明 |
---|---|
AmlNotification |
通过 AML 通知启用电子邮件通知。 |
MonitoringSignalType
值 | 说明 |
---|---|
Custom |
跟踪用户提供的自定义信号。 |
DataDrift |
跟踪模型输入数据分布变化,与训练数据或过去的生产数据进行比较。 |
DataQuality |
跟踪模型输入数据完整性。 |
FeatureAttributionDrift |
跟踪生产中的特征重要性变化,与训练时的特征重要性进行比较。 |
PredictionDrift |
跟踪预测结果数据分布变化,与验证/测试标签数据或过去的生产数据进行比较。 |
MonitoringTarget
监视目标定义。
名称 | 类型 | 说明 |
---|---|---|
deploymentId |
string |
对此监视器目标的部署资产的引用。 |
modelId |
string |
对此监视器所针对的模型资产的引用。 |
taskType |
[必需]受监视模型的机器学习任务类型。 |
MonitoringThreshold
名称 | 类型 | 说明 |
---|---|---|
value |
number (double) |
阈值。 如果为 null,则设置默认值取决于指标类型。 |
MonitorNotificationSettings
名称 | 类型 | 说明 |
---|---|---|
emailNotificationSettings |
AML 通知电子邮件设置。 |
MonitorServerlessSparkCompute
监视无服务器 Spark 计算定义。
名称 | 类型 | 说明 |
---|---|---|
computeIdentity | MonitorComputeIdentityBase: |
[必需]无服务器 Spark 上运行的 Spark 作业利用的标识方案。 |
computeType |
string:
Serverless |
[必需]指定要监视的信号类型。 |
instanceType |
string minLength: 1pattern: [a-zA-Z0-9_] |
[必需]运行 Spark 作业的实例类型。 |
runtimeVersion |
string minLength: 1pattern: ^[0-9]+\.[0-9]+$ |
[必需]Spark 运行时版本。 |
Mpi
MPI 分发配置。
名称 | 类型 | 说明 |
---|---|---|
distributionType | string: |
[必需]指定分发框架的类型。 |
processCountPerInstance |
integer (int32) |
每个 MPI 节点的进程数。 |
NCrossValidationsMode
确定如何确定 N-Cross 验证值。
值 | 说明 |
---|---|
Auto |
自动确定 N 交叉验证值。 仅支持“预测”AutoML 任务。 |
Custom |
使用自定义 N 交叉验证值。 |
NlpVerticalFeaturizationSettings
名称 | 类型 | 说明 |
---|---|---|
datasetLanguage |
string |
数据集语言,适用于文本数据。 |
NlpVerticalLimitSettings
作业执行约束。
名称 | 类型 | 默认值 | 说明 |
---|---|---|---|
maxConcurrentTrials |
integer (int32) |
1 |
最大并发 AutoML 迭代次数。 |
maxTrials |
integer (int32) |
1 |
AutoML 迭代数。 |
timeout |
string (duration) |
P7D |
AutoML 作业超时。 |
NodesValueType
节点值的枚举类型
值 | 说明 |
---|---|
All |
NotificationSetting
通知的配置。
名称 | 类型 | 说明 |
---|---|---|
emailOn |
在指定的通知类型上向用户发送电子邮件通知 |
|
emails |
string[] |
这是电子邮件收件人列表,限制为 499 个字符的总 concat 和逗号分隔符 |
webhooks |
object |
将 Webhook 回调发送到服务。 密钥是 Webhook 的用户提供的名称。 |
NumericalDataDriftMetric
值 | 说明 |
---|---|
JensenShannonDistance |
詹森香农距离 (JSD) 指标。 |
NormalizedWassersteinDistance |
规范化 Wasserstein 距离指标。 |
PopulationStabilityIndex |
总体稳定性索引 (PSI) 指标。 |
TwoSampleKolmogorovSmirnovTest |
双样本 Kolmogorov-Smirnov 测试(双样本 K–S)”量度。 |
NumericalDataDriftMetricThreshold
名称 | 类型 | 说明 |
---|---|---|
dataType |
string:
Numerical |
[必需]指定指标阈值的数据类型。 |
metric |
[必需]要计算的数字数据偏移指标。 |
|
threshold |
阈值。 如果为 null,则会根据所选指标设置默认值。 |
NumericalDataQualityMetric
值 | 说明 |
---|---|
DataTypeErrorRate |
计算数据类型错误的速率。 |
NullValueRate |
计算 null 值的速率。 |
OutOfBoundsRate |
计算速率值超出边界。 |
NumericalDataQualityMetricThreshold
名称 | 类型 | 说明 |
---|---|---|
dataType |
string:
Numerical |
[必需]指定指标阈值的数据类型。 |
metric |
[必需]要计算的数字数据质量指标。 |
|
threshold |
阈值。 如果为 null,则会根据所选指标设置默认值。 |
NumericalPredictionDriftMetric
值 | 说明 |
---|---|
JensenShannonDistance |
詹森香农距离 (JSD) 指标。 |
NormalizedWassersteinDistance |
规范化 Wasserstein 距离指标。 |
PopulationStabilityIndex |
总体稳定性索引 (PSI) 指标。 |
TwoSampleKolmogorovSmirnovTest |
双样本 Kolmogorov-Smirnov 测试(双样本 K–S)”量度。 |
NumericalPredictionDriftMetricThreshold
名称 | 类型 | 说明 |
---|---|---|
dataType |
string:
Numerical |
[必需]指定指标阈值的数据类型。 |
metric |
[必需]要计算的数字预测偏移指标。 |
|
threshold |
阈值。 如果为 null,则会根据所选指标设置默认值。 |
ObjectDetectionPrimaryMetrics
Image ObjectDetection 任务的主要指标。
值 | 说明 |
---|---|
MeanAveragePrecision |
平均平均精度 (MAP) 是 AP (平均精度) 的平均值。 针对每个类计算 AP,并求平均值以获取 MAP。 |
Objective
优化目标。
名称 | 类型 | 说明 |
---|---|---|
goal |
[必需]定义超参数优化支持的指标目标 |
|
primaryMetric |
string minLength: 1pattern: [a-zA-Z0-9_] |
[必需]要优化的指标的名称。 |
OutputDeliveryMode
输出数据传送模式枚举。
值 | 说明 |
---|---|
Direct | |
ReadWriteMount | |
Upload |
PipelineJob
管道作业定义:定义 MFE 属性的泛型。
名称 | 类型 | 默认值 | 说明 |
---|---|---|---|
componentId |
string |
组件资源的 ARM 资源 ID。 |
|
computeId |
string |
计算资源的 ARM 资源 ID。 |
|
description |
string |
资产说明文本。 |
|
displayName |
string |
作业的显示名称。 |
|
experimentName |
string |
Default |
作业所属的试验的名称。 如果未设置,作业将放置在“默认”试验中。 |
identity | IdentityConfiguration: |
标识配置。 如果已设置,则应为 AmlToken、ManagedIdentity、UserIdentity 或 null 之一。 如果为 null,则默认为 AmlToken。 |
|
inputs |
object |
管道作业的输入。 |
|
isArchived |
boolean |
False |
资产是否已存档? |
jobType |
string:
Pipeline |
[必需]指定作业的类型。 |
|
jobs |
object |
作业构造管道作业。 |
|
notificationSetting |
作业的通知设置 |
||
outputs |
object |
管道作业的输出 |
|
properties |
object |
资产属性字典。 |
|
services |
<string,
Job |
JobEndpoints 列表。 对于本地作业,作业终结点的终结点值为 FileStreamObject。 |
|
settings |
object |
管道设置,例如 ContinueRunOnStepFailure 等。 |
|
sourceJobId |
string |
源作业的 ARM 资源 ID。 |
|
status |
作业的状态。 |
||
tags |
object |
标记字典。 可以添加、删除和更新标记。 |
PredictionDriftMonitoringSignal
名称 | 类型 | 说明 |
---|---|---|
featureDataTypeOverride |
object |
一个字典,用于将特征名称映射到各自的数据类型。 |
metricThresholds | PredictionDriftMetricThresholdBase[]: |
[必需]要计算的指标列表及其关联的阈值。 |
notificationTypes |
此信号的当前通知模式。 |
|
productionData | MonitoringInputDataBase: |
[必需]将计算偏移的数据。 |
properties |
object |
属性字典。 可以添加属性,但不能删除或更改属性。 |
referenceData | MonitoringInputDataBase: |
[必需]要计算偏移的数据。 |
signalType |
string:
Prediction |
[必需]指定要监视的信号类型。 |
PyTorch
PyTorch 分发配置。
名称 | 类型 | 说明 |
---|---|---|
distributionType | string: |
[必需]指定分发框架的类型。 |
processCountPerInstance |
integer (int32) |
每个节点的进程数。 |
QueueSettings
名称 | 类型 | 默认值 | 说明 |
---|---|---|---|
jobTier | Null |
控制计算作业层 |
RandomSamplingAlgorithm
定义随机生成值的采样算法
名称 | 类型 | 默认值 | 说明 |
---|---|---|---|
rule | Random |
随机算法的特定类型 |
|
samplingAlgorithmType |
string:
Random |
[必需]用于生成超参数值的算法以及配置属性 |
|
seed |
integer (int32) |
用作随机数生成的种子的可选整数 |
RandomSamplingAlgorithmRule
随机算法的特定类型
值 | 说明 |
---|---|
Random | |
Sobol |
RecurrenceFrequency
用于描述定期计划频率的枚举
值 | 说明 |
---|---|
Day |
日频率 |
Hour |
小时频率 |
Minute |
分钟频率 |
Month |
月频率 |
Week |
周频率 |
RecurrenceSchedule
名称 | 类型 | 说明 |
---|---|---|
hours |
integer[] (int32) |
[必需]计划小时列表。 |
minutes |
integer[] (int32) |
[必需]计划分钟列表。 |
monthDays |
integer[] (int32) |
计划月份日期列表 |
weekDays |
Week |
计划天数列表。 |
RecurrenceTrigger
名称 | 类型 | 默认值 | 说明 |
---|---|---|---|
endTime |
string |
以 ISO 8601 指定计划的结束时间,但不指定 UTC 偏移量。 请参阅 https://en.wikipedia.org/wiki/ISO_8601。 重新注释的格式将为“2022-06-01T00:00:01”(如果不存在),计划将无限期运行 |
|
frequency |
[必需]触发计划的频率。 |
||
interval |
integer (int32) |
[必需]指定计划间隔与频率 |
|
schedule |
重复计划。 |
||
startTime |
string |
以 ISO 8601 格式指定计划的开始时间,但没有 UTC 偏移量。 |
|
timeZone |
string |
UTC |
指定运行计划的时区。 TimeZone 应遵循 Windows 时区格式。 指: https://docs.microsoft.com/en-us/windows-hardware/manufacture/desktop/default-time-zones?view=windows-11 |
triggerType |
string:
Recurrence |
[必需] |
Regression
AutoML 表垂直中的回归任务。
名称 | 类型 | 默认值 | 说明 |
---|---|---|---|
cvSplitColumnNames |
string[] |
用于 CVSplit 数据的列。 |
|
featurizationSettings |
AutoML 作业所需的特征化输入。 |
||
limitSettings |
AutoMLJob 的执行约束。 |
||
logVerbosity | Info |
作业的详细记录。 |
|
nCrossValidations | NCrossValidations: |
未提供验证数据集时要应用于训练数据集的交叉验证折叠数。 |
|
primaryMetric | NormalizedRootMeanSquaredError |
回归任务的主要指标。 |
|
targetColumnName |
string |
目标列名称:这是预测值列。 也称为分类任务的上下文中的标签列名称。 |
|
taskType | string: |
[必需]AutoMLJob 的任务类型。 |
|
testData |
测试数据输入。 |
||
testDataSize |
number (double) |
需要为验证目的预留的测试数据集的分数。 未提供验证数据集时应用的值(0.0、1.0)。 |
|
trainingData |
[必需]训练数据输入。 |
||
trainingSettings |
AutoML 作业训练阶段的输入。 |
||
validationData |
验证数据输入。 |
||
validationDataSize |
number (double) |
需要留出用于验证的定型数据集的分数。 未提供验证数据集时应用的值(0.0、1.0)。 |
|
weightColumnName |
string |
示例权重列的名称。 自动化 ML 支持加权列作为输入,导致数据中的行向上或向下加权。 |
RegressionModels
AutoML 支持的所有回归模型的枚举。
值 | 说明 |
---|---|
DecisionTree |
决策树是一种用于分类和回归任务的非参数监督式学习方法。 目标是创建一个模型,通过学习从数据特征推断的简单决策规则来预测目标变量的值。 |
ElasticNet |
弹性网是一种常用的正则化线性回归,它结合了两种常用点数,特别是 L1 和 L2 惩罚函数。 |
ExtremeRandomTrees |
极端树是一种组合机器学习算法,它结合了许多决策树的预测。 它与广泛使用的随机林算法相关。 |
GradientBoosting |
将周学习者转移到强学习者的技术称为“提升”。 梯度提升算法过程适用于此执行理论。 |
KNN |
K 最近的邻居 (KNN) 算法使用“特征相似性”来预测新数据点的值,这进一步意味着新数据点将基于它与训练集中的点匹配程度分配一个值。 |
LassoLars |
套索模型适合与最小角度回归 a.k.a. Lars。 它是使用 L1 训练的线性模型,之前用作正则器。 |
LightGBM |
LightGBM 是一种梯度提升框架,它使用基于树的学习算法。 |
RandomForest |
随机林是一种监督式学习算法。 它构建的 “森林” 是决策树的集合,通常使用 “bagging” 方法进行训练。 装袋方法的一般思路是,学习模型的组合会增加整体结果。 |
SGD |
ZN:随机梯度下降是机器学习应用程序中常用的优化算法,用于查找与预测输出和实际输出之间的最佳拟合的模型参数。 这是一种无所事事但强大的技术。 |
XGBoostRegressor |
XGBoostRegressor:极端梯度提升回归器是一种使用基础学习器合奏的监督机器学习模型。 |
RegressionPrimaryMetrics
回归任务的主要指标。
值 | 说明 |
---|---|
NormalizedMeanAbsoluteError |
规范化平均绝对误差(NMAE)是一个验证指标,用于比较具有不同比例的(时序)平均绝对误差(MAE)。 |
NormalizedRootMeanSquaredError |
RMSE 的规范化根均方误差(NRMSE)有助于在不同比例的模型之间进行比较。 |
R2Score |
R2 分数是基于预测的机器学习模型的性能评估度量值之一。 |
SpearmanCorrelation |
Spearman 的相关性排名系数是排名相关性的非参数度量值。 |
RegressionTrainingSettings
回归训练相关配置。
名称 | 类型 | 默认值 | 说明 |
---|---|---|---|
allowedTrainingAlgorithms |
回归任务的允许模型。 |
||
blockedTrainingAlgorithms |
回归任务的阻止模型。 |
||
enableDnnTraining |
boolean |
False |
启用 DNN 模型的建议。 |
enableModelExplainability |
boolean |
True |
标志以在最佳模型上启用可解释性。 |
enableOnnxCompatibleModels |
boolean |
False |
用于启用 onnx 兼容模型的标志。 |
enableStackEnsemble |
boolean |
True |
启用堆栈合奏运行。 |
enableVoteEnsemble |
boolean |
True |
启用投票合奏运行。 |
ensembleModelDownloadTimeout |
string (duration) |
PT5M |
在 VotingEnsemble 和 StackEnsemble 模型生成期间,将下载先前子运行中的多个拟合模型。 如果需要更多时间,请将此参数配置为大于 300 秒的值。 |
stackEnsembleSettings |
堆栈合奏的堆栈合奏设置。 |
RollingInputData
滚动输入数据定义。
名称 | 类型 | 说明 |
---|---|---|
columns |
object |
将列名映射到特殊用途。 |
dataContext |
string |
数据源的上下文元数据。 |
inputDataType |
string:
Rolling |
[必需]指定要监视的信号类型。 |
jobInputType |
[必需]指定作业的类型。 |
|
preprocessingComponentId |
string |
对用于预处理数据的组件资产的引用。 |
uri |
string minLength: 1pattern: [a-zA-Z0-9_] |
[必需]输入资产 URI。 |
windowOffset |
string (duration) |
[必需]数据窗口末尾与监视器的当前运行时之间的时间偏移量。 |
windowSize |
string (duration) |
[必需]滚动数据窗口的大小。 |
SamplingAlgorithmType
值 | 说明 |
---|---|
Bayesian | |
Grid | |
Random |
Schedule
计划的基本定义
名称 | 类型 | 默认值 | 说明 |
---|---|---|---|
action | ScheduleActionBase: |
[必需]指定计划的作 |
|
description |
string |
资产说明文本。 |
|
displayName |
string |
计划显示名称。 |
|
isEnabled |
boolean |
True |
是否启用了计划? |
properties |
object |
资产属性字典。 |
|
provisioningState |
计划的预配状态。 |
||
tags |
object |
标记字典。 可以添加、删除和更新标记。 |
|
trigger | TriggerBase: |
[必需]指定触发器详细信息 |
ScheduleActionType
值 | 说明 |
---|---|
CreateJob | |
CreateMonitor | |
InvokeBatchEndpoint |
ScheduleProvisioningStatus
值 | 说明 |
---|---|
Canceled | |
Creating | |
Deleting | |
Failed | |
Succeeded | |
Updating |
ScheduleResource
Azure 资源管理器资源信封。
名称 | 类型 | 说明 |
---|---|---|
id |
string |
资源的完全限定资源 ID。 示例 - /subscriptions/{subscriptionId}/resourceGroups/{resourceGroupName}/providers/{resourceProviderNamespace}/{resourceType}/{resourceName} |
name |
string |
资源的名称 |
properties |
[必需]实体的其他属性。 |
|
systemData |
包含 createdBy 和 modifiedBy 信息的 Azure 资源管理器元数据。 |
|
type |
string |
资源类型。 例如“Microsoft.Compute/virtualMachines”或“Microsoft.Storage/storageAccounts” |
SeasonalityMode
预测季节性模式。
值 | 说明 |
---|---|
Auto |
要自动确定的季节性。 |
Custom |
使用自定义季节性值。 |
ShortSeriesHandlingConfiguration
定义 AutoML 如何处理短时序的参数。
值 | 说明 |
---|---|
Auto |
如果没有长系列,将填充短系列,否则将删除短系列。 |
Drop |
所有短系列都将被删除。 |
None |
表示 no/null 值。 |
Pad |
所有短系列都将填充。 |
SparkJob
Spark 作业定义。
名称 | 类型 | 默认值 | 说明 |
---|---|---|---|
archives |
string[] |
存档作业中使用的文件。 |
|
args |
string |
作业的参数。 |
|
codeId |
string (arm-id) minLength: 1pattern: [a-zA-Z0-9_] |
[必需] 代码资产的 arm-id。 |
|
componentId |
string |
组件资源的 ARM 资源 ID。 |
|
computeId |
string |
计算资源的 ARM 资源 ID。 |
|
conf |
object |
Spark 配置的属性。 |
|
description |
string |
资产说明文本。 |
|
displayName |
string |
作业的显示名称。 |
|
entry | SparkJobEntry: |
[必需]在启动作业时要执行的条目。 |
|
environmentId |
string (arm-id) |
作业的环境规范的 ARM 资源 ID。 |
|
environmentVariables |
object |
作业中包含的环境变量。 |
|
experimentName |
string |
Default |
作业所属的试验的名称。 如果未设置,作业将放置在“默认”试验中。 |
files |
string[] |
作业中使用的文件。 |
|
identity | IdentityConfiguration: |
标识配置。 如果已设置,则应为 AmlToken、ManagedIdentity、UserIdentity 或 null 之一。 如果为 null,则默认为 AmlToken。 |
|
inputs |
object |
作业中使用的输入数据绑定的映射。 |
|
isArchived |
boolean |
False |
资产是否已存档? |
jars |
string[] |
作业中使用的 Jar 文件。 |
|
jobType |
string:
Spark |
[必需]指定作业的类型。 |
|
notificationSetting |
作业的通知设置 |
||
outputs |
object |
作业中使用的输出数据绑定的映射。 |
|
properties |
object |
资产属性字典。 |
|
pyFiles |
string[] |
作业中使用的 Python 文件。 |
|
queueSettings |
作业的队列设置 |
||
resources |
作业的计算资源配置。 |
||
services |
<string,
Job |
JobEndpoints 列表。 对于本地作业,作业终结点的终结点值为 FileStreamObject。 |
|
status |
作业的状态。 |
||
tags |
object |
标记字典。 可以添加、删除和更新标记。 |
SparkJobEntryType
值 | 说明 |
---|---|
SparkJobPythonEntry | |
SparkJobScalaEntry |
SparkJobPythonEntry
名称 | 类型 | 说明 |
---|---|---|
file |
string minLength: 1pattern: [a-zA-Z0-9_] |
[必需]作业入口点的相对 python 文件路径。 |
sparkJobEntryType | string: |
[必需]作业入口点的类型。 |
SparkJobScalaEntry
名称 | 类型 | 说明 |
---|---|---|
className |
string minLength: 1pattern: [a-zA-Z0-9_] |
[必需]用作入口点的 Scala 类名称。 |
sparkJobEntryType | string: |
[必需]作业入口点的类型。 |
SparkResourceConfiguration
名称 | 类型 | 默认值 | 说明 |
---|---|---|---|
instanceType |
string |
计算目标支持的可选 VM 类型。 |
|
runtimeVersion |
string |
3.1 |
用于作业的 spark 运行时的版本。 |
StackEnsembleSettings
推进设置以自定义 StackEnsemble 运行。
名称 | 类型 | 默认值 | 说明 |
---|---|---|---|
stackMetaLearnerKWargs |
object |
要传递给元学习器初始值设定项的可选参数。 |
|
stackMetaLearnerTrainPercentage |
number (double) |
0.2 |
指定要保留用于训练元学习者的训练集(选择训练和训练类型的训练)的比例。 默认值为 0.2。 |
stackMetaLearnerType | None |
元学习器是在单个异类模型的输出上训练的模型。 |
StackMetaLearnerType
元学习器是在单个异类模型的输出上训练的模型。 默认元学习器是分类任务的 LogisticRegression(如果启用了交叉验证)和 ElasticNet 用于回归/预测任务(如果启用了交叉验证),则为 ElasticNetCV。 此参数可以是以下字符串之一:LogisticRegression、LogisticRegressionCV、LightGBMClassifier、ElasticNet、ElasticNetCV、LightGBMRegressor 或 LinearRegression
值 | 说明 |
---|---|
ElasticNet |
默认元学习器是回归任务的 LogisticRegression。 |
ElasticNetCV |
当 CV 处于打开状态时,默认元学习器是回归任务的 LogisticRegression。 |
LightGBMClassifier | |
LightGBMRegressor | |
LinearRegression | |
LogisticRegression |
默认元学习器是分类任务的 LogisticRegression。 |
LogisticRegressionCV |
当 CV 处于打开状态时,默认元学习器是分类任务的 LogisticRegression。 |
None |
StaticInputData
静态输入数据定义。
名称 | 类型 | 说明 |
---|---|---|
columns |
object |
将列名映射到特殊用途。 |
dataContext |
string |
数据源的上下文元数据。 |
inputDataType |
string:
Static |
[必需]指定要监视的信号类型。 |
jobInputType |
[必需]指定作业的类型。 |
|
preprocessingComponentId |
string |
对用于预处理数据的组件资产的引用。 |
uri |
string minLength: 1pattern: [a-zA-Z0-9_] |
[必需]输入资产 URI。 |
windowEnd |
string (date-time) |
[必需]数据窗口的结束日期。 |
windowStart |
string (date-time) |
[必需]数据窗口的开始日期。 |
StochasticOptimizer
图像模型的随机优化器。
值 | 说明 |
---|---|
Adam |
Adam 是基于时刻自适应估计优化随机目标函数的算法 |
Adamw |
AdamW 是优化器 Adam 的变体,它改进了重量衰减的实现。 |
None |
未选择优化器。 |
Sgd |
随机梯度下降优化器。 |
SweepJob
扫描作业定义。
名称 | 类型 | 默认值 | 说明 |
---|---|---|---|
componentId |
string |
组件资源的 ARM 资源 ID。 |
|
computeId |
string |
计算资源的 ARM 资源 ID。 |
|
description |
string |
资产说明文本。 |
|
displayName |
string |
作业的显示名称。 |
|
earlyTermination | EarlyTerminationPolicy: |
提前终止策略可在完成之前取消性能不佳的运行 |
|
experimentName |
string |
Default |
作业所属的试验的名称。 如果未设置,作业将放置在“默认”试验中。 |
identity | IdentityConfiguration: |
标识配置。 如果已设置,则应为 AmlToken、ManagedIdentity、UserIdentity 或 null 之一。 如果为 null,则默认为 AmlToken。 |
|
inputs |
object |
作业中使用的输入数据绑定的映射。 |
|
isArchived |
boolean |
False |
资产是否已存档? |
jobType |
string:
Sweep |
[必需]指定作业的类型。 |
|
limits | {} |
扫描作业限制。 |
|
notificationSetting |
作业的通知设置 |
||
objective |
[必需]优化目标。 |
||
outputs |
object |
作业中使用的输出数据绑定的映射。 |
|
properties |
object |
资产属性字典。 |
|
queueSettings |
作业的队列设置 |
||
samplingAlgorithm | SamplingAlgorithm: |
[必需]超参数采样算法 |
|
searchSpace |
object |
[必需]包含每个参数及其分布的字典。 字典键是参数的名称 |
|
services |
<string,
Job |
JobEndpoints 列表。 对于本地作业,作业终结点的终结点值为 FileStreamObject。 |
|
status |
作业的状态。 |
||
tags |
object |
标记字典。 可以添加、删除和更新标记。 |
|
trial |
[必需]试用组件定义。 |
SweepJobLimits
扫描作业限制类。
名称 | 类型 | 说明 |
---|---|---|
jobLimitsType |
string:
Sweep |
[必需]JobLimit 类型。 |
maxConcurrentTrials |
integer (int32) |
扫描作业最大并发试用版。 |
maxTotalTrials |
integer (int32) |
扫描作业最大总试用版数。 |
timeout |
string (duration) |
ISO 8601 格式的最大运行持续时间,之后作业将被取消。 仅支持精度为秒的持续时间。 |
trialTimeout |
string (duration) |
扫描作业试用超时值。 |
systemData
与创建和上次修改资源相关的元数据。
名称 | 类型 | 说明 |
---|---|---|
createdAt |
string (date-time) |
资源创建时间戳(UTC)。 |
createdBy |
string |
创建资源的标识。 |
createdByType |
创建资源的标识的类型。 |
|
lastModifiedAt |
string (date-time) |
上次修改的资源时间戳(UTC) |
lastModifiedBy |
string |
上次修改资源的标识。 |
lastModifiedByType |
上次修改资源的标识的类型。 |
TableVerticalFeaturizationSettings
特征化配置。
名称 | 类型 | 默认值 | 说明 |
---|---|---|---|
blockedTransformers |
这些转换器不应用于特征化。 |
||
columnNameAndTypes |
object |
列名及其类型(int、float、string、datetime 等)的字典。 |
|
datasetLanguage |
string |
数据集语言,适用于文本数据。 |
|
enableDnnFeaturization |
boolean |
False |
确定是否使用基于 Dnn 的特征化器进行数据特征化。 |
mode | Auto |
特征化模式 - 用户可以保留默认的“自动”模式,AutoML 将负责在特征化阶段对数据进行必要的转换。 如果选择了“关闭”,则不会完成特征化。 如果选择“自定义”,则用户可以指定其他输入以自定义特征化完成方式。 |
|
transformerParams |
object |
用户可以指定要用于的其他转换器以及要向其应用它的列以及转换器构造函数的参数。 |
TableVerticalLimitSettings
作业执行约束。
名称 | 类型 | 默认值 | 说明 |
---|---|---|---|
enableEarlyTermination |
boolean |
True |
启用提前终止,确定如果最近 20 次迭代中没有分数改进,AutoMLJob 是否会提前终止。 |
exitScore |
number (double) |
AutoML 作业的退出分数。 |
|
maxConcurrentTrials |
integer (int32) |
1 |
最大并发迭代数。 |
maxCoresPerTrial |
integer (int32) |
-1 |
每次迭代的最大核心数。 |
maxTrials |
integer (int32) |
1000 |
迭代次数。 |
timeout |
string (duration) |
PT6H |
AutoML 作业超时。 |
trialTimeout |
string (duration) |
PT30M |
迭代超时。 |
TargetAggregationFunction
目标聚合函数。
值 | 说明 |
---|---|
Max | |
Mean | |
Min | |
None |
表示未设置任何值。 |
Sum |
TargetLagsMode
目标滞后选择模式。
值 | 说明 |
---|---|
Auto |
要自动确定的目标滞后时间。 |
Custom |
使用自定义目标滞后时间。 |
TargetRollingWindowSizeMode
目标滚动窗口大小模式。
值 | 说明 |
---|---|
Auto |
自动确定滚动窗口大小。 |
Custom |
使用指定的滚动窗口大小。 |
TaskType
AutoMLJob 任务类型。
值 | 说明 |
---|---|
Classification |
机器学习和统计信息中的分类是一种监督式学习方法,计算机程序从给定的数据中学习并进行新的观察或分类。 |
Forecasting |
预测是一种特殊的回归任务,用于处理时序数据并创建预测模型,可用于根据输入预测近期值。 |
ImageClassification |
图像分类。 当图像仅使用一组类中的单个标签进行分类(例如,每个图像被分类为“猫”或“狗”或“鸭子”的图像)时,将使用多类图像分类。 |
ImageClassificationMultilabel |
图像分类多标签。 当图像可能具有一组标签中的一个或多个标签时,将使用多标签图像分类,例如图像可以同时标有“cat”和“dog”。 |
ImageInstanceSegmentation |
图像实例分段。 实例分段用于标识像素级别图像中的对象,在图像中的每个对象周围绘制多边形。 |
ImageObjectDetection |
图像对象检测。 对象检测用于识别图像中的对象,并使用边界框定位每个对象,例如在图像中定位所有狗和猫,并在每个对象周围绘制边界框。 |
Regression |
回归意味着使用输入数据预测值。 回归模型用于预测连续值。 |
TextClassification |
文本分类(也称为文本标记或文本分类)是将文本排序到类别的过程。 类别是相互排斥的。 |
TextClassificationMultilabel |
多标签分类任务将每个示例分配给目标标签的组(零个或多个)。 |
TextNER |
名为 Entity Recognition a.k.a. TextNER 的文本。 命名实体识别(NER)能够采用自由格式的文本,并识别人员、位置、组织等实体的出现次数。 |
TensorFlow
TensorFlow 分发配置。
名称 | 类型 | 默认值 | 说明 |
---|---|---|---|
distributionType | string: |
[必需]指定分发框架的类型。 |
|
parameterServerCount |
integer (int32) |
0 |
参数服务器任务数。 |
workerCount |
integer (int32) |
工人数。 如果未指定,则默认为实例计数。 |
TextClassification
AutoML NLP 垂直中的文本分类任务。 NLP - 自然语言处理。
名称 | 类型 | 默认值 | 说明 |
---|---|---|---|
featurizationSettings |
AutoML 作业所需的特征化输入。 |
||
limitSettings |
AutoMLJob 的执行约束。 |
||
logVerbosity | Info |
作业的详细记录。 |
|
primaryMetric | Accuracy |
Text-Classification 任务的主要指标。 |
|
targetColumnName |
string |
目标列名称:这是预测值列。 也称为分类任务的上下文中的标签列名称。 |
|
taskType | string: |
[必需]AutoMLJob 的任务类型。 |
|
trainingData |
[必需]训练数据输入。 |
||
validationData |
验证数据输入。 |
TextClassificationMultilabel
AutoML NLP 垂直中的文本分类多标签任务。 NLP - 自然语言处理。
名称 | 类型 | 默认值 | 说明 |
---|---|---|---|
featurizationSettings |
AutoML 作业所需的特征化输入。 |
||
limitSettings |
AutoMLJob 的执行约束。 |
||
logVerbosity | Info |
作业的详细记录。 |
|
primaryMetric |
文本Classification-Multilabel 任务的主要指标。 目前仅支持准确性作为主要指标,因此用户不需要显式设置它。 |
||
targetColumnName |
string |
目标列名称:这是预测值列。 也称为分类任务的上下文中的标签列名称。 |
|
taskType | string: |
[必需]AutoMLJob 的任务类型。 |
|
trainingData |
[必需]训练数据输入。 |
||
validationData |
验证数据输入。 |
TextNer
在 AutoML NLP 垂直中 Text-NER 任务。 NER - 命名实体识别。 NLP - 自然语言处理。
名称 | 类型 | 默认值 | 说明 |
---|---|---|---|
featurizationSettings |
AutoML 作业所需的特征化输入。 |
||
limitSettings |
AutoMLJob 的执行约束。 |
||
logVerbosity | Info |
作业的详细记录。 |
|
primaryMetric |
Text-NER 任务的主要指标。 Text-NER 仅支持“准确性”,因此用户不需要显式设置此值。 |
||
targetColumnName |
string |
目标列名称:这是预测值列。 也称为分类任务的上下文中的标签列名称。 |
|
taskType |
string:
TextNER |
[必需]AutoMLJob 的任务类型。 |
|
trainingData |
[必需]训练数据输入。 |
||
validationData |
验证数据输入。 |
TopNFeaturesByAttribution
名称 | 类型 | 默认值 | 说明 |
---|---|---|---|
filterType |
string:
Top |
[必需]指定要在选择要计算指标的功能时利用的功能筛选器。 |
|
top |
integer (int32) |
10 |
要包括的顶级功能数。 |
TrialComponent
试用组件定义。
名称 | 类型 | 默认值 | 说明 |
---|---|---|---|
codeId |
string |
代码资产的 ARM 资源 ID。 |
|
command |
string minLength: 1pattern: [a-zA-Z0-9_] |
[必需]在启动作业时执行的命令。 例如 “python train.py” |
|
distribution | DistributionConfiguration: |
作业的分发配置。 如果已设置,则应为 Mpi、Tensorflow、PyTorch 或 null 之一。 |
|
environmentId |
string minLength: 1pattern: [a-zA-Z0-9_] |
[必需]作业的环境规范的 ARM 资源 ID。 |
|
environmentVariables |
object |
作业中包含的环境变量。 |
|
resources | {} |
作业的计算资源配置。 |
TriggerType
值 | 说明 |
---|---|
Cron | |
Recurrence |
TritonModelJobInput
名称 | 类型 | 默认值 | 说明 |
---|---|---|---|
description |
string |
输入的说明。 |
|
jobInputType |
string:
triton_model |
[必需]指定作业的类型。 |
|
mode | ReadOnlyMount |
输入资产传送模式。 |
|
uri |
string minLength: 1pattern: [a-zA-Z0-9_] |
[必需]输入资产 URI。 |
TritonModelJobOutput
名称 | 类型 | 默认值 | 说明 |
---|---|---|---|
description |
string |
输出的说明。 |
|
jobOutputType |
string:
triton_model |
[必需]指定作业的类型。 |
|
mode | ReadWriteMount |
输出资产传送模式。 |
|
uri |
string |
输出资产 URI。 |
TruncationSelectionPolicy
定义一个提前终止策略,该策略在每个评估间隔内取消给定的运行百分比。
名称 | 类型 | 默认值 | 说明 |
---|---|---|---|
delayEvaluation |
integer (int32) |
0 |
延迟第一次计算的间隔数。 |
evaluationInterval |
integer (int32) |
0 |
策略评估之间的间隔(运行数)。 |
policyType |
string:
Truncation |
[必需]策略配置的名称 |
|
truncationPercentage |
integer (int32) |
0 |
要在每个评估间隔取消的运行百分比。 |
UriFileJobInput
名称 | 类型 | 默认值 | 说明 |
---|---|---|---|
description |
string |
输入的说明。 |
|
jobInputType |
string:
uri_file |
[必需]指定作业的类型。 |
|
mode | ReadOnlyMount |
输入资产传送模式。 |
|
uri |
string minLength: 1pattern: [a-zA-Z0-9_] |
[必需]输入资产 URI。 |
UriFileJobOutput
名称 | 类型 | 默认值 | 说明 |
---|---|---|---|
description |
string |
输出的说明。 |
|
jobOutputType |
string:
uri_file |
[必需]指定作业的类型。 |
|
mode | ReadWriteMount |
输出资产传送模式。 |
|
uri |
string |
输出资产 URI。 |
UriFolderJobInput
名称 | 类型 | 默认值 | 说明 |
---|---|---|---|
description |
string |
输入的说明。 |
|
jobInputType |
string:
uri_folder |
[必需]指定作业的类型。 |
|
mode | ReadOnlyMount |
输入资产传送模式。 |
|
uri |
string minLength: 1pattern: [a-zA-Z0-9_] |
[必需]输入资产 URI。 |
UriFolderJobOutput
名称 | 类型 | 默认值 | 说明 |
---|---|---|---|
description |
string |
输出的说明。 |
|
jobOutputType |
string:
uri_folder |
[必需]指定作业的类型。 |
|
mode | ReadWriteMount |
输出资产传送模式。 |
|
uri |
string |
输出资产 URI。 |
UserAssignedIdentity
用户分配的标识属性
名称 | 类型 | 说明 |
---|---|---|
clientId |
string (uuid) |
分配的标识的客户端 ID。 |
principalId |
string (uuid) |
已分配标识的主体 ID。 |
UserIdentity
用户标识配置。
名称 | 类型 | 说明 |
---|---|---|
identityType | string: |
[必需]指定标识框架的类型。 |
UseStl
配置时序目标列的 STL 分解。
值 | 说明 |
---|---|
None |
无 stl 分解。 |
Season | |
SeasonTrend |
ValidationMetricType
用于图像任务中验证指标的指标计算方法。
值 | 说明 |
---|---|
Coco |
Coco 指标。 |
CocoVoc |
CocoVoc 指标。 |
None |
无指标。 |
Voc |
Voc 指标。 |
WebhookType
用于确定 Webhook 回调服务类型的枚举。
值 | 说明 |
---|---|
AzureDevOps |
WeekDay
工作日枚举
值 | 说明 |
---|---|
Friday |
星期五工作日 |
Monday |
星期一工作日 |
Saturday |
星期六工作日 |
Sunday |
星期天工作日 |
Thursday |
星期四工作日 |
Tuesday |
星期二工作日 |
Wednesday |
星期三工作日 |