你当前正在访问 Microsoft Azure Global Edition 技术文档网站。 如果需要访问由世纪互联运营的 Microsoft Azure 中国技术文档网站,请访问 https://docs.azure.cn。
- 最近的
- 2025-07-01-预览版
- 2025-06-01
- 2025-04-01
- 2025-04-01-预览版
- 2025-01-01-预览版
- 2024-10-01
- 2024-10-01-预览版
- 2024-07-01-预览版
- 2024-04-01
- 2024-04-01-预览版
- 2024-01-01-预览版
- 2023-10-01
- 2023-08-01-预览版
- 2023-06-01-预览版
- 2023-04-01
- 2023-04-01-预览版
- 2023-02-01-预览版
- 2022-12-01-预览版
- 2022-10-01
- 2022-10-01-预览版
- 2022-06-01-预览版
- 2022-05-01
- 2022-02-01-预览版
- 2021-03-01-预览版
Bicep 资源定义
可以使用目标作部署工作区/作业资源类型:
- 资源组 - 请参阅 资源组部署命令
有关每个 API 版本中已更改属性的列表,请参阅 更改日志。
资源格式
若要创建 Microsoft.MachineLearningServices/workspaces/jobs 资源,请将以下 Bicep 添加到模板。
resource symbolicname 'Microsoft.MachineLearningServices/workspaces/jobs@2022-10-01-preview' = {
parent: resourceSymbolicName
name: 'string'
properties: {
componentId: 'string'
computeId: 'string'
description: 'string'
displayName: 'string'
experimentName: 'string'
identity: {
identityType: 'string'
// For remaining properties, see IdentityConfiguration objects
}
isArchived: bool
properties: {
{customized property}: 'string'
}
services: {
{customized property}: {
endpoint: 'string'
jobServiceType: 'string'
nodes: {
nodesValueType: 'string'
// For remaining properties, see Nodes objects
}
port: int
properties: {
{customized property}: 'string'
}
}
}
tags: {
{customized property}: 'string'
}
jobType: 'string'
// For remaining properties, see JobBaseProperties objects
}
}
季节性对象
设置 模式 属性以指定对象的类型。
对于 自动,请使用:
{
mode: 'Auto'
}
对于 “自定义”,请使用:
{
mode: 'Custom'
value: int
}
ForecastHorizon 对象
设置 模式 属性以指定对象的类型。
对于 自动,请使用:
{
mode: 'Auto'
}
对于 “自定义”,请使用:
{
mode: 'Custom'
value: int
}
JobOutput 对象
设置 jobOutputType 属性以指定对象的类型。
对于 custom_model,请使用:
{
jobOutputType: 'custom_model'
mode: 'string'
uri: 'string'
}
对于 mlflow_model,请使用:
{
jobOutputType: 'mlflow_model'
mode: 'string'
uri: 'string'
}
对于 mltable,请使用:
{
jobOutputType: 'mltable'
mode: 'string'
uri: 'string'
}
对于 triton_model,请使用:
{
jobOutputType: 'triton_model'
mode: 'string'
uri: 'string'
}
对于 uri_file,请使用:
{
jobOutputType: 'uri_file'
mode: 'string'
uri: 'string'
}
对于 uri_folder,请使用:
{
jobOutputType: 'uri_folder'
mode: 'string'
uri: 'string'
}
IdentityConfiguration 对象
设置 identityType 属性以指定对象的类型。
对于 AMLToken,请使用:
{
identityType: 'AMLToken'
}
对于 托管,请使用:
{
clientId: 'string'
identityType: 'Managed'
objectId: 'string'
resourceId: 'string'
}
对于 UserIdentity,请使用:
{
identityType: 'UserIdentity'
}
DistributionConfiguration 对象
设置 distributionType 属性以指定对象的类型。
对于 Mpi,请使用:
{
distributionType: 'Mpi'
processCountPerInstance: int
}
对于 PyTorch,请使用:
{
distributionType: 'PyTorch'
processCountPerInstance: int
}
对于 TensorFlow,请使用:
{
distributionType: 'TensorFlow'
parameterServerCount: int
workerCount: int
}
MLAssistConfiguration 对象
设置 mlAssist 属性以指定对象的类型。
对于 禁用,请使用:
{
mlAssist: 'Disabled'
}
对于 “已启用”,请使用:
{
inferencingComputeBinding: 'string'
mlAssist: 'Enabled'
trainingComputeBinding: 'string'
}
EarlyTerminationPolicy 对象
设置 policyType 属性以指定对象的类型。
对于 Bandit,请使用:
{
policyType: 'Bandit'
slackAmount: int
slackFactor: int
}
对于 MedianStopping,请使用:
{
policyType: 'MedianStopping'
}
对于 TruncationSelection,请使用:
{
policyType: 'TruncationSelection'
truncationPercentage: int
}
TargetRollingWindowSize 对象
设置 模式 属性以指定对象的类型。
对于 自动,请使用:
{
mode: 'Auto'
}
对于 “自定义”,请使用:
{
mode: 'Custom'
value: int
}
SparkJobEntry 对象
设置 sparkJobEntryType 属性以指定对象的类型。
对于 SparkJobPythonEntry,请使用:
{
file: 'string'
sparkJobEntryType: 'SparkJobPythonEntry'
}
对于 SparkJobScalaEntry,请使用:
{
className: 'string'
sparkJobEntryType: 'SparkJobScalaEntry'
}
AutoMLVertical 对象
设置 taskType 属性以指定对象的类型。
对于 分类,请使用:
{
cvSplitColumnNames: [
'string'
]
featurizationSettings: {
blockedTransformers: [
'string'
]
columnNameAndTypes: {
{customized property}: 'string'
}
datasetLanguage: 'string'
enableDnnFeaturization: bool
mode: 'string'
transformerParams: {
{customized property}: [
{
fields: [
'string'
]
parameters: any(...)
}
]
}
}
fixedParameters: {
booster: 'string'
boostingType: 'string'
growPolicy: 'string'
learningRate: int
maxBin: int
maxDepth: int
maxLeaves: int
minDataInLeaf: int
minSplitGain: int
modelName: 'string'
nEstimators: int
numLeaves: int
preprocessorName: 'string'
regAlpha: int
regLambda: int
subsample: int
subsampleFreq: int
treeMethod: 'string'
withMean: bool
withStd: bool
}
limitSettings: {
enableEarlyTermination: bool
exitScore: int
maxConcurrentTrials: int
maxCoresPerTrial: int
maxTrials: int
sweepConcurrentTrials: int
sweepTrials: int
timeout: 'string'
trialTimeout: 'string'
}
nCrossValidations: {
mode: 'string'
// For remaining properties, see NCrossValidations objects
}
positiveLabel: 'string'
primaryMetric: 'string'
searchSpace: [
{
booster: 'string'
boostingType: 'string'
growPolicy: 'string'
learningRate: 'string'
maxBin: 'string'
maxDepth: 'string'
maxLeaves: 'string'
minDataInLeaf: 'string'
minSplitGain: 'string'
modelName: 'string'
nEstimators: 'string'
numLeaves: 'string'
preprocessorName: 'string'
regAlpha: 'string'
regLambda: 'string'
subsample: 'string'
subsampleFreq: 'string'
treeMethod: 'string'
withMean: 'string'
withStd: 'string'
}
]
sweepSettings: {
earlyTermination: {
delayEvaluation: int
evaluationInterval: int
policyType: 'string'
// For remaining properties, see EarlyTerminationPolicy objects
}
samplingAlgorithm: 'string'
}
taskType: 'Classification'
testData: {
description: 'string'
jobInputType: 'string'
mode: 'string'
uri: 'string'
}
testDataSize: int
trainingSettings: {
allowedTrainingAlgorithms: [
'string'
]
blockedTrainingAlgorithms: [
'string'
]
enableDnnTraining: bool
enableModelExplainability: bool
enableOnnxCompatibleModels: bool
enableStackEnsemble: bool
enableVoteEnsemble: bool
ensembleModelDownloadTimeout: 'string'
stackEnsembleSettings: {
stackMetaLearnerKWargs: any(...)
stackMetaLearnerTrainPercentage: int
stackMetaLearnerType: 'string'
}
}
validationData: {
description: 'string'
jobInputType: 'string'
mode: 'string'
uri: 'string'
}
validationDataSize: int
weightColumnName: 'string'
}
对于 预测,请使用:
{
cvSplitColumnNames: [
'string'
]
featurizationSettings: {
blockedTransformers: [
'string'
]
columnNameAndTypes: {
{customized property}: 'string'
}
datasetLanguage: 'string'
enableDnnFeaturization: bool
mode: 'string'
transformerParams: {
{customized property}: [
{
fields: [
'string'
]
parameters: any(...)
}
]
}
}
fixedParameters: {
booster: 'string'
boostingType: 'string'
growPolicy: 'string'
learningRate: int
maxBin: int
maxDepth: int
maxLeaves: int
minDataInLeaf: int
minSplitGain: int
modelName: 'string'
nEstimators: int
numLeaves: int
preprocessorName: 'string'
regAlpha: int
regLambda: int
subsample: int
subsampleFreq: int
treeMethod: 'string'
withMean: bool
withStd: bool
}
forecastingSettings: {
countryOrRegionForHolidays: 'string'
cvStepSize: int
featureLags: 'string'
forecastHorizon: {
mode: 'string'
// For remaining properties, see ForecastHorizon objects
}
frequency: 'string'
seasonality: {
mode: 'string'
// For remaining properties, see Seasonality objects
}
shortSeriesHandlingConfig: 'string'
targetAggregateFunction: 'string'
targetLags: {
mode: 'string'
// For remaining properties, see TargetLags objects
}
targetRollingWindowSize: {
mode: 'string'
// For remaining properties, see TargetRollingWindowSize objects
}
timeColumnName: 'string'
timeSeriesIdColumnNames: [
'string'
]
useStl: 'string'
}
limitSettings: {
enableEarlyTermination: bool
exitScore: int
maxConcurrentTrials: int
maxCoresPerTrial: int
maxTrials: int
sweepConcurrentTrials: int
sweepTrials: int
timeout: 'string'
trialTimeout: 'string'
}
nCrossValidations: {
mode: 'string'
// For remaining properties, see NCrossValidations objects
}
primaryMetric: 'string'
searchSpace: [
{
booster: 'string'
boostingType: 'string'
growPolicy: 'string'
learningRate: 'string'
maxBin: 'string'
maxDepth: 'string'
maxLeaves: 'string'
minDataInLeaf: 'string'
minSplitGain: 'string'
modelName: 'string'
nEstimators: 'string'
numLeaves: 'string'
preprocessorName: 'string'
regAlpha: 'string'
regLambda: 'string'
subsample: 'string'
subsampleFreq: 'string'
treeMethod: 'string'
withMean: 'string'
withStd: 'string'
}
]
sweepSettings: {
earlyTermination: {
delayEvaluation: int
evaluationInterval: int
policyType: 'string'
// For remaining properties, see EarlyTerminationPolicy objects
}
samplingAlgorithm: 'string'
}
taskType: 'Forecasting'
testData: {
description: 'string'
jobInputType: 'string'
mode: 'string'
uri: 'string'
}
testDataSize: int
trainingSettings: {
allowedTrainingAlgorithms: [
'string'
]
blockedTrainingAlgorithms: [
'string'
]
enableDnnTraining: bool
enableModelExplainability: bool
enableOnnxCompatibleModels: bool
enableStackEnsemble: bool
enableVoteEnsemble: bool
ensembleModelDownloadTimeout: 'string'
stackEnsembleSettings: {
stackMetaLearnerKWargs: any(...)
stackMetaLearnerTrainPercentage: int
stackMetaLearnerType: 'string'
}
}
validationData: {
description: 'string'
jobInputType: 'string'
mode: 'string'
uri: 'string'
}
validationDataSize: int
weightColumnName: 'string'
}
对于 ImageClassification,请使用:
{
limitSettings: {
maxConcurrentTrials: int
maxTrials: int
timeout: 'string'
}
modelSettings: {
advancedSettings: 'string'
amsGradient: bool
augmentations: 'string'
beta1: int
beta2: int
checkpointFrequency: int
checkpointModel: {
description: 'string'
jobInputType: 'string'
mode: 'string'
uri: 'string'
}
checkpointRunId: 'string'
distributed: bool
earlyStopping: bool
earlyStoppingDelay: int
earlyStoppingPatience: int
enableOnnxNormalization: bool
evaluationFrequency: int
gradientAccumulationStep: int
layersToFreeze: int
learningRate: int
learningRateScheduler: 'string'
modelName: 'string'
momentum: int
nesterov: bool
numberOfEpochs: int
numberOfWorkers: int
optimizer: 'string'
randomSeed: int
stepLRGamma: int
stepLRStepSize: int
trainingBatchSize: int
trainingCropSize: int
validationBatchSize: int
validationCropSize: int
validationResizeSize: int
warmupCosineLRCycles: int
warmupCosineLRWarmupEpochs: int
weightDecay: int
weightedLoss: int
}
primaryMetric: 'string'
searchSpace: [
{
amsGradient: 'string'
augmentations: 'string'
beta1: 'string'
beta2: 'string'
distributed: 'string'
earlyStopping: 'string'
earlyStoppingDelay: 'string'
earlyStoppingPatience: 'string'
enableOnnxNormalization: 'string'
evaluationFrequency: 'string'
gradientAccumulationStep: 'string'
layersToFreeze: 'string'
learningRate: 'string'
learningRateScheduler: 'string'
modelName: 'string'
momentum: 'string'
nesterov: 'string'
numberOfEpochs: 'string'
numberOfWorkers: 'string'
optimizer: 'string'
randomSeed: 'string'
stepLRGamma: 'string'
stepLRStepSize: 'string'
trainingBatchSize: 'string'
trainingCropSize: 'string'
validationBatchSize: 'string'
validationCropSize: 'string'
validationResizeSize: 'string'
warmupCosineLRCycles: 'string'
warmupCosineLRWarmupEpochs: 'string'
weightDecay: 'string'
weightedLoss: 'string'
}
]
sweepSettings: {
earlyTermination: {
delayEvaluation: int
evaluationInterval: int
policyType: 'string'
// For remaining properties, see EarlyTerminationPolicy objects
}
samplingAlgorithm: 'string'
}
taskType: 'ImageClassification'
validationData: {
description: 'string'
jobInputType: 'string'
mode: 'string'
uri: 'string'
}
validationDataSize: int
}
对于 ImageClassificationMultilabel,请使用:
{
limitSettings: {
maxConcurrentTrials: int
maxTrials: int
timeout: 'string'
}
modelSettings: {
advancedSettings: 'string'
amsGradient: bool
augmentations: 'string'
beta1: int
beta2: int
checkpointFrequency: int
checkpointModel: {
description: 'string'
jobInputType: 'string'
mode: 'string'
uri: 'string'
}
checkpointRunId: 'string'
distributed: bool
earlyStopping: bool
earlyStoppingDelay: int
earlyStoppingPatience: int
enableOnnxNormalization: bool
evaluationFrequency: int
gradientAccumulationStep: int
layersToFreeze: int
learningRate: int
learningRateScheduler: 'string'
modelName: 'string'
momentum: int
nesterov: bool
numberOfEpochs: int
numberOfWorkers: int
optimizer: 'string'
randomSeed: int
stepLRGamma: int
stepLRStepSize: int
trainingBatchSize: int
trainingCropSize: int
validationBatchSize: int
validationCropSize: int
validationResizeSize: int
warmupCosineLRCycles: int
warmupCosineLRWarmupEpochs: int
weightDecay: int
weightedLoss: int
}
primaryMetric: 'string'
searchSpace: [
{
amsGradient: 'string'
augmentations: 'string'
beta1: 'string'
beta2: 'string'
distributed: 'string'
earlyStopping: 'string'
earlyStoppingDelay: 'string'
earlyStoppingPatience: 'string'
enableOnnxNormalization: 'string'
evaluationFrequency: 'string'
gradientAccumulationStep: 'string'
layersToFreeze: 'string'
learningRate: 'string'
learningRateScheduler: 'string'
modelName: 'string'
momentum: 'string'
nesterov: 'string'
numberOfEpochs: 'string'
numberOfWorkers: 'string'
optimizer: 'string'
randomSeed: 'string'
stepLRGamma: 'string'
stepLRStepSize: 'string'
trainingBatchSize: 'string'
trainingCropSize: 'string'
validationBatchSize: 'string'
validationCropSize: 'string'
validationResizeSize: 'string'
warmupCosineLRCycles: 'string'
warmupCosineLRWarmupEpochs: 'string'
weightDecay: 'string'
weightedLoss: 'string'
}
]
sweepSettings: {
earlyTermination: {
delayEvaluation: int
evaluationInterval: int
policyType: 'string'
// For remaining properties, see EarlyTerminationPolicy objects
}
samplingAlgorithm: 'string'
}
taskType: 'ImageClassificationMultilabel'
validationData: {
description: 'string'
jobInputType: 'string'
mode: 'string'
uri: 'string'
}
validationDataSize: int
}
对于 ImageInstanceSegmentation,请使用:
{
limitSettings: {
maxConcurrentTrials: int
maxTrials: int
timeout: 'string'
}
modelSettings: {
advancedSettings: 'string'
amsGradient: bool
augmentations: 'string'
beta1: int
beta2: int
boxDetectionsPerImage: int
boxScoreThreshold: int
checkpointFrequency: int
checkpointModel: {
description: 'string'
jobInputType: 'string'
mode: 'string'
uri: 'string'
}
checkpointRunId: 'string'
distributed: bool
earlyStopping: bool
earlyStoppingDelay: int
earlyStoppingPatience: int
enableOnnxNormalization: bool
evaluationFrequency: int
gradientAccumulationStep: int
imageSize: int
layersToFreeze: int
learningRate: int
learningRateScheduler: 'string'
maxSize: int
minSize: int
modelName: 'string'
modelSize: 'string'
momentum: int
multiScale: bool
nesterov: bool
nmsIouThreshold: int
numberOfEpochs: int
numberOfWorkers: int
optimizer: 'string'
randomSeed: int
stepLRGamma: int
stepLRStepSize: int
tileGridSize: 'string'
tileOverlapRatio: int
tilePredictionsNmsThreshold: int
trainingBatchSize: int
validationBatchSize: int
validationIouThreshold: int
validationMetricType: 'string'
warmupCosineLRCycles: int
warmupCosineLRWarmupEpochs: int
weightDecay: int
}
primaryMetric: 'string'
searchSpace: [
{
amsGradient: 'string'
augmentations: 'string'
beta1: 'string'
beta2: 'string'
boxDetectionsPerImage: 'string'
boxScoreThreshold: 'string'
distributed: 'string'
earlyStopping: 'string'
earlyStoppingDelay: 'string'
earlyStoppingPatience: 'string'
enableOnnxNormalization: 'string'
evaluationFrequency: 'string'
gradientAccumulationStep: 'string'
imageSize: 'string'
layersToFreeze: 'string'
learningRate: 'string'
learningRateScheduler: 'string'
maxSize: 'string'
minSize: 'string'
modelName: 'string'
modelSize: 'string'
momentum: 'string'
multiScale: 'string'
nesterov: 'string'
nmsIouThreshold: 'string'
numberOfEpochs: 'string'
numberOfWorkers: 'string'
optimizer: 'string'
randomSeed: 'string'
stepLRGamma: 'string'
stepLRStepSize: 'string'
tileGridSize: 'string'
tileOverlapRatio: 'string'
tilePredictionsNmsThreshold: 'string'
trainingBatchSize: 'string'
validationBatchSize: 'string'
validationIouThreshold: 'string'
validationMetricType: 'string'
warmupCosineLRCycles: 'string'
warmupCosineLRWarmupEpochs: 'string'
weightDecay: 'string'
}
]
sweepSettings: {
earlyTermination: {
delayEvaluation: int
evaluationInterval: int
policyType: 'string'
// For remaining properties, see EarlyTerminationPolicy objects
}
samplingAlgorithm: 'string'
}
taskType: 'ImageInstanceSegmentation'
validationData: {
description: 'string'
jobInputType: 'string'
mode: 'string'
uri: 'string'
}
validationDataSize: int
}
对于 ImageObjectDetection,请使用:
{
limitSettings: {
maxConcurrentTrials: int
maxTrials: int
timeout: 'string'
}
modelSettings: {
advancedSettings: 'string'
amsGradient: bool
augmentations: 'string'
beta1: int
beta2: int
boxDetectionsPerImage: int
boxScoreThreshold: int
checkpointFrequency: int
checkpointModel: {
description: 'string'
jobInputType: 'string'
mode: 'string'
uri: 'string'
}
checkpointRunId: 'string'
distributed: bool
earlyStopping: bool
earlyStoppingDelay: int
earlyStoppingPatience: int
enableOnnxNormalization: bool
evaluationFrequency: int
gradientAccumulationStep: int
imageSize: int
layersToFreeze: int
learningRate: int
learningRateScheduler: 'string'
maxSize: int
minSize: int
modelName: 'string'
modelSize: 'string'
momentum: int
multiScale: bool
nesterov: bool
nmsIouThreshold: int
numberOfEpochs: int
numberOfWorkers: int
optimizer: 'string'
randomSeed: int
stepLRGamma: int
stepLRStepSize: int
tileGridSize: 'string'
tileOverlapRatio: int
tilePredictionsNmsThreshold: int
trainingBatchSize: int
validationBatchSize: int
validationIouThreshold: int
validationMetricType: 'string'
warmupCosineLRCycles: int
warmupCosineLRWarmupEpochs: int
weightDecay: int
}
primaryMetric: 'string'
searchSpace: [
{
amsGradient: 'string'
augmentations: 'string'
beta1: 'string'
beta2: 'string'
boxDetectionsPerImage: 'string'
boxScoreThreshold: 'string'
distributed: 'string'
earlyStopping: 'string'
earlyStoppingDelay: 'string'
earlyStoppingPatience: 'string'
enableOnnxNormalization: 'string'
evaluationFrequency: 'string'
gradientAccumulationStep: 'string'
imageSize: 'string'
layersToFreeze: 'string'
learningRate: 'string'
learningRateScheduler: 'string'
maxSize: 'string'
minSize: 'string'
modelName: 'string'
modelSize: 'string'
momentum: 'string'
multiScale: 'string'
nesterov: 'string'
nmsIouThreshold: 'string'
numberOfEpochs: 'string'
numberOfWorkers: 'string'
optimizer: 'string'
randomSeed: 'string'
stepLRGamma: 'string'
stepLRStepSize: 'string'
tileGridSize: 'string'
tileOverlapRatio: 'string'
tilePredictionsNmsThreshold: 'string'
trainingBatchSize: 'string'
validationBatchSize: 'string'
validationIouThreshold: 'string'
validationMetricType: 'string'
warmupCosineLRCycles: 'string'
warmupCosineLRWarmupEpochs: 'string'
weightDecay: 'string'
}
]
sweepSettings: {
earlyTermination: {
delayEvaluation: int
evaluationInterval: int
policyType: 'string'
// For remaining properties, see EarlyTerminationPolicy objects
}
samplingAlgorithm: 'string'
}
taskType: 'ImageObjectDetection'
validationData: {
description: 'string'
jobInputType: 'string'
mode: 'string'
uri: 'string'
}
validationDataSize: int
}
对于 回归,请使用:
{
cvSplitColumnNames: [
'string'
]
featurizationSettings: {
blockedTransformers: [
'string'
]
columnNameAndTypes: {
{customized property}: 'string'
}
datasetLanguage: 'string'
enableDnnFeaturization: bool
mode: 'string'
transformerParams: {
{customized property}: [
{
fields: [
'string'
]
parameters: any(...)
}
]
}
}
fixedParameters: {
booster: 'string'
boostingType: 'string'
growPolicy: 'string'
learningRate: int
maxBin: int
maxDepth: int
maxLeaves: int
minDataInLeaf: int
minSplitGain: int
modelName: 'string'
nEstimators: int
numLeaves: int
preprocessorName: 'string'
regAlpha: int
regLambda: int
subsample: int
subsampleFreq: int
treeMethod: 'string'
withMean: bool
withStd: bool
}
limitSettings: {
enableEarlyTermination: bool
exitScore: int
maxConcurrentTrials: int
maxCoresPerTrial: int
maxTrials: int
sweepConcurrentTrials: int
sweepTrials: int
timeout: 'string'
trialTimeout: 'string'
}
nCrossValidations: {
mode: 'string'
// For remaining properties, see NCrossValidations objects
}
primaryMetric: 'string'
searchSpace: [
{
booster: 'string'
boostingType: 'string'
growPolicy: 'string'
learningRate: 'string'
maxBin: 'string'
maxDepth: 'string'
maxLeaves: 'string'
minDataInLeaf: 'string'
minSplitGain: 'string'
modelName: 'string'
nEstimators: 'string'
numLeaves: 'string'
preprocessorName: 'string'
regAlpha: 'string'
regLambda: 'string'
subsample: 'string'
subsampleFreq: 'string'
treeMethod: 'string'
withMean: 'string'
withStd: 'string'
}
]
sweepSettings: {
earlyTermination: {
delayEvaluation: int
evaluationInterval: int
policyType: 'string'
// For remaining properties, see EarlyTerminationPolicy objects
}
samplingAlgorithm: 'string'
}
taskType: 'Regression'
testData: {
description: 'string'
jobInputType: 'string'
mode: 'string'
uri: 'string'
}
testDataSize: int
trainingSettings: {
allowedTrainingAlgorithms: [
'string'
]
blockedTrainingAlgorithms: [
'string'
]
enableDnnTraining: bool
enableModelExplainability: bool
enableOnnxCompatibleModels: bool
enableStackEnsemble: bool
enableVoteEnsemble: bool
ensembleModelDownloadTimeout: 'string'
stackEnsembleSettings: {
stackMetaLearnerKWargs: any(...)
stackMetaLearnerTrainPercentage: int
stackMetaLearnerType: 'string'
}
}
validationData: {
description: 'string'
jobInputType: 'string'
mode: 'string'
uri: 'string'
}
validationDataSize: int
weightColumnName: 'string'
}
对于 TextClassification,请使用:
{
featurizationSettings: {
datasetLanguage: 'string'
}
fixedParameters: {
gradientAccumulationSteps: int
learningRate: int
learningRateScheduler: 'string'
modelName: 'string'
numberOfEpochs: int
trainingBatchSize: int
validationBatchSize: int
warmupRatio: int
weightDecay: int
}
limitSettings: {
maxConcurrentTrials: int
maxNodes: int
maxTrials: int
timeout: 'string'
trialTimeout: 'string'
}
primaryMetric: 'string'
searchSpace: [
{
gradientAccumulationSteps: 'string'
learningRate: 'string'
learningRateScheduler: 'string'
modelName: 'string'
numberOfEpochs: 'string'
trainingBatchSize: 'string'
validationBatchSize: 'string'
warmupRatio: 'string'
weightDecay: 'string'
}
]
sweepSettings: {
earlyTermination: {
delayEvaluation: int
evaluationInterval: int
policyType: 'string'
// For remaining properties, see EarlyTerminationPolicy objects
}
samplingAlgorithm: 'string'
}
taskType: 'TextClassification'
validationData: {
description: 'string'
jobInputType: 'string'
mode: 'string'
uri: 'string'
}
}
对于 TextClassificationMultilabel,请使用:
{
featurizationSettings: {
datasetLanguage: 'string'
}
fixedParameters: {
gradientAccumulationSteps: int
learningRate: int
learningRateScheduler: 'string'
modelName: 'string'
numberOfEpochs: int
trainingBatchSize: int
validationBatchSize: int
warmupRatio: int
weightDecay: int
}
limitSettings: {
maxConcurrentTrials: int
maxNodes: int
maxTrials: int
timeout: 'string'
trialTimeout: 'string'
}
searchSpace: [
{
gradientAccumulationSteps: 'string'
learningRate: 'string'
learningRateScheduler: 'string'
modelName: 'string'
numberOfEpochs: 'string'
trainingBatchSize: 'string'
validationBatchSize: 'string'
warmupRatio: 'string'
weightDecay: 'string'
}
]
sweepSettings: {
earlyTermination: {
delayEvaluation: int
evaluationInterval: int
policyType: 'string'
// For remaining properties, see EarlyTerminationPolicy objects
}
samplingAlgorithm: 'string'
}
taskType: 'TextClassificationMultilabel'
validationData: {
description: 'string'
jobInputType: 'string'
mode: 'string'
uri: 'string'
}
}
对于 TextNER,请使用:
{
featurizationSettings: {
datasetLanguage: 'string'
}
fixedParameters: {
gradientAccumulationSteps: int
learningRate: int
learningRateScheduler: 'string'
modelName: 'string'
numberOfEpochs: int
trainingBatchSize: int
validationBatchSize: int
warmupRatio: int
weightDecay: int
}
limitSettings: {
maxConcurrentTrials: int
maxNodes: int
maxTrials: int
timeout: 'string'
trialTimeout: 'string'
}
searchSpace: [
{
gradientAccumulationSteps: 'string'
learningRate: 'string'
learningRateScheduler: 'string'
modelName: 'string'
numberOfEpochs: 'string'
trainingBatchSize: 'string'
validationBatchSize: 'string'
warmupRatio: 'string'
weightDecay: 'string'
}
]
sweepSettings: {
earlyTermination: {
delayEvaluation: int
evaluationInterval: int
policyType: 'string'
// For remaining properties, see EarlyTerminationPolicy objects
}
samplingAlgorithm: 'string'
}
taskType: 'TextNER'
validationData: {
description: 'string'
jobInputType: 'string'
mode: 'string'
uri: 'string'
}
}
TargetLags 对象
设置 模式 属性以指定对象的类型。
对于 自动,请使用:
{
mode: 'Auto'
}
对于 “自定义”,请使用:
{
mode: 'Custom'
values: [
int
]
}
LabelingJobMediaProperties 对象
设置 mediaType 属性以指定对象的类型。
对于 映像,请使用:
{
annotationType: 'string'
mediaType: 'Image'
}
对于 文本,请使用:
{
annotationType: 'string'
mediaType: 'Text'
}
JobInput 对象
设置 jobInputType 属性以指定对象的类型。
对于 custom_model,请使用:
{
jobInputType: 'custom_model'
mode: 'string'
uri: 'string'
}
对于 文本,请使用:
{
jobInputType: 'literal'
value: 'string'
}
对于 mlflow_model,请使用:
{
jobInputType: 'mlflow_model'
mode: 'string'
uri: 'string'
}
对于 mltable,请使用:
{
jobInputType: 'mltable'
mode: 'string'
uri: 'string'
}
对于 triton_model,请使用:
{
jobInputType: 'triton_model'
mode: 'string'
uri: 'string'
}
对于 uri_file,请使用:
{
jobInputType: 'uri_file'
mode: 'string'
uri: 'string'
}
对于 uri_folder,请使用:
{
jobInputType: 'uri_folder'
mode: 'string'
uri: 'string'
}
JobBaseProperties 对象
设置 jobType 属性以指定对象的类型。
对于 AutoML,请使用:
{
environmentId: 'string'
environmentVariables: {
{customized property}: 'string'
}
jobType: 'AutoML'
outputs: {
{customized property}: {
description: 'string'
jobOutputType: 'string'
// For remaining properties, see JobOutput objects
}
}
resources: {
dockerArgs: 'string'
instanceCount: int
instanceType: 'string'
properties: {
{customized property}: any(...)
}
shmSize: 'string'
}
taskDetails: {
logVerbosity: 'string'
targetColumnName: 'string'
trainingData: {
description: 'string'
jobInputType: 'string'
mode: 'string'
uri: 'string'
}
taskType: 'string'
// For remaining properties, see AutoMLVertical objects
}
}
对于 命令,请使用:
{
autologgerSettings: {
mlflowAutologger: 'string'
}
codeId: 'string'
command: 'string'
distribution: {
distributionType: 'string'
// For remaining properties, see DistributionConfiguration objects
}
environmentId: 'string'
environmentVariables: {
{customized property}: 'string'
}
inputs: {
{customized property}: {
description: 'string'
jobInputType: 'string'
// For remaining properties, see JobInput objects
}
}
jobType: 'Command'
limits: {
jobLimitsType: 'string'
timeout: 'string'
}
outputs: {
{customized property}: {
description: 'string'
jobOutputType: 'string'
// For remaining properties, see JobOutput objects
}
}
resources: {
dockerArgs: 'string'
instanceCount: int
instanceType: 'string'
properties: {
{customized property}: any(...)
}
shmSize: 'string'
}
}
对于 标记,请使用:
{
dataConfiguration: {
dataId: 'string'
incrementalDataRefreshEnabled: bool
}
jobInstructions: {
uri: 'string'
}
jobType: 'Labeling'
labelCategories: {
{customized property}: {
classes: {
{customized property}: {
displayName: 'string'
subclasses: {
{customized property}: ...
}
}
}
displayName: 'string'
multiSelectEnabled: bool
}
}
labelingJobMediaProperties: {
mediaType: 'string'
// For remaining properties, see LabelingJobMediaProperties objects
}
mlAssistConfiguration: {
mlAssist: 'string'
// For remaining properties, see MLAssistConfiguration objects
}
}
对于 管道,请使用:
{
inputs: {
{customized property}: {
description: 'string'
jobInputType: 'string'
// For remaining properties, see JobInput objects
}
}
jobs: {
{customized property}: any(...)
}
jobType: 'Pipeline'
outputs: {
{customized property}: {
description: 'string'
jobOutputType: 'string'
// For remaining properties, see JobOutput objects
}
}
settings: any(...)
sourceJobId: 'string'
}
对于 Spark,请使用:
{
archives: [
'string'
]
args: 'string'
codeId: 'string'
conf: {
{customized property}: 'string'
}
entry: {
sparkJobEntryType: 'string'
// For remaining properties, see SparkJobEntry objects
}
environmentId: 'string'
files: [
'string'
]
inputs: {
{customized property}: {
description: 'string'
jobInputType: 'string'
// For remaining properties, see JobInput objects
}
}
jars: [
'string'
]
jobType: 'Spark'
outputs: {
{customized property}: {
description: 'string'
jobOutputType: 'string'
// For remaining properties, see JobOutput objects
}
}
pyFiles: [
'string'
]
resources: {
instanceType: 'string'
runtimeVersion: 'string'
}
}
对于 扫描,请使用:
{
earlyTermination: {
delayEvaluation: int
evaluationInterval: int
policyType: 'string'
// For remaining properties, see EarlyTerminationPolicy objects
}
inputs: {
{customized property}: {
description: 'string'
jobInputType: 'string'
// For remaining properties, see JobInput objects
}
}
jobType: 'Sweep'
limits: {
jobLimitsType: 'string'
maxConcurrentTrials: int
maxTotalTrials: int
timeout: 'string'
trialTimeout: 'string'
}
objective: {
goal: 'string'
primaryMetric: 'string'
}
outputs: {
{customized property}: {
description: 'string'
jobOutputType: 'string'
// For remaining properties, see JobOutput objects
}
}
samplingAlgorithm: {
samplingAlgorithmType: 'string'
// For remaining properties, see SamplingAlgorithm objects
}
searchSpace: any(...)
trial: {
codeId: 'string'
command: 'string'
distribution: {
distributionType: 'string'
// For remaining properties, see DistributionConfiguration objects
}
environmentId: 'string'
environmentVariables: {
{customized property}: 'string'
}
resources: {
dockerArgs: 'string'
instanceCount: int
instanceType: 'string'
properties: {
{customized property}: any(...)
}
shmSize: 'string'
}
}
}
节点对象
设置 nodesValueType 属性以指定对象的类型。
对于 “全部”,请使用:
{
nodesValueType: 'All'
}
SamplingAlgorithm 对象
设置 samplingAlgorithmType 属性以指定对象的类型。
对于 Bayesian,请使用:
{
samplingAlgorithmType: 'Bayesian'
}
对于 网格,请使用:
{
samplingAlgorithmType: 'Grid'
}
对于 Random,请使用:
{
rule: 'string'
samplingAlgorithmType: 'Random'
seed: int
}
NCrossValidations 对象
设置 模式 属性以指定对象的类型。
对于 自动,请使用:
{
mode: 'Auto'
}
对于 “自定义”,请使用:
{
mode: 'Custom'
value: int
}
属性值
Microsoft.MachineLearningServices/workspaces/jobs
名称 | DESCRIPTION | 价值 |
---|---|---|
姓名 | 资源名称 | 字符串 约束: 模式 = ^[a-zA-Z0-9][a-zA-Z0-9\-_]{0,254}$ (必需) |
父级 | 在 Bicep 中,可以为子资源指定父资源。 仅当子资源在父资源外部声明时,才需要添加此属性。 有关详细信息,请参阅 父资源外部的子资源。 |
类型资源的符号名称: 工作区 |
属性 | [必需]实体的其他属性。 | JobBaseProperties (必需) |
所有节点
名称 | DESCRIPTION | 价值 |
---|---|---|
nodesValueType | [必需]Nodes 值的类型 | “全部”(必需) |
AmlToken
名称 | DESCRIPTION | 价值 |
---|---|---|
身份类型 | [必需]指定标识框架的类型。 | “AMLToken”(必需) |
自动预测地平线
名称 | DESCRIPTION | 价值 |
---|---|---|
模式 | [必需]设置预测地平线值选择模式。 | “Auto”(必需) |
Autologger 设置
名称 | DESCRIPTION | 价值 |
---|---|---|
mlflow自动记录器 | [必需]指示是否启用 mlflow 自动记录器。 | “Disabled” “Enabled”(必需) |
AutoMLJob
名称 | DESCRIPTION | 价值 |
---|---|---|
环境 ID | 作业的环境规范的 ARM 资源 ID。 这是一个可选值,如果未提供,AutoML 将在运行作业时将其默认为生产 AutoML 特选环境版本。 |
字符串 |
环境变量 | 作业中包含的环境变量。 | AutoMLJobEnvironmentVariables |
职位类型 | [必需]指定作业的类型。 | “AutoML”(必需) |
输出 | 作业中使用的输出数据绑定的映射。 | AutoMLJob 输出 |
资源 | 作业的计算资源配置。 | JobResourceConfiguration |
taskDetails | [必需]这表示可以是表/NLP/Image 之一的方案 | AutoMLVertical (必需) |
AutoMLJobEnvironmentVariables
名称 | DESCRIPTION | 价值 |
---|
AutoMLJob 输出
名称 | DESCRIPTION | 价值 |
---|
AutoMLVertical
名称 | DESCRIPTION | 价值 |
---|---|---|
logVerbosity (对数详细程度) | 作业的详细记录。 | “Critical” “Debug” “Error” “Info” “NotSet” “Warning” |
targetColumnName | 目标列名称:这是预测值列。 也称为分类任务的上下文中的标签列名称。 |
字符串 |
任务类型 | 设置为类型 “分类”的“分类”。 设置为“ 预测”类型。 设置为 ImageClassification 类型的“ImageClassification”。 设置为 ImageClassificationMultilabel 类型的“ImageClassificationMultilabel”。 设置为 ImageInstanceSegmentation 类型的“ImageInstanceSegmentation”。 设置为 ImageObjectDetection 类型的“ImageObjectDetection”。 设置为“ 回归”类型。 设置为 TextClassification 类型的“TextClassification”。 对于 TextClassificationMultilabel,设置为“TextClassificationMultilabel”。 设置为 TextNer 类型的“TextNER”。 | “Classification” “预测” “ImageClassification” “ImageClassificationMultilabel” “ImageInstanceSegmentation” “ImageObjectDetection” “回归” “TextClassification” “TextClassificationMultilabel” “TextNER”(必需) |
trainingData (训练数据) | [必需]训练数据输入。 | MLTableJobInput (必需) |
AutoNCross验证
名称 | DESCRIPTION | 价值 |
---|---|---|
模式 | [必需]用于确定 N 交叉验证的模式。 | “Auto”(必需) |
自动季节性
名称 | DESCRIPTION | 价值 |
---|---|---|
模式 | [必需]季节性模式。 | “Auto”(必需) |
AutoTargetLags 自动目标滞后
名称 | DESCRIPTION | 价值 |
---|---|---|
模式 | [必需]设置目标滞后模式 - 自动/自定义 | “Auto”(必需) |
AutoTargetRollingWindowSize (自动目标滚动窗口大小)
名称 | DESCRIPTION | 价值 |
---|---|---|
模式 | [必需]TargetRollingWindowSiz 检测模式。 | “Auto”(必需) |
BanditPolicy (强盗政策)
名称 | DESCRIPTION | 价值 |
---|---|---|
policyType | [必需]策略配置的名称 | “强盗”(必需) |
slackAmount | 从性能最佳的运行中允许的绝对距离。 | 整数 (int) |
slackFactor 的 | 与性能最佳的运行距离的允许距离比率。 | 整数 (int) |
BayesianSamplingAlgorithm
名称 | DESCRIPTION | 价值 |
---|---|---|
采样算法类型 | [必需]用于生成超参数值的算法以及配置属性 | “贝伊西亚”(必需) |
分类
名称 | DESCRIPTION | 价值 |
---|---|---|
cvSplitColumnNames | 用于 CVSplit 数据的列。 | 字符串[] |
featurizationSettings | AutoML 作业所需的特征化输入。 | TableVerticalFeaturizationSettings |
固定参数 | 在整个训练过程中将保持不变的模型/训练参数。 | TableFixedParameters (表固定参数) |
limitSettings | AutoMLJob 的执行约束。 | TableVerticalLimitSettings |
nCrossValidations | 要应用于训练数据集的交叉验证折叠数 如果未提供验证数据集,则为 。 |
NCross验证 |
积极标签 | 二进制指标计算的正标签。 | 字符串 |
primaryMetric | 任务的主要指标。 | “准确性” “AUCWeighted” “AveragePrecisionScoreWeighted” “NormMacroRecall” “PrecisionScoreWeighted” |
搜索空间 | 用于采样模型及其超参数的不同组合的搜索空间。 | TableParameterSubspace[] |
扫描设置 | 模型扫描和超参数优化的设置。 | TableSweepSettings (表格扫描设置) |
任务类型 | [必需]AutoMLJob 的任务类型。 | “分类”(必需) |
测试数据 | 测试数据输入。 | MLTableJobInput |
testDataSize | 需要为验证目的预留的测试数据集的分数。 介于 (0.0、 1.0) 之间的值 未提供验证数据集时应用。 |
整数 (int) |
trainingSettings | AutoML 作业训练阶段的输入。 | 分类训练设置 |
validationData (验证数据) | 验证数据输入。 | MLTableJobInput |
validationDataSize | 需要留出用于验证的定型数据集的分数。 介于 (0.0、 1.0) 之间的值 未提供验证数据集时应用。 |
整数 (int) |
权重列名称 | 示例权重列的名称。 自动化 ML 支持加权列作为输入,导致数据中的行向上或向下加权。 | 字符串 |
分类训练设置
名称 | DESCRIPTION | 价值 |
---|---|---|
allowedTrainingAlgorithms | 分类任务的允许模型。 | 包含任一项的字符串数组: “BernoulliNaiveBayes” “DecisionTree” “ExtremeRandomTrees” “GradientBoosting” “KNN” “LightGBM” “LinearSVM” “LogisticRegression” “MultinomialNaiveBayes” “RandomForest” “ZN” “SVM” “XGBoostClassifier” |
blockedTrainingAlgorithms | 分类任务的阻止模型。 | 包含任一项的字符串数组: “BernoulliNaiveBayes” “DecisionTree” “ExtremeRandomTrees” “GradientBoosting” “KNN” “LightGBM” “LinearSVM” “LogisticRegression” “MultinomialNaiveBayes” “RandomForest” “ZN” “SVM” “XGBoostClassifier” |
enableDnnTraining | 启用 DNN 模型的建议。 | 布尔 |
enableModelExplainability | 标志以在最佳模型上启用可解释性。 | 布尔 |
enableOnnxCompatibleModels | 用于启用 onnx 兼容模型的标志。 | 布尔 |
enableStackEnsemble | 启用堆栈合奏运行。 | 布尔 |
enableVoteEnsemble | 启用投票合奏运行。 | 布尔 |
ensembleModelDownloadTimeout | 在 VotingEnsemble 和 StackEnsemble 模型生成期间,将下载先前子运行中的多个拟合模型。 如果需要更多时间,请将此参数配置为大于 300 秒的值。 |
字符串 |
stackEnsembleSettings | 堆栈合奏的堆栈合奏设置。 | StackEnsembleSettings |
ColumnTransformer (列变换器)
名称 | DESCRIPTION | 价值 |
---|---|---|
字段 | 要应用转换器逻辑的字段。 | 字符串[] |
参数 | 要传递给转换器的不同属性。 输入应为 JSON 格式的键值对字典。 |
任何 |
CommandJob
名称 | DESCRIPTION | 价值 |
---|---|---|
autologger设置 | 作业的分发配置。 如果已设置,则应为 Mpi、Tensorflow、PyTorch 或 null 之一。 | Autologger 设置 |
代码 Id | 代码资产的 ARM 资源 ID。 | 字符串 |
指令 | [必需]在启动作业时执行的命令。 例如 “python train.py” | 字符串 约束: 最小长度 = 1 模式 = [a-zA-Z0-9_] (必需) |
分配 | 作业的分发配置。 如果已设置,则应为 Mpi、Tensorflow、PyTorch 或 null 之一。 | 分发配置 |
环境 ID | [必需]作业的环境规范的 ARM 资源 ID。 | 字符串 约束: 模式 = [a-zA-Z0-9_] (必需) |
环境变量 | 作业中包含的环境变量。 | CommandJobEnvironmentVariables |
输入 | 作业中使用的输入数据绑定的映射。 | CommandJobInputs 命令作业输入 |
职位类型 | [必需]指定作业的类型。 | “Command”(必需) |
限制 | 命令作业限制。 | CommandJobLimits 命令作业限制 |
输出 | 作业中使用的输出数据绑定的映射。 | CommandJobOutputs 命令作业输出 |
资源 | 作业的计算资源配置。 | JobResourceConfiguration |
CommandJobEnvironmentVariables
名称 | DESCRIPTION | 价值 |
---|
CommandJobInputs 命令作业输入
名称 | DESCRIPTION | 价值 |
---|
CommandJobLimits 命令作业限制
名称 | DESCRIPTION | 价值 |
---|---|---|
jobLimits类型 | [必需]JobLimit 类型。 | “Command” “扫描”(必需) |
超时 | ISO 8601 格式的最大运行持续时间,之后作业将被取消。 仅支持精度为秒的持续时间。 | 字符串 |
CommandJobOutputs 命令作业输出
名称 | DESCRIPTION | 价值 |
---|
CustomForecastHorizon
名称 | DESCRIPTION | 价值 |
---|---|---|
模式 | [必需]设置预测地平线值选择模式。 | “Custom”(必需) |
价值 | [必需]预测地平线值。 | int (必需) |
CustomModelJobInput (自定义模型作业输入)
名称 | DESCRIPTION | 价值 |
---|---|---|
jobInputType (作业输入类型) | [必需]指定作业的类型。 | “custom_model”(必需) |
模式 | 输入资产传送模式。 | “Direct” “下载” “EvalDownload” “EvalMount” “ReadOnlyMount” “ReadWriteMount” |
URI | [必需]输入资产 URI。 | 字符串 约束: 模式 = [a-zA-Z0-9_] (必需) |
CustomModelJobOutput
名称 | DESCRIPTION | 价值 |
---|---|---|
jobOutputType | [必需]指定作业的类型。 | “custom_model”(必需) |
模式 | 输出资产传送模式。 | “Direct” “ReadWriteMount” “Upload” |
URI | 输出资产 URI。 | 字符串 |
CustomNCross验证
名称 | DESCRIPTION | 价值 |
---|---|---|
模式 | [必需]用于确定 N 交叉验证的模式。 | “Custom”(必需) |
价值 | [必需]N 交叉验证值。 | int (必需) |
CustomSeasonality (自定义季节性)
名称 | DESCRIPTION | 价值 |
---|---|---|
模式 | [必需]季节性模式。 | “Custom”(必需) |
价值 | [必需]季节性值。 | int (必需) |
CustomTargetLags (自定义目标滞后)
名称 | DESCRIPTION | 价值 |
---|---|---|
模式 | [必需]设置目标滞后模式 - 自动/自定义 | “Custom”(必需) |
价值, 价值观 | [必需]设置目标滞后值。 | int[] (必需) |
CustomTargetRollingWindowSize
名称 | DESCRIPTION | 价值 |
---|---|---|
模式 | [必需]TargetRollingWindowSiz 检测模式。 | “Custom”(必需) |
价值 | [必需]TargetRollingWindowSize 值。 | int (必需) |
分发配置
名称 | DESCRIPTION | 价值 |
---|---|---|
distributionType | 对于 Mpi 类型,设置为“ Mpi”。 对于 PyTorch 类型,设置为“ PyTorch”。 设置为 TensorFlow 类型的“TensorFlow”。 | “Mpi” “PyTorch” “TensorFlow”(必需) |
提前终止政策
名称 | DESCRIPTION | 价值 |
---|---|---|
delay评估 | 延迟第一次计算的间隔数。 | 整数 (int) |
evaluationInterval | 策略评估之间的间隔(运行数)。 | 整数 (int) |
policyType | 设置为“ BanditPolicy”类型为“BanditPolicy”。 对于 MedianStoppingPolicy,设置为“MedianStoppingPolicy”。 对于 TruncationSelectionPolicy 类型,设置为“TruncationSelection”。 | “Bandit” “MedianStopping” “TruncationSelection”(必需) |
预测地平线
名称 | DESCRIPTION | 价值 |
---|---|---|
模式 | 设置为“ AutoForecastHorizon”类型。 设置为 CustomForecastHorizon 类型的“Custom”。 | “Auto” “Custom”(必需) |
预测
名称 | DESCRIPTION | 价值 |
---|---|---|
cvSplitColumnNames | 用于 CVSplit 数据的列。 | 字符串[] |
featurizationSettings | AutoML 作业所需的特征化输入。 | TableVerticalFeaturizationSettings |
固定参数 | 在整个训练过程中将保持不变的模型/训练参数。 | TableFixedParameters (表固定参数) |
forecasting设置 | 预测任务特定的输入。 | ForecastingSettings |
limitSettings | AutoMLJob 的执行约束。 | TableVerticalLimitSettings |
nCrossValidations | 要应用于训练数据集的交叉验证折叠数 如果未提供验证数据集,则为 。 |
NCross验证 |
primaryMetric | 预测任务的主要指标。 | “NormalizedMeanAbsoluteError” “NormalizedRootMeanSquaredError” “R2Score” 'SpearmanCorrelation' |
搜索空间 | 用于采样模型及其超参数的不同组合的搜索空间。 | TableParameterSubspace[] |
扫描设置 | 模型扫描和超参数优化的设置。 | TableSweepSettings (表格扫描设置) |
任务类型 | [必需]AutoMLJob 的任务类型。 | “预测”(必需) |
测试数据 | 测试数据输入。 | MLTableJobInput |
testDataSize | 需要为验证目的预留的测试数据集的分数。 介于 (0.0、 1.0) 之间的值 未提供验证数据集时应用。 |
整数 (int) |
trainingSettings | AutoML 作业训练阶段的输入。 | ForecastingTrainingSettings |
validationData (验证数据) | 验证数据输入。 | MLTableJobInput |
validationDataSize | 需要留出用于验证的定型数据集的分数。 介于 (0.0、 1.0) 之间的值 未提供验证数据集时应用。 |
整数 (int) |
权重列名称 | 示例权重列的名称。 自动化 ML 支持加权列作为输入,导致数据中的行向上或向下加权。 | 字符串 |
ForecastingSettings
名称 | DESCRIPTION | 价值 |
---|---|---|
国家/地区或地区为假期 | 用于预测任务的假日国家或地区。 这些代码应为 ISO 3166 双字母国家/地区代码,例如“US”或“GB”。 |
字符串 |
cvStepSize | 一个 CV 折叠的起始时间与下一个折叠之间的句点数。 为 例如,如果 CVStepSize = 3 表示每日数据,则每个折叠的源时间将为三天相隔。 |
整数 (int) |
featureLags | 使用“auto”或 null 为数值特征生成滞后的标志。 | “Auto” “None” |
forecastHorizon (预测地平线) | 所需最大预测范围(以时序频率单位为单位)。 | 预测地平线 |
频率 | 预测时,此参数表示需要预测的时间段,例如每日、每周、每年等。默认情况下,预测频率为数据集频率。 | 字符串 |
季节性 | 将时序季节性设置为序列频率的整数倍数。 如果季节性设置为“auto”,则会推断它。 |
季节性 |
shortSeriesHandlingConfig | 定义 AutoML 如何处理短时序的参数。 | “Auto” “掉落” “None” “Pad” |
targetAggregateFunction | 用于聚合符合用户指定频率的时序目标列的函数。 如果设置了 TargetAggregateFunction,即不是“None”,但未设置 freq 参数,则会引发错误。 可能的目标聚合函数包括:“sum”、“max”、“min”和“mean”。 |
“Max” “Mean” “Min” “None” “Sum” |
目标拉格 | 要从目标列滞后的过去时间段数。 | 目标滞后 |
targetRollingWindowSize | 用于创建目标列的滚动窗口平均值的过去时间段数。 | TargetRollingWindowSize |
timeColumnName (时间列名称) | 时间列的名称。 当预测在用于生成时序并推断其频率的输入数据中指定日期/时间列时,此参数是必需的。 | 字符串 |
timeSeriesIdColumnNames | 用于对时间序列进行分组的列的名称。 它可用于创建多个序列。 如果未定义粒度,则假定数据集为一个时序。 此参数用于任务类型预测。 |
字符串[] |
useStl | 配置时序目标列的 STL 分解。 | “None” “季度” “SeasonTrend” |
ForecastingTrainingSettings
名称 | DESCRIPTION | 价值 |
---|---|---|
allowedTrainingAlgorithms | 允许用于预测任务的模型。 | 包含任一项的字符串数组: “Arimax” “AutoArima” “Average” “DecisionTree” “ElasticNet” “ExponentialSmoothing” “ExtremeRandomTrees” “GradientBoosting” “KNN” “LassoLars” “LightGBM” “Naive” “先知” “RandomForest” “SeasonalAverage” “SeasonalNaive” “ZN” “TCNForecaster” “XGBoostRegressor” |
blockedTrainingAlgorithms | 用于预测任务的阻止模型。 | 包含任一项的字符串数组: “Arimax” “AutoArima” “Average” “DecisionTree” “ElasticNet” “ExponentialSmoothing” “ExtremeRandomTrees” “GradientBoosting” “KNN” “LassoLars” “LightGBM” “Naive” “先知” “RandomForest” “SeasonalAverage” “SeasonalNaive” “ZN” “TCNForecaster” “XGBoostRegressor” |
enableDnnTraining | 启用 DNN 模型的建议。 | 布尔 |
enableModelExplainability | 标志以在最佳模型上启用可解释性。 | 布尔 |
enableOnnxCompatibleModels | 用于启用 onnx 兼容模型的标志。 | 布尔 |
enableStackEnsemble | 启用堆栈合奏运行。 | 布尔 |
enableVoteEnsemble | 启用投票合奏运行。 | 布尔 |
ensembleModelDownloadTimeout | 在 VotingEnsemble 和 StackEnsemble 模型生成期间,将下载先前子运行中的多个拟合模型。 如果需要更多时间,请将此参数配置为大于 300 秒的值。 |
字符串 |
stackEnsembleSettings | 堆栈合奏的堆栈合奏设置。 | StackEnsembleSettings |
GridSampling算法
名称 | DESCRIPTION | 价值 |
---|---|---|
采样算法类型 | [必需]用于生成超参数值的算法以及配置属性 | “Grid”(必需) |
身份配置
名称 | DESCRIPTION | 价值 |
---|---|---|
身份类型 | 对于 AmlToken 类型,设置为“AMLToken”。 设置为 “ManagedIdentity”类型。 对于 UserIdentity 类型,设置为“UserIdentity”。 | “AMLToken” “Managed” “UserIdentity”(必需) |
图像分类
名称 | DESCRIPTION | 价值 |
---|---|---|
limitSettings | [必需]限制 AutoML 作业的设置。 | ImageLimitSettings (必需) |
modelSettings | 用于训练模型的设置。 | ImageModelSettings分类 |
primaryMetric | 要针对此任务进行优化的主要指标。 | “准确性” “AUCWeighted” “AveragePrecisionScoreWeighted” “NormMacroRecall” “PrecisionScoreWeighted” |
搜索空间 | 用于采样模型及其超参数的不同组合的搜索空间。 | ImageModelDistributionSettingsClassification[] |
扫描设置 | 模型扫描和超参数扫描相关设置。 | ImageSweepSettings (图像扫描设置) |
任务类型 | [必需]AutoMLJob 的任务类型。 | “ImageClassification”(必需) |
validationData (验证数据) | 验证数据输入。 | MLTableJobInput |
validationDataSize | 需要留出用于验证的定型数据集的分数。 介于 (0.0、 1.0) 之间的值 未提供验证数据集时应用。 |
整数 (int) |
ImageClassificationMultilabel
名称 | DESCRIPTION | 价值 |
---|---|---|
limitSettings | [必需]限制 AutoML 作业的设置。 | ImageLimitSettings (必需) |
modelSettings | 用于训练模型的设置。 | ImageModelSettings分类 |
primaryMetric | 要针对此任务进行优化的主要指标。 | “准确性” “AUCWeighted” “AveragePrecisionScoreWeighted” “IOU” “NormMacroRecall” “PrecisionScoreWeighted” |
搜索空间 | 用于采样模型及其超参数的不同组合的搜索空间。 | ImageModelDistributionSettingsClassification[] |
扫描设置 | 模型扫描和超参数扫描相关设置。 | ImageSweepSettings (图像扫描设置) |
任务类型 | [必需]AutoMLJob 的任务类型。 | “ImageClassificationMultilabel”(必需) |
validationData (验证数据) | 验证数据输入。 | MLTableJobInput |
validationDataSize | 需要留出用于验证的定型数据集的分数。 介于 (0.0、 1.0) 之间的值 未提供验证数据集时应用。 |
整数 (int) |
ImageInstanceSegmentation
名称 | DESCRIPTION | 价值 |
---|---|---|
limitSettings | [必需]限制 AutoML 作业的设置。 | ImageLimitSettings (必需) |
modelSettings | 用于训练模型的设置。 | ImageModelSettingsObjectDetection |
primaryMetric | 要针对此任务进行优化的主要指标。 | “MeanAveragePrecision” |
搜索空间 | 用于采样模型及其超参数的不同组合的搜索空间。 | ImageModelDistributionSettingsObjectDetection[] |
扫描设置 | 模型扫描和超参数扫描相关设置。 | ImageSweepSettings (图像扫描设置) |
任务类型 | [必需]AutoMLJob 的任务类型。 | “ImageInstanceSegmentation”(必需) |
validationData (验证数据) | 验证数据输入。 | MLTableJobInput |
validationDataSize | 需要留出用于验证的定型数据集的分数。 介于 (0.0、 1.0) 之间的值 未提供验证数据集时应用。 |
整数 (int) |
ImageLimitSettings
名称 | DESCRIPTION | 价值 |
---|---|---|
maxConcurrentTrials | 最大并发 AutoML 迭代数。 | 整数 (int) |
maxTrials | AutoML 迭代的最大数目。 | 整数 (int) |
超时 | AutoML 作业超时。 | 字符串 |
ImageModelDistributionSettings分类
名称 | DESCRIPTION | 价值 |
---|---|---|
amsGradient | 优化器为“adam”或“adamw”时启用 AMSGrad。 | 字符串 |
扩充 | 使用扩充的设置。 | 字符串 |
贝塔1 | 优化器为“adam”或“adamw”时“beta1”的值。 必须是 [0, 1] 范围内的浮点。 | 字符串 |
贝塔2 | 优化器为“adam”或“adamw”时“beta2”的值。 必须是 [0, 1] 范围内的浮点。 | 字符串 |
分散式 | 是否使用分布式程序训练。 | 字符串 |
earlyStopping (早期停止) | 在训练期间启用提前停止逻辑。 | 字符串 |
earlyStoppingDelay | 在主要指标改进之前等待的最小纪元数或验证评估数 跟踪早期停止。 必须是正整数。 |
字符串 |
早点停止耐心 | 之前没有主要指标改进的最小纪元或验证评估数 运行已停止。 必须是正整数。 |
字符串 |
enableOnnxNormalization | 导出 ONNX 模型时启用规范化。 | 字符串 |
evaluationFrequency | 评估验证数据集以获取指标分数的频率。 必须是正整数。 | 字符串 |
梯度累积步骤 | 渐变累积意味着在不运行配置数量的“GradAccumulationStep”步骤的情况下 更新模型权重,同时累积这些步骤的渐变,然后使用 用于计算权重更新的累积渐变。 必须是正整数。 |
字符串 |
layersToFreeze (图层冻结) | 要冻结模型的层数。 必须是正整数。 例如,将 2 作为“seresnext”的值传递意味着 冻结 layer0 和 layer1。 有关支持的模型的完整列表以及有关层冻结的详细信息,请 请参阅:/azure/machine-learning/how-to-auto-train-image-models。 |
字符串 |
learningRate | 初始学习速率。 必须是 [0, 1] 范围内的浮点。 | 字符串 |
learningRateScheduler 的 | 学习速率计划程序的类型。 必须是“warmup_cosine”或“step”。 | 字符串 |
模型名称 | 要用于训练的模型的名称。 有关可用模型的详细信息,请访问官方文档: /azure/machine-learning/how-to-auto-train-image-models。 |
字符串 |
动量 | 优化器为“zn”时的动量值。 必须是 [0, 1] 范围内的浮点。 | 字符串 |
涅斯特罗夫 | 优化器为“zn”时启用 nesterov。 | 字符串 |
纪元数 | 训练纪元数。 必须是正整数。 | 字符串 |
工人数 | 数据加载程序辅助角色数。 必须是非负整数。 | 字符串 |
优化器 | 优化器的类型。 必须是“zn”、“adam”或“adamw”。 | 字符串 |
随机种子 | 使用确定性训练时要使用的随机种子。 | 字符串 |
stepLR伽玛 | 当学习速率计划程序为“step”时,gamma 的值。 必须是 [0, 1] 范围内的浮点。 | 字符串 |
stepLRStepSize | 学习速率计划程序为“step”时步骤大小的值。 必须是正整数。 | 字符串 |
trainingBatchSize | 训练批大小。 必须是正整数。 | 字符串 |
trainingCropSize | 训练数据集的神经网络输入的图像裁剪大小。 必须是正整数。 | 字符串 |
validationBatchSize | 验证批大小。 必须是正整数。 | 字符串 |
validationCropSize | 输入到神经网络的验证数据集的图像裁剪大小。 必须是正整数。 | 字符串 |
validationResizeSize | 在裁剪验证数据集之前要调整其大小的图像大小。 必须是正整数。 | 字符串 |
warmupCosineLRCycles | 学习速率计划程序为“warmup_cosine”时的余弦周期值。 必须是 [0, 1] 范围内的浮点。 | 字符串 |
warmupCosineLRWarmupEpochs | 当学习速率计划程序为“warmup_cosine”时,预热时期的值。 必须是正整数。 | 字符串 |
weightDecay (权重衰减) | 优化器为“zn”、“adam”或“adamw”时的权重衰减值。 必须是范围[0, 1] 中的浮点。 | 字符串 |
weightedLoss | 减肥。 对于无加权损失,接受的值为 0。 1 用于与 sqrt 一起减肥。(class_weights)。 2 用于减肥与class_weights。 必须为 0 或 1 或 2。 |
字符串 |
ImageModelDistributionSettingsObjectDetection
名称 | DESCRIPTION | 价值 |
---|---|---|
amsGradient | 优化器为“adam”或“adamw”时启用 AMSGrad。 | 字符串 |
扩充 | 使用扩充的设置。 | 字符串 |
贝塔1 | 优化器为“adam”或“adamw”时“beta1”的值。 必须是 [0, 1] 范围内的浮点。 | 字符串 |
贝塔2 | 优化器为“adam”或“adamw”时“beta2”的值。 必须是 [0, 1] 范围内的浮点。 | 字符串 |
boxDetectionsPerImage (每图像检测) | 每个图像的最大检测数,适用于所有类。 必须是正整数。 注意:“yolov5”算法不支持此设置。 |
字符串 |
boxScoreThreshold (盒分数阈值) | 在推理期间,仅返回分类分数大于 BoxScoreThreshold。 必须是范围[0, 1] 中的浮点。 |
字符串 |
分散式 | 是否使用分布式程序训练。 | 字符串 |
earlyStopping (早期停止) | 在训练期间启用提前停止逻辑。 | 字符串 |
earlyStoppingDelay | 在主要指标改进之前等待的最小纪元数或验证评估数 跟踪早期停止。 必须是正整数。 |
字符串 |
早点停止耐心 | 之前没有主要指标改进的最小纪元或验证评估数 运行已停止。 必须是正整数。 |
字符串 |
enableOnnxNormalization | 导出 ONNX 模型时启用规范化。 | 字符串 |
evaluationFrequency | 评估验证数据集以获取指标分数的频率。 必须是正整数。 | 字符串 |
梯度累积步骤 | 渐变累积意味着在不运行配置数量的“GradAccumulationStep”步骤的情况下 更新模型权重,同时累积这些步骤的渐变,然后使用 用于计算权重更新的累积渐变。 必须是正整数。 |
字符串 |
图像大小 | 用于训练和验证的图像大小。 必须是正整数。 注意:如果大小太大,训练运行可能会进入 CUDA OOM。 注意:仅“yolov5”算法支持此设置。 |
字符串 |
layersToFreeze (图层冻结) | 要冻结模型的层数。 必须是正整数。 例如,将 2 作为“seresnext”的值传递意味着 冻结 layer0 和 layer1。 有关支持的模型的完整列表以及有关层冻结的详细信息,请 请参阅:/azure/machine-learning/how-to-auto-train-image-models。 |
字符串 |
learningRate | 初始学习速率。 必须是 [0, 1] 范围内的浮点。 | 字符串 |
learningRateScheduler 的 | 学习速率计划程序的类型。 必须是“warmup_cosine”或“step”。 | 字符串 |
最大大小 | 将图像馈送至主干之前要重新缩放的最大大小。 必须是正整数。 注意:如果大小太大,训练运行可能会进入 CUDA OOM。 注意:“yolov5”算法不支持此设置。 |
字符串 |
最小大小 | 将图像馈送到主干之前要重新缩放的最小大小。 必须是正整数。 注意:如果大小太大,训练运行可能会进入 CUDA OOM。 注意:“yolov5”算法不支持此设置。 |
字符串 |
模型名称 | 要用于训练的模型的名称。 有关可用模型的详细信息,请访问官方文档: /azure/machine-learning/how-to-auto-train-image-models。 |
字符串 |
modelSize | 模型大小。 必须是“small”、“medium”、“large”或“xlarge”。 注意:如果模型大小太大,训练运行可能会进入 CUDA OOM。 注意:仅“yolov5”算法支持此设置。 |
字符串 |
动量 | 优化器为“zn”时的动量值。 必须是 [0, 1] 范围内的浮点。 | 字符串 |
多尺度 | 按 +/- 50%的不同图像大小启用多缩放图像。 注意:如果没有足够的 GPU 内存,训练运行可能会进入 CUDA OOM。 注意:仅“yolov5”算法支持此设置。 |
字符串 |
涅斯特罗夫 | 优化器为“zn”时启用 nesterov。 | 字符串 |
nmsIouThreshold | 在 NMS 后期处理的推理期间使用的 IOU 阈值。 必须在 [0, 1] 范围内浮动。 | 字符串 |
纪元数 | 训练纪元数。 必须是正整数。 | 字符串 |
工人数 | 数据加载程序辅助角色数。 必须是非负整数。 | 字符串 |
优化器 | 优化器的类型。 必须是“zn”、“adam”或“adamw”。 | 字符串 |
随机种子 | 使用确定性训练时要使用的随机种子。 | 字符串 |
stepLR伽玛 | 当学习速率计划程序为“step”时,gamma 的值。 必须是 [0, 1] 范围内的浮点。 | 字符串 |
stepLRStepSize | 学习速率计划程序为“step”时步骤大小的值。 必须是正整数。 | 字符串 |
tileGridSize (平铺网格大小) | 用于平铺每个图像的网格大小。 注意:TileGridSize 不得为 无可启用小型对象检测逻辑。 一个字符串,其中包含两个整数(采用格式)。 注意:“yolov5”算法不支持此设置。 |
字符串 |
tileOverlapRatio (平铺重叠比率) | 每个维度中相邻磁贴之间的重叠比率。 必须在 [0, 1] 范围内浮动。 注意:“yolov5”算法不支持此设置。 |
字符串 |
tilePredictionsNmsThreshold | 用于执行 NMS 的 IOU 阈值,同时合并来自磁贴和图像的预测。 用于验证/推理。 必须在 [0, 1] 范围内浮动。 注意:“yolov5”算法不支持此设置。 NMS:非最大抑制 |
字符串 |
trainingBatchSize | 训练批大小。 必须是正整数。 | 字符串 |
validationBatchSize | 验证批大小。 必须是正整数。 | 字符串 |
validationIouThreshold | 计算验证指标时要使用的 IOU 阈值。 必须在 [0, 1] 范围内浮动。 | 字符串 |
validationMetricType | 用于验证指标的指标计算方法。 必须是“none”、“coco”、“voc”或“coco_voc”。 | 字符串 |
warmupCosineLRCycles | 学习速率计划程序为“warmup_cosine”时的余弦周期值。 必须是 [0, 1] 范围内的浮点。 | 字符串 |
warmupCosineLRWarmupEpochs | 当学习速率计划程序为“warmup_cosine”时,预热时期的值。 必须是正整数。 | 字符串 |
weightDecay (权重衰减) | 优化器为“zn”、“adam”或“adamw”时的权重衰减值。 必须是范围[0, 1] 中的浮点。 | 字符串 |
ImageModelSettings分类
名称 | DESCRIPTION | 价值 |
---|---|---|
高级设置 | 高级方案的设置。 | 字符串 |
amsGradient | 优化器为“adam”或“adamw”时启用 AMSGrad。 | 布尔 |
扩充 | 使用扩充的设置。 | 字符串 |
贝塔1 | 优化器为“adam”或“adamw”时“beta1”的值。 必须是 [0, 1] 范围内的浮点。 | 整数 (int) |
贝塔2 | 优化器为“adam”或“adamw”时“beta2”的值。 必须是 [0, 1] 范围内的浮点。 | 整数 (int) |
检查点频率 | 存储模型检查点的频率。 必须是正整数。 | 整数 (int) |
checkpoint模型 | 用于增量训练的预先训练检查点模型。 | MLFlowModelJobInput |
检查点RunId | 上一次运行的 ID,该运行具有用于增量训练的预先训练检查点。 | 字符串 |
分散式 | 是否使用分布式训练。 | 布尔 |
earlyStopping (早期停止) | 在训练期间启用提前停止逻辑。 | 布尔 |
earlyStoppingDelay | 在主要指标改进之前等待的最小纪元数或验证评估数 跟踪早期停止。 必须是正整数。 |
整数 (int) |
早点停止耐心 | 之前没有主要指标改进的最小纪元或验证评估数 运行已停止。 必须是正整数。 |
整数 (int) |
enableOnnxNormalization | 导出 ONNX 模型时启用规范化。 | 布尔 |
evaluationFrequency | 评估验证数据集以获取指标分数的频率。 必须是正整数。 | 整数 (int) |
梯度累积步骤 | 渐变累积意味着在不运行配置数量的“GradAccumulationStep”步骤的情况下 更新模型权重,同时累积这些步骤的渐变,然后使用 用于计算权重更新的累积渐变。 必须是正整数。 |
整数 (int) |
layersToFreeze (图层冻结) | 要冻结模型的层数。 必须是正整数。 例如,将 2 作为“seresnext”的值传递意味着 冻结 layer0 和 layer1。 有关支持的模型的完整列表以及有关层冻结的详细信息,请 请参阅:/azure/machine-learning/how-to-auto-train-image-models。 |
整数 (int) |
learningRate | 初始学习速率。 必须是 [0, 1] 范围内的浮点。 | 整数 (int) |
learningRateScheduler 的 | 学习速率计划程序的类型。 必须是“warmup_cosine”或“step”。 | “None” “Step” “WarmupCosine” |
模型名称 | 要用于训练的模型的名称。 有关可用模型的详细信息,请访问官方文档: /azure/machine-learning/how-to-auto-train-image-models。 |
字符串 |
动量 | 优化器为“zn”时的动量值。 必须是 [0, 1] 范围内的浮点。 | 整数 (int) |
涅斯特罗夫 | 优化器为“zn”时启用 nesterov。 | 布尔 |
纪元数 | 训练纪元数。 必须是正整数。 | 整数 (int) |
工人数 | 数据加载程序辅助角色数。 必须是非负整数。 | 整数 (int) |
优化器 | 优化器的类型。 | “Adam” “Adamw” “None” “Zn” |
随机种子 | 使用确定性训练时要使用的随机种子。 | 整数 (int) |
stepLR伽玛 | 当学习速率计划程序为“step”时,gamma 的值。 必须是 [0, 1] 范围内的浮点。 | 整数 (int) |
stepLRStepSize | 学习速率计划程序为“step”时步骤大小的值。 必须是正整数。 | 整数 (int) |
trainingBatchSize | 训练批大小。 必须是正整数。 | 整数 (int) |
trainingCropSize | 训练数据集的神经网络输入的图像裁剪大小。 必须是正整数。 | 整数 (int) |
validationBatchSize | 验证批大小。 必须是正整数。 | 整数 (int) |
validationCropSize | 输入到神经网络的验证数据集的图像裁剪大小。 必须是正整数。 | 整数 (int) |
validationResizeSize | 在裁剪验证数据集之前要调整其大小的图像大小。 必须是正整数。 | 整数 (int) |
warmupCosineLRCycles | 学习速率计划程序为“warmup_cosine”时的余弦周期值。 必须是 [0, 1] 范围内的浮点。 | 整数 (int) |
warmupCosineLRWarmupEpochs | 当学习速率计划程序为“warmup_cosine”时,预热时期的值。 必须是正整数。 | 整数 (int) |
weightDecay (权重衰减) | 优化器为“zn”、“adam”或“adamw”时的权重衰减值。 必须是范围[0, 1] 中的浮点。 | 整数 (int) |
weightedLoss | 减肥。 对于无加权损失,接受的值为 0。 1 用于与 sqrt 一起减肥。(class_weights)。 2 用于减肥与class_weights。 必须为 0 或 1 或 2。 |
整数 (int) |
ImageModelSettingsObjectDetection
名称 | DESCRIPTION | 价值 |
---|---|---|
高级设置 | 高级方案的设置。 | 字符串 |
amsGradient | 优化器为“adam”或“adamw”时启用 AMSGrad。 | 布尔 |
扩充 | 使用扩充的设置。 | 字符串 |
贝塔1 | 优化器为“adam”或“adamw”时“beta1”的值。 必须是 [0, 1] 范围内的浮点。 | 整数 (int) |
贝塔2 | 优化器为“adam”或“adamw”时“beta2”的值。 必须是 [0, 1] 范围内的浮点。 | 整数 (int) |
boxDetectionsPerImage (每图像检测) | 每个图像的最大检测数,适用于所有类。 必须是正整数。 注意:“yolov5”算法不支持此设置。 |
整数 (int) |
boxScoreThreshold (盒分数阈值) | 在推理期间,仅返回分类分数大于 BoxScoreThreshold。 必须是范围[0, 1] 中的浮点。 |
整数 (int) |
检查点频率 | 存储模型检查点的频率。 必须是正整数。 | 整数 (int) |
checkpoint模型 | 用于增量训练的预先训练检查点模型。 | MLFlowModelJobInput |
检查点RunId | 上一次运行的 ID,该运行具有用于增量训练的预先训练检查点。 | 字符串 |
分散式 | 是否使用分布式训练。 | 布尔 |
earlyStopping (早期停止) | 在训练期间启用提前停止逻辑。 | 布尔 |
earlyStoppingDelay | 在主要指标改进之前等待的最小纪元数或验证评估数 跟踪早期停止。 必须是正整数。 |
整数 (int) |
早点停止耐心 | 之前没有主要指标改进的最小纪元或验证评估数 运行已停止。 必须是正整数。 |
整数 (int) |
enableOnnxNormalization | 导出 ONNX 模型时启用规范化。 | 布尔 |
evaluationFrequency | 评估验证数据集以获取指标分数的频率。 必须是正整数。 | 整数 (int) |
梯度累积步骤 | 渐变累积意味着在不运行配置数量的“GradAccumulationStep”步骤的情况下 更新模型权重,同时累积这些步骤的渐变,然后使用 用于计算权重更新的累积渐变。 必须是正整数。 |
整数 (int) |
图像大小 | 用于训练和验证的图像大小。 必须是正整数。 注意:如果大小太大,训练运行可能会进入 CUDA OOM。 注意:仅“yolov5”算法支持此设置。 |
整数 (int) |
layersToFreeze (图层冻结) | 要冻结模型的层数。 必须是正整数。 例如,将 2 作为“seresnext”的值传递意味着 冻结 layer0 和 layer1。 有关支持的模型的完整列表以及有关层冻结的详细信息,请 请参阅:/azure/machine-learning/how-to-auto-train-image-models。 |
整数 (int) |
learningRate | 初始学习速率。 必须是 [0, 1] 范围内的浮点。 | 整数 (int) |
learningRateScheduler 的 | 学习速率计划程序的类型。 必须是“warmup_cosine”或“step”。 | “None” “Step” “WarmupCosine” |
最大大小 | 将图像馈送至主干之前要重新缩放的最大大小。 必须是正整数。 注意:如果大小太大,训练运行可能会进入 CUDA OOM。 注意:“yolov5”算法不支持此设置。 |
整数 (int) |
最小大小 | 将图像馈送到主干之前要重新缩放的最小大小。 必须是正整数。 注意:如果大小太大,训练运行可能会进入 CUDA OOM。 注意:“yolov5”算法不支持此设置。 |
整数 (int) |
模型名称 | 要用于训练的模型的名称。 有关可用模型的详细信息,请访问官方文档: /azure/machine-learning/how-to-auto-train-image-models。 |
字符串 |
modelSize | 模型大小。 必须是“small”、“medium”、“large”或“xlarge”。 注意:如果模型大小太大,训练运行可能会进入 CUDA OOM。 注意:仅“yolov5”算法支持此设置。 |
“ExtraLarge” “Large” “Medium” “None” “Small” |
动量 | 优化器为“zn”时的动量值。 必须是 [0, 1] 范围内的浮点。 | 整数 (int) |
多尺度 | 按 +/- 50%的不同图像大小启用多缩放图像。 注意:如果没有足够的 GPU 内存,训练运行可能会进入 CUDA OOM。 注意:仅“yolov5”算法支持此设置。 |
布尔 |
涅斯特罗夫 | 优化器为“zn”时启用 nesterov。 | 布尔 |
nmsIouThreshold | 在 NMS 后期处理的推理期间使用的 IOU 阈值。 必须是 [0, 1] 范围内的浮点。 | 整数 (int) |
纪元数 | 训练纪元数。 必须是正整数。 | 整数 (int) |
工人数 | 数据加载程序辅助角色数。 必须是非负整数。 | 整数 (int) |
优化器 | 优化器的类型。 | “Adam” “Adamw” “None” “Zn” |
随机种子 | 使用确定性训练时要使用的随机种子。 | 整数 (int) |
stepLR伽玛 | 当学习速率计划程序为“step”时,gamma 的值。 必须是 [0, 1] 范围内的浮点。 | 整数 (int) |
stepLRStepSize | 学习速率计划程序为“step”时步骤大小的值。 必须是正整数。 | 整数 (int) |
tileGridSize (平铺网格大小) | 用于平铺每个图像的网格大小。 注意:TileGridSize 不得为 无可启用小型对象检测逻辑。 一个字符串,其中包含两个整数(采用格式)。 注意:“yolov5”算法不支持此设置。 |
字符串 |
tileOverlapRatio (平铺重叠比率) | 每个维度中相邻磁贴之间的重叠比率。 必须在 [0, 1] 范围内浮动。 注意:“yolov5”算法不支持此设置。 |
整数 (int) |
tilePredictionsNmsThreshold | 用于执行 NMS 的 IOU 阈值,同时合并来自磁贴和图像的预测。 用于验证/推理。 必须在 [0, 1] 范围内浮动。 注意:“yolov5”算法不支持此设置。 |
整数 (int) |
trainingBatchSize | 训练批大小。 必须是正整数。 | 整数 (int) |
validationBatchSize | 验证批大小。 必须是正整数。 | 整数 (int) |
validationIouThreshold | 计算验证指标时要使用的 IOU 阈值。 必须在 [0, 1] 范围内浮动。 | 整数 (int) |
validationMetricType | 用于验证指标的指标计算方法。 | “Coco” “CocoVoc” “None” “Voc” |
warmupCosineLRCycles | 学习速率计划程序为“warmup_cosine”时的余弦周期值。 必须是 [0, 1] 范围内的浮点。 | 整数 (int) |
warmupCosineLRWarmupEpochs | 当学习速率计划程序为“warmup_cosine”时,预热时期的值。 必须是正整数。 | 整数 (int) |
weightDecay (权重衰减) | 优化器为“zn”、“adam”或“adamw”时的权重衰减值。 必须是范围[0, 1] 中的浮点。 | 整数 (int) |
ImageObjectDetection
名称 | DESCRIPTION | 价值 |
---|---|---|
limitSettings | [必需]限制 AutoML 作业的设置。 | ImageLimitSettings (必需) |
modelSettings | 用于训练模型的设置。 | ImageModelSettingsObjectDetection |
primaryMetric | 要针对此任务进行优化的主要指标。 | “MeanAveragePrecision” |
搜索空间 | 用于采样模型及其超参数的不同组合的搜索空间。 | ImageModelDistributionSettingsObjectDetection[] |
扫描设置 | 模型扫描和超参数扫描相关设置。 | ImageSweepSettings (图像扫描设置) |
任务类型 | [必需]AutoMLJob 的任务类型。 | “ImageObjectDetection”(必需) |
validationData (验证数据) | 验证数据输入。 | MLTableJobInput |
validationDataSize | 需要留出用于验证的定型数据集的分数。 介于 (0.0、 1.0) 之间的值 未提供验证数据集时应用。 |
整数 (int) |
ImageSweepSettings (图像扫描设置)
名称 | DESCRIPTION | 价值 |
---|---|---|
early终止 | 提前终止策略的类型。 | 提前终止政策 |
sampling算法 | [必需]超参数采样算法的类型。 | “贝贝西亚语” “Grid” “Random”(必需) |
JobBaseProperties
名称 | DESCRIPTION | 价值 |
---|---|---|
组件 ID | 组件资源的 ARM 资源 ID。 | 字符串 |
计算 ID | 计算资源的 ARM 资源 ID。 | 字符串 |
描述 | 资产说明文本。 | 字符串 |
displayName (显示名称) | 作业的显示名称。 | 字符串 |
实验名称 | 作业所属的试验的名称。 如果未设置,作业将放置在“默认”试验中。 | 字符串 |
标识 | 标识配置。 如果已设置,则应为 AmlToken、ManagedIdentity、UserIdentity 或 null 之一。 如果为 null,则默认为 AmlToken。 |
身份配置 |
isArchived 已存档 | 资产是否已存档? | 布尔 |
职位类型 | 设置为 AutoMLJob 类型的“AutoML”。 设置为 CommandJob 类型的“Command”。 设置为 “LabelingJobProperties”类型的“标记”。 设置为 PipelineJob 类型的“Pipeline”。 设置为“ SparkJob”类型的“Spark”。 设置为“ SweepJob”类型。 | “AutoML” “Command” “标记” “Pipeline” “Spark” “扫描”(必需) |
属性 | 资产属性字典。 | ResourceBaseProperties |
服务 | JobEndpoints 列表。 对于本地作业,作业终结点的终结点值为 FileStreamObject。 |
JobBase服务 |
标签 | 标记字典。 可以添加、删除和更新标记。 | ResourceBaseTags |
JobBase服务
名称 | DESCRIPTION | 价值 |
---|
作业输入
名称 | DESCRIPTION | 价值 |
---|---|---|
描述 | 输入的说明。 | 字符串 |
jobInputType (作业输入类型) | 设置为 CustomModelJobInput 类型的“custom_model”。 设置为 Type LiteralJobInput 的“literal”。 设置为 MLFlowModelJobInput 类型的“mlflow_model”。 设置为 MLTableJobInput 类型的“mltable”。 设置为 TritonModelJobInput 类型的“triton_model”。 设置为 UriFileJobInput 类型的“uri_file”。 设置为 UriFolderJobInput 类型的“uri_folder”。 | “custom_model” “literal” “mlflow_model” “mltable” “triton_model” “uri_file” “uri_folder”(必需) |
JobOutput (作业输出)
名称 | DESCRIPTION | 价值 |
---|---|---|
描述 | 输出的说明。 | 字符串 |
jobOutputType | 设置为 CustomModelJobOutput 类型的“custom_model”。 设置为 MLFlowModelJobOutput 类型的“mlflow_model”。 设置为 MLTableJobOutput 类型的“mltable”。 设置为 TritonModelJobOutput 类型的“triton_model”。 设置为 UriFileJobOutput 类型的“uri_file”。 设置为 UriFolderJobOutput 类型的“uri_folder”。 | “custom_model” “mlflow_model” “mltable” “triton_model” “uri_file” “uri_folder”(必需) |
JobResourceConfiguration
名称 | DESCRIPTION | 价值 |
---|---|---|
dockerArgs | 要传递给 Docker run 命令的额外参数。 这将替代系统设置的任何参数,或在本部分中。 此参数仅支持 Azure ML 计算类型。 | 字符串 |
instanceCount | 计算目标使用的实例或节点数可选。 | 整数 (int) |
instanceType | 计算目标支持的可选 VM 类型。 | 字符串 |
属性 | 其他属性包。 | ResourceConfigurationProperties |
shmSize | docker 容器的共享内存块的大小。 这应采用 (number)(unit) 格式,其中数字大于 0,单位可以是 b(字节)、k(千字节)、m(兆字节)或 g(GB)。 | 字符串 约束: 图案 = \d+[bBkKmMgG] |
工作服务
名称 | DESCRIPTION | 价值 |
---|---|---|
终结点 | 终结点的 URL。 | 字符串 |
jobServiceType | 终结点类型。 | 字符串 |
节点 | 用户希望启动服务的节点。 如果未将 Nodes 设置为 null,则服务将仅在领导节点上启动。 |
节点 |
移植 | 用户设置的终结点的端口。 | 整数 (int) |
属性 | 在终结点上设置的其他属性。 | JobServiceProperties |
JobServiceProperties
名称 | DESCRIPTION | 价值 |
---|
标签类别
名称 | DESCRIPTION | 价值 |
---|---|---|
类 | 此类别中标签类的字典。 | 标签类别类 |
displayName (显示名称) | 标签类别的显示名称。 | 字符串 |
multiSelectEnabled 已启用 | 指示是否允许在此类别中选择多个类。 | 布尔 |
标签类别类
名称 | DESCRIPTION | 价值 |
---|
标签类
名称 | DESCRIPTION | 价值 |
---|---|---|
displayName (显示名称) | 标签类的显示名称。 | 字符串 |
子 | 标签类的子类的字典。 | LabelClass子类 |
LabelClass子类
名称 | DESCRIPTION | 价值 |
---|
LabelingDataConfiguration
名称 | DESCRIPTION | 价值 |
---|---|---|
数据 ID | 要执行标记的数据资产的资源 ID。 | 字符串 |
incrementalDataRefreshEnabled | 指示是否启用增量数据刷新。 | 布尔 |
LabelingJobImageProperties
名称 | DESCRIPTION | 价值 |
---|---|---|
annotationType | 图像标记作业的批注类型。 | “BoundingBox” “Classification” “InstanceSegmentation” |
mediaType | [必需]作业的媒体类型。 | “Image”(必需) |
TagJobInstructions
名称 | DESCRIPTION | 价值 |
---|---|---|
URI | 指向页面的链接,其中包含标签器的详细标记说明。 | 字符串 |
LabelingJobLabel类别
名称 | DESCRIPTION | 价值 |
---|
LabelingJobMediaProperties
名称 | DESCRIPTION | 价值 |
---|---|---|
mediaType | 设置为“Image”,类型 为 LabelingJobImageProperties。 对于 LabelingJobTextProperties 类型,设置为“Text”。 | “Image” “Text”(必需) |
LabelingJobProperties
名称 | DESCRIPTION | 价值 |
---|---|---|
dataConfiguration | 配置作业中使用的数据。 | LabelingDataConfiguration |
工作说明 | 标记作业的说明。 | TagJobInstructions |
职位类型 | [必需]指定作业的类型。 | “标记”(必需) |
标签类别 | 作业的标签类别。 | LabelingJobLabel类别 |
labelingJobMediaProperties | 作业中的媒体类型特定属性。 | LabelingJobMediaProperties |
mlAssistConfiguration | 在作业中配置 MLAssist 功能。 | MLAssistConfiguration |
LabelingJobTextProperties
名称 | DESCRIPTION | 价值 |
---|---|---|
annotationType | 文本标记作业的批注类型。 | “Classification” 'NamedEntityRecognition' (命名实体识别) |
mediaType | [必需]作业的媒体类型。 | “Text”(必需) |
LiteralJobInput (文字作业输入)
名称 | DESCRIPTION | 价值 |
---|---|---|
jobInputType (作业输入类型) | [必需]指定作业的类型。 | “literal”(必需) |
价值 | [必需]输入的文本值。 | 字符串 约束: 模式 = [a-zA-Z0-9_] (必需) |
ManagedIdentity (托管身份)
名称 | DESCRIPTION | 价值 |
---|---|---|
客户端 ID | 按客户端 ID 指定用户分配的标识。 对于系统分配,请不要设置此字段。 | 字符串 约束: 最小长度 = 36 最大长度 = 36 图案 = ^[0-9a-fA-F]{8}-([0-9a-fA-F]{4}-){3}[0-9a-fA-F]{12}$ |
身份类型 | [必需]指定标识框架的类型。 | “Managed”(必需) |
对象 ID | 按对象 ID 指定用户分配的标识。 对于系统分配,请不要设置此字段。 | 字符串 约束: 最小长度 = 36 最大长度 = 36 图案 = ^[0-9a-fA-F]{8}-([0-9a-fA-F]{4}-){3}[0-9a-fA-F]{12}$ |
资源ID | 按 ARM 资源 ID 指定用户分配的标识。 对于系统分配,请不要设置此字段。 | 字符串 |
MedianStoppingPolicy (中值停止策略)
名称 | DESCRIPTION | 价值 |
---|---|---|
policyType | [必需]策略配置的名称 | “MedianStopping”(必需) |
MLAssistConfiguration
名称 | DESCRIPTION | 价值 |
---|---|---|
mlAssist | 设置为 MLAssistConfigurationDisabled 类型的“Disabled”。 设置为 MLAssistConfigurationEnabled 类型的“Enabled”。 | “Disabled” “Enabled”(必需) |
MLAssistConfigurationDisabled
名称 | DESCRIPTION | 价值 |
---|---|---|
mlAssist | [必需]指示是否启用 MLAssist 功能。 | “Disabled”(必需) |
MLAssistConfiguration已启用
名称 | DESCRIPTION | 价值 |
---|---|---|
inferencingComputeBinding | [必需]推理中使用的 AML 计算绑定。 | 字符串 约束: 模式 = [a-zA-Z0-9_] (必需) |
mlAssist | [必需]指示是否启用 MLAssist 功能。 | “Enabled”(必需) |
trainingComputeBinding 的 | [必需]训练中使用的 AML 计算绑定。 | 字符串 约束: 模式 = [a-zA-Z0-9_] (必需) |
MLFlowModelJobInput
名称 | DESCRIPTION | 价值 |
---|---|---|
jobInputType (作业输入类型) | [必需]指定作业的类型。 | “mlflow_model”(必需) |
模式 | 输入资产传送模式。 | “Direct” “下载” “EvalDownload” “EvalMount” “ReadOnlyMount” “ReadWriteMount” |
URI | [必需]输入资产 URI。 | 字符串 约束: 模式 = [a-zA-Z0-9_] (必需) |
MLFlowModelJobInput
名称 | DESCRIPTION | 价值 |
---|---|---|
描述 | 输入的说明。 | 字符串 |
jobInputType (作业输入类型) | [必需]指定作业的类型。 | “custom_model” “literal” “mlflow_model” “mltable” “triton_model” “uri_file” “uri_folder”(必需) |
模式 | 输入资产传送模式。 | “Direct” “下载” “EvalDownload” “EvalMount” “ReadOnlyMount” “ReadWriteMount” |
URI | [必需]输入资产 URI。 | 字符串 约束: 模式 = [a-zA-Z0-9_] (必需) |
MLFlowModelJobOutput
名称 | DESCRIPTION | 价值 |
---|---|---|
jobOutputType | [必需]指定作业的类型。 | “mlflow_model”(必需) |
模式 | 输出资产传送模式。 | “Direct” “ReadWriteMount” “Upload” |
URI | 输出资产 URI。 | 字符串 |
MLTableJobInput
名称 | DESCRIPTION | 价值 |
---|---|---|
描述 | 输入的说明。 | 字符串 |
jobInputType (作业输入类型) | [必需]指定作业的类型。 | “custom_model” “literal” “mlflow_model” “mltable” “triton_model” “uri_file” “uri_folder”(必需) |
模式 | 输入资产传送模式。 | “Direct” “下载” “EvalDownload” “EvalMount” “ReadOnlyMount” “ReadWriteMount” |
URI | [必需]输入资产 URI。 | 字符串 约束: 模式 = [a-zA-Z0-9_] (必需) |
MLTableJobInput
名称 | DESCRIPTION | 价值 |
---|---|---|
jobInputType (作业输入类型) | [必需]指定作业的类型。 | “mltable”(必需) |
模式 | 输入资产传送模式。 | “Direct” “下载” “EvalDownload” “EvalMount” “ReadOnlyMount” “ReadWriteMount” |
URI | [必需]输入资产 URI。 | 字符串 约束: 模式 = [a-zA-Z0-9_] (必需) |
MLTableJobOutput
名称 | DESCRIPTION | 价值 |
---|---|---|
jobOutputType | [必需]指定作业的类型。 | “mltable”(必需) |
模式 | 输出资产传送模式。 | “Direct” “ReadWriteMount” “Upload” |
URI | 输出资产 URI。 | 字符串 |
MPI
名称 | DESCRIPTION | 价值 |
---|---|---|
distributionType | [必需]指定分发框架的类型。 | “Mpi”(必需) |
processCountPerInstance | 每个 MPI 节点的进程数。 | 整数 (int) |
NCross验证
名称 | DESCRIPTION | 价值 |
---|---|---|
模式 | 对于 AutoNCrossValidations 类型,设置为“自动”。 设置为 CustomNCrossValidations 类型的“Custom”。 | “Auto” “Custom”(必需) |
NlpFixedParameters
名称 | DESCRIPTION | 价值 |
---|---|---|
梯度累积步骤 | 在运行向后传递之前累积渐变的步骤数。 | 整数 (int) |
learningRate | 训练过程的学习速率。 | 整数 (int) |
learningRateScheduler 的 | 训练过程中要使用的学习速率计划的类型。 | “Constant” “ConstantWithWarmup” “余弦” “CosineWithRestarts” “Linear” “None” “多项式” |
模型名称 | 要训练的模型的名称。 | 字符串 |
纪元数 | 训练纪元数。 | 整数 (int) |
trainingBatchSize | 训练过程的批大小。 | 整数 (int) |
validationBatchSize | 要在评估期间使用的批大小。 | 整数 (int) |
warmupRatio | 与 LrSchedulerType 一起使用的预热比率。 | 整数 (int) |
weightDecay (权重衰减) | 训练过程的重量衰减。 | 整数 (int) |
NlpParameterSubspace
名称 | DESCRIPTION | 价值 |
---|---|---|
梯度累积步骤 | 在运行向后传递之前累积渐变的步骤数。 | 字符串 |
learningRate | 训练过程的学习速率。 | 字符串 |
learningRateScheduler 的 | 训练过程中要使用的学习速率计划的类型。 | 字符串 |
模型名称 | 要训练的模型的名称。 | 字符串 |
纪元数 | 训练纪元数。 | 字符串 |
trainingBatchSize | 训练过程的批大小。 | 字符串 |
validationBatchSize | 要在评估期间使用的批大小。 | 字符串 |
warmupRatio | 与 LrSchedulerType 一起使用的预热比率。 | 字符串 |
weightDecay (权重衰减) | 训练过程的重量衰减。 | 字符串 |
NlpSweepSettings
名称 | DESCRIPTION | 价值 |
---|---|---|
early终止 | 扫描作业的提前终止策略的类型。 | 提前终止政策 |
sampling算法 | [必需]采样算法的类型。 | “贝贝西亚语” “Grid” “Random”(必需) |
NlpVerticalFeaturizationSettings
名称 | DESCRIPTION | 价值 |
---|---|---|
datasetLanguage | 数据集语言,适用于文本数据。 | 字符串 |
NlpVerticalLimitSettings
名称 | DESCRIPTION | 价值 |
---|---|---|
maxConcurrentTrials | 最大并发 AutoML 迭代次数。 | 整数 (int) |
最大节点数 | 用于在任何单个试用版中训练的最大节点数。 控制多节点分布式训练。 | 整数 (int) |
maxTrials | AutoML 迭代数。 | 整数 (int) |
超时 | AutoML 作业超时。 | 字符串 |
trialTimeout (试用超时) | 单个 HD 试用版的超时。 | 字符串 |
节点
名称 | DESCRIPTION | 价值 |
---|---|---|
nodesValueType | 对于 AllNodes 类型,设置为“All”。 | “全部”(必需) |
目的
名称 | DESCRIPTION | 价值 |
---|---|---|
目标 | [必需]定义超参数优化支持的指标目标 | “最大化” “最小化”(必需) |
primaryMetric | [必需]要优化的指标的名称。 | 字符串 约束: 模式 = [a-zA-Z0-9_] (必需) |
管道作业
名称 | DESCRIPTION | 价值 |
---|---|---|
输入 | 管道作业的输入。 | 管道作业输入 |
工作 | 作业构造管道作业。 | PipelineJobJob 作业 |
职位类型 | [必需]指定作业的类型。 | “Pipeline”(必需) |
输出 | 管道作业的输出 | PipelineJobOutputs |
设置 | 管道设置,例如 ContinueRunOnStepFailure 等。 | 任何 |
源作业 ID | 源作业的 ARM 资源 ID。 | 字符串 |
管道作业输入
名称 | DESCRIPTION | 价值 |
---|
PipelineJobJob 作业
名称 | DESCRIPTION | 价值 |
---|
PipelineJobOutputs
名称 | DESCRIPTION | 价值 |
---|
PyTorch
名称 | DESCRIPTION | 价值 |
---|---|---|
distributionType | [必需]指定分发框架的类型。 | “PyTorch”(必需) |
processCountPerInstance | 每个节点的进程数。 | 整数 (int) |
RandomSamplingAlgorithm 算法
名称 | DESCRIPTION | 价值 |
---|---|---|
规则 | 随机算法的特定类型 | “Random” “Sobol” |
采样算法类型 | [必需]用于生成超参数值的算法以及配置属性 | “Random”(必需) |
种子 | 用作随机数生成的种子的可选整数 | 整数 (int) |
回归
名称 | DESCRIPTION | 价值 |
---|---|---|
cvSplitColumnNames | 用于 CVSplit 数据的列。 | 字符串[] |
featurizationSettings | AutoML 作业所需的特征化输入。 | TableVerticalFeaturizationSettings |
固定参数 | 在整个训练过程中将保持不变的模型/训练参数。 | TableFixedParameters (表固定参数) |
limitSettings | AutoMLJob 的执行约束。 | TableVerticalLimitSettings |
nCrossValidations | 要应用于训练数据集的交叉验证折叠数 如果未提供验证数据集,则为 。 |
NCross验证 |
primaryMetric | 回归任务的主要指标。 | “NormalizedMeanAbsoluteError” “NormalizedRootMeanSquaredError” “R2Score” 'SpearmanCorrelation' |
搜索空间 | 用于采样模型及其超参数的不同组合的搜索空间。 | TableParameterSubspace[] |
扫描设置 | 模型扫描和超参数优化的设置。 | TableSweepSettings (表格扫描设置) |
任务类型 | [必需]AutoMLJob 的任务类型。 | “回归”(必需) |
测试数据 | 测试数据输入。 | MLTableJobInput |
testDataSize | 需要为验证目的预留的测试数据集的分数。 介于 (0.0、 1.0) 之间的值 未提供验证数据集时应用。 |
整数 (int) |
trainingSettings | AutoML 作业训练阶段的输入。 | 回归训练设置 |
validationData (验证数据) | 验证数据输入。 | MLTableJobInput |
validationDataSize | 需要留出用于验证的定型数据集的分数。 介于 (0.0、 1.0) 之间的值 未提供验证数据集时应用。 |
整数 (int) |
权重列名称 | 示例权重列的名称。 自动化 ML 支持加权列作为输入,导致数据中的行向上或向下加权。 | 字符串 |
回归训练设置
名称 | DESCRIPTION | 价值 |
---|---|---|
allowedTrainingAlgorithms | 回归任务的允许模型。 | 包含任一项的字符串数组: “DecisionTree” “ElasticNet” “ExtremeRandomTrees” “GradientBoosting” “KNN” “LassoLars” “LightGBM” “RandomForest” “ZN” “XGBoostRegressor” |
blockedTrainingAlgorithms | 回归任务的阻止模型。 | 包含任一项的字符串数组: “DecisionTree” “ElasticNet” “ExtremeRandomTrees” “GradientBoosting” “KNN” “LassoLars” “LightGBM” “RandomForest” “ZN” “XGBoostRegressor” |
enableDnnTraining | 启用 DNN 模型的建议。 | 布尔 |
enableModelExplainability | 标志以在最佳模型上启用可解释性。 | 布尔 |
enableOnnxCompatibleModels | 用于启用 onnx 兼容模型的标志。 | 布尔 |
enableStackEnsemble | 启用堆栈合奏运行。 | 布尔 |
enableVoteEnsemble | 启用投票合奏运行。 | 布尔 |
ensembleModelDownloadTimeout | 在 VotingEnsemble 和 StackEnsemble 模型生成期间,将下载先前子运行中的多个拟合模型。 如果需要更多时间,请将此参数配置为大于 300 秒的值。 |
字符串 |
stackEnsembleSettings | 堆栈合奏的堆栈合奏设置。 | StackEnsembleSettings |
ResourceBaseProperties
名称 | DESCRIPTION | 价值 |
---|
ResourceBaseTags
名称 | DESCRIPTION | 价值 |
---|
ResourceConfigurationProperties
名称 | DESCRIPTION | 价值 |
---|
采样算法
名称 | DESCRIPTION | 价值 |
---|---|---|
采样算法类型 | 设置为 “Bayesian”类型的 BayesianSamplingAlgorithm。 设置为 GridSamplingAlgorithm 类型的“Grid”。 设置为 RandomSamplingAlgorithm 类型的“Random”。 | “贝贝西亚语” “Grid” “Random”(必需) |
季节性
名称 | DESCRIPTION | 价值 |
---|---|---|
模式 | 设置为“ AutoSeasonality”类型为“自动”。 设置为“ CustomSeasonality”类型。 | “Auto” “Custom”(必需) |
SparkJob
名称 | DESCRIPTION | 价值 |
---|---|---|
档案 | 存档作业中使用的文件。 | 字符串[] |
参数 | 作业的参数。 | 字符串 |
代码 Id | [必需]代码资产的 ARM 资源 ID。 | 字符串 约束: 模式 = [a-zA-Z0-9_] (必需) |
会议 | Spark 配置的属性。 | SparkJobConf 函数 |
输入 | [必需]在启动作业时要执行的条目。 | SparkJobEntry (必需) |
环境 ID | 作业的环境规范的 ARM 资源 ID。 | 字符串 |
文件 | 作业中使用的文件。 | 字符串[] |
输入 | 作业中使用的输入数据绑定的映射。 | SparkJobInputs |
罐子 | 作业中使用的 Jar 文件。 | 字符串[] |
职位类型 | [必需]指定作业的类型。 | “Spark”(必需) |
输出 | 作业中使用的输出数据绑定的映射。 | SparkJob输出 |
py文件 | 作业中使用的 Python 文件。 | 字符串[] |
资源 | 作业的计算资源配置。 | SparkResourceConfiguration |
SparkJobConf 函数
名称 | DESCRIPTION | 价值 |
---|
SparkJobEntry
名称 | DESCRIPTION | 价值 |
---|---|---|
sparkJobEntryType | 设置为 SparkJobPythonEntry 类型的“SparkJobPythonEntry”。 设置为“ SparkJobScalaEntry”类型的“SparkJobScalaEntry”。 | “SparkJobPythonEntry” “SparkJobScalaEntry”(必需) |
SparkJobInputs
名称 | DESCRIPTION | 价值 |
---|
SparkJob输出
名称 | DESCRIPTION | 价值 |
---|
SparkJobPython条目
名称 | DESCRIPTION | 价值 |
---|---|---|
文件 | [必需]作业入口点的相对 python 文件路径。 | 字符串 约束: 最小长度 = 1 模式 = [a-zA-Z0-9_] (必需) |
sparkJobEntryType | [必需]作业入口点的类型。 | “SparkJobPythonEntry”(必需) |
SparkJobScalaEntry
名称 | DESCRIPTION | 价值 |
---|---|---|
类名 | [必需]用作入口点的 Scala 类名称。 | 字符串 约束: 最小长度 = 1 模式 = [a-zA-Z0-9_] (必需) |
sparkJobEntryType | [必需]作业入口点的类型。 | “SparkJobScalaEntry”(必需) |
SparkResourceConfiguration
名称 | DESCRIPTION | 价值 |
---|---|---|
instanceType | 计算目标支持的可选 VM 类型。 | 字符串 |
runtimeVersion (运行时版本) | 用于作业的 spark 运行时的版本。 | 字符串 |
StackEnsembleSettings
名称 | DESCRIPTION | 价值 |
---|---|---|
stackMetaLearnerKWargs | 要传递给元学习器初始值设定项的可选参数。 | 任何 |
stackMetaLearnerTrainPercentage | 指定要保留用于训练元学习者的训练集(选择训练和训练类型的训练)的比例。 默认值为 0.2。 | 整数 (int) |
stackMetaLearnerType | 元学习器是在单个异类模型的输出上训练的模型。 | “ElasticNet” “ElasticNetCV” “LightGBMClassifier” “LightGBMRegressor” “LinearRegression” “LogisticRegression” “LogisticRegressionCV” “None” |
SweepJob (扫描作业)
名称 | DESCRIPTION | 价值 |
---|---|---|
early终止 | 提前终止策略可在完成之前取消性能不佳的运行 | 提前终止政策 |
输入 | 作业中使用的输入数据绑定的映射。 | SweepJobInputs |
职位类型 | [必需]指定作业的类型。 | “扫描”(必需) |
限制 | 扫描作业限制。 | SweepJobLimits (扫描作业限制) |
目的 | [必需]优化目标。 | 目标 (必需) |
输出 | 作业中使用的输出数据绑定的映射。 | SweepJobOutputs (扫描作业输出) |
sampling算法 | [必需]超参数采样算法 | SamplingAlgorithm (必需) |
搜索空间 | [必需]包含每个参数及其分布的字典。 字典键是参数的名称 | 任何(必需) |
试用 | [必需]试用组件定义。 | TrialComponent (必需) |
SweepJobInputs
名称 | DESCRIPTION | 价值 |
---|
SweepJobLimits (扫描作业限制)
名称 | DESCRIPTION | 价值 |
---|---|---|
jobLimits类型 | [必需]JobLimit 类型。 | “Command” “扫描”(必需) |
maxConcurrentTrials | 扫描作业最大并发试用版。 | 整数 (int) |
maxTotalTrials | 扫描作业最大总试用版数。 | 整数 (int) |
超时 | ISO 8601 格式的最大运行持续时间,之后作业将被取消。 仅支持精度为秒的持续时间。 | 字符串 |
trialTimeout (试用超时) | 扫描作业试用超时值。 | 字符串 |
SweepJobOutputs (扫描作业输出)
名称 | DESCRIPTION | 价值 |
---|
TableFixedParameters (表固定参数)
名称 | DESCRIPTION | 价值 |
---|---|---|
助 推 器 | 指定提升类型,例如 XGBoost 的 gbdt。 | 字符串 |
boosting类型 | 指定提升类型,例如 LightGBM 的 gbdt。 | 字符串 |
增长策略 | 指定增长策略,该策略控制新节点添加到树的方式。 | 字符串 |
learningRate | 训练过程的学习速率。 | 整数 (int) |
最大 Bin | 指定存储桶连续功能的最大离散箱数。 | 整数 (int) |
最大深度 | 指定显式限制树深度的最大深度。 | 整数 (int) |
最大叶数 | 指定显式限制树叶的最大叶数。 | 整数 (int) |
minDataInLeaf 的 | 每个叶的最小数据数。 | 整数 (int) |
minSplitGain 最小分度增益 | 在树的叶节点上进行进一步分区所需的最小损失减少。 | 整数 (int) |
模型名称 | 要训练的模型的名称。 | 字符串 |
nEstimator | 指定模型中的树数(或舍入)。 | 整数 (int) |
叶数 | 指定叶数。 | 整数 (int) |
preprocessorName | 要使用的预处理器的名称。 | 字符串 |
regAlpha | 权重的 L1 正则化术语。 | 整数 (int) |
regLambda | L2 权重的正则化术语。 | 整数 (int) |
子样本 | 训练实例的子采样比率。 | 整数 (int) |
subsampleFreq | 子采样的频率。 | 整数 (int) |
treeMethod | 指定树方法。 | 字符串 |
withMean | 如果为 true,在使用 StandardScalar 缩放数据之前居中。 | 布尔 |
withStd | 如果为 true,请使用 StandardScalar 缩放具有单位方差的数据。 | 布尔 |
TableParameterSubspace
名称 | DESCRIPTION | 价值 |
---|---|---|
助 推 器 | 指定提升类型,例如 XGBoost 的 gbdt。 | 字符串 |
boosting类型 | 指定提升类型,例如 LightGBM 的 gbdt。 | 字符串 |
增长策略 | 指定增长策略,该策略控制新节点添加到树的方式。 | 字符串 |
learningRate | 训练过程的学习速率。 | 字符串 |
最大 Bin | 指定存储桶连续功能的最大离散箱数。 | 字符串 |
最大深度 | 指定显式限制树深度的最大深度。 | 字符串 |
最大叶数 | 指定显式限制树叶的最大叶数。 | 字符串 |
minDataInLeaf 的 | 每个叶的最小数据数。 | 字符串 |
minSplitGain 最小分度增益 | 在树的叶节点上进行进一步分区所需的最小损失减少。 | 字符串 |
模型名称 | 要训练的模型的名称。 | 字符串 |
nEstimator | 指定模型中的树数(或舍入)。 | 字符串 |
叶数 | 指定叶数。 | 字符串 |
preprocessorName | 要使用的预处理器的名称。 | 字符串 |
regAlpha | 权重的 L1 正则化术语。 | 字符串 |
regLambda | L2 权重的正则化术语。 | 字符串 |
子样本 | 训练实例的子采样比率。 | 字符串 |
subsampleFreq | 子采样的频率 | 字符串 |
treeMethod | 指定树方法。 | 字符串 |
withMean | 如果为 true,在使用 StandardScalar 缩放数据之前居中。 | 字符串 |
withStd | 如果为 true,请使用 StandardScalar 缩放具有单位方差的数据。 | 字符串 |
TableSweepSettings (表格扫描设置)
名称 | DESCRIPTION | 价值 |
---|---|---|
early终止 | 扫描作业的提前终止策略的类型。 | 提前终止政策 |
sampling算法 | [必需]采样算法的类型。 | “贝贝西亚语” “Grid” “Random”(必需) |
TableVerticalFeaturizationSettings
名称 | DESCRIPTION | 价值 |
---|---|---|
阻塞变压器 | 这些转换器不应用于特征化。 | 包含任一项的字符串数组: “CatTargetEncoder” “CountVectorizer” “HashOneHotEncoder” “LabelEncoder” “NaiveBayes” “OneHotEncoder” “TextTargetEncoder” “TfIdf” “WoETargetEncoder” “WordEmbedding” |
columnNameAnd类型 | 列名及其类型(int、float、string、datetime 等)的字典。 | TableVerticalFeaturizationSettingsColumnNameAndTypes |
datasetLanguage | 数据集语言,适用于文本数据。 | 字符串 |
enableDnnFeaturization | 确定是否使用基于 Dnn 的特征化器进行数据特征化。 | 布尔 |
模式 | 特征化模式 - 用户可以保留默认的“自动”模式,AutoML 将负责在特征化阶段对数据进行必要的转换。 如果选择了“关闭”,则不会完成特征化。 如果选择“自定义”,则用户可以指定其他输入以自定义特征化完成方式。 |
“Auto” “Custom” “关闭” |
transformer参数 | 用户可以指定要用于的其他转换器以及要向其应用它的列以及转换器构造函数的参数。 | TableVerticalFeaturizationSettingsTransformerParams |
TableVerticalFeaturizationSettingsColumnNameAndTypes
名称 | DESCRIPTION | 价值 |
---|
TableVerticalFeaturizationSettingsTransformerParams
名称 | DESCRIPTION | 价值 |
---|
TableVerticalLimitSettings
名称 | DESCRIPTION | 价值 |
---|---|---|
enableEarlyTermination | 启用提前终止,确定如果最近 20 次迭代中没有分数改进,AutoMLJob 是否会提前终止。 | 布尔 |
退出评分 | AutoML 作业的退出分数。 | 整数 (int) |
maxConcurrentTrials | 最大并发迭代数。 | 整数 (int) |
maxCoresPerTrial | 每次迭代的最大核心数。 | 整数 (int) |
maxTrials | 迭代数。 | 整数 (int) |
sweepConcurrentTrials | 用户想要触发的并发扫描运行数。 | 整数 (int) |
sweepTrials | 用户想要触发的扫描运行数。 | 整数 (int) |
超时 | AutoML 作业超时。 | 字符串 |
trialTimeout (试用超时) | 迭代超时。 | 字符串 |
目标滞后
名称 | DESCRIPTION | 价值 |
---|---|---|
模式 | 对于 AutoTargetLags 类型,设置为“自动”。 设置为 CustomTargetLags 类型的“Custom”。 | “Auto” “Custom”(必需) |
TargetRollingWindowSize
名称 | DESCRIPTION | 价值 |
---|---|---|
模式 | 设置为“ AutoTargetRollingWindowSize”类型的“自动”。 设置为 CustomTargetRollingWindowSize 类型的“Custom”。 | “Auto” “Custom”(必需) |
TensorFlow
名称 | DESCRIPTION | 价值 |
---|---|---|
distributionType | [必需]指定分发框架的类型。 | “TensorFlow”(必需) |
parameterServerCount | 参数服务器任务数。 | 整数 (int) |
workerCount 工人计数 | 工人数。 如果未指定,则默认为实例计数。 | 整数 (int) |
文本分类
名称 | DESCRIPTION | 价值 |
---|---|---|
featurizationSettings | AutoML 作业所需的特征化输入。 | NlpVerticalFeaturizationSettings |
固定参数 | 在整个训练过程中将保持不变的模型/训练参数。 | NlpFixedParameters |
limitSettings | AutoMLJob 的执行约束。 | NlpVerticalLimitSettings |
primaryMetric | Text-Classification 任务的主要指标。 | “准确性” “AUCWeighted” “AveragePrecisionScoreWeighted” “NormMacroRecall” “PrecisionScoreWeighted” |
搜索空间 | 用于采样模型及其超参数的不同组合的搜索空间。 | NlpParameterSubspace[] |
扫描设置 | 模型扫描和超参数优化的设置。 | NlpSweepSettings |
任务类型 | [必需]AutoMLJob 的任务类型。 | “TextClassification”(必需) |
validationData (验证数据) | 验证数据输入。 | MLTableJobInput |
TextClassificationMultilabel
名称 | DESCRIPTION | 价值 |
---|---|---|
featurizationSettings | AutoML 作业所需的特征化输入。 | NlpVerticalFeaturizationSettings |
固定参数 | 在整个训练过程中将保持不变的模型/训练参数。 | NlpFixedParameters |
limitSettings | AutoMLJob 的执行约束。 | NlpVerticalLimitSettings |
搜索空间 | 用于采样模型及其超参数的不同组合的搜索空间。 | NlpParameterSubspace[] |
扫描设置 | 模型扫描和超参数优化的设置。 | NlpSweepSettings |
任务类型 | [必需]AutoMLJob 的任务类型。 | “TextClassificationMultilabel”(必需) |
validationData (验证数据) | 验证数据输入。 | MLTableJobInput |
TextNer (文本生成器)
名称 | DESCRIPTION | 价值 |
---|---|---|
featurizationSettings | AutoML 作业所需的特征化输入。 | NlpVerticalFeaturizationSettings |
固定参数 | 在整个训练过程中将保持不变的模型/训练参数。 | NlpFixedParameters |
limitSettings | AutoMLJob 的执行约束。 | NlpVerticalLimitSettings |
搜索空间 | 用于采样模型及其超参数的不同组合的搜索空间。 | NlpParameterSubspace[] |
扫描设置 | 模型扫描和超参数优化的设置。 | NlpSweepSettings |
任务类型 | [必需]AutoMLJob 的任务类型。 | “TextNER”(必需) |
validationData (验证数据) | 验证数据输入。 | MLTableJobInput |
TrialComponent (试用组件)
名称 | DESCRIPTION | 价值 |
---|---|---|
代码 Id | 代码资产的 ARM 资源 ID。 | 字符串 |
指令 | [必需]在启动作业时执行的命令。 例如 “python train.py” | 字符串 约束: 最小长度 = 1 模式 = [a-zA-Z0-9_] (必需) |
分配 | 作业的分发配置。 如果已设置,则应为 Mpi、Tensorflow、PyTorch 或 null 之一。 | 分发配置 |
环境 ID | [必需]作业的环境规范的 ARM 资源 ID。 | 字符串 约束: 模式 = [a-zA-Z0-9_] (必需) |
环境变量 | 作业中包含的环境变量。 | TrialComponentEnvironmentVariables |
资源 | 作业的计算资源配置。 | JobResourceConfiguration |
TrialComponentEnvironmentVariables
名称 | DESCRIPTION | 价值 |
---|
TritonModelJobInput
名称 | DESCRIPTION | 价值 |
---|---|---|
jobInputType (作业输入类型) | [必需]指定作业的类型。 | “triton_model”(必需) |
模式 | 输入资产传送模式。 | “Direct” “下载” “EvalDownload” “EvalMount” “ReadOnlyMount” “ReadWriteMount” |
URI | [必需]输入资产 URI。 | 字符串 约束: 模式 = [a-zA-Z0-9_] (必需) |
TritonModelJobOutput
名称 | DESCRIPTION | 价值 |
---|---|---|
jobOutputType | [必需]指定作业的类型。 | “triton_model”(必需) |
模式 | 输出资产传送模式。 | “Direct” “ReadWriteMount” “Upload” |
URI | 输出资产 URI。 | 字符串 |
截断选择策略
名称 | DESCRIPTION | 价值 |
---|---|---|
policyType | [必需]策略配置的名称 | “TruncationSelection”(必需) |
截断百分比 | 要在每个评估间隔取消的运行百分比。 | 整数 (int) |
UriFileJobInput
名称 | DESCRIPTION | 价值 |
---|---|---|
jobInputType (作业输入类型) | [必需]指定作业的类型。 | “uri_file”(必需) |
模式 | 输入资产传送模式。 | “Direct” “下载” “EvalDownload” “EvalMount” “ReadOnlyMount” “ReadWriteMount” |
URI | [必需]输入资产 URI。 | 字符串 约束: 模式 = [a-zA-Z0-9_] (必需) |
UriFileJobOutput
名称 | DESCRIPTION | 价值 |
---|---|---|
jobOutputType | [必需]指定作业的类型。 | “uri_file”(必需) |
模式 | 输出资产传送模式。 | “Direct” “ReadWriteMount” “Upload” |
URI | 输出资产 URI。 | 字符串 |
UriFolderJobInput
名称 | DESCRIPTION | 价值 |
---|---|---|
jobInputType (作业输入类型) | [必需]指定作业的类型。 | “uri_folder”(必需) |
模式 | 输入资产传送模式。 | “Direct” “下载” “EvalDownload” “EvalMount” “ReadOnlyMount” “ReadWriteMount” |
URI | [必需]输入资产 URI。 | 字符串 约束: 模式 = [a-zA-Z0-9_] (必需) |
UriFolderJobOutput
名称 | DESCRIPTION | 价值 |
---|---|---|
jobOutputType | [必需]指定作业的类型。 | “uri_folder”(必需) |
模式 | 输出资产传送模式。 | “Direct” “ReadWriteMount” “Upload” |
URI | 输出资产 URI。 | 字符串 |
用户身份
名称 | DESCRIPTION | 价值 |
---|---|---|
身份类型 | [必需]指定标识框架的类型。 | “UserIdentity”(必需) |
用法示例
Azure 快速入门示例
以下 Azure 快速入门模板 包含用于部署此资源类型的 Bicep 示例。
Bicep 文件 | DESCRIPTION |
---|---|
创建 Azure 机器学习 AutoML 分类作业 | 此模板创建一个 Azure 机器学习 AutoML 分类作业,以找出用于预测客户是否会与金融机构订阅固定期存款的最佳模型。 |
创建 Azure 机器学习命令作业 | 此模板使用基本hello_world脚本创建 Azure 机器学习命令作业 |
创建 Azure 机器学习扫描作业 | 此模板创建用于超参数优化的 Azure 机器学习扫描作业。 |
ARM 模板资源定义
可以使用目标作部署工作区/作业资源类型:
- 资源组 - 请参阅 资源组部署命令
有关每个 API 版本中已更改属性的列表,请参阅 更改日志。
资源格式
若要创建 Microsoft.MachineLearningServices/workspaces/jobs 资源,请将以下 JSON 添加到模板。
{
"type": "Microsoft.MachineLearningServices/workspaces/jobs",
"apiVersion": "2022-10-01-preview",
"name": "string",
"properties": {
"componentId": "string",
"computeId": "string",
"description": "string",
"displayName": "string",
"experimentName": "string",
"identity": {
"identityType": "string"
// For remaining properties, see IdentityConfiguration objects
},
"isArchived": "bool",
"properties": {
"{customized property}": "string"
},
"services": {
"{customized property}": {
"endpoint": "string",
"jobServiceType": "string",
"nodes": {
"nodesValueType": "string"
// For remaining properties, see Nodes objects
},
"port": "int",
"properties": {
"{customized property}": "string"
}
}
},
"tags": {
"{customized property}": "string"
},
"jobType": "string"
// For remaining properties, see JobBaseProperties objects
}
}
季节性对象
设置 模式 属性以指定对象的类型。
对于 自动,请使用:
{
"mode": "Auto"
}
对于 “自定义”,请使用:
{
"mode": "Custom",
"value": "int"
}
ForecastHorizon 对象
设置 模式 属性以指定对象的类型。
对于 自动,请使用:
{
"mode": "Auto"
}
对于 “自定义”,请使用:
{
"mode": "Custom",
"value": "int"
}
JobOutput 对象
设置 jobOutputType 属性以指定对象的类型。
对于 custom_model,请使用:
{
"jobOutputType": "custom_model",
"mode": "string",
"uri": "string"
}
对于 mlflow_model,请使用:
{
"jobOutputType": "mlflow_model",
"mode": "string",
"uri": "string"
}
对于 mltable,请使用:
{
"jobOutputType": "mltable",
"mode": "string",
"uri": "string"
}
对于 triton_model,请使用:
{
"jobOutputType": "triton_model",
"mode": "string",
"uri": "string"
}
对于 uri_file,请使用:
{
"jobOutputType": "uri_file",
"mode": "string",
"uri": "string"
}
对于 uri_folder,请使用:
{
"jobOutputType": "uri_folder",
"mode": "string",
"uri": "string"
}
IdentityConfiguration 对象
设置 identityType 属性以指定对象的类型。
对于 AMLToken,请使用:
{
"identityType": "AMLToken"
}
对于 托管,请使用:
{
"clientId": "string",
"identityType": "Managed",
"objectId": "string",
"resourceId": "string"
}
对于 UserIdentity,请使用:
{
"identityType": "UserIdentity"
}
DistributionConfiguration 对象
设置 distributionType 属性以指定对象的类型。
对于 Mpi,请使用:
{
"distributionType": "Mpi",
"processCountPerInstance": "int"
}
对于 PyTorch,请使用:
{
"distributionType": "PyTorch",
"processCountPerInstance": "int"
}
对于 TensorFlow,请使用:
{
"distributionType": "TensorFlow",
"parameterServerCount": "int",
"workerCount": "int"
}
MLAssistConfiguration 对象
设置 mlAssist 属性以指定对象的类型。
对于 禁用,请使用:
{
"mlAssist": "Disabled"
}
对于 “已启用”,请使用:
{
"inferencingComputeBinding": "string",
"mlAssist": "Enabled",
"trainingComputeBinding": "string"
}
EarlyTerminationPolicy 对象
设置 policyType 属性以指定对象的类型。
对于 Bandit,请使用:
{
"policyType": "Bandit",
"slackAmount": "int",
"slackFactor": "int"
}
对于 MedianStopping,请使用:
{
"policyType": "MedianStopping"
}
对于 TruncationSelection,请使用:
{
"policyType": "TruncationSelection",
"truncationPercentage": "int"
}
TargetRollingWindowSize 对象
设置 模式 属性以指定对象的类型。
对于 自动,请使用:
{
"mode": "Auto"
}
对于 “自定义”,请使用:
{
"mode": "Custom",
"value": "int"
}
SparkJobEntry 对象
设置 sparkJobEntryType 属性以指定对象的类型。
对于 SparkJobPythonEntry,请使用:
{
"file": "string",
"sparkJobEntryType": "SparkJobPythonEntry"
}
对于 SparkJobScalaEntry,请使用:
{
"className": "string",
"sparkJobEntryType": "SparkJobScalaEntry"
}
AutoMLVertical 对象
设置 taskType 属性以指定对象的类型。
对于 分类,请使用:
{
"cvSplitColumnNames": [ "string" ],
"featurizationSettings": {
"blockedTransformers": [ "string" ],
"columnNameAndTypes": {
"{customized property}": "string"
},
"datasetLanguage": "string",
"enableDnnFeaturization": "bool",
"mode": "string",
"transformerParams": {
"{customized property}": [
{
"fields": [ "string" ],
"parameters": {}
}
]
}
},
"fixedParameters": {
"booster": "string",
"boostingType": "string",
"growPolicy": "string",
"learningRate": "int",
"maxBin": "int",
"maxDepth": "int",
"maxLeaves": "int",
"minDataInLeaf": "int",
"minSplitGain": "int",
"modelName": "string",
"nEstimators": "int",
"numLeaves": "int",
"preprocessorName": "string",
"regAlpha": "int",
"regLambda": "int",
"subsample": "int",
"subsampleFreq": "int",
"treeMethod": "string",
"withMean": "bool",
"withStd": "bool"
},
"limitSettings": {
"enableEarlyTermination": "bool",
"exitScore": "int",
"maxConcurrentTrials": "int",
"maxCoresPerTrial": "int",
"maxTrials": "int",
"sweepConcurrentTrials": "int",
"sweepTrials": "int",
"timeout": "string",
"trialTimeout": "string"
},
"nCrossValidations": {
"mode": "string"
// For remaining properties, see NCrossValidations objects
},
"positiveLabel": "string",
"primaryMetric": "string",
"searchSpace": [
{
"booster": "string",
"boostingType": "string",
"growPolicy": "string",
"learningRate": "string",
"maxBin": "string",
"maxDepth": "string",
"maxLeaves": "string",
"minDataInLeaf": "string",
"minSplitGain": "string",
"modelName": "string",
"nEstimators": "string",
"numLeaves": "string",
"preprocessorName": "string",
"regAlpha": "string",
"regLambda": "string",
"subsample": "string",
"subsampleFreq": "string",
"treeMethod": "string",
"withMean": "string",
"withStd": "string"
}
],
"sweepSettings": {
"earlyTermination": {
"delayEvaluation": "int",
"evaluationInterval": "int",
"policyType": "string"
// For remaining properties, see EarlyTerminationPolicy objects
},
"samplingAlgorithm": "string"
},
"taskType": "Classification",
"testData": {
"description": "string",
"jobInputType": "string",
"mode": "string",
"uri": "string"
},
"testDataSize": "int",
"trainingSettings": {
"allowedTrainingAlgorithms": [ "string" ],
"blockedTrainingAlgorithms": [ "string" ],
"enableDnnTraining": "bool",
"enableModelExplainability": "bool",
"enableOnnxCompatibleModels": "bool",
"enableStackEnsemble": "bool",
"enableVoteEnsemble": "bool",
"ensembleModelDownloadTimeout": "string",
"stackEnsembleSettings": {
"stackMetaLearnerKWargs": {},
"stackMetaLearnerTrainPercentage": "int",
"stackMetaLearnerType": "string"
}
},
"validationData": {
"description": "string",
"jobInputType": "string",
"mode": "string",
"uri": "string"
},
"validationDataSize": "int",
"weightColumnName": "string"
}
对于 预测,请使用:
{
"cvSplitColumnNames": [ "string" ],
"featurizationSettings": {
"blockedTransformers": [ "string" ],
"columnNameAndTypes": {
"{customized property}": "string"
},
"datasetLanguage": "string",
"enableDnnFeaturization": "bool",
"mode": "string",
"transformerParams": {
"{customized property}": [
{
"fields": [ "string" ],
"parameters": {}
}
]
}
},
"fixedParameters": {
"booster": "string",
"boostingType": "string",
"growPolicy": "string",
"learningRate": "int",
"maxBin": "int",
"maxDepth": "int",
"maxLeaves": "int",
"minDataInLeaf": "int",
"minSplitGain": "int",
"modelName": "string",
"nEstimators": "int",
"numLeaves": "int",
"preprocessorName": "string",
"regAlpha": "int",
"regLambda": "int",
"subsample": "int",
"subsampleFreq": "int",
"treeMethod": "string",
"withMean": "bool",
"withStd": "bool"
},
"forecastingSettings": {
"countryOrRegionForHolidays": "string",
"cvStepSize": "int",
"featureLags": "string",
"forecastHorizon": {
"mode": "string"
// For remaining properties, see ForecastHorizon objects
},
"frequency": "string",
"seasonality": {
"mode": "string"
// For remaining properties, see Seasonality objects
},
"shortSeriesHandlingConfig": "string",
"targetAggregateFunction": "string",
"targetLags": {
"mode": "string"
// For remaining properties, see TargetLags objects
},
"targetRollingWindowSize": {
"mode": "string"
// For remaining properties, see TargetRollingWindowSize objects
},
"timeColumnName": "string",
"timeSeriesIdColumnNames": [ "string" ],
"useStl": "string"
},
"limitSettings": {
"enableEarlyTermination": "bool",
"exitScore": "int",
"maxConcurrentTrials": "int",
"maxCoresPerTrial": "int",
"maxTrials": "int",
"sweepConcurrentTrials": "int",
"sweepTrials": "int",
"timeout": "string",
"trialTimeout": "string"
},
"nCrossValidations": {
"mode": "string"
// For remaining properties, see NCrossValidations objects
},
"primaryMetric": "string",
"searchSpace": [
{
"booster": "string",
"boostingType": "string",
"growPolicy": "string",
"learningRate": "string",
"maxBin": "string",
"maxDepth": "string",
"maxLeaves": "string",
"minDataInLeaf": "string",
"minSplitGain": "string",
"modelName": "string",
"nEstimators": "string",
"numLeaves": "string",
"preprocessorName": "string",
"regAlpha": "string",
"regLambda": "string",
"subsample": "string",
"subsampleFreq": "string",
"treeMethod": "string",
"withMean": "string",
"withStd": "string"
}
],
"sweepSettings": {
"earlyTermination": {
"delayEvaluation": "int",
"evaluationInterval": "int",
"policyType": "string"
// For remaining properties, see EarlyTerminationPolicy objects
},
"samplingAlgorithm": "string"
},
"taskType": "Forecasting",
"testData": {
"description": "string",
"jobInputType": "string",
"mode": "string",
"uri": "string"
},
"testDataSize": "int",
"trainingSettings": {
"allowedTrainingAlgorithms": [ "string" ],
"blockedTrainingAlgorithms": [ "string" ],
"enableDnnTraining": "bool",
"enableModelExplainability": "bool",
"enableOnnxCompatibleModels": "bool",
"enableStackEnsemble": "bool",
"enableVoteEnsemble": "bool",
"ensembleModelDownloadTimeout": "string",
"stackEnsembleSettings": {
"stackMetaLearnerKWargs": {},
"stackMetaLearnerTrainPercentage": "int",
"stackMetaLearnerType": "string"
}
},
"validationData": {
"description": "string",
"jobInputType": "string",
"mode": "string",
"uri": "string"
},
"validationDataSize": "int",
"weightColumnName": "string"
}
对于 ImageClassification,请使用:
{
"limitSettings": {
"maxConcurrentTrials": "int",
"maxTrials": "int",
"timeout": "string"
},
"modelSettings": {
"advancedSettings": "string",
"amsGradient": "bool",
"augmentations": "string",
"beta1": "int",
"beta2": "int",
"checkpointFrequency": "int",
"checkpointModel": {
"description": "string",
"jobInputType": "string",
"mode": "string",
"uri": "string"
},
"checkpointRunId": "string",
"distributed": "bool",
"earlyStopping": "bool",
"earlyStoppingDelay": "int",
"earlyStoppingPatience": "int",
"enableOnnxNormalization": "bool",
"evaluationFrequency": "int",
"gradientAccumulationStep": "int",
"layersToFreeze": "int",
"learningRate": "int",
"learningRateScheduler": "string",
"modelName": "string",
"momentum": "int",
"nesterov": "bool",
"numberOfEpochs": "int",
"numberOfWorkers": "int",
"optimizer": "string",
"randomSeed": "int",
"stepLRGamma": "int",
"stepLRStepSize": "int",
"trainingBatchSize": "int",
"trainingCropSize": "int",
"validationBatchSize": "int",
"validationCropSize": "int",
"validationResizeSize": "int",
"warmupCosineLRCycles": "int",
"warmupCosineLRWarmupEpochs": "int",
"weightDecay": "int",
"weightedLoss": "int"
},
"primaryMetric": "string",
"searchSpace": [
{
"amsGradient": "string",
"augmentations": "string",
"beta1": "string",
"beta2": "string",
"distributed": "string",
"earlyStopping": "string",
"earlyStoppingDelay": "string",
"earlyStoppingPatience": "string",
"enableOnnxNormalization": "string",
"evaluationFrequency": "string",
"gradientAccumulationStep": "string",
"layersToFreeze": "string",
"learningRate": "string",
"learningRateScheduler": "string",
"modelName": "string",
"momentum": "string",
"nesterov": "string",
"numberOfEpochs": "string",
"numberOfWorkers": "string",
"optimizer": "string",
"randomSeed": "string",
"stepLRGamma": "string",
"stepLRStepSize": "string",
"trainingBatchSize": "string",
"trainingCropSize": "string",
"validationBatchSize": "string",
"validationCropSize": "string",
"validationResizeSize": "string",
"warmupCosineLRCycles": "string",
"warmupCosineLRWarmupEpochs": "string",
"weightDecay": "string",
"weightedLoss": "string"
}
],
"sweepSettings": {
"earlyTermination": {
"delayEvaluation": "int",
"evaluationInterval": "int",
"policyType": "string"
// For remaining properties, see EarlyTerminationPolicy objects
},
"samplingAlgorithm": "string"
},
"taskType": "ImageClassification",
"validationData": {
"description": "string",
"jobInputType": "string",
"mode": "string",
"uri": "string"
},
"validationDataSize": "int"
}
对于 ImageClassificationMultilabel,请使用:
{
"limitSettings": {
"maxConcurrentTrials": "int",
"maxTrials": "int",
"timeout": "string"
},
"modelSettings": {
"advancedSettings": "string",
"amsGradient": "bool",
"augmentations": "string",
"beta1": "int",
"beta2": "int",
"checkpointFrequency": "int",
"checkpointModel": {
"description": "string",
"jobInputType": "string",
"mode": "string",
"uri": "string"
},
"checkpointRunId": "string",
"distributed": "bool",
"earlyStopping": "bool",
"earlyStoppingDelay": "int",
"earlyStoppingPatience": "int",
"enableOnnxNormalization": "bool",
"evaluationFrequency": "int",
"gradientAccumulationStep": "int",
"layersToFreeze": "int",
"learningRate": "int",
"learningRateScheduler": "string",
"modelName": "string",
"momentum": "int",
"nesterov": "bool",
"numberOfEpochs": "int",
"numberOfWorkers": "int",
"optimizer": "string",
"randomSeed": "int",
"stepLRGamma": "int",
"stepLRStepSize": "int",
"trainingBatchSize": "int",
"trainingCropSize": "int",
"validationBatchSize": "int",
"validationCropSize": "int",
"validationResizeSize": "int",
"warmupCosineLRCycles": "int",
"warmupCosineLRWarmupEpochs": "int",
"weightDecay": "int",
"weightedLoss": "int"
},
"primaryMetric": "string",
"searchSpace": [
{
"amsGradient": "string",
"augmentations": "string",
"beta1": "string",
"beta2": "string",
"distributed": "string",
"earlyStopping": "string",
"earlyStoppingDelay": "string",
"earlyStoppingPatience": "string",
"enableOnnxNormalization": "string",
"evaluationFrequency": "string",
"gradientAccumulationStep": "string",
"layersToFreeze": "string",
"learningRate": "string",
"learningRateScheduler": "string",
"modelName": "string",
"momentum": "string",
"nesterov": "string",
"numberOfEpochs": "string",
"numberOfWorkers": "string",
"optimizer": "string",
"randomSeed": "string",
"stepLRGamma": "string",
"stepLRStepSize": "string",
"trainingBatchSize": "string",
"trainingCropSize": "string",
"validationBatchSize": "string",
"validationCropSize": "string",
"validationResizeSize": "string",
"warmupCosineLRCycles": "string",
"warmupCosineLRWarmupEpochs": "string",
"weightDecay": "string",
"weightedLoss": "string"
}
],
"sweepSettings": {
"earlyTermination": {
"delayEvaluation": "int",
"evaluationInterval": "int",
"policyType": "string"
// For remaining properties, see EarlyTerminationPolicy objects
},
"samplingAlgorithm": "string"
},
"taskType": "ImageClassificationMultilabel",
"validationData": {
"description": "string",
"jobInputType": "string",
"mode": "string",
"uri": "string"
},
"validationDataSize": "int"
}
对于 ImageInstanceSegmentation,请使用:
{
"limitSettings": {
"maxConcurrentTrials": "int",
"maxTrials": "int",
"timeout": "string"
},
"modelSettings": {
"advancedSettings": "string",
"amsGradient": "bool",
"augmentations": "string",
"beta1": "int",
"beta2": "int",
"boxDetectionsPerImage": "int",
"boxScoreThreshold": "int",
"checkpointFrequency": "int",
"checkpointModel": {
"description": "string",
"jobInputType": "string",
"mode": "string",
"uri": "string"
},
"checkpointRunId": "string",
"distributed": "bool",
"earlyStopping": "bool",
"earlyStoppingDelay": "int",
"earlyStoppingPatience": "int",
"enableOnnxNormalization": "bool",
"evaluationFrequency": "int",
"gradientAccumulationStep": "int",
"imageSize": "int",
"layersToFreeze": "int",
"learningRate": "int",
"learningRateScheduler": "string",
"maxSize": "int",
"minSize": "int",
"modelName": "string",
"modelSize": "string",
"momentum": "int",
"multiScale": "bool",
"nesterov": "bool",
"nmsIouThreshold": "int",
"numberOfEpochs": "int",
"numberOfWorkers": "int",
"optimizer": "string",
"randomSeed": "int",
"stepLRGamma": "int",
"stepLRStepSize": "int",
"tileGridSize": "string",
"tileOverlapRatio": "int",
"tilePredictionsNmsThreshold": "int",
"trainingBatchSize": "int",
"validationBatchSize": "int",
"validationIouThreshold": "int",
"validationMetricType": "string",
"warmupCosineLRCycles": "int",
"warmupCosineLRWarmupEpochs": "int",
"weightDecay": "int"
},
"primaryMetric": "string",
"searchSpace": [
{
"amsGradient": "string",
"augmentations": "string",
"beta1": "string",
"beta2": "string",
"boxDetectionsPerImage": "string",
"boxScoreThreshold": "string",
"distributed": "string",
"earlyStopping": "string",
"earlyStoppingDelay": "string",
"earlyStoppingPatience": "string",
"enableOnnxNormalization": "string",
"evaluationFrequency": "string",
"gradientAccumulationStep": "string",
"imageSize": "string",
"layersToFreeze": "string",
"learningRate": "string",
"learningRateScheduler": "string",
"maxSize": "string",
"minSize": "string",
"modelName": "string",
"modelSize": "string",
"momentum": "string",
"multiScale": "string",
"nesterov": "string",
"nmsIouThreshold": "string",
"numberOfEpochs": "string",
"numberOfWorkers": "string",
"optimizer": "string",
"randomSeed": "string",
"stepLRGamma": "string",
"stepLRStepSize": "string",
"tileGridSize": "string",
"tileOverlapRatio": "string",
"tilePredictionsNmsThreshold": "string",
"trainingBatchSize": "string",
"validationBatchSize": "string",
"validationIouThreshold": "string",
"validationMetricType": "string",
"warmupCosineLRCycles": "string",
"warmupCosineLRWarmupEpochs": "string",
"weightDecay": "string"
}
],
"sweepSettings": {
"earlyTermination": {
"delayEvaluation": "int",
"evaluationInterval": "int",
"policyType": "string"
// For remaining properties, see EarlyTerminationPolicy objects
},
"samplingAlgorithm": "string"
},
"taskType": "ImageInstanceSegmentation",
"validationData": {
"description": "string",
"jobInputType": "string",
"mode": "string",
"uri": "string"
},
"validationDataSize": "int"
}
对于 ImageObjectDetection,请使用:
{
"limitSettings": {
"maxConcurrentTrials": "int",
"maxTrials": "int",
"timeout": "string"
},
"modelSettings": {
"advancedSettings": "string",
"amsGradient": "bool",
"augmentations": "string",
"beta1": "int",
"beta2": "int",
"boxDetectionsPerImage": "int",
"boxScoreThreshold": "int",
"checkpointFrequency": "int",
"checkpointModel": {
"description": "string",
"jobInputType": "string",
"mode": "string",
"uri": "string"
},
"checkpointRunId": "string",
"distributed": "bool",
"earlyStopping": "bool",
"earlyStoppingDelay": "int",
"earlyStoppingPatience": "int",
"enableOnnxNormalization": "bool",
"evaluationFrequency": "int",
"gradientAccumulationStep": "int",
"imageSize": "int",
"layersToFreeze": "int",
"learningRate": "int",
"learningRateScheduler": "string",
"maxSize": "int",
"minSize": "int",
"modelName": "string",
"modelSize": "string",
"momentum": "int",
"multiScale": "bool",
"nesterov": "bool",
"nmsIouThreshold": "int",
"numberOfEpochs": "int",
"numberOfWorkers": "int",
"optimizer": "string",
"randomSeed": "int",
"stepLRGamma": "int",
"stepLRStepSize": "int",
"tileGridSize": "string",
"tileOverlapRatio": "int",
"tilePredictionsNmsThreshold": "int",
"trainingBatchSize": "int",
"validationBatchSize": "int",
"validationIouThreshold": "int",
"validationMetricType": "string",
"warmupCosineLRCycles": "int",
"warmupCosineLRWarmupEpochs": "int",
"weightDecay": "int"
},
"primaryMetric": "string",
"searchSpace": [
{
"amsGradient": "string",
"augmentations": "string",
"beta1": "string",
"beta2": "string",
"boxDetectionsPerImage": "string",
"boxScoreThreshold": "string",
"distributed": "string",
"earlyStopping": "string",
"earlyStoppingDelay": "string",
"earlyStoppingPatience": "string",
"enableOnnxNormalization": "string",
"evaluationFrequency": "string",
"gradientAccumulationStep": "string",
"imageSize": "string",
"layersToFreeze": "string",
"learningRate": "string",
"learningRateScheduler": "string",
"maxSize": "string",
"minSize": "string",
"modelName": "string",
"modelSize": "string",
"momentum": "string",
"multiScale": "string",
"nesterov": "string",
"nmsIouThreshold": "string",
"numberOfEpochs": "string",
"numberOfWorkers": "string",
"optimizer": "string",
"randomSeed": "string",
"stepLRGamma": "string",
"stepLRStepSize": "string",
"tileGridSize": "string",
"tileOverlapRatio": "string",
"tilePredictionsNmsThreshold": "string",
"trainingBatchSize": "string",
"validationBatchSize": "string",
"validationIouThreshold": "string",
"validationMetricType": "string",
"warmupCosineLRCycles": "string",
"warmupCosineLRWarmupEpochs": "string",
"weightDecay": "string"
}
],
"sweepSettings": {
"earlyTermination": {
"delayEvaluation": "int",
"evaluationInterval": "int",
"policyType": "string"
// For remaining properties, see EarlyTerminationPolicy objects
},
"samplingAlgorithm": "string"
},
"taskType": "ImageObjectDetection",
"validationData": {
"description": "string",
"jobInputType": "string",
"mode": "string",
"uri": "string"
},
"validationDataSize": "int"
}
对于 回归,请使用:
{
"cvSplitColumnNames": [ "string" ],
"featurizationSettings": {
"blockedTransformers": [ "string" ],
"columnNameAndTypes": {
"{customized property}": "string"
},
"datasetLanguage": "string",
"enableDnnFeaturization": "bool",
"mode": "string",
"transformerParams": {
"{customized property}": [
{
"fields": [ "string" ],
"parameters": {}
}
]
}
},
"fixedParameters": {
"booster": "string",
"boostingType": "string",
"growPolicy": "string",
"learningRate": "int",
"maxBin": "int",
"maxDepth": "int",
"maxLeaves": "int",
"minDataInLeaf": "int",
"minSplitGain": "int",
"modelName": "string",
"nEstimators": "int",
"numLeaves": "int",
"preprocessorName": "string",
"regAlpha": "int",
"regLambda": "int",
"subsample": "int",
"subsampleFreq": "int",
"treeMethod": "string",
"withMean": "bool",
"withStd": "bool"
},
"limitSettings": {
"enableEarlyTermination": "bool",
"exitScore": "int",
"maxConcurrentTrials": "int",
"maxCoresPerTrial": "int",
"maxTrials": "int",
"sweepConcurrentTrials": "int",
"sweepTrials": "int",
"timeout": "string",
"trialTimeout": "string"
},
"nCrossValidations": {
"mode": "string"
// For remaining properties, see NCrossValidations objects
},
"primaryMetric": "string",
"searchSpace": [
{
"booster": "string",
"boostingType": "string",
"growPolicy": "string",
"learningRate": "string",
"maxBin": "string",
"maxDepth": "string",
"maxLeaves": "string",
"minDataInLeaf": "string",
"minSplitGain": "string",
"modelName": "string",
"nEstimators": "string",
"numLeaves": "string",
"preprocessorName": "string",
"regAlpha": "string",
"regLambda": "string",
"subsample": "string",
"subsampleFreq": "string",
"treeMethod": "string",
"withMean": "string",
"withStd": "string"
}
],
"sweepSettings": {
"earlyTermination": {
"delayEvaluation": "int",
"evaluationInterval": "int",
"policyType": "string"
// For remaining properties, see EarlyTerminationPolicy objects
},
"samplingAlgorithm": "string"
},
"taskType": "Regression",
"testData": {
"description": "string",
"jobInputType": "string",
"mode": "string",
"uri": "string"
},
"testDataSize": "int",
"trainingSettings": {
"allowedTrainingAlgorithms": [ "string" ],
"blockedTrainingAlgorithms": [ "string" ],
"enableDnnTraining": "bool",
"enableModelExplainability": "bool",
"enableOnnxCompatibleModels": "bool",
"enableStackEnsemble": "bool",
"enableVoteEnsemble": "bool",
"ensembleModelDownloadTimeout": "string",
"stackEnsembleSettings": {
"stackMetaLearnerKWargs": {},
"stackMetaLearnerTrainPercentage": "int",
"stackMetaLearnerType": "string"
}
},
"validationData": {
"description": "string",
"jobInputType": "string",
"mode": "string",
"uri": "string"
},
"validationDataSize": "int",
"weightColumnName": "string"
}
对于 TextClassification,请使用:
{
"featurizationSettings": {
"datasetLanguage": "string"
},
"fixedParameters": {
"gradientAccumulationSteps": "int",
"learningRate": "int",
"learningRateScheduler": "string",
"modelName": "string",
"numberOfEpochs": "int",
"trainingBatchSize": "int",
"validationBatchSize": "int",
"warmupRatio": "int",
"weightDecay": "int"
},
"limitSettings": {
"maxConcurrentTrials": "int",
"maxNodes": "int",
"maxTrials": "int",
"timeout": "string",
"trialTimeout": "string"
},
"primaryMetric": "string",
"searchSpace": [
{
"gradientAccumulationSteps": "string",
"learningRate": "string",
"learningRateScheduler": "string",
"modelName": "string",
"numberOfEpochs": "string",
"trainingBatchSize": "string",
"validationBatchSize": "string",
"warmupRatio": "string",
"weightDecay": "string"
}
],
"sweepSettings": {
"earlyTermination": {
"delayEvaluation": "int",
"evaluationInterval": "int",
"policyType": "string"
// For remaining properties, see EarlyTerminationPolicy objects
},
"samplingAlgorithm": "string"
},
"taskType": "TextClassification",
"validationData": {
"description": "string",
"jobInputType": "string",
"mode": "string",
"uri": "string"
}
}
对于 TextClassificationMultilabel,请使用:
{
"featurizationSettings": {
"datasetLanguage": "string"
},
"fixedParameters": {
"gradientAccumulationSteps": "int",
"learningRate": "int",
"learningRateScheduler": "string",
"modelName": "string",
"numberOfEpochs": "int",
"trainingBatchSize": "int",
"validationBatchSize": "int",
"warmupRatio": "int",
"weightDecay": "int"
},
"limitSettings": {
"maxConcurrentTrials": "int",
"maxNodes": "int",
"maxTrials": "int",
"timeout": "string",
"trialTimeout": "string"
},
"searchSpace": [
{
"gradientAccumulationSteps": "string",
"learningRate": "string",
"learningRateScheduler": "string",
"modelName": "string",
"numberOfEpochs": "string",
"trainingBatchSize": "string",
"validationBatchSize": "string",
"warmupRatio": "string",
"weightDecay": "string"
}
],
"sweepSettings": {
"earlyTermination": {
"delayEvaluation": "int",
"evaluationInterval": "int",
"policyType": "string"
// For remaining properties, see EarlyTerminationPolicy objects
},
"samplingAlgorithm": "string"
},
"taskType": "TextClassificationMultilabel",
"validationData": {
"description": "string",
"jobInputType": "string",
"mode": "string",
"uri": "string"
}
}
对于 TextNER,请使用:
{
"featurizationSettings": {
"datasetLanguage": "string"
},
"fixedParameters": {
"gradientAccumulationSteps": "int",
"learningRate": "int",
"learningRateScheduler": "string",
"modelName": "string",
"numberOfEpochs": "int",
"trainingBatchSize": "int",
"validationBatchSize": "int",
"warmupRatio": "int",
"weightDecay": "int"
},
"limitSettings": {
"maxConcurrentTrials": "int",
"maxNodes": "int",
"maxTrials": "int",
"timeout": "string",
"trialTimeout": "string"
},
"searchSpace": [
{
"gradientAccumulationSteps": "string",
"learningRate": "string",
"learningRateScheduler": "string",
"modelName": "string",
"numberOfEpochs": "string",
"trainingBatchSize": "string",
"validationBatchSize": "string",
"warmupRatio": "string",
"weightDecay": "string"
}
],
"sweepSettings": {
"earlyTermination": {
"delayEvaluation": "int",
"evaluationInterval": "int",
"policyType": "string"
// For remaining properties, see EarlyTerminationPolicy objects
},
"samplingAlgorithm": "string"
},
"taskType": "TextNER",
"validationData": {
"description": "string",
"jobInputType": "string",
"mode": "string",
"uri": "string"
}
}
TargetLags 对象
设置 模式 属性以指定对象的类型。
对于 自动,请使用:
{
"mode": "Auto"
}
对于 “自定义”,请使用:
{
"mode": "Custom",
"values": [ "int" ]
}
LabelingJobMediaProperties 对象
设置 mediaType 属性以指定对象的类型。
对于 映像,请使用:
{
"annotationType": "string",
"mediaType": "Image"
}
对于 文本,请使用:
{
"annotationType": "string",
"mediaType": "Text"
}
JobInput 对象
设置 jobInputType 属性以指定对象的类型。
对于 custom_model,请使用:
{
"jobInputType": "custom_model",
"mode": "string",
"uri": "string"
}
对于 文本,请使用:
{
"jobInputType": "literal",
"value": "string"
}
对于 mlflow_model,请使用:
{
"jobInputType": "mlflow_model",
"mode": "string",
"uri": "string"
}
对于 mltable,请使用:
{
"jobInputType": "mltable",
"mode": "string",
"uri": "string"
}
对于 triton_model,请使用:
{
"jobInputType": "triton_model",
"mode": "string",
"uri": "string"
}
对于 uri_file,请使用:
{
"jobInputType": "uri_file",
"mode": "string",
"uri": "string"
}
对于 uri_folder,请使用:
{
"jobInputType": "uri_folder",
"mode": "string",
"uri": "string"
}
JobBaseProperties 对象
设置 jobType 属性以指定对象的类型。
对于 AutoML,请使用:
{
"environmentId": "string",
"environmentVariables": {
"{customized property}": "string"
},
"jobType": "AutoML",
"outputs": {
"{customized property}": {
"description": "string",
"jobOutputType": "string"
// For remaining properties, see JobOutput objects
}
},
"resources": {
"dockerArgs": "string",
"instanceCount": "int",
"instanceType": "string",
"properties": {
"{customized property}": {}
},
"shmSize": "string"
},
"taskDetails": {
"logVerbosity": "string",
"targetColumnName": "string",
"trainingData": {
"description": "string",
"jobInputType": "string",
"mode": "string",
"uri": "string"
},
"taskType": "string"
// For remaining properties, see AutoMLVertical objects
}
}
对于 命令,请使用:
{
"autologgerSettings": {
"mlflowAutologger": "string"
},
"codeId": "string",
"command": "string",
"distribution": {
"distributionType": "string"
// For remaining properties, see DistributionConfiguration objects
},
"environmentId": "string",
"environmentVariables": {
"{customized property}": "string"
},
"inputs": {
"{customized property}": {
"description": "string",
"jobInputType": "string"
// For remaining properties, see JobInput objects
}
},
"jobType": "Command",
"limits": {
"jobLimitsType": "string",
"timeout": "string"
},
"outputs": {
"{customized property}": {
"description": "string",
"jobOutputType": "string"
// For remaining properties, see JobOutput objects
}
},
"resources": {
"dockerArgs": "string",
"instanceCount": "int",
"instanceType": "string",
"properties": {
"{customized property}": {}
},
"shmSize": "string"
}
}
对于 标记,请使用:
{
"dataConfiguration": {
"dataId": "string",
"incrementalDataRefreshEnabled": "bool"
},
"jobInstructions": {
"uri": "string"
},
"jobType": "Labeling",
"labelCategories": {
"{customized property}": {
"classes": {
"{customized property}": {
"displayName": "string",
"subclasses": {
"{customized property}": ...
}
}
},
"displayName": "string",
"multiSelectEnabled": "bool"
}
},
"labelingJobMediaProperties": {
"mediaType": "string"
// For remaining properties, see LabelingJobMediaProperties objects
},
"mlAssistConfiguration": {
"mlAssist": "string"
// For remaining properties, see MLAssistConfiguration objects
}
}
对于 管道,请使用:
{
"inputs": {
"{customized property}": {
"description": "string",
"jobInputType": "string"
// For remaining properties, see JobInput objects
}
},
"jobs": {
"{customized property}": {}
},
"jobType": "Pipeline",
"outputs": {
"{customized property}": {
"description": "string",
"jobOutputType": "string"
// For remaining properties, see JobOutput objects
}
},
"settings": {},
"sourceJobId": "string"
}
对于 Spark,请使用:
{
"archives": [ "string" ],
"args": "string",
"codeId": "string",
"conf": {
"{customized property}": "string"
},
"entry": {
"sparkJobEntryType": "string"
// For remaining properties, see SparkJobEntry objects
},
"environmentId": "string",
"files": [ "string" ],
"inputs": {
"{customized property}": {
"description": "string",
"jobInputType": "string"
// For remaining properties, see JobInput objects
}
},
"jars": [ "string" ],
"jobType": "Spark",
"outputs": {
"{customized property}": {
"description": "string",
"jobOutputType": "string"
// For remaining properties, see JobOutput objects
}
},
"pyFiles": [ "string" ],
"resources": {
"instanceType": "string",
"runtimeVersion": "string"
}
}
对于 扫描,请使用:
{
"earlyTermination": {
"delayEvaluation": "int",
"evaluationInterval": "int",
"policyType": "string"
// For remaining properties, see EarlyTerminationPolicy objects
},
"inputs": {
"{customized property}": {
"description": "string",
"jobInputType": "string"
// For remaining properties, see JobInput objects
}
},
"jobType": "Sweep",
"limits": {
"jobLimitsType": "string",
"maxConcurrentTrials": "int",
"maxTotalTrials": "int",
"timeout": "string",
"trialTimeout": "string"
},
"objective": {
"goal": "string",
"primaryMetric": "string"
},
"outputs": {
"{customized property}": {
"description": "string",
"jobOutputType": "string"
// For remaining properties, see JobOutput objects
}
},
"samplingAlgorithm": {
"samplingAlgorithmType": "string"
// For remaining properties, see SamplingAlgorithm objects
},
"searchSpace": {},
"trial": {
"codeId": "string",
"command": "string",
"distribution": {
"distributionType": "string"
// For remaining properties, see DistributionConfiguration objects
},
"environmentId": "string",
"environmentVariables": {
"{customized property}": "string"
},
"resources": {
"dockerArgs": "string",
"instanceCount": "int",
"instanceType": "string",
"properties": {
"{customized property}": {}
},
"shmSize": "string"
}
}
}
节点对象
设置 nodesValueType 属性以指定对象的类型。
对于 “全部”,请使用:
{
"nodesValueType": "All"
}
SamplingAlgorithm 对象
设置 samplingAlgorithmType 属性以指定对象的类型。
对于 Bayesian,请使用:
{
"samplingAlgorithmType": "Bayesian"
}
对于 网格,请使用:
{
"samplingAlgorithmType": "Grid"
}
对于 Random,请使用:
{
"rule": "string",
"samplingAlgorithmType": "Random",
"seed": "int"
}
NCrossValidations 对象
设置 模式 属性以指定对象的类型。
对于 自动,请使用:
{
"mode": "Auto"
}
对于 “自定义”,请使用:
{
"mode": "Custom",
"value": "int"
}
属性值
Microsoft.MachineLearningServices/workspaces/jobs
名称 | DESCRIPTION | 价值 |
---|---|---|
apiVersion | API 版本 | “2022-10-01-预览” |
姓名 | 资源名称 | 字符串 约束: 模式 = ^[a-zA-Z0-9][a-zA-Z0-9\-_]{0,254}$ (必需) |
属性 | [必需]实体的其他属性。 | JobBaseProperties (必需) |
类型 | 资源类型 | “Microsoft.MachineLearningServices/workspaces/jobs” |
所有节点
名称 | DESCRIPTION | 价值 |
---|---|---|
nodesValueType | [必需]Nodes 值的类型 | “全部”(必需) |
AmlToken
名称 | DESCRIPTION | 价值 |
---|---|---|
身份类型 | [必需]指定标识框架的类型。 | “AMLToken”(必需) |
自动预测地平线
名称 | DESCRIPTION | 价值 |
---|---|---|
模式 | [必需]设置预测地平线值选择模式。 | “Auto”(必需) |
Autologger 设置
名称 | DESCRIPTION | 价值 |
---|---|---|
mlflow自动记录器 | [必需]指示是否启用 mlflow 自动记录器。 | “Disabled” “Enabled”(必需) |
AutoMLJob
名称 | DESCRIPTION | 价值 |
---|---|---|
环境 ID | 作业的环境规范的 ARM 资源 ID。 这是一个可选值,如果未提供,AutoML 将在运行作业时将其默认为生产 AutoML 特选环境版本。 |
字符串 |
环境变量 | 作业中包含的环境变量。 | AutoMLJobEnvironmentVariables |
职位类型 | [必需]指定作业的类型。 | “AutoML”(必需) |
输出 | 作业中使用的输出数据绑定的映射。 | AutoMLJob 输出 |
资源 | 作业的计算资源配置。 | JobResourceConfiguration |
taskDetails | [必需]这表示可以是表/NLP/Image 之一的方案 | AutoMLVertical (必需) |
AutoMLJobEnvironmentVariables
名称 | DESCRIPTION | 价值 |
---|
AutoMLJob 输出
名称 | DESCRIPTION | 价值 |
---|
AutoMLVertical
名称 | DESCRIPTION | 价值 |
---|---|---|
logVerbosity (对数详细程度) | 作业的详细记录。 | “Critical” “Debug” “Error” “Info” “NotSet” “Warning” |
targetColumnName | 目标列名称:这是预测值列。 也称为分类任务的上下文中的标签列名称。 |
字符串 |
任务类型 | 设置为类型 “分类”的“分类”。 设置为“ 预测”类型。 设置为 ImageClassification 类型的“ImageClassification”。 设置为 ImageClassificationMultilabel 类型的“ImageClassificationMultilabel”。 设置为 ImageInstanceSegmentation 类型的“ImageInstanceSegmentation”。 设置为 ImageObjectDetection 类型的“ImageObjectDetection”。 设置为“ 回归”类型。 设置为 TextClassification 类型的“TextClassification”。 对于 TextClassificationMultilabel,设置为“TextClassificationMultilabel”。 设置为 TextNer 类型的“TextNER”。 | “Classification” “预测” “ImageClassification” “ImageClassificationMultilabel” “ImageInstanceSegmentation” “ImageObjectDetection” “回归” “TextClassification” “TextClassificationMultilabel” “TextNER”(必需) |
trainingData (训练数据) | [必需]训练数据输入。 | MLTableJobInput (必需) |
AutoNCross验证
名称 | DESCRIPTION | 价值 |
---|---|---|
模式 | [必需]用于确定 N 交叉验证的模式。 | “Auto”(必需) |
自动季节性
名称 | DESCRIPTION | 价值 |
---|---|---|
模式 | [必需]季节性模式。 | “Auto”(必需) |
AutoTargetLags 自动目标滞后
名称 | DESCRIPTION | 价值 |
---|---|---|
模式 | [必需]设置目标滞后模式 - 自动/自定义 | “Auto”(必需) |
AutoTargetRollingWindowSize (自动目标滚动窗口大小)
名称 | DESCRIPTION | 价值 |
---|---|---|
模式 | [必需]TargetRollingWindowSiz 检测模式。 | “Auto”(必需) |
BanditPolicy (强盗政策)
名称 | DESCRIPTION | 价值 |
---|---|---|
policyType | [必需]策略配置的名称 | “强盗”(必需) |
slackAmount | 从性能最佳的运行中允许的绝对距离。 | 整数 (int) |
slackFactor 的 | 与性能最佳的运行距离的允许距离比率。 | 整数 (int) |
BayesianSamplingAlgorithm
名称 | DESCRIPTION | 价值 |
---|---|---|
采样算法类型 | [必需]用于生成超参数值的算法以及配置属性 | “贝伊西亚”(必需) |
分类
名称 | DESCRIPTION | 价值 |
---|---|---|
cvSplitColumnNames | 用于 CVSplit 数据的列。 | 字符串[] |
featurizationSettings | AutoML 作业所需的特征化输入。 | TableVerticalFeaturizationSettings |
固定参数 | 在整个训练过程中将保持不变的模型/训练参数。 | TableFixedParameters (表固定参数) |
limitSettings | AutoMLJob 的执行约束。 | TableVerticalLimitSettings |
nCrossValidations | 要应用于训练数据集的交叉验证折叠数 如果未提供验证数据集,则为 。 |
NCross验证 |
积极标签 | 二进制指标计算的正标签。 | 字符串 |
primaryMetric | 任务的主要指标。 | “准确性” “AUCWeighted” “AveragePrecisionScoreWeighted” “NormMacroRecall” “PrecisionScoreWeighted” |
搜索空间 | 用于采样模型及其超参数的不同组合的搜索空间。 | TableParameterSubspace[] |
扫描设置 | 模型扫描和超参数优化的设置。 | TableSweepSettings (表格扫描设置) |
任务类型 | [必需]AutoMLJob 的任务类型。 | “分类”(必需) |
测试数据 | 测试数据输入。 | MLTableJobInput |
testDataSize | 需要为验证目的预留的测试数据集的分数。 介于 (0.0、 1.0) 之间的值 未提供验证数据集时应用。 |
整数 (int) |
trainingSettings | AutoML 作业训练阶段的输入。 | 分类训练设置 |
validationData (验证数据) | 验证数据输入。 | MLTableJobInput |
validationDataSize | 需要留出用于验证的定型数据集的分数。 介于 (0.0、 1.0) 之间的值 未提供验证数据集时应用。 |
整数 (int) |
权重列名称 | 示例权重列的名称。 自动化 ML 支持加权列作为输入,导致数据中的行向上或向下加权。 | 字符串 |
分类训练设置
名称 | DESCRIPTION | 价值 |
---|---|---|
allowedTrainingAlgorithms | 分类任务的允许模型。 | 包含任一项的字符串数组: “BernoulliNaiveBayes” “DecisionTree” “ExtremeRandomTrees” “GradientBoosting” “KNN” “LightGBM” “LinearSVM” “LogisticRegression” “MultinomialNaiveBayes” “RandomForest” “ZN” “SVM” “XGBoostClassifier” |
blockedTrainingAlgorithms | 分类任务的阻止模型。 | 包含任一项的字符串数组: “BernoulliNaiveBayes” “DecisionTree” “ExtremeRandomTrees” “GradientBoosting” “KNN” “LightGBM” “LinearSVM” “LogisticRegression” “MultinomialNaiveBayes” “RandomForest” “ZN” “SVM” “XGBoostClassifier” |
enableDnnTraining | 启用 DNN 模型的建议。 | 布尔 |
enableModelExplainability | 标志以在最佳模型上启用可解释性。 | 布尔 |
enableOnnxCompatibleModels | 用于启用 onnx 兼容模型的标志。 | 布尔 |
enableStackEnsemble | 启用堆栈合奏运行。 | 布尔 |
enableVoteEnsemble | 启用投票合奏运行。 | 布尔 |
ensembleModelDownloadTimeout | 在 VotingEnsemble 和 StackEnsemble 模型生成期间,将下载先前子运行中的多个拟合模型。 如果需要更多时间,请将此参数配置为大于 300 秒的值。 |
字符串 |
stackEnsembleSettings | 堆栈合奏的堆栈合奏设置。 | StackEnsembleSettings |
ColumnTransformer (列变换器)
名称 | DESCRIPTION | 价值 |
---|---|---|
字段 | 要应用转换器逻辑的字段。 | 字符串[] |
参数 | 要传递给转换器的不同属性。 输入应为 JSON 格式的键值对字典。 |
任何 |
CommandJob
名称 | DESCRIPTION | 价值 |
---|---|---|
autologger设置 | 作业的分发配置。 如果已设置,则应为 Mpi、Tensorflow、PyTorch 或 null 之一。 | Autologger 设置 |
代码 Id | 代码资产的 ARM 资源 ID。 | 字符串 |
指令 | [必需]在启动作业时执行的命令。 例如 “python train.py” | 字符串 约束: 最小长度 = 1 模式 = [a-zA-Z0-9_] (必需) |
分配 | 作业的分发配置。 如果已设置,则应为 Mpi、Tensorflow、PyTorch 或 null 之一。 | 分发配置 |
环境 ID | [必需]作业的环境规范的 ARM 资源 ID。 | 字符串 约束: 模式 = [a-zA-Z0-9_] (必需) |
环境变量 | 作业中包含的环境变量。 | CommandJobEnvironmentVariables |
输入 | 作业中使用的输入数据绑定的映射。 | CommandJobInputs 命令作业输入 |
职位类型 | [必需]指定作业的类型。 | “Command”(必需) |
限制 | 命令作业限制。 | CommandJobLimits 命令作业限制 |
输出 | 作业中使用的输出数据绑定的映射。 | CommandJobOutputs 命令作业输出 |
资源 | 作业的计算资源配置。 | JobResourceConfiguration |
CommandJobEnvironmentVariables
名称 | DESCRIPTION | 价值 |
---|
CommandJobInputs 命令作业输入
名称 | DESCRIPTION | 价值 |
---|
CommandJobLimits 命令作业限制
名称 | DESCRIPTION | 价值 |
---|---|---|
jobLimits类型 | [必需]JobLimit 类型。 | “Command” “扫描”(必需) |
超时 | ISO 8601 格式的最大运行持续时间,之后作业将被取消。 仅支持精度为秒的持续时间。 | 字符串 |
CommandJobOutputs 命令作业输出
名称 | DESCRIPTION | 价值 |
---|
CustomForecastHorizon
名称 | DESCRIPTION | 价值 |
---|---|---|
模式 | [必需]设置预测地平线值选择模式。 | “Custom”(必需) |
价值 | [必需]预测地平线值。 | int (必需) |
CustomModelJobInput (自定义模型作业输入)
名称 | DESCRIPTION | 价值 |
---|---|---|
jobInputType (作业输入类型) | [必需]指定作业的类型。 | “custom_model”(必需) |
模式 | 输入资产传送模式。 | “Direct” “下载” “EvalDownload” “EvalMount” “ReadOnlyMount” “ReadWriteMount” |
URI | [必需]输入资产 URI。 | 字符串 约束: 模式 = [a-zA-Z0-9_] (必需) |
CustomModelJobOutput
名称 | DESCRIPTION | 价值 |
---|---|---|
jobOutputType | [必需]指定作业的类型。 | “custom_model”(必需) |
模式 | 输出资产传送模式。 | “Direct” “ReadWriteMount” “Upload” |
URI | 输出资产 URI。 | 字符串 |
CustomNCross验证
名称 | DESCRIPTION | 价值 |
---|---|---|
模式 | [必需]用于确定 N 交叉验证的模式。 | “Custom”(必需) |
价值 | [必需]N 交叉验证值。 | int (必需) |
CustomSeasonality (自定义季节性)
名称 | DESCRIPTION | 价值 |
---|---|---|
模式 | [必需]季节性模式。 | “Custom”(必需) |
价值 | [必需]季节性值。 | int (必需) |
CustomTargetLags (自定义目标滞后)
名称 | DESCRIPTION | 价值 |
---|---|---|
模式 | [必需]设置目标滞后模式 - 自动/自定义 | “Custom”(必需) |
价值, 价值观 | [必需]设置目标滞后值。 | int[] (必需) |
CustomTargetRollingWindowSize
名称 | DESCRIPTION | 价值 |
---|---|---|
模式 | [必需]TargetRollingWindowSiz 检测模式。 | “Custom”(必需) |
价值 | [必需]TargetRollingWindowSize 值。 | int (必需) |
分发配置
名称 | DESCRIPTION | 价值 |
---|---|---|
distributionType | 对于 Mpi 类型,设置为“ Mpi”。 对于 PyTorch 类型,设置为“ PyTorch”。 设置为 TensorFlow 类型的“TensorFlow”。 | “Mpi” “PyTorch” “TensorFlow”(必需) |
提前终止政策
名称 | DESCRIPTION | 价值 |
---|---|---|
delay评估 | 延迟第一次计算的间隔数。 | 整数 (int) |
evaluationInterval | 策略评估之间的间隔(运行数)。 | 整数 (int) |
policyType | 设置为“ BanditPolicy”类型为“BanditPolicy”。 对于 MedianStoppingPolicy,设置为“MedianStoppingPolicy”。 对于 TruncationSelectionPolicy 类型,设置为“TruncationSelection”。 | “Bandit” “MedianStopping” “TruncationSelection”(必需) |
预测地平线
名称 | DESCRIPTION | 价值 |
---|---|---|
模式 | 设置为“ AutoForecastHorizon”类型。 设置为 CustomForecastHorizon 类型的“Custom”。 | “Auto” “Custom”(必需) |
预测
名称 | DESCRIPTION | 价值 |
---|---|---|
cvSplitColumnNames | 用于 CVSplit 数据的列。 | 字符串[] |
featurizationSettings | AutoML 作业所需的特征化输入。 | TableVerticalFeaturizationSettings |
固定参数 | 在整个训练过程中将保持不变的模型/训练参数。 | TableFixedParameters (表固定参数) |
forecasting设置 | 预测任务特定的输入。 | ForecastingSettings |
limitSettings | AutoMLJob 的执行约束。 | TableVerticalLimitSettings |
nCrossValidations | 要应用于训练数据集的交叉验证折叠数 如果未提供验证数据集,则为 。 |
NCross验证 |
primaryMetric | 预测任务的主要指标。 | “NormalizedMeanAbsoluteError” “NormalizedRootMeanSquaredError” “R2Score” 'SpearmanCorrelation' |
搜索空间 | 用于采样模型及其超参数的不同组合的搜索空间。 | TableParameterSubspace[] |
扫描设置 | 模型扫描和超参数优化的设置。 | TableSweepSettings (表格扫描设置) |
任务类型 | [必需]AutoMLJob 的任务类型。 | “预测”(必需) |
测试数据 | 测试数据输入。 | MLTableJobInput |
testDataSize | 需要为验证目的预留的测试数据集的分数。 介于 (0.0、 1.0) 之间的值 未提供验证数据集时应用。 |
整数 (int) |
trainingSettings | AutoML 作业训练阶段的输入。 | ForecastingTrainingSettings |
validationData (验证数据) | 验证数据输入。 | MLTableJobInput |
validationDataSize | 需要留出用于验证的定型数据集的分数。 介于 (0.0、 1.0) 之间的值 未提供验证数据集时应用。 |
整数 (int) |
权重列名称 | 示例权重列的名称。 自动化 ML 支持加权列作为输入,导致数据中的行向上或向下加权。 | 字符串 |
ForecastingSettings
名称 | DESCRIPTION | 价值 |
---|---|---|
国家/地区或地区为假期 | 用于预测任务的假日国家或地区。 这些代码应为 ISO 3166 双字母国家/地区代码,例如“US”或“GB”。 |
字符串 |
cvStepSize | 一个 CV 折叠的起始时间与下一个折叠之间的句点数。 为 例如,如果 CVStepSize = 3 表示每日数据,则每个折叠的源时间将为三天相隔。 |
整数 (int) |
featureLags | 使用“auto”或 null 为数值特征生成滞后的标志。 | “Auto” “None” |
forecastHorizon (预测地平线) | 所需最大预测范围(以时序频率单位为单位)。 | 预测地平线 |
频率 | 预测时,此参数表示需要预测的时间段,例如每日、每周、每年等。默认情况下,预测频率为数据集频率。 | 字符串 |
季节性 | 将时序季节性设置为序列频率的整数倍数。 如果季节性设置为“auto”,则会推断它。 |
季节性 |
shortSeriesHandlingConfig | 定义 AutoML 如何处理短时序的参数。 | “Auto” “掉落” “None” “Pad” |
targetAggregateFunction | 用于聚合符合用户指定频率的时序目标列的函数。 如果设置了 TargetAggregateFunction,即不是“None”,但未设置 freq 参数,则会引发错误。 可能的目标聚合函数包括:“sum”、“max”、“min”和“mean”。 |
“Max” “Mean” “Min” “None” “Sum” |
目标拉格 | 要从目标列滞后的过去时间段数。 | 目标滞后 |
targetRollingWindowSize | 用于创建目标列的滚动窗口平均值的过去时间段数。 | TargetRollingWindowSize |
timeColumnName (时间列名称) | 时间列的名称。 当预测在用于生成时序并推断其频率的输入数据中指定日期/时间列时,此参数是必需的。 | 字符串 |
timeSeriesIdColumnNames | 用于对时间序列进行分组的列的名称。 它可用于创建多个序列。 如果未定义粒度,则假定数据集为一个时序。 此参数用于任务类型预测。 |
字符串[] |
useStl | 配置时序目标列的 STL 分解。 | “None” “季度” “SeasonTrend” |
ForecastingTrainingSettings
名称 | DESCRIPTION | 价值 |
---|---|---|
allowedTrainingAlgorithms | 允许用于预测任务的模型。 | 包含任一项的字符串数组: “Arimax” “AutoArima” “Average” “DecisionTree” “ElasticNet” “ExponentialSmoothing” “ExtremeRandomTrees” “GradientBoosting” “KNN” “LassoLars” “LightGBM” “Naive” “先知” “RandomForest” “SeasonalAverage” “SeasonalNaive” “ZN” “TCNForecaster” “XGBoostRegressor” |
blockedTrainingAlgorithms | 用于预测任务的阻止模型。 | 包含任一项的字符串数组: “Arimax” “AutoArima” “Average” “DecisionTree” “ElasticNet” “ExponentialSmoothing” “ExtremeRandomTrees” “GradientBoosting” “KNN” “LassoLars” “LightGBM” “Naive” “先知” “RandomForest” “SeasonalAverage” “SeasonalNaive” “ZN” “TCNForecaster” “XGBoostRegressor” |
enableDnnTraining | 启用 DNN 模型的建议。 | 布尔 |
enableModelExplainability | 标志以在最佳模型上启用可解释性。 | 布尔 |
enableOnnxCompatibleModels | 用于启用 onnx 兼容模型的标志。 | 布尔 |
enableStackEnsemble | 启用堆栈合奏运行。 | 布尔 |
enableVoteEnsemble | 启用投票合奏运行。 | 布尔 |
ensembleModelDownloadTimeout | 在 VotingEnsemble 和 StackEnsemble 模型生成期间,将下载先前子运行中的多个拟合模型。 如果需要更多时间,请将此参数配置为大于 300 秒的值。 |
字符串 |
stackEnsembleSettings | 堆栈合奏的堆栈合奏设置。 | StackEnsembleSettings |
GridSampling算法
名称 | DESCRIPTION | 价值 |
---|---|---|
采样算法类型 | [必需]用于生成超参数值的算法以及配置属性 | “Grid”(必需) |
身份配置
名称 | DESCRIPTION | 价值 |
---|---|---|
身份类型 | 对于 AmlToken 类型,设置为“AMLToken”。 设置为 “ManagedIdentity”类型。 对于 UserIdentity 类型,设置为“UserIdentity”。 | “AMLToken” “Managed” “UserIdentity”(必需) |
图像分类
名称 | DESCRIPTION | 价值 |
---|---|---|
limitSettings | [必需]限制 AutoML 作业的设置。 | ImageLimitSettings (必需) |
modelSettings | 用于训练模型的设置。 | ImageModelSettings分类 |
primaryMetric | 要针对此任务进行优化的主要指标。 | “准确性” “AUCWeighted” “AveragePrecisionScoreWeighted” “NormMacroRecall” “PrecisionScoreWeighted” |
搜索空间 | 用于采样模型及其超参数的不同组合的搜索空间。 | ImageModelDistributionSettingsClassification[] |
扫描设置 | 模型扫描和超参数扫描相关设置。 | ImageSweepSettings (图像扫描设置) |
任务类型 | [必需]AutoMLJob 的任务类型。 | “ImageClassification”(必需) |
validationData (验证数据) | 验证数据输入。 | MLTableJobInput |
validationDataSize | 需要留出用于验证的定型数据集的分数。 介于 (0.0、 1.0) 之间的值 未提供验证数据集时应用。 |
整数 (int) |
ImageClassificationMultilabel
名称 | DESCRIPTION | 价值 |
---|---|---|
limitSettings | [必需]限制 AutoML 作业的设置。 | ImageLimitSettings (必需) |
modelSettings | 用于训练模型的设置。 | ImageModelSettings分类 |
primaryMetric | 要针对此任务进行优化的主要指标。 | “准确性” “AUCWeighted” “AveragePrecisionScoreWeighted” “IOU” “NormMacroRecall” “PrecisionScoreWeighted” |
搜索空间 | 用于采样模型及其超参数的不同组合的搜索空间。 | ImageModelDistributionSettingsClassification[] |
扫描设置 | 模型扫描和超参数扫描相关设置。 | ImageSweepSettings (图像扫描设置) |
任务类型 | [必需]AutoMLJob 的任务类型。 | “ImageClassificationMultilabel”(必需) |
validationData (验证数据) | 验证数据输入。 | MLTableJobInput |
validationDataSize | 需要留出用于验证的定型数据集的分数。 介于 (0.0、 1.0) 之间的值 未提供验证数据集时应用。 |
整数 (int) |
ImageInstanceSegmentation
名称 | DESCRIPTION | 价值 |
---|---|---|
limitSettings | [必需]限制 AutoML 作业的设置。 | ImageLimitSettings (必需) |
modelSettings | 用于训练模型的设置。 | ImageModelSettingsObjectDetection |
primaryMetric | 要针对此任务进行优化的主要指标。 | “MeanAveragePrecision” |
搜索空间 | 用于采样模型及其超参数的不同组合的搜索空间。 | ImageModelDistributionSettingsObjectDetection[] |
扫描设置 | 模型扫描和超参数扫描相关设置。 | ImageSweepSettings (图像扫描设置) |
任务类型 | [必需]AutoMLJob 的任务类型。 | “ImageInstanceSegmentation”(必需) |
validationData (验证数据) | 验证数据输入。 | MLTableJobInput |
validationDataSize | 需要留出用于验证的定型数据集的分数。 介于 (0.0、 1.0) 之间的值 未提供验证数据集时应用。 |
整数 (int) |
ImageLimitSettings
名称 | DESCRIPTION | 价值 |
---|---|---|
maxConcurrentTrials | 最大并发 AutoML 迭代数。 | 整数 (int) |
maxTrials | AutoML 迭代的最大数目。 | 整数 (int) |
超时 | AutoML 作业超时。 | 字符串 |
ImageModelDistributionSettings分类
名称 | DESCRIPTION | 价值 |
---|---|---|
amsGradient | 优化器为“adam”或“adamw”时启用 AMSGrad。 | 字符串 |
扩充 | 使用扩充的设置。 | 字符串 |
贝塔1 | 优化器为“adam”或“adamw”时“beta1”的值。 必须是 [0, 1] 范围内的浮点。 | 字符串 |
贝塔2 | 优化器为“adam”或“adamw”时“beta2”的值。 必须是 [0, 1] 范围内的浮点。 | 字符串 |
分散式 | 是否使用分布式程序训练。 | 字符串 |
earlyStopping (早期停止) | 在训练期间启用提前停止逻辑。 | 字符串 |
earlyStoppingDelay | 在主要指标改进之前等待的最小纪元数或验证评估数 跟踪早期停止。 必须是正整数。 |
字符串 |
早点停止耐心 | 之前没有主要指标改进的最小纪元或验证评估数 运行已停止。 必须是正整数。 |
字符串 |
enableOnnxNormalization | 导出 ONNX 模型时启用规范化。 | 字符串 |
evaluationFrequency | 评估验证数据集以获取指标分数的频率。 必须是正整数。 | 字符串 |
梯度累积步骤 | 渐变累积意味着在不运行配置数量的“GradAccumulationStep”步骤的情况下 更新模型权重,同时累积这些步骤的渐变,然后使用 用于计算权重更新的累积渐变。 必须是正整数。 |
字符串 |
layersToFreeze (图层冻结) | 要冻结模型的层数。 必须是正整数。 例如,将 2 作为“seresnext”的值传递意味着 冻结 layer0 和 layer1。 有关支持的模型的完整列表以及有关层冻结的详细信息,请 请参阅:/azure/machine-learning/how-to-auto-train-image-models。 |
字符串 |
learningRate | 初始学习速率。 必须是 [0, 1] 范围内的浮点。 | 字符串 |
learningRateScheduler 的 | 学习速率计划程序的类型。 必须是“warmup_cosine”或“step”。 | 字符串 |
模型名称 | 要用于训练的模型的名称。 有关可用模型的详细信息,请访问官方文档: /azure/machine-learning/how-to-auto-train-image-models。 |
字符串 |
动量 | 优化器为“zn”时的动量值。 必须是 [0, 1] 范围内的浮点。 | 字符串 |
涅斯特罗夫 | 优化器为“zn”时启用 nesterov。 | 字符串 |
纪元数 | 训练纪元数。 必须是正整数。 | 字符串 |
工人数 | 数据加载程序辅助角色数。 必须是非负整数。 | 字符串 |
优化器 | 优化器的类型。 必须是“zn”、“adam”或“adamw”。 | 字符串 |
随机种子 | 使用确定性训练时要使用的随机种子。 | 字符串 |
stepLR伽玛 | 当学习速率计划程序为“step”时,gamma 的值。 必须是 [0, 1] 范围内的浮点。 | 字符串 |
stepLRStepSize | 学习速率计划程序为“step”时步骤大小的值。 必须是正整数。 | 字符串 |
trainingBatchSize | 训练批大小。 必须是正整数。 | 字符串 |
trainingCropSize | 训练数据集的神经网络输入的图像裁剪大小。 必须是正整数。 | 字符串 |
validationBatchSize | 验证批大小。 必须是正整数。 | 字符串 |
validationCropSize | 输入到神经网络的验证数据集的图像裁剪大小。 必须是正整数。 | 字符串 |
validationResizeSize | 在裁剪验证数据集之前要调整其大小的图像大小。 必须是正整数。 | 字符串 |
warmupCosineLRCycles | 学习速率计划程序为“warmup_cosine”时的余弦周期值。 必须是 [0, 1] 范围内的浮点。 | 字符串 |
warmupCosineLRWarmupEpochs | 当学习速率计划程序为“warmup_cosine”时,预热时期的值。 必须是正整数。 | 字符串 |
weightDecay (权重衰减) | 优化器为“zn”、“adam”或“adamw”时的权重衰减值。 必须是范围[0, 1] 中的浮点。 | 字符串 |
weightedLoss | 减肥。 对于无加权损失,接受的值为 0。 1 用于与 sqrt 一起减肥。(class_weights)。 2 用于减肥与class_weights。 必须为 0 或 1 或 2。 |
字符串 |
ImageModelDistributionSettingsObjectDetection
名称 | DESCRIPTION | 价值 |
---|---|---|
amsGradient | 优化器为“adam”或“adamw”时启用 AMSGrad。 | 字符串 |
扩充 | 使用扩充的设置。 | 字符串 |
贝塔1 | 优化器为“adam”或“adamw”时“beta1”的值。 必须是 [0, 1] 范围内的浮点。 | 字符串 |
贝塔2 | 优化器为“adam”或“adamw”时“beta2”的值。 必须是 [0, 1] 范围内的浮点。 | 字符串 |
boxDetectionsPerImage (每图像检测) | 每个图像的最大检测数,适用于所有类。 必须是正整数。 注意:“yolov5”算法不支持此设置。 |
字符串 |
boxScoreThreshold (盒分数阈值) | 在推理期间,仅返回分类分数大于 BoxScoreThreshold。 必须是范围[0, 1] 中的浮点。 |
字符串 |
分散式 | 是否使用分布式程序训练。 | 字符串 |
earlyStopping (早期停止) | 在训练期间启用提前停止逻辑。 | 字符串 |
earlyStoppingDelay | 在主要指标改进之前等待的最小纪元数或验证评估数 跟踪早期停止。 必须是正整数。 |
字符串 |
早点停止耐心 | 之前没有主要指标改进的最小纪元或验证评估数 运行已停止。 必须是正整数。 |
字符串 |
enableOnnxNormalization | 导出 ONNX 模型时启用规范化。 | 字符串 |
evaluationFrequency | 评估验证数据集以获取指标分数的频率。 必须是正整数。 | 字符串 |
梯度累积步骤 | 渐变累积意味着在不运行配置数量的“GradAccumulationStep”步骤的情况下 更新模型权重,同时累积这些步骤的渐变,然后使用 用于计算权重更新的累积渐变。 必须是正整数。 |
字符串 |
图像大小 | 用于训练和验证的图像大小。 必须是正整数。 注意:如果大小太大,训练运行可能会进入 CUDA OOM。 注意:仅“yolov5”算法支持此设置。 |
字符串 |
layersToFreeze (图层冻结) | 要冻结模型的层数。 必须是正整数。 例如,将 2 作为“seresnext”的值传递意味着 冻结 layer0 和 layer1。 有关支持的模型的完整列表以及有关层冻结的详细信息,请 请参阅:/azure/machine-learning/how-to-auto-train-image-models。 |
字符串 |
learningRate | 初始学习速率。 必须是 [0, 1] 范围内的浮点。 | 字符串 |
learningRateScheduler 的 | 学习速率计划程序的类型。 必须是“warmup_cosine”或“step”。 | 字符串 |
最大大小 | 将图像馈送至主干之前要重新缩放的最大大小。 必须是正整数。 注意:如果大小太大,训练运行可能会进入 CUDA OOM。 注意:“yolov5”算法不支持此设置。 |
字符串 |
最小大小 | 将图像馈送到主干之前要重新缩放的最小大小。 必须是正整数。 注意:如果大小太大,训练运行可能会进入 CUDA OOM。 注意:“yolov5”算法不支持此设置。 |
字符串 |
模型名称 | 要用于训练的模型的名称。 有关可用模型的详细信息,请访问官方文档: /azure/machine-learning/how-to-auto-train-image-models。 |
字符串 |
modelSize | 模型大小。 必须是“small”、“medium”、“large”或“xlarge”。 注意:如果模型大小太大,训练运行可能会进入 CUDA OOM。 注意:仅“yolov5”算法支持此设置。 |
字符串 |
动量 | 优化器为“zn”时的动量值。 必须是 [0, 1] 范围内的浮点。 | 字符串 |
多尺度 | 按 +/- 50%的不同图像大小启用多缩放图像。 注意:如果没有足够的 GPU 内存,训练运行可能会进入 CUDA OOM。 注意:仅“yolov5”算法支持此设置。 |
字符串 |
涅斯特罗夫 | 优化器为“zn”时启用 nesterov。 | 字符串 |
nmsIouThreshold | 在 NMS 后期处理的推理期间使用的 IOU 阈值。 必须在 [0, 1] 范围内浮动。 | 字符串 |
纪元数 | 训练纪元数。 必须是正整数。 | 字符串 |
工人数 | 数据加载程序辅助角色数。 必须是非负整数。 | 字符串 |
优化器 | 优化器的类型。 必须是“zn”、“adam”或“adamw”。 | 字符串 |
随机种子 | 使用确定性训练时要使用的随机种子。 | 字符串 |
stepLR伽玛 | 当学习速率计划程序为“step”时,gamma 的值。 必须是 [0, 1] 范围内的浮点。 | 字符串 |
stepLRStepSize | 学习速率计划程序为“step”时步骤大小的值。 必须是正整数。 | 字符串 |
tileGridSize (平铺网格大小) | 用于平铺每个图像的网格大小。 注意:TileGridSize 不得为 无可启用小型对象检测逻辑。 一个字符串,其中包含两个整数(采用格式)。 注意:“yolov5”算法不支持此设置。 |
字符串 |
tileOverlapRatio (平铺重叠比率) | 每个维度中相邻磁贴之间的重叠比率。 必须在 [0, 1] 范围内浮动。 注意:“yolov5”算法不支持此设置。 |
字符串 |
tilePredictionsNmsThreshold | 用于执行 NMS 的 IOU 阈值,同时合并来自磁贴和图像的预测。 用于验证/推理。 必须在 [0, 1] 范围内浮动。 注意:“yolov5”算法不支持此设置。 NMS:非最大抑制 |
字符串 |
trainingBatchSize | 训练批大小。 必须是正整数。 | 字符串 |
validationBatchSize | 验证批大小。 必须是正整数。 | 字符串 |
validationIouThreshold | 计算验证指标时要使用的 IOU 阈值。 必须在 [0, 1] 范围内浮动。 | 字符串 |
validationMetricType | 用于验证指标的指标计算方法。 必须是“none”、“coco”、“voc”或“coco_voc”。 | 字符串 |
warmupCosineLRCycles | 学习速率计划程序为“warmup_cosine”时的余弦周期值。 必须是 [0, 1] 范围内的浮点。 | 字符串 |
warmupCosineLRWarmupEpochs | 当学习速率计划程序为“warmup_cosine”时,预热时期的值。 必须是正整数。 | 字符串 |
weightDecay (权重衰减) | 优化器为“zn”、“adam”或“adamw”时的权重衰减值。 必须是范围[0, 1] 中的浮点。 | 字符串 |
ImageModelSettings分类
名称 | DESCRIPTION | 价值 |
---|---|---|
高级设置 | 高级方案的设置。 | 字符串 |
amsGradient | 优化器为“adam”或“adamw”时启用 AMSGrad。 | 布尔 |
扩充 | 使用扩充的设置。 | 字符串 |
贝塔1 | 优化器为“adam”或“adamw”时“beta1”的值。 必须是 [0, 1] 范围内的浮点。 | 整数 (int) |
贝塔2 | 优化器为“adam”或“adamw”时“beta2”的值。 必须是 [0, 1] 范围内的浮点。 | 整数 (int) |
检查点频率 | 存储模型检查点的频率。 必须是正整数。 | 整数 (int) |
checkpoint模型 | 用于增量训练的预先训练检查点模型。 | MLFlowModelJobInput |
检查点RunId | 上一次运行的 ID,该运行具有用于增量训练的预先训练检查点。 | 字符串 |
分散式 | 是否使用分布式训练。 | 布尔 |
earlyStopping (早期停止) | 在训练期间启用提前停止逻辑。 | 布尔 |
earlyStoppingDelay | 在主要指标改进之前等待的最小纪元数或验证评估数 跟踪早期停止。 必须是正整数。 |
整数 (int) |
早点停止耐心 | 之前没有主要指标改进的最小纪元或验证评估数 运行已停止。 必须是正整数。 |
整数 (int) |
enableOnnxNormalization | 导出 ONNX 模型时启用规范化。 | 布尔 |
evaluationFrequency | 评估验证数据集以获取指标分数的频率。 必须是正整数。 | 整数 (int) |
梯度累积步骤 | 渐变累积意味着在不运行配置数量的“GradAccumulationStep”步骤的情况下 更新模型权重,同时累积这些步骤的渐变,然后使用 用于计算权重更新的累积渐变。 必须是正整数。 |
整数 (int) |
layersToFreeze (图层冻结) | 要冻结模型的层数。 必须是正整数。 例如,将 2 作为“seresnext”的值传递意味着 冻结 layer0 和 layer1。 有关支持的模型的完整列表以及有关层冻结的详细信息,请 请参阅:/azure/machine-learning/how-to-auto-train-image-models。 |
整数 (int) |
learningRate | 初始学习速率。 必须是 [0, 1] 范围内的浮点。 | 整数 (int) |
learningRateScheduler 的 | 学习速率计划程序的类型。 必须是“warmup_cosine”或“step”。 | “None” “Step” “WarmupCosine” |
模型名称 | 要用于训练的模型的名称。 有关可用模型的详细信息,请访问官方文档: /azure/machine-learning/how-to-auto-train-image-models。 |
字符串 |
动量 | 优化器为“zn”时的动量值。 必须是 [0, 1] 范围内的浮点。 | 整数 (int) |
涅斯特罗夫 | 优化器为“zn”时启用 nesterov。 | 布尔 |
纪元数 | 训练纪元数。 必须是正整数。 | 整数 (int) |
工人数 | 数据加载程序辅助角色数。 必须是非负整数。 | 整数 (int) |
优化器 | 优化器的类型。 | “Adam” “Adamw” “None” “Zn” |
随机种子 | 使用确定性训练时要使用的随机种子。 | 整数 (int) |
stepLR伽玛 | 当学习速率计划程序为“step”时,gamma 的值。 必须是 [0, 1] 范围内的浮点。 | 整数 (int) |
stepLRStepSize | 学习速率计划程序为“step”时步骤大小的值。 必须是正整数。 | 整数 (int) |
trainingBatchSize | 训练批大小。 必须是正整数。 | 整数 (int) |
trainingCropSize | 训练数据集的神经网络输入的图像裁剪大小。 必须是正整数。 | 整数 (int) |
validationBatchSize | 验证批大小。 必须是正整数。 | 整数 (int) |
validationCropSize | 输入到神经网络的验证数据集的图像裁剪大小。 必须是正整数。 | 整数 (int) |
validationResizeSize | 在裁剪验证数据集之前要调整其大小的图像大小。 必须是正整数。 | 整数 (int) |
warmupCosineLRCycles | 学习速率计划程序为“warmup_cosine”时的余弦周期值。 必须是 [0, 1] 范围内的浮点。 | 整数 (int) |
warmupCosineLRWarmupEpochs | 当学习速率计划程序为“warmup_cosine”时,预热时期的值。 必须是正整数。 | 整数 (int) |
weightDecay (权重衰减) | 优化器为“zn”、“adam”或“adamw”时的权重衰减值。 必须是范围[0, 1] 中的浮点。 | 整数 (int) |
weightedLoss | 减肥。 对于无加权损失,接受的值为 0。 1 用于与 sqrt 一起减肥。(class_weights)。 2 用于减肥与class_weights。 必须为 0 或 1 或 2。 |
整数 (int) |
ImageModelSettingsObjectDetection
名称 | DESCRIPTION | 价值 |
---|---|---|
高级设置 | 高级方案的设置。 | 字符串 |
amsGradient | 优化器为“adam”或“adamw”时启用 AMSGrad。 | 布尔 |
扩充 | 使用扩充的设置。 | 字符串 |
贝塔1 | 优化器为“adam”或“adamw”时“beta1”的值。 必须是 [0, 1] 范围内的浮点。 | 整数 (int) |
贝塔2 | 优化器为“adam”或“adamw”时“beta2”的值。 必须是 [0, 1] 范围内的浮点。 | 整数 (int) |
boxDetectionsPerImage (每图像检测) | 每个图像的最大检测数,适用于所有类。 必须是正整数。 注意:“yolov5”算法不支持此设置。 |
整数 (int) |
boxScoreThreshold (盒分数阈值) | 在推理期间,仅返回分类分数大于 BoxScoreThreshold。 必须是范围[0, 1] 中的浮点。 |
整数 (int) |
检查点频率 | 存储模型检查点的频率。 必须是正整数。 | 整数 (int) |
checkpoint模型 | 用于增量训练的预先训练检查点模型。 | MLFlowModelJobInput |
检查点RunId | 上一次运行的 ID,该运行具有用于增量训练的预先训练检查点。 | 字符串 |
分散式 | 是否使用分布式训练。 | 布尔 |
earlyStopping (早期停止) | 在训练期间启用提前停止逻辑。 | 布尔 |
earlyStoppingDelay | 在主要指标改进之前等待的最小纪元数或验证评估数 跟踪早期停止。 必须是正整数。 |
整数 (int) |
早点停止耐心 | 之前没有主要指标改进的最小纪元或验证评估数 运行已停止。 必须是正整数。 |
整数 (int) |
enableOnnxNormalization | 导出 ONNX 模型时启用规范化。 | 布尔 |
evaluationFrequency | 评估验证数据集以获取指标分数的频率。 必须是正整数。 | 整数 (int) |
梯度累积步骤 | 渐变累积意味着在不运行配置数量的“GradAccumulationStep”步骤的情况下 更新模型权重,同时累积这些步骤的渐变,然后使用 用于计算权重更新的累积渐变。 必须是正整数。 |
整数 (int) |
图像大小 | 用于训练和验证的图像大小。 必须是正整数。 注意:如果大小太大,训练运行可能会进入 CUDA OOM。 注意:仅“yolov5”算法支持此设置。 |
整数 (int) |
layersToFreeze (图层冻结) | 要冻结模型的层数。 必须是正整数。 例如,将 2 作为“seresnext”的值传递意味着 冻结 layer0 和 layer1。 有关支持的模型的完整列表以及有关层冻结的详细信息,请 请参阅:/azure/machine-learning/how-to-auto-train-image-models。 |
整数 (int) |
learningRate | 初始学习速率。 必须是 [0, 1] 范围内的浮点。 | 整数 (int) |
learningRateScheduler 的 | 学习速率计划程序的类型。 必须是“warmup_cosine”或“step”。 | “None” “Step” “WarmupCosine” |
最大大小 | 将图像馈送至主干之前要重新缩放的最大大小。 必须是正整数。 注意:如果大小太大,训练运行可能会进入 CUDA OOM。 注意:“yolov5”算法不支持此设置。 |
整数 (int) |
最小大小 | 将图像馈送到主干之前要重新缩放的最小大小。 必须是正整数。 注意:如果大小太大,训练运行可能会进入 CUDA OOM。 注意:“yolov5”算法不支持此设置。 |
整数 (int) |
模型名称 | 要用于训练的模型的名称。 有关可用模型的详细信息,请访问官方文档: /azure/machine-learning/how-to-auto-train-image-models。 |
字符串 |
modelSize | 模型大小。 必须是“small”、“medium”、“large”或“xlarge”。 注意:如果模型大小太大,训练运行可能会进入 CUDA OOM。 注意:仅“yolov5”算法支持此设置。 |
“ExtraLarge” “Large” “Medium” “None” “Small” |
动量 | 优化器为“zn”时的动量值。 必须是 [0, 1] 范围内的浮点。 | 整数 (int) |
多尺度 | 按 +/- 50%的不同图像大小启用多缩放图像。 注意:如果没有足够的 GPU 内存,训练运行可能会进入 CUDA OOM。 注意:仅“yolov5”算法支持此设置。 |
布尔 |
涅斯特罗夫 | 优化器为“zn”时启用 nesterov。 | 布尔 |
nmsIouThreshold | 在 NMS 后期处理的推理期间使用的 IOU 阈值。 必须是 [0, 1] 范围内的浮点。 | 整数 (int) |
纪元数 | 训练纪元数。 必须是正整数。 | 整数 (int) |
工人数 | 数据加载程序辅助角色数。 必须是非负整数。 | 整数 (int) |
优化器 | 优化器的类型。 | “Adam” “Adamw” “None” “Zn” |
随机种子 | 使用确定性训练时要使用的随机种子。 | 整数 (int) |
stepLR伽玛 | 当学习速率计划程序为“step”时,gamma 的值。 必须是 [0, 1] 范围内的浮点。 | 整数 (int) |
stepLRStepSize | 学习速率计划程序为“step”时步骤大小的值。 必须是正整数。 | 整数 (int) |
tileGridSize (平铺网格大小) | 用于平铺每个图像的网格大小。 注意:TileGridSize 不得为 无可启用小型对象检测逻辑。 一个字符串,其中包含两个整数(采用格式)。 注意:“yolov5”算法不支持此设置。 |
字符串 |
tileOverlapRatio (平铺重叠比率) | 每个维度中相邻磁贴之间的重叠比率。 必须在 [0, 1] 范围内浮动。 注意:“yolov5”算法不支持此设置。 |
整数 (int) |
tilePredictionsNmsThreshold | 用于执行 NMS 的 IOU 阈值,同时合并来自磁贴和图像的预测。 用于验证/推理。 必须在 [0, 1] 范围内浮动。 注意:“yolov5”算法不支持此设置。 |
整数 (int) |
trainingBatchSize | 训练批大小。 必须是正整数。 | 整数 (int) |
validationBatchSize | 验证批大小。 必须是正整数。 | 整数 (int) |
validationIouThreshold | 计算验证指标时要使用的 IOU 阈值。 必须在 [0, 1] 范围内浮动。 | 整数 (int) |
validationMetricType | 用于验证指标的指标计算方法。 | “Coco” “CocoVoc” “None” “Voc” |
warmupCosineLRCycles | 学习速率计划程序为“warmup_cosine”时的余弦周期值。 必须是 [0, 1] 范围内的浮点。 | 整数 (int) |
warmupCosineLRWarmupEpochs | 当学习速率计划程序为“warmup_cosine”时,预热时期的值。 必须是正整数。 | 整数 (int) |
weightDecay (权重衰减) | 优化器为“zn”、“adam”或“adamw”时的权重衰减值。 必须是范围[0, 1] 中的浮点。 | 整数 (int) |
ImageObjectDetection
名称 | DESCRIPTION | 价值 |
---|---|---|
limitSettings | [必需]限制 AutoML 作业的设置。 | ImageLimitSettings (必需) |
modelSettings | 用于训练模型的设置。 | ImageModelSettingsObjectDetection |
primaryMetric | 要针对此任务进行优化的主要指标。 | “MeanAveragePrecision” |
搜索空间 | 用于采样模型及其超参数的不同组合的搜索空间。 | ImageModelDistributionSettingsObjectDetection[] |
扫描设置 | 模型扫描和超参数扫描相关设置。 | ImageSweepSettings (图像扫描设置) |
任务类型 | [必需]AutoMLJob 的任务类型。 | “ImageObjectDetection”(必需) |
validationData (验证数据) | 验证数据输入。 | MLTableJobInput |
validationDataSize | 需要留出用于验证的定型数据集的分数。 介于 (0.0、 1.0) 之间的值 未提供验证数据集时应用。 |
整数 (int) |
ImageSweepSettings (图像扫描设置)
名称 | DESCRIPTION | 价值 |
---|---|---|
early终止 | 提前终止策略的类型。 | 提前终止政策 |
sampling算法 | [必需]超参数采样算法的类型。 | “贝贝西亚语” “Grid” “Random”(必需) |
JobBaseProperties
名称 | DESCRIPTION | 价值 |
---|---|---|
组件 ID | 组件资源的 ARM 资源 ID。 | 字符串 |
计算 ID | 计算资源的 ARM 资源 ID。 | 字符串 |
描述 | 资产说明文本。 | 字符串 |
displayName (显示名称) | 作业的显示名称。 | 字符串 |
实验名称 | 作业所属的试验的名称。 如果未设置,作业将放置在“默认”试验中。 | 字符串 |
标识 | 标识配置。 如果已设置,则应为 AmlToken、ManagedIdentity、UserIdentity 或 null 之一。 如果为 null,则默认为 AmlToken。 |
身份配置 |
isArchived 已存档 | 资产是否已存档? | 布尔 |
职位类型 | 设置为 AutoMLJob 类型的“AutoML”。 设置为 CommandJob 类型的“Command”。 设置为 “LabelingJobProperties”类型的“标记”。 设置为 PipelineJob 类型的“Pipeline”。 设置为“ SparkJob”类型的“Spark”。 设置为“ SweepJob”类型。 | “AutoML” “Command” “标记” “Pipeline” “Spark” “扫描”(必需) |
属性 | 资产属性字典。 | ResourceBaseProperties |
服务 | JobEndpoints 列表。 对于本地作业,作业终结点的终结点值为 FileStreamObject。 |
JobBase服务 |
标签 | 标记字典。 可以添加、删除和更新标记。 | ResourceBaseTags |
JobBase服务
名称 | DESCRIPTION | 价值 |
---|
作业输入
名称 | DESCRIPTION | 价值 |
---|---|---|
描述 | 输入的说明。 | 字符串 |
jobInputType (作业输入类型) | 设置为 CustomModelJobInput 类型的“custom_model”。 设置为 Type LiteralJobInput 的“literal”。 设置为 MLFlowModelJobInput 类型的“mlflow_model”。 设置为 MLTableJobInput 类型的“mltable”。 设置为 TritonModelJobInput 类型的“triton_model”。 设置为 UriFileJobInput 类型的“uri_file”。 设置为 UriFolderJobInput 类型的“uri_folder”。 | “custom_model” “literal” “mlflow_model” “mltable” “triton_model” “uri_file” “uri_folder”(必需) |
JobOutput (作业输出)
名称 | DESCRIPTION | 价值 |
---|---|---|
描述 | 输出的说明。 | 字符串 |
jobOutputType | 设置为 CustomModelJobOutput 类型的“custom_model”。 设置为 MLFlowModelJobOutput 类型的“mlflow_model”。 设置为 MLTableJobOutput 类型的“mltable”。 设置为 TritonModelJobOutput 类型的“triton_model”。 设置为 UriFileJobOutput 类型的“uri_file”。 设置为 UriFolderJobOutput 类型的“uri_folder”。 | “custom_model” “mlflow_model” “mltable” “triton_model” “uri_file” “uri_folder”(必需) |
JobResourceConfiguration
名称 | DESCRIPTION | 价值 |
---|---|---|
dockerArgs | 要传递给 Docker run 命令的额外参数。 这将替代系统设置的任何参数,或在本部分中。 此参数仅支持 Azure ML 计算类型。 | 字符串 |
instanceCount | 计算目标使用的实例或节点数可选。 | 整数 (int) |
instanceType | 计算目标支持的可选 VM 类型。 | 字符串 |
属性 | 其他属性包。 | ResourceConfigurationProperties |
shmSize | docker 容器的共享内存块的大小。 这应采用 (number)(unit) 格式,其中数字大于 0,单位可以是 b(字节)、k(千字节)、m(兆字节)或 g(GB)。 | 字符串 约束: 图案 = \d+[bBkKmMgG] |
工作服务
名称 | DESCRIPTION | 价值 |
---|---|---|
终结点 | 终结点的 URL。 | 字符串 |
jobServiceType | 终结点类型。 | 字符串 |
节点 | 用户希望启动服务的节点。 如果未将 Nodes 设置为 null,则服务将仅在领导节点上启动。 |
节点 |
移植 | 用户设置的终结点的端口。 | 整数 (int) |
属性 | 在终结点上设置的其他属性。 | JobServiceProperties |
JobServiceProperties
名称 | DESCRIPTION | 价值 |
---|
标签类别
名称 | DESCRIPTION | 价值 |
---|---|---|
类 | 此类别中标签类的字典。 | 标签类别类 |
displayName (显示名称) | 标签类别的显示名称。 | 字符串 |
multiSelectEnabled 已启用 | 指示是否允许在此类别中选择多个类。 | 布尔 |
标签类别类
名称 | DESCRIPTION | 价值 |
---|
标签类
名称 | DESCRIPTION | 价值 |
---|---|---|
displayName (显示名称) | 标签类的显示名称。 | 字符串 |
子 | 标签类的子类的字典。 | LabelClass子类 |
LabelClass子类
名称 | DESCRIPTION | 价值 |
---|
LabelingDataConfiguration
名称 | DESCRIPTION | 价值 |
---|---|---|
数据 ID | 要执行标记的数据资产的资源 ID。 | 字符串 |
incrementalDataRefreshEnabled | 指示是否启用增量数据刷新。 | 布尔 |
LabelingJobImageProperties
名称 | DESCRIPTION | 价值 |
---|---|---|
annotationType | 图像标记作业的批注类型。 | “BoundingBox” “Classification” “InstanceSegmentation” |
mediaType | [必需]作业的媒体类型。 | “Image”(必需) |
TagJobInstructions
名称 | DESCRIPTION | 价值 |
---|---|---|
URI | 指向页面的链接,其中包含标签器的详细标记说明。 | 字符串 |
LabelingJobLabel类别
名称 | DESCRIPTION | 价值 |
---|
LabelingJobMediaProperties
名称 | DESCRIPTION | 价值 |
---|---|---|
mediaType | 设置为“Image”,类型 为 LabelingJobImageProperties。 对于 LabelingJobTextProperties 类型,设置为“Text”。 | “Image” “Text”(必需) |
LabelingJobProperties
名称 | DESCRIPTION | 价值 |
---|---|---|
dataConfiguration | 配置作业中使用的数据。 | LabelingDataConfiguration |
工作说明 | 标记作业的说明。 | TagJobInstructions |
职位类型 | [必需]指定作业的类型。 | “标记”(必需) |
标签类别 | 作业的标签类别。 | LabelingJobLabel类别 |
labelingJobMediaProperties | 作业中的媒体类型特定属性。 | LabelingJobMediaProperties |
mlAssistConfiguration | 在作业中配置 MLAssist 功能。 | MLAssistConfiguration |
LabelingJobTextProperties
名称 | DESCRIPTION | 价值 |
---|---|---|
annotationType | 文本标记作业的批注类型。 | “Classification” 'NamedEntityRecognition' (命名实体识别) |
mediaType | [必需]作业的媒体类型。 | “Text”(必需) |
LiteralJobInput (文字作业输入)
名称 | DESCRIPTION | 价值 |
---|---|---|
jobInputType (作业输入类型) | [必需]指定作业的类型。 | “literal”(必需) |
价值 | [必需]输入的文本值。 | 字符串 约束: 模式 = [a-zA-Z0-9_] (必需) |
ManagedIdentity (托管身份)
名称 | DESCRIPTION | 价值 |
---|---|---|
客户端 ID | 按客户端 ID 指定用户分配的标识。 对于系统分配,请不要设置此字段。 | 字符串 约束: 最小长度 = 36 最大长度 = 36 图案 = ^[0-9a-fA-F]{8}-([0-9a-fA-F]{4}-){3}[0-9a-fA-F]{12}$ |
身份类型 | [必需]指定标识框架的类型。 | “Managed”(必需) |
对象 ID | 按对象 ID 指定用户分配的标识。 对于系统分配,请不要设置此字段。 | 字符串 约束: 最小长度 = 36 最大长度 = 36 图案 = ^[0-9a-fA-F]{8}-([0-9a-fA-F]{4}-){3}[0-9a-fA-F]{12}$ |
资源ID | 按 ARM 资源 ID 指定用户分配的标识。 对于系统分配,请不要设置此字段。 | 字符串 |
MedianStoppingPolicy (中值停止策略)
名称 | DESCRIPTION | 价值 |
---|---|---|
policyType | [必需]策略配置的名称 | “MedianStopping”(必需) |
MLAssistConfiguration
名称 | DESCRIPTION | 价值 |
---|---|---|
mlAssist | 设置为 MLAssistConfigurationDisabled 类型的“Disabled”。 设置为 MLAssistConfigurationEnabled 类型的“Enabled”。 | “Disabled” “Enabled”(必需) |
MLAssistConfigurationDisabled
名称 | DESCRIPTION | 价值 |
---|---|---|
mlAssist | [必需]指示是否启用 MLAssist 功能。 | “Disabled”(必需) |
MLAssistConfiguration已启用
名称 | DESCRIPTION | 价值 |
---|---|---|
inferencingComputeBinding | [必需]推理中使用的 AML 计算绑定。 | 字符串 约束: 模式 = [a-zA-Z0-9_] (必需) |
mlAssist | [必需]指示是否启用 MLAssist 功能。 | “Enabled”(必需) |
trainingComputeBinding 的 | [必需]训练中使用的 AML 计算绑定。 | 字符串 约束: 模式 = [a-zA-Z0-9_] (必需) |
MLFlowModelJobInput
名称 | DESCRIPTION | 价值 |
---|---|---|
jobInputType (作业输入类型) | [必需]指定作业的类型。 | “mlflow_model”(必需) |
模式 | 输入资产传送模式。 | “Direct” “下载” “EvalDownload” “EvalMount” “ReadOnlyMount” “ReadWriteMount” |
URI | [必需]输入资产 URI。 | 字符串 约束: 模式 = [a-zA-Z0-9_] (必需) |
MLFlowModelJobInput
名称 | DESCRIPTION | 价值 |
---|---|---|
描述 | 输入的说明。 | 字符串 |
jobInputType (作业输入类型) | [必需]指定作业的类型。 | “custom_model” “literal” “mlflow_model” “mltable” “triton_model” “uri_file” “uri_folder”(必需) |
模式 | 输入资产传送模式。 | “Direct” “下载” “EvalDownload” “EvalMount” “ReadOnlyMount” “ReadWriteMount” |
URI | [必需]输入资产 URI。 | 字符串 约束: 模式 = [a-zA-Z0-9_] (必需) |
MLFlowModelJobOutput
名称 | DESCRIPTION | 价值 |
---|---|---|
jobOutputType | [必需]指定作业的类型。 | “mlflow_model”(必需) |
模式 | 输出资产传送模式。 | “Direct” “ReadWriteMount” “Upload” |
URI | 输出资产 URI。 | 字符串 |
MLTableJobInput
名称 | DESCRIPTION | 价值 |
---|---|---|
描述 | 输入的说明。 | 字符串 |
jobInputType (作业输入类型) | [必需]指定作业的类型。 | “custom_model” “literal” “mlflow_model” “mltable” “triton_model” “uri_file” “uri_folder”(必需) |
模式 | 输入资产传送模式。 | “Direct” “下载” “EvalDownload” “EvalMount” “ReadOnlyMount” “ReadWriteMount” |
URI | [必需]输入资产 URI。 | 字符串 约束: 模式 = [a-zA-Z0-9_] (必需) |
MLTableJobInput
名称 | DESCRIPTION | 价值 |
---|---|---|
jobInputType (作业输入类型) | [必需]指定作业的类型。 | “mltable”(必需) |
模式 | 输入资产传送模式。 | “Direct” “下载” “EvalDownload” “EvalMount” “ReadOnlyMount” “ReadWriteMount” |
URI | [必需]输入资产 URI。 | 字符串 约束: 模式 = [a-zA-Z0-9_] (必需) |
MLTableJobOutput
名称 | DESCRIPTION | 价值 |
---|---|---|
jobOutputType | [必需]指定作业的类型。 | “mltable”(必需) |
模式 | 输出资产传送模式。 | “Direct” “ReadWriteMount” “Upload” |
URI | 输出资产 URI。 | 字符串 |
MPI
名称 | DESCRIPTION | 价值 |
---|---|---|
distributionType | [必需]指定分发框架的类型。 | “Mpi”(必需) |
processCountPerInstance | 每个 MPI 节点的进程数。 | 整数 (int) |
NCross验证
名称 | DESCRIPTION | 价值 |
---|---|---|
模式 | 对于 AutoNCrossValidations 类型,设置为“自动”。 设置为 CustomNCrossValidations 类型的“Custom”。 | “Auto” “Custom”(必需) |
NlpFixedParameters
名称 | DESCRIPTION | 价值 |
---|---|---|
梯度累积步骤 | 在运行向后传递之前累积渐变的步骤数。 | 整数 (int) |
learningRate | 训练过程的学习速率。 | 整数 (int) |
learningRateScheduler 的 | 训练过程中要使用的学习速率计划的类型。 | “Constant” “ConstantWithWarmup” “余弦” “CosineWithRestarts” “Linear” “None” “多项式” |
模型名称 | 要训练的模型的名称。 | 字符串 |
纪元数 | 训练纪元数。 | 整数 (int) |
trainingBatchSize | 训练过程的批大小。 | 整数 (int) |
validationBatchSize | 要在评估期间使用的批大小。 | 整数 (int) |
warmupRatio | 与 LrSchedulerType 一起使用的预热比率。 | 整数 (int) |
weightDecay (权重衰减) | 训练过程的重量衰减。 | 整数 (int) |
NlpParameterSubspace
名称 | DESCRIPTION | 价值 |
---|---|---|
梯度累积步骤 | 在运行向后传递之前累积渐变的步骤数。 | 字符串 |
learningRate | 训练过程的学习速率。 | 字符串 |
learningRateScheduler 的 | 训练过程中要使用的学习速率计划的类型。 | 字符串 |
模型名称 | 要训练的模型的名称。 | 字符串 |
纪元数 | 训练纪元数。 | 字符串 |
trainingBatchSize | 训练过程的批大小。 | 字符串 |
validationBatchSize | 要在评估期间使用的批大小。 | 字符串 |
warmupRatio | 与 LrSchedulerType 一起使用的预热比率。 | 字符串 |
weightDecay (权重衰减) | 训练过程的重量衰减。 | 字符串 |
NlpSweepSettings
名称 | DESCRIPTION | 价值 |
---|---|---|
early终止 | 扫描作业的提前终止策略的类型。 | 提前终止政策 |
sampling算法 | [必需]采样算法的类型。 | “贝贝西亚语” “Grid” “Random”(必需) |
NlpVerticalFeaturizationSettings
名称 | DESCRIPTION | 价值 |
---|---|---|
datasetLanguage | 数据集语言,适用于文本数据。 | 字符串 |
NlpVerticalLimitSettings
名称 | DESCRIPTION | 价值 |
---|---|---|
maxConcurrentTrials | 最大并发 AutoML 迭代次数。 | 整数 (int) |
最大节点数 | 用于在任何单个试用版中训练的最大节点数。 控制多节点分布式训练。 | 整数 (int) |
maxTrials | AutoML 迭代数。 | 整数 (int) |
超时 | AutoML 作业超时。 | 字符串 |
trialTimeout (试用超时) | 单个 HD 试用版的超时。 | 字符串 |
节点
名称 | DESCRIPTION | 价值 |
---|---|---|
nodesValueType | 对于 AllNodes 类型,设置为“All”。 | “全部”(必需) |
目的
名称 | DESCRIPTION | 价值 |
---|---|---|
目标 | [必需]定义超参数优化支持的指标目标 | “最大化” “最小化”(必需) |
primaryMetric | [必需]要优化的指标的名称。 | 字符串 约束: 模式 = [a-zA-Z0-9_] (必需) |
管道作业
名称 | DESCRIPTION | 价值 |
---|---|---|
输入 | 管道作业的输入。 | 管道作业输入 |
工作 | 作业构造管道作业。 | PipelineJobJob 作业 |
职位类型 | [必需]指定作业的类型。 | “Pipeline”(必需) |
输出 | 管道作业的输出 | PipelineJobOutputs |
设置 | 管道设置,例如 ContinueRunOnStepFailure 等。 | 任何 |
源作业 ID | 源作业的 ARM 资源 ID。 | 字符串 |
管道作业输入
名称 | DESCRIPTION | 价值 |
---|
PipelineJobJob 作业
名称 | DESCRIPTION | 价值 |
---|
PipelineJobOutputs
名称 | DESCRIPTION | 价值 |
---|
PyTorch
名称 | DESCRIPTION | 价值 |
---|---|---|
distributionType | [必需]指定分发框架的类型。 | “PyTorch”(必需) |
processCountPerInstance | 每个节点的进程数。 | 整数 (int) |
RandomSamplingAlgorithm 算法
名称 | DESCRIPTION | 价值 |
---|---|---|
规则 | 随机算法的特定类型 | “Random” “Sobol” |
采样算法类型 | [必需]用于生成超参数值的算法以及配置属性 | “Random”(必需) |
种子 | 用作随机数生成的种子的可选整数 | 整数 (int) |
回归
名称 | DESCRIPTION | 价值 |
---|---|---|
cvSplitColumnNames | 用于 CVSplit 数据的列。 | 字符串[] |
featurizationSettings | AutoML 作业所需的特征化输入。 | TableVerticalFeaturizationSettings |
固定参数 | 在整个训练过程中将保持不变的模型/训练参数。 | TableFixedParameters (表固定参数) |
limitSettings | AutoMLJob 的执行约束。 | TableVerticalLimitSettings |
nCrossValidations | 要应用于训练数据集的交叉验证折叠数 如果未提供验证数据集,则为 。 |
NCross验证 |
primaryMetric | 回归任务的主要指标。 | “NormalizedMeanAbsoluteError” “NormalizedRootMeanSquaredError” “R2Score” 'SpearmanCorrelation' |
搜索空间 | 用于采样模型及其超参数的不同组合的搜索空间。 | TableParameterSubspace[] |
扫描设置 | 模型扫描和超参数优化的设置。 | TableSweepSettings (表格扫描设置) |
任务类型 | [必需]AutoMLJob 的任务类型。 | “回归”(必需) |
测试数据 | 测试数据输入。 | MLTableJobInput |
testDataSize | 需要为验证目的预留的测试数据集的分数。 介于 (0.0、 1.0) 之间的值 未提供验证数据集时应用。 |
整数 (int) |
trainingSettings | AutoML 作业训练阶段的输入。 | 回归训练设置 |
validationData (验证数据) | 验证数据输入。 | MLTableJobInput |
validationDataSize | 需要留出用于验证的定型数据集的分数。 介于 (0.0、 1.0) 之间的值 未提供验证数据集时应用。 |
整数 (int) |
权重列名称 | 示例权重列的名称。 自动化 ML 支持加权列作为输入,导致数据中的行向上或向下加权。 | 字符串 |
回归训练设置
名称 | DESCRIPTION | 价值 |
---|---|---|
allowedTrainingAlgorithms | 回归任务的允许模型。 | 包含任一项的字符串数组: “DecisionTree” “ElasticNet” “ExtremeRandomTrees” “GradientBoosting” “KNN” “LassoLars” “LightGBM” “RandomForest” “ZN” “XGBoostRegressor” |
blockedTrainingAlgorithms | 回归任务的阻止模型。 | 包含任一项的字符串数组: “DecisionTree” “ElasticNet” “ExtremeRandomTrees” “GradientBoosting” “KNN” “LassoLars” “LightGBM” “RandomForest” “ZN” “XGBoostRegressor” |
enableDnnTraining | 启用 DNN 模型的建议。 | 布尔 |
enableModelExplainability | 标志以在最佳模型上启用可解释性。 | 布尔 |
enableOnnxCompatibleModels | 用于启用 onnx 兼容模型的标志。 | 布尔 |
enableStackEnsemble | 启用堆栈合奏运行。 | 布尔 |
enableVoteEnsemble | 启用投票合奏运行。 | 布尔 |
ensembleModelDownloadTimeout | 在 VotingEnsemble 和 StackEnsemble 模型生成期间,将下载先前子运行中的多个拟合模型。 如果需要更多时间,请将此参数配置为大于 300 秒的值。 |
字符串 |
stackEnsembleSettings | 堆栈合奏的堆栈合奏设置。 | StackEnsembleSettings |
ResourceBaseProperties
名称 | DESCRIPTION | 价值 |
---|
ResourceBaseTags
名称 | DESCRIPTION | 价值 |
---|
ResourceConfigurationProperties
名称 | DESCRIPTION | 价值 |
---|
采样算法
名称 | DESCRIPTION | 价值 |
---|---|---|
采样算法类型 | 设置为 “Bayesian”类型的 BayesianSamplingAlgorithm。 设置为 GridSamplingAlgorithm 类型的“Grid”。 设置为 RandomSamplingAlgorithm 类型的“Random”。 | “贝贝西亚语” “Grid” “Random”(必需) |
季节性
名称 | DESCRIPTION | 价值 |
---|---|---|
模式 | 设置为“ AutoSeasonality”类型为“自动”。 设置为“ CustomSeasonality”类型。 | “Auto” “Custom”(必需) |
SparkJob
名称 | DESCRIPTION | 价值 |
---|---|---|
档案 | 存档作业中使用的文件。 | 字符串[] |
参数 | 作业的参数。 | 字符串 |
代码 Id | [必需]代码资产的 ARM 资源 ID。 | 字符串 约束: 模式 = [a-zA-Z0-9_] (必需) |
会议 | Spark 配置的属性。 | SparkJobConf 函数 |
输入 | [必需]在启动作业时要执行的条目。 | SparkJobEntry (必需) |
环境 ID | 作业的环境规范的 ARM 资源 ID。 | 字符串 |
文件 | 作业中使用的文件。 | 字符串[] |
输入 | 作业中使用的输入数据绑定的映射。 | SparkJobInputs |
罐子 | 作业中使用的 Jar 文件。 | 字符串[] |
职位类型 | [必需]指定作业的类型。 | “Spark”(必需) |
输出 | 作业中使用的输出数据绑定的映射。 | SparkJob输出 |
py文件 | 作业中使用的 Python 文件。 | 字符串[] |
资源 | 作业的计算资源配置。 | SparkResourceConfiguration |
SparkJobConf 函数
名称 | DESCRIPTION | 价值 |
---|
SparkJobEntry
名称 | DESCRIPTION | 价值 |
---|---|---|
sparkJobEntryType | 设置为 SparkJobPythonEntry 类型的“SparkJobPythonEntry”。 设置为“ SparkJobScalaEntry”类型的“SparkJobScalaEntry”。 | “SparkJobPythonEntry” “SparkJobScalaEntry”(必需) |
SparkJobInputs
名称 | DESCRIPTION | 价值 |
---|
SparkJob输出
名称 | DESCRIPTION | 价值 |
---|
SparkJobPython条目
名称 | DESCRIPTION | 价值 |
---|---|---|
文件 | [必需]作业入口点的相对 python 文件路径。 | 字符串 约束: 最小长度 = 1 模式 = [a-zA-Z0-9_] (必需) |
sparkJobEntryType | [必需]作业入口点的类型。 | “SparkJobPythonEntry”(必需) |
SparkJobScalaEntry
名称 | DESCRIPTION | 价值 |
---|---|---|
类名 | [必需]用作入口点的 Scala 类名称。 | 字符串 约束: 最小长度 = 1 模式 = [a-zA-Z0-9_] (必需) |
sparkJobEntryType | [必需]作业入口点的类型。 | “SparkJobScalaEntry”(必需) |
SparkResourceConfiguration
名称 | DESCRIPTION | 价值 |
---|---|---|
instanceType | 计算目标支持的可选 VM 类型。 | 字符串 |
runtimeVersion (运行时版本) | 用于作业的 spark 运行时的版本。 | 字符串 |
StackEnsembleSettings
名称 | DESCRIPTION | 价值 |
---|---|---|
stackMetaLearnerKWargs | 要传递给元学习器初始值设定项的可选参数。 | 任何 |
stackMetaLearnerTrainPercentage | 指定要保留用于训练元学习者的训练集(选择训练和训练类型的训练)的比例。 默认值为 0.2。 | 整数 (int) |
stackMetaLearnerType | 元学习器是在单个异类模型的输出上训练的模型。 | “ElasticNet” “ElasticNetCV” “LightGBMClassifier” “LightGBMRegressor” “LinearRegression” “LogisticRegression” “LogisticRegressionCV” “None” |
SweepJob (扫描作业)
名称 | DESCRIPTION | 价值 |
---|---|---|
early终止 | 提前终止策略可在完成之前取消性能不佳的运行 | 提前终止政策 |
输入 | 作业中使用的输入数据绑定的映射。 | SweepJobInputs |
职位类型 | [必需]指定作业的类型。 | “扫描”(必需) |
限制 | 扫描作业限制。 | SweepJobLimits (扫描作业限制) |
目的 | [必需]优化目标。 | 目标 (必需) |
输出 | 作业中使用的输出数据绑定的映射。 | SweepJobOutputs (扫描作业输出) |
sampling算法 | [必需]超参数采样算法 | SamplingAlgorithm (必需) |
搜索空间 | [必需]包含每个参数及其分布的字典。 字典键是参数的名称 | 任何(必需) |
试用 | [必需]试用组件定义。 | TrialComponent (必需) |
SweepJobInputs
名称 | DESCRIPTION | 价值 |
---|
SweepJobLimits (扫描作业限制)
名称 | DESCRIPTION | 价值 |
---|---|---|
jobLimits类型 | [必需]JobLimit 类型。 | “Command” “扫描”(必需) |
maxConcurrentTrials | 扫描作业最大并发试用版。 | 整数 (int) |
maxTotalTrials | 扫描作业最大总试用版数。 | 整数 (int) |
超时 | ISO 8601 格式的最大运行持续时间,之后作业将被取消。 仅支持精度为秒的持续时间。 | 字符串 |
trialTimeout (试用超时) | 扫描作业试用超时值。 | 字符串 |
SweepJobOutputs (扫描作业输出)
名称 | DESCRIPTION | 价值 |
---|
TableFixedParameters (表固定参数)
名称 | DESCRIPTION | 价值 |
---|---|---|
助 推 器 | 指定提升类型,例如 XGBoost 的 gbdt。 | 字符串 |
boosting类型 | 指定提升类型,例如 LightGBM 的 gbdt。 | 字符串 |
增长策略 | 指定增长策略,该策略控制新节点添加到树的方式。 | 字符串 |
learningRate | 训练过程的学习速率。 | 整数 (int) |
最大 Bin | 指定存储桶连续功能的最大离散箱数。 | 整数 (int) |
最大深度 | 指定显式限制树深度的最大深度。 | 整数 (int) |
最大叶数 | 指定显式限制树叶的最大叶数。 | 整数 (int) |
minDataInLeaf 的 | 每个叶的最小数据数。 | 整数 (int) |
minSplitGain 最小分度增益 | 在树的叶节点上进行进一步分区所需的最小损失减少。 | 整数 (int) |
模型名称 | 要训练的模型的名称。 | 字符串 |
nEstimator | 指定模型中的树数(或舍入)。 | 整数 (int) |
叶数 | 指定叶数。 | 整数 (int) |
preprocessorName | 要使用的预处理器的名称。 | 字符串 |
regAlpha | 权重的 L1 正则化术语。 | 整数 (int) |
regLambda | L2 权重的正则化术语。 | 整数 (int) |
子样本 | 训练实例的子采样比率。 | 整数 (int) |
subsampleFreq | 子采样的频率。 | 整数 (int) |
treeMethod | 指定树方法。 | 字符串 |
withMean | 如果为 true,在使用 StandardScalar 缩放数据之前居中。 | 布尔 |
withStd | 如果为 true,请使用 StandardScalar 缩放具有单位方差的数据。 | 布尔 |
TableParameterSubspace
名称 | DESCRIPTION | 价值 |
---|---|---|
助 推 器 | 指定提升类型,例如 XGBoost 的 gbdt。 | 字符串 |
boosting类型 | 指定提升类型,例如 LightGBM 的 gbdt。 | 字符串 |
增长策略 | 指定增长策略,该策略控制新节点添加到树的方式。 | 字符串 |
learningRate | 训练过程的学习速率。 | 字符串 |
最大 Bin | 指定存储桶连续功能的最大离散箱数。 | 字符串 |
最大深度 | 指定显式限制树深度的最大深度。 | 字符串 |
最大叶数 | 指定显式限制树叶的最大叶数。 | 字符串 |
minDataInLeaf 的 | 每个叶的最小数据数。 | 字符串 |
minSplitGain 最小分度增益 | 在树的叶节点上进行进一步分区所需的最小损失减少。 | 字符串 |
模型名称 | 要训练的模型的名称。 | 字符串 |
nEstimator | 指定模型中的树数(或舍入)。 | 字符串 |
叶数 | 指定叶数。 | 字符串 |
preprocessorName | 要使用的预处理器的名称。 | 字符串 |
regAlpha | 权重的 L1 正则化术语。 | 字符串 |
regLambda | L2 权重的正则化术语。 | 字符串 |
子样本 | 训练实例的子采样比率。 | 字符串 |
subsampleFreq | 子采样的频率 | 字符串 |
treeMethod | 指定树方法。 | 字符串 |
withMean | 如果为 true,在使用 StandardScalar 缩放数据之前居中。 | 字符串 |
withStd | 如果为 true,请使用 StandardScalar 缩放具有单位方差的数据。 | 字符串 |
TableSweepSettings (表格扫描设置)
名称 | DESCRIPTION | 价值 |
---|---|---|
early终止 | 扫描作业的提前终止策略的类型。 | 提前终止政策 |
sampling算法 | [必需]采样算法的类型。 | “贝贝西亚语” “Grid” “Random”(必需) |
TableVerticalFeaturizationSettings
名称 | DESCRIPTION | 价值 |
---|---|---|
阻塞变压器 | 这些转换器不应用于特征化。 | 包含任一项的字符串数组: “CatTargetEncoder” “CountVectorizer” “HashOneHotEncoder” “LabelEncoder” “NaiveBayes” “OneHotEncoder” “TextTargetEncoder” “TfIdf” “WoETargetEncoder” “WordEmbedding” |
columnNameAnd类型 | 列名及其类型(int、float、string、datetime 等)的字典。 | TableVerticalFeaturizationSettingsColumnNameAndTypes |
datasetLanguage | 数据集语言,适用于文本数据。 | 字符串 |
enableDnnFeaturization | 确定是否使用基于 Dnn 的特征化器进行数据特征化。 | 布尔 |
模式 | 特征化模式 - 用户可以保留默认的“自动”模式,AutoML 将负责在特征化阶段对数据进行必要的转换。 如果选择了“关闭”,则不会完成特征化。 如果选择“自定义”,则用户可以指定其他输入以自定义特征化完成方式。 |
“Auto” “Custom” “关闭” |
transformer参数 | 用户可以指定要用于的其他转换器以及要向其应用它的列以及转换器构造函数的参数。 | TableVerticalFeaturizationSettingsTransformerParams |
TableVerticalFeaturizationSettingsColumnNameAndTypes
名称 | DESCRIPTION | 价值 |
---|
TableVerticalFeaturizationSettingsTransformerParams
名称 | DESCRIPTION | 价值 |
---|
TableVerticalLimitSettings
名称 | DESCRIPTION | 价值 |
---|---|---|
enableEarlyTermination | 启用提前终止,确定如果最近 20 次迭代中没有分数改进,AutoMLJob 是否会提前终止。 | 布尔 |
退出评分 | AutoML 作业的退出分数。 | 整数 (int) |
maxConcurrentTrials | 最大并发迭代数。 | 整数 (int) |
maxCoresPerTrial | 每次迭代的最大核心数。 | 整数 (int) |
maxTrials | 迭代数。 | 整数 (int) |
sweepConcurrentTrials | 用户想要触发的并发扫描运行数。 | 整数 (int) |
sweepTrials | 用户想要触发的扫描运行数。 | 整数 (int) |
超时 | AutoML 作业超时。 | 字符串 |
trialTimeout (试用超时) | 迭代超时。 | 字符串 |
目标滞后
名称 | DESCRIPTION | 价值 |
---|---|---|
模式 | 对于 AutoTargetLags 类型,设置为“自动”。 设置为 CustomTargetLags 类型的“Custom”。 | “Auto” “Custom”(必需) |
TargetRollingWindowSize
名称 | DESCRIPTION | 价值 |
---|---|---|
模式 | 设置为“ AutoTargetRollingWindowSize”类型的“自动”。 设置为 CustomTargetRollingWindowSize 类型的“Custom”。 | “Auto” “Custom”(必需) |
TensorFlow
名称 | DESCRIPTION | 价值 |
---|---|---|
distributionType | [必需]指定分发框架的类型。 | “TensorFlow”(必需) |
parameterServerCount | 参数服务器任务数。 | 整数 (int) |
workerCount 工人计数 | 工人数。 如果未指定,则默认为实例计数。 | 整数 (int) |
文本分类
名称 | DESCRIPTION | 价值 |
---|---|---|
featurizationSettings | AutoML 作业所需的特征化输入。 | NlpVerticalFeaturizationSettings |
固定参数 | 在整个训练过程中将保持不变的模型/训练参数。 | NlpFixedParameters |
limitSettings | AutoMLJob 的执行约束。 | NlpVerticalLimitSettings |
primaryMetric | Text-Classification 任务的主要指标。 | “准确性” “AUCWeighted” “AveragePrecisionScoreWeighted” “NormMacroRecall” “PrecisionScoreWeighted” |
搜索空间 | 用于采样模型及其超参数的不同组合的搜索空间。 | NlpParameterSubspace[] |
扫描设置 | 模型扫描和超参数优化的设置。 | NlpSweepSettings |
任务类型 | [必需]AutoMLJob 的任务类型。 | “TextClassification”(必需) |
validationData (验证数据) | 验证数据输入。 | MLTableJobInput |
TextClassificationMultilabel
名称 | DESCRIPTION | 价值 |
---|---|---|
featurizationSettings | AutoML 作业所需的特征化输入。 | NlpVerticalFeaturizationSettings |
固定参数 | 在整个训练过程中将保持不变的模型/训练参数。 | NlpFixedParameters |
limitSettings | AutoMLJob 的执行约束。 | NlpVerticalLimitSettings |
搜索空间 | 用于采样模型及其超参数的不同组合的搜索空间。 | NlpParameterSubspace[] |
扫描设置 | 模型扫描和超参数优化的设置。 | NlpSweepSettings |
任务类型 | [必需]AutoMLJob 的任务类型。 | “TextClassificationMultilabel”(必需) |
validationData (验证数据) | 验证数据输入。 | MLTableJobInput |
TextNer (文本生成器)
名称 | DESCRIPTION | 价值 |
---|---|---|
featurizationSettings | AutoML 作业所需的特征化输入。 | NlpVerticalFeaturizationSettings |
固定参数 | 在整个训练过程中将保持不变的模型/训练参数。 | NlpFixedParameters |
limitSettings | AutoMLJob 的执行约束。 | NlpVerticalLimitSettings |
搜索空间 | 用于采样模型及其超参数的不同组合的搜索空间。 | NlpParameterSubspace[] |
扫描设置 | 模型扫描和超参数优化的设置。 | NlpSweepSettings |
任务类型 | [必需]AutoMLJob 的任务类型。 | “TextNER”(必需) |
validationData (验证数据) | 验证数据输入。 | MLTableJobInput |
TrialComponent (试用组件)
名称 | DESCRIPTION | 价值 |
---|---|---|
代码 Id | 代码资产的 ARM 资源 ID。 | 字符串 |
指令 | [必需]在启动作业时执行的命令。 例如 “python train.py” | 字符串 约束: 最小长度 = 1 模式 = [a-zA-Z0-9_] (必需) |
分配 | 作业的分发配置。 如果已设置,则应为 Mpi、Tensorflow、PyTorch 或 null 之一。 | 分发配置 |
环境 ID | [必需]作业的环境规范的 ARM 资源 ID。 | 字符串 约束: 模式 = [a-zA-Z0-9_] (必需) |
环境变量 | 作业中包含的环境变量。 | TrialComponentEnvironmentVariables |
资源 | 作业的计算资源配置。 | JobResourceConfiguration |
TrialComponentEnvironmentVariables
名称 | DESCRIPTION | 价值 |
---|
TritonModelJobInput
名称 | DESCRIPTION | 价值 |
---|---|---|
jobInputType (作业输入类型) | [必需]指定作业的类型。 | “triton_model”(必需) |
模式 | 输入资产传送模式。 | “Direct” “下载” “EvalDownload” “EvalMount” “ReadOnlyMount” “ReadWriteMount” |
URI | [必需]输入资产 URI。 | 字符串 约束: 模式 = [a-zA-Z0-9_] (必需) |
TritonModelJobOutput
名称 | DESCRIPTION | 价值 |
---|---|---|
jobOutputType | [必需]指定作业的类型。 | “triton_model”(必需) |
模式 | 输出资产传送模式。 | “Direct” “ReadWriteMount” “Upload” |
URI | 输出资产 URI。 | 字符串 |
截断选择策略
名称 | DESCRIPTION | 价值 |
---|---|---|
policyType | [必需]策略配置的名称 | “TruncationSelection”(必需) |
截断百分比 | 要在每个评估间隔取消的运行百分比。 | 整数 (int) |
UriFileJobInput
名称 | DESCRIPTION | 价值 |
---|---|---|
jobInputType (作业输入类型) | [必需]指定作业的类型。 | “uri_file”(必需) |
模式 | 输入资产传送模式。 | “Direct” “下载” “EvalDownload” “EvalMount” “ReadOnlyMount” “ReadWriteMount” |
URI | [必需]输入资产 URI。 | 字符串 约束: 模式 = [a-zA-Z0-9_] (必需) |
UriFileJobOutput
名称 | DESCRIPTION | 价值 |
---|---|---|
jobOutputType | [必需]指定作业的类型。 | “uri_file”(必需) |
模式 | 输出资产传送模式。 | “Direct” “ReadWriteMount” “Upload” |
URI | 输出资产 URI。 | 字符串 |
UriFolderJobInput
名称 | DESCRIPTION | 价值 |
---|---|---|
jobInputType (作业输入类型) | [必需]指定作业的类型。 | “uri_folder”(必需) |
模式 | 输入资产传送模式。 | “Direct” “下载” “EvalDownload” “EvalMount” “ReadOnlyMount” “ReadWriteMount” |
URI | [必需]输入资产 URI。 | 字符串 约束: 模式 = [a-zA-Z0-9_] (必需) |
UriFolderJobOutput
名称 | DESCRIPTION | 价值 |
---|---|---|
jobOutputType | [必需]指定作业的类型。 | “uri_folder”(必需) |
模式 | 输出资产传送模式。 | “Direct” “ReadWriteMount” “Upload” |
URI | 输出资产 URI。 | 字符串 |
用户身份
名称 | DESCRIPTION | 价值 |
---|---|---|
身份类型 | [必需]指定标识框架的类型。 | “UserIdentity”(必需) |
用法示例
Azure 快速入门模板
以下 Azure 快速入门模板 部署此资源类型。
模板 | DESCRIPTION |
---|---|
创建 Azure 机器学习 AutoML 分类作业 |
此模板创建一个 Azure 机器学习 AutoML 分类作业,以找出用于预测客户是否会与金融机构订阅固定期存款的最佳模型。 |
创建 Azure 机器学习命令作业 |
此模板使用基本hello_world脚本创建 Azure 机器学习命令作业 |
创建 Azure 机器学习扫描作业 |
此模板创建用于超参数优化的 Azure 机器学习扫描作业。 |
Terraform (AzAPI 提供程序)资源定义
可以使用目标作部署工作区/作业资源类型:
- 资源组
有关每个 API 版本中已更改属性的列表,请参阅 更改日志。
资源格式
若要创建 Microsoft.MachineLearningServices/workspaces/jobs 资源,请将以下 Terraform 添加到模板。
resource "azapi_resource" "symbolicname" {
type = "Microsoft.MachineLearningServices/workspaces/jobs@2022-10-01-preview"
name = "string"
parent_id = "string"
body = {
properties = {
componentId = "string"
computeId = "string"
description = "string"
displayName = "string"
experimentName = "string"
identity = {
identityType = "string"
// For remaining properties, see IdentityConfiguration objects
}
isArchived = bool
properties = {
{customized property} = "string"
}
services = {
{customized property} = {
endpoint = "string"
jobServiceType = "string"
nodes = {
nodesValueType = "string"
// For remaining properties, see Nodes objects
}
port = int
properties = {
{customized property} = "string"
}
}
}
tags = {
{customized property} = "string"
}
jobType = "string"
// For remaining properties, see JobBaseProperties objects
}
}
}
季节性对象
设置 模式 属性以指定对象的类型。
对于 自动,请使用:
{
mode = "Auto"
}
对于 “自定义”,请使用:
{
mode = "Custom"
value = int
}
ForecastHorizon 对象
设置 模式 属性以指定对象的类型。
对于 自动,请使用:
{
mode = "Auto"
}
对于 “自定义”,请使用:
{
mode = "Custom"
value = int
}
JobOutput 对象
设置 jobOutputType 属性以指定对象的类型。
对于 custom_model,请使用:
{
jobOutputType = "custom_model"
mode = "string"
uri = "string"
}
对于 mlflow_model,请使用:
{
jobOutputType = "mlflow_model"
mode = "string"
uri = "string"
}
对于 mltable,请使用:
{
jobOutputType = "mltable"
mode = "string"
uri = "string"
}
对于 triton_model,请使用:
{
jobOutputType = "triton_model"
mode = "string"
uri = "string"
}
对于 uri_file,请使用:
{
jobOutputType = "uri_file"
mode = "string"
uri = "string"
}
对于 uri_folder,请使用:
{
jobOutputType = "uri_folder"
mode = "string"
uri = "string"
}
IdentityConfiguration 对象
设置 identityType 属性以指定对象的类型。
对于 AMLToken,请使用:
{
identityType = "AMLToken"
}
对于 托管,请使用:
{
clientId = "string"
identityType = "Managed"
objectId = "string"
resourceId = "string"
}
对于 UserIdentity,请使用:
{
identityType = "UserIdentity"
}
DistributionConfiguration 对象
设置 distributionType 属性以指定对象的类型。
对于 Mpi,请使用:
{
distributionType = "Mpi"
processCountPerInstance = int
}
对于 PyTorch,请使用:
{
distributionType = "PyTorch"
processCountPerInstance = int
}
对于 TensorFlow,请使用:
{
distributionType = "TensorFlow"
parameterServerCount = int
workerCount = int
}
MLAssistConfiguration 对象
设置 mlAssist 属性以指定对象的类型。
对于 禁用,请使用:
{
mlAssist = "Disabled"
}
对于 “已启用”,请使用:
{
inferencingComputeBinding = "string"
mlAssist = "Enabled"
trainingComputeBinding = "string"
}
EarlyTerminationPolicy 对象
设置 policyType 属性以指定对象的类型。
对于 Bandit,请使用:
{
policyType = "Bandit"
slackAmount = int
slackFactor = int
}
对于 MedianStopping,请使用:
{
policyType = "MedianStopping"
}
对于 TruncationSelection,请使用:
{
policyType = "TruncationSelection"
truncationPercentage = int
}
TargetRollingWindowSize 对象
设置 模式 属性以指定对象的类型。
对于 自动,请使用:
{
mode = "Auto"
}
对于 “自定义”,请使用:
{
mode = "Custom"
value = int
}
SparkJobEntry 对象
设置 sparkJobEntryType 属性以指定对象的类型。
对于 SparkJobPythonEntry,请使用:
{
file = "string"
sparkJobEntryType = "SparkJobPythonEntry"
}
对于 SparkJobScalaEntry,请使用:
{
className = "string"
sparkJobEntryType = "SparkJobScalaEntry"
}
AutoMLVertical 对象
设置 taskType 属性以指定对象的类型。
对于 分类,请使用:
{
cvSplitColumnNames = [
"string"
]
featurizationSettings = {
blockedTransformers = [
"string"
]
columnNameAndTypes = {
{customized property} = "string"
}
datasetLanguage = "string"
enableDnnFeaturization = bool
mode = "string"
transformerParams = {
{customized property} = [
{
fields = [
"string"
]
parameters = ?
}
]
}
}
fixedParameters = {
booster = "string"
boostingType = "string"
growPolicy = "string"
learningRate = int
maxBin = int
maxDepth = int
maxLeaves = int
minDataInLeaf = int
minSplitGain = int
modelName = "string"
nEstimators = int
numLeaves = int
preprocessorName = "string"
regAlpha = int
regLambda = int
subsample = int
subsampleFreq = int
treeMethod = "string"
withMean = bool
withStd = bool
}
limitSettings = {
enableEarlyTermination = bool
exitScore = int
maxConcurrentTrials = int
maxCoresPerTrial = int
maxTrials = int
sweepConcurrentTrials = int
sweepTrials = int
timeout = "string"
trialTimeout = "string"
}
nCrossValidations = {
mode = "string"
// For remaining properties, see NCrossValidations objects
}
positiveLabel = "string"
primaryMetric = "string"
searchSpace = [
{
booster = "string"
boostingType = "string"
growPolicy = "string"
learningRate = "string"
maxBin = "string"
maxDepth = "string"
maxLeaves = "string"
minDataInLeaf = "string"
minSplitGain = "string"
modelName = "string"
nEstimators = "string"
numLeaves = "string"
preprocessorName = "string"
regAlpha = "string"
regLambda = "string"
subsample = "string"
subsampleFreq = "string"
treeMethod = "string"
withMean = "string"
withStd = "string"
}
]
sweepSettings = {
earlyTermination = {
delayEvaluation = int
evaluationInterval = int
policyType = "string"
// For remaining properties, see EarlyTerminationPolicy objects
}
samplingAlgorithm = "string"
}
taskType = "Classification"
testData = {
description = "string"
jobInputType = "string"
mode = "string"
uri = "string"
}
testDataSize = int
trainingSettings = {
allowedTrainingAlgorithms = [
"string"
]
blockedTrainingAlgorithms = [
"string"
]
enableDnnTraining = bool
enableModelExplainability = bool
enableOnnxCompatibleModels = bool
enableStackEnsemble = bool
enableVoteEnsemble = bool
ensembleModelDownloadTimeout = "string"
stackEnsembleSettings = {
stackMetaLearnerKWargs = ?
stackMetaLearnerTrainPercentage = int
stackMetaLearnerType = "string"
}
}
validationData = {
description = "string"
jobInputType = "string"
mode = "string"
uri = "string"
}
validationDataSize = int
weightColumnName = "string"
}
对于 预测,请使用:
{
cvSplitColumnNames = [
"string"
]
featurizationSettings = {
blockedTransformers = [
"string"
]
columnNameAndTypes = {
{customized property} = "string"
}
datasetLanguage = "string"
enableDnnFeaturization = bool
mode = "string"
transformerParams = {
{customized property} = [
{
fields = [
"string"
]
parameters = ?
}
]
}
}
fixedParameters = {
booster = "string"
boostingType = "string"
growPolicy = "string"
learningRate = int
maxBin = int
maxDepth = int
maxLeaves = int
minDataInLeaf = int
minSplitGain = int
modelName = "string"
nEstimators = int
numLeaves = int
preprocessorName = "string"
regAlpha = int
regLambda = int
subsample = int
subsampleFreq = int
treeMethod = "string"
withMean = bool
withStd = bool
}
forecastingSettings = {
countryOrRegionForHolidays = "string"
cvStepSize = int
featureLags = "string"
forecastHorizon = {
mode = "string"
// For remaining properties, see ForecastHorizon objects
}
frequency = "string"
seasonality = {
mode = "string"
// For remaining properties, see Seasonality objects
}
shortSeriesHandlingConfig = "string"
targetAggregateFunction = "string"
targetLags = {
mode = "string"
// For remaining properties, see TargetLags objects
}
targetRollingWindowSize = {
mode = "string"
// For remaining properties, see TargetRollingWindowSize objects
}
timeColumnName = "string"
timeSeriesIdColumnNames = [
"string"
]
useStl = "string"
}
limitSettings = {
enableEarlyTermination = bool
exitScore = int
maxConcurrentTrials = int
maxCoresPerTrial = int
maxTrials = int
sweepConcurrentTrials = int
sweepTrials = int
timeout = "string"
trialTimeout = "string"
}
nCrossValidations = {
mode = "string"
// For remaining properties, see NCrossValidations objects
}
primaryMetric = "string"
searchSpace = [
{
booster = "string"
boostingType = "string"
growPolicy = "string"
learningRate = "string"
maxBin = "string"
maxDepth = "string"
maxLeaves = "string"
minDataInLeaf = "string"
minSplitGain = "string"
modelName = "string"
nEstimators = "string"
numLeaves = "string"
preprocessorName = "string"
regAlpha = "string"
regLambda = "string"
subsample = "string"
subsampleFreq = "string"
treeMethod = "string"
withMean = "string"
withStd = "string"
}
]
sweepSettings = {
earlyTermination = {
delayEvaluation = int
evaluationInterval = int
policyType = "string"
// For remaining properties, see EarlyTerminationPolicy objects
}
samplingAlgorithm = "string"
}
taskType = "Forecasting"
testData = {
description = "string"
jobInputType = "string"
mode = "string"
uri = "string"
}
testDataSize = int
trainingSettings = {
allowedTrainingAlgorithms = [
"string"
]
blockedTrainingAlgorithms = [
"string"
]
enableDnnTraining = bool
enableModelExplainability = bool
enableOnnxCompatibleModels = bool
enableStackEnsemble = bool
enableVoteEnsemble = bool
ensembleModelDownloadTimeout = "string"
stackEnsembleSettings = {
stackMetaLearnerKWargs = ?
stackMetaLearnerTrainPercentage = int
stackMetaLearnerType = "string"
}
}
validationData = {
description = "string"
jobInputType = "string"
mode = "string"
uri = "string"
}
validationDataSize = int
weightColumnName = "string"
}
对于 ImageClassification,请使用:
{
limitSettings = {
maxConcurrentTrials = int
maxTrials = int
timeout = "string"
}
modelSettings = {
advancedSettings = "string"
amsGradient = bool
augmentations = "string"
beta1 = int
beta2 = int
checkpointFrequency = int
checkpointModel = {
description = "string"
jobInputType = "string"
mode = "string"
uri = "string"
}
checkpointRunId = "string"
distributed = bool
earlyStopping = bool
earlyStoppingDelay = int
earlyStoppingPatience = int
enableOnnxNormalization = bool
evaluationFrequency = int
gradientAccumulationStep = int
layersToFreeze = int
learningRate = int
learningRateScheduler = "string"
modelName = "string"
momentum = int
nesterov = bool
numberOfEpochs = int
numberOfWorkers = int
optimizer = "string"
randomSeed = int
stepLRGamma = int
stepLRStepSize = int
trainingBatchSize = int
trainingCropSize = int
validationBatchSize = int
validationCropSize = int
validationResizeSize = int
warmupCosineLRCycles = int
warmupCosineLRWarmupEpochs = int
weightDecay = int
weightedLoss = int
}
primaryMetric = "string"
searchSpace = [
{
amsGradient = "string"
augmentations = "string"
beta1 = "string"
beta2 = "string"
distributed = "string"
earlyStopping = "string"
earlyStoppingDelay = "string"
earlyStoppingPatience = "string"
enableOnnxNormalization = "string"
evaluationFrequency = "string"
gradientAccumulationStep = "string"
layersToFreeze = "string"
learningRate = "string"
learningRateScheduler = "string"
modelName = "string"
momentum = "string"
nesterov = "string"
numberOfEpochs = "string"
numberOfWorkers = "string"
optimizer = "string"
randomSeed = "string"
stepLRGamma = "string"
stepLRStepSize = "string"
trainingBatchSize = "string"
trainingCropSize = "string"
validationBatchSize = "string"
validationCropSize = "string"
validationResizeSize = "string"
warmupCosineLRCycles = "string"
warmupCosineLRWarmupEpochs = "string"
weightDecay = "string"
weightedLoss = "string"
}
]
sweepSettings = {
earlyTermination = {
delayEvaluation = int
evaluationInterval = int
policyType = "string"
// For remaining properties, see EarlyTerminationPolicy objects
}
samplingAlgorithm = "string"
}
taskType = "ImageClassification"
validationData = {
description = "string"
jobInputType = "string"
mode = "string"
uri = "string"
}
validationDataSize = int
}
对于 ImageClassificationMultilabel,请使用:
{
limitSettings = {
maxConcurrentTrials = int
maxTrials = int
timeout = "string"
}
modelSettings = {
advancedSettings = "string"
amsGradient = bool
augmentations = "string"
beta1 = int
beta2 = int
checkpointFrequency = int
checkpointModel = {
description = "string"
jobInputType = "string"
mode = "string"
uri = "string"
}
checkpointRunId = "string"
distributed = bool
earlyStopping = bool
earlyStoppingDelay = int
earlyStoppingPatience = int
enableOnnxNormalization = bool
evaluationFrequency = int
gradientAccumulationStep = int
layersToFreeze = int
learningRate = int
learningRateScheduler = "string"
modelName = "string"
momentum = int
nesterov = bool
numberOfEpochs = int
numberOfWorkers = int
optimizer = "string"
randomSeed = int
stepLRGamma = int
stepLRStepSize = int
trainingBatchSize = int
trainingCropSize = int
validationBatchSize = int
validationCropSize = int
validationResizeSize = int
warmupCosineLRCycles = int
warmupCosineLRWarmupEpochs = int
weightDecay = int
weightedLoss = int
}
primaryMetric = "string"
searchSpace = [
{
amsGradient = "string"
augmentations = "string"
beta1 = "string"
beta2 = "string"
distributed = "string"
earlyStopping = "string"
earlyStoppingDelay = "string"
earlyStoppingPatience = "string"
enableOnnxNormalization = "string"
evaluationFrequency = "string"
gradientAccumulationStep = "string"
layersToFreeze = "string"
learningRate = "string"
learningRateScheduler = "string"
modelName = "string"
momentum = "string"
nesterov = "string"
numberOfEpochs = "string"
numberOfWorkers = "string"
optimizer = "string"
randomSeed = "string"
stepLRGamma = "string"
stepLRStepSize = "string"
trainingBatchSize = "string"
trainingCropSize = "string"
validationBatchSize = "string"
validationCropSize = "string"
validationResizeSize = "string"
warmupCosineLRCycles = "string"
warmupCosineLRWarmupEpochs = "string"
weightDecay = "string"
weightedLoss = "string"
}
]
sweepSettings = {
earlyTermination = {
delayEvaluation = int
evaluationInterval = int
policyType = "string"
// For remaining properties, see EarlyTerminationPolicy objects
}
samplingAlgorithm = "string"
}
taskType = "ImageClassificationMultilabel"
validationData = {
description = "string"
jobInputType = "string"
mode = "string"
uri = "string"
}
validationDataSize = int
}
对于 ImageInstanceSegmentation,请使用:
{
limitSettings = {
maxConcurrentTrials = int
maxTrials = int
timeout = "string"
}
modelSettings = {
advancedSettings = "string"
amsGradient = bool
augmentations = "string"
beta1 = int
beta2 = int
boxDetectionsPerImage = int
boxScoreThreshold = int
checkpointFrequency = int
checkpointModel = {
description = "string"
jobInputType = "string"
mode = "string"
uri = "string"
}
checkpointRunId = "string"
distributed = bool
earlyStopping = bool
earlyStoppingDelay = int
earlyStoppingPatience = int
enableOnnxNormalization = bool
evaluationFrequency = int
gradientAccumulationStep = int
imageSize = int
layersToFreeze = int
learningRate = int
learningRateScheduler = "string"
maxSize = int
minSize = int
modelName = "string"
modelSize = "string"
momentum = int
multiScale = bool
nesterov = bool
nmsIouThreshold = int
numberOfEpochs = int
numberOfWorkers = int
optimizer = "string"
randomSeed = int
stepLRGamma = int
stepLRStepSize = int
tileGridSize = "string"
tileOverlapRatio = int
tilePredictionsNmsThreshold = int
trainingBatchSize = int
validationBatchSize = int
validationIouThreshold = int
validationMetricType = "string"
warmupCosineLRCycles = int
warmupCosineLRWarmupEpochs = int
weightDecay = int
}
primaryMetric = "string"
searchSpace = [
{
amsGradient = "string"
augmentations = "string"
beta1 = "string"
beta2 = "string"
boxDetectionsPerImage = "string"
boxScoreThreshold = "string"
distributed = "string"
earlyStopping = "string"
earlyStoppingDelay = "string"
earlyStoppingPatience = "string"
enableOnnxNormalization = "string"
evaluationFrequency = "string"
gradientAccumulationStep = "string"
imageSize = "string"
layersToFreeze = "string"
learningRate = "string"
learningRateScheduler = "string"
maxSize = "string"
minSize = "string"
modelName = "string"
modelSize = "string"
momentum = "string"
multiScale = "string"
nesterov = "string"
nmsIouThreshold = "string"
numberOfEpochs = "string"
numberOfWorkers = "string"
optimizer = "string"
randomSeed = "string"
stepLRGamma = "string"
stepLRStepSize = "string"
tileGridSize = "string"
tileOverlapRatio = "string"
tilePredictionsNmsThreshold = "string"
trainingBatchSize = "string"
validationBatchSize = "string"
validationIouThreshold = "string"
validationMetricType = "string"
warmupCosineLRCycles = "string"
warmupCosineLRWarmupEpochs = "string"
weightDecay = "string"
}
]
sweepSettings = {
earlyTermination = {
delayEvaluation = int
evaluationInterval = int
policyType = "string"
// For remaining properties, see EarlyTerminationPolicy objects
}
samplingAlgorithm = "string"
}
taskType = "ImageInstanceSegmentation"
validationData = {
description = "string"
jobInputType = "string"
mode = "string"
uri = "string"
}
validationDataSize = int
}
对于 ImageObjectDetection,请使用:
{
limitSettings = {
maxConcurrentTrials = int
maxTrials = int
timeout = "string"
}
modelSettings = {
advancedSettings = "string"
amsGradient = bool
augmentations = "string"
beta1 = int
beta2 = int
boxDetectionsPerImage = int
boxScoreThreshold = int
checkpointFrequency = int
checkpointModel = {
description = "string"
jobInputType = "string"
mode = "string"
uri = "string"
}
checkpointRunId = "string"
distributed = bool
earlyStopping = bool
earlyStoppingDelay = int
earlyStoppingPatience = int
enableOnnxNormalization = bool
evaluationFrequency = int
gradientAccumulationStep = int
imageSize = int
layersToFreeze = int
learningRate = int
learningRateScheduler = "string"
maxSize = int
minSize = int
modelName = "string"
modelSize = "string"
momentum = int
multiScale = bool
nesterov = bool
nmsIouThreshold = int
numberOfEpochs = int
numberOfWorkers = int
optimizer = "string"
randomSeed = int
stepLRGamma = int
stepLRStepSize = int
tileGridSize = "string"
tileOverlapRatio = int
tilePredictionsNmsThreshold = int
trainingBatchSize = int
validationBatchSize = int
validationIouThreshold = int
validationMetricType = "string"
warmupCosineLRCycles = int
warmupCosineLRWarmupEpochs = int
weightDecay = int
}
primaryMetric = "string"
searchSpace = [
{
amsGradient = "string"
augmentations = "string"
beta1 = "string"
beta2 = "string"
boxDetectionsPerImage = "string"
boxScoreThreshold = "string"
distributed = "string"
earlyStopping = "string"
earlyStoppingDelay = "string"
earlyStoppingPatience = "string"
enableOnnxNormalization = "string"
evaluationFrequency = "string"
gradientAccumulationStep = "string"
imageSize = "string"
layersToFreeze = "string"
learningRate = "string"
learningRateScheduler = "string"
maxSize = "string"
minSize = "string"
modelName = "string"
modelSize = "string"
momentum = "string"
multiScale = "string"
nesterov = "string"
nmsIouThreshold = "string"
numberOfEpochs = "string"
numberOfWorkers = "string"
optimizer = "string"
randomSeed = "string"
stepLRGamma = "string"
stepLRStepSize = "string"
tileGridSize = "string"
tileOverlapRatio = "string"
tilePredictionsNmsThreshold = "string"
trainingBatchSize = "string"
validationBatchSize = "string"
validationIouThreshold = "string"
validationMetricType = "string"
warmupCosineLRCycles = "string"
warmupCosineLRWarmupEpochs = "string"
weightDecay = "string"
}
]
sweepSettings = {
earlyTermination = {
delayEvaluation = int
evaluationInterval = int
policyType = "string"
// For remaining properties, see EarlyTerminationPolicy objects
}
samplingAlgorithm = "string"
}
taskType = "ImageObjectDetection"
validationData = {
description = "string"
jobInputType = "string"
mode = "string"
uri = "string"
}
validationDataSize = int
}
对于 回归,请使用:
{
cvSplitColumnNames = [
"string"
]
featurizationSettings = {
blockedTransformers = [
"string"
]
columnNameAndTypes = {
{customized property} = "string"
}
datasetLanguage = "string"
enableDnnFeaturization = bool
mode = "string"
transformerParams = {
{customized property} = [
{
fields = [
"string"
]
parameters = ?
}
]
}
}
fixedParameters = {
booster = "string"
boostingType = "string"
growPolicy = "string"
learningRate = int
maxBin = int
maxDepth = int
maxLeaves = int
minDataInLeaf = int
minSplitGain = int
modelName = "string"
nEstimators = int
numLeaves = int
preprocessorName = "string"
regAlpha = int
regLambda = int
subsample = int
subsampleFreq = int
treeMethod = "string"
withMean = bool
withStd = bool
}
limitSettings = {
enableEarlyTermination = bool
exitScore = int
maxConcurrentTrials = int
maxCoresPerTrial = int
maxTrials = int
sweepConcurrentTrials = int
sweepTrials = int
timeout = "string"
trialTimeout = "string"
}
nCrossValidations = {
mode = "string"
// For remaining properties, see NCrossValidations objects
}
primaryMetric = "string"
searchSpace = [
{
booster = "string"
boostingType = "string"
growPolicy = "string"
learningRate = "string"
maxBin = "string"
maxDepth = "string"
maxLeaves = "string"
minDataInLeaf = "string"
minSplitGain = "string"
modelName = "string"
nEstimators = "string"
numLeaves = "string"
preprocessorName = "string"
regAlpha = "string"
regLambda = "string"
subsample = "string"
subsampleFreq = "string"
treeMethod = "string"
withMean = "string"
withStd = "string"
}
]
sweepSettings = {
earlyTermination = {
delayEvaluation = int
evaluationInterval = int
policyType = "string"
// For remaining properties, see EarlyTerminationPolicy objects
}
samplingAlgorithm = "string"
}
taskType = "Regression"
testData = {
description = "string"
jobInputType = "string"
mode = "string"
uri = "string"
}
testDataSize = int
trainingSettings = {
allowedTrainingAlgorithms = [
"string"
]
blockedTrainingAlgorithms = [
"string"
]
enableDnnTraining = bool
enableModelExplainability = bool
enableOnnxCompatibleModels = bool
enableStackEnsemble = bool
enableVoteEnsemble = bool
ensembleModelDownloadTimeout = "string"
stackEnsembleSettings = {
stackMetaLearnerKWargs = ?
stackMetaLearnerTrainPercentage = int
stackMetaLearnerType = "string"
}
}
validationData = {
description = "string"
jobInputType = "string"
mode = "string"
uri = "string"
}
validationDataSize = int
weightColumnName = "string"
}
对于 TextClassification,请使用:
{
featurizationSettings = {
datasetLanguage = "string"
}
fixedParameters = {
gradientAccumulationSteps = int
learningRate = int
learningRateScheduler = "string"
modelName = "string"
numberOfEpochs = int
trainingBatchSize = int
validationBatchSize = int
warmupRatio = int
weightDecay = int
}
limitSettings = {
maxConcurrentTrials = int
maxNodes = int
maxTrials = int
timeout = "string"
trialTimeout = "string"
}
primaryMetric = "string"
searchSpace = [
{
gradientAccumulationSteps = "string"
learningRate = "string"
learningRateScheduler = "string"
modelName = "string"
numberOfEpochs = "string"
trainingBatchSize = "string"
validationBatchSize = "string"
warmupRatio = "string"
weightDecay = "string"
}
]
sweepSettings = {
earlyTermination = {
delayEvaluation = int
evaluationInterval = int
policyType = "string"
// For remaining properties, see EarlyTerminationPolicy objects
}
samplingAlgorithm = "string"
}
taskType = "TextClassification"
validationData = {
description = "string"
jobInputType = "string"
mode = "string"
uri = "string"
}
}
对于 TextClassificationMultilabel,请使用:
{
featurizationSettings = {
datasetLanguage = "string"
}
fixedParameters = {
gradientAccumulationSteps = int
learningRate = int
learningRateScheduler = "string"
modelName = "string"
numberOfEpochs = int
trainingBatchSize = int
validationBatchSize = int
warmupRatio = int
weightDecay = int
}
limitSettings = {
maxConcurrentTrials = int
maxNodes = int
maxTrials = int
timeout = "string"
trialTimeout = "string"
}
searchSpace = [
{
gradientAccumulationSteps = "string"
learningRate = "string"
learningRateScheduler = "string"
modelName = "string"
numberOfEpochs = "string"
trainingBatchSize = "string"
validationBatchSize = "string"
warmupRatio = "string"
weightDecay = "string"
}
]
sweepSettings = {
earlyTermination = {
delayEvaluation = int
evaluationInterval = int
policyType = "string"
// For remaining properties, see EarlyTerminationPolicy objects
}
samplingAlgorithm = "string"
}
taskType = "TextClassificationMultilabel"
validationData = {
description = "string"
jobInputType = "string"
mode = "string"
uri = "string"
}
}
对于 TextNER,请使用:
{
featurizationSettings = {
datasetLanguage = "string"
}
fixedParameters = {
gradientAccumulationSteps = int
learningRate = int
learningRateScheduler = "string"
modelName = "string"
numberOfEpochs = int
trainingBatchSize = int
validationBatchSize = int
warmupRatio = int
weightDecay = int
}
limitSettings = {
maxConcurrentTrials = int
maxNodes = int
maxTrials = int
timeout = "string"
trialTimeout = "string"
}
searchSpace = [
{
gradientAccumulationSteps = "string"
learningRate = "string"
learningRateScheduler = "string"
modelName = "string"
numberOfEpochs = "string"
trainingBatchSize = "string"
validationBatchSize = "string"
warmupRatio = "string"
weightDecay = "string"
}
]
sweepSettings = {
earlyTermination = {
delayEvaluation = int
evaluationInterval = int
policyType = "string"
// For remaining properties, see EarlyTerminationPolicy objects
}
samplingAlgorithm = "string"
}
taskType = "TextNER"
validationData = {
description = "string"
jobInputType = "string"
mode = "string"
uri = "string"
}
}
TargetLags 对象
设置 模式 属性以指定对象的类型。
对于 自动,请使用:
{
mode = "Auto"
}
对于 “自定义”,请使用:
{
mode = "Custom"
values = [
int
]
}
LabelingJobMediaProperties 对象
设置 mediaType 属性以指定对象的类型。
对于 映像,请使用:
{
annotationType = "string"
mediaType = "Image"
}
对于 文本,请使用:
{
annotationType = "string"
mediaType = "Text"
}
JobInput 对象
设置 jobInputType 属性以指定对象的类型。
对于 custom_model,请使用:
{
jobInputType = "custom_model"
mode = "string"
uri = "string"
}
对于 文本,请使用:
{
jobInputType = "literal"
value = "string"
}
对于 mlflow_model,请使用:
{
jobInputType = "mlflow_model"
mode = "string"
uri = "string"
}
对于 mltable,请使用:
{
jobInputType = "mltable"
mode = "string"
uri = "string"
}
对于 triton_model,请使用:
{
jobInputType = "triton_model"
mode = "string"
uri = "string"
}
对于 uri_file,请使用:
{
jobInputType = "uri_file"
mode = "string"
uri = "string"
}
对于 uri_folder,请使用:
{
jobInputType = "uri_folder"
mode = "string"
uri = "string"
}
JobBaseProperties 对象
设置 jobType 属性以指定对象的类型。
对于 AutoML,请使用:
{
environmentId = "string"
environmentVariables = {
{customized property} = "string"
}
jobType = "AutoML"
outputs = {
{customized property} = {
description = "string"
jobOutputType = "string"
// For remaining properties, see JobOutput objects
}
}
resources = {
dockerArgs = "string"
instanceCount = int
instanceType = "string"
properties = {
{customized property} = ?
}
shmSize = "string"
}
taskDetails = {
logVerbosity = "string"
targetColumnName = "string"
trainingData = {
description = "string"
jobInputType = "string"
mode = "string"
uri = "string"
}
taskType = "string"
// For remaining properties, see AutoMLVertical objects
}
}
对于 命令,请使用:
{
autologgerSettings = {
mlflowAutologger = "string"
}
codeId = "string"
command = "string"
distribution = {
distributionType = "string"
// For remaining properties, see DistributionConfiguration objects
}
environmentId = "string"
environmentVariables = {
{customized property} = "string"
}
inputs = {
{customized property} = {
description = "string"
jobInputType = "string"
// For remaining properties, see JobInput objects
}
}
jobType = "Command"
limits = {
jobLimitsType = "string"
timeout = "string"
}
outputs = {
{customized property} = {
description = "string"
jobOutputType = "string"
// For remaining properties, see JobOutput objects
}
}
resources = {
dockerArgs = "string"
instanceCount = int
instanceType = "string"
properties = {
{customized property} = ?
}
shmSize = "string"
}
}
对于 标记,请使用:
{
dataConfiguration = {
dataId = "string"
incrementalDataRefreshEnabled = bool
}
jobInstructions = {
uri = "string"
}
jobType = "Labeling"
labelCategories = {
{customized property} = {
classes = {
{customized property} = {
displayName = "string"
subclasses = {
{customized property} = ...
}
}
}
displayName = "string"
multiSelectEnabled = bool
}
}
labelingJobMediaProperties = {
mediaType = "string"
// For remaining properties, see LabelingJobMediaProperties objects
}
mlAssistConfiguration = {
mlAssist = "string"
// For remaining properties, see MLAssistConfiguration objects
}
}
对于 管道,请使用:
{
inputs = {
{customized property} = {
description = "string"
jobInputType = "string"
// For remaining properties, see JobInput objects
}
}
jobs = {
{customized property} = ?
}
jobType = "Pipeline"
outputs = {
{customized property} = {
description = "string"
jobOutputType = "string"
// For remaining properties, see JobOutput objects
}
}
settings = ?
sourceJobId = "string"
}
对于 Spark,请使用:
{
archives = [
"string"
]
args = "string"
codeId = "string"
conf = {
{customized property} = "string"
}
entry = {
sparkJobEntryType = "string"
// For remaining properties, see SparkJobEntry objects
}
environmentId = "string"
files = [
"string"
]
inputs = {
{customized property} = {
description = "string"
jobInputType = "string"
// For remaining properties, see JobInput objects
}
}
jars = [
"string"
]
jobType = "Spark"
outputs = {
{customized property} = {
description = "string"
jobOutputType = "string"
// For remaining properties, see JobOutput objects
}
}
pyFiles = [
"string"
]
resources = {
instanceType = "string"
runtimeVersion = "string"
}
}
对于 扫描,请使用:
{
earlyTermination = {
delayEvaluation = int
evaluationInterval = int
policyType = "string"
// For remaining properties, see EarlyTerminationPolicy objects
}
inputs = {
{customized property} = {
description = "string"
jobInputType = "string"
// For remaining properties, see JobInput objects
}
}
jobType = "Sweep"
limits = {
jobLimitsType = "string"
maxConcurrentTrials = int
maxTotalTrials = int
timeout = "string"
trialTimeout = "string"
}
objective = {
goal = "string"
primaryMetric = "string"
}
outputs = {
{customized property} = {
description = "string"
jobOutputType = "string"
// For remaining properties, see JobOutput objects
}
}
samplingAlgorithm = {
samplingAlgorithmType = "string"
// For remaining properties, see SamplingAlgorithm objects
}
searchSpace = ?
trial = {
codeId = "string"
command = "string"
distribution = {
distributionType = "string"
// For remaining properties, see DistributionConfiguration objects
}
environmentId = "string"
environmentVariables = {
{customized property} = "string"
}
resources = {
dockerArgs = "string"
instanceCount = int
instanceType = "string"
properties = {
{customized property} = ?
}
shmSize = "string"
}
}
}
节点对象
设置 nodesValueType 属性以指定对象的类型。
对于 “全部”,请使用:
{
nodesValueType = "All"
}
SamplingAlgorithm 对象
设置 samplingAlgorithmType 属性以指定对象的类型。
对于 Bayesian,请使用:
{
samplingAlgorithmType = "Bayesian"
}
对于 网格,请使用:
{
samplingAlgorithmType = "Grid"
}
对于 Random,请使用:
{
rule = "string"
samplingAlgorithmType = "Random"
seed = int
}
NCrossValidations 对象
设置 模式 属性以指定对象的类型。
对于 自动,请使用:
{
mode = "Auto"
}
对于 “自定义”,请使用:
{
mode = "Custom"
value = int
}
属性值
Microsoft.MachineLearningServices/workspaces/jobs
名称 | DESCRIPTION | 价值 |
---|---|---|
姓名 | 资源名称 | 字符串 约束: 模式 = ^[a-zA-Z0-9][a-zA-Z0-9\-_]{0,254}$ (必需) |
parent_id | 此资源的父资源的 ID。 | 类型资源的 ID: 工作区 |
属性 | [必需]实体的其他属性。 | JobBaseProperties (必需) |
类型 | 资源类型 | “Microsoft.MachineLearningServices/workspaces/jobs@2022-10-01-preview” |
所有节点
名称 | DESCRIPTION | 价值 |
---|---|---|
nodesValueType | [必需]Nodes 值的类型 | “全部”(必需) |
AmlToken
名称 | DESCRIPTION | 价值 |
---|---|---|
身份类型 | [必需]指定标识框架的类型。 | “AMLToken”(必需) |
自动预测地平线
名称 | DESCRIPTION | 价值 |
---|---|---|
模式 | [必需]设置预测地平线值选择模式。 | “Auto”(必需) |
Autologger 设置
名称 | DESCRIPTION | 价值 |
---|---|---|
mlflow自动记录器 | [必需]指示是否启用 mlflow 自动记录器。 | “Disabled” “Enabled”(必需) |
AutoMLJob
名称 | DESCRIPTION | 价值 |
---|---|---|
环境 ID | 作业的环境规范的 ARM 资源 ID。 这是一个可选值,如果未提供,AutoML 将在运行作业时将其默认为生产 AutoML 特选环境版本。 |
字符串 |
环境变量 | 作业中包含的环境变量。 | AutoMLJobEnvironmentVariables |
职位类型 | [必需]指定作业的类型。 | “AutoML”(必需) |
输出 | 作业中使用的输出数据绑定的映射。 | AutoMLJob 输出 |
资源 | 作业的计算资源配置。 | JobResourceConfiguration |
taskDetails | [必需]这表示可以是表/NLP/Image 之一的方案 | AutoMLVertical (必需) |
AutoMLJobEnvironmentVariables
名称 | DESCRIPTION | 价值 |
---|
AutoMLJob 输出
名称 | DESCRIPTION | 价值 |
---|
AutoMLVertical
名称 | DESCRIPTION | 价值 |
---|---|---|
logVerbosity (对数详细程度) | 作业的详细记录。 | “Critical” “Debug” “Error” “Info” “NotSet” “Warning” |
targetColumnName | 目标列名称:这是预测值列。 也称为分类任务的上下文中的标签列名称。 |
字符串 |
任务类型 | 设置为类型 “分类”的“分类”。 设置为“ 预测”类型。 设置为 ImageClassification 类型的“ImageClassification”。 设置为 ImageClassificationMultilabel 类型的“ImageClassificationMultilabel”。 设置为 ImageInstanceSegmentation 类型的“ImageInstanceSegmentation”。 设置为 ImageObjectDetection 类型的“ImageObjectDetection”。 设置为“ 回归”类型。 设置为 TextClassification 类型的“TextClassification”。 对于 TextClassificationMultilabel,设置为“TextClassificationMultilabel”。 设置为 TextNer 类型的“TextNER”。 | “Classification” “预测” “ImageClassification” “ImageClassificationMultilabel” “ImageInstanceSegmentation” “ImageObjectDetection” “回归” “TextClassification” “TextClassificationMultilabel” “TextNER”(必需) |
trainingData (训练数据) | [必需]训练数据输入。 | MLTableJobInput (必需) |
AutoNCross验证
名称 | DESCRIPTION | 价值 |
---|---|---|
模式 | [必需]用于确定 N 交叉验证的模式。 | “Auto”(必需) |
自动季节性
名称 | DESCRIPTION | 价值 |
---|---|---|
模式 | [必需]季节性模式。 | “Auto”(必需) |
AutoTargetLags 自动目标滞后
名称 | DESCRIPTION | 价值 |
---|---|---|
模式 | [必需]设置目标滞后模式 - 自动/自定义 | “Auto”(必需) |
AutoTargetRollingWindowSize (自动目标滚动窗口大小)
名称 | DESCRIPTION | 价值 |
---|---|---|
模式 | [必需]TargetRollingWindowSiz 检测模式。 | “Auto”(必需) |
BanditPolicy (强盗政策)
名称 | DESCRIPTION | 价值 |
---|---|---|
policyType | [必需]策略配置的名称 | “强盗”(必需) |
slackAmount | 从性能最佳的运行中允许的绝对距离。 | 整数 (int) |
slackFactor 的 | 与性能最佳的运行距离的允许距离比率。 | 整数 (int) |
BayesianSamplingAlgorithm
名称 | DESCRIPTION | 价值 |
---|---|---|
采样算法类型 | [必需]用于生成超参数值的算法以及配置属性 | “贝伊西亚”(必需) |
分类
名称 | DESCRIPTION | 价值 |
---|---|---|
cvSplitColumnNames | 用于 CVSplit 数据的列。 | 字符串[] |
featurizationSettings | AutoML 作业所需的特征化输入。 | TableVerticalFeaturizationSettings |
固定参数 | 在整个训练过程中将保持不变的模型/训练参数。 | TableFixedParameters (表固定参数) |
limitSettings | AutoMLJob 的执行约束。 | TableVerticalLimitSettings |
nCrossValidations | 要应用于训练数据集的交叉验证折叠数 如果未提供验证数据集,则为 。 |
NCross验证 |
积极标签 | 二进制指标计算的正标签。 | 字符串 |
primaryMetric | 任务的主要指标。 | “准确性” “AUCWeighted” “AveragePrecisionScoreWeighted” “NormMacroRecall” “PrecisionScoreWeighted” |
搜索空间 | 用于采样模型及其超参数的不同组合的搜索空间。 | TableParameterSubspace[] |
扫描设置 | 模型扫描和超参数优化的设置。 | TableSweepSettings (表格扫描设置) |
任务类型 | [必需]AutoMLJob 的任务类型。 | “分类”(必需) |
测试数据 | 测试数据输入。 | MLTableJobInput |
testDataSize | 需要为验证目的预留的测试数据集的分数。 介于 (0.0、 1.0) 之间的值 未提供验证数据集时应用。 |
整数 (int) |
trainingSettings | AutoML 作业训练阶段的输入。 | 分类训练设置 |
validationData (验证数据) | 验证数据输入。 | MLTableJobInput |
validationDataSize | 需要留出用于验证的定型数据集的分数。 介于 (0.0、 1.0) 之间的值 未提供验证数据集时应用。 |
整数 (int) |
权重列名称 | 示例权重列的名称。 自动化 ML 支持加权列作为输入,导致数据中的行向上或向下加权。 | 字符串 |
分类训练设置
名称 | DESCRIPTION | 价值 |
---|---|---|
allowedTrainingAlgorithms | 分类任务的允许模型。 | 包含任一项的字符串数组: “BernoulliNaiveBayes” “DecisionTree” “ExtremeRandomTrees” “GradientBoosting” “KNN” “LightGBM” “LinearSVM” “LogisticRegression” “MultinomialNaiveBayes” “RandomForest” “ZN” “SVM” “XGBoostClassifier” |
blockedTrainingAlgorithms | 分类任务的阻止模型。 | 包含任一项的字符串数组: “BernoulliNaiveBayes” “DecisionTree” “ExtremeRandomTrees” “GradientBoosting” “KNN” “LightGBM” “LinearSVM” “LogisticRegression” “MultinomialNaiveBayes” “RandomForest” “ZN” “SVM” “XGBoostClassifier” |
enableDnnTraining | 启用 DNN 模型的建议。 | 布尔 |
enableModelExplainability | 标志以在最佳模型上启用可解释性。 | 布尔 |
enableOnnxCompatibleModels | 用于启用 onnx 兼容模型的标志。 | 布尔 |
enableStackEnsemble | 启用堆栈合奏运行。 | 布尔 |
enableVoteEnsemble | 启用投票合奏运行。 | 布尔 |
ensembleModelDownloadTimeout | 在 VotingEnsemble 和 StackEnsemble 模型生成期间,将下载先前子运行中的多个拟合模型。 如果需要更多时间,请将此参数配置为大于 300 秒的值。 |
字符串 |
stackEnsembleSettings | 堆栈合奏的堆栈合奏设置。 | StackEnsembleSettings |
ColumnTransformer (列变换器)
名称 | DESCRIPTION | 价值 |
---|---|---|
字段 | 要应用转换器逻辑的字段。 | 字符串[] |
参数 | 要传递给转换器的不同属性。 输入应为 JSON 格式的键值对字典。 |
任何 |
CommandJob
名称 | DESCRIPTION | 价值 |
---|---|---|
autologger设置 | 作业的分发配置。 如果已设置,则应为 Mpi、Tensorflow、PyTorch 或 null 之一。 | Autologger 设置 |
代码 Id | 代码资产的 ARM 资源 ID。 | 字符串 |
指令 | [必需]在启动作业时执行的命令。 例如 “python train.py” | 字符串 约束: 最小长度 = 1 模式 = [a-zA-Z0-9_] (必需) |
分配 | 作业的分发配置。 如果已设置,则应为 Mpi、Tensorflow、PyTorch 或 null 之一。 | 分发配置 |
环境 ID | [必需]作业的环境规范的 ARM 资源 ID。 | 字符串 约束: 模式 = [a-zA-Z0-9_] (必需) |
环境变量 | 作业中包含的环境变量。 | CommandJobEnvironmentVariables |
输入 | 作业中使用的输入数据绑定的映射。 | CommandJobInputs 命令作业输入 |
职位类型 | [必需]指定作业的类型。 | “Command”(必需) |
限制 | 命令作业限制。 | CommandJobLimits 命令作业限制 |
输出 | 作业中使用的输出数据绑定的映射。 | CommandJobOutputs 命令作业输出 |
资源 | 作业的计算资源配置。 | JobResourceConfiguration |
CommandJobEnvironmentVariables
名称 | DESCRIPTION | 价值 |
---|
CommandJobInputs 命令作业输入
名称 | DESCRIPTION | 价值 |
---|
CommandJobLimits 命令作业限制
名称 | DESCRIPTION | 价值 |
---|---|---|
jobLimits类型 | [必需]JobLimit 类型。 | “Command” “扫描”(必需) |
超时 | ISO 8601 格式的最大运行持续时间,之后作业将被取消。 仅支持精度为秒的持续时间。 | 字符串 |
CommandJobOutputs 命令作业输出
名称 | DESCRIPTION | 价值 |
---|
CustomForecastHorizon
名称 | DESCRIPTION | 价值 |
---|---|---|
模式 | [必需]设置预测地平线值选择模式。 | “Custom”(必需) |
价值 | [必需]预测地平线值。 | int (必需) |
CustomModelJobInput (自定义模型作业输入)
名称 | DESCRIPTION | 价值 |
---|---|---|
jobInputType (作业输入类型) | [必需]指定作业的类型。 | “custom_model”(必需) |
模式 | 输入资产传送模式。 | “Direct” “下载” “EvalDownload” “EvalMount” “ReadOnlyMount” “ReadWriteMount” |
URI | [必需]输入资产 URI。 | 字符串 约束: 模式 = [a-zA-Z0-9_] (必需) |
CustomModelJobOutput
名称 | DESCRIPTION | 价值 |
---|---|---|
jobOutputType | [必需]指定作业的类型。 | “custom_model”(必需) |
模式 | 输出资产传送模式。 | “Direct” “ReadWriteMount” “Upload” |
URI | 输出资产 URI。 | 字符串 |
CustomNCross验证
名称 | DESCRIPTION | 价值 |
---|---|---|
模式 | [必需]用于确定 N 交叉验证的模式。 | “Custom”(必需) |
价值 | [必需]N 交叉验证值。 | int (必需) |
CustomSeasonality (自定义季节性)
名称 | DESCRIPTION | 价值 |
---|---|---|
模式 | [必需]季节性模式。 | “Custom”(必需) |
价值 | [必需]季节性值。 | int (必需) |
CustomTargetLags (自定义目标滞后)
名称 | DESCRIPTION | 价值 |
---|---|---|
模式 | [必需]设置目标滞后模式 - 自动/自定义 | “Custom”(必需) |
价值, 价值观 | [必需]设置目标滞后值。 | int[] (必需) |
CustomTargetRollingWindowSize
名称 | DESCRIPTION | 价值 |
---|---|---|
模式 | [必需]TargetRollingWindowSiz 检测模式。 | “Custom”(必需) |
价值 | [必需]TargetRollingWindowSize 值。 | int (必需) |
分发配置
名称 | DESCRIPTION | 价值 |
---|---|---|
distributionType | 对于 Mpi 类型,设置为“ Mpi”。 对于 PyTorch 类型,设置为“ PyTorch”。 设置为 TensorFlow 类型的“TensorFlow”。 | “Mpi” “PyTorch” “TensorFlow”(必需) |
提前终止政策
名称 | DESCRIPTION | 价值 |
---|---|---|
delay评估 | 延迟第一次计算的间隔数。 | 整数 (int) |
evaluationInterval | 策略评估之间的间隔(运行数)。 | 整数 (int) |
policyType | 设置为“ BanditPolicy”类型为“BanditPolicy”。 对于 MedianStoppingPolicy,设置为“MedianStoppingPolicy”。 对于 TruncationSelectionPolicy 类型,设置为“TruncationSelection”。 | “Bandit” “MedianStopping” “TruncationSelection”(必需) |
预测地平线
名称 | DESCRIPTION | 价值 |
---|---|---|
模式 | 设置为“ AutoForecastHorizon”类型。 设置为 CustomForecastHorizon 类型的“Custom”。 | “Auto” “Custom”(必需) |
预测
名称 | DESCRIPTION | 价值 |
---|---|---|
cvSplitColumnNames | 用于 CVSplit 数据的列。 | 字符串[] |
featurizationSettings | AutoML 作业所需的特征化输入。 | TableVerticalFeaturizationSettings |
固定参数 | 在整个训练过程中将保持不变的模型/训练参数。 | TableFixedParameters (表固定参数) |
forecasting设置 | 预测任务特定的输入。 | ForecastingSettings |
limitSettings | AutoMLJob 的执行约束。 | TableVerticalLimitSettings |
nCrossValidations | 要应用于训练数据集的交叉验证折叠数 如果未提供验证数据集,则为 。 |
NCross验证 |
primaryMetric | 预测任务的主要指标。 | “NormalizedMeanAbsoluteError” “NormalizedRootMeanSquaredError” “R2Score” 'SpearmanCorrelation' |
搜索空间 | 用于采样模型及其超参数的不同组合的搜索空间。 | TableParameterSubspace[] |
扫描设置 | 模型扫描和超参数优化的设置。 | TableSweepSettings (表格扫描设置) |
任务类型 | [必需]AutoMLJob 的任务类型。 | “预测”(必需) |
测试数据 | 测试数据输入。 | MLTableJobInput |
testDataSize | 需要为验证目的预留的测试数据集的分数。 介于 (0.0、 1.0) 之间的值 未提供验证数据集时应用。 |
整数 (int) |
trainingSettings | AutoML 作业训练阶段的输入。 | ForecastingTrainingSettings |
validationData (验证数据) | 验证数据输入。 | MLTableJobInput |
validationDataSize | 需要留出用于验证的定型数据集的分数。 介于 (0.0、 1.0) 之间的值 未提供验证数据集时应用。 |
整数 (int) |
权重列名称 | 示例权重列的名称。 自动化 ML 支持加权列作为输入,导致数据中的行向上或向下加权。 | 字符串 |
ForecastingSettings
名称 | DESCRIPTION | 价值 |
---|---|---|
国家/地区或地区为假期 | 用于预测任务的假日国家或地区。 这些代码应为 ISO 3166 双字母国家/地区代码,例如“US”或“GB”。 |
字符串 |
cvStepSize | 一个 CV 折叠的起始时间与下一个折叠之间的句点数。 为 例如,如果 CVStepSize = 3 表示每日数据,则每个折叠的源时间将为三天相隔。 |
整数 (int) |
featureLags | 使用“auto”或 null 为数值特征生成滞后的标志。 | “Auto” “None” |
forecastHorizon (预测地平线) | 所需最大预测范围(以时序频率单位为单位)。 | 预测地平线 |
频率 | 预测时,此参数表示需要预测的时间段,例如每日、每周、每年等。默认情况下,预测频率为数据集频率。 | 字符串 |
季节性 | 将时序季节性设置为序列频率的整数倍数。 如果季节性设置为“auto”,则会推断它。 |
季节性 |
shortSeriesHandlingConfig | 定义 AutoML 如何处理短时序的参数。 | “Auto” “掉落” “None” “Pad” |
targetAggregateFunction | 用于聚合符合用户指定频率的时序目标列的函数。 如果设置了 TargetAggregateFunction,即不是“None”,但未设置 freq 参数,则会引发错误。 可能的目标聚合函数包括:“sum”、“max”、“min”和“mean”。 |
“Max” “Mean” “Min” “None” “Sum” |
目标拉格 | 要从目标列滞后的过去时间段数。 | 目标滞后 |
targetRollingWindowSize | 用于创建目标列的滚动窗口平均值的过去时间段数。 | TargetRollingWindowSize |
timeColumnName (时间列名称) | 时间列的名称。 当预测在用于生成时序并推断其频率的输入数据中指定日期/时间列时,此参数是必需的。 | 字符串 |
timeSeriesIdColumnNames | 用于对时间序列进行分组的列的名称。 它可用于创建多个序列。 如果未定义粒度,则假定数据集为一个时序。 此参数用于任务类型预测。 |
字符串[] |
useStl | 配置时序目标列的 STL 分解。 | “None” “季度” “SeasonTrend” |
ForecastingTrainingSettings
名称 | DESCRIPTION | 价值 |
---|---|---|
allowedTrainingAlgorithms | 允许用于预测任务的模型。 | 包含任一项的字符串数组: “Arimax” “AutoArima” “Average” “DecisionTree” “ElasticNet” “ExponentialSmoothing” “ExtremeRandomTrees” “GradientBoosting” “KNN” “LassoLars” “LightGBM” “Naive” “先知” “RandomForest” “SeasonalAverage” “SeasonalNaive” “ZN” “TCNForecaster” “XGBoostRegressor” |
blockedTrainingAlgorithms | 用于预测任务的阻止模型。 | 包含任一项的字符串数组: “Arimax” “AutoArima” “Average” “DecisionTree” “ElasticNet” “ExponentialSmoothing” “ExtremeRandomTrees” “GradientBoosting” “KNN” “LassoLars” “LightGBM” “Naive” “先知” “RandomForest” “SeasonalAverage” “SeasonalNaive” “ZN” “TCNForecaster” “XGBoostRegressor” |
enableDnnTraining | 启用 DNN 模型的建议。 | 布尔 |
enableModelExplainability | 标志以在最佳模型上启用可解释性。 | 布尔 |
enableOnnxCompatibleModels | 用于启用 onnx 兼容模型的标志。 | 布尔 |
enableStackEnsemble | 启用堆栈合奏运行。 | 布尔 |
enableVoteEnsemble | 启用投票合奏运行。 | 布尔 |
ensembleModelDownloadTimeout | 在 VotingEnsemble 和 StackEnsemble 模型生成期间,将下载先前子运行中的多个拟合模型。 如果需要更多时间,请将此参数配置为大于 300 秒的值。 |
字符串 |
stackEnsembleSettings | 堆栈合奏的堆栈合奏设置。 | StackEnsembleSettings |
GridSampling算法
名称 | DESCRIPTION | 价值 |
---|---|---|
采样算法类型 | [必需]用于生成超参数值的算法以及配置属性 | “Grid”(必需) |
身份配置
名称 | DESCRIPTION | 价值 |
---|---|---|
身份类型 | 对于 AmlToken 类型,设置为“AMLToken”。 设置为 “ManagedIdentity”类型。 对于 UserIdentity 类型,设置为“UserIdentity”。 | “AMLToken” “Managed” “UserIdentity”(必需) |
图像分类
名称 | DESCRIPTION | 价值 |
---|---|---|
limitSettings | [必需]限制 AutoML 作业的设置。 | ImageLimitSettings (必需) |
modelSettings | 用于训练模型的设置。 | ImageModelSettings分类 |
primaryMetric | 要针对此任务进行优化的主要指标。 | “准确性” “AUCWeighted” “AveragePrecisionScoreWeighted” “NormMacroRecall” “PrecisionScoreWeighted” |
搜索空间 | 用于采样模型及其超参数的不同组合的搜索空间。 | ImageModelDistributionSettingsClassification[] |
扫描设置 | 模型扫描和超参数扫描相关设置。 | ImageSweepSettings (图像扫描设置) |
任务类型 | [必需]AutoMLJob 的任务类型。 | “ImageClassification”(必需) |
validationData (验证数据) | 验证数据输入。 | MLTableJobInput |
validationDataSize | 需要留出用于验证的定型数据集的分数。 介于 (0.0、 1.0) 之间的值 未提供验证数据集时应用。 |
整数 (int) |
ImageClassificationMultilabel
名称 | DESCRIPTION | 价值 |
---|---|---|
limitSettings | [必需]限制 AutoML 作业的设置。 | ImageLimitSettings (必需) |
modelSettings | 用于训练模型的设置。 | ImageModelSettings分类 |
primaryMetric | 要针对此任务进行优化的主要指标。 | “准确性” “AUCWeighted” “AveragePrecisionScoreWeighted” “IOU” “NormMacroRecall” “PrecisionScoreWeighted” |
搜索空间 | 用于采样模型及其超参数的不同组合的搜索空间。 | ImageModelDistributionSettingsClassification[] |
扫描设置 | 模型扫描和超参数扫描相关设置。 | ImageSweepSettings (图像扫描设置) |
任务类型 | [必需]AutoMLJob 的任务类型。 | “ImageClassificationMultilabel”(必需) |
validationData (验证数据) | 验证数据输入。 | MLTableJobInput |
validationDataSize | 需要留出用于验证的定型数据集的分数。 介于 (0.0、 1.0) 之间的值 未提供验证数据集时应用。 |
整数 (int) |
ImageInstanceSegmentation
名称 | DESCRIPTION | 价值 |
---|---|---|
limitSettings | [必需]限制 AutoML 作业的设置。 | ImageLimitSettings (必需) |
modelSettings | 用于训练模型的设置。 | ImageModelSettingsObjectDetection |
primaryMetric | 要针对此任务进行优化的主要指标。 | “MeanAveragePrecision” |
搜索空间 | 用于采样模型及其超参数的不同组合的搜索空间。 | ImageModelDistributionSettingsObjectDetection[] |
扫描设置 | 模型扫描和超参数扫描相关设置。 | ImageSweepSettings (图像扫描设置) |
任务类型 | [必需]AutoMLJob 的任务类型。 | “ImageInstanceSegmentation”(必需) |
validationData (验证数据) | 验证数据输入。 | MLTableJobInput |
validationDataSize | 需要留出用于验证的定型数据集的分数。 介于 (0.0、 1.0) 之间的值 未提供验证数据集时应用。 |
整数 (int) |
ImageLimitSettings
名称 | DESCRIPTION | 价值 |
---|---|---|
maxConcurrentTrials | 最大并发 AutoML 迭代数。 | 整数 (int) |
maxTrials | AutoML 迭代的最大数目。 | 整数 (int) |
超时 | AutoML 作业超时。 | 字符串 |
ImageModelDistributionSettings分类
名称 | DESCRIPTION | 价值 |
---|---|---|
amsGradient | 优化器为“adam”或“adamw”时启用 AMSGrad。 | 字符串 |
扩充 | 使用扩充的设置。 | 字符串 |
贝塔1 | 优化器为“adam”或“adamw”时“beta1”的值。 必须是 [0, 1] 范围内的浮点。 | 字符串 |
贝塔2 | 优化器为“adam”或“adamw”时“beta2”的值。 必须是 [0, 1] 范围内的浮点。 | 字符串 |
分散式 | 是否使用分布式程序训练。 | 字符串 |
earlyStopping (早期停止) | 在训练期间启用提前停止逻辑。 | 字符串 |
earlyStoppingDelay | 在主要指标改进之前等待的最小纪元数或验证评估数 跟踪早期停止。 必须是正整数。 |
字符串 |
早点停止耐心 | 之前没有主要指标改进的最小纪元或验证评估数 运行已停止。 必须是正整数。 |
字符串 |
enableOnnxNormalization | 导出 ONNX 模型时启用规范化。 | 字符串 |
evaluationFrequency | 评估验证数据集以获取指标分数的频率。 必须是正整数。 | 字符串 |
梯度累积步骤 | 渐变累积意味着在不运行配置数量的“GradAccumulationStep”步骤的情况下 更新模型权重,同时累积这些步骤的渐变,然后使用 用于计算权重更新的累积渐变。 必须是正整数。 |
字符串 |
layersToFreeze (图层冻结) | 要冻结模型的层数。 必须是正整数。 例如,将 2 作为“seresnext”的值传递意味着 冻结 layer0 和 layer1。 有关支持的模型的完整列表以及有关层冻结的详细信息,请 请参阅:/azure/machine-learning/how-to-auto-train-image-models。 |
字符串 |
learningRate | 初始学习速率。 必须是 [0, 1] 范围内的浮点。 | 字符串 |
learningRateScheduler 的 | 学习速率计划程序的类型。 必须是“warmup_cosine”或“step”。 | 字符串 |
模型名称 | 要用于训练的模型的名称。 有关可用模型的详细信息,请访问官方文档: /azure/machine-learning/how-to-auto-train-image-models。 |
字符串 |
动量 | 优化器为“zn”时的动量值。 必须是 [0, 1] 范围内的浮点。 | 字符串 |
涅斯特罗夫 | 优化器为“zn”时启用 nesterov。 | 字符串 |
纪元数 | 训练纪元数。 必须是正整数。 | 字符串 |
工人数 | 数据加载程序辅助角色数。 必须是非负整数。 | 字符串 |
优化器 | 优化器的类型。 必须是“zn”、“adam”或“adamw”。 | 字符串 |
随机种子 | 使用确定性训练时要使用的随机种子。 | 字符串 |
stepLR伽玛 | 当学习速率计划程序为“step”时,gamma 的值。 必须是 [0, 1] 范围内的浮点。 | 字符串 |
stepLRStepSize | 学习速率计划程序为“step”时步骤大小的值。 必须是正整数。 | 字符串 |
trainingBatchSize | 训练批大小。 必须是正整数。 | 字符串 |
trainingCropSize | 训练数据集的神经网络输入的图像裁剪大小。 必须是正整数。 | 字符串 |
validationBatchSize | 验证批大小。 必须是正整数。 | 字符串 |
validationCropSize | 输入到神经网络的验证数据集的图像裁剪大小。 必须是正整数。 | 字符串 |
validationResizeSize | 在裁剪验证数据集之前要调整其大小的图像大小。 必须是正整数。 | 字符串 |
warmupCosineLRCycles | 学习速率计划程序为“warmup_cosine”时的余弦周期值。 必须是 [0, 1] 范围内的浮点。 | 字符串 |
warmupCosineLRWarmupEpochs | 当学习速率计划程序为“warmup_cosine”时,预热时期的值。 必须是正整数。 | 字符串 |
weightDecay (权重衰减) | 优化器为“zn”、“adam”或“adamw”时的权重衰减值。 必须是范围[0, 1] 中的浮点。 | 字符串 |
weightedLoss | 减肥。 对于无加权损失,接受的值为 0。 1 用于与 sqrt 一起减肥。(class_weights)。 2 用于减肥与class_weights。 必须为 0 或 1 或 2。 |
字符串 |
ImageModelDistributionSettingsObjectDetection
名称 | DESCRIPTION | 价值 |
---|---|---|
amsGradient | 优化器为“adam”或“adamw”时启用 AMSGrad。 | 字符串 |
扩充 | 使用扩充的设置。 | 字符串 |
贝塔1 | 优化器为“adam”或“adamw”时“beta1”的值。 必须是 [0, 1] 范围内的浮点。 | 字符串 |
贝塔2 | 优化器为“adam”或“adamw”时“beta2”的值。 必须是 [0, 1] 范围内的浮点。 | 字符串 |
boxDetectionsPerImage (每图像检测) | 每个图像的最大检测数,适用于所有类。 必须是正整数。 注意:“yolov5”算法不支持此设置。 |
字符串 |
boxScoreThreshold (盒分数阈值) | 在推理期间,仅返回分类分数大于 BoxScoreThreshold。 必须是范围[0, 1] 中的浮点。 |
字符串 |
分散式 | 是否使用分布式程序训练。 | 字符串 |
earlyStopping (早期停止) | 在训练期间启用提前停止逻辑。 | 字符串 |
earlyStoppingDelay | 在主要指标改进之前等待的最小纪元数或验证评估数 跟踪早期停止。 必须是正整数。 |
字符串 |
早点停止耐心 | 之前没有主要指标改进的最小纪元或验证评估数 运行已停止。 必须是正整数。 |
字符串 |
enableOnnxNormalization | 导出 ONNX 模型时启用规范化。 | 字符串 |
evaluationFrequency | 评估验证数据集以获取指标分数的频率。 必须是正整数。 | 字符串 |
梯度累积步骤 | 渐变累积意味着在不运行配置数量的“GradAccumulationStep”步骤的情况下 更新模型权重,同时累积这些步骤的渐变,然后使用 用于计算权重更新的累积渐变。 必须是正整数。 |
字符串 |
图像大小 | 用于训练和验证的图像大小。 必须是正整数。 注意:如果大小太大,训练运行可能会进入 CUDA OOM。 注意:仅“yolov5”算法支持此设置。 |
字符串 |
layersToFreeze (图层冻结) | 要冻结模型的层数。 必须是正整数。 例如,将 2 作为“seresnext”的值传递意味着 冻结 layer0 和 layer1。 有关支持的模型的完整列表以及有关层冻结的详细信息,请 请参阅:/azure/machine-learning/how-to-auto-train-image-models。 |
字符串 |
learningRate | 初始学习速率。 必须是 [0, 1] 范围内的浮点。 | 字符串 |
learningRateScheduler 的 | 学习速率计划程序的类型。 必须是“warmup_cosine”或“step”。 | 字符串 |
最大大小 | 将图像馈送至主干之前要重新缩放的最大大小。 必须是正整数。 注意:如果大小太大,训练运行可能会进入 CUDA OOM。 注意:“yolov5”算法不支持此设置。 |
字符串 |
最小大小 | 将图像馈送到主干之前要重新缩放的最小大小。 必须是正整数。 注意:如果大小太大,训练运行可能会进入 CUDA OOM。 注意:“yolov5”算法不支持此设置。 |
字符串 |
模型名称 | 要用于训练的模型的名称。 有关可用模型的详细信息,请访问官方文档: /azure/machine-learning/how-to-auto-train-image-models。 |
字符串 |
modelSize | 模型大小。 必须是“small”、“medium”、“large”或“xlarge”。 注意:如果模型大小太大,训练运行可能会进入 CUDA OOM。 注意:仅“yolov5”算法支持此设置。 |
字符串 |
动量 | 优化器为“zn”时的动量值。 必须是 [0, 1] 范围内的浮点。 | 字符串 |
多尺度 | 按 +/- 50%的不同图像大小启用多缩放图像。 注意:如果没有足够的 GPU 内存,训练运行可能会进入 CUDA OOM。 注意:仅“yolov5”算法支持此设置。 |
字符串 |
涅斯特罗夫 | 优化器为“zn”时启用 nesterov。 | 字符串 |
nmsIouThreshold | 在 NMS 后期处理的推理期间使用的 IOU 阈值。 必须在 [0, 1] 范围内浮动。 | 字符串 |
纪元数 | 训练纪元数。 必须是正整数。 | 字符串 |
工人数 | 数据加载程序辅助角色数。 必须是非负整数。 | 字符串 |
优化器 | 优化器的类型。 必须是“zn”、“adam”或“adamw”。 | 字符串 |
随机种子 | 使用确定性训练时要使用的随机种子。 | 字符串 |
stepLR伽玛 | 当学习速率计划程序为“step”时,gamma 的值。 必须是 [0, 1] 范围内的浮点。 | 字符串 |
stepLRStepSize | 学习速率计划程序为“step”时步骤大小的值。 必须是正整数。 | 字符串 |
tileGridSize (平铺网格大小) | 用于平铺每个图像的网格大小。 注意:TileGridSize 不得为 无可启用小型对象检测逻辑。 一个字符串,其中包含两个整数(采用格式)。 注意:“yolov5”算法不支持此设置。 |
字符串 |
tileOverlapRatio (平铺重叠比率) | 每个维度中相邻磁贴之间的重叠比率。 必须在 [0, 1] 范围内浮动。 注意:“yolov5”算法不支持此设置。 |
字符串 |
tilePredictionsNmsThreshold | 用于执行 NMS 的 IOU 阈值,同时合并来自磁贴和图像的预测。 用于验证/推理。 必须在 [0, 1] 范围内浮动。 注意:“yolov5”算法不支持此设置。 NMS:非最大抑制 |
字符串 |
trainingBatchSize | 训练批大小。 必须是正整数。 | 字符串 |
validationBatchSize | 验证批大小。 必须是正整数。 | 字符串 |
validationIouThreshold | 计算验证指标时要使用的 IOU 阈值。 必须在 [0, 1] 范围内浮动。 | 字符串 |
validationMetricType | 用于验证指标的指标计算方法。 必须是“none”、“coco”、“voc”或“coco_voc”。 | 字符串 |
warmupCosineLRCycles | 学习速率计划程序为“warmup_cosine”时的余弦周期值。 必须是 [0, 1] 范围内的浮点。 | 字符串 |
warmupCosineLRWarmupEpochs | 当学习速率计划程序为“warmup_cosine”时,预热时期的值。 必须是正整数。 | 字符串 |
weightDecay (权重衰减) | 优化器为“zn”、“adam”或“adamw”时的权重衰减值。 必须是范围[0, 1] 中的浮点。 | 字符串 |
ImageModelSettings分类
名称 | DESCRIPTION | 价值 |
---|---|---|
高级设置 | 高级方案的设置。 | 字符串 |
amsGradient | 优化器为“adam”或“adamw”时启用 AMSGrad。 | 布尔 |
扩充 | 使用扩充的设置。 | 字符串 |
贝塔1 | 优化器为“adam”或“adamw”时“beta1”的值。 必须是 [0, 1] 范围内的浮点。 | 整数 (int) |
贝塔2 | 优化器为“adam”或“adamw”时“beta2”的值。 必须是 [0, 1] 范围内的浮点。 | 整数 (int) |
检查点频率 | 存储模型检查点的频率。 必须是正整数。 | 整数 (int) |
checkpoint模型 | 用于增量训练的预先训练检查点模型。 | MLFlowModelJobInput |
检查点RunId | 上一次运行的 ID,该运行具有用于增量训练的预先训练检查点。 | 字符串 |
分散式 | 是否使用分布式训练。 | 布尔 |
earlyStopping (早期停止) | 在训练期间启用提前停止逻辑。 | 布尔 |
earlyStoppingDelay | 在主要指标改进之前等待的最小纪元数或验证评估数 跟踪早期停止。 必须是正整数。 |
整数 (int) |
早点停止耐心 | 之前没有主要指标改进的最小纪元或验证评估数 运行已停止。 必须是正整数。 |
整数 (int) |
enableOnnxNormalization | 导出 ONNX 模型时启用规范化。 | 布尔 |
evaluationFrequency | 评估验证数据集以获取指标分数的频率。 必须是正整数。 | 整数 (int) |
梯度累积步骤 | 渐变累积意味着在不运行配置数量的“GradAccumulationStep”步骤的情况下 更新模型权重,同时累积这些步骤的渐变,然后使用 用于计算权重更新的累积渐变。 必须是正整数。 |
整数 (int) |
layersToFreeze (图层冻结) | 要冻结模型的层数。 必须是正整数。 例如,将 2 作为“seresnext”的值传递意味着 冻结 layer0 和 layer1。 有关支持的模型的完整列表以及有关层冻结的详细信息,请 请参阅:/azure/machine-learning/how-to-auto-train-image-models。 |
整数 (int) |
learningRate | 初始学习速率。 必须是 [0, 1] 范围内的浮点。 | 整数 (int) |
learningRateScheduler 的 | 学习速率计划程序的类型。 必须是“warmup_cosine”或“step”。 | “None” “Step” “WarmupCosine” |
模型名称 | 要用于训练的模型的名称。 有关可用模型的详细信息,请访问官方文档: /azure/machine-learning/how-to-auto-train-image-models。 |
字符串 |
动量 | 优化器为“zn”时的动量值。 必须是 [0, 1] 范围内的浮点。 | 整数 (int) |
涅斯特罗夫 | 优化器为“zn”时启用 nesterov。 | 布尔 |
纪元数 | 训练纪元数。 必须是正整数。 | 整数 (int) |
工人数 | 数据加载程序辅助角色数。 必须是非负整数。 | 整数 (int) |
优化器 | 优化器的类型。 | “Adam” “Adamw” “None” “Zn” |
随机种子 | 使用确定性训练时要使用的随机种子。 | 整数 (int) |
stepLR伽玛 | 当学习速率计划程序为“step”时,gamma 的值。 必须是 [0, 1] 范围内的浮点。 | 整数 (int) |
stepLRStepSize | 学习速率计划程序为“step”时步骤大小的值。 必须是正整数。 | 整数 (int) |
trainingBatchSize | 训练批大小。 必须是正整数。 | 整数 (int) |
trainingCropSize | 训练数据集的神经网络输入的图像裁剪大小。 必须是正整数。 | 整数 (int) |
validationBatchSize | 验证批大小。 必须是正整数。 | 整数 (int) |
validationCropSize | 输入到神经网络的验证数据集的图像裁剪大小。 必须是正整数。 | 整数 (int) |
validationResizeSize | 在裁剪验证数据集之前要调整其大小的图像大小。 必须是正整数。 | 整数 (int) |
warmupCosineLRCycles | 学习速率计划程序为“warmup_cosine”时的余弦周期值。 必须是 [0, 1] 范围内的浮点。 | 整数 (int) |
warmupCosineLRWarmupEpochs | 当学习速率计划程序为“warmup_cosine”时,预热时期的值。 必须是正整数。 | 整数 (int) |
weightDecay (权重衰减) | 优化器为“zn”、“adam”或“adamw”时的权重衰减值。 必须是范围[0, 1] 中的浮点。 | 整数 (int) |
weightedLoss | 减肥。 对于无加权损失,接受的值为 0。 1 用于与 sqrt 一起减肥。(class_weights)。 2 用于减肥与class_weights。 必须为 0 或 1 或 2。 |
整数 (int) |
ImageModelSettingsObjectDetection
名称 | DESCRIPTION | 价值 |
---|---|---|
高级设置 | 高级方案的设置。 | 字符串 |
amsGradient | 优化器为“adam”或“adamw”时启用 AMSGrad。 | 布尔 |
扩充 | 使用扩充的设置。 | 字符串 |
贝塔1 | 优化器为“adam”或“adamw”时“beta1”的值。 必须是 [0, 1] 范围内的浮点。 | 整数 (int) |
贝塔2 | 优化器为“adam”或“adamw”时“beta2”的值。 必须是 [0, 1] 范围内的浮点。 | 整数 (int) |
boxDetectionsPerImage (每图像检测) | 每个图像的最大检测数,适用于所有类。 必须是正整数。 注意:“yolov5”算法不支持此设置。 |
整数 (int) |
boxScoreThreshold (盒分数阈值) | 在推理期间,仅返回分类分数大于 BoxScoreThreshold。 必须是范围[0, 1] 中的浮点。 |
整数 (int) |
检查点频率 | 存储模型检查点的频率。 必须是正整数。 | 整数 (int) |
checkpoint模型 | 用于增量训练的预先训练检查点模型。 | MLFlowModelJobInput |
检查点RunId | 上一次运行的 ID,该运行具有用于增量训练的预先训练检查点。 | 字符串 |
分散式 | 是否使用分布式训练。 | 布尔 |
earlyStopping (早期停止) | 在训练期间启用提前停止逻辑。 | 布尔 |
earlyStoppingDelay | 在主要指标改进之前等待的最小纪元数或验证评估数 跟踪早期停止。 必须是正整数。 |
整数 (int) |
早点停止耐心 | 之前没有主要指标改进的最小纪元或验证评估数 运行已停止。 必须是正整数。 |
整数 (int) |
enableOnnxNormalization | 导出 ONNX 模型时启用规范化。 | 布尔 |
evaluationFrequency | 评估验证数据集以获取指标分数的频率。 必须是正整数。 | 整数 (int) |
梯度累积步骤 | 渐变累积意味着在不运行配置数量的“GradAccumulationStep”步骤的情况下 更新模型权重,同时累积这些步骤的渐变,然后使用 用于计算权重更新的累积渐变。 必须是正整数。 |
整数 (int) |
图像大小 | 用于训练和验证的图像大小。 必须是正整数。 注意:如果大小太大,训练运行可能会进入 CUDA OOM。 注意:仅“yolov5”算法支持此设置。 |
整数 (int) |
layersToFreeze (图层冻结) | 要冻结模型的层数。 必须是正整数。 例如,将 2 作为“seresnext”的值传递意味着 冻结 layer0 和 layer1。 有关支持的模型的完整列表以及有关层冻结的详细信息,请 请参阅:/azure/machine-learning/how-to-auto-train-image-models。 |
整数 (int) |
learningRate | 初始学习速率。 必须是 [0, 1] 范围内的浮点。 | 整数 (int) |
learningRateScheduler 的 | 学习速率计划程序的类型。 必须是“warmup_cosine”或“step”。 | “None” “Step” “WarmupCosine” |
最大大小 | 将图像馈送至主干之前要重新缩放的最大大小。 必须是正整数。 注意:如果大小太大,训练运行可能会进入 CUDA OOM。 注意:“yolov5”算法不支持此设置。 |
整数 (int) |
最小大小 | 将图像馈送到主干之前要重新缩放的最小大小。 必须是正整数。 注意:如果大小太大,训练运行可能会进入 CUDA OOM。 注意:“yolov5”算法不支持此设置。 |
整数 (int) |
模型名称 | 要用于训练的模型的名称。 有关可用模型的详细信息,请访问官方文档: /azure/machine-learning/how-to-auto-train-image-models。 |
字符串 |
modelSize | 模型大小。 必须是“small”、“medium”、“large”或“xlarge”。 注意:如果模型大小太大,训练运行可能会进入 CUDA OOM。 注意:仅“yolov5”算法支持此设置。 |
“ExtraLarge” “Large” “Medium” “None” “Small” |
动量 | 优化器为“zn”时的动量值。 必须是 [0, 1] 范围内的浮点。 | 整数 (int) |
多尺度 | 按 +/- 50%的不同图像大小启用多缩放图像。 注意:如果没有足够的 GPU 内存,训练运行可能会进入 CUDA OOM。 注意:仅“yolov5”算法支持此设置。 |
布尔 |
涅斯特罗夫 | 优化器为“zn”时启用 nesterov。 | 布尔 |
nmsIouThreshold | 在 NMS 后期处理的推理期间使用的 IOU 阈值。 必须是 [0, 1] 范围内的浮点。 | 整数 (int) |
纪元数 | 训练纪元数。 必须是正整数。 | 整数 (int) |
工人数 | 数据加载程序辅助角色数。 必须是非负整数。 | 整数 (int) |
优化器 | 优化器的类型。 | “Adam” “Adamw” “None” “Zn” |
随机种子 | 使用确定性训练时要使用的随机种子。 | 整数 (int) |
stepLR伽玛 | 当学习速率计划程序为“step”时,gamma 的值。 必须是 [0, 1] 范围内的浮点。 | 整数 (int) |
stepLRStepSize | 学习速率计划程序为“step”时步骤大小的值。 必须是正整数。 | 整数 (int) |
tileGridSize (平铺网格大小) | 用于平铺每个图像的网格大小。 注意:TileGridSize 不得为 无可启用小型对象检测逻辑。 一个字符串,其中包含两个整数(采用格式)。 注意:“yolov5”算法不支持此设置。 |
字符串 |
tileOverlapRatio (平铺重叠比率) | 每个维度中相邻磁贴之间的重叠比率。 必须在 [0, 1] 范围内浮动。 注意:“yolov5”算法不支持此设置。 |
整数 (int) |
tilePredictionsNmsThreshold | 用于执行 NMS 的 IOU 阈值,同时合并来自磁贴和图像的预测。 用于验证/推理。 必须在 [0, 1] 范围内浮动。 注意:“yolov5”算法不支持此设置。 |
整数 (int) |
trainingBatchSize | 训练批大小。 必须是正整数。 | 整数 (int) |
validationBatchSize | 验证批大小。 必须是正整数。 | 整数 (int) |
validationIouThreshold | 计算验证指标时要使用的 IOU 阈值。 必须在 [0, 1] 范围内浮动。 | 整数 (int) |
validationMetricType | 用于验证指标的指标计算方法。 | “Coco” “CocoVoc” “None” “Voc” |
warmupCosineLRCycles | 学习速率计划程序为“warmup_cosine”时的余弦周期值。 必须是 [0, 1] 范围内的浮点。 | 整数 (int) |
warmupCosineLRWarmupEpochs | 当学习速率计划程序为“warmup_cosine”时,预热时期的值。 必须是正整数。 | 整数 (int) |
weightDecay (权重衰减) | 优化器为“zn”、“adam”或“adamw”时的权重衰减值。 必须是范围[0, 1] 中的浮点。 | 整数 (int) |
ImageObjectDetection
名称 | DESCRIPTION | 价值 |
---|---|---|
limitSettings | [必需]限制 AutoML 作业的设置。 | ImageLimitSettings (必需) |
modelSettings | 用于训练模型的设置。 | ImageModelSettingsObjectDetection |
primaryMetric | 要针对此任务进行优化的主要指标。 | “MeanAveragePrecision” |
搜索空间 | 用于采样模型及其超参数的不同组合的搜索空间。 | ImageModelDistributionSettingsObjectDetection[] |
扫描设置 | 模型扫描和超参数扫描相关设置。 | ImageSweepSettings (图像扫描设置) |
任务类型 | [必需]AutoMLJob 的任务类型。 | “ImageObjectDetection”(必需) |
validationData (验证数据) | 验证数据输入。 | MLTableJobInput |
validationDataSize | 需要留出用于验证的定型数据集的分数。 介于 (0.0、 1.0) 之间的值 未提供验证数据集时应用。 |
整数 (int) |
ImageSweepSettings (图像扫描设置)
名称 | DESCRIPTION | 价值 |
---|---|---|
early终止 | 提前终止策略的类型。 | 提前终止政策 |
sampling算法 | [必需]超参数采样算法的类型。 | “贝贝西亚语” “Grid” “Random”(必需) |
JobBaseProperties
名称 | DESCRIPTION | 价值 |
---|---|---|
组件 ID | 组件资源的 ARM 资源 ID。 | 字符串 |
计算 ID | 计算资源的 ARM 资源 ID。 | 字符串 |
描述 | 资产说明文本。 | 字符串 |
displayName (显示名称) | 作业的显示名称。 | 字符串 |
实验名称 | 作业所属的试验的名称。 如果未设置,作业将放置在“默认”试验中。 | 字符串 |
标识 | 标识配置。 如果已设置,则应为 AmlToken、ManagedIdentity、UserIdentity 或 null 之一。 如果为 null,则默认为 AmlToken。 |
身份配置 |
isArchived 已存档 | 资产是否已存档? | 布尔 |
职位类型 | 设置为 AutoMLJob 类型的“AutoML”。 设置为 CommandJob 类型的“Command”。 设置为 “LabelingJobProperties”类型的“标记”。 设置为 PipelineJob 类型的“Pipeline”。 设置为“ SparkJob”类型的“Spark”。 设置为“ SweepJob”类型。 | “AutoML” “Command” “标记” “Pipeline” “Spark” “扫描”(必需) |
属性 | 资产属性字典。 | ResourceBaseProperties |
服务 | JobEndpoints 列表。 对于本地作业,作业终结点的终结点值为 FileStreamObject。 |
JobBase服务 |
标签 | 标记字典。 可以添加、删除和更新标记。 | ResourceBaseTags |
JobBase服务
名称 | DESCRIPTION | 价值 |
---|
作业输入
名称 | DESCRIPTION | 价值 |
---|---|---|
描述 | 输入的说明。 | 字符串 |
jobInputType (作业输入类型) | 设置为 CustomModelJobInput 类型的“custom_model”。 设置为 Type LiteralJobInput 的“literal”。 设置为 MLFlowModelJobInput 类型的“mlflow_model”。 设置为 MLTableJobInput 类型的“mltable”。 设置为 TritonModelJobInput 类型的“triton_model”。 设置为 UriFileJobInput 类型的“uri_file”。 设置为 UriFolderJobInput 类型的“uri_folder”。 | “custom_model” “literal” “mlflow_model” “mltable” “triton_model” “uri_file” “uri_folder”(必需) |
JobOutput (作业输出)
名称 | DESCRIPTION | 价值 |
---|---|---|
描述 | 输出的说明。 | 字符串 |
jobOutputType | 设置为 CustomModelJobOutput 类型的“custom_model”。 设置为 MLFlowModelJobOutput 类型的“mlflow_model”。 设置为 MLTableJobOutput 类型的“mltable”。 设置为 TritonModelJobOutput 类型的“triton_model”。 设置为 UriFileJobOutput 类型的“uri_file”。 设置为 UriFolderJobOutput 类型的“uri_folder”。 | “custom_model” “mlflow_model” “mltable” “triton_model” “uri_file” “uri_folder”(必需) |
JobResourceConfiguration
名称 | DESCRIPTION | 价值 |
---|---|---|
dockerArgs | 要传递给 Docker run 命令的额外参数。 这将替代系统设置的任何参数,或在本部分中。 此参数仅支持 Azure ML 计算类型。 | 字符串 |
instanceCount | 计算目标使用的实例或节点数可选。 | 整数 (int) |
instanceType | 计算目标支持的可选 VM 类型。 | 字符串 |
属性 | 其他属性包。 | ResourceConfigurationProperties |
shmSize | docker 容器的共享内存块的大小。 这应采用 (number)(unit) 格式,其中数字大于 0,单位可以是 b(字节)、k(千字节)、m(兆字节)或 g(GB)。 | 字符串 约束: 图案 = \d+[bBkKmMgG] |
工作服务
名称 | DESCRIPTION | 价值 |
---|---|---|
终结点 | 终结点的 URL。 | 字符串 |
jobServiceType | 终结点类型。 | 字符串 |
节点 | 用户希望启动服务的节点。 如果未将 Nodes 设置为 null,则服务将仅在领导节点上启动。 |
节点 |
移植 | 用户设置的终结点的端口。 | 整数 (int) |
属性 | 在终结点上设置的其他属性。 | JobServiceProperties |
JobServiceProperties
名称 | DESCRIPTION | 价值 |
---|
标签类别
名称 | DESCRIPTION | 价值 |
---|---|---|
类 | 此类别中标签类的字典。 | 标签类别类 |
displayName (显示名称) | 标签类别的显示名称。 | 字符串 |
multiSelectEnabled 已启用 | 指示是否允许在此类别中选择多个类。 | 布尔 |
标签类别类
名称 | DESCRIPTION | 价值 |
---|
标签类
名称 | DESCRIPTION | 价值 |
---|---|---|
displayName (显示名称) | 标签类的显示名称。 | 字符串 |
子 | 标签类的子类的字典。 | LabelClass子类 |
LabelClass子类
名称 | DESCRIPTION | 价值 |
---|
LabelingDataConfiguration
名称 | DESCRIPTION | 价值 |
---|---|---|
数据 ID | 要执行标记的数据资产的资源 ID。 | 字符串 |
incrementalDataRefreshEnabled | 指示是否启用增量数据刷新。 | 布尔 |
LabelingJobImageProperties
名称 | DESCRIPTION | 价值 |
---|---|---|
annotationType | 图像标记作业的批注类型。 | “BoundingBox” “Classification” “InstanceSegmentation” |
mediaType | [必需]作业的媒体类型。 | “Image”(必需) |
TagJobInstructions
名称 | DESCRIPTION | 价值 |
---|---|---|
URI | 指向页面的链接,其中包含标签器的详细标记说明。 | 字符串 |
LabelingJobLabel类别
名称 | DESCRIPTION | 价值 |
---|
LabelingJobMediaProperties
名称 | DESCRIPTION | 价值 |
---|---|---|
mediaType | 设置为“Image”,类型 为 LabelingJobImageProperties。 对于 LabelingJobTextProperties 类型,设置为“Text”。 | “Image” “Text”(必需) |
LabelingJobProperties
名称 | DESCRIPTION | 价值 |
---|---|---|
dataConfiguration | 配置作业中使用的数据。 | LabelingDataConfiguration |
工作说明 | 标记作业的说明。 | TagJobInstructions |
职位类型 | [必需]指定作业的类型。 | “标记”(必需) |
标签类别 | 作业的标签类别。 | LabelingJobLabel类别 |
labelingJobMediaProperties | 作业中的媒体类型特定属性。 | LabelingJobMediaProperties |
mlAssistConfiguration | 在作业中配置 MLAssist 功能。 | MLAssistConfiguration |
LabelingJobTextProperties
名称 | DESCRIPTION | 价值 |
---|---|---|
annotationType | 文本标记作业的批注类型。 | “Classification” 'NamedEntityRecognition' (命名实体识别) |
mediaType | [必需]作业的媒体类型。 | “Text”(必需) |
LiteralJobInput (文字作业输入)
名称 | DESCRIPTION | 价值 |
---|---|---|
jobInputType (作业输入类型) | [必需]指定作业的类型。 | “literal”(必需) |
价值 | [必需]输入的文本值。 | 字符串 约束: 模式 = [a-zA-Z0-9_] (必需) |
ManagedIdentity (托管身份)
名称 | DESCRIPTION | 价值 |
---|---|---|
客户端 ID | 按客户端 ID 指定用户分配的标识。 对于系统分配,请不要设置此字段。 | 字符串 约束: 最小长度 = 36 最大长度 = 36 图案 = ^[0-9a-fA-F]{8}-([0-9a-fA-F]{4}-){3}[0-9a-fA-F]{12}$ |
身份类型 | [必需]指定标识框架的类型。 | “Managed”(必需) |
对象 ID | 按对象 ID 指定用户分配的标识。 对于系统分配,请不要设置此字段。 | 字符串 约束: 最小长度 = 36 最大长度 = 36 图案 = ^[0-9a-fA-F]{8}-([0-9a-fA-F]{4}-){3}[0-9a-fA-F]{12}$ |
资源ID | 按 ARM 资源 ID 指定用户分配的标识。 对于系统分配,请不要设置此字段。 | 字符串 |
MedianStoppingPolicy (中值停止策略)
名称 | DESCRIPTION | 价值 |
---|---|---|
policyType | [必需]策略配置的名称 | “MedianStopping”(必需) |
MLAssistConfiguration
名称 | DESCRIPTION | 价值 |
---|---|---|
mlAssist | 设置为 MLAssistConfigurationDisabled 类型的“Disabled”。 设置为 MLAssistConfigurationEnabled 类型的“Enabled”。 | “Disabled” “Enabled”(必需) |
MLAssistConfigurationDisabled
名称 | DESCRIPTION | 价值 |
---|---|---|
mlAssist | [必需]指示是否启用 MLAssist 功能。 | “Disabled”(必需) |
MLAssistConfiguration已启用
名称 | DESCRIPTION | 价值 |
---|---|---|
inferencingComputeBinding | [必需]推理中使用的 AML 计算绑定。 | 字符串 约束: 模式 = [a-zA-Z0-9_] (必需) |
mlAssist | [必需]指示是否启用 MLAssist 功能。 | “Enabled”(必需) |
trainingComputeBinding 的 | [必需]训练中使用的 AML 计算绑定。 | 字符串 约束: 模式 = [a-zA-Z0-9_] (必需) |
MLFlowModelJobInput
名称 | DESCRIPTION | 价值 |
---|---|---|
jobInputType (作业输入类型) | [必需]指定作业的类型。 | “mlflow_model”(必需) |
模式 | 输入资产传送模式。 | “Direct” “下载” “EvalDownload” “EvalMount” “ReadOnlyMount” “ReadWriteMount” |
URI | [必需]输入资产 URI。 | 字符串 约束: 模式 = [a-zA-Z0-9_] (必需) |
MLFlowModelJobInput
名称 | DESCRIPTION | 价值 |
---|---|---|
描述 | 输入的说明。 | 字符串 |
jobInputType (作业输入类型) | [必需]指定作业的类型。 | “custom_model” “literal” “mlflow_model” “mltable” “triton_model” “uri_file” “uri_folder”(必需) |
模式 | 输入资产传送模式。 | “Direct” “下载” “EvalDownload” “EvalMount” “ReadOnlyMount” “ReadWriteMount” |
URI | [必需]输入资产 URI。 | 字符串 约束: 模式 = [a-zA-Z0-9_] (必需) |
MLFlowModelJobOutput
名称 | DESCRIPTION | 价值 |
---|---|---|
jobOutputType | [必需]指定作业的类型。 | “mlflow_model”(必需) |
模式 | 输出资产传送模式。 | “Direct” “ReadWriteMount” “Upload” |
URI | 输出资产 URI。 | 字符串 |
MLTableJobInput
名称 | DESCRIPTION | 价值 |
---|---|---|
描述 | 输入的说明。 | 字符串 |
jobInputType (作业输入类型) | [必需]指定作业的类型。 | “custom_model” “literal” “mlflow_model” “mltable” “triton_model” “uri_file” “uri_folder”(必需) |
模式 | 输入资产传送模式。 | “Direct” “下载” “EvalDownload” “EvalMount” “ReadOnlyMount” “ReadWriteMount” |
URI | [必需]输入资产 URI。 | 字符串 约束: 模式 = [a-zA-Z0-9_] (必需) |
MLTableJobInput
名称 | DESCRIPTION | 价值 |
---|---|---|
jobInputType (作业输入类型) | [必需]指定作业的类型。 | “mltable”(必需) |
模式 | 输入资产传送模式。 | “Direct” “下载” “EvalDownload” “EvalMount” “ReadOnlyMount” “ReadWriteMount” |
URI | [必需]输入资产 URI。 | 字符串 约束: 模式 = [a-zA-Z0-9_] (必需) |
MLTableJobOutput
名称 | DESCRIPTION | 价值 |
---|---|---|
jobOutputType | [必需]指定作业的类型。 | “mltable”(必需) |
模式 | 输出资产传送模式。 | “Direct” “ReadWriteMount” “Upload” |
URI | 输出资产 URI。 | 字符串 |
MPI
名称 | DESCRIPTION | 价值 |
---|---|---|
distributionType | [必需]指定分发框架的类型。 | “Mpi”(必需) |
processCountPerInstance | 每个 MPI 节点的进程数。 | 整数 (int) |
NCross验证
名称 | DESCRIPTION | 价值 |
---|---|---|
模式 | 对于 AutoNCrossValidations 类型,设置为“自动”。 设置为 CustomNCrossValidations 类型的“Custom”。 | “Auto” “Custom”(必需) |
NlpFixedParameters
名称 | DESCRIPTION | 价值 |
---|---|---|
梯度累积步骤 | 在运行向后传递之前累积渐变的步骤数。 | 整数 (int) |
learningRate | 训练过程的学习速率。 | 整数 (int) |
learningRateScheduler 的 | 训练过程中要使用的学习速率计划的类型。 | “Constant” “ConstantWithWarmup” “余弦” “CosineWithRestarts” “Linear” “None” “多项式” |
模型名称 | 要训练的模型的名称。 | 字符串 |
纪元数 | 训练纪元数。 | 整数 (int) |
trainingBatchSize | 训练过程的批大小。 | 整数 (int) |
validationBatchSize | 要在评估期间使用的批大小。 | 整数 (int) |
warmupRatio | 与 LrSchedulerType 一起使用的预热比率。 | 整数 (int) |
weightDecay (权重衰减) | 训练过程的重量衰减。 | 整数 (int) |
NlpParameterSubspace
名称 | DESCRIPTION | 价值 |
---|---|---|
梯度累积步骤 | 在运行向后传递之前累积渐变的步骤数。 | 字符串 |
learningRate | 训练过程的学习速率。 | 字符串 |
learningRateScheduler 的 | 训练过程中要使用的学习速率计划的类型。 | 字符串 |
模型名称 | 要训练的模型的名称。 | 字符串 |
纪元数 | 训练纪元数。 | 字符串 |
trainingBatchSize | 训练过程的批大小。 | 字符串 |
validationBatchSize | 要在评估期间使用的批大小。 | 字符串 |
warmupRatio | 与 LrSchedulerType 一起使用的预热比率。 | 字符串 |
weightDecay (权重衰减) | 训练过程的重量衰减。 | 字符串 |
NlpSweepSettings
名称 | DESCRIPTION | 价值 |
---|---|---|
early终止 | 扫描作业的提前终止策略的类型。 | 提前终止政策 |
sampling算法 | [必需]采样算法的类型。 | “贝贝西亚语” “Grid” “Random”(必需) |
NlpVerticalFeaturizationSettings
名称 | DESCRIPTION | 价值 |
---|---|---|
datasetLanguage | 数据集语言,适用于文本数据。 | 字符串 |
NlpVerticalLimitSettings
名称 | DESCRIPTION | 价值 |
---|---|---|
maxConcurrentTrials | 最大并发 AutoML 迭代次数。 | 整数 (int) |
最大节点数 | 用于在任何单个试用版中训练的最大节点数。 控制多节点分布式训练。 | 整数 (int) |
maxTrials | AutoML 迭代数。 | 整数 (int) |
超时 | AutoML 作业超时。 | 字符串 |
trialTimeout (试用超时) | 单个 HD 试用版的超时。 | 字符串 |
节点
名称 | DESCRIPTION | 价值 |
---|---|---|
nodesValueType | 对于 AllNodes 类型,设置为“All”。 | “全部”(必需) |
目的
名称 | DESCRIPTION | 价值 |
---|---|---|
目标 | [必需]定义超参数优化支持的指标目标 | “最大化” “最小化”(必需) |
primaryMetric | [必需]要优化的指标的名称。 | 字符串 约束: 模式 = [a-zA-Z0-9_] (必需) |
管道作业
名称 | DESCRIPTION | 价值 |
---|---|---|
输入 | 管道作业的输入。 | 管道作业输入 |
工作 | 作业构造管道作业。 | PipelineJobJob 作业 |
职位类型 | [必需]指定作业的类型。 | “Pipeline”(必需) |
输出 | 管道作业的输出 | PipelineJobOutputs |
设置 | 管道设置,例如 ContinueRunOnStepFailure 等。 | 任何 |
源作业 ID | 源作业的 ARM 资源 ID。 | 字符串 |
管道作业输入
名称 | DESCRIPTION | 价值 |
---|
PipelineJobJob 作业
名称 | DESCRIPTION | 价值 |
---|
PipelineJobOutputs
名称 | DESCRIPTION | 价值 |
---|
PyTorch
名称 | DESCRIPTION | 价值 |
---|---|---|
distributionType | [必需]指定分发框架的类型。 | “PyTorch”(必需) |
processCountPerInstance | 每个节点的进程数。 | 整数 (int) |
RandomSamplingAlgorithm 算法
名称 | DESCRIPTION | 价值 |
---|---|---|
规则 | 随机算法的特定类型 | “Random” “Sobol” |
采样算法类型 | [必需]用于生成超参数值的算法以及配置属性 | “Random”(必需) |
种子 | 用作随机数生成的种子的可选整数 | 整数 (int) |
回归
名称 | DESCRIPTION | 价值 |
---|---|---|
cvSplitColumnNames | 用于 CVSplit 数据的列。 | 字符串[] |
featurizationSettings | AutoML 作业所需的特征化输入。 | TableVerticalFeaturizationSettings |
固定参数 | 在整个训练过程中将保持不变的模型/训练参数。 | TableFixedParameters (表固定参数) |
limitSettings | AutoMLJob 的执行约束。 | TableVerticalLimitSettings |
nCrossValidations | 要应用于训练数据集的交叉验证折叠数 如果未提供验证数据集,则为 。 |
NCross验证 |
primaryMetric | 回归任务的主要指标。 | “NormalizedMeanAbsoluteError” “NormalizedRootMeanSquaredError” “R2Score” 'SpearmanCorrelation' |
搜索空间 | 用于采样模型及其超参数的不同组合的搜索空间。 | TableParameterSubspace[] |
扫描设置 | 模型扫描和超参数优化的设置。 | TableSweepSettings (表格扫描设置) |
任务类型 | [必需]AutoMLJob 的任务类型。 | “回归”(必需) |
测试数据 | 测试数据输入。 | MLTableJobInput |
testDataSize | 需要为验证目的预留的测试数据集的分数。 介于 (0.0、 1.0) 之间的值 未提供验证数据集时应用。 |
整数 (int) |
trainingSettings | AutoML 作业训练阶段的输入。 | 回归训练设置 |
validationData (验证数据) | 验证数据输入。 | MLTableJobInput |
validationDataSize | 需要留出用于验证的定型数据集的分数。 介于 (0.0、 1.0) 之间的值 未提供验证数据集时应用。 |
整数 (int) |
权重列名称 | 示例权重列的名称。 自动化 ML 支持加权列作为输入,导致数据中的行向上或向下加权。 | 字符串 |
回归训练设置
名称 | DESCRIPTION | 价值 |
---|---|---|
allowedTrainingAlgorithms | 回归任务的允许模型。 | 包含任一项的字符串数组: “DecisionTree” “ElasticNet” “ExtremeRandomTrees” “GradientBoosting” “KNN” “LassoLars” “LightGBM” “RandomForest” “ZN” “XGBoostRegressor” |
blockedTrainingAlgorithms | 回归任务的阻止模型。 | 包含任一项的字符串数组: “DecisionTree” “ElasticNet” “ExtremeRandomTrees” “GradientBoosting” “KNN” “LassoLars” “LightGBM” “RandomForest” “ZN” “XGBoostRegressor” |
enableDnnTraining | 启用 DNN 模型的建议。 | 布尔 |
enableModelExplainability | 标志以在最佳模型上启用可解释性。 | 布尔 |
enableOnnxCompatibleModels | 用于启用 onnx 兼容模型的标志。 | 布尔 |
enableStackEnsemble | 启用堆栈合奏运行。 | 布尔 |
enableVoteEnsemble | 启用投票合奏运行。 | 布尔 |
ensembleModelDownloadTimeout | 在 VotingEnsemble 和 StackEnsemble 模型生成期间,将下载先前子运行中的多个拟合模型。 如果需要更多时间,请将此参数配置为大于 300 秒的值。 |
字符串 |
stackEnsembleSettings | 堆栈合奏的堆栈合奏设置。 | StackEnsembleSettings |
ResourceBaseProperties
名称 | DESCRIPTION | 价值 |
---|
ResourceBaseTags
名称 | DESCRIPTION | 价值 |
---|
ResourceConfigurationProperties
名称 | DESCRIPTION | 价值 |
---|
采样算法
名称 | DESCRIPTION | 价值 |
---|---|---|
采样算法类型 | 设置为 “Bayesian”类型的 BayesianSamplingAlgorithm。 设置为 GridSamplingAlgorithm 类型的“Grid”。 设置为 RandomSamplingAlgorithm 类型的“Random”。 | “贝贝西亚语” “Grid” “Random”(必需) |
季节性
名称 | DESCRIPTION | 价值 |
---|---|---|
模式 | 设置为“ AutoSeasonality”类型为“自动”。 设置为“ CustomSeasonality”类型。 | “Auto” “Custom”(必需) |
SparkJob
名称 | DESCRIPTION | 价值 |
---|---|---|
档案 | 存档作业中使用的文件。 | 字符串[] |
参数 | 作业的参数。 | 字符串 |
代码 Id | [必需]代码资产的 ARM 资源 ID。 | 字符串 约束: 模式 = [a-zA-Z0-9_] (必需) |
会议 | Spark 配置的属性。 | SparkJobConf 函数 |
输入 | [必需]在启动作业时要执行的条目。 | SparkJobEntry (必需) |
环境 ID | 作业的环境规范的 ARM 资源 ID。 | 字符串 |
文件 | 作业中使用的文件。 | 字符串[] |
输入 | 作业中使用的输入数据绑定的映射。 | SparkJobInputs |
罐子 | 作业中使用的 Jar 文件。 | 字符串[] |
职位类型 | [必需]指定作业的类型。 | “Spark”(必需) |
输出 | 作业中使用的输出数据绑定的映射。 | SparkJob输出 |
py文件 | 作业中使用的 Python 文件。 | 字符串[] |
资源 | 作业的计算资源配置。 | SparkResourceConfiguration |
SparkJobConf 函数
名称 | DESCRIPTION | 价值 |
---|
SparkJobEntry
名称 | DESCRIPTION | 价值 |
---|---|---|
sparkJobEntryType | 设置为 SparkJobPythonEntry 类型的“SparkJobPythonEntry”。 设置为“ SparkJobScalaEntry”类型的“SparkJobScalaEntry”。 | “SparkJobPythonEntry” “SparkJobScalaEntry”(必需) |
SparkJobInputs
名称 | DESCRIPTION | 价值 |
---|
SparkJob输出
名称 | DESCRIPTION | 价值 |
---|
SparkJobPython条目
名称 | DESCRIPTION | 价值 |
---|---|---|
文件 | [必需]作业入口点的相对 python 文件路径。 | 字符串 约束: 最小长度 = 1 模式 = [a-zA-Z0-9_] (必需) |
sparkJobEntryType | [必需]作业入口点的类型。 | “SparkJobPythonEntry”(必需) |
SparkJobScalaEntry
名称 | DESCRIPTION | 价值 |
---|---|---|
类名 | [必需]用作入口点的 Scala 类名称。 | 字符串 约束: 最小长度 = 1 模式 = [a-zA-Z0-9_] (必需) |
sparkJobEntryType | [必需]作业入口点的类型。 | “SparkJobScalaEntry”(必需) |
SparkResourceConfiguration
名称 | DESCRIPTION | 价值 |
---|---|---|
instanceType | 计算目标支持的可选 VM 类型。 | 字符串 |
runtimeVersion (运行时版本) | 用于作业的 spark 运行时的版本。 | 字符串 |
StackEnsembleSettings
名称 | DESCRIPTION | 价值 |
---|---|---|
stackMetaLearnerKWargs | 要传递给元学习器初始值设定项的可选参数。 | 任何 |
stackMetaLearnerTrainPercentage | 指定要保留用于训练元学习者的训练集(选择训练和训练类型的训练)的比例。 默认值为 0.2。 | 整数 (int) |
stackMetaLearnerType | 元学习器是在单个异类模型的输出上训练的模型。 | “ElasticNet” “ElasticNetCV” “LightGBMClassifier” “LightGBMRegressor” “LinearRegression” “LogisticRegression” “LogisticRegressionCV” “None” |
SweepJob (扫描作业)
名称 | DESCRIPTION | 价值 |
---|---|---|
early终止 | 提前终止策略可在完成之前取消性能不佳的运行 | 提前终止政策 |
输入 | 作业中使用的输入数据绑定的映射。 | SweepJobInputs |
职位类型 | [必需]指定作业的类型。 | “扫描”(必需) |
限制 | 扫描作业限制。 | SweepJobLimits (扫描作业限制) |
目的 | [必需]优化目标。 | 目标 (必需) |
输出 | 作业中使用的输出数据绑定的映射。 | SweepJobOutputs (扫描作业输出) |
sampling算法 | [必需]超参数采样算法 | SamplingAlgorithm (必需) |
搜索空间 | [必需]包含每个参数及其分布的字典。 字典键是参数的名称 | 任何(必需) |
试用 | [必需]试用组件定义。 | TrialComponent (必需) |
SweepJobInputs
名称 | DESCRIPTION | 价值 |
---|
SweepJobLimits (扫描作业限制)
名称 | DESCRIPTION | 价值 |
---|---|---|
jobLimits类型 | [必需]JobLimit 类型。 | “Command” “扫描”(必需) |
maxConcurrentTrials | 扫描作业最大并发试用版。 | 整数 (int) |
maxTotalTrials | 扫描作业最大总试用版数。 | 整数 (int) |
超时 | ISO 8601 格式的最大运行持续时间,之后作业将被取消。 仅支持精度为秒的持续时间。 | 字符串 |
trialTimeout (试用超时) | 扫描作业试用超时值。 | 字符串 |
SweepJobOutputs (扫描作业输出)
名称 | DESCRIPTION | 价值 |
---|
TableFixedParameters (表固定参数)
名称 | DESCRIPTION | 价值 |
---|---|---|
助 推 器 | 指定提升类型,例如 XGBoost 的 gbdt。 | 字符串 |
boosting类型 | 指定提升类型,例如 LightGBM 的 gbdt。 | 字符串 |
增长策略 | 指定增长策略,该策略控制新节点添加到树的方式。 | 字符串 |
learningRate | 训练过程的学习速率。 | 整数 (int) |
最大 Bin | 指定存储桶连续功能的最大离散箱数。 | 整数 (int) |
最大深度 | 指定显式限制树深度的最大深度。 | 整数 (int) |
最大叶数 | 指定显式限制树叶的最大叶数。 | 整数 (int) |
minDataInLeaf 的 | 每个叶的最小数据数。 | 整数 (int) |
minSplitGain 最小分度增益 | 在树的叶节点上进行进一步分区所需的最小损失减少。 | 整数 (int) |
模型名称 | 要训练的模型的名称。 | 字符串 |
nEstimator | 指定模型中的树数(或舍入)。 | 整数 (int) |
叶数 | 指定叶数。 | 整数 (int) |
preprocessorName | 要使用的预处理器的名称。 | 字符串 |
regAlpha | 权重的 L1 正则化术语。 | 整数 (int) |
regLambda | L2 权重的正则化术语。 | 整数 (int) |
子样本 | 训练实例的子采样比率。 | 整数 (int) |
subsampleFreq | 子采样的频率。 | 整数 (int) |
treeMethod | 指定树方法。 | 字符串 |
withMean | 如果为 true,在使用 StandardScalar 缩放数据之前居中。 | 布尔 |
withStd | 如果为 true,请使用 StandardScalar 缩放具有单位方差的数据。 | 布尔 |
TableParameterSubspace
名称 | DESCRIPTION | 价值 |
---|---|---|
助 推 器 | 指定提升类型,例如 XGBoost 的 gbdt。 | 字符串 |
boosting类型 | 指定提升类型,例如 LightGBM 的 gbdt。 | 字符串 |
增长策略 | 指定增长策略,该策略控制新节点添加到树的方式。 | 字符串 |
learningRate | 训练过程的学习速率。 | 字符串 |
最大 Bin | 指定存储桶连续功能的最大离散箱数。 | 字符串 |
最大深度 | 指定显式限制树深度的最大深度。 | 字符串 |
最大叶数 | 指定显式限制树叶的最大叶数。 | 字符串 |
minDataInLeaf 的 | 每个叶的最小数据数。 | 字符串 |
minSplitGain 最小分度增益 | 在树的叶节点上进行进一步分区所需的最小损失减少。 | 字符串 |
模型名称 | 要训练的模型的名称。 | 字符串 |
nEstimator | 指定模型中的树数(或舍入)。 | 字符串 |
叶数 | 指定叶数。 | 字符串 |
preprocessorName | 要使用的预处理器的名称。 | 字符串 |
regAlpha | 权重的 L1 正则化术语。 | 字符串 |
regLambda | L2 权重的正则化术语。 | 字符串 |
子样本 | 训练实例的子采样比率。 | 字符串 |
subsampleFreq | 子采样的频率 | 字符串 |
treeMethod | 指定树方法。 | 字符串 |
withMean | 如果为 true,在使用 StandardScalar 缩放数据之前居中。 | 字符串 |
withStd | 如果为 true,请使用 StandardScalar 缩放具有单位方差的数据。 | 字符串 |
TableSweepSettings (表格扫描设置)
名称 | DESCRIPTION | 价值 |
---|---|---|
early终止 | 扫描作业的提前终止策略的类型。 | 提前终止政策 |
sampling算法 | [必需]采样算法的类型。 | “贝贝西亚语” “Grid” “Random”(必需) |
TableVerticalFeaturizationSettings
名称 | DESCRIPTION | 价值 |
---|---|---|
阻塞变压器 | 这些转换器不应用于特征化。 | 包含任一项的字符串数组: “CatTargetEncoder” “CountVectorizer” “HashOneHotEncoder” “LabelEncoder” “NaiveBayes” “OneHotEncoder” “TextTargetEncoder” “TfIdf” “WoETargetEncoder” “WordEmbedding” |
columnNameAnd类型 | 列名及其类型(int、float、string、datetime 等)的字典。 | TableVerticalFeaturizationSettingsColumnNameAndTypes |
datasetLanguage | 数据集语言,适用于文本数据。 | 字符串 |
enableDnnFeaturization | 确定是否使用基于 Dnn 的特征化器进行数据特征化。 | 布尔 |
模式 | 特征化模式 - 用户可以保留默认的“自动”模式,AutoML 将负责在特征化阶段对数据进行必要的转换。 如果选择了“关闭”,则不会完成特征化。 如果选择“自定义”,则用户可以指定其他输入以自定义特征化完成方式。 |
“Auto” “Custom” “关闭” |
transformer参数 | 用户可以指定要用于的其他转换器以及要向其应用它的列以及转换器构造函数的参数。 | TableVerticalFeaturizationSettingsTransformerParams |
TableVerticalFeaturizationSettingsColumnNameAndTypes
名称 | DESCRIPTION | 价值 |
---|
TableVerticalFeaturizationSettingsTransformerParams
名称 | DESCRIPTION | 价值 |
---|
TableVerticalLimitSettings
名称 | DESCRIPTION | 价值 |
---|---|---|
enableEarlyTermination | 启用提前终止,确定如果最近 20 次迭代中没有分数改进,AutoMLJob 是否会提前终止。 | 布尔 |
退出评分 | AutoML 作业的退出分数。 | 整数 (int) |
maxConcurrentTrials | 最大并发迭代数。 | 整数 (int) |
maxCoresPerTrial | 每次迭代的最大核心数。 | 整数 (int) |
maxTrials | 迭代数。 | 整数 (int) |
sweepConcurrentTrials | 用户想要触发的并发扫描运行数。 | 整数 (int) |
sweepTrials | 用户想要触发的扫描运行数。 | 整数 (int) |
超时 | AutoML 作业超时。 | 字符串 |
trialTimeout (试用超时) | 迭代超时。 | 字符串 |
目标滞后
名称 | DESCRIPTION | 价值 |
---|---|---|
模式 | 对于 AutoTargetLags 类型,设置为“自动”。 设置为 CustomTargetLags 类型的“Custom”。 | “Auto” “Custom”(必需) |
TargetRollingWindowSize
名称 | DESCRIPTION | 价值 |
---|---|---|
模式 | 设置为“ AutoTargetRollingWindowSize”类型的“自动”。 设置为 CustomTargetRollingWindowSize 类型的“Custom”。 | “Auto” “Custom”(必需) |
TensorFlow
名称 | DESCRIPTION | 价值 |
---|---|---|
distributionType | [必需]指定分发框架的类型。 | “TensorFlow”(必需) |
parameterServerCount | 参数服务器任务数。 | 整数 (int) |
workerCount 工人计数 | 工人数。 如果未指定,则默认为实例计数。 | 整数 (int) |
文本分类
名称 | DESCRIPTION | 价值 |
---|---|---|
featurizationSettings | AutoML 作业所需的特征化输入。 | NlpVerticalFeaturizationSettings |
固定参数 | 在整个训练过程中将保持不变的模型/训练参数。 | NlpFixedParameters |
limitSettings | AutoMLJob 的执行约束。 | NlpVerticalLimitSettings |
primaryMetric | Text-Classification 任务的主要指标。 | “准确性” “AUCWeighted” “AveragePrecisionScoreWeighted” “NormMacroRecall” “PrecisionScoreWeighted” |
搜索空间 | 用于采样模型及其超参数的不同组合的搜索空间。 | NlpParameterSubspace[] |
扫描设置 | 模型扫描和超参数优化的设置。 | NlpSweepSettings |
任务类型 | [必需]AutoMLJob 的任务类型。 | “TextClassification”(必需) |
validationData (验证数据) | 验证数据输入。 | MLTableJobInput |
TextClassificationMultilabel
名称 | DESCRIPTION | 价值 |
---|---|---|
featurizationSettings | AutoML 作业所需的特征化输入。 | NlpVerticalFeaturizationSettings |
固定参数 | 在整个训练过程中将保持不变的模型/训练参数。 | NlpFixedParameters |
limitSettings | AutoMLJob 的执行约束。 | NlpVerticalLimitSettings |
搜索空间 | 用于采样模型及其超参数的不同组合的搜索空间。 | NlpParameterSubspace[] |
扫描设置 | 模型扫描和超参数优化的设置。 | NlpSweepSettings |
任务类型 | [必需]AutoMLJob 的任务类型。 | “TextClassificationMultilabel”(必需) |
validationData (验证数据) | 验证数据输入。 | MLTableJobInput |
TextNer (文本生成器)
名称 | DESCRIPTION | 价值 |
---|---|---|
featurizationSettings | AutoML 作业所需的特征化输入。 | NlpVerticalFeaturizationSettings |
固定参数 | 在整个训练过程中将保持不变的模型/训练参数。 | NlpFixedParameters |
limitSettings | AutoMLJob 的执行约束。 | NlpVerticalLimitSettings |
搜索空间 | 用于采样模型及其超参数的不同组合的搜索空间。 | NlpParameterSubspace[] |
扫描设置 | 模型扫描和超参数优化的设置。 | NlpSweepSettings |
任务类型 | [必需]AutoMLJob 的任务类型。 | “TextNER”(必需) |
validationData (验证数据) | 验证数据输入。 | MLTableJobInput |
TrialComponent (试用组件)
名称 | DESCRIPTION | 价值 |
---|---|---|
代码 Id | 代码资产的 ARM 资源 ID。 | 字符串 |
指令 | [必需]在启动作业时执行的命令。 例如 “python train.py” | 字符串 约束: 最小长度 = 1 模式 = [a-zA-Z0-9_] (必需) |
分配 | 作业的分发配置。 如果已设置,则应为 Mpi、Tensorflow、PyTorch 或 null 之一。 | 分发配置 |
环境 ID | [必需]作业的环境规范的 ARM 资源 ID。 | 字符串 约束: 模式 = [a-zA-Z0-9_] (必需) |
环境变量 | 作业中包含的环境变量。 | TrialComponentEnvironmentVariables |
资源 | 作业的计算资源配置。 | JobResourceConfiguration |
TrialComponentEnvironmentVariables
名称 | DESCRIPTION | 价值 |
---|
TritonModelJobInput
名称 | DESCRIPTION | 价值 |
---|---|---|
jobInputType (作业输入类型) | [必需]指定作业的类型。 | “triton_model”(必需) |
模式 | 输入资产传送模式。 | “Direct” “下载” “EvalDownload” “EvalMount” “ReadOnlyMount” “ReadWriteMount” |
URI | [必需]输入资产 URI。 | 字符串 约束: 模式 = [a-zA-Z0-9_] (必需) |
TritonModelJobOutput
名称 | DESCRIPTION | 价值 |
---|---|---|
jobOutputType | [必需]指定作业的类型。 | “triton_model”(必需) |
模式 | 输出资产传送模式。 | “Direct” “ReadWriteMount” “Upload” |
URI | 输出资产 URI。 | 字符串 |
截断选择策略
名称 | DESCRIPTION | 价值 |
---|---|---|
policyType | [必需]策略配置的名称 | “TruncationSelection”(必需) |
截断百分比 | 要在每个评估间隔取消的运行百分比。 | 整数 (int) |
UriFileJobInput
名称 | DESCRIPTION | 价值 |
---|---|---|
jobInputType (作业输入类型) | [必需]指定作业的类型。 | “uri_file”(必需) |
模式 | 输入资产传送模式。 | “Direct” “下载” “EvalDownload” “EvalMount” “ReadOnlyMount” “ReadWriteMount” |
URI | [必需]输入资产 URI。 | 字符串 约束: 模式 = [a-zA-Z0-9_] (必需) |
UriFileJobOutput
名称 | DESCRIPTION | 价值 |
---|---|---|
jobOutputType | [必需]指定作业的类型。 | “uri_file”(必需) |
模式 | 输出资产传送模式。 | “Direct” “ReadWriteMount” “Upload” |
URI | 输出资产 URI。 | 字符串 |
UriFolderJobInput
名称 | DESCRIPTION | 价值 |
---|---|---|
jobInputType (作业输入类型) | [必需]指定作业的类型。 | “uri_folder”(必需) |
模式 | 输入资产传送模式。 | “Direct” “下载” “EvalDownload” “EvalMount” “ReadOnlyMount” “ReadWriteMount” |
URI | [必需]输入资产 URI。 | 字符串 约束: 模式 = [a-zA-Z0-9_] (必需) |
UriFolderJobOutput
名称 | DESCRIPTION | 价值 |
---|---|---|
jobOutputType | [必需]指定作业的类型。 | “uri_folder”(必需) |
模式 | 输出资产传送模式。 | “Direct” “ReadWriteMount” “Upload” |
URI | 输出资产 URI。 | 字符串 |
用户身份
名称 | DESCRIPTION | 价值 |
---|---|---|
身份类型 | [必需]指定标识框架的类型。 | “UserIdentity”(必需) |