你当前正在访问 Microsoft Azure Global Edition 技术文档网站。 如果需要访问由世纪互联运营的 Microsoft Azure 中国技术文档网站,请访问 https://docs.azure.cn

Microsoft.MachineLearningServices 工作区/作业 2022-10-01-preview

Bicep 资源定义

可以使用目标作部署工作区/作业资源类型:

有关每个 API 版本中已更改属性的列表,请参阅 更改日志

资源格式

若要创建 Microsoft.MachineLearningServices/workspaces/jobs 资源,请将以下 Bicep 添加到模板。

resource symbolicname 'Microsoft.MachineLearningServices/workspaces/jobs@2022-10-01-preview' = {
  parent: resourceSymbolicName
  name: 'string'
  properties: {
    componentId: 'string'
    computeId: 'string'
    description: 'string'
    displayName: 'string'
    experimentName: 'string'
    identity: {
      identityType: 'string'
      // For remaining properties, see IdentityConfiguration objects
    }
    isArchived: bool
    properties: {
      {customized property}: 'string'
    }
    services: {
      {customized property}: {
        endpoint: 'string'
        jobServiceType: 'string'
        nodes: {
          nodesValueType: 'string'
          // For remaining properties, see Nodes objects
        }
        port: int
        properties: {
          {customized property}: 'string'
        }
      }
    }
    tags: {
      {customized property}: 'string'
    }
    jobType: 'string'
    // For remaining properties, see JobBaseProperties objects
  }
}

季节性对象

设置 模式 属性以指定对象的类型。

对于 自动,请使用:

{
  mode: 'Auto'
}

对于 “自定义”,请使用:

{
  mode: 'Custom'
  value: int
}

ForecastHorizon 对象

设置 模式 属性以指定对象的类型。

对于 自动,请使用:

{
  mode: 'Auto'
}

对于 “自定义”,请使用:

{
  mode: 'Custom'
  value: int
}

JobOutput 对象

设置 jobOutputType 属性以指定对象的类型。

对于 custom_model,请使用:

{
  jobOutputType: 'custom_model'
  mode: 'string'
  uri: 'string'
}

对于 mlflow_model,请使用:

{
  jobOutputType: 'mlflow_model'
  mode: 'string'
  uri: 'string'
}

对于 mltable,请使用:

{
  jobOutputType: 'mltable'
  mode: 'string'
  uri: 'string'
}

对于 triton_model,请使用:

{
  jobOutputType: 'triton_model'
  mode: 'string'
  uri: 'string'
}

对于 uri_file,请使用:

{
  jobOutputType: 'uri_file'
  mode: 'string'
  uri: 'string'
}

对于 uri_folder,请使用:

{
  jobOutputType: 'uri_folder'
  mode: 'string'
  uri: 'string'
}

IdentityConfiguration 对象

设置 identityType 属性以指定对象的类型。

对于 AMLToken,请使用:

{
  identityType: 'AMLToken'
}

对于 托管,请使用:

{
  clientId: 'string'
  identityType: 'Managed'
  objectId: 'string'
  resourceId: 'string'
}

对于 UserIdentity,请使用:

{
  identityType: 'UserIdentity'
}

DistributionConfiguration 对象

设置 distributionType 属性以指定对象的类型。

对于 Mpi,请使用:

{
  distributionType: 'Mpi'
  processCountPerInstance: int
}

对于 PyTorch,请使用:

{
  distributionType: 'PyTorch'
  processCountPerInstance: int
}

对于 TensorFlow,请使用:

{
  distributionType: 'TensorFlow'
  parameterServerCount: int
  workerCount: int
}

MLAssistConfiguration 对象

设置 mlAssist 属性以指定对象的类型。

对于 禁用,请使用:

{
  mlAssist: 'Disabled'
}

对于 “已启用”,请使用:

{
  inferencingComputeBinding: 'string'
  mlAssist: 'Enabled'
  trainingComputeBinding: 'string'
}

EarlyTerminationPolicy 对象

设置 policyType 属性以指定对象的类型。

对于 Bandit,请使用:

{
  policyType: 'Bandit'
  slackAmount: int
  slackFactor: int
}

对于 MedianStopping,请使用:

{
  policyType: 'MedianStopping'
}

对于 TruncationSelection,请使用:

{
  policyType: 'TruncationSelection'
  truncationPercentage: int
}

TargetRollingWindowSize 对象

设置 模式 属性以指定对象的类型。

对于 自动,请使用:

{
  mode: 'Auto'
}

对于 “自定义”,请使用:

{
  mode: 'Custom'
  value: int
}

SparkJobEntry 对象

设置 sparkJobEntryType 属性以指定对象的类型。

对于 SparkJobPythonEntry,请使用:

{
  file: 'string'
  sparkJobEntryType: 'SparkJobPythonEntry'
}

对于 SparkJobScalaEntry,请使用:

{
  className: 'string'
  sparkJobEntryType: 'SparkJobScalaEntry'
}

AutoMLVertical 对象

设置 taskType 属性以指定对象的类型。

对于 分类,请使用:

{
  cvSplitColumnNames: [
    'string'
  ]
  featurizationSettings: {
    blockedTransformers: [
      'string'
    ]
    columnNameAndTypes: {
      {customized property}: 'string'
    }
    datasetLanguage: 'string'
    enableDnnFeaturization: bool
    mode: 'string'
    transformerParams: {
      {customized property}: [
        {
          fields: [
            'string'
          ]
          parameters: any(...)
        }
      ]
    }
  }
  fixedParameters: {
    booster: 'string'
    boostingType: 'string'
    growPolicy: 'string'
    learningRate: int
    maxBin: int
    maxDepth: int
    maxLeaves: int
    minDataInLeaf: int
    minSplitGain: int
    modelName: 'string'
    nEstimators: int
    numLeaves: int
    preprocessorName: 'string'
    regAlpha: int
    regLambda: int
    subsample: int
    subsampleFreq: int
    treeMethod: 'string'
    withMean: bool
    withStd: bool
  }
  limitSettings: {
    enableEarlyTermination: bool
    exitScore: int
    maxConcurrentTrials: int
    maxCoresPerTrial: int
    maxTrials: int
    sweepConcurrentTrials: int
    sweepTrials: int
    timeout: 'string'
    trialTimeout: 'string'
  }
  nCrossValidations: {
    mode: 'string'
    // For remaining properties, see NCrossValidations objects
  }
  positiveLabel: 'string'
  primaryMetric: 'string'
  searchSpace: [
    {
      booster: 'string'
      boostingType: 'string'
      growPolicy: 'string'
      learningRate: 'string'
      maxBin: 'string'
      maxDepth: 'string'
      maxLeaves: 'string'
      minDataInLeaf: 'string'
      minSplitGain: 'string'
      modelName: 'string'
      nEstimators: 'string'
      numLeaves: 'string'
      preprocessorName: 'string'
      regAlpha: 'string'
      regLambda: 'string'
      subsample: 'string'
      subsampleFreq: 'string'
      treeMethod: 'string'
      withMean: 'string'
      withStd: 'string'
    }
  ]
  sweepSettings: {
    earlyTermination: {
      delayEvaluation: int
      evaluationInterval: int
      policyType: 'string'
      // For remaining properties, see EarlyTerminationPolicy objects
    }
    samplingAlgorithm: 'string'
  }
  taskType: 'Classification'
  testData: {
    description: 'string'
    jobInputType: 'string'
    mode: 'string'
    uri: 'string'
  }
  testDataSize: int
  trainingSettings: {
    allowedTrainingAlgorithms: [
      'string'
    ]
    blockedTrainingAlgorithms: [
      'string'
    ]
    enableDnnTraining: bool
    enableModelExplainability: bool
    enableOnnxCompatibleModels: bool
    enableStackEnsemble: bool
    enableVoteEnsemble: bool
    ensembleModelDownloadTimeout: 'string'
    stackEnsembleSettings: {
      stackMetaLearnerKWargs: any(...)
      stackMetaLearnerTrainPercentage: int
      stackMetaLearnerType: 'string'
    }
  }
  validationData: {
    description: 'string'
    jobInputType: 'string'
    mode: 'string'
    uri: 'string'
  }
  validationDataSize: int
  weightColumnName: 'string'
}

对于 预测,请使用:

{
  cvSplitColumnNames: [
    'string'
  ]
  featurizationSettings: {
    blockedTransformers: [
      'string'
    ]
    columnNameAndTypes: {
      {customized property}: 'string'
    }
    datasetLanguage: 'string'
    enableDnnFeaturization: bool
    mode: 'string'
    transformerParams: {
      {customized property}: [
        {
          fields: [
            'string'
          ]
          parameters: any(...)
        }
      ]
    }
  }
  fixedParameters: {
    booster: 'string'
    boostingType: 'string'
    growPolicy: 'string'
    learningRate: int
    maxBin: int
    maxDepth: int
    maxLeaves: int
    minDataInLeaf: int
    minSplitGain: int
    modelName: 'string'
    nEstimators: int
    numLeaves: int
    preprocessorName: 'string'
    regAlpha: int
    regLambda: int
    subsample: int
    subsampleFreq: int
    treeMethod: 'string'
    withMean: bool
    withStd: bool
  }
  forecastingSettings: {
    countryOrRegionForHolidays: 'string'
    cvStepSize: int
    featureLags: 'string'
    forecastHorizon: {
      mode: 'string'
      // For remaining properties, see ForecastHorizon objects
    }
    frequency: 'string'
    seasonality: {
      mode: 'string'
      // For remaining properties, see Seasonality objects
    }
    shortSeriesHandlingConfig: 'string'
    targetAggregateFunction: 'string'
    targetLags: {
      mode: 'string'
      // For remaining properties, see TargetLags objects
    }
    targetRollingWindowSize: {
      mode: 'string'
      // For remaining properties, see TargetRollingWindowSize objects
    }
    timeColumnName: 'string'
    timeSeriesIdColumnNames: [
      'string'
    ]
    useStl: 'string'
  }
  limitSettings: {
    enableEarlyTermination: bool
    exitScore: int
    maxConcurrentTrials: int
    maxCoresPerTrial: int
    maxTrials: int
    sweepConcurrentTrials: int
    sweepTrials: int
    timeout: 'string'
    trialTimeout: 'string'
  }
  nCrossValidations: {
    mode: 'string'
    // For remaining properties, see NCrossValidations objects
  }
  primaryMetric: 'string'
  searchSpace: [
    {
      booster: 'string'
      boostingType: 'string'
      growPolicy: 'string'
      learningRate: 'string'
      maxBin: 'string'
      maxDepth: 'string'
      maxLeaves: 'string'
      minDataInLeaf: 'string'
      minSplitGain: 'string'
      modelName: 'string'
      nEstimators: 'string'
      numLeaves: 'string'
      preprocessorName: 'string'
      regAlpha: 'string'
      regLambda: 'string'
      subsample: 'string'
      subsampleFreq: 'string'
      treeMethod: 'string'
      withMean: 'string'
      withStd: 'string'
    }
  ]
  sweepSettings: {
    earlyTermination: {
      delayEvaluation: int
      evaluationInterval: int
      policyType: 'string'
      // For remaining properties, see EarlyTerminationPolicy objects
    }
    samplingAlgorithm: 'string'
  }
  taskType: 'Forecasting'
  testData: {
    description: 'string'
    jobInputType: 'string'
    mode: 'string'
    uri: 'string'
  }
  testDataSize: int
  trainingSettings: {
    allowedTrainingAlgorithms: [
      'string'
    ]
    blockedTrainingAlgorithms: [
      'string'
    ]
    enableDnnTraining: bool
    enableModelExplainability: bool
    enableOnnxCompatibleModels: bool
    enableStackEnsemble: bool
    enableVoteEnsemble: bool
    ensembleModelDownloadTimeout: 'string'
    stackEnsembleSettings: {
      stackMetaLearnerKWargs: any(...)
      stackMetaLearnerTrainPercentage: int
      stackMetaLearnerType: 'string'
    }
  }
  validationData: {
    description: 'string'
    jobInputType: 'string'
    mode: 'string'
    uri: 'string'
  }
  validationDataSize: int
  weightColumnName: 'string'
}

对于 ImageClassification,请使用:

{
  limitSettings: {
    maxConcurrentTrials: int
    maxTrials: int
    timeout: 'string'
  }
  modelSettings: {
    advancedSettings: 'string'
    amsGradient: bool
    augmentations: 'string'
    beta1: int
    beta2: int
    checkpointFrequency: int
    checkpointModel: {
      description: 'string'
      jobInputType: 'string'
      mode: 'string'
      uri: 'string'
    }
    checkpointRunId: 'string'
    distributed: bool
    earlyStopping: bool
    earlyStoppingDelay: int
    earlyStoppingPatience: int
    enableOnnxNormalization: bool
    evaluationFrequency: int
    gradientAccumulationStep: int
    layersToFreeze: int
    learningRate: int
    learningRateScheduler: 'string'
    modelName: 'string'
    momentum: int
    nesterov: bool
    numberOfEpochs: int
    numberOfWorkers: int
    optimizer: 'string'
    randomSeed: int
    stepLRGamma: int
    stepLRStepSize: int
    trainingBatchSize: int
    trainingCropSize: int
    validationBatchSize: int
    validationCropSize: int
    validationResizeSize: int
    warmupCosineLRCycles: int
    warmupCosineLRWarmupEpochs: int
    weightDecay: int
    weightedLoss: int
  }
  primaryMetric: 'string'
  searchSpace: [
    {
      amsGradient: 'string'
      augmentations: 'string'
      beta1: 'string'
      beta2: 'string'
      distributed: 'string'
      earlyStopping: 'string'
      earlyStoppingDelay: 'string'
      earlyStoppingPatience: 'string'
      enableOnnxNormalization: 'string'
      evaluationFrequency: 'string'
      gradientAccumulationStep: 'string'
      layersToFreeze: 'string'
      learningRate: 'string'
      learningRateScheduler: 'string'
      modelName: 'string'
      momentum: 'string'
      nesterov: 'string'
      numberOfEpochs: 'string'
      numberOfWorkers: 'string'
      optimizer: 'string'
      randomSeed: 'string'
      stepLRGamma: 'string'
      stepLRStepSize: 'string'
      trainingBatchSize: 'string'
      trainingCropSize: 'string'
      validationBatchSize: 'string'
      validationCropSize: 'string'
      validationResizeSize: 'string'
      warmupCosineLRCycles: 'string'
      warmupCosineLRWarmupEpochs: 'string'
      weightDecay: 'string'
      weightedLoss: 'string'
    }
  ]
  sweepSettings: {
    earlyTermination: {
      delayEvaluation: int
      evaluationInterval: int
      policyType: 'string'
      // For remaining properties, see EarlyTerminationPolicy objects
    }
    samplingAlgorithm: 'string'
  }
  taskType: 'ImageClassification'
  validationData: {
    description: 'string'
    jobInputType: 'string'
    mode: 'string'
    uri: 'string'
  }
  validationDataSize: int
}

对于 ImageClassificationMultilabel,请使用:

{
  limitSettings: {
    maxConcurrentTrials: int
    maxTrials: int
    timeout: 'string'
  }
  modelSettings: {
    advancedSettings: 'string'
    amsGradient: bool
    augmentations: 'string'
    beta1: int
    beta2: int
    checkpointFrequency: int
    checkpointModel: {
      description: 'string'
      jobInputType: 'string'
      mode: 'string'
      uri: 'string'
    }
    checkpointRunId: 'string'
    distributed: bool
    earlyStopping: bool
    earlyStoppingDelay: int
    earlyStoppingPatience: int
    enableOnnxNormalization: bool
    evaluationFrequency: int
    gradientAccumulationStep: int
    layersToFreeze: int
    learningRate: int
    learningRateScheduler: 'string'
    modelName: 'string'
    momentum: int
    nesterov: bool
    numberOfEpochs: int
    numberOfWorkers: int
    optimizer: 'string'
    randomSeed: int
    stepLRGamma: int
    stepLRStepSize: int
    trainingBatchSize: int
    trainingCropSize: int
    validationBatchSize: int
    validationCropSize: int
    validationResizeSize: int
    warmupCosineLRCycles: int
    warmupCosineLRWarmupEpochs: int
    weightDecay: int
    weightedLoss: int
  }
  primaryMetric: 'string'
  searchSpace: [
    {
      amsGradient: 'string'
      augmentations: 'string'
      beta1: 'string'
      beta2: 'string'
      distributed: 'string'
      earlyStopping: 'string'
      earlyStoppingDelay: 'string'
      earlyStoppingPatience: 'string'
      enableOnnxNormalization: 'string'
      evaluationFrequency: 'string'
      gradientAccumulationStep: 'string'
      layersToFreeze: 'string'
      learningRate: 'string'
      learningRateScheduler: 'string'
      modelName: 'string'
      momentum: 'string'
      nesterov: 'string'
      numberOfEpochs: 'string'
      numberOfWorkers: 'string'
      optimizer: 'string'
      randomSeed: 'string'
      stepLRGamma: 'string'
      stepLRStepSize: 'string'
      trainingBatchSize: 'string'
      trainingCropSize: 'string'
      validationBatchSize: 'string'
      validationCropSize: 'string'
      validationResizeSize: 'string'
      warmupCosineLRCycles: 'string'
      warmupCosineLRWarmupEpochs: 'string'
      weightDecay: 'string'
      weightedLoss: 'string'
    }
  ]
  sweepSettings: {
    earlyTermination: {
      delayEvaluation: int
      evaluationInterval: int
      policyType: 'string'
      // For remaining properties, see EarlyTerminationPolicy objects
    }
    samplingAlgorithm: 'string'
  }
  taskType: 'ImageClassificationMultilabel'
  validationData: {
    description: 'string'
    jobInputType: 'string'
    mode: 'string'
    uri: 'string'
  }
  validationDataSize: int
}

对于 ImageInstanceSegmentation,请使用:

{
  limitSettings: {
    maxConcurrentTrials: int
    maxTrials: int
    timeout: 'string'
  }
  modelSettings: {
    advancedSettings: 'string'
    amsGradient: bool
    augmentations: 'string'
    beta1: int
    beta2: int
    boxDetectionsPerImage: int
    boxScoreThreshold: int
    checkpointFrequency: int
    checkpointModel: {
      description: 'string'
      jobInputType: 'string'
      mode: 'string'
      uri: 'string'
    }
    checkpointRunId: 'string'
    distributed: bool
    earlyStopping: bool
    earlyStoppingDelay: int
    earlyStoppingPatience: int
    enableOnnxNormalization: bool
    evaluationFrequency: int
    gradientAccumulationStep: int
    imageSize: int
    layersToFreeze: int
    learningRate: int
    learningRateScheduler: 'string'
    maxSize: int
    minSize: int
    modelName: 'string'
    modelSize: 'string'
    momentum: int
    multiScale: bool
    nesterov: bool
    nmsIouThreshold: int
    numberOfEpochs: int
    numberOfWorkers: int
    optimizer: 'string'
    randomSeed: int
    stepLRGamma: int
    stepLRStepSize: int
    tileGridSize: 'string'
    tileOverlapRatio: int
    tilePredictionsNmsThreshold: int
    trainingBatchSize: int
    validationBatchSize: int
    validationIouThreshold: int
    validationMetricType: 'string'
    warmupCosineLRCycles: int
    warmupCosineLRWarmupEpochs: int
    weightDecay: int
  }
  primaryMetric: 'string'
  searchSpace: [
    {
      amsGradient: 'string'
      augmentations: 'string'
      beta1: 'string'
      beta2: 'string'
      boxDetectionsPerImage: 'string'
      boxScoreThreshold: 'string'
      distributed: 'string'
      earlyStopping: 'string'
      earlyStoppingDelay: 'string'
      earlyStoppingPatience: 'string'
      enableOnnxNormalization: 'string'
      evaluationFrequency: 'string'
      gradientAccumulationStep: 'string'
      imageSize: 'string'
      layersToFreeze: 'string'
      learningRate: 'string'
      learningRateScheduler: 'string'
      maxSize: 'string'
      minSize: 'string'
      modelName: 'string'
      modelSize: 'string'
      momentum: 'string'
      multiScale: 'string'
      nesterov: 'string'
      nmsIouThreshold: 'string'
      numberOfEpochs: 'string'
      numberOfWorkers: 'string'
      optimizer: 'string'
      randomSeed: 'string'
      stepLRGamma: 'string'
      stepLRStepSize: 'string'
      tileGridSize: 'string'
      tileOverlapRatio: 'string'
      tilePredictionsNmsThreshold: 'string'
      trainingBatchSize: 'string'
      validationBatchSize: 'string'
      validationIouThreshold: 'string'
      validationMetricType: 'string'
      warmupCosineLRCycles: 'string'
      warmupCosineLRWarmupEpochs: 'string'
      weightDecay: 'string'
    }
  ]
  sweepSettings: {
    earlyTermination: {
      delayEvaluation: int
      evaluationInterval: int
      policyType: 'string'
      // For remaining properties, see EarlyTerminationPolicy objects
    }
    samplingAlgorithm: 'string'
  }
  taskType: 'ImageInstanceSegmentation'
  validationData: {
    description: 'string'
    jobInputType: 'string'
    mode: 'string'
    uri: 'string'
  }
  validationDataSize: int
}

对于 ImageObjectDetection,请使用:

{
  limitSettings: {
    maxConcurrentTrials: int
    maxTrials: int
    timeout: 'string'
  }
  modelSettings: {
    advancedSettings: 'string'
    amsGradient: bool
    augmentations: 'string'
    beta1: int
    beta2: int
    boxDetectionsPerImage: int
    boxScoreThreshold: int
    checkpointFrequency: int
    checkpointModel: {
      description: 'string'
      jobInputType: 'string'
      mode: 'string'
      uri: 'string'
    }
    checkpointRunId: 'string'
    distributed: bool
    earlyStopping: bool
    earlyStoppingDelay: int
    earlyStoppingPatience: int
    enableOnnxNormalization: bool
    evaluationFrequency: int
    gradientAccumulationStep: int
    imageSize: int
    layersToFreeze: int
    learningRate: int
    learningRateScheduler: 'string'
    maxSize: int
    minSize: int
    modelName: 'string'
    modelSize: 'string'
    momentum: int
    multiScale: bool
    nesterov: bool
    nmsIouThreshold: int
    numberOfEpochs: int
    numberOfWorkers: int
    optimizer: 'string'
    randomSeed: int
    stepLRGamma: int
    stepLRStepSize: int
    tileGridSize: 'string'
    tileOverlapRatio: int
    tilePredictionsNmsThreshold: int
    trainingBatchSize: int
    validationBatchSize: int
    validationIouThreshold: int
    validationMetricType: 'string'
    warmupCosineLRCycles: int
    warmupCosineLRWarmupEpochs: int
    weightDecay: int
  }
  primaryMetric: 'string'
  searchSpace: [
    {
      amsGradient: 'string'
      augmentations: 'string'
      beta1: 'string'
      beta2: 'string'
      boxDetectionsPerImage: 'string'
      boxScoreThreshold: 'string'
      distributed: 'string'
      earlyStopping: 'string'
      earlyStoppingDelay: 'string'
      earlyStoppingPatience: 'string'
      enableOnnxNormalization: 'string'
      evaluationFrequency: 'string'
      gradientAccumulationStep: 'string'
      imageSize: 'string'
      layersToFreeze: 'string'
      learningRate: 'string'
      learningRateScheduler: 'string'
      maxSize: 'string'
      minSize: 'string'
      modelName: 'string'
      modelSize: 'string'
      momentum: 'string'
      multiScale: 'string'
      nesterov: 'string'
      nmsIouThreshold: 'string'
      numberOfEpochs: 'string'
      numberOfWorkers: 'string'
      optimizer: 'string'
      randomSeed: 'string'
      stepLRGamma: 'string'
      stepLRStepSize: 'string'
      tileGridSize: 'string'
      tileOverlapRatio: 'string'
      tilePredictionsNmsThreshold: 'string'
      trainingBatchSize: 'string'
      validationBatchSize: 'string'
      validationIouThreshold: 'string'
      validationMetricType: 'string'
      warmupCosineLRCycles: 'string'
      warmupCosineLRWarmupEpochs: 'string'
      weightDecay: 'string'
    }
  ]
  sweepSettings: {
    earlyTermination: {
      delayEvaluation: int
      evaluationInterval: int
      policyType: 'string'
      // For remaining properties, see EarlyTerminationPolicy objects
    }
    samplingAlgorithm: 'string'
  }
  taskType: 'ImageObjectDetection'
  validationData: {
    description: 'string'
    jobInputType: 'string'
    mode: 'string'
    uri: 'string'
  }
  validationDataSize: int
}

对于 回归,请使用:

{
  cvSplitColumnNames: [
    'string'
  ]
  featurizationSettings: {
    blockedTransformers: [
      'string'
    ]
    columnNameAndTypes: {
      {customized property}: 'string'
    }
    datasetLanguage: 'string'
    enableDnnFeaturization: bool
    mode: 'string'
    transformerParams: {
      {customized property}: [
        {
          fields: [
            'string'
          ]
          parameters: any(...)
        }
      ]
    }
  }
  fixedParameters: {
    booster: 'string'
    boostingType: 'string'
    growPolicy: 'string'
    learningRate: int
    maxBin: int
    maxDepth: int
    maxLeaves: int
    minDataInLeaf: int
    minSplitGain: int
    modelName: 'string'
    nEstimators: int
    numLeaves: int
    preprocessorName: 'string'
    regAlpha: int
    regLambda: int
    subsample: int
    subsampleFreq: int
    treeMethod: 'string'
    withMean: bool
    withStd: bool
  }
  limitSettings: {
    enableEarlyTermination: bool
    exitScore: int
    maxConcurrentTrials: int
    maxCoresPerTrial: int
    maxTrials: int
    sweepConcurrentTrials: int
    sweepTrials: int
    timeout: 'string'
    trialTimeout: 'string'
  }
  nCrossValidations: {
    mode: 'string'
    // For remaining properties, see NCrossValidations objects
  }
  primaryMetric: 'string'
  searchSpace: [
    {
      booster: 'string'
      boostingType: 'string'
      growPolicy: 'string'
      learningRate: 'string'
      maxBin: 'string'
      maxDepth: 'string'
      maxLeaves: 'string'
      minDataInLeaf: 'string'
      minSplitGain: 'string'
      modelName: 'string'
      nEstimators: 'string'
      numLeaves: 'string'
      preprocessorName: 'string'
      regAlpha: 'string'
      regLambda: 'string'
      subsample: 'string'
      subsampleFreq: 'string'
      treeMethod: 'string'
      withMean: 'string'
      withStd: 'string'
    }
  ]
  sweepSettings: {
    earlyTermination: {
      delayEvaluation: int
      evaluationInterval: int
      policyType: 'string'
      // For remaining properties, see EarlyTerminationPolicy objects
    }
    samplingAlgorithm: 'string'
  }
  taskType: 'Regression'
  testData: {
    description: 'string'
    jobInputType: 'string'
    mode: 'string'
    uri: 'string'
  }
  testDataSize: int
  trainingSettings: {
    allowedTrainingAlgorithms: [
      'string'
    ]
    blockedTrainingAlgorithms: [
      'string'
    ]
    enableDnnTraining: bool
    enableModelExplainability: bool
    enableOnnxCompatibleModels: bool
    enableStackEnsemble: bool
    enableVoteEnsemble: bool
    ensembleModelDownloadTimeout: 'string'
    stackEnsembleSettings: {
      stackMetaLearnerKWargs: any(...)
      stackMetaLearnerTrainPercentage: int
      stackMetaLearnerType: 'string'
    }
  }
  validationData: {
    description: 'string'
    jobInputType: 'string'
    mode: 'string'
    uri: 'string'
  }
  validationDataSize: int
  weightColumnName: 'string'
}

对于 TextClassification,请使用:

{
  featurizationSettings: {
    datasetLanguage: 'string'
  }
  fixedParameters: {
    gradientAccumulationSteps: int
    learningRate: int
    learningRateScheduler: 'string'
    modelName: 'string'
    numberOfEpochs: int
    trainingBatchSize: int
    validationBatchSize: int
    warmupRatio: int
    weightDecay: int
  }
  limitSettings: {
    maxConcurrentTrials: int
    maxNodes: int
    maxTrials: int
    timeout: 'string'
    trialTimeout: 'string'
  }
  primaryMetric: 'string'
  searchSpace: [
    {
      gradientAccumulationSteps: 'string'
      learningRate: 'string'
      learningRateScheduler: 'string'
      modelName: 'string'
      numberOfEpochs: 'string'
      trainingBatchSize: 'string'
      validationBatchSize: 'string'
      warmupRatio: 'string'
      weightDecay: 'string'
    }
  ]
  sweepSettings: {
    earlyTermination: {
      delayEvaluation: int
      evaluationInterval: int
      policyType: 'string'
      // For remaining properties, see EarlyTerminationPolicy objects
    }
    samplingAlgorithm: 'string'
  }
  taskType: 'TextClassification'
  validationData: {
    description: 'string'
    jobInputType: 'string'
    mode: 'string'
    uri: 'string'
  }
}

对于 TextClassificationMultilabel,请使用:

{
  featurizationSettings: {
    datasetLanguage: 'string'
  }
  fixedParameters: {
    gradientAccumulationSteps: int
    learningRate: int
    learningRateScheduler: 'string'
    modelName: 'string'
    numberOfEpochs: int
    trainingBatchSize: int
    validationBatchSize: int
    warmupRatio: int
    weightDecay: int
  }
  limitSettings: {
    maxConcurrentTrials: int
    maxNodes: int
    maxTrials: int
    timeout: 'string'
    trialTimeout: 'string'
  }
  searchSpace: [
    {
      gradientAccumulationSteps: 'string'
      learningRate: 'string'
      learningRateScheduler: 'string'
      modelName: 'string'
      numberOfEpochs: 'string'
      trainingBatchSize: 'string'
      validationBatchSize: 'string'
      warmupRatio: 'string'
      weightDecay: 'string'
    }
  ]
  sweepSettings: {
    earlyTermination: {
      delayEvaluation: int
      evaluationInterval: int
      policyType: 'string'
      // For remaining properties, see EarlyTerminationPolicy objects
    }
    samplingAlgorithm: 'string'
  }
  taskType: 'TextClassificationMultilabel'
  validationData: {
    description: 'string'
    jobInputType: 'string'
    mode: 'string'
    uri: 'string'
  }
}

对于 TextNER,请使用:

{
  featurizationSettings: {
    datasetLanguage: 'string'
  }
  fixedParameters: {
    gradientAccumulationSteps: int
    learningRate: int
    learningRateScheduler: 'string'
    modelName: 'string'
    numberOfEpochs: int
    trainingBatchSize: int
    validationBatchSize: int
    warmupRatio: int
    weightDecay: int
  }
  limitSettings: {
    maxConcurrentTrials: int
    maxNodes: int
    maxTrials: int
    timeout: 'string'
    trialTimeout: 'string'
  }
  searchSpace: [
    {
      gradientAccumulationSteps: 'string'
      learningRate: 'string'
      learningRateScheduler: 'string'
      modelName: 'string'
      numberOfEpochs: 'string'
      trainingBatchSize: 'string'
      validationBatchSize: 'string'
      warmupRatio: 'string'
      weightDecay: 'string'
    }
  ]
  sweepSettings: {
    earlyTermination: {
      delayEvaluation: int
      evaluationInterval: int
      policyType: 'string'
      // For remaining properties, see EarlyTerminationPolicy objects
    }
    samplingAlgorithm: 'string'
  }
  taskType: 'TextNER'
  validationData: {
    description: 'string'
    jobInputType: 'string'
    mode: 'string'
    uri: 'string'
  }
}

TargetLags 对象

设置 模式 属性以指定对象的类型。

对于 自动,请使用:

{
  mode: 'Auto'
}

对于 “自定义”,请使用:

{
  mode: 'Custom'
  values: [
    int
  ]
}

LabelingJobMediaProperties 对象

设置 mediaType 属性以指定对象的类型。

对于 映像,请使用:

{
  annotationType: 'string'
  mediaType: 'Image'
}

对于 文本,请使用:

{
  annotationType: 'string'
  mediaType: 'Text'
}

JobInput 对象

设置 jobInputType 属性以指定对象的类型。

对于 custom_model,请使用:

{
  jobInputType: 'custom_model'
  mode: 'string'
  uri: 'string'
}

对于 文本,请使用:

{
  jobInputType: 'literal'
  value: 'string'
}

对于 mlflow_model,请使用:

{
  jobInputType: 'mlflow_model'
  mode: 'string'
  uri: 'string'
}

对于 mltable,请使用:

{
  jobInputType: 'mltable'
  mode: 'string'
  uri: 'string'
}

对于 triton_model,请使用:

{
  jobInputType: 'triton_model'
  mode: 'string'
  uri: 'string'
}

对于 uri_file,请使用:

{
  jobInputType: 'uri_file'
  mode: 'string'
  uri: 'string'
}

对于 uri_folder,请使用:

{
  jobInputType: 'uri_folder'
  mode: 'string'
  uri: 'string'
}

JobBaseProperties 对象

设置 jobType 属性以指定对象的类型。

对于 AutoML,请使用:

{
  environmentId: 'string'
  environmentVariables: {
    {customized property}: 'string'
  }
  jobType: 'AutoML'
  outputs: {
    {customized property}: {
      description: 'string'
      jobOutputType: 'string'
      // For remaining properties, see JobOutput objects
    }
  }
  resources: {
    dockerArgs: 'string'
    instanceCount: int
    instanceType: 'string'
    properties: {
      {customized property}: any(...)
    }
    shmSize: 'string'
  }
  taskDetails: {
    logVerbosity: 'string'
    targetColumnName: 'string'
    trainingData: {
      description: 'string'
      jobInputType: 'string'
      mode: 'string'
      uri: 'string'
    }
    taskType: 'string'
    // For remaining properties, see AutoMLVertical objects
  }
}

对于 命令,请使用:

{
  autologgerSettings: {
    mlflowAutologger: 'string'
  }
  codeId: 'string'
  command: 'string'
  distribution: {
    distributionType: 'string'
    // For remaining properties, see DistributionConfiguration objects
  }
  environmentId: 'string'
  environmentVariables: {
    {customized property}: 'string'
  }
  inputs: {
    {customized property}: {
      description: 'string'
      jobInputType: 'string'
      // For remaining properties, see JobInput objects
    }
  }
  jobType: 'Command'
  limits: {
    jobLimitsType: 'string'
    timeout: 'string'
  }
  outputs: {
    {customized property}: {
      description: 'string'
      jobOutputType: 'string'
      // For remaining properties, see JobOutput objects
    }
  }
  resources: {
    dockerArgs: 'string'
    instanceCount: int
    instanceType: 'string'
    properties: {
      {customized property}: any(...)
    }
    shmSize: 'string'
  }
}

对于 标记,请使用:

{
  dataConfiguration: {
    dataId: 'string'
    incrementalDataRefreshEnabled: bool
  }
  jobInstructions: {
    uri: 'string'
  }
  jobType: 'Labeling'
  labelCategories: {
    {customized property}: {
      classes: {
        {customized property}: {
          displayName: 'string'
          subclasses: {
            {customized property}: ...
          }
        }
      }
      displayName: 'string'
      multiSelectEnabled: bool
    }
  }
  labelingJobMediaProperties: {
    mediaType: 'string'
    // For remaining properties, see LabelingJobMediaProperties objects
  }
  mlAssistConfiguration: {
    mlAssist: 'string'
    // For remaining properties, see MLAssistConfiguration objects
  }
}

对于 管道,请使用:

{
  inputs: {
    {customized property}: {
      description: 'string'
      jobInputType: 'string'
      // For remaining properties, see JobInput objects
    }
  }
  jobs: {
    {customized property}: any(...)
  }
  jobType: 'Pipeline'
  outputs: {
    {customized property}: {
      description: 'string'
      jobOutputType: 'string'
      // For remaining properties, see JobOutput objects
    }
  }
  settings: any(...)
  sourceJobId: 'string'
}

对于 Spark,请使用:

{
  archives: [
    'string'
  ]
  args: 'string'
  codeId: 'string'
  conf: {
    {customized property}: 'string'
  }
  entry: {
    sparkJobEntryType: 'string'
    // For remaining properties, see SparkJobEntry objects
  }
  environmentId: 'string'
  files: [
    'string'
  ]
  inputs: {
    {customized property}: {
      description: 'string'
      jobInputType: 'string'
      // For remaining properties, see JobInput objects
    }
  }
  jars: [
    'string'
  ]
  jobType: 'Spark'
  outputs: {
    {customized property}: {
      description: 'string'
      jobOutputType: 'string'
      // For remaining properties, see JobOutput objects
    }
  }
  pyFiles: [
    'string'
  ]
  resources: {
    instanceType: 'string'
    runtimeVersion: 'string'
  }
}

对于 扫描,请使用:

{
  earlyTermination: {
    delayEvaluation: int
    evaluationInterval: int
    policyType: 'string'
    // For remaining properties, see EarlyTerminationPolicy objects
  }
  inputs: {
    {customized property}: {
      description: 'string'
      jobInputType: 'string'
      // For remaining properties, see JobInput objects
    }
  }
  jobType: 'Sweep'
  limits: {
    jobLimitsType: 'string'
    maxConcurrentTrials: int
    maxTotalTrials: int
    timeout: 'string'
    trialTimeout: 'string'
  }
  objective: {
    goal: 'string'
    primaryMetric: 'string'
  }
  outputs: {
    {customized property}: {
      description: 'string'
      jobOutputType: 'string'
      // For remaining properties, see JobOutput objects
    }
  }
  samplingAlgorithm: {
    samplingAlgorithmType: 'string'
    // For remaining properties, see SamplingAlgorithm objects
  }
  searchSpace: any(...)
  trial: {
    codeId: 'string'
    command: 'string'
    distribution: {
      distributionType: 'string'
      // For remaining properties, see DistributionConfiguration objects
    }
    environmentId: 'string'
    environmentVariables: {
      {customized property}: 'string'
    }
    resources: {
      dockerArgs: 'string'
      instanceCount: int
      instanceType: 'string'
      properties: {
        {customized property}: any(...)
      }
      shmSize: 'string'
    }
  }
}

节点对象

设置 nodesValueType 属性以指定对象的类型。

对于 “全部”,请使用:

{
  nodesValueType: 'All'
}

SamplingAlgorithm 对象

设置 samplingAlgorithmType 属性以指定对象的类型。

对于 Bayesian,请使用:

{
  samplingAlgorithmType: 'Bayesian'
}

对于 网格,请使用:

{
  samplingAlgorithmType: 'Grid'
}

对于 Random,请使用:

{
  rule: 'string'
  samplingAlgorithmType: 'Random'
  seed: int
}

NCrossValidations 对象

设置 模式 属性以指定对象的类型。

对于 自动,请使用:

{
  mode: 'Auto'
}

对于 “自定义”,请使用:

{
  mode: 'Custom'
  value: int
}

属性值

Microsoft.MachineLearningServices/workspaces/jobs

名称 DESCRIPTION 价值
姓名 资源名称 字符串

约束:
模式 = ^[a-zA-Z0-9][a-zA-Z0-9\-_]{0,254}$ (必需)
父级 在 Bicep 中,可以为子资源指定父资源。 仅当子资源在父资源外部声明时,才需要添加此属性。

有关详细信息,请参阅 父资源外部的子资源
类型资源的符号名称: 工作区
属性 [必需]实体的其他属性。 JobBaseProperties (必需)

所有节点

名称 DESCRIPTION 价值
nodesValueType [必需]Nodes 值的类型 “全部”(必需)

AmlToken

名称 DESCRIPTION 价值
身份类型 [必需]指定标识框架的类型。 “AMLToken”(必需)

自动预测地平线

名称 DESCRIPTION 价值
模式 [必需]设置预测地平线值选择模式。 “Auto”(必需)

Autologger 设置

名称 DESCRIPTION 价值
mlflow自动记录器 [必需]指示是否启用 mlflow 自动记录器。 “Disabled”
“Enabled”(必需)

AutoMLJob

名称 DESCRIPTION 价值
环境 ID 作业的环境规范的 ARM 资源 ID。
这是一个可选值,如果未提供,AutoML 将在运行作业时将其默认为生产 AutoML 特选环境版本。
字符串
环境变量 作业中包含的环境变量。 AutoMLJobEnvironmentVariables
职位类型 [必需]指定作业的类型。 “AutoML”(必需)
输出 作业中使用的输出数据绑定的映射。 AutoMLJob 输出
资源 作业的计算资源配置。 JobResourceConfiguration
taskDetails [必需]这表示可以是表/NLP/Image 之一的方案 AutoMLVertical (必需)

AutoMLJobEnvironmentVariables

名称 DESCRIPTION 价值

AutoMLJob 输出

名称 DESCRIPTION 价值

AutoMLVertical

名称 DESCRIPTION 价值
logVerbosity (对数详细程度) 作业的详细记录。 “Critical”
“Debug”
“Error”
“Info”
“NotSet”
“Warning”
targetColumnName 目标列名称:这是预测值列。
也称为分类任务的上下文中的标签列名称。
字符串
任务类型 设置为类型 “分类”的“分类”。 设置为“ 预测”类型。 设置为 ImageClassification 类型的“ImageClassification”。 设置为 ImageClassificationMultilabel 类型的“ImageClassificationMultilabel”。 设置为 ImageInstanceSegmentation 类型的“ImageInstanceSegmentation”。 设置为 ImageObjectDetection 类型的“ImageObjectDetection”。 设置为“ 回归”类型。 设置为 TextClassification 类型的“TextClassification”。 对于 TextClassificationMultilabel,设置为“TextClassificationMultilabel”。 设置为 TextNer 类型的“TextNER”。 “Classification”
“预测”
“ImageClassification”
“ImageClassificationMultilabel”
“ImageInstanceSegmentation”
“ImageObjectDetection”
“回归”
“TextClassification”
“TextClassificationMultilabel”
“TextNER”(必需)
trainingData (训练数据) [必需]训练数据输入。 MLTableJobInput (必需)

AutoNCross验证

名称 DESCRIPTION 价值
模式 [必需]用于确定 N 交叉验证的模式。 “Auto”(必需)

自动季节性

名称 DESCRIPTION 价值
模式 [必需]季节性模式。 “Auto”(必需)

AutoTargetLags 自动目标滞后

名称 DESCRIPTION 价值
模式 [必需]设置目标滞后模式 - 自动/自定义 “Auto”(必需)

AutoTargetRollingWindowSize (自动目标滚动窗口大小)

名称 DESCRIPTION 价值
模式 [必需]TargetRollingWindowSiz 检测模式。 “Auto”(必需)

BanditPolicy (强盗政策)

名称 DESCRIPTION 价值
policyType [必需]策略配置的名称 “强盗”(必需)
slackAmount 从性能最佳的运行中允许的绝对距离。 整数 (int)
slackFactor 的 与性能最佳的运行距离的允许距离比率。 整数 (int)

BayesianSamplingAlgorithm

名称 DESCRIPTION 价值
采样算法类型 [必需]用于生成超参数值的算法以及配置属性 “贝伊西亚”(必需)

分类

名称 DESCRIPTION 价值
cvSplitColumnNames 用于 CVSplit 数据的列。 字符串[]
featurizationSettings AutoML 作业所需的特征化输入。 TableVerticalFeaturizationSettings
固定参数 在整个训练过程中将保持不变的模型/训练参数。 TableFixedParameters (表固定参数)
limitSettings AutoMLJob 的执行约束。 TableVerticalLimitSettings
nCrossValidations 要应用于训练数据集的交叉验证折叠数
如果未提供验证数据集,则为 。
NCross验证
积极标签 二进制指标计算的正标签。 字符串
primaryMetric 任务的主要指标。 “准确性”
“AUCWeighted”
“AveragePrecisionScoreWeighted”
“NormMacroRecall”
“PrecisionScoreWeighted”
搜索空间 用于采样模型及其超参数的不同组合的搜索空间。 TableParameterSubspace[]
扫描设置 模型扫描和超参数优化的设置。 TableSweepSettings (表格扫描设置)
任务类型 [必需]AutoMLJob 的任务类型。 “分类”(必需)
测试数据 测试数据输入。 MLTableJobInput
testDataSize 需要为验证目的预留的测试数据集的分数。
介于 (0.0、 1.0) 之间的值
未提供验证数据集时应用。
整数 (int)
trainingSettings AutoML 作业训练阶段的输入。 分类训练设置
validationData (验证数据) 验证数据输入。 MLTableJobInput
validationDataSize 需要留出用于验证的定型数据集的分数。
介于 (0.0、 1.0) 之间的值
未提供验证数据集时应用。
整数 (int)
权重列名称 示例权重列的名称。 自动化 ML 支持加权列作为输入,导致数据中的行向上或向下加权。 字符串

分类训练设置

名称 DESCRIPTION 价值
allowedTrainingAlgorithms 分类任务的允许模型。 包含任一项的字符串数组:
“BernoulliNaiveBayes”
“DecisionTree”
“ExtremeRandomTrees”
“GradientBoosting”
“KNN”
“LightGBM”
“LinearSVM”
“LogisticRegression”
“MultinomialNaiveBayes”
“RandomForest”
“ZN”
“SVM”
“XGBoostClassifier”
blockedTrainingAlgorithms 分类任务的阻止模型。 包含任一项的字符串数组:
“BernoulliNaiveBayes”
“DecisionTree”
“ExtremeRandomTrees”
“GradientBoosting”
“KNN”
“LightGBM”
“LinearSVM”
“LogisticRegression”
“MultinomialNaiveBayes”
“RandomForest”
“ZN”
“SVM”
“XGBoostClassifier”
enableDnnTraining 启用 DNN 模型的建议。 布尔
enableModelExplainability 标志以在最佳模型上启用可解释性。 布尔
enableOnnxCompatibleModels 用于启用 onnx 兼容模型的标志。 布尔
enableStackEnsemble 启用堆栈合奏运行。 布尔
enableVoteEnsemble 启用投票合奏运行。 布尔
ensembleModelDownloadTimeout 在 VotingEnsemble 和 StackEnsemble 模型生成期间,将下载先前子运行中的多个拟合模型。
如果需要更多时间,请将此参数配置为大于 300 秒的值。
字符串
stackEnsembleSettings 堆栈合奏的堆栈合奏设置。 StackEnsembleSettings

ColumnTransformer (列变换器)

名称 DESCRIPTION 价值
字段 要应用转换器逻辑的字段。 字符串[]
参数 要传递给转换器的不同属性。
输入应为 JSON 格式的键值对字典。
任何

CommandJob

名称 DESCRIPTION 价值
autologger设置 作业的分发配置。 如果已设置,则应为 Mpi、Tensorflow、PyTorch 或 null 之一。 Autologger 设置
代码 Id 代码资产的 ARM 资源 ID。 字符串
指令 [必需]在启动作业时执行的命令。 例如 “python train.py” 字符串

约束:
最小长度 = 1
模式 = [a-zA-Z0-9_] (必需)
分配 作业的分发配置。 如果已设置,则应为 Mpi、Tensorflow、PyTorch 或 null 之一。 分发配置
环境 ID [必需]作业的环境规范的 ARM 资源 ID。 字符串

约束:
模式 = [a-zA-Z0-9_] (必需)
环境变量 作业中包含的环境变量。 CommandJobEnvironmentVariables
输入 作业中使用的输入数据绑定的映射。 CommandJobInputs 命令作业输入
职位类型 [必需]指定作业的类型。 “Command”(必需)
限制 命令作业限制。 CommandJobLimits 命令作业限制
输出 作业中使用的输出数据绑定的映射。 CommandJobOutputs 命令作业输出
资源 作业的计算资源配置。 JobResourceConfiguration

CommandJobEnvironmentVariables

名称 DESCRIPTION 价值

CommandJobInputs 命令作业输入

名称 DESCRIPTION 价值

CommandJobLimits 命令作业限制

名称 DESCRIPTION 价值
jobLimits类型 [必需]JobLimit 类型。 “Command”
“扫描”(必需)
超时 ISO 8601 格式的最大运行持续时间,之后作业将被取消。 仅支持精度为秒的持续时间。 字符串

CommandJobOutputs 命令作业输出

名称 DESCRIPTION 价值

CustomForecastHorizon

名称 DESCRIPTION 价值
模式 [必需]设置预测地平线值选择模式。 “Custom”(必需)
价值 [必需]预测地平线值。 int (必需)

CustomModelJobInput (自定义模型作业输入)

名称 DESCRIPTION 价值
jobInputType (作业输入类型) [必需]指定作业的类型。 “custom_model”(必需)
模式 输入资产传送模式。 “Direct”
“下载”
“EvalDownload”
“EvalMount”
“ReadOnlyMount”
“ReadWriteMount”
URI [必需]输入资产 URI。 字符串

约束:
模式 = [a-zA-Z0-9_] (必需)

CustomModelJobOutput

名称 DESCRIPTION 价值
jobOutputType [必需]指定作业的类型。 “custom_model”(必需)
模式 输出资产传送模式。 “Direct”
“ReadWriteMount”
“Upload”
URI 输出资产 URI。 字符串

CustomNCross验证

名称 DESCRIPTION 价值
模式 [必需]用于确定 N 交叉验证的模式。 “Custom”(必需)
价值 [必需]N 交叉验证值。 int (必需)

CustomSeasonality (自定义季节性)

名称 DESCRIPTION 价值
模式 [必需]季节性模式。 “Custom”(必需)
价值 [必需]季节性值。 int (必需)

CustomTargetLags (自定义目标滞后)

名称 DESCRIPTION 价值
模式 [必需]设置目标滞后模式 - 自动/自定义 “Custom”(必需)
价值, 价值观 [必需]设置目标滞后值。 int[] (必需)

CustomTargetRollingWindowSize

名称 DESCRIPTION 价值
模式 [必需]TargetRollingWindowSiz 检测模式。 “Custom”(必需)
价值 [必需]TargetRollingWindowSize 值。 int (必需)

分发配置

名称 DESCRIPTION 价值
distributionType 对于 Mpi 类型,设置为“ Mpi”。 对于 PyTorch 类型,设置为“ PyTorch”。 设置为 TensorFlow 类型的“TensorFlow”。 “Mpi”
“PyTorch”
“TensorFlow”(必需)

提前终止政策

名称 DESCRIPTION 价值
delay评估 延迟第一次计算的间隔数。 整数 (int)
evaluationInterval 策略评估之间的间隔(运行数)。 整数 (int)
policyType 设置为“ BanditPolicy”类型为“BanditPolicy”。 对于 MedianStoppingPolicy,设置为“MedianStoppingPolicy”。 对于 TruncationSelectionPolicy 类型,设置为“TruncationSelection”。 “Bandit”
“MedianStopping”
“TruncationSelection”(必需)

预测地平线

名称 DESCRIPTION 价值
模式 设置为“ AutoForecastHorizon”类型。 设置为 CustomForecastHorizon 类型的“Custom”。 “Auto”
“Custom”(必需)

预测

名称 DESCRIPTION 价值
cvSplitColumnNames 用于 CVSplit 数据的列。 字符串[]
featurizationSettings AutoML 作业所需的特征化输入。 TableVerticalFeaturizationSettings
固定参数 在整个训练过程中将保持不变的模型/训练参数。 TableFixedParameters (表固定参数)
forecasting设置 预测任务特定的输入。 ForecastingSettings
limitSettings AutoMLJob 的执行约束。 TableVerticalLimitSettings
nCrossValidations 要应用于训练数据集的交叉验证折叠数
如果未提供验证数据集,则为 。
NCross验证
primaryMetric 预测任务的主要指标。 “NormalizedMeanAbsoluteError”
“NormalizedRootMeanSquaredError”
“R2Score”
'SpearmanCorrelation'
搜索空间 用于采样模型及其超参数的不同组合的搜索空间。 TableParameterSubspace[]
扫描设置 模型扫描和超参数优化的设置。 TableSweepSettings (表格扫描设置)
任务类型 [必需]AutoMLJob 的任务类型。 “预测”(必需)
测试数据 测试数据输入。 MLTableJobInput
testDataSize 需要为验证目的预留的测试数据集的分数。
介于 (0.0、 1.0) 之间的值
未提供验证数据集时应用。
整数 (int)
trainingSettings AutoML 作业训练阶段的输入。 ForecastingTrainingSettings
validationData (验证数据) 验证数据输入。 MLTableJobInput
validationDataSize 需要留出用于验证的定型数据集的分数。
介于 (0.0、 1.0) 之间的值
未提供验证数据集时应用。
整数 (int)
权重列名称 示例权重列的名称。 自动化 ML 支持加权列作为输入,导致数据中的行向上或向下加权。 字符串

ForecastingSettings

名称 DESCRIPTION 价值
国家/地区或地区为假期 用于预测任务的假日国家或地区。
这些代码应为 ISO 3166 双字母国家/地区代码,例如“US”或“GB”。
字符串
cvStepSize 一个 CV 折叠的起始时间与下一个折叠之间的句点数。 为
例如,如果 CVStepSize = 3 表示每日数据,则每个折叠的源时间将为
三天相隔。
整数 (int)
featureLags 使用“auto”或 null 为数值特征生成滞后的标志。 “Auto”
“None”
forecastHorizon (预测地平线) 所需最大预测范围(以时序频率单位为单位)。 预测地平线
频率 预测时,此参数表示需要预测的时间段,例如每日、每周、每年等。默认情况下,预测频率为数据集频率。 字符串
季节性 将时序季节性设置为序列频率的整数倍数。
如果季节性设置为“auto”,则会推断它。
季节性
shortSeriesHandlingConfig 定义 AutoML 如何处理短时序的参数。 “Auto”
“掉落”
“None”
“Pad”
targetAggregateFunction 用于聚合符合用户指定频率的时序目标列的函数。
如果设置了 TargetAggregateFunction,即不是“None”,但未设置 freq 参数,则会引发错误。 可能的目标聚合函数包括:“sum”、“max”、“min”和“mean”。
“Max”
“Mean”
“Min”
“None”
“Sum”
目标拉格 要从目标列滞后的过去时间段数。 目标滞后
targetRollingWindowSize 用于创建目标列的滚动窗口平均值的过去时间段数。 TargetRollingWindowSize
timeColumnName (时间列名称) 时间列的名称。 当预测在用于生成时序并推断其频率的输入数据中指定日期/时间列时,此参数是必需的。 字符串
timeSeriesIdColumnNames 用于对时间序列进行分组的列的名称。 它可用于创建多个序列。
如果未定义粒度,则假定数据集为一个时序。 此参数用于任务类型预测。
字符串[]
useStl 配置时序目标列的 STL 分解。 “None”
“季度”
“SeasonTrend”

ForecastingTrainingSettings

名称 DESCRIPTION 价值
allowedTrainingAlgorithms 允许用于预测任务的模型。 包含任一项的字符串数组:
“Arimax”
“AutoArima”
“Average”
“DecisionTree”
“ElasticNet”
“ExponentialSmoothing”
“ExtremeRandomTrees”
“GradientBoosting”
“KNN”
“LassoLars”
“LightGBM”
“Naive”
“先知”
“RandomForest”
“SeasonalAverage”
“SeasonalNaive”
“ZN”
“TCNForecaster”
“XGBoostRegressor”
blockedTrainingAlgorithms 用于预测任务的阻止模型。 包含任一项的字符串数组:
“Arimax”
“AutoArima”
“Average”
“DecisionTree”
“ElasticNet”
“ExponentialSmoothing”
“ExtremeRandomTrees”
“GradientBoosting”
“KNN”
“LassoLars”
“LightGBM”
“Naive”
“先知”
“RandomForest”
“SeasonalAverage”
“SeasonalNaive”
“ZN”
“TCNForecaster”
“XGBoostRegressor”
enableDnnTraining 启用 DNN 模型的建议。 布尔
enableModelExplainability 标志以在最佳模型上启用可解释性。 布尔
enableOnnxCompatibleModels 用于启用 onnx 兼容模型的标志。 布尔
enableStackEnsemble 启用堆栈合奏运行。 布尔
enableVoteEnsemble 启用投票合奏运行。 布尔
ensembleModelDownloadTimeout 在 VotingEnsemble 和 StackEnsemble 模型生成期间,将下载先前子运行中的多个拟合模型。
如果需要更多时间,请将此参数配置为大于 300 秒的值。
字符串
stackEnsembleSettings 堆栈合奏的堆栈合奏设置。 StackEnsembleSettings

GridSampling算法

名称 DESCRIPTION 价值
采样算法类型 [必需]用于生成超参数值的算法以及配置属性 “Grid”(必需)

身份配置

名称 DESCRIPTION 价值
身份类型 对于 AmlToken 类型,设置为“AMLToken”。 设置为 “ManagedIdentity”类型。 对于 UserIdentity 类型,设置为“UserIdentity”。 “AMLToken”
“Managed”
“UserIdentity”(必需)

图像分类

名称 DESCRIPTION 价值
limitSettings [必需]限制 AutoML 作业的设置。 ImageLimitSettings (必需)
modelSettings 用于训练模型的设置。 ImageModelSettings分类
primaryMetric 要针对此任务进行优化的主要指标。 “准确性”
“AUCWeighted”
“AveragePrecisionScoreWeighted”
“NormMacroRecall”
“PrecisionScoreWeighted”
搜索空间 用于采样模型及其超参数的不同组合的搜索空间。 ImageModelDistributionSettingsClassification[]
扫描设置 模型扫描和超参数扫描相关设置。 ImageSweepSettings (图像扫描设置)
任务类型 [必需]AutoMLJob 的任务类型。 “ImageClassification”(必需)
validationData (验证数据) 验证数据输入。 MLTableJobInput
validationDataSize 需要留出用于验证的定型数据集的分数。
介于 (0.0、 1.0) 之间的值
未提供验证数据集时应用。
整数 (int)

ImageClassificationMultilabel

名称 DESCRIPTION 价值
limitSettings [必需]限制 AutoML 作业的设置。 ImageLimitSettings (必需)
modelSettings 用于训练模型的设置。 ImageModelSettings分类
primaryMetric 要针对此任务进行优化的主要指标。 “准确性”
“AUCWeighted”
“AveragePrecisionScoreWeighted”
“IOU”
“NormMacroRecall”
“PrecisionScoreWeighted”
搜索空间 用于采样模型及其超参数的不同组合的搜索空间。 ImageModelDistributionSettingsClassification[]
扫描设置 模型扫描和超参数扫描相关设置。 ImageSweepSettings (图像扫描设置)
任务类型 [必需]AutoMLJob 的任务类型。 “ImageClassificationMultilabel”(必需)
validationData (验证数据) 验证数据输入。 MLTableJobInput
validationDataSize 需要留出用于验证的定型数据集的分数。
介于 (0.0、 1.0) 之间的值
未提供验证数据集时应用。
整数 (int)

ImageInstanceSegmentation

名称 DESCRIPTION 价值
limitSettings [必需]限制 AutoML 作业的设置。 ImageLimitSettings (必需)
modelSettings 用于训练模型的设置。 ImageModelSettingsObjectDetection
primaryMetric 要针对此任务进行优化的主要指标。 “MeanAveragePrecision”
搜索空间 用于采样模型及其超参数的不同组合的搜索空间。 ImageModelDistributionSettingsObjectDetection[]
扫描设置 模型扫描和超参数扫描相关设置。 ImageSweepSettings (图像扫描设置)
任务类型 [必需]AutoMLJob 的任务类型。 “ImageInstanceSegmentation”(必需)
validationData (验证数据) 验证数据输入。 MLTableJobInput
validationDataSize 需要留出用于验证的定型数据集的分数。
介于 (0.0、 1.0) 之间的值
未提供验证数据集时应用。
整数 (int)

ImageLimitSettings

名称 DESCRIPTION 价值
maxConcurrentTrials 最大并发 AutoML 迭代数。 整数 (int)
maxTrials AutoML 迭代的最大数目。 整数 (int)
超时 AutoML 作业超时。 字符串

ImageModelDistributionSettings分类

名称 DESCRIPTION 价值
amsGradient 优化器为“adam”或“adamw”时启用 AMSGrad。 字符串
扩充 使用扩充的设置。 字符串
贝塔1 优化器为“adam”或“adamw”时“beta1”的值。 必须是 [0, 1] 范围内的浮点。 字符串
贝塔2 优化器为“adam”或“adamw”时“beta2”的值。 必须是 [0, 1] 范围内的浮点。 字符串
分散式 是否使用分布式程序训练。 字符串
earlyStopping (早期停止) 在训练期间启用提前停止逻辑。 字符串
earlyStoppingDelay 在主要指标改进之前等待的最小纪元数或验证评估数
跟踪早期停止。 必须是正整数。
字符串
早点停止耐心 之前没有主要指标改进的最小纪元或验证评估数
运行已停止。 必须是正整数。
字符串
enableOnnxNormalization 导出 ONNX 模型时启用规范化。 字符串
evaluationFrequency 评估验证数据集以获取指标分数的频率。 必须是正整数。 字符串
梯度累积步骤 渐变累积意味着在不运行配置数量的“GradAccumulationStep”步骤的情况下
更新模型权重,同时累积这些步骤的渐变,然后使用
用于计算权重更新的累积渐变。 必须是正整数。
字符串
layersToFreeze (图层冻结) 要冻结模型的层数。 必须是正整数。
例如,将 2 作为“seresnext”的值传递意味着
冻结 layer0 和 layer1。 有关支持的模型的完整列表以及有关层冻结的详细信息,请
请参阅:/azure/machine-learning/how-to-auto-train-image-models。
字符串
learningRate 初始学习速率。 必须是 [0, 1] 范围内的浮点。 字符串
learningRateScheduler 的 学习速率计划程序的类型。 必须是“warmup_cosine”或“step”。 字符串
模型名称 要用于训练的模型的名称。
有关可用模型的详细信息,请访问官方文档:
/azure/machine-learning/how-to-auto-train-image-models。
字符串
动量 优化器为“zn”时的动量值。 必须是 [0, 1] 范围内的浮点。 字符串
涅斯特罗夫 优化器为“zn”时启用 nesterov。 字符串
纪元数 训练纪元数。 必须是正整数。 字符串
工人数 数据加载程序辅助角色数。 必须是非负整数。 字符串
优化器 优化器的类型。 必须是“zn”、“adam”或“adamw”。 字符串
随机种子 使用确定性训练时要使用的随机种子。 字符串
stepLR伽玛 当学习速率计划程序为“step”时,gamma 的值。 必须是 [0, 1] 范围内的浮点。 字符串
stepLRStepSize 学习速率计划程序为“step”时步骤大小的值。 必须是正整数。 字符串
trainingBatchSize 训练批大小。 必须是正整数。 字符串
trainingCropSize 训练数据集的神经网络输入的图像裁剪大小。 必须是正整数。 字符串
validationBatchSize 验证批大小。 必须是正整数。 字符串
validationCropSize 输入到神经网络的验证数据集的图像裁剪大小。 必须是正整数。 字符串
validationResizeSize 在裁剪验证数据集之前要调整其大小的图像大小。 必须是正整数。 字符串
warmupCosineLRCycles 学习速率计划程序为“warmup_cosine”时的余弦周期值。 必须是 [0, 1] 范围内的浮点。 字符串
warmupCosineLRWarmupEpochs 当学习速率计划程序为“warmup_cosine”时,预热时期的值。 必须是正整数。 字符串
weightDecay (权重衰减) 优化器为“zn”、“adam”或“adamw”时的权重衰减值。 必须是范围[0, 1] 中的浮点。 字符串
weightedLoss 减肥。 对于无加权损失,接受的值为 0。
1 用于与 sqrt 一起减肥。(class_weights)。 2 用于减肥与class_weights。 必须为 0 或 1 或 2。
字符串

ImageModelDistributionSettingsObjectDetection

名称 DESCRIPTION 价值
amsGradient 优化器为“adam”或“adamw”时启用 AMSGrad。 字符串
扩充 使用扩充的设置。 字符串
贝塔1 优化器为“adam”或“adamw”时“beta1”的值。 必须是 [0, 1] 范围内的浮点。 字符串
贝塔2 优化器为“adam”或“adamw”时“beta2”的值。 必须是 [0, 1] 范围内的浮点。 字符串
boxDetectionsPerImage (每图像检测) 每个图像的最大检测数,适用于所有类。 必须是正整数。
注意:“yolov5”算法不支持此设置。
字符串
boxScoreThreshold (盒分数阈值) 在推理期间,仅返回分类分数大于
BoxScoreThreshold。 必须是范围[0, 1] 中的浮点。
字符串
分散式 是否使用分布式程序训练。 字符串
earlyStopping (早期停止) 在训练期间启用提前停止逻辑。 字符串
earlyStoppingDelay 在主要指标改进之前等待的最小纪元数或验证评估数
跟踪早期停止。 必须是正整数。
字符串
早点停止耐心 之前没有主要指标改进的最小纪元或验证评估数
运行已停止。 必须是正整数。
字符串
enableOnnxNormalization 导出 ONNX 模型时启用规范化。 字符串
evaluationFrequency 评估验证数据集以获取指标分数的频率。 必须是正整数。 字符串
梯度累积步骤 渐变累积意味着在不运行配置数量的“GradAccumulationStep”步骤的情况下
更新模型权重,同时累积这些步骤的渐变,然后使用
用于计算权重更新的累积渐变。 必须是正整数。
字符串
图像大小 用于训练和验证的图像大小。 必须是正整数。
注意:如果大小太大,训练运行可能会进入 CUDA OOM。
注意:仅“yolov5”算法支持此设置。
字符串
layersToFreeze (图层冻结) 要冻结模型的层数。 必须是正整数。
例如,将 2 作为“seresnext”的值传递意味着
冻结 layer0 和 layer1。 有关支持的模型的完整列表以及有关层冻结的详细信息,请
请参阅:/azure/machine-learning/how-to-auto-train-image-models。
字符串
learningRate 初始学习速率。 必须是 [0, 1] 范围内的浮点。 字符串
learningRateScheduler 的 学习速率计划程序的类型。 必须是“warmup_cosine”或“step”。 字符串
最大大小 将图像馈送至主干之前要重新缩放的最大大小。
必须是正整数。 注意:如果大小太大,训练运行可能会进入 CUDA OOM。
注意:“yolov5”算法不支持此设置。
字符串
最小大小 将图像馈送到主干之前要重新缩放的最小大小。
必须是正整数。 注意:如果大小太大,训练运行可能会进入 CUDA OOM。
注意:“yolov5”算法不支持此设置。
字符串
模型名称 要用于训练的模型的名称。
有关可用模型的详细信息,请访问官方文档:
/azure/machine-learning/how-to-auto-train-image-models。
字符串
modelSize 模型大小。 必须是“small”、“medium”、“large”或“xlarge”。
注意:如果模型大小太大,训练运行可能会进入 CUDA OOM。
注意:仅“yolov5”算法支持此设置。
字符串
动量 优化器为“zn”时的动量值。 必须是 [0, 1] 范围内的浮点。 字符串
多尺度 按 +/- 50%的不同图像大小启用多缩放图像。
注意:如果没有足够的 GPU 内存,训练运行可能会进入 CUDA OOM。
注意:仅“yolov5”算法支持此设置。
字符串
涅斯特罗夫 优化器为“zn”时启用 nesterov。 字符串
nmsIouThreshold 在 NMS 后期处理的推理期间使用的 IOU 阈值。 必须在 [0, 1] 范围内浮动。 字符串
纪元数 训练纪元数。 必须是正整数。 字符串
工人数 数据加载程序辅助角色数。 必须是非负整数。 字符串
优化器 优化器的类型。 必须是“zn”、“adam”或“adamw”。 字符串
随机种子 使用确定性训练时要使用的随机种子。 字符串
stepLR伽玛 当学习速率计划程序为“step”时,gamma 的值。 必须是 [0, 1] 范围内的浮点。 字符串
stepLRStepSize 学习速率计划程序为“step”时步骤大小的值。 必须是正整数。 字符串
tileGridSize (平铺网格大小) 用于平铺每个图像的网格大小。 注意:TileGridSize 不得为
无可启用小型对象检测逻辑。 一个字符串,其中包含两个整数(采用格式)。
注意:“yolov5”算法不支持此设置。
字符串
tileOverlapRatio (平铺重叠比率) 每个维度中相邻磁贴之间的重叠比率。 必须在 [0, 1] 范围内浮动。
注意:“yolov5”算法不支持此设置。
字符串
tilePredictionsNmsThreshold 用于执行 NMS 的 IOU 阈值,同时合并来自磁贴和图像的预测。
用于验证/推理。 必须在 [0, 1] 范围内浮动。
注意:“yolov5”算法不支持此设置。
NMS:非最大抑制
字符串
trainingBatchSize 训练批大小。 必须是正整数。 字符串
validationBatchSize 验证批大小。 必须是正整数。 字符串
validationIouThreshold 计算验证指标时要使用的 IOU 阈值。 必须在 [0, 1] 范围内浮动。 字符串
validationMetricType 用于验证指标的指标计算方法。 必须是“none”、“coco”、“voc”或“coco_voc”。 字符串
warmupCosineLRCycles 学习速率计划程序为“warmup_cosine”时的余弦周期值。 必须是 [0, 1] 范围内的浮点。 字符串
warmupCosineLRWarmupEpochs 当学习速率计划程序为“warmup_cosine”时,预热时期的值。 必须是正整数。 字符串
weightDecay (权重衰减) 优化器为“zn”、“adam”或“adamw”时的权重衰减值。 必须是范围[0, 1] 中的浮点。 字符串

ImageModelSettings分类

名称 DESCRIPTION 价值
高级设置 高级方案的设置。 字符串
amsGradient 优化器为“adam”或“adamw”时启用 AMSGrad。 布尔
扩充 使用扩充的设置。 字符串
贝塔1 优化器为“adam”或“adamw”时“beta1”的值。 必须是 [0, 1] 范围内的浮点。 整数 (int)
贝塔2 优化器为“adam”或“adamw”时“beta2”的值。 必须是 [0, 1] 范围内的浮点。 整数 (int)
检查点频率 存储模型检查点的频率。 必须是正整数。 整数 (int)
checkpoint模型 用于增量训练的预先训练检查点模型。 MLFlowModelJobInput
检查点RunId 上一次运行的 ID,该运行具有用于增量训练的预先训练检查点。 字符串
分散式 是否使用分布式训练。 布尔
earlyStopping (早期停止) 在训练期间启用提前停止逻辑。 布尔
earlyStoppingDelay 在主要指标改进之前等待的最小纪元数或验证评估数
跟踪早期停止。 必须是正整数。
整数 (int)
早点停止耐心 之前没有主要指标改进的最小纪元或验证评估数
运行已停止。 必须是正整数。
整数 (int)
enableOnnxNormalization 导出 ONNX 模型时启用规范化。 布尔
evaluationFrequency 评估验证数据集以获取指标分数的频率。 必须是正整数。 整数 (int)
梯度累积步骤 渐变累积意味着在不运行配置数量的“GradAccumulationStep”步骤的情况下
更新模型权重,同时累积这些步骤的渐变,然后使用
用于计算权重更新的累积渐变。 必须是正整数。
整数 (int)
layersToFreeze (图层冻结) 要冻结模型的层数。 必须是正整数。
例如,将 2 作为“seresnext”的值传递意味着
冻结 layer0 和 layer1。 有关支持的模型的完整列表以及有关层冻结的详细信息,请
请参阅:/azure/machine-learning/how-to-auto-train-image-models。
整数 (int)
learningRate 初始学习速率。 必须是 [0, 1] 范围内的浮点。 整数 (int)
learningRateScheduler 的 学习速率计划程序的类型。 必须是“warmup_cosine”或“step”。 “None”
“Step”
“WarmupCosine”
模型名称 要用于训练的模型的名称。
有关可用模型的详细信息,请访问官方文档:
/azure/machine-learning/how-to-auto-train-image-models。
字符串
动量 优化器为“zn”时的动量值。 必须是 [0, 1] 范围内的浮点。 整数 (int)
涅斯特罗夫 优化器为“zn”时启用 nesterov。 布尔
纪元数 训练纪元数。 必须是正整数。 整数 (int)
工人数 数据加载程序辅助角色数。 必须是非负整数。 整数 (int)
优化器 优化器的类型。 “Adam”
“Adamw”
“None”
“Zn”
随机种子 使用确定性训练时要使用的随机种子。 整数 (int)
stepLR伽玛 当学习速率计划程序为“step”时,gamma 的值。 必须是 [0, 1] 范围内的浮点。 整数 (int)
stepLRStepSize 学习速率计划程序为“step”时步骤大小的值。 必须是正整数。 整数 (int)
trainingBatchSize 训练批大小。 必须是正整数。 整数 (int)
trainingCropSize 训练数据集的神经网络输入的图像裁剪大小。 必须是正整数。 整数 (int)
validationBatchSize 验证批大小。 必须是正整数。 整数 (int)
validationCropSize 输入到神经网络的验证数据集的图像裁剪大小。 必须是正整数。 整数 (int)
validationResizeSize 在裁剪验证数据集之前要调整其大小的图像大小。 必须是正整数。 整数 (int)
warmupCosineLRCycles 学习速率计划程序为“warmup_cosine”时的余弦周期值。 必须是 [0, 1] 范围内的浮点。 整数 (int)
warmupCosineLRWarmupEpochs 当学习速率计划程序为“warmup_cosine”时,预热时期的值。 必须是正整数。 整数 (int)
weightDecay (权重衰减) 优化器为“zn”、“adam”或“adamw”时的权重衰减值。 必须是范围[0, 1] 中的浮点。 整数 (int)
weightedLoss 减肥。 对于无加权损失,接受的值为 0。
1 用于与 sqrt 一起减肥。(class_weights)。 2 用于减肥与class_weights。 必须为 0 或 1 或 2。
整数 (int)

ImageModelSettingsObjectDetection

名称 DESCRIPTION 价值
高级设置 高级方案的设置。 字符串
amsGradient 优化器为“adam”或“adamw”时启用 AMSGrad。 布尔
扩充 使用扩充的设置。 字符串
贝塔1 优化器为“adam”或“adamw”时“beta1”的值。 必须是 [0, 1] 范围内的浮点。 整数 (int)
贝塔2 优化器为“adam”或“adamw”时“beta2”的值。 必须是 [0, 1] 范围内的浮点。 整数 (int)
boxDetectionsPerImage (每图像检测) 每个图像的最大检测数,适用于所有类。 必须是正整数。
注意:“yolov5”算法不支持此设置。
整数 (int)
boxScoreThreshold (盒分数阈值) 在推理期间,仅返回分类分数大于
BoxScoreThreshold。 必须是范围[0, 1] 中的浮点。
整数 (int)
检查点频率 存储模型检查点的频率。 必须是正整数。 整数 (int)
checkpoint模型 用于增量训练的预先训练检查点模型。 MLFlowModelJobInput
检查点RunId 上一次运行的 ID,该运行具有用于增量训练的预先训练检查点。 字符串
分散式 是否使用分布式训练。 布尔
earlyStopping (早期停止) 在训练期间启用提前停止逻辑。 布尔
earlyStoppingDelay 在主要指标改进之前等待的最小纪元数或验证评估数
跟踪早期停止。 必须是正整数。
整数 (int)
早点停止耐心 之前没有主要指标改进的最小纪元或验证评估数
运行已停止。 必须是正整数。
整数 (int)
enableOnnxNormalization 导出 ONNX 模型时启用规范化。 布尔
evaluationFrequency 评估验证数据集以获取指标分数的频率。 必须是正整数。 整数 (int)
梯度累积步骤 渐变累积意味着在不运行配置数量的“GradAccumulationStep”步骤的情况下
更新模型权重,同时累积这些步骤的渐变,然后使用
用于计算权重更新的累积渐变。 必须是正整数。
整数 (int)
图像大小 用于训练和验证的图像大小。 必须是正整数。
注意:如果大小太大,训练运行可能会进入 CUDA OOM。
注意:仅“yolov5”算法支持此设置。
整数 (int)
layersToFreeze (图层冻结) 要冻结模型的层数。 必须是正整数。
例如,将 2 作为“seresnext”的值传递意味着
冻结 layer0 和 layer1。 有关支持的模型的完整列表以及有关层冻结的详细信息,请
请参阅:/azure/machine-learning/how-to-auto-train-image-models。
整数 (int)
learningRate 初始学习速率。 必须是 [0, 1] 范围内的浮点。 整数 (int)
learningRateScheduler 的 学习速率计划程序的类型。 必须是“warmup_cosine”或“step”。 “None”
“Step”
“WarmupCosine”
最大大小 将图像馈送至主干之前要重新缩放的最大大小。
必须是正整数。 注意:如果大小太大,训练运行可能会进入 CUDA OOM。
注意:“yolov5”算法不支持此设置。
整数 (int)
最小大小 将图像馈送到主干之前要重新缩放的最小大小。
必须是正整数。 注意:如果大小太大,训练运行可能会进入 CUDA OOM。
注意:“yolov5”算法不支持此设置。
整数 (int)
模型名称 要用于训练的模型的名称。
有关可用模型的详细信息,请访问官方文档:
/azure/machine-learning/how-to-auto-train-image-models。
字符串
modelSize 模型大小。 必须是“small”、“medium”、“large”或“xlarge”。
注意:如果模型大小太大,训练运行可能会进入 CUDA OOM。
注意:仅“yolov5”算法支持此设置。
“ExtraLarge”
“Large”
“Medium”
“None”
“Small”
动量 优化器为“zn”时的动量值。 必须是 [0, 1] 范围内的浮点。 整数 (int)
多尺度 按 +/- 50%的不同图像大小启用多缩放图像。
注意:如果没有足够的 GPU 内存,训练运行可能会进入 CUDA OOM。
注意:仅“yolov5”算法支持此设置。
布尔
涅斯特罗夫 优化器为“zn”时启用 nesterov。 布尔
nmsIouThreshold 在 NMS 后期处理的推理期间使用的 IOU 阈值。 必须是 [0, 1] 范围内的浮点。 整数 (int)
纪元数 训练纪元数。 必须是正整数。 整数 (int)
工人数 数据加载程序辅助角色数。 必须是非负整数。 整数 (int)
优化器 优化器的类型。 “Adam”
“Adamw”
“None”
“Zn”
随机种子 使用确定性训练时要使用的随机种子。 整数 (int)
stepLR伽玛 当学习速率计划程序为“step”时,gamma 的值。 必须是 [0, 1] 范围内的浮点。 整数 (int)
stepLRStepSize 学习速率计划程序为“step”时步骤大小的值。 必须是正整数。 整数 (int)
tileGridSize (平铺网格大小) 用于平铺每个图像的网格大小。 注意:TileGridSize 不得为
无可启用小型对象检测逻辑。 一个字符串,其中包含两个整数(采用格式)。
注意:“yolov5”算法不支持此设置。
字符串
tileOverlapRatio (平铺重叠比率) 每个维度中相邻磁贴之间的重叠比率。 必须在 [0, 1] 范围内浮动。
注意:“yolov5”算法不支持此设置。
整数 (int)
tilePredictionsNmsThreshold 用于执行 NMS 的 IOU 阈值,同时合并来自磁贴和图像的预测。
用于验证/推理。 必须在 [0, 1] 范围内浮动。
注意:“yolov5”算法不支持此设置。
整数 (int)
trainingBatchSize 训练批大小。 必须是正整数。 整数 (int)
validationBatchSize 验证批大小。 必须是正整数。 整数 (int)
validationIouThreshold 计算验证指标时要使用的 IOU 阈值。 必须在 [0, 1] 范围内浮动。 整数 (int)
validationMetricType 用于验证指标的指标计算方法。 “Coco”
“CocoVoc”
“None”
“Voc”
warmupCosineLRCycles 学习速率计划程序为“warmup_cosine”时的余弦周期值。 必须是 [0, 1] 范围内的浮点。 整数 (int)
warmupCosineLRWarmupEpochs 当学习速率计划程序为“warmup_cosine”时,预热时期的值。 必须是正整数。 整数 (int)
weightDecay (权重衰减) 优化器为“zn”、“adam”或“adamw”时的权重衰减值。 必须是范围[0, 1] 中的浮点。 整数 (int)

ImageObjectDetection

名称 DESCRIPTION 价值
limitSettings [必需]限制 AutoML 作业的设置。 ImageLimitSettings (必需)
modelSettings 用于训练模型的设置。 ImageModelSettingsObjectDetection
primaryMetric 要针对此任务进行优化的主要指标。 “MeanAveragePrecision”
搜索空间 用于采样模型及其超参数的不同组合的搜索空间。 ImageModelDistributionSettingsObjectDetection[]
扫描设置 模型扫描和超参数扫描相关设置。 ImageSweepSettings (图像扫描设置)
任务类型 [必需]AutoMLJob 的任务类型。 “ImageObjectDetection”(必需)
validationData (验证数据) 验证数据输入。 MLTableJobInput
validationDataSize 需要留出用于验证的定型数据集的分数。
介于 (0.0、 1.0) 之间的值
未提供验证数据集时应用。
整数 (int)

ImageSweepSettings (图像扫描设置)

名称 DESCRIPTION 价值
early终止 提前终止策略的类型。 提前终止政策
sampling算法 [必需]超参数采样算法的类型。 “贝贝西亚语”
“Grid”
“Random”(必需)

JobBaseProperties

名称 DESCRIPTION 价值
组件 ID 组件资源的 ARM 资源 ID。 字符串
计算 ID 计算资源的 ARM 资源 ID。 字符串
描述 资产说明文本。 字符串
displayName (显示名称) 作业的显示名称。 字符串
实验名称 作业所属的试验的名称。 如果未设置,作业将放置在“默认”试验中。 字符串
标识 标识配置。 如果已设置,则应为 AmlToken、ManagedIdentity、UserIdentity 或 null 之一。
如果为 null,则默认为 AmlToken。
身份配置
isArchived 已存档 资产是否已存档? 布尔
职位类型 设置为 AutoMLJob 类型的“AutoML”。 设置为 CommandJob 类型的“Command”。 设置为 “LabelingJobProperties”类型的“标记”。 设置为 PipelineJob 类型的“Pipeline”。 设置为“ SparkJob”类型的“Spark”。 设置为“ SweepJob”类型。 “AutoML”
“Command”
“标记”
“Pipeline”
“Spark”
“扫描”(必需)
属性 资产属性字典。 ResourceBaseProperties
服务 JobEndpoints 列表。
对于本地作业,作业终结点的终结点值为 FileStreamObject。
JobBase服务
标签 标记字典。 可以添加、删除和更新标记。 ResourceBaseTags

JobBase服务

名称 DESCRIPTION 价值

作业输入

名称 DESCRIPTION 价值
描述 输入的说明。 字符串
jobInputType (作业输入类型) 设置为 CustomModelJobInput 类型的“custom_model”。 设置为 Type LiteralJobInput 的“literal”。 设置为 MLFlowModelJobInput 类型的“mlflow_model”。 设置为 MLTableJobInput 类型的“mltable”。 设置为 TritonModelJobInput 类型的“triton_model”。 设置为 UriFileJobInput 类型的“uri_file”。 设置为 UriFolderJobInput 类型的“uri_folder”。 “custom_model”
“literal”
“mlflow_model”
“mltable”
“triton_model”
“uri_file”
“uri_folder”(必需)

JobOutput (作业输出)

名称 DESCRIPTION 价值
描述 输出的说明。 字符串
jobOutputType 设置为 CustomModelJobOutput 类型的“custom_model”。 设置为 MLFlowModelJobOutput 类型的“mlflow_model”。 设置为 MLTableJobOutput 类型的“mltable”。 设置为 TritonModelJobOutput 类型的“triton_model”。 设置为 UriFileJobOutput 类型的“uri_file”。 设置为 UriFolderJobOutput 类型的“uri_folder”。 “custom_model”
“mlflow_model”
“mltable”
“triton_model”
“uri_file”
“uri_folder”(必需)

JobResourceConfiguration

名称 DESCRIPTION 价值
dockerArgs 要传递给 Docker run 命令的额外参数。 这将替代系统设置的任何参数,或在本部分中。 此参数仅支持 Azure ML 计算类型。 字符串
instanceCount 计算目标使用的实例或节点数可选。 整数 (int)
instanceType 计算目标支持的可选 VM 类型。 字符串
属性 其他属性包。 ResourceConfigurationProperties
shmSize docker 容器的共享内存块的大小。 这应采用 (number)(unit) 格式,其中数字大于 0,单位可以是 b(字节)、k(千字节)、m(兆字节)或 g(GB)。 字符串

约束:
图案 = \d+[bBkKmMgG]

工作服务

名称 DESCRIPTION 价值
终结点 终结点的 URL。 字符串
jobServiceType 终结点类型。 字符串
节点 用户希望启动服务的节点。
如果未将 Nodes 设置为 null,则服务将仅在领导节点上启动。
节点
移植 用户设置的终结点的端口。 整数 (int)
属性 在终结点上设置的其他属性。 JobServiceProperties

JobServiceProperties

名称 DESCRIPTION 价值

标签类别

名称 DESCRIPTION 价值
此类别中标签类的字典。 标签类别类
displayName (显示名称) 标签类别的显示名称。 字符串
multiSelectEnabled 已启用 指示是否允许在此类别中选择多个类。 布尔

标签类别类

名称 DESCRIPTION 价值

标签类

名称 DESCRIPTION 价值
displayName (显示名称) 标签类的显示名称。 字符串
标签类的子类的字典。 LabelClass子类

LabelClass子类

名称 DESCRIPTION 价值

LabelingDataConfiguration

名称 DESCRIPTION 价值
数据 ID 要执行标记的数据资产的资源 ID。 字符串
incrementalDataRefreshEnabled 指示是否启用增量数据刷新。 布尔

LabelingJobImageProperties

名称 DESCRIPTION 价值
annotationType 图像标记作业的批注类型。 “BoundingBox”
“Classification”
“InstanceSegmentation”
mediaType [必需]作业的媒体类型。 “Image”(必需)

TagJobInstructions

名称 DESCRIPTION 价值
URI 指向页面的链接,其中包含标签器的详细标记说明。 字符串

LabelingJobLabel类别

名称 DESCRIPTION 价值

LabelingJobMediaProperties

名称 DESCRIPTION 价值
mediaType 设置为“Image”,类型 为 LabelingJobImageProperties。 对于 LabelingJobTextProperties 类型,设置为“Text”。 “Image”
“Text”(必需)

LabelingJobProperties

名称 DESCRIPTION 价值
dataConfiguration 配置作业中使用的数据。 LabelingDataConfiguration
工作说明 标记作业的说明。 TagJobInstructions
职位类型 [必需]指定作业的类型。 “标记”(必需)
标签类别 作业的标签类别。 LabelingJobLabel类别
labelingJobMediaProperties 作业中的媒体类型特定属性。 LabelingJobMediaProperties
mlAssistConfiguration 在作业中配置 MLAssist 功能。 MLAssistConfiguration

LabelingJobTextProperties

名称 DESCRIPTION 价值
annotationType 文本标记作业的批注类型。 “Classification”
'NamedEntityRecognition' (命名实体识别)
mediaType [必需]作业的媒体类型。 “Text”(必需)

LiteralJobInput (文字作业输入)

名称 DESCRIPTION 价值
jobInputType (作业输入类型) [必需]指定作业的类型。 “literal”(必需)
价值 [必需]输入的文本值。 字符串

约束:
模式 = [a-zA-Z0-9_] (必需)

ManagedIdentity (托管身份)

名称 DESCRIPTION 价值
客户端 ID 按客户端 ID 指定用户分配的标识。 对于系统分配,请不要设置此字段。 字符串

约束:
最小长度 = 36
最大长度 = 36
图案 = ^[0-9a-fA-F]{8}-([0-9a-fA-F]{4}-){3}[0-9a-fA-F]{12}$
身份类型 [必需]指定标识框架的类型。 “Managed”(必需)
对象 ID 按对象 ID 指定用户分配的标识。 对于系统分配,请不要设置此字段。 字符串

约束:
最小长度 = 36
最大长度 = 36
图案 = ^[0-9a-fA-F]{8}-([0-9a-fA-F]{4}-){3}[0-9a-fA-F]{12}$
资源ID 按 ARM 资源 ID 指定用户分配的标识。 对于系统分配,请不要设置此字段。 字符串

MedianStoppingPolicy (中值停止策略)

名称 DESCRIPTION 价值
policyType [必需]策略配置的名称 “MedianStopping”(必需)

MLAssistConfiguration

名称 DESCRIPTION 价值
mlAssist 设置为 MLAssistConfigurationDisabled 类型的“Disabled”。 设置为 MLAssistConfigurationEnabled 类型的“Enabled”。 “Disabled”
“Enabled”(必需)

MLAssistConfigurationDisabled

名称 DESCRIPTION 价值
mlAssist [必需]指示是否启用 MLAssist 功能。 “Disabled”(必需)

MLAssistConfiguration已启用

名称 DESCRIPTION 价值
inferencingComputeBinding [必需]推理中使用的 AML 计算绑定。 字符串

约束:
模式 = [a-zA-Z0-9_] (必需)
mlAssist [必需]指示是否启用 MLAssist 功能。 “Enabled”(必需)
trainingComputeBinding 的 [必需]训练中使用的 AML 计算绑定。 字符串

约束:
模式 = [a-zA-Z0-9_] (必需)

MLFlowModelJobInput

名称 DESCRIPTION 价值
jobInputType (作业输入类型) [必需]指定作业的类型。 “mlflow_model”(必需)
模式 输入资产传送模式。 “Direct”
“下载”
“EvalDownload”
“EvalMount”
“ReadOnlyMount”
“ReadWriteMount”
URI [必需]输入资产 URI。 字符串

约束:
模式 = [a-zA-Z0-9_] (必需)

MLFlowModelJobInput

名称 DESCRIPTION 价值
描述 输入的说明。 字符串
jobInputType (作业输入类型) [必需]指定作业的类型。 “custom_model”
“literal”
“mlflow_model”
“mltable”
“triton_model”
“uri_file”
“uri_folder”(必需)
模式 输入资产传送模式。 “Direct”
“下载”
“EvalDownload”
“EvalMount”
“ReadOnlyMount”
“ReadWriteMount”
URI [必需]输入资产 URI。 字符串

约束:
模式 = [a-zA-Z0-9_] (必需)

MLFlowModelJobOutput

名称 DESCRIPTION 价值
jobOutputType [必需]指定作业的类型。 “mlflow_model”(必需)
模式 输出资产传送模式。 “Direct”
“ReadWriteMount”
“Upload”
URI 输出资产 URI。 字符串

MLTableJobInput

名称 DESCRIPTION 价值
描述 输入的说明。 字符串
jobInputType (作业输入类型) [必需]指定作业的类型。 “custom_model”
“literal”
“mlflow_model”
“mltable”
“triton_model”
“uri_file”
“uri_folder”(必需)
模式 输入资产传送模式。 “Direct”
“下载”
“EvalDownload”
“EvalMount”
“ReadOnlyMount”
“ReadWriteMount”
URI [必需]输入资产 URI。 字符串

约束:
模式 = [a-zA-Z0-9_] (必需)

MLTableJobInput

名称 DESCRIPTION 价值
jobInputType (作业输入类型) [必需]指定作业的类型。 “mltable”(必需)
模式 输入资产传送模式。 “Direct”
“下载”
“EvalDownload”
“EvalMount”
“ReadOnlyMount”
“ReadWriteMount”
URI [必需]输入资产 URI。 字符串

约束:
模式 = [a-zA-Z0-9_] (必需)

MLTableJobOutput

名称 DESCRIPTION 价值
jobOutputType [必需]指定作业的类型。 “mltable”(必需)
模式 输出资产传送模式。 “Direct”
“ReadWriteMount”
“Upload”
URI 输出资产 URI。 字符串

MPI

名称 DESCRIPTION 价值
distributionType [必需]指定分发框架的类型。 “Mpi”(必需)
processCountPerInstance 每个 MPI 节点的进程数。 整数 (int)

NCross验证

名称 DESCRIPTION 价值
模式 对于 AutoNCrossValidations 类型,设置为“自动”。 设置为 CustomNCrossValidations 类型的“Custom”。 “Auto”
“Custom”(必需)

NlpFixedParameters

名称 DESCRIPTION 价值
梯度累积步骤 在运行向后传递之前累积渐变的步骤数。 整数 (int)
learningRate 训练过程的学习速率。 整数 (int)
learningRateScheduler 的 训练过程中要使用的学习速率计划的类型。 “Constant”
“ConstantWithWarmup”
“余弦”
“CosineWithRestarts”
“Linear”
“None”
“多项式”
模型名称 要训练的模型的名称。 字符串
纪元数 训练纪元数。 整数 (int)
trainingBatchSize 训练过程的批大小。 整数 (int)
validationBatchSize 要在评估期间使用的批大小。 整数 (int)
warmupRatio 与 LrSchedulerType 一起使用的预热比率。 整数 (int)
weightDecay (权重衰减) 训练过程的重量衰减。 整数 (int)

NlpParameterSubspace

名称 DESCRIPTION 价值
梯度累积步骤 在运行向后传递之前累积渐变的步骤数。 字符串
learningRate 训练过程的学习速率。 字符串
learningRateScheduler 的 训练过程中要使用的学习速率计划的类型。 字符串
模型名称 要训练的模型的名称。 字符串
纪元数 训练纪元数。 字符串
trainingBatchSize 训练过程的批大小。 字符串
validationBatchSize 要在评估期间使用的批大小。 字符串
warmupRatio 与 LrSchedulerType 一起使用的预热比率。 字符串
weightDecay (权重衰减) 训练过程的重量衰减。 字符串

NlpSweepSettings

名称 DESCRIPTION 价值
early终止 扫描作业的提前终止策略的类型。 提前终止政策
sampling算法 [必需]采样算法的类型。 “贝贝西亚语”
“Grid”
“Random”(必需)

NlpVerticalFeaturizationSettings

名称 DESCRIPTION 价值
datasetLanguage 数据集语言,适用于文本数据。 字符串

NlpVerticalLimitSettings

名称 DESCRIPTION 价值
maxConcurrentTrials 最大并发 AutoML 迭代次数。 整数 (int)
最大节点数 用于在任何单个试用版中训练的最大节点数。 控制多节点分布式训练。 整数 (int)
maxTrials AutoML 迭代数。 整数 (int)
超时 AutoML 作业超时。 字符串
trialTimeout (试用超时) 单个 HD 试用版的超时。 字符串

节点

名称 DESCRIPTION 价值
nodesValueType 对于 AllNodes 类型,设置为“All”。 “全部”(必需)

目的

名称 DESCRIPTION 价值
目标 [必需]定义超参数优化支持的指标目标 “最大化”
“最小化”(必需)
primaryMetric [必需]要优化的指标的名称。 字符串

约束:
模式 = [a-zA-Z0-9_] (必需)

管道作业

名称 DESCRIPTION 价值
输入 管道作业的输入。 管道作业输入
工作 作业构造管道作业。 PipelineJobJob 作业
职位类型 [必需]指定作业的类型。 “Pipeline”(必需)
输出 管道作业的输出 PipelineJobOutputs
设置 管道设置,例如 ContinueRunOnStepFailure 等。 任何
源作业 ID 源作业的 ARM 资源 ID。 字符串

管道作业输入

名称 DESCRIPTION 价值

PipelineJobJob 作业

名称 DESCRIPTION 价值

PipelineJobOutputs

名称 DESCRIPTION 价值

PyTorch

名称 DESCRIPTION 价值
distributionType [必需]指定分发框架的类型。 “PyTorch”(必需)
processCountPerInstance 每个节点的进程数。 整数 (int)

RandomSamplingAlgorithm 算法

名称 DESCRIPTION 价值
规则 随机算法的特定类型 “Random”
“Sobol”
采样算法类型 [必需]用于生成超参数值的算法以及配置属性 “Random”(必需)
种子 用作随机数生成的种子的可选整数 整数 (int)

回归

名称 DESCRIPTION 价值
cvSplitColumnNames 用于 CVSplit 数据的列。 字符串[]
featurizationSettings AutoML 作业所需的特征化输入。 TableVerticalFeaturizationSettings
固定参数 在整个训练过程中将保持不变的模型/训练参数。 TableFixedParameters (表固定参数)
limitSettings AutoMLJob 的执行约束。 TableVerticalLimitSettings
nCrossValidations 要应用于训练数据集的交叉验证折叠数
如果未提供验证数据集,则为 。
NCross验证
primaryMetric 回归任务的主要指标。 “NormalizedMeanAbsoluteError”
“NormalizedRootMeanSquaredError”
“R2Score”
'SpearmanCorrelation'
搜索空间 用于采样模型及其超参数的不同组合的搜索空间。 TableParameterSubspace[]
扫描设置 模型扫描和超参数优化的设置。 TableSweepSettings (表格扫描设置)
任务类型 [必需]AutoMLJob 的任务类型。 “回归”(必需)
测试数据 测试数据输入。 MLTableJobInput
testDataSize 需要为验证目的预留的测试数据集的分数。
介于 (0.0、 1.0) 之间的值
未提供验证数据集时应用。
整数 (int)
trainingSettings AutoML 作业训练阶段的输入。 回归训练设置
validationData (验证数据) 验证数据输入。 MLTableJobInput
validationDataSize 需要留出用于验证的定型数据集的分数。
介于 (0.0、 1.0) 之间的值
未提供验证数据集时应用。
整数 (int)
权重列名称 示例权重列的名称。 自动化 ML 支持加权列作为输入,导致数据中的行向上或向下加权。 字符串

回归训练设置

名称 DESCRIPTION 价值
allowedTrainingAlgorithms 回归任务的允许模型。 包含任一项的字符串数组:
“DecisionTree”
“ElasticNet”
“ExtremeRandomTrees”
“GradientBoosting”
“KNN”
“LassoLars”
“LightGBM”
“RandomForest”
“ZN”
“XGBoostRegressor”
blockedTrainingAlgorithms 回归任务的阻止模型。 包含任一项的字符串数组:
“DecisionTree”
“ElasticNet”
“ExtremeRandomTrees”
“GradientBoosting”
“KNN”
“LassoLars”
“LightGBM”
“RandomForest”
“ZN”
“XGBoostRegressor”
enableDnnTraining 启用 DNN 模型的建议。 布尔
enableModelExplainability 标志以在最佳模型上启用可解释性。 布尔
enableOnnxCompatibleModels 用于启用 onnx 兼容模型的标志。 布尔
enableStackEnsemble 启用堆栈合奏运行。 布尔
enableVoteEnsemble 启用投票合奏运行。 布尔
ensembleModelDownloadTimeout 在 VotingEnsemble 和 StackEnsemble 模型生成期间,将下载先前子运行中的多个拟合模型。
如果需要更多时间,请将此参数配置为大于 300 秒的值。
字符串
stackEnsembleSettings 堆栈合奏的堆栈合奏设置。 StackEnsembleSettings

ResourceBaseProperties

名称 DESCRIPTION 价值

ResourceBaseTags

名称 DESCRIPTION 价值

ResourceConfigurationProperties

名称 DESCRIPTION 价值

采样算法

名称 DESCRIPTION 价值
采样算法类型 设置为 “Bayesian”类型的 BayesianSamplingAlgorithm。 设置为 GridSamplingAlgorithm 类型的“Grid”。 设置为 RandomSamplingAlgorithm 类型的“Random”。 “贝贝西亚语”
“Grid”
“Random”(必需)

季节性

名称 DESCRIPTION 价值
模式 设置为“ AutoSeasonality”类型为“自动”。 设置为“ CustomSeasonality”类型。 “Auto”
“Custom”(必需)

SparkJob

名称 DESCRIPTION 价值
档案 存档作业中使用的文件。 字符串[]
参数 作业的参数。 字符串
代码 Id [必需]代码资产的 ARM 资源 ID。 字符串

约束:
模式 = [a-zA-Z0-9_] (必需)
会议 Spark 配置的属性。 SparkJobConf 函数
输入 [必需]在启动作业时要执行的条目。 SparkJobEntry (必需)
环境 ID 作业的环境规范的 ARM 资源 ID。 字符串
文件 作业中使用的文件。 字符串[]
输入 作业中使用的输入数据绑定的映射。 SparkJobInputs
罐子 作业中使用的 Jar 文件。 字符串[]
职位类型 [必需]指定作业的类型。 “Spark”(必需)
输出 作业中使用的输出数据绑定的映射。 SparkJob输出
py文件 作业中使用的 Python 文件。 字符串[]
资源 作业的计算资源配置。 SparkResourceConfiguration

SparkJobConf 函数

名称 DESCRIPTION 价值

SparkJobEntry

名称 DESCRIPTION 价值
sparkJobEntryType 设置为 SparkJobPythonEntry 类型的“SparkJobPythonEntry”。 设置为“ SparkJobScalaEntry”类型的“SparkJobScalaEntry”。 “SparkJobPythonEntry”
“SparkJobScalaEntry”(必需)

SparkJobInputs

名称 DESCRIPTION 价值

SparkJob输出

名称 DESCRIPTION 价值

SparkJobPython条目

名称 DESCRIPTION 价值
文件 [必需]作业入口点的相对 python 文件路径。 字符串

约束:
最小长度 = 1
模式 = [a-zA-Z0-9_] (必需)
sparkJobEntryType [必需]作业入口点的类型。 “SparkJobPythonEntry”(必需)

SparkJobScalaEntry

名称 DESCRIPTION 价值
类名 [必需]用作入口点的 Scala 类名称。 字符串

约束:
最小长度 = 1
模式 = [a-zA-Z0-9_] (必需)
sparkJobEntryType [必需]作业入口点的类型。 “SparkJobScalaEntry”(必需)

SparkResourceConfiguration

名称 DESCRIPTION 价值
instanceType 计算目标支持的可选 VM 类型。 字符串
runtimeVersion (运行时版本) 用于作业的 spark 运行时的版本。 字符串

StackEnsembleSettings

名称 DESCRIPTION 价值
stackMetaLearnerKWargs 要传递给元学习器初始值设定项的可选参数。 任何
stackMetaLearnerTrainPercentage 指定要保留用于训练元学习者的训练集(选择训练和训练类型的训练)的比例。 默认值为 0.2。 整数 (int)
stackMetaLearnerType 元学习器是在单个异类模型的输出上训练的模型。 “ElasticNet”
“ElasticNetCV”
“LightGBMClassifier”
“LightGBMRegressor”
“LinearRegression”
“LogisticRegression”
“LogisticRegressionCV”
“None”

SweepJob (扫描作业)

名称 DESCRIPTION 价值
early终止 提前终止策略可在完成之前取消性能不佳的运行 提前终止政策
输入 作业中使用的输入数据绑定的映射。 SweepJobInputs
职位类型 [必需]指定作业的类型。 “扫描”(必需)
限制 扫描作业限制。 SweepJobLimits (扫描作业限制)
目的 [必需]优化目标。 目标 (必需)
输出 作业中使用的输出数据绑定的映射。 SweepJobOutputs (扫描作业输出)
sampling算法 [必需]超参数采样算法 SamplingAlgorithm (必需)
搜索空间 [必需]包含每个参数及其分布的字典。 字典键是参数的名称 任何(必需)
试用 [必需]试用组件定义。 TrialComponent (必需)

SweepJobInputs

名称 DESCRIPTION 价值

SweepJobLimits (扫描作业限制)

名称 DESCRIPTION 价值
jobLimits类型 [必需]JobLimit 类型。 “Command”
“扫描”(必需)
maxConcurrentTrials 扫描作业最大并发试用版。 整数 (int)
maxTotalTrials 扫描作业最大总试用版数。 整数 (int)
超时 ISO 8601 格式的最大运行持续时间,之后作业将被取消。 仅支持精度为秒的持续时间。 字符串
trialTimeout (试用超时) 扫描作业试用超时值。 字符串

SweepJobOutputs (扫描作业输出)

名称 DESCRIPTION 价值

TableFixedParameters (表固定参数)

名称 DESCRIPTION 价值
助 推 器 指定提升类型,例如 XGBoost 的 gbdt。 字符串
boosting类型 指定提升类型,例如 LightGBM 的 gbdt。 字符串
增长策略 指定增长策略,该策略控制新节点添加到树的方式。 字符串
learningRate 训练过程的学习速率。 整数 (int)
最大 Bin 指定存储桶连续功能的最大离散箱数。 整数 (int)
最大深度 指定显式限制树深度的最大深度。 整数 (int)
最大叶数 指定显式限制树叶的最大叶数。 整数 (int)
minDataInLeaf 的 每个叶的最小数据数。 整数 (int)
minSplitGain 最小分度增益 在树的叶节点上进行进一步分区所需的最小损失减少。 整数 (int)
模型名称 要训练的模型的名称。 字符串
nEstimator 指定模型中的树数(或舍入)。 整数 (int)
叶数 指定叶数。 整数 (int)
preprocessorName 要使用的预处理器的名称。 字符串
regAlpha 权重的 L1 正则化术语。 整数 (int)
regLambda L2 权重的正则化术语。 整数 (int)
子样本 训练实例的子采样比率。 整数 (int)
subsampleFreq 子采样的频率。 整数 (int)
treeMethod 指定树方法。 字符串
withMean 如果为 true,在使用 StandardScalar 缩放数据之前居中。 布尔
withStd 如果为 true,请使用 StandardScalar 缩放具有单位方差的数据。 布尔

TableParameterSubspace

名称 DESCRIPTION 价值
助 推 器 指定提升类型,例如 XGBoost 的 gbdt。 字符串
boosting类型 指定提升类型,例如 LightGBM 的 gbdt。 字符串
增长策略 指定增长策略,该策略控制新节点添加到树的方式。 字符串
learningRate 训练过程的学习速率。 字符串
最大 Bin 指定存储桶连续功能的最大离散箱数。 字符串
最大深度 指定显式限制树深度的最大深度。 字符串
最大叶数 指定显式限制树叶的最大叶数。 字符串
minDataInLeaf 的 每个叶的最小数据数。 字符串
minSplitGain 最小分度增益 在树的叶节点上进行进一步分区所需的最小损失减少。 字符串
模型名称 要训练的模型的名称。 字符串
nEstimator 指定模型中的树数(或舍入)。 字符串
叶数 指定叶数。 字符串
preprocessorName 要使用的预处理器的名称。 字符串
regAlpha 权重的 L1 正则化术语。 字符串
regLambda L2 权重的正则化术语。 字符串
子样本 训练实例的子采样比率。 字符串
subsampleFreq 子采样的频率 字符串
treeMethod 指定树方法。 字符串
withMean 如果为 true,在使用 StandardScalar 缩放数据之前居中。 字符串
withStd 如果为 true,请使用 StandardScalar 缩放具有单位方差的数据。 字符串

TableSweepSettings (表格扫描设置)

名称 DESCRIPTION 价值
early终止 扫描作业的提前终止策略的类型。 提前终止政策
sampling算法 [必需]采样算法的类型。 “贝贝西亚语”
“Grid”
“Random”(必需)

TableVerticalFeaturizationSettings

名称 DESCRIPTION 价值
阻塞变压器 这些转换器不应用于特征化。 包含任一项的字符串数组:
“CatTargetEncoder”
“CountVectorizer”
“HashOneHotEncoder”
“LabelEncoder”
“NaiveBayes”
“OneHotEncoder”
“TextTargetEncoder”
“TfIdf”
“WoETargetEncoder”
“WordEmbedding”
columnNameAnd类型 列名及其类型(int、float、string、datetime 等)的字典。 TableVerticalFeaturizationSettingsColumnNameAndTypes
datasetLanguage 数据集语言,适用于文本数据。 字符串
enableDnnFeaturization 确定是否使用基于 Dnn 的特征化器进行数据特征化。 布尔
模式 特征化模式 - 用户可以保留默认的“自动”模式,AutoML 将负责在特征化阶段对数据进行必要的转换。
如果选择了“关闭”,则不会完成特征化。
如果选择“自定义”,则用户可以指定其他输入以自定义特征化完成方式。
“Auto”
“Custom”
“关闭”
transformer参数 用户可以指定要用于的其他转换器以及要向其应用它的列以及转换器构造函数的参数。 TableVerticalFeaturizationSettingsTransformerParams

TableVerticalFeaturizationSettingsColumnNameAndTypes

名称 DESCRIPTION 价值

TableVerticalFeaturizationSettingsTransformerParams

名称 DESCRIPTION 价值

TableVerticalLimitSettings

名称 DESCRIPTION 价值
enableEarlyTermination 启用提前终止,确定如果最近 20 次迭代中没有分数改进,AutoMLJob 是否会提前终止。 布尔
退出评分 AutoML 作业的退出分数。 整数 (int)
maxConcurrentTrials 最大并发迭代数。 整数 (int)
maxCoresPerTrial 每次迭代的最大核心数。 整数 (int)
maxTrials 迭代数。 整数 (int)
sweepConcurrentTrials 用户想要触发的并发扫描运行数。 整数 (int)
sweepTrials 用户想要触发的扫描运行数。 整数 (int)
超时 AutoML 作业超时。 字符串
trialTimeout (试用超时) 迭代超时。 字符串

目标滞后

名称 DESCRIPTION 价值
模式 对于 AutoTargetLags 类型,设置为“自动”。 设置为 CustomTargetLags 类型的“Custom”。 “Auto”
“Custom”(必需)

TargetRollingWindowSize

名称 DESCRIPTION 价值
模式 设置为“ AutoTargetRollingWindowSize”类型的“自动”。 设置为 CustomTargetRollingWindowSize 类型的“Custom”。 “Auto”
“Custom”(必需)

TensorFlow

名称 DESCRIPTION 价值
distributionType [必需]指定分发框架的类型。 “TensorFlow”(必需)
parameterServerCount 参数服务器任务数。 整数 (int)
workerCount 工人计数 工人数。 如果未指定,则默认为实例计数。 整数 (int)

文本分类

名称 DESCRIPTION 价值
featurizationSettings AutoML 作业所需的特征化输入。 NlpVerticalFeaturizationSettings
固定参数 在整个训练过程中将保持不变的模型/训练参数。 NlpFixedParameters
limitSettings AutoMLJob 的执行约束。 NlpVerticalLimitSettings
primaryMetric Text-Classification 任务的主要指标。 “准确性”
“AUCWeighted”
“AveragePrecisionScoreWeighted”
“NormMacroRecall”
“PrecisionScoreWeighted”
搜索空间 用于采样模型及其超参数的不同组合的搜索空间。 NlpParameterSubspace[]
扫描设置 模型扫描和超参数优化的设置。 NlpSweepSettings
任务类型 [必需]AutoMLJob 的任务类型。 “TextClassification”(必需)
validationData (验证数据) 验证数据输入。 MLTableJobInput

TextClassificationMultilabel

名称 DESCRIPTION 价值
featurizationSettings AutoML 作业所需的特征化输入。 NlpVerticalFeaturizationSettings
固定参数 在整个训练过程中将保持不变的模型/训练参数。 NlpFixedParameters
limitSettings AutoMLJob 的执行约束。 NlpVerticalLimitSettings
搜索空间 用于采样模型及其超参数的不同组合的搜索空间。 NlpParameterSubspace[]
扫描设置 模型扫描和超参数优化的设置。 NlpSweepSettings
任务类型 [必需]AutoMLJob 的任务类型。 “TextClassificationMultilabel”(必需)
validationData (验证数据) 验证数据输入。 MLTableJobInput

TextNer (文本生成器)

名称 DESCRIPTION 价值
featurizationSettings AutoML 作业所需的特征化输入。 NlpVerticalFeaturizationSettings
固定参数 在整个训练过程中将保持不变的模型/训练参数。 NlpFixedParameters
limitSettings AutoMLJob 的执行约束。 NlpVerticalLimitSettings
搜索空间 用于采样模型及其超参数的不同组合的搜索空间。 NlpParameterSubspace[]
扫描设置 模型扫描和超参数优化的设置。 NlpSweepSettings
任务类型 [必需]AutoMLJob 的任务类型。 “TextNER”(必需)
validationData (验证数据) 验证数据输入。 MLTableJobInput

TrialComponent (试用组件)

名称 DESCRIPTION 价值
代码 Id 代码资产的 ARM 资源 ID。 字符串
指令 [必需]在启动作业时执行的命令。 例如 “python train.py” 字符串

约束:
最小长度 = 1
模式 = [a-zA-Z0-9_] (必需)
分配 作业的分发配置。 如果已设置,则应为 Mpi、Tensorflow、PyTorch 或 null 之一。 分发配置
环境 ID [必需]作业的环境规范的 ARM 资源 ID。 字符串

约束:
模式 = [a-zA-Z0-9_] (必需)
环境变量 作业中包含的环境变量。 TrialComponentEnvironmentVariables
资源 作业的计算资源配置。 JobResourceConfiguration

TrialComponentEnvironmentVariables

名称 DESCRIPTION 价值

TritonModelJobInput

名称 DESCRIPTION 价值
jobInputType (作业输入类型) [必需]指定作业的类型。 “triton_model”(必需)
模式 输入资产传送模式。 “Direct”
“下载”
“EvalDownload”
“EvalMount”
“ReadOnlyMount”
“ReadWriteMount”
URI [必需]输入资产 URI。 字符串

约束:
模式 = [a-zA-Z0-9_] (必需)

TritonModelJobOutput

名称 DESCRIPTION 价值
jobOutputType [必需]指定作业的类型。 “triton_model”(必需)
模式 输出资产传送模式。 “Direct”
“ReadWriteMount”
“Upload”
URI 输出资产 URI。 字符串

截断选择策略

名称 DESCRIPTION 价值
policyType [必需]策略配置的名称 “TruncationSelection”(必需)
截断百分比 要在每个评估间隔取消的运行百分比。 整数 (int)

UriFileJobInput

名称 DESCRIPTION 价值
jobInputType (作业输入类型) [必需]指定作业的类型。 “uri_file”(必需)
模式 输入资产传送模式。 “Direct”
“下载”
“EvalDownload”
“EvalMount”
“ReadOnlyMount”
“ReadWriteMount”
URI [必需]输入资产 URI。 字符串

约束:
模式 = [a-zA-Z0-9_] (必需)

UriFileJobOutput

名称 DESCRIPTION 价值
jobOutputType [必需]指定作业的类型。 “uri_file”(必需)
模式 输出资产传送模式。 “Direct”
“ReadWriteMount”
“Upload”
URI 输出资产 URI。 字符串

UriFolderJobInput

名称 DESCRIPTION 价值
jobInputType (作业输入类型) [必需]指定作业的类型。 “uri_folder”(必需)
模式 输入资产传送模式。 “Direct”
“下载”
“EvalDownload”
“EvalMount”
“ReadOnlyMount”
“ReadWriteMount”
URI [必需]输入资产 URI。 字符串

约束:
模式 = [a-zA-Z0-9_] (必需)

UriFolderJobOutput

名称 DESCRIPTION 价值
jobOutputType [必需]指定作业的类型。 “uri_folder”(必需)
模式 输出资产传送模式。 “Direct”
“ReadWriteMount”
“Upload”
URI 输出资产 URI。 字符串

用户身份

名称 DESCRIPTION 价值
身份类型 [必需]指定标识框架的类型。 “UserIdentity”(必需)

用法示例

Azure 快速入门示例

以下 Azure 快速入门模板 包含用于部署此资源类型的 Bicep 示例。

Bicep 文件 DESCRIPTION
创建 Azure 机器学习 AutoML 分类作业 此模板创建一个 Azure 机器学习 AutoML 分类作业,以找出用于预测客户是否会与金融机构订阅固定期存款的最佳模型。
创建 Azure 机器学习命令作业 此模板使用基本hello_world脚本创建 Azure 机器学习命令作业
创建 Azure 机器学习扫描作业 此模板创建用于超参数优化的 Azure 机器学习扫描作业。

ARM 模板资源定义

可以使用目标作部署工作区/作业资源类型:

有关每个 API 版本中已更改属性的列表,请参阅 更改日志

资源格式

若要创建 Microsoft.MachineLearningServices/workspaces/jobs 资源,请将以下 JSON 添加到模板。

{
  "type": "Microsoft.MachineLearningServices/workspaces/jobs",
  "apiVersion": "2022-10-01-preview",
  "name": "string",
  "properties": {
    "componentId": "string",
    "computeId": "string",
    "description": "string",
    "displayName": "string",
    "experimentName": "string",
    "identity": {
      "identityType": "string"
      // For remaining properties, see IdentityConfiguration objects
    },
    "isArchived": "bool",
    "properties": {
      "{customized property}": "string"
    },
    "services": {
      "{customized property}": {
        "endpoint": "string",
        "jobServiceType": "string",
        "nodes": {
          "nodesValueType": "string"
          // For remaining properties, see Nodes objects
        },
        "port": "int",
        "properties": {
          "{customized property}": "string"
        }
      }
    },
    "tags": {
      "{customized property}": "string"
    },
    "jobType": "string"
    // For remaining properties, see JobBaseProperties objects
  }
}

季节性对象

设置 模式 属性以指定对象的类型。

对于 自动,请使用:

{
  "mode": "Auto"
}

对于 “自定义”,请使用:

{
  "mode": "Custom",
  "value": "int"
}

ForecastHorizon 对象

设置 模式 属性以指定对象的类型。

对于 自动,请使用:

{
  "mode": "Auto"
}

对于 “自定义”,请使用:

{
  "mode": "Custom",
  "value": "int"
}

JobOutput 对象

设置 jobOutputType 属性以指定对象的类型。

对于 custom_model,请使用:

{
  "jobOutputType": "custom_model",
  "mode": "string",
  "uri": "string"
}

对于 mlflow_model,请使用:

{
  "jobOutputType": "mlflow_model",
  "mode": "string",
  "uri": "string"
}

对于 mltable,请使用:

{
  "jobOutputType": "mltable",
  "mode": "string",
  "uri": "string"
}

对于 triton_model,请使用:

{
  "jobOutputType": "triton_model",
  "mode": "string",
  "uri": "string"
}

对于 uri_file,请使用:

{
  "jobOutputType": "uri_file",
  "mode": "string",
  "uri": "string"
}

对于 uri_folder,请使用:

{
  "jobOutputType": "uri_folder",
  "mode": "string",
  "uri": "string"
}

IdentityConfiguration 对象

设置 identityType 属性以指定对象的类型。

对于 AMLToken,请使用:

{
  "identityType": "AMLToken"
}

对于 托管,请使用:

{
  "clientId": "string",
  "identityType": "Managed",
  "objectId": "string",
  "resourceId": "string"
}

对于 UserIdentity,请使用:

{
  "identityType": "UserIdentity"
}

DistributionConfiguration 对象

设置 distributionType 属性以指定对象的类型。

对于 Mpi,请使用:

{
  "distributionType": "Mpi",
  "processCountPerInstance": "int"
}

对于 PyTorch,请使用:

{
  "distributionType": "PyTorch",
  "processCountPerInstance": "int"
}

对于 TensorFlow,请使用:

{
  "distributionType": "TensorFlow",
  "parameterServerCount": "int",
  "workerCount": "int"
}

MLAssistConfiguration 对象

设置 mlAssist 属性以指定对象的类型。

对于 禁用,请使用:

{
  "mlAssist": "Disabled"
}

对于 “已启用”,请使用:

{
  "inferencingComputeBinding": "string",
  "mlAssist": "Enabled",
  "trainingComputeBinding": "string"
}

EarlyTerminationPolicy 对象

设置 policyType 属性以指定对象的类型。

对于 Bandit,请使用:

{
  "policyType": "Bandit",
  "slackAmount": "int",
  "slackFactor": "int"
}

对于 MedianStopping,请使用:

{
  "policyType": "MedianStopping"
}

对于 TruncationSelection,请使用:

{
  "policyType": "TruncationSelection",
  "truncationPercentage": "int"
}

TargetRollingWindowSize 对象

设置 模式 属性以指定对象的类型。

对于 自动,请使用:

{
  "mode": "Auto"
}

对于 “自定义”,请使用:

{
  "mode": "Custom",
  "value": "int"
}

SparkJobEntry 对象

设置 sparkJobEntryType 属性以指定对象的类型。

对于 SparkJobPythonEntry,请使用:

{
  "file": "string",
  "sparkJobEntryType": "SparkJobPythonEntry"
}

对于 SparkJobScalaEntry,请使用:

{
  "className": "string",
  "sparkJobEntryType": "SparkJobScalaEntry"
}

AutoMLVertical 对象

设置 taskType 属性以指定对象的类型。

对于 分类,请使用:

{
  "cvSplitColumnNames": [ "string" ],
  "featurizationSettings": {
    "blockedTransformers": [ "string" ],
    "columnNameAndTypes": {
      "{customized property}": "string"
    },
    "datasetLanguage": "string",
    "enableDnnFeaturization": "bool",
    "mode": "string",
    "transformerParams": {
      "{customized property}": [
        {
          "fields": [ "string" ],
          "parameters": {}
        }
      ]
    }
  },
  "fixedParameters": {
    "booster": "string",
    "boostingType": "string",
    "growPolicy": "string",
    "learningRate": "int",
    "maxBin": "int",
    "maxDepth": "int",
    "maxLeaves": "int",
    "minDataInLeaf": "int",
    "minSplitGain": "int",
    "modelName": "string",
    "nEstimators": "int",
    "numLeaves": "int",
    "preprocessorName": "string",
    "regAlpha": "int",
    "regLambda": "int",
    "subsample": "int",
    "subsampleFreq": "int",
    "treeMethod": "string",
    "withMean": "bool",
    "withStd": "bool"
  },
  "limitSettings": {
    "enableEarlyTermination": "bool",
    "exitScore": "int",
    "maxConcurrentTrials": "int",
    "maxCoresPerTrial": "int",
    "maxTrials": "int",
    "sweepConcurrentTrials": "int",
    "sweepTrials": "int",
    "timeout": "string",
    "trialTimeout": "string"
  },
  "nCrossValidations": {
    "mode": "string"
    // For remaining properties, see NCrossValidations objects
  },
  "positiveLabel": "string",
  "primaryMetric": "string",
  "searchSpace": [
    {
      "booster": "string",
      "boostingType": "string",
      "growPolicy": "string",
      "learningRate": "string",
      "maxBin": "string",
      "maxDepth": "string",
      "maxLeaves": "string",
      "minDataInLeaf": "string",
      "minSplitGain": "string",
      "modelName": "string",
      "nEstimators": "string",
      "numLeaves": "string",
      "preprocessorName": "string",
      "regAlpha": "string",
      "regLambda": "string",
      "subsample": "string",
      "subsampleFreq": "string",
      "treeMethod": "string",
      "withMean": "string",
      "withStd": "string"
    }
  ],
  "sweepSettings": {
    "earlyTermination": {
      "delayEvaluation": "int",
      "evaluationInterval": "int",
      "policyType": "string"
      // For remaining properties, see EarlyTerminationPolicy objects
    },
    "samplingAlgorithm": "string"
  },
  "taskType": "Classification",
  "testData": {
    "description": "string",
    "jobInputType": "string",
    "mode": "string",
    "uri": "string"
  },
  "testDataSize": "int",
  "trainingSettings": {
    "allowedTrainingAlgorithms": [ "string" ],
    "blockedTrainingAlgorithms": [ "string" ],
    "enableDnnTraining": "bool",
    "enableModelExplainability": "bool",
    "enableOnnxCompatibleModels": "bool",
    "enableStackEnsemble": "bool",
    "enableVoteEnsemble": "bool",
    "ensembleModelDownloadTimeout": "string",
    "stackEnsembleSettings": {
      "stackMetaLearnerKWargs": {},
      "stackMetaLearnerTrainPercentage": "int",
      "stackMetaLearnerType": "string"
    }
  },
  "validationData": {
    "description": "string",
    "jobInputType": "string",
    "mode": "string",
    "uri": "string"
  },
  "validationDataSize": "int",
  "weightColumnName": "string"
}

对于 预测,请使用:

{
  "cvSplitColumnNames": [ "string" ],
  "featurizationSettings": {
    "blockedTransformers": [ "string" ],
    "columnNameAndTypes": {
      "{customized property}": "string"
    },
    "datasetLanguage": "string",
    "enableDnnFeaturization": "bool",
    "mode": "string",
    "transformerParams": {
      "{customized property}": [
        {
          "fields": [ "string" ],
          "parameters": {}
        }
      ]
    }
  },
  "fixedParameters": {
    "booster": "string",
    "boostingType": "string",
    "growPolicy": "string",
    "learningRate": "int",
    "maxBin": "int",
    "maxDepth": "int",
    "maxLeaves": "int",
    "minDataInLeaf": "int",
    "minSplitGain": "int",
    "modelName": "string",
    "nEstimators": "int",
    "numLeaves": "int",
    "preprocessorName": "string",
    "regAlpha": "int",
    "regLambda": "int",
    "subsample": "int",
    "subsampleFreq": "int",
    "treeMethod": "string",
    "withMean": "bool",
    "withStd": "bool"
  },
  "forecastingSettings": {
    "countryOrRegionForHolidays": "string",
    "cvStepSize": "int",
    "featureLags": "string",
    "forecastHorizon": {
      "mode": "string"
      // For remaining properties, see ForecastHorizon objects
    },
    "frequency": "string",
    "seasonality": {
      "mode": "string"
      // For remaining properties, see Seasonality objects
    },
    "shortSeriesHandlingConfig": "string",
    "targetAggregateFunction": "string",
    "targetLags": {
      "mode": "string"
      // For remaining properties, see TargetLags objects
    },
    "targetRollingWindowSize": {
      "mode": "string"
      // For remaining properties, see TargetRollingWindowSize objects
    },
    "timeColumnName": "string",
    "timeSeriesIdColumnNames": [ "string" ],
    "useStl": "string"
  },
  "limitSettings": {
    "enableEarlyTermination": "bool",
    "exitScore": "int",
    "maxConcurrentTrials": "int",
    "maxCoresPerTrial": "int",
    "maxTrials": "int",
    "sweepConcurrentTrials": "int",
    "sweepTrials": "int",
    "timeout": "string",
    "trialTimeout": "string"
  },
  "nCrossValidations": {
    "mode": "string"
    // For remaining properties, see NCrossValidations objects
  },
  "primaryMetric": "string",
  "searchSpace": [
    {
      "booster": "string",
      "boostingType": "string",
      "growPolicy": "string",
      "learningRate": "string",
      "maxBin": "string",
      "maxDepth": "string",
      "maxLeaves": "string",
      "minDataInLeaf": "string",
      "minSplitGain": "string",
      "modelName": "string",
      "nEstimators": "string",
      "numLeaves": "string",
      "preprocessorName": "string",
      "regAlpha": "string",
      "regLambda": "string",
      "subsample": "string",
      "subsampleFreq": "string",
      "treeMethod": "string",
      "withMean": "string",
      "withStd": "string"
    }
  ],
  "sweepSettings": {
    "earlyTermination": {
      "delayEvaluation": "int",
      "evaluationInterval": "int",
      "policyType": "string"
      // For remaining properties, see EarlyTerminationPolicy objects
    },
    "samplingAlgorithm": "string"
  },
  "taskType": "Forecasting",
  "testData": {
    "description": "string",
    "jobInputType": "string",
    "mode": "string",
    "uri": "string"
  },
  "testDataSize": "int",
  "trainingSettings": {
    "allowedTrainingAlgorithms": [ "string" ],
    "blockedTrainingAlgorithms": [ "string" ],
    "enableDnnTraining": "bool",
    "enableModelExplainability": "bool",
    "enableOnnxCompatibleModels": "bool",
    "enableStackEnsemble": "bool",
    "enableVoteEnsemble": "bool",
    "ensembleModelDownloadTimeout": "string",
    "stackEnsembleSettings": {
      "stackMetaLearnerKWargs": {},
      "stackMetaLearnerTrainPercentage": "int",
      "stackMetaLearnerType": "string"
    }
  },
  "validationData": {
    "description": "string",
    "jobInputType": "string",
    "mode": "string",
    "uri": "string"
  },
  "validationDataSize": "int",
  "weightColumnName": "string"
}

对于 ImageClassification,请使用:

{
  "limitSettings": {
    "maxConcurrentTrials": "int",
    "maxTrials": "int",
    "timeout": "string"
  },
  "modelSettings": {
    "advancedSettings": "string",
    "amsGradient": "bool",
    "augmentations": "string",
    "beta1": "int",
    "beta2": "int",
    "checkpointFrequency": "int",
    "checkpointModel": {
      "description": "string",
      "jobInputType": "string",
      "mode": "string",
      "uri": "string"
    },
    "checkpointRunId": "string",
    "distributed": "bool",
    "earlyStopping": "bool",
    "earlyStoppingDelay": "int",
    "earlyStoppingPatience": "int",
    "enableOnnxNormalization": "bool",
    "evaluationFrequency": "int",
    "gradientAccumulationStep": "int",
    "layersToFreeze": "int",
    "learningRate": "int",
    "learningRateScheduler": "string",
    "modelName": "string",
    "momentum": "int",
    "nesterov": "bool",
    "numberOfEpochs": "int",
    "numberOfWorkers": "int",
    "optimizer": "string",
    "randomSeed": "int",
    "stepLRGamma": "int",
    "stepLRStepSize": "int",
    "trainingBatchSize": "int",
    "trainingCropSize": "int",
    "validationBatchSize": "int",
    "validationCropSize": "int",
    "validationResizeSize": "int",
    "warmupCosineLRCycles": "int",
    "warmupCosineLRWarmupEpochs": "int",
    "weightDecay": "int",
    "weightedLoss": "int"
  },
  "primaryMetric": "string",
  "searchSpace": [
    {
      "amsGradient": "string",
      "augmentations": "string",
      "beta1": "string",
      "beta2": "string",
      "distributed": "string",
      "earlyStopping": "string",
      "earlyStoppingDelay": "string",
      "earlyStoppingPatience": "string",
      "enableOnnxNormalization": "string",
      "evaluationFrequency": "string",
      "gradientAccumulationStep": "string",
      "layersToFreeze": "string",
      "learningRate": "string",
      "learningRateScheduler": "string",
      "modelName": "string",
      "momentum": "string",
      "nesterov": "string",
      "numberOfEpochs": "string",
      "numberOfWorkers": "string",
      "optimizer": "string",
      "randomSeed": "string",
      "stepLRGamma": "string",
      "stepLRStepSize": "string",
      "trainingBatchSize": "string",
      "trainingCropSize": "string",
      "validationBatchSize": "string",
      "validationCropSize": "string",
      "validationResizeSize": "string",
      "warmupCosineLRCycles": "string",
      "warmupCosineLRWarmupEpochs": "string",
      "weightDecay": "string",
      "weightedLoss": "string"
    }
  ],
  "sweepSettings": {
    "earlyTermination": {
      "delayEvaluation": "int",
      "evaluationInterval": "int",
      "policyType": "string"
      // For remaining properties, see EarlyTerminationPolicy objects
    },
    "samplingAlgorithm": "string"
  },
  "taskType": "ImageClassification",
  "validationData": {
    "description": "string",
    "jobInputType": "string",
    "mode": "string",
    "uri": "string"
  },
  "validationDataSize": "int"
}

对于 ImageClassificationMultilabel,请使用:

{
  "limitSettings": {
    "maxConcurrentTrials": "int",
    "maxTrials": "int",
    "timeout": "string"
  },
  "modelSettings": {
    "advancedSettings": "string",
    "amsGradient": "bool",
    "augmentations": "string",
    "beta1": "int",
    "beta2": "int",
    "checkpointFrequency": "int",
    "checkpointModel": {
      "description": "string",
      "jobInputType": "string",
      "mode": "string",
      "uri": "string"
    },
    "checkpointRunId": "string",
    "distributed": "bool",
    "earlyStopping": "bool",
    "earlyStoppingDelay": "int",
    "earlyStoppingPatience": "int",
    "enableOnnxNormalization": "bool",
    "evaluationFrequency": "int",
    "gradientAccumulationStep": "int",
    "layersToFreeze": "int",
    "learningRate": "int",
    "learningRateScheduler": "string",
    "modelName": "string",
    "momentum": "int",
    "nesterov": "bool",
    "numberOfEpochs": "int",
    "numberOfWorkers": "int",
    "optimizer": "string",
    "randomSeed": "int",
    "stepLRGamma": "int",
    "stepLRStepSize": "int",
    "trainingBatchSize": "int",
    "trainingCropSize": "int",
    "validationBatchSize": "int",
    "validationCropSize": "int",
    "validationResizeSize": "int",
    "warmupCosineLRCycles": "int",
    "warmupCosineLRWarmupEpochs": "int",
    "weightDecay": "int",
    "weightedLoss": "int"
  },
  "primaryMetric": "string",
  "searchSpace": [
    {
      "amsGradient": "string",
      "augmentations": "string",
      "beta1": "string",
      "beta2": "string",
      "distributed": "string",
      "earlyStopping": "string",
      "earlyStoppingDelay": "string",
      "earlyStoppingPatience": "string",
      "enableOnnxNormalization": "string",
      "evaluationFrequency": "string",
      "gradientAccumulationStep": "string",
      "layersToFreeze": "string",
      "learningRate": "string",
      "learningRateScheduler": "string",
      "modelName": "string",
      "momentum": "string",
      "nesterov": "string",
      "numberOfEpochs": "string",
      "numberOfWorkers": "string",
      "optimizer": "string",
      "randomSeed": "string",
      "stepLRGamma": "string",
      "stepLRStepSize": "string",
      "trainingBatchSize": "string",
      "trainingCropSize": "string",
      "validationBatchSize": "string",
      "validationCropSize": "string",
      "validationResizeSize": "string",
      "warmupCosineLRCycles": "string",
      "warmupCosineLRWarmupEpochs": "string",
      "weightDecay": "string",
      "weightedLoss": "string"
    }
  ],
  "sweepSettings": {
    "earlyTermination": {
      "delayEvaluation": "int",
      "evaluationInterval": "int",
      "policyType": "string"
      // For remaining properties, see EarlyTerminationPolicy objects
    },
    "samplingAlgorithm": "string"
  },
  "taskType": "ImageClassificationMultilabel",
  "validationData": {
    "description": "string",
    "jobInputType": "string",
    "mode": "string",
    "uri": "string"
  },
  "validationDataSize": "int"
}

对于 ImageInstanceSegmentation,请使用:

{
  "limitSettings": {
    "maxConcurrentTrials": "int",
    "maxTrials": "int",
    "timeout": "string"
  },
  "modelSettings": {
    "advancedSettings": "string",
    "amsGradient": "bool",
    "augmentations": "string",
    "beta1": "int",
    "beta2": "int",
    "boxDetectionsPerImage": "int",
    "boxScoreThreshold": "int",
    "checkpointFrequency": "int",
    "checkpointModel": {
      "description": "string",
      "jobInputType": "string",
      "mode": "string",
      "uri": "string"
    },
    "checkpointRunId": "string",
    "distributed": "bool",
    "earlyStopping": "bool",
    "earlyStoppingDelay": "int",
    "earlyStoppingPatience": "int",
    "enableOnnxNormalization": "bool",
    "evaluationFrequency": "int",
    "gradientAccumulationStep": "int",
    "imageSize": "int",
    "layersToFreeze": "int",
    "learningRate": "int",
    "learningRateScheduler": "string",
    "maxSize": "int",
    "minSize": "int",
    "modelName": "string",
    "modelSize": "string",
    "momentum": "int",
    "multiScale": "bool",
    "nesterov": "bool",
    "nmsIouThreshold": "int",
    "numberOfEpochs": "int",
    "numberOfWorkers": "int",
    "optimizer": "string",
    "randomSeed": "int",
    "stepLRGamma": "int",
    "stepLRStepSize": "int",
    "tileGridSize": "string",
    "tileOverlapRatio": "int",
    "tilePredictionsNmsThreshold": "int",
    "trainingBatchSize": "int",
    "validationBatchSize": "int",
    "validationIouThreshold": "int",
    "validationMetricType": "string",
    "warmupCosineLRCycles": "int",
    "warmupCosineLRWarmupEpochs": "int",
    "weightDecay": "int"
  },
  "primaryMetric": "string",
  "searchSpace": [
    {
      "amsGradient": "string",
      "augmentations": "string",
      "beta1": "string",
      "beta2": "string",
      "boxDetectionsPerImage": "string",
      "boxScoreThreshold": "string",
      "distributed": "string",
      "earlyStopping": "string",
      "earlyStoppingDelay": "string",
      "earlyStoppingPatience": "string",
      "enableOnnxNormalization": "string",
      "evaluationFrequency": "string",
      "gradientAccumulationStep": "string",
      "imageSize": "string",
      "layersToFreeze": "string",
      "learningRate": "string",
      "learningRateScheduler": "string",
      "maxSize": "string",
      "minSize": "string",
      "modelName": "string",
      "modelSize": "string",
      "momentum": "string",
      "multiScale": "string",
      "nesterov": "string",
      "nmsIouThreshold": "string",
      "numberOfEpochs": "string",
      "numberOfWorkers": "string",
      "optimizer": "string",
      "randomSeed": "string",
      "stepLRGamma": "string",
      "stepLRStepSize": "string",
      "tileGridSize": "string",
      "tileOverlapRatio": "string",
      "tilePredictionsNmsThreshold": "string",
      "trainingBatchSize": "string",
      "validationBatchSize": "string",
      "validationIouThreshold": "string",
      "validationMetricType": "string",
      "warmupCosineLRCycles": "string",
      "warmupCosineLRWarmupEpochs": "string",
      "weightDecay": "string"
    }
  ],
  "sweepSettings": {
    "earlyTermination": {
      "delayEvaluation": "int",
      "evaluationInterval": "int",
      "policyType": "string"
      // For remaining properties, see EarlyTerminationPolicy objects
    },
    "samplingAlgorithm": "string"
  },
  "taskType": "ImageInstanceSegmentation",
  "validationData": {
    "description": "string",
    "jobInputType": "string",
    "mode": "string",
    "uri": "string"
  },
  "validationDataSize": "int"
}

对于 ImageObjectDetection,请使用:

{
  "limitSettings": {
    "maxConcurrentTrials": "int",
    "maxTrials": "int",
    "timeout": "string"
  },
  "modelSettings": {
    "advancedSettings": "string",
    "amsGradient": "bool",
    "augmentations": "string",
    "beta1": "int",
    "beta2": "int",
    "boxDetectionsPerImage": "int",
    "boxScoreThreshold": "int",
    "checkpointFrequency": "int",
    "checkpointModel": {
      "description": "string",
      "jobInputType": "string",
      "mode": "string",
      "uri": "string"
    },
    "checkpointRunId": "string",
    "distributed": "bool",
    "earlyStopping": "bool",
    "earlyStoppingDelay": "int",
    "earlyStoppingPatience": "int",
    "enableOnnxNormalization": "bool",
    "evaluationFrequency": "int",
    "gradientAccumulationStep": "int",
    "imageSize": "int",
    "layersToFreeze": "int",
    "learningRate": "int",
    "learningRateScheduler": "string",
    "maxSize": "int",
    "minSize": "int",
    "modelName": "string",
    "modelSize": "string",
    "momentum": "int",
    "multiScale": "bool",
    "nesterov": "bool",
    "nmsIouThreshold": "int",
    "numberOfEpochs": "int",
    "numberOfWorkers": "int",
    "optimizer": "string",
    "randomSeed": "int",
    "stepLRGamma": "int",
    "stepLRStepSize": "int",
    "tileGridSize": "string",
    "tileOverlapRatio": "int",
    "tilePredictionsNmsThreshold": "int",
    "trainingBatchSize": "int",
    "validationBatchSize": "int",
    "validationIouThreshold": "int",
    "validationMetricType": "string",
    "warmupCosineLRCycles": "int",
    "warmupCosineLRWarmupEpochs": "int",
    "weightDecay": "int"
  },
  "primaryMetric": "string",
  "searchSpace": [
    {
      "amsGradient": "string",
      "augmentations": "string",
      "beta1": "string",
      "beta2": "string",
      "boxDetectionsPerImage": "string",
      "boxScoreThreshold": "string",
      "distributed": "string",
      "earlyStopping": "string",
      "earlyStoppingDelay": "string",
      "earlyStoppingPatience": "string",
      "enableOnnxNormalization": "string",
      "evaluationFrequency": "string",
      "gradientAccumulationStep": "string",
      "imageSize": "string",
      "layersToFreeze": "string",
      "learningRate": "string",
      "learningRateScheduler": "string",
      "maxSize": "string",
      "minSize": "string",
      "modelName": "string",
      "modelSize": "string",
      "momentum": "string",
      "multiScale": "string",
      "nesterov": "string",
      "nmsIouThreshold": "string",
      "numberOfEpochs": "string",
      "numberOfWorkers": "string",
      "optimizer": "string",
      "randomSeed": "string",
      "stepLRGamma": "string",
      "stepLRStepSize": "string",
      "tileGridSize": "string",
      "tileOverlapRatio": "string",
      "tilePredictionsNmsThreshold": "string",
      "trainingBatchSize": "string",
      "validationBatchSize": "string",
      "validationIouThreshold": "string",
      "validationMetricType": "string",
      "warmupCosineLRCycles": "string",
      "warmupCosineLRWarmupEpochs": "string",
      "weightDecay": "string"
    }
  ],
  "sweepSettings": {
    "earlyTermination": {
      "delayEvaluation": "int",
      "evaluationInterval": "int",
      "policyType": "string"
      // For remaining properties, see EarlyTerminationPolicy objects
    },
    "samplingAlgorithm": "string"
  },
  "taskType": "ImageObjectDetection",
  "validationData": {
    "description": "string",
    "jobInputType": "string",
    "mode": "string",
    "uri": "string"
  },
  "validationDataSize": "int"
}

对于 回归,请使用:

{
  "cvSplitColumnNames": [ "string" ],
  "featurizationSettings": {
    "blockedTransformers": [ "string" ],
    "columnNameAndTypes": {
      "{customized property}": "string"
    },
    "datasetLanguage": "string",
    "enableDnnFeaturization": "bool",
    "mode": "string",
    "transformerParams": {
      "{customized property}": [
        {
          "fields": [ "string" ],
          "parameters": {}
        }
      ]
    }
  },
  "fixedParameters": {
    "booster": "string",
    "boostingType": "string",
    "growPolicy": "string",
    "learningRate": "int",
    "maxBin": "int",
    "maxDepth": "int",
    "maxLeaves": "int",
    "minDataInLeaf": "int",
    "minSplitGain": "int",
    "modelName": "string",
    "nEstimators": "int",
    "numLeaves": "int",
    "preprocessorName": "string",
    "regAlpha": "int",
    "regLambda": "int",
    "subsample": "int",
    "subsampleFreq": "int",
    "treeMethod": "string",
    "withMean": "bool",
    "withStd": "bool"
  },
  "limitSettings": {
    "enableEarlyTermination": "bool",
    "exitScore": "int",
    "maxConcurrentTrials": "int",
    "maxCoresPerTrial": "int",
    "maxTrials": "int",
    "sweepConcurrentTrials": "int",
    "sweepTrials": "int",
    "timeout": "string",
    "trialTimeout": "string"
  },
  "nCrossValidations": {
    "mode": "string"
    // For remaining properties, see NCrossValidations objects
  },
  "primaryMetric": "string",
  "searchSpace": [
    {
      "booster": "string",
      "boostingType": "string",
      "growPolicy": "string",
      "learningRate": "string",
      "maxBin": "string",
      "maxDepth": "string",
      "maxLeaves": "string",
      "minDataInLeaf": "string",
      "minSplitGain": "string",
      "modelName": "string",
      "nEstimators": "string",
      "numLeaves": "string",
      "preprocessorName": "string",
      "regAlpha": "string",
      "regLambda": "string",
      "subsample": "string",
      "subsampleFreq": "string",
      "treeMethod": "string",
      "withMean": "string",
      "withStd": "string"
    }
  ],
  "sweepSettings": {
    "earlyTermination": {
      "delayEvaluation": "int",
      "evaluationInterval": "int",
      "policyType": "string"
      // For remaining properties, see EarlyTerminationPolicy objects
    },
    "samplingAlgorithm": "string"
  },
  "taskType": "Regression",
  "testData": {
    "description": "string",
    "jobInputType": "string",
    "mode": "string",
    "uri": "string"
  },
  "testDataSize": "int",
  "trainingSettings": {
    "allowedTrainingAlgorithms": [ "string" ],
    "blockedTrainingAlgorithms": [ "string" ],
    "enableDnnTraining": "bool",
    "enableModelExplainability": "bool",
    "enableOnnxCompatibleModels": "bool",
    "enableStackEnsemble": "bool",
    "enableVoteEnsemble": "bool",
    "ensembleModelDownloadTimeout": "string",
    "stackEnsembleSettings": {
      "stackMetaLearnerKWargs": {},
      "stackMetaLearnerTrainPercentage": "int",
      "stackMetaLearnerType": "string"
    }
  },
  "validationData": {
    "description": "string",
    "jobInputType": "string",
    "mode": "string",
    "uri": "string"
  },
  "validationDataSize": "int",
  "weightColumnName": "string"
}

对于 TextClassification,请使用:

{
  "featurizationSettings": {
    "datasetLanguage": "string"
  },
  "fixedParameters": {
    "gradientAccumulationSteps": "int",
    "learningRate": "int",
    "learningRateScheduler": "string",
    "modelName": "string",
    "numberOfEpochs": "int",
    "trainingBatchSize": "int",
    "validationBatchSize": "int",
    "warmupRatio": "int",
    "weightDecay": "int"
  },
  "limitSettings": {
    "maxConcurrentTrials": "int",
    "maxNodes": "int",
    "maxTrials": "int",
    "timeout": "string",
    "trialTimeout": "string"
  },
  "primaryMetric": "string",
  "searchSpace": [
    {
      "gradientAccumulationSteps": "string",
      "learningRate": "string",
      "learningRateScheduler": "string",
      "modelName": "string",
      "numberOfEpochs": "string",
      "trainingBatchSize": "string",
      "validationBatchSize": "string",
      "warmupRatio": "string",
      "weightDecay": "string"
    }
  ],
  "sweepSettings": {
    "earlyTermination": {
      "delayEvaluation": "int",
      "evaluationInterval": "int",
      "policyType": "string"
      // For remaining properties, see EarlyTerminationPolicy objects
    },
    "samplingAlgorithm": "string"
  },
  "taskType": "TextClassification",
  "validationData": {
    "description": "string",
    "jobInputType": "string",
    "mode": "string",
    "uri": "string"
  }
}

对于 TextClassificationMultilabel,请使用:

{
  "featurizationSettings": {
    "datasetLanguage": "string"
  },
  "fixedParameters": {
    "gradientAccumulationSteps": "int",
    "learningRate": "int",
    "learningRateScheduler": "string",
    "modelName": "string",
    "numberOfEpochs": "int",
    "trainingBatchSize": "int",
    "validationBatchSize": "int",
    "warmupRatio": "int",
    "weightDecay": "int"
  },
  "limitSettings": {
    "maxConcurrentTrials": "int",
    "maxNodes": "int",
    "maxTrials": "int",
    "timeout": "string",
    "trialTimeout": "string"
  },
  "searchSpace": [
    {
      "gradientAccumulationSteps": "string",
      "learningRate": "string",
      "learningRateScheduler": "string",
      "modelName": "string",
      "numberOfEpochs": "string",
      "trainingBatchSize": "string",
      "validationBatchSize": "string",
      "warmupRatio": "string",
      "weightDecay": "string"
    }
  ],
  "sweepSettings": {
    "earlyTermination": {
      "delayEvaluation": "int",
      "evaluationInterval": "int",
      "policyType": "string"
      // For remaining properties, see EarlyTerminationPolicy objects
    },
    "samplingAlgorithm": "string"
  },
  "taskType": "TextClassificationMultilabel",
  "validationData": {
    "description": "string",
    "jobInputType": "string",
    "mode": "string",
    "uri": "string"
  }
}

对于 TextNER,请使用:

{
  "featurizationSettings": {
    "datasetLanguage": "string"
  },
  "fixedParameters": {
    "gradientAccumulationSteps": "int",
    "learningRate": "int",
    "learningRateScheduler": "string",
    "modelName": "string",
    "numberOfEpochs": "int",
    "trainingBatchSize": "int",
    "validationBatchSize": "int",
    "warmupRatio": "int",
    "weightDecay": "int"
  },
  "limitSettings": {
    "maxConcurrentTrials": "int",
    "maxNodes": "int",
    "maxTrials": "int",
    "timeout": "string",
    "trialTimeout": "string"
  },
  "searchSpace": [
    {
      "gradientAccumulationSteps": "string",
      "learningRate": "string",
      "learningRateScheduler": "string",
      "modelName": "string",
      "numberOfEpochs": "string",
      "trainingBatchSize": "string",
      "validationBatchSize": "string",
      "warmupRatio": "string",
      "weightDecay": "string"
    }
  ],
  "sweepSettings": {
    "earlyTermination": {
      "delayEvaluation": "int",
      "evaluationInterval": "int",
      "policyType": "string"
      // For remaining properties, see EarlyTerminationPolicy objects
    },
    "samplingAlgorithm": "string"
  },
  "taskType": "TextNER",
  "validationData": {
    "description": "string",
    "jobInputType": "string",
    "mode": "string",
    "uri": "string"
  }
}

TargetLags 对象

设置 模式 属性以指定对象的类型。

对于 自动,请使用:

{
  "mode": "Auto"
}

对于 “自定义”,请使用:

{
  "mode": "Custom",
  "values": [ "int" ]
}

LabelingJobMediaProperties 对象

设置 mediaType 属性以指定对象的类型。

对于 映像,请使用:

{
  "annotationType": "string",
  "mediaType": "Image"
}

对于 文本,请使用:

{
  "annotationType": "string",
  "mediaType": "Text"
}

JobInput 对象

设置 jobInputType 属性以指定对象的类型。

对于 custom_model,请使用:

{
  "jobInputType": "custom_model",
  "mode": "string",
  "uri": "string"
}

对于 文本,请使用:

{
  "jobInputType": "literal",
  "value": "string"
}

对于 mlflow_model,请使用:

{
  "jobInputType": "mlflow_model",
  "mode": "string",
  "uri": "string"
}

对于 mltable,请使用:

{
  "jobInputType": "mltable",
  "mode": "string",
  "uri": "string"
}

对于 triton_model,请使用:

{
  "jobInputType": "triton_model",
  "mode": "string",
  "uri": "string"
}

对于 uri_file,请使用:

{
  "jobInputType": "uri_file",
  "mode": "string",
  "uri": "string"
}

对于 uri_folder,请使用:

{
  "jobInputType": "uri_folder",
  "mode": "string",
  "uri": "string"
}

JobBaseProperties 对象

设置 jobType 属性以指定对象的类型。

对于 AutoML,请使用:

{
  "environmentId": "string",
  "environmentVariables": {
    "{customized property}": "string"
  },
  "jobType": "AutoML",
  "outputs": {
    "{customized property}": {
      "description": "string",
      "jobOutputType": "string"
      // For remaining properties, see JobOutput objects
    }
  },
  "resources": {
    "dockerArgs": "string",
    "instanceCount": "int",
    "instanceType": "string",
    "properties": {
      "{customized property}": {}
    },
    "shmSize": "string"
  },
  "taskDetails": {
    "logVerbosity": "string",
    "targetColumnName": "string",
    "trainingData": {
      "description": "string",
      "jobInputType": "string",
      "mode": "string",
      "uri": "string"
    },
    "taskType": "string"
    // For remaining properties, see AutoMLVertical objects
  }
}

对于 命令,请使用:

{
  "autologgerSettings": {
    "mlflowAutologger": "string"
  },
  "codeId": "string",
  "command": "string",
  "distribution": {
    "distributionType": "string"
    // For remaining properties, see DistributionConfiguration objects
  },
  "environmentId": "string",
  "environmentVariables": {
    "{customized property}": "string"
  },
  "inputs": {
    "{customized property}": {
      "description": "string",
      "jobInputType": "string"
      // For remaining properties, see JobInput objects
    }
  },
  "jobType": "Command",
  "limits": {
    "jobLimitsType": "string",
    "timeout": "string"
  },
  "outputs": {
    "{customized property}": {
      "description": "string",
      "jobOutputType": "string"
      // For remaining properties, see JobOutput objects
    }
  },
  "resources": {
    "dockerArgs": "string",
    "instanceCount": "int",
    "instanceType": "string",
    "properties": {
      "{customized property}": {}
    },
    "shmSize": "string"
  }
}

对于 标记,请使用:

{
  "dataConfiguration": {
    "dataId": "string",
    "incrementalDataRefreshEnabled": "bool"
  },
  "jobInstructions": {
    "uri": "string"
  },
  "jobType": "Labeling",
  "labelCategories": {
    "{customized property}": {
      "classes": {
        "{customized property}": {
          "displayName": "string",
          "subclasses": {
            "{customized property}": ...
          }
        }
      },
      "displayName": "string",
      "multiSelectEnabled": "bool"
    }
  },
  "labelingJobMediaProperties": {
    "mediaType": "string"
    // For remaining properties, see LabelingJobMediaProperties objects
  },
  "mlAssistConfiguration": {
    "mlAssist": "string"
    // For remaining properties, see MLAssistConfiguration objects
  }
}

对于 管道,请使用:

{
  "inputs": {
    "{customized property}": {
      "description": "string",
      "jobInputType": "string"
      // For remaining properties, see JobInput objects
    }
  },
  "jobs": {
    "{customized property}": {}
  },
  "jobType": "Pipeline",
  "outputs": {
    "{customized property}": {
      "description": "string",
      "jobOutputType": "string"
      // For remaining properties, see JobOutput objects
    }
  },
  "settings": {},
  "sourceJobId": "string"
}

对于 Spark,请使用:

{
  "archives": [ "string" ],
  "args": "string",
  "codeId": "string",
  "conf": {
    "{customized property}": "string"
  },
  "entry": {
    "sparkJobEntryType": "string"
    // For remaining properties, see SparkJobEntry objects
  },
  "environmentId": "string",
  "files": [ "string" ],
  "inputs": {
    "{customized property}": {
      "description": "string",
      "jobInputType": "string"
      // For remaining properties, see JobInput objects
    }
  },
  "jars": [ "string" ],
  "jobType": "Spark",
  "outputs": {
    "{customized property}": {
      "description": "string",
      "jobOutputType": "string"
      // For remaining properties, see JobOutput objects
    }
  },
  "pyFiles": [ "string" ],
  "resources": {
    "instanceType": "string",
    "runtimeVersion": "string"
  }
}

对于 扫描,请使用:

{
  "earlyTermination": {
    "delayEvaluation": "int",
    "evaluationInterval": "int",
    "policyType": "string"
    // For remaining properties, see EarlyTerminationPolicy objects
  },
  "inputs": {
    "{customized property}": {
      "description": "string",
      "jobInputType": "string"
      // For remaining properties, see JobInput objects
    }
  },
  "jobType": "Sweep",
  "limits": {
    "jobLimitsType": "string",
    "maxConcurrentTrials": "int",
    "maxTotalTrials": "int",
    "timeout": "string",
    "trialTimeout": "string"
  },
  "objective": {
    "goal": "string",
    "primaryMetric": "string"
  },
  "outputs": {
    "{customized property}": {
      "description": "string",
      "jobOutputType": "string"
      // For remaining properties, see JobOutput objects
    }
  },
  "samplingAlgorithm": {
    "samplingAlgorithmType": "string"
    // For remaining properties, see SamplingAlgorithm objects
  },
  "searchSpace": {},
  "trial": {
    "codeId": "string",
    "command": "string",
    "distribution": {
      "distributionType": "string"
      // For remaining properties, see DistributionConfiguration objects
    },
    "environmentId": "string",
    "environmentVariables": {
      "{customized property}": "string"
    },
    "resources": {
      "dockerArgs": "string",
      "instanceCount": "int",
      "instanceType": "string",
      "properties": {
        "{customized property}": {}
      },
      "shmSize": "string"
    }
  }
}

节点对象

设置 nodesValueType 属性以指定对象的类型。

对于 “全部”,请使用:

{
  "nodesValueType": "All"
}

SamplingAlgorithm 对象

设置 samplingAlgorithmType 属性以指定对象的类型。

对于 Bayesian,请使用:

{
  "samplingAlgorithmType": "Bayesian"
}

对于 网格,请使用:

{
  "samplingAlgorithmType": "Grid"
}

对于 Random,请使用:

{
  "rule": "string",
  "samplingAlgorithmType": "Random",
  "seed": "int"
}

NCrossValidations 对象

设置 模式 属性以指定对象的类型。

对于 自动,请使用:

{
  "mode": "Auto"
}

对于 “自定义”,请使用:

{
  "mode": "Custom",
  "value": "int"
}

属性值

Microsoft.MachineLearningServices/workspaces/jobs

名称 DESCRIPTION 价值
apiVersion API 版本 “2022-10-01-预览”
姓名 资源名称 字符串

约束:
模式 = ^[a-zA-Z0-9][a-zA-Z0-9\-_]{0,254}$ (必需)
属性 [必需]实体的其他属性。 JobBaseProperties (必需)
类型 资源类型 “Microsoft.MachineLearningServices/workspaces/jobs”

所有节点

名称 DESCRIPTION 价值
nodesValueType [必需]Nodes 值的类型 “全部”(必需)

AmlToken

名称 DESCRIPTION 价值
身份类型 [必需]指定标识框架的类型。 “AMLToken”(必需)

自动预测地平线

名称 DESCRIPTION 价值
模式 [必需]设置预测地平线值选择模式。 “Auto”(必需)

Autologger 设置

名称 DESCRIPTION 价值
mlflow自动记录器 [必需]指示是否启用 mlflow 自动记录器。 “Disabled”
“Enabled”(必需)

AutoMLJob

名称 DESCRIPTION 价值
环境 ID 作业的环境规范的 ARM 资源 ID。
这是一个可选值,如果未提供,AutoML 将在运行作业时将其默认为生产 AutoML 特选环境版本。
字符串
环境变量 作业中包含的环境变量。 AutoMLJobEnvironmentVariables
职位类型 [必需]指定作业的类型。 “AutoML”(必需)
输出 作业中使用的输出数据绑定的映射。 AutoMLJob 输出
资源 作业的计算资源配置。 JobResourceConfiguration
taskDetails [必需]这表示可以是表/NLP/Image 之一的方案 AutoMLVertical (必需)

AutoMLJobEnvironmentVariables

名称 DESCRIPTION 价值

AutoMLJob 输出

名称 DESCRIPTION 价值

AutoMLVertical

名称 DESCRIPTION 价值
logVerbosity (对数详细程度) 作业的详细记录。 “Critical”
“Debug”
“Error”
“Info”
“NotSet”
“Warning”
targetColumnName 目标列名称:这是预测值列。
也称为分类任务的上下文中的标签列名称。
字符串
任务类型 设置为类型 “分类”的“分类”。 设置为“ 预测”类型。 设置为 ImageClassification 类型的“ImageClassification”。 设置为 ImageClassificationMultilabel 类型的“ImageClassificationMultilabel”。 设置为 ImageInstanceSegmentation 类型的“ImageInstanceSegmentation”。 设置为 ImageObjectDetection 类型的“ImageObjectDetection”。 设置为“ 回归”类型。 设置为 TextClassification 类型的“TextClassification”。 对于 TextClassificationMultilabel,设置为“TextClassificationMultilabel”。 设置为 TextNer 类型的“TextNER”。 “Classification”
“预测”
“ImageClassification”
“ImageClassificationMultilabel”
“ImageInstanceSegmentation”
“ImageObjectDetection”
“回归”
“TextClassification”
“TextClassificationMultilabel”
“TextNER”(必需)
trainingData (训练数据) [必需]训练数据输入。 MLTableJobInput (必需)

AutoNCross验证

名称 DESCRIPTION 价值
模式 [必需]用于确定 N 交叉验证的模式。 “Auto”(必需)

自动季节性

名称 DESCRIPTION 价值
模式 [必需]季节性模式。 “Auto”(必需)

AutoTargetLags 自动目标滞后

名称 DESCRIPTION 价值
模式 [必需]设置目标滞后模式 - 自动/自定义 “Auto”(必需)

AutoTargetRollingWindowSize (自动目标滚动窗口大小)

名称 DESCRIPTION 价值
模式 [必需]TargetRollingWindowSiz 检测模式。 “Auto”(必需)

BanditPolicy (强盗政策)

名称 DESCRIPTION 价值
policyType [必需]策略配置的名称 “强盗”(必需)
slackAmount 从性能最佳的运行中允许的绝对距离。 整数 (int)
slackFactor 的 与性能最佳的运行距离的允许距离比率。 整数 (int)

BayesianSamplingAlgorithm

名称 DESCRIPTION 价值
采样算法类型 [必需]用于生成超参数值的算法以及配置属性 “贝伊西亚”(必需)

分类

名称 DESCRIPTION 价值
cvSplitColumnNames 用于 CVSplit 数据的列。 字符串[]
featurizationSettings AutoML 作业所需的特征化输入。 TableVerticalFeaturizationSettings
固定参数 在整个训练过程中将保持不变的模型/训练参数。 TableFixedParameters (表固定参数)
limitSettings AutoMLJob 的执行约束。 TableVerticalLimitSettings
nCrossValidations 要应用于训练数据集的交叉验证折叠数
如果未提供验证数据集,则为 。
NCross验证
积极标签 二进制指标计算的正标签。 字符串
primaryMetric 任务的主要指标。 “准确性”
“AUCWeighted”
“AveragePrecisionScoreWeighted”
“NormMacroRecall”
“PrecisionScoreWeighted”
搜索空间 用于采样模型及其超参数的不同组合的搜索空间。 TableParameterSubspace[]
扫描设置 模型扫描和超参数优化的设置。 TableSweepSettings (表格扫描设置)
任务类型 [必需]AutoMLJob 的任务类型。 “分类”(必需)
测试数据 测试数据输入。 MLTableJobInput
testDataSize 需要为验证目的预留的测试数据集的分数。
介于 (0.0、 1.0) 之间的值
未提供验证数据集时应用。
整数 (int)
trainingSettings AutoML 作业训练阶段的输入。 分类训练设置
validationData (验证数据) 验证数据输入。 MLTableJobInput
validationDataSize 需要留出用于验证的定型数据集的分数。
介于 (0.0、 1.0) 之间的值
未提供验证数据集时应用。
整数 (int)
权重列名称 示例权重列的名称。 自动化 ML 支持加权列作为输入,导致数据中的行向上或向下加权。 字符串

分类训练设置

名称 DESCRIPTION 价值
allowedTrainingAlgorithms 分类任务的允许模型。 包含任一项的字符串数组:
“BernoulliNaiveBayes”
“DecisionTree”
“ExtremeRandomTrees”
“GradientBoosting”
“KNN”
“LightGBM”
“LinearSVM”
“LogisticRegression”
“MultinomialNaiveBayes”
“RandomForest”
“ZN”
“SVM”
“XGBoostClassifier”
blockedTrainingAlgorithms 分类任务的阻止模型。 包含任一项的字符串数组:
“BernoulliNaiveBayes”
“DecisionTree”
“ExtremeRandomTrees”
“GradientBoosting”
“KNN”
“LightGBM”
“LinearSVM”
“LogisticRegression”
“MultinomialNaiveBayes”
“RandomForest”
“ZN”
“SVM”
“XGBoostClassifier”
enableDnnTraining 启用 DNN 模型的建议。 布尔
enableModelExplainability 标志以在最佳模型上启用可解释性。 布尔
enableOnnxCompatibleModels 用于启用 onnx 兼容模型的标志。 布尔
enableStackEnsemble 启用堆栈合奏运行。 布尔
enableVoteEnsemble 启用投票合奏运行。 布尔
ensembleModelDownloadTimeout 在 VotingEnsemble 和 StackEnsemble 模型生成期间,将下载先前子运行中的多个拟合模型。
如果需要更多时间,请将此参数配置为大于 300 秒的值。
字符串
stackEnsembleSettings 堆栈合奏的堆栈合奏设置。 StackEnsembleSettings

ColumnTransformer (列变换器)

名称 DESCRIPTION 价值
字段 要应用转换器逻辑的字段。 字符串[]
参数 要传递给转换器的不同属性。
输入应为 JSON 格式的键值对字典。
任何

CommandJob

名称 DESCRIPTION 价值
autologger设置 作业的分发配置。 如果已设置,则应为 Mpi、Tensorflow、PyTorch 或 null 之一。 Autologger 设置
代码 Id 代码资产的 ARM 资源 ID。 字符串
指令 [必需]在启动作业时执行的命令。 例如 “python train.py” 字符串

约束:
最小长度 = 1
模式 = [a-zA-Z0-9_] (必需)
分配 作业的分发配置。 如果已设置,则应为 Mpi、Tensorflow、PyTorch 或 null 之一。 分发配置
环境 ID [必需]作业的环境规范的 ARM 资源 ID。 字符串

约束:
模式 = [a-zA-Z0-9_] (必需)
环境变量 作业中包含的环境变量。 CommandJobEnvironmentVariables
输入 作业中使用的输入数据绑定的映射。 CommandJobInputs 命令作业输入
职位类型 [必需]指定作业的类型。 “Command”(必需)
限制 命令作业限制。 CommandJobLimits 命令作业限制
输出 作业中使用的输出数据绑定的映射。 CommandJobOutputs 命令作业输出
资源 作业的计算资源配置。 JobResourceConfiguration

CommandJobEnvironmentVariables

名称 DESCRIPTION 价值

CommandJobInputs 命令作业输入

名称 DESCRIPTION 价值

CommandJobLimits 命令作业限制

名称 DESCRIPTION 价值
jobLimits类型 [必需]JobLimit 类型。 “Command”
“扫描”(必需)
超时 ISO 8601 格式的最大运行持续时间,之后作业将被取消。 仅支持精度为秒的持续时间。 字符串

CommandJobOutputs 命令作业输出

名称 DESCRIPTION 价值

CustomForecastHorizon

名称 DESCRIPTION 价值
模式 [必需]设置预测地平线值选择模式。 “Custom”(必需)
价值 [必需]预测地平线值。 int (必需)

CustomModelJobInput (自定义模型作业输入)

名称 DESCRIPTION 价值
jobInputType (作业输入类型) [必需]指定作业的类型。 “custom_model”(必需)
模式 输入资产传送模式。 “Direct”
“下载”
“EvalDownload”
“EvalMount”
“ReadOnlyMount”
“ReadWriteMount”
URI [必需]输入资产 URI。 字符串

约束:
模式 = [a-zA-Z0-9_] (必需)

CustomModelJobOutput

名称 DESCRIPTION 价值
jobOutputType [必需]指定作业的类型。 “custom_model”(必需)
模式 输出资产传送模式。 “Direct”
“ReadWriteMount”
“Upload”
URI 输出资产 URI。 字符串

CustomNCross验证

名称 DESCRIPTION 价值
模式 [必需]用于确定 N 交叉验证的模式。 “Custom”(必需)
价值 [必需]N 交叉验证值。 int (必需)

CustomSeasonality (自定义季节性)

名称 DESCRIPTION 价值
模式 [必需]季节性模式。 “Custom”(必需)
价值 [必需]季节性值。 int (必需)

CustomTargetLags (自定义目标滞后)

名称 DESCRIPTION 价值
模式 [必需]设置目标滞后模式 - 自动/自定义 “Custom”(必需)
价值, 价值观 [必需]设置目标滞后值。 int[] (必需)

CustomTargetRollingWindowSize

名称 DESCRIPTION 价值
模式 [必需]TargetRollingWindowSiz 检测模式。 “Custom”(必需)
价值 [必需]TargetRollingWindowSize 值。 int (必需)

分发配置

名称 DESCRIPTION 价值
distributionType 对于 Mpi 类型,设置为“ Mpi”。 对于 PyTorch 类型,设置为“ PyTorch”。 设置为 TensorFlow 类型的“TensorFlow”。 “Mpi”
“PyTorch”
“TensorFlow”(必需)

提前终止政策

名称 DESCRIPTION 价值
delay评估 延迟第一次计算的间隔数。 整数 (int)
evaluationInterval 策略评估之间的间隔(运行数)。 整数 (int)
policyType 设置为“ BanditPolicy”类型为“BanditPolicy”。 对于 MedianStoppingPolicy,设置为“MedianStoppingPolicy”。 对于 TruncationSelectionPolicy 类型,设置为“TruncationSelection”。 “Bandit”
“MedianStopping”
“TruncationSelection”(必需)

预测地平线

名称 DESCRIPTION 价值
模式 设置为“ AutoForecastHorizon”类型。 设置为 CustomForecastHorizon 类型的“Custom”。 “Auto”
“Custom”(必需)

预测

名称 DESCRIPTION 价值
cvSplitColumnNames 用于 CVSplit 数据的列。 字符串[]
featurizationSettings AutoML 作业所需的特征化输入。 TableVerticalFeaturizationSettings
固定参数 在整个训练过程中将保持不变的模型/训练参数。 TableFixedParameters (表固定参数)
forecasting设置 预测任务特定的输入。 ForecastingSettings
limitSettings AutoMLJob 的执行约束。 TableVerticalLimitSettings
nCrossValidations 要应用于训练数据集的交叉验证折叠数
如果未提供验证数据集,则为 。
NCross验证
primaryMetric 预测任务的主要指标。 “NormalizedMeanAbsoluteError”
“NormalizedRootMeanSquaredError”
“R2Score”
'SpearmanCorrelation'
搜索空间 用于采样模型及其超参数的不同组合的搜索空间。 TableParameterSubspace[]
扫描设置 模型扫描和超参数优化的设置。 TableSweepSettings (表格扫描设置)
任务类型 [必需]AutoMLJob 的任务类型。 “预测”(必需)
测试数据 测试数据输入。 MLTableJobInput
testDataSize 需要为验证目的预留的测试数据集的分数。
介于 (0.0、 1.0) 之间的值
未提供验证数据集时应用。
整数 (int)
trainingSettings AutoML 作业训练阶段的输入。 ForecastingTrainingSettings
validationData (验证数据) 验证数据输入。 MLTableJobInput
validationDataSize 需要留出用于验证的定型数据集的分数。
介于 (0.0、 1.0) 之间的值
未提供验证数据集时应用。
整数 (int)
权重列名称 示例权重列的名称。 自动化 ML 支持加权列作为输入,导致数据中的行向上或向下加权。 字符串

ForecastingSettings

名称 DESCRIPTION 价值
国家/地区或地区为假期 用于预测任务的假日国家或地区。
这些代码应为 ISO 3166 双字母国家/地区代码,例如“US”或“GB”。
字符串
cvStepSize 一个 CV 折叠的起始时间与下一个折叠之间的句点数。 为
例如,如果 CVStepSize = 3 表示每日数据,则每个折叠的源时间将为
三天相隔。
整数 (int)
featureLags 使用“auto”或 null 为数值特征生成滞后的标志。 “Auto”
“None”
forecastHorizon (预测地平线) 所需最大预测范围(以时序频率单位为单位)。 预测地平线
频率 预测时,此参数表示需要预测的时间段,例如每日、每周、每年等。默认情况下,预测频率为数据集频率。 字符串
季节性 将时序季节性设置为序列频率的整数倍数。
如果季节性设置为“auto”,则会推断它。
季节性
shortSeriesHandlingConfig 定义 AutoML 如何处理短时序的参数。 “Auto”
“掉落”
“None”
“Pad”
targetAggregateFunction 用于聚合符合用户指定频率的时序目标列的函数。
如果设置了 TargetAggregateFunction,即不是“None”,但未设置 freq 参数,则会引发错误。 可能的目标聚合函数包括:“sum”、“max”、“min”和“mean”。
“Max”
“Mean”
“Min”
“None”
“Sum”
目标拉格 要从目标列滞后的过去时间段数。 目标滞后
targetRollingWindowSize 用于创建目标列的滚动窗口平均值的过去时间段数。 TargetRollingWindowSize
timeColumnName (时间列名称) 时间列的名称。 当预测在用于生成时序并推断其频率的输入数据中指定日期/时间列时,此参数是必需的。 字符串
timeSeriesIdColumnNames 用于对时间序列进行分组的列的名称。 它可用于创建多个序列。
如果未定义粒度,则假定数据集为一个时序。 此参数用于任务类型预测。
字符串[]
useStl 配置时序目标列的 STL 分解。 “None”
“季度”
“SeasonTrend”

ForecastingTrainingSettings

名称 DESCRIPTION 价值
allowedTrainingAlgorithms 允许用于预测任务的模型。 包含任一项的字符串数组:
“Arimax”
“AutoArima”
“Average”
“DecisionTree”
“ElasticNet”
“ExponentialSmoothing”
“ExtremeRandomTrees”
“GradientBoosting”
“KNN”
“LassoLars”
“LightGBM”
“Naive”
“先知”
“RandomForest”
“SeasonalAverage”
“SeasonalNaive”
“ZN”
“TCNForecaster”
“XGBoostRegressor”
blockedTrainingAlgorithms 用于预测任务的阻止模型。 包含任一项的字符串数组:
“Arimax”
“AutoArima”
“Average”
“DecisionTree”
“ElasticNet”
“ExponentialSmoothing”
“ExtremeRandomTrees”
“GradientBoosting”
“KNN”
“LassoLars”
“LightGBM”
“Naive”
“先知”
“RandomForest”
“SeasonalAverage”
“SeasonalNaive”
“ZN”
“TCNForecaster”
“XGBoostRegressor”
enableDnnTraining 启用 DNN 模型的建议。 布尔
enableModelExplainability 标志以在最佳模型上启用可解释性。 布尔
enableOnnxCompatibleModels 用于启用 onnx 兼容模型的标志。 布尔
enableStackEnsemble 启用堆栈合奏运行。 布尔
enableVoteEnsemble 启用投票合奏运行。 布尔
ensembleModelDownloadTimeout 在 VotingEnsemble 和 StackEnsemble 模型生成期间,将下载先前子运行中的多个拟合模型。
如果需要更多时间,请将此参数配置为大于 300 秒的值。
字符串
stackEnsembleSettings 堆栈合奏的堆栈合奏设置。 StackEnsembleSettings

GridSampling算法

名称 DESCRIPTION 价值
采样算法类型 [必需]用于生成超参数值的算法以及配置属性 “Grid”(必需)

身份配置

名称 DESCRIPTION 价值
身份类型 对于 AmlToken 类型,设置为“AMLToken”。 设置为 “ManagedIdentity”类型。 对于 UserIdentity 类型,设置为“UserIdentity”。 “AMLToken”
“Managed”
“UserIdentity”(必需)

图像分类

名称 DESCRIPTION 价值
limitSettings [必需]限制 AutoML 作业的设置。 ImageLimitSettings (必需)
modelSettings 用于训练模型的设置。 ImageModelSettings分类
primaryMetric 要针对此任务进行优化的主要指标。 “准确性”
“AUCWeighted”
“AveragePrecisionScoreWeighted”
“NormMacroRecall”
“PrecisionScoreWeighted”
搜索空间 用于采样模型及其超参数的不同组合的搜索空间。 ImageModelDistributionSettingsClassification[]
扫描设置 模型扫描和超参数扫描相关设置。 ImageSweepSettings (图像扫描设置)
任务类型 [必需]AutoMLJob 的任务类型。 “ImageClassification”(必需)
validationData (验证数据) 验证数据输入。 MLTableJobInput
validationDataSize 需要留出用于验证的定型数据集的分数。
介于 (0.0、 1.0) 之间的值
未提供验证数据集时应用。
整数 (int)

ImageClassificationMultilabel

名称 DESCRIPTION 价值
limitSettings [必需]限制 AutoML 作业的设置。 ImageLimitSettings (必需)
modelSettings 用于训练模型的设置。 ImageModelSettings分类
primaryMetric 要针对此任务进行优化的主要指标。 “准确性”
“AUCWeighted”
“AveragePrecisionScoreWeighted”
“IOU”
“NormMacroRecall”
“PrecisionScoreWeighted”
搜索空间 用于采样模型及其超参数的不同组合的搜索空间。 ImageModelDistributionSettingsClassification[]
扫描设置 模型扫描和超参数扫描相关设置。 ImageSweepSettings (图像扫描设置)
任务类型 [必需]AutoMLJob 的任务类型。 “ImageClassificationMultilabel”(必需)
validationData (验证数据) 验证数据输入。 MLTableJobInput
validationDataSize 需要留出用于验证的定型数据集的分数。
介于 (0.0、 1.0) 之间的值
未提供验证数据集时应用。
整数 (int)

ImageInstanceSegmentation

名称 DESCRIPTION 价值
limitSettings [必需]限制 AutoML 作业的设置。 ImageLimitSettings (必需)
modelSettings 用于训练模型的设置。 ImageModelSettingsObjectDetection
primaryMetric 要针对此任务进行优化的主要指标。 “MeanAveragePrecision”
搜索空间 用于采样模型及其超参数的不同组合的搜索空间。 ImageModelDistributionSettingsObjectDetection[]
扫描设置 模型扫描和超参数扫描相关设置。 ImageSweepSettings (图像扫描设置)
任务类型 [必需]AutoMLJob 的任务类型。 “ImageInstanceSegmentation”(必需)
validationData (验证数据) 验证数据输入。 MLTableJobInput
validationDataSize 需要留出用于验证的定型数据集的分数。
介于 (0.0、 1.0) 之间的值
未提供验证数据集时应用。
整数 (int)

ImageLimitSettings

名称 DESCRIPTION 价值
maxConcurrentTrials 最大并发 AutoML 迭代数。 整数 (int)
maxTrials AutoML 迭代的最大数目。 整数 (int)
超时 AutoML 作业超时。 字符串

ImageModelDistributionSettings分类

名称 DESCRIPTION 价值
amsGradient 优化器为“adam”或“adamw”时启用 AMSGrad。 字符串
扩充 使用扩充的设置。 字符串
贝塔1 优化器为“adam”或“adamw”时“beta1”的值。 必须是 [0, 1] 范围内的浮点。 字符串
贝塔2 优化器为“adam”或“adamw”时“beta2”的值。 必须是 [0, 1] 范围内的浮点。 字符串
分散式 是否使用分布式程序训练。 字符串
earlyStopping (早期停止) 在训练期间启用提前停止逻辑。 字符串
earlyStoppingDelay 在主要指标改进之前等待的最小纪元数或验证评估数
跟踪早期停止。 必须是正整数。
字符串
早点停止耐心 之前没有主要指标改进的最小纪元或验证评估数
运行已停止。 必须是正整数。
字符串
enableOnnxNormalization 导出 ONNX 模型时启用规范化。 字符串
evaluationFrequency 评估验证数据集以获取指标分数的频率。 必须是正整数。 字符串
梯度累积步骤 渐变累积意味着在不运行配置数量的“GradAccumulationStep”步骤的情况下
更新模型权重,同时累积这些步骤的渐变,然后使用
用于计算权重更新的累积渐变。 必须是正整数。
字符串
layersToFreeze (图层冻结) 要冻结模型的层数。 必须是正整数。
例如,将 2 作为“seresnext”的值传递意味着
冻结 layer0 和 layer1。 有关支持的模型的完整列表以及有关层冻结的详细信息,请
请参阅:/azure/machine-learning/how-to-auto-train-image-models。
字符串
learningRate 初始学习速率。 必须是 [0, 1] 范围内的浮点。 字符串
learningRateScheduler 的 学习速率计划程序的类型。 必须是“warmup_cosine”或“step”。 字符串
模型名称 要用于训练的模型的名称。
有关可用模型的详细信息,请访问官方文档:
/azure/machine-learning/how-to-auto-train-image-models。
字符串
动量 优化器为“zn”时的动量值。 必须是 [0, 1] 范围内的浮点。 字符串
涅斯特罗夫 优化器为“zn”时启用 nesterov。 字符串
纪元数 训练纪元数。 必须是正整数。 字符串
工人数 数据加载程序辅助角色数。 必须是非负整数。 字符串
优化器 优化器的类型。 必须是“zn”、“adam”或“adamw”。 字符串
随机种子 使用确定性训练时要使用的随机种子。 字符串
stepLR伽玛 当学习速率计划程序为“step”时,gamma 的值。 必须是 [0, 1] 范围内的浮点。 字符串
stepLRStepSize 学习速率计划程序为“step”时步骤大小的值。 必须是正整数。 字符串
trainingBatchSize 训练批大小。 必须是正整数。 字符串
trainingCropSize 训练数据集的神经网络输入的图像裁剪大小。 必须是正整数。 字符串
validationBatchSize 验证批大小。 必须是正整数。 字符串
validationCropSize 输入到神经网络的验证数据集的图像裁剪大小。 必须是正整数。 字符串
validationResizeSize 在裁剪验证数据集之前要调整其大小的图像大小。 必须是正整数。 字符串
warmupCosineLRCycles 学习速率计划程序为“warmup_cosine”时的余弦周期值。 必须是 [0, 1] 范围内的浮点。 字符串
warmupCosineLRWarmupEpochs 当学习速率计划程序为“warmup_cosine”时,预热时期的值。 必须是正整数。 字符串
weightDecay (权重衰减) 优化器为“zn”、“adam”或“adamw”时的权重衰减值。 必须是范围[0, 1] 中的浮点。 字符串
weightedLoss 减肥。 对于无加权损失,接受的值为 0。
1 用于与 sqrt 一起减肥。(class_weights)。 2 用于减肥与class_weights。 必须为 0 或 1 或 2。
字符串

ImageModelDistributionSettingsObjectDetection

名称 DESCRIPTION 价值
amsGradient 优化器为“adam”或“adamw”时启用 AMSGrad。 字符串
扩充 使用扩充的设置。 字符串
贝塔1 优化器为“adam”或“adamw”时“beta1”的值。 必须是 [0, 1] 范围内的浮点。 字符串
贝塔2 优化器为“adam”或“adamw”时“beta2”的值。 必须是 [0, 1] 范围内的浮点。 字符串
boxDetectionsPerImage (每图像检测) 每个图像的最大检测数,适用于所有类。 必须是正整数。
注意:“yolov5”算法不支持此设置。
字符串
boxScoreThreshold (盒分数阈值) 在推理期间,仅返回分类分数大于
BoxScoreThreshold。 必须是范围[0, 1] 中的浮点。
字符串
分散式 是否使用分布式程序训练。 字符串
earlyStopping (早期停止) 在训练期间启用提前停止逻辑。 字符串
earlyStoppingDelay 在主要指标改进之前等待的最小纪元数或验证评估数
跟踪早期停止。 必须是正整数。
字符串
早点停止耐心 之前没有主要指标改进的最小纪元或验证评估数
运行已停止。 必须是正整数。
字符串
enableOnnxNormalization 导出 ONNX 模型时启用规范化。 字符串
evaluationFrequency 评估验证数据集以获取指标分数的频率。 必须是正整数。 字符串
梯度累积步骤 渐变累积意味着在不运行配置数量的“GradAccumulationStep”步骤的情况下
更新模型权重,同时累积这些步骤的渐变,然后使用
用于计算权重更新的累积渐变。 必须是正整数。
字符串
图像大小 用于训练和验证的图像大小。 必须是正整数。
注意:如果大小太大,训练运行可能会进入 CUDA OOM。
注意:仅“yolov5”算法支持此设置。
字符串
layersToFreeze (图层冻结) 要冻结模型的层数。 必须是正整数。
例如,将 2 作为“seresnext”的值传递意味着
冻结 layer0 和 layer1。 有关支持的模型的完整列表以及有关层冻结的详细信息,请
请参阅:/azure/machine-learning/how-to-auto-train-image-models。
字符串
learningRate 初始学习速率。 必须是 [0, 1] 范围内的浮点。 字符串
learningRateScheduler 的 学习速率计划程序的类型。 必须是“warmup_cosine”或“step”。 字符串
最大大小 将图像馈送至主干之前要重新缩放的最大大小。
必须是正整数。 注意:如果大小太大,训练运行可能会进入 CUDA OOM。
注意:“yolov5”算法不支持此设置。
字符串
最小大小 将图像馈送到主干之前要重新缩放的最小大小。
必须是正整数。 注意:如果大小太大,训练运行可能会进入 CUDA OOM。
注意:“yolov5”算法不支持此设置。
字符串
模型名称 要用于训练的模型的名称。
有关可用模型的详细信息,请访问官方文档:
/azure/machine-learning/how-to-auto-train-image-models。
字符串
modelSize 模型大小。 必须是“small”、“medium”、“large”或“xlarge”。
注意:如果模型大小太大,训练运行可能会进入 CUDA OOM。
注意:仅“yolov5”算法支持此设置。
字符串
动量 优化器为“zn”时的动量值。 必须是 [0, 1] 范围内的浮点。 字符串
多尺度 按 +/- 50%的不同图像大小启用多缩放图像。
注意:如果没有足够的 GPU 内存,训练运行可能会进入 CUDA OOM。
注意:仅“yolov5”算法支持此设置。
字符串
涅斯特罗夫 优化器为“zn”时启用 nesterov。 字符串
nmsIouThreshold 在 NMS 后期处理的推理期间使用的 IOU 阈值。 必须在 [0, 1] 范围内浮动。 字符串
纪元数 训练纪元数。 必须是正整数。 字符串
工人数 数据加载程序辅助角色数。 必须是非负整数。 字符串
优化器 优化器的类型。 必须是“zn”、“adam”或“adamw”。 字符串
随机种子 使用确定性训练时要使用的随机种子。 字符串
stepLR伽玛 当学习速率计划程序为“step”时,gamma 的值。 必须是 [0, 1] 范围内的浮点。 字符串
stepLRStepSize 学习速率计划程序为“step”时步骤大小的值。 必须是正整数。 字符串
tileGridSize (平铺网格大小) 用于平铺每个图像的网格大小。 注意:TileGridSize 不得为
无可启用小型对象检测逻辑。 一个字符串,其中包含两个整数(采用格式)。
注意:“yolov5”算法不支持此设置。
字符串
tileOverlapRatio (平铺重叠比率) 每个维度中相邻磁贴之间的重叠比率。 必须在 [0, 1] 范围内浮动。
注意:“yolov5”算法不支持此设置。
字符串
tilePredictionsNmsThreshold 用于执行 NMS 的 IOU 阈值,同时合并来自磁贴和图像的预测。
用于验证/推理。 必须在 [0, 1] 范围内浮动。
注意:“yolov5”算法不支持此设置。
NMS:非最大抑制
字符串
trainingBatchSize 训练批大小。 必须是正整数。 字符串
validationBatchSize 验证批大小。 必须是正整数。 字符串
validationIouThreshold 计算验证指标时要使用的 IOU 阈值。 必须在 [0, 1] 范围内浮动。 字符串
validationMetricType 用于验证指标的指标计算方法。 必须是“none”、“coco”、“voc”或“coco_voc”。 字符串
warmupCosineLRCycles 学习速率计划程序为“warmup_cosine”时的余弦周期值。 必须是 [0, 1] 范围内的浮点。 字符串
warmupCosineLRWarmupEpochs 当学习速率计划程序为“warmup_cosine”时,预热时期的值。 必须是正整数。 字符串
weightDecay (权重衰减) 优化器为“zn”、“adam”或“adamw”时的权重衰减值。 必须是范围[0, 1] 中的浮点。 字符串

ImageModelSettings分类

名称 DESCRIPTION 价值
高级设置 高级方案的设置。 字符串
amsGradient 优化器为“adam”或“adamw”时启用 AMSGrad。 布尔
扩充 使用扩充的设置。 字符串
贝塔1 优化器为“adam”或“adamw”时“beta1”的值。 必须是 [0, 1] 范围内的浮点。 整数 (int)
贝塔2 优化器为“adam”或“adamw”时“beta2”的值。 必须是 [0, 1] 范围内的浮点。 整数 (int)
检查点频率 存储模型检查点的频率。 必须是正整数。 整数 (int)
checkpoint模型 用于增量训练的预先训练检查点模型。 MLFlowModelJobInput
检查点RunId 上一次运行的 ID,该运行具有用于增量训练的预先训练检查点。 字符串
分散式 是否使用分布式训练。 布尔
earlyStopping (早期停止) 在训练期间启用提前停止逻辑。 布尔
earlyStoppingDelay 在主要指标改进之前等待的最小纪元数或验证评估数
跟踪早期停止。 必须是正整数。
整数 (int)
早点停止耐心 之前没有主要指标改进的最小纪元或验证评估数
运行已停止。 必须是正整数。
整数 (int)
enableOnnxNormalization 导出 ONNX 模型时启用规范化。 布尔
evaluationFrequency 评估验证数据集以获取指标分数的频率。 必须是正整数。 整数 (int)
梯度累积步骤 渐变累积意味着在不运行配置数量的“GradAccumulationStep”步骤的情况下
更新模型权重,同时累积这些步骤的渐变,然后使用
用于计算权重更新的累积渐变。 必须是正整数。
整数 (int)
layersToFreeze (图层冻结) 要冻结模型的层数。 必须是正整数。
例如,将 2 作为“seresnext”的值传递意味着
冻结 layer0 和 layer1。 有关支持的模型的完整列表以及有关层冻结的详细信息,请
请参阅:/azure/machine-learning/how-to-auto-train-image-models。
整数 (int)
learningRate 初始学习速率。 必须是 [0, 1] 范围内的浮点。 整数 (int)
learningRateScheduler 的 学习速率计划程序的类型。 必须是“warmup_cosine”或“step”。 “None”
“Step”
“WarmupCosine”
模型名称 要用于训练的模型的名称。
有关可用模型的详细信息,请访问官方文档:
/azure/machine-learning/how-to-auto-train-image-models。
字符串
动量 优化器为“zn”时的动量值。 必须是 [0, 1] 范围内的浮点。 整数 (int)
涅斯特罗夫 优化器为“zn”时启用 nesterov。 布尔
纪元数 训练纪元数。 必须是正整数。 整数 (int)
工人数 数据加载程序辅助角色数。 必须是非负整数。 整数 (int)
优化器 优化器的类型。 “Adam”
“Adamw”
“None”
“Zn”
随机种子 使用确定性训练时要使用的随机种子。 整数 (int)
stepLR伽玛 当学习速率计划程序为“step”时,gamma 的值。 必须是 [0, 1] 范围内的浮点。 整数 (int)
stepLRStepSize 学习速率计划程序为“step”时步骤大小的值。 必须是正整数。 整数 (int)
trainingBatchSize 训练批大小。 必须是正整数。 整数 (int)
trainingCropSize 训练数据集的神经网络输入的图像裁剪大小。 必须是正整数。 整数 (int)
validationBatchSize 验证批大小。 必须是正整数。 整数 (int)
validationCropSize 输入到神经网络的验证数据集的图像裁剪大小。 必须是正整数。 整数 (int)
validationResizeSize 在裁剪验证数据集之前要调整其大小的图像大小。 必须是正整数。 整数 (int)
warmupCosineLRCycles 学习速率计划程序为“warmup_cosine”时的余弦周期值。 必须是 [0, 1] 范围内的浮点。 整数 (int)
warmupCosineLRWarmupEpochs 当学习速率计划程序为“warmup_cosine”时,预热时期的值。 必须是正整数。 整数 (int)
weightDecay (权重衰减) 优化器为“zn”、“adam”或“adamw”时的权重衰减值。 必须是范围[0, 1] 中的浮点。 整数 (int)
weightedLoss 减肥。 对于无加权损失,接受的值为 0。
1 用于与 sqrt 一起减肥。(class_weights)。 2 用于减肥与class_weights。 必须为 0 或 1 或 2。
整数 (int)

ImageModelSettingsObjectDetection

名称 DESCRIPTION 价值
高级设置 高级方案的设置。 字符串
amsGradient 优化器为“adam”或“adamw”时启用 AMSGrad。 布尔
扩充 使用扩充的设置。 字符串
贝塔1 优化器为“adam”或“adamw”时“beta1”的值。 必须是 [0, 1] 范围内的浮点。 整数 (int)
贝塔2 优化器为“adam”或“adamw”时“beta2”的值。 必须是 [0, 1] 范围内的浮点。 整数 (int)
boxDetectionsPerImage (每图像检测) 每个图像的最大检测数,适用于所有类。 必须是正整数。
注意:“yolov5”算法不支持此设置。
整数 (int)
boxScoreThreshold (盒分数阈值) 在推理期间,仅返回分类分数大于
BoxScoreThreshold。 必须是范围[0, 1] 中的浮点。
整数 (int)
检查点频率 存储模型检查点的频率。 必须是正整数。 整数 (int)
checkpoint模型 用于增量训练的预先训练检查点模型。 MLFlowModelJobInput
检查点RunId 上一次运行的 ID,该运行具有用于增量训练的预先训练检查点。 字符串
分散式 是否使用分布式训练。 布尔
earlyStopping (早期停止) 在训练期间启用提前停止逻辑。 布尔
earlyStoppingDelay 在主要指标改进之前等待的最小纪元数或验证评估数
跟踪早期停止。 必须是正整数。
整数 (int)
早点停止耐心 之前没有主要指标改进的最小纪元或验证评估数
运行已停止。 必须是正整数。
整数 (int)
enableOnnxNormalization 导出 ONNX 模型时启用规范化。 布尔
evaluationFrequency 评估验证数据集以获取指标分数的频率。 必须是正整数。 整数 (int)
梯度累积步骤 渐变累积意味着在不运行配置数量的“GradAccumulationStep”步骤的情况下
更新模型权重,同时累积这些步骤的渐变,然后使用
用于计算权重更新的累积渐变。 必须是正整数。
整数 (int)
图像大小 用于训练和验证的图像大小。 必须是正整数。
注意:如果大小太大,训练运行可能会进入 CUDA OOM。
注意:仅“yolov5”算法支持此设置。
整数 (int)
layersToFreeze (图层冻结) 要冻结模型的层数。 必须是正整数。
例如,将 2 作为“seresnext”的值传递意味着
冻结 layer0 和 layer1。 有关支持的模型的完整列表以及有关层冻结的详细信息,请
请参阅:/azure/machine-learning/how-to-auto-train-image-models。
整数 (int)
learningRate 初始学习速率。 必须是 [0, 1] 范围内的浮点。 整数 (int)
learningRateScheduler 的 学习速率计划程序的类型。 必须是“warmup_cosine”或“step”。 “None”
“Step”
“WarmupCosine”
最大大小 将图像馈送至主干之前要重新缩放的最大大小。
必须是正整数。 注意:如果大小太大,训练运行可能会进入 CUDA OOM。
注意:“yolov5”算法不支持此设置。
整数 (int)
最小大小 将图像馈送到主干之前要重新缩放的最小大小。
必须是正整数。 注意:如果大小太大,训练运行可能会进入 CUDA OOM。
注意:“yolov5”算法不支持此设置。
整数 (int)
模型名称 要用于训练的模型的名称。
有关可用模型的详细信息,请访问官方文档:
/azure/machine-learning/how-to-auto-train-image-models。
字符串
modelSize 模型大小。 必须是“small”、“medium”、“large”或“xlarge”。
注意:如果模型大小太大,训练运行可能会进入 CUDA OOM。
注意:仅“yolov5”算法支持此设置。
“ExtraLarge”
“Large”
“Medium”
“None”
“Small”
动量 优化器为“zn”时的动量值。 必须是 [0, 1] 范围内的浮点。 整数 (int)
多尺度 按 +/- 50%的不同图像大小启用多缩放图像。
注意:如果没有足够的 GPU 内存,训练运行可能会进入 CUDA OOM。
注意:仅“yolov5”算法支持此设置。
布尔
涅斯特罗夫 优化器为“zn”时启用 nesterov。 布尔
nmsIouThreshold 在 NMS 后期处理的推理期间使用的 IOU 阈值。 必须是 [0, 1] 范围内的浮点。 整数 (int)
纪元数 训练纪元数。 必须是正整数。 整数 (int)
工人数 数据加载程序辅助角色数。 必须是非负整数。 整数 (int)
优化器 优化器的类型。 “Adam”
“Adamw”
“None”
“Zn”
随机种子 使用确定性训练时要使用的随机种子。 整数 (int)
stepLR伽玛 当学习速率计划程序为“step”时,gamma 的值。 必须是 [0, 1] 范围内的浮点。 整数 (int)
stepLRStepSize 学习速率计划程序为“step”时步骤大小的值。 必须是正整数。 整数 (int)
tileGridSize (平铺网格大小) 用于平铺每个图像的网格大小。 注意:TileGridSize 不得为
无可启用小型对象检测逻辑。 一个字符串,其中包含两个整数(采用格式)。
注意:“yolov5”算法不支持此设置。
字符串
tileOverlapRatio (平铺重叠比率) 每个维度中相邻磁贴之间的重叠比率。 必须在 [0, 1] 范围内浮动。
注意:“yolov5”算法不支持此设置。
整数 (int)
tilePredictionsNmsThreshold 用于执行 NMS 的 IOU 阈值,同时合并来自磁贴和图像的预测。
用于验证/推理。 必须在 [0, 1] 范围内浮动。
注意:“yolov5”算法不支持此设置。
整数 (int)
trainingBatchSize 训练批大小。 必须是正整数。 整数 (int)
validationBatchSize 验证批大小。 必须是正整数。 整数 (int)
validationIouThreshold 计算验证指标时要使用的 IOU 阈值。 必须在 [0, 1] 范围内浮动。 整数 (int)
validationMetricType 用于验证指标的指标计算方法。 “Coco”
“CocoVoc”
“None”
“Voc”
warmupCosineLRCycles 学习速率计划程序为“warmup_cosine”时的余弦周期值。 必须是 [0, 1] 范围内的浮点。 整数 (int)
warmupCosineLRWarmupEpochs 当学习速率计划程序为“warmup_cosine”时,预热时期的值。 必须是正整数。 整数 (int)
weightDecay (权重衰减) 优化器为“zn”、“adam”或“adamw”时的权重衰减值。 必须是范围[0, 1] 中的浮点。 整数 (int)

ImageObjectDetection

名称 DESCRIPTION 价值
limitSettings [必需]限制 AutoML 作业的设置。 ImageLimitSettings (必需)
modelSettings 用于训练模型的设置。 ImageModelSettingsObjectDetection
primaryMetric 要针对此任务进行优化的主要指标。 “MeanAveragePrecision”
搜索空间 用于采样模型及其超参数的不同组合的搜索空间。 ImageModelDistributionSettingsObjectDetection[]
扫描设置 模型扫描和超参数扫描相关设置。 ImageSweepSettings (图像扫描设置)
任务类型 [必需]AutoMLJob 的任务类型。 “ImageObjectDetection”(必需)
validationData (验证数据) 验证数据输入。 MLTableJobInput
validationDataSize 需要留出用于验证的定型数据集的分数。
介于 (0.0、 1.0) 之间的值
未提供验证数据集时应用。
整数 (int)

ImageSweepSettings (图像扫描设置)

名称 DESCRIPTION 价值
early终止 提前终止策略的类型。 提前终止政策
sampling算法 [必需]超参数采样算法的类型。 “贝贝西亚语”
“Grid”
“Random”(必需)

JobBaseProperties

名称 DESCRIPTION 价值
组件 ID 组件资源的 ARM 资源 ID。 字符串
计算 ID 计算资源的 ARM 资源 ID。 字符串
描述 资产说明文本。 字符串
displayName (显示名称) 作业的显示名称。 字符串
实验名称 作业所属的试验的名称。 如果未设置,作业将放置在“默认”试验中。 字符串
标识 标识配置。 如果已设置,则应为 AmlToken、ManagedIdentity、UserIdentity 或 null 之一。
如果为 null,则默认为 AmlToken。
身份配置
isArchived 已存档 资产是否已存档? 布尔
职位类型 设置为 AutoMLJob 类型的“AutoML”。 设置为 CommandJob 类型的“Command”。 设置为 “LabelingJobProperties”类型的“标记”。 设置为 PipelineJob 类型的“Pipeline”。 设置为“ SparkJob”类型的“Spark”。 设置为“ SweepJob”类型。 “AutoML”
“Command”
“标记”
“Pipeline”
“Spark”
“扫描”(必需)
属性 资产属性字典。 ResourceBaseProperties
服务 JobEndpoints 列表。
对于本地作业,作业终结点的终结点值为 FileStreamObject。
JobBase服务
标签 标记字典。 可以添加、删除和更新标记。 ResourceBaseTags

JobBase服务

名称 DESCRIPTION 价值

作业输入

名称 DESCRIPTION 价值
描述 输入的说明。 字符串
jobInputType (作业输入类型) 设置为 CustomModelJobInput 类型的“custom_model”。 设置为 Type LiteralJobInput 的“literal”。 设置为 MLFlowModelJobInput 类型的“mlflow_model”。 设置为 MLTableJobInput 类型的“mltable”。 设置为 TritonModelJobInput 类型的“triton_model”。 设置为 UriFileJobInput 类型的“uri_file”。 设置为 UriFolderJobInput 类型的“uri_folder”。 “custom_model”
“literal”
“mlflow_model”
“mltable”
“triton_model”
“uri_file”
“uri_folder”(必需)

JobOutput (作业输出)

名称 DESCRIPTION 价值
描述 输出的说明。 字符串
jobOutputType 设置为 CustomModelJobOutput 类型的“custom_model”。 设置为 MLFlowModelJobOutput 类型的“mlflow_model”。 设置为 MLTableJobOutput 类型的“mltable”。 设置为 TritonModelJobOutput 类型的“triton_model”。 设置为 UriFileJobOutput 类型的“uri_file”。 设置为 UriFolderJobOutput 类型的“uri_folder”。 “custom_model”
“mlflow_model”
“mltable”
“triton_model”
“uri_file”
“uri_folder”(必需)

JobResourceConfiguration

名称 DESCRIPTION 价值
dockerArgs 要传递给 Docker run 命令的额外参数。 这将替代系统设置的任何参数,或在本部分中。 此参数仅支持 Azure ML 计算类型。 字符串
instanceCount 计算目标使用的实例或节点数可选。 整数 (int)
instanceType 计算目标支持的可选 VM 类型。 字符串
属性 其他属性包。 ResourceConfigurationProperties
shmSize docker 容器的共享内存块的大小。 这应采用 (number)(unit) 格式,其中数字大于 0,单位可以是 b(字节)、k(千字节)、m(兆字节)或 g(GB)。 字符串

约束:
图案 = \d+[bBkKmMgG]

工作服务

名称 DESCRIPTION 价值
终结点 终结点的 URL。 字符串
jobServiceType 终结点类型。 字符串
节点 用户希望启动服务的节点。
如果未将 Nodes 设置为 null,则服务将仅在领导节点上启动。
节点
移植 用户设置的终结点的端口。 整数 (int)
属性 在终结点上设置的其他属性。 JobServiceProperties

JobServiceProperties

名称 DESCRIPTION 价值

标签类别

名称 DESCRIPTION 价值
此类别中标签类的字典。 标签类别类
displayName (显示名称) 标签类别的显示名称。 字符串
multiSelectEnabled 已启用 指示是否允许在此类别中选择多个类。 布尔

标签类别类

名称 DESCRIPTION 价值

标签类

名称 DESCRIPTION 价值
displayName (显示名称) 标签类的显示名称。 字符串
标签类的子类的字典。 LabelClass子类

LabelClass子类

名称 DESCRIPTION 价值

LabelingDataConfiguration

名称 DESCRIPTION 价值
数据 ID 要执行标记的数据资产的资源 ID。 字符串
incrementalDataRefreshEnabled 指示是否启用增量数据刷新。 布尔

LabelingJobImageProperties

名称 DESCRIPTION 价值
annotationType 图像标记作业的批注类型。 “BoundingBox”
“Classification”
“InstanceSegmentation”
mediaType [必需]作业的媒体类型。 “Image”(必需)

TagJobInstructions

名称 DESCRIPTION 价值
URI 指向页面的链接,其中包含标签器的详细标记说明。 字符串

LabelingJobLabel类别

名称 DESCRIPTION 价值

LabelingJobMediaProperties

名称 DESCRIPTION 价值
mediaType 设置为“Image”,类型 为 LabelingJobImageProperties。 对于 LabelingJobTextProperties 类型,设置为“Text”。 “Image”
“Text”(必需)

LabelingJobProperties

名称 DESCRIPTION 价值
dataConfiguration 配置作业中使用的数据。 LabelingDataConfiguration
工作说明 标记作业的说明。 TagJobInstructions
职位类型 [必需]指定作业的类型。 “标记”(必需)
标签类别 作业的标签类别。 LabelingJobLabel类别
labelingJobMediaProperties 作业中的媒体类型特定属性。 LabelingJobMediaProperties
mlAssistConfiguration 在作业中配置 MLAssist 功能。 MLAssistConfiguration

LabelingJobTextProperties

名称 DESCRIPTION 价值
annotationType 文本标记作业的批注类型。 “Classification”
'NamedEntityRecognition' (命名实体识别)
mediaType [必需]作业的媒体类型。 “Text”(必需)

LiteralJobInput (文字作业输入)

名称 DESCRIPTION 价值
jobInputType (作业输入类型) [必需]指定作业的类型。 “literal”(必需)
价值 [必需]输入的文本值。 字符串

约束:
模式 = [a-zA-Z0-9_] (必需)

ManagedIdentity (托管身份)

名称 DESCRIPTION 价值
客户端 ID 按客户端 ID 指定用户分配的标识。 对于系统分配,请不要设置此字段。 字符串

约束:
最小长度 = 36
最大长度 = 36
图案 = ^[0-9a-fA-F]{8}-([0-9a-fA-F]{4}-){3}[0-9a-fA-F]{12}$
身份类型 [必需]指定标识框架的类型。 “Managed”(必需)
对象 ID 按对象 ID 指定用户分配的标识。 对于系统分配,请不要设置此字段。 字符串

约束:
最小长度 = 36
最大长度 = 36
图案 = ^[0-9a-fA-F]{8}-([0-9a-fA-F]{4}-){3}[0-9a-fA-F]{12}$
资源ID 按 ARM 资源 ID 指定用户分配的标识。 对于系统分配,请不要设置此字段。 字符串

MedianStoppingPolicy (中值停止策略)

名称 DESCRIPTION 价值
policyType [必需]策略配置的名称 “MedianStopping”(必需)

MLAssistConfiguration

名称 DESCRIPTION 价值
mlAssist 设置为 MLAssistConfigurationDisabled 类型的“Disabled”。 设置为 MLAssistConfigurationEnabled 类型的“Enabled”。 “Disabled”
“Enabled”(必需)

MLAssistConfigurationDisabled

名称 DESCRIPTION 价值
mlAssist [必需]指示是否启用 MLAssist 功能。 “Disabled”(必需)

MLAssistConfiguration已启用

名称 DESCRIPTION 价值
inferencingComputeBinding [必需]推理中使用的 AML 计算绑定。 字符串

约束:
模式 = [a-zA-Z0-9_] (必需)
mlAssist [必需]指示是否启用 MLAssist 功能。 “Enabled”(必需)
trainingComputeBinding 的 [必需]训练中使用的 AML 计算绑定。 字符串

约束:
模式 = [a-zA-Z0-9_] (必需)

MLFlowModelJobInput

名称 DESCRIPTION 价值
jobInputType (作业输入类型) [必需]指定作业的类型。 “mlflow_model”(必需)
模式 输入资产传送模式。 “Direct”
“下载”
“EvalDownload”
“EvalMount”
“ReadOnlyMount”
“ReadWriteMount”
URI [必需]输入资产 URI。 字符串

约束:
模式 = [a-zA-Z0-9_] (必需)

MLFlowModelJobInput

名称 DESCRIPTION 价值
描述 输入的说明。 字符串
jobInputType (作业输入类型) [必需]指定作业的类型。 “custom_model”
“literal”
“mlflow_model”
“mltable”
“triton_model”
“uri_file”
“uri_folder”(必需)
模式 输入资产传送模式。 “Direct”
“下载”
“EvalDownload”
“EvalMount”
“ReadOnlyMount”
“ReadWriteMount”
URI [必需]输入资产 URI。 字符串

约束:
模式 = [a-zA-Z0-9_] (必需)

MLFlowModelJobOutput

名称 DESCRIPTION 价值
jobOutputType [必需]指定作业的类型。 “mlflow_model”(必需)
模式 输出资产传送模式。 “Direct”
“ReadWriteMount”
“Upload”
URI 输出资产 URI。 字符串

MLTableJobInput

名称 DESCRIPTION 价值
描述 输入的说明。 字符串
jobInputType (作业输入类型) [必需]指定作业的类型。 “custom_model”
“literal”
“mlflow_model”
“mltable”
“triton_model”
“uri_file”
“uri_folder”(必需)
模式 输入资产传送模式。 “Direct”
“下载”
“EvalDownload”
“EvalMount”
“ReadOnlyMount”
“ReadWriteMount”
URI [必需]输入资产 URI。 字符串

约束:
模式 = [a-zA-Z0-9_] (必需)

MLTableJobInput

名称 DESCRIPTION 价值
jobInputType (作业输入类型) [必需]指定作业的类型。 “mltable”(必需)
模式 输入资产传送模式。 “Direct”
“下载”
“EvalDownload”
“EvalMount”
“ReadOnlyMount”
“ReadWriteMount”
URI [必需]输入资产 URI。 字符串

约束:
模式 = [a-zA-Z0-9_] (必需)

MLTableJobOutput

名称 DESCRIPTION 价值
jobOutputType [必需]指定作业的类型。 “mltable”(必需)
模式 输出资产传送模式。 “Direct”
“ReadWriteMount”
“Upload”
URI 输出资产 URI。 字符串

MPI

名称 DESCRIPTION 价值
distributionType [必需]指定分发框架的类型。 “Mpi”(必需)
processCountPerInstance 每个 MPI 节点的进程数。 整数 (int)

NCross验证

名称 DESCRIPTION 价值
模式 对于 AutoNCrossValidations 类型,设置为“自动”。 设置为 CustomNCrossValidations 类型的“Custom”。 “Auto”
“Custom”(必需)

NlpFixedParameters

名称 DESCRIPTION 价值
梯度累积步骤 在运行向后传递之前累积渐变的步骤数。 整数 (int)
learningRate 训练过程的学习速率。 整数 (int)
learningRateScheduler 的 训练过程中要使用的学习速率计划的类型。 “Constant”
“ConstantWithWarmup”
“余弦”
“CosineWithRestarts”
“Linear”
“None”
“多项式”
模型名称 要训练的模型的名称。 字符串
纪元数 训练纪元数。 整数 (int)
trainingBatchSize 训练过程的批大小。 整数 (int)
validationBatchSize 要在评估期间使用的批大小。 整数 (int)
warmupRatio 与 LrSchedulerType 一起使用的预热比率。 整数 (int)
weightDecay (权重衰减) 训练过程的重量衰减。 整数 (int)

NlpParameterSubspace

名称 DESCRIPTION 价值
梯度累积步骤 在运行向后传递之前累积渐变的步骤数。 字符串
learningRate 训练过程的学习速率。 字符串
learningRateScheduler 的 训练过程中要使用的学习速率计划的类型。 字符串
模型名称 要训练的模型的名称。 字符串
纪元数 训练纪元数。 字符串
trainingBatchSize 训练过程的批大小。 字符串
validationBatchSize 要在评估期间使用的批大小。 字符串
warmupRatio 与 LrSchedulerType 一起使用的预热比率。 字符串
weightDecay (权重衰减) 训练过程的重量衰减。 字符串

NlpSweepSettings

名称 DESCRIPTION 价值
early终止 扫描作业的提前终止策略的类型。 提前终止政策
sampling算法 [必需]采样算法的类型。 “贝贝西亚语”
“Grid”
“Random”(必需)

NlpVerticalFeaturizationSettings

名称 DESCRIPTION 价值
datasetLanguage 数据集语言,适用于文本数据。 字符串

NlpVerticalLimitSettings

名称 DESCRIPTION 价值
maxConcurrentTrials 最大并发 AutoML 迭代次数。 整数 (int)
最大节点数 用于在任何单个试用版中训练的最大节点数。 控制多节点分布式训练。 整数 (int)
maxTrials AutoML 迭代数。 整数 (int)
超时 AutoML 作业超时。 字符串
trialTimeout (试用超时) 单个 HD 试用版的超时。 字符串

节点

名称 DESCRIPTION 价值
nodesValueType 对于 AllNodes 类型,设置为“All”。 “全部”(必需)

目的

名称 DESCRIPTION 价值
目标 [必需]定义超参数优化支持的指标目标 “最大化”
“最小化”(必需)
primaryMetric [必需]要优化的指标的名称。 字符串

约束:
模式 = [a-zA-Z0-9_] (必需)

管道作业

名称 DESCRIPTION 价值
输入 管道作业的输入。 管道作业输入
工作 作业构造管道作业。 PipelineJobJob 作业
职位类型 [必需]指定作业的类型。 “Pipeline”(必需)
输出 管道作业的输出 PipelineJobOutputs
设置 管道设置,例如 ContinueRunOnStepFailure 等。 任何
源作业 ID 源作业的 ARM 资源 ID。 字符串

管道作业输入

名称 DESCRIPTION 价值

PipelineJobJob 作业

名称 DESCRIPTION 价值

PipelineJobOutputs

名称 DESCRIPTION 价值

PyTorch

名称 DESCRIPTION 价值
distributionType [必需]指定分发框架的类型。 “PyTorch”(必需)
processCountPerInstance 每个节点的进程数。 整数 (int)

RandomSamplingAlgorithm 算法

名称 DESCRIPTION 价值
规则 随机算法的特定类型 “Random”
“Sobol”
采样算法类型 [必需]用于生成超参数值的算法以及配置属性 “Random”(必需)
种子 用作随机数生成的种子的可选整数 整数 (int)

回归

名称 DESCRIPTION 价值
cvSplitColumnNames 用于 CVSplit 数据的列。 字符串[]
featurizationSettings AutoML 作业所需的特征化输入。 TableVerticalFeaturizationSettings
固定参数 在整个训练过程中将保持不变的模型/训练参数。 TableFixedParameters (表固定参数)
limitSettings AutoMLJob 的执行约束。 TableVerticalLimitSettings
nCrossValidations 要应用于训练数据集的交叉验证折叠数
如果未提供验证数据集,则为 。
NCross验证
primaryMetric 回归任务的主要指标。 “NormalizedMeanAbsoluteError”
“NormalizedRootMeanSquaredError”
“R2Score”
'SpearmanCorrelation'
搜索空间 用于采样模型及其超参数的不同组合的搜索空间。 TableParameterSubspace[]
扫描设置 模型扫描和超参数优化的设置。 TableSweepSettings (表格扫描设置)
任务类型 [必需]AutoMLJob 的任务类型。 “回归”(必需)
测试数据 测试数据输入。 MLTableJobInput
testDataSize 需要为验证目的预留的测试数据集的分数。
介于 (0.0、 1.0) 之间的值
未提供验证数据集时应用。
整数 (int)
trainingSettings AutoML 作业训练阶段的输入。 回归训练设置
validationData (验证数据) 验证数据输入。 MLTableJobInput
validationDataSize 需要留出用于验证的定型数据集的分数。
介于 (0.0、 1.0) 之间的值
未提供验证数据集时应用。
整数 (int)
权重列名称 示例权重列的名称。 自动化 ML 支持加权列作为输入,导致数据中的行向上或向下加权。 字符串

回归训练设置

名称 DESCRIPTION 价值
allowedTrainingAlgorithms 回归任务的允许模型。 包含任一项的字符串数组:
“DecisionTree”
“ElasticNet”
“ExtremeRandomTrees”
“GradientBoosting”
“KNN”
“LassoLars”
“LightGBM”
“RandomForest”
“ZN”
“XGBoostRegressor”
blockedTrainingAlgorithms 回归任务的阻止模型。 包含任一项的字符串数组:
“DecisionTree”
“ElasticNet”
“ExtremeRandomTrees”
“GradientBoosting”
“KNN”
“LassoLars”
“LightGBM”
“RandomForest”
“ZN”
“XGBoostRegressor”
enableDnnTraining 启用 DNN 模型的建议。 布尔
enableModelExplainability 标志以在最佳模型上启用可解释性。 布尔
enableOnnxCompatibleModels 用于启用 onnx 兼容模型的标志。 布尔
enableStackEnsemble 启用堆栈合奏运行。 布尔
enableVoteEnsemble 启用投票合奏运行。 布尔
ensembleModelDownloadTimeout 在 VotingEnsemble 和 StackEnsemble 模型生成期间,将下载先前子运行中的多个拟合模型。
如果需要更多时间,请将此参数配置为大于 300 秒的值。
字符串
stackEnsembleSettings 堆栈合奏的堆栈合奏设置。 StackEnsembleSettings

ResourceBaseProperties

名称 DESCRIPTION 价值

ResourceBaseTags

名称 DESCRIPTION 价值

ResourceConfigurationProperties

名称 DESCRIPTION 价值

采样算法

名称 DESCRIPTION 价值
采样算法类型 设置为 “Bayesian”类型的 BayesianSamplingAlgorithm。 设置为 GridSamplingAlgorithm 类型的“Grid”。 设置为 RandomSamplingAlgorithm 类型的“Random”。 “贝贝西亚语”
“Grid”
“Random”(必需)

季节性

名称 DESCRIPTION 价值
模式 设置为“ AutoSeasonality”类型为“自动”。 设置为“ CustomSeasonality”类型。 “Auto”
“Custom”(必需)

SparkJob

名称 DESCRIPTION 价值
档案 存档作业中使用的文件。 字符串[]
参数 作业的参数。 字符串
代码 Id [必需]代码资产的 ARM 资源 ID。 字符串

约束:
模式 = [a-zA-Z0-9_] (必需)
会议 Spark 配置的属性。 SparkJobConf 函数
输入 [必需]在启动作业时要执行的条目。 SparkJobEntry (必需)
环境 ID 作业的环境规范的 ARM 资源 ID。 字符串
文件 作业中使用的文件。 字符串[]
输入 作业中使用的输入数据绑定的映射。 SparkJobInputs
罐子 作业中使用的 Jar 文件。 字符串[]
职位类型 [必需]指定作业的类型。 “Spark”(必需)
输出 作业中使用的输出数据绑定的映射。 SparkJob输出
py文件 作业中使用的 Python 文件。 字符串[]
资源 作业的计算资源配置。 SparkResourceConfiguration

SparkJobConf 函数

名称 DESCRIPTION 价值

SparkJobEntry

名称 DESCRIPTION 价值
sparkJobEntryType 设置为 SparkJobPythonEntry 类型的“SparkJobPythonEntry”。 设置为“ SparkJobScalaEntry”类型的“SparkJobScalaEntry”。 “SparkJobPythonEntry”
“SparkJobScalaEntry”(必需)

SparkJobInputs

名称 DESCRIPTION 价值

SparkJob输出

名称 DESCRIPTION 价值

SparkJobPython条目

名称 DESCRIPTION 价值
文件 [必需]作业入口点的相对 python 文件路径。 字符串

约束:
最小长度 = 1
模式 = [a-zA-Z0-9_] (必需)
sparkJobEntryType [必需]作业入口点的类型。 “SparkJobPythonEntry”(必需)

SparkJobScalaEntry

名称 DESCRIPTION 价值
类名 [必需]用作入口点的 Scala 类名称。 字符串

约束:
最小长度 = 1
模式 = [a-zA-Z0-9_] (必需)
sparkJobEntryType [必需]作业入口点的类型。 “SparkJobScalaEntry”(必需)

SparkResourceConfiguration

名称 DESCRIPTION 价值
instanceType 计算目标支持的可选 VM 类型。 字符串
runtimeVersion (运行时版本) 用于作业的 spark 运行时的版本。 字符串

StackEnsembleSettings

名称 DESCRIPTION 价值
stackMetaLearnerKWargs 要传递给元学习器初始值设定项的可选参数。 任何
stackMetaLearnerTrainPercentage 指定要保留用于训练元学习者的训练集(选择训练和训练类型的训练)的比例。 默认值为 0.2。 整数 (int)
stackMetaLearnerType 元学习器是在单个异类模型的输出上训练的模型。 “ElasticNet”
“ElasticNetCV”
“LightGBMClassifier”
“LightGBMRegressor”
“LinearRegression”
“LogisticRegression”
“LogisticRegressionCV”
“None”

SweepJob (扫描作业)

名称 DESCRIPTION 价值
early终止 提前终止策略可在完成之前取消性能不佳的运行 提前终止政策
输入 作业中使用的输入数据绑定的映射。 SweepJobInputs
职位类型 [必需]指定作业的类型。 “扫描”(必需)
限制 扫描作业限制。 SweepJobLimits (扫描作业限制)
目的 [必需]优化目标。 目标 (必需)
输出 作业中使用的输出数据绑定的映射。 SweepJobOutputs (扫描作业输出)
sampling算法 [必需]超参数采样算法 SamplingAlgorithm (必需)
搜索空间 [必需]包含每个参数及其分布的字典。 字典键是参数的名称 任何(必需)
试用 [必需]试用组件定义。 TrialComponent (必需)

SweepJobInputs

名称 DESCRIPTION 价值

SweepJobLimits (扫描作业限制)

名称 DESCRIPTION 价值
jobLimits类型 [必需]JobLimit 类型。 “Command”
“扫描”(必需)
maxConcurrentTrials 扫描作业最大并发试用版。 整数 (int)
maxTotalTrials 扫描作业最大总试用版数。 整数 (int)
超时 ISO 8601 格式的最大运行持续时间,之后作业将被取消。 仅支持精度为秒的持续时间。 字符串
trialTimeout (试用超时) 扫描作业试用超时值。 字符串

SweepJobOutputs (扫描作业输出)

名称 DESCRIPTION 价值

TableFixedParameters (表固定参数)

名称 DESCRIPTION 价值
助 推 器 指定提升类型,例如 XGBoost 的 gbdt。 字符串
boosting类型 指定提升类型,例如 LightGBM 的 gbdt。 字符串
增长策略 指定增长策略,该策略控制新节点添加到树的方式。 字符串
learningRate 训练过程的学习速率。 整数 (int)
最大 Bin 指定存储桶连续功能的最大离散箱数。 整数 (int)
最大深度 指定显式限制树深度的最大深度。 整数 (int)
最大叶数 指定显式限制树叶的最大叶数。 整数 (int)
minDataInLeaf 的 每个叶的最小数据数。 整数 (int)
minSplitGain 最小分度增益 在树的叶节点上进行进一步分区所需的最小损失减少。 整数 (int)
模型名称 要训练的模型的名称。 字符串
nEstimator 指定模型中的树数(或舍入)。 整数 (int)
叶数 指定叶数。 整数 (int)
preprocessorName 要使用的预处理器的名称。 字符串
regAlpha 权重的 L1 正则化术语。 整数 (int)
regLambda L2 权重的正则化术语。 整数 (int)
子样本 训练实例的子采样比率。 整数 (int)
subsampleFreq 子采样的频率。 整数 (int)
treeMethod 指定树方法。 字符串
withMean 如果为 true,在使用 StandardScalar 缩放数据之前居中。 布尔
withStd 如果为 true,请使用 StandardScalar 缩放具有单位方差的数据。 布尔

TableParameterSubspace

名称 DESCRIPTION 价值
助 推 器 指定提升类型,例如 XGBoost 的 gbdt。 字符串
boosting类型 指定提升类型,例如 LightGBM 的 gbdt。 字符串
增长策略 指定增长策略,该策略控制新节点添加到树的方式。 字符串
learningRate 训练过程的学习速率。 字符串
最大 Bin 指定存储桶连续功能的最大离散箱数。 字符串
最大深度 指定显式限制树深度的最大深度。 字符串
最大叶数 指定显式限制树叶的最大叶数。 字符串
minDataInLeaf 的 每个叶的最小数据数。 字符串
minSplitGain 最小分度增益 在树的叶节点上进行进一步分区所需的最小损失减少。 字符串
模型名称 要训练的模型的名称。 字符串
nEstimator 指定模型中的树数(或舍入)。 字符串
叶数 指定叶数。 字符串
preprocessorName 要使用的预处理器的名称。 字符串
regAlpha 权重的 L1 正则化术语。 字符串
regLambda L2 权重的正则化术语。 字符串
子样本 训练实例的子采样比率。 字符串
subsampleFreq 子采样的频率 字符串
treeMethod 指定树方法。 字符串
withMean 如果为 true,在使用 StandardScalar 缩放数据之前居中。 字符串
withStd 如果为 true,请使用 StandardScalar 缩放具有单位方差的数据。 字符串

TableSweepSettings (表格扫描设置)

名称 DESCRIPTION 价值
early终止 扫描作业的提前终止策略的类型。 提前终止政策
sampling算法 [必需]采样算法的类型。 “贝贝西亚语”
“Grid”
“Random”(必需)

TableVerticalFeaturizationSettings

名称 DESCRIPTION 价值
阻塞变压器 这些转换器不应用于特征化。 包含任一项的字符串数组:
“CatTargetEncoder”
“CountVectorizer”
“HashOneHotEncoder”
“LabelEncoder”
“NaiveBayes”
“OneHotEncoder”
“TextTargetEncoder”
“TfIdf”
“WoETargetEncoder”
“WordEmbedding”
columnNameAnd类型 列名及其类型(int、float、string、datetime 等)的字典。 TableVerticalFeaturizationSettingsColumnNameAndTypes
datasetLanguage 数据集语言,适用于文本数据。 字符串
enableDnnFeaturization 确定是否使用基于 Dnn 的特征化器进行数据特征化。 布尔
模式 特征化模式 - 用户可以保留默认的“自动”模式,AutoML 将负责在特征化阶段对数据进行必要的转换。
如果选择了“关闭”,则不会完成特征化。
如果选择“自定义”,则用户可以指定其他输入以自定义特征化完成方式。
“Auto”
“Custom”
“关闭”
transformer参数 用户可以指定要用于的其他转换器以及要向其应用它的列以及转换器构造函数的参数。 TableVerticalFeaturizationSettingsTransformerParams

TableVerticalFeaturizationSettingsColumnNameAndTypes

名称 DESCRIPTION 价值

TableVerticalFeaturizationSettingsTransformerParams

名称 DESCRIPTION 价值

TableVerticalLimitSettings

名称 DESCRIPTION 价值
enableEarlyTermination 启用提前终止,确定如果最近 20 次迭代中没有分数改进,AutoMLJob 是否会提前终止。 布尔
退出评分 AutoML 作业的退出分数。 整数 (int)
maxConcurrentTrials 最大并发迭代数。 整数 (int)
maxCoresPerTrial 每次迭代的最大核心数。 整数 (int)
maxTrials 迭代数。 整数 (int)
sweepConcurrentTrials 用户想要触发的并发扫描运行数。 整数 (int)
sweepTrials 用户想要触发的扫描运行数。 整数 (int)
超时 AutoML 作业超时。 字符串
trialTimeout (试用超时) 迭代超时。 字符串

目标滞后

名称 DESCRIPTION 价值
模式 对于 AutoTargetLags 类型,设置为“自动”。 设置为 CustomTargetLags 类型的“Custom”。 “Auto”
“Custom”(必需)

TargetRollingWindowSize

名称 DESCRIPTION 价值
模式 设置为“ AutoTargetRollingWindowSize”类型的“自动”。 设置为 CustomTargetRollingWindowSize 类型的“Custom”。 “Auto”
“Custom”(必需)

TensorFlow

名称 DESCRIPTION 价值
distributionType [必需]指定分发框架的类型。 “TensorFlow”(必需)
parameterServerCount 参数服务器任务数。 整数 (int)
workerCount 工人计数 工人数。 如果未指定,则默认为实例计数。 整数 (int)

文本分类

名称 DESCRIPTION 价值
featurizationSettings AutoML 作业所需的特征化输入。 NlpVerticalFeaturizationSettings
固定参数 在整个训练过程中将保持不变的模型/训练参数。 NlpFixedParameters
limitSettings AutoMLJob 的执行约束。 NlpVerticalLimitSettings
primaryMetric Text-Classification 任务的主要指标。 “准确性”
“AUCWeighted”
“AveragePrecisionScoreWeighted”
“NormMacroRecall”
“PrecisionScoreWeighted”
搜索空间 用于采样模型及其超参数的不同组合的搜索空间。 NlpParameterSubspace[]
扫描设置 模型扫描和超参数优化的设置。 NlpSweepSettings
任务类型 [必需]AutoMLJob 的任务类型。 “TextClassification”(必需)
validationData (验证数据) 验证数据输入。 MLTableJobInput

TextClassificationMultilabel

名称 DESCRIPTION 价值
featurizationSettings AutoML 作业所需的特征化输入。 NlpVerticalFeaturizationSettings
固定参数 在整个训练过程中将保持不变的模型/训练参数。 NlpFixedParameters
limitSettings AutoMLJob 的执行约束。 NlpVerticalLimitSettings
搜索空间 用于采样模型及其超参数的不同组合的搜索空间。 NlpParameterSubspace[]
扫描设置 模型扫描和超参数优化的设置。 NlpSweepSettings
任务类型 [必需]AutoMLJob 的任务类型。 “TextClassificationMultilabel”(必需)
validationData (验证数据) 验证数据输入。 MLTableJobInput

TextNer (文本生成器)

名称 DESCRIPTION 价值
featurizationSettings AutoML 作业所需的特征化输入。 NlpVerticalFeaturizationSettings
固定参数 在整个训练过程中将保持不变的模型/训练参数。 NlpFixedParameters
limitSettings AutoMLJob 的执行约束。 NlpVerticalLimitSettings
搜索空间 用于采样模型及其超参数的不同组合的搜索空间。 NlpParameterSubspace[]
扫描设置 模型扫描和超参数优化的设置。 NlpSweepSettings
任务类型 [必需]AutoMLJob 的任务类型。 “TextNER”(必需)
validationData (验证数据) 验证数据输入。 MLTableJobInput

TrialComponent (试用组件)

名称 DESCRIPTION 价值
代码 Id 代码资产的 ARM 资源 ID。 字符串
指令 [必需]在启动作业时执行的命令。 例如 “python train.py” 字符串

约束:
最小长度 = 1
模式 = [a-zA-Z0-9_] (必需)
分配 作业的分发配置。 如果已设置,则应为 Mpi、Tensorflow、PyTorch 或 null 之一。 分发配置
环境 ID [必需]作业的环境规范的 ARM 资源 ID。 字符串

约束:
模式 = [a-zA-Z0-9_] (必需)
环境变量 作业中包含的环境变量。 TrialComponentEnvironmentVariables
资源 作业的计算资源配置。 JobResourceConfiguration

TrialComponentEnvironmentVariables

名称 DESCRIPTION 价值

TritonModelJobInput

名称 DESCRIPTION 价值
jobInputType (作业输入类型) [必需]指定作业的类型。 “triton_model”(必需)
模式 输入资产传送模式。 “Direct”
“下载”
“EvalDownload”
“EvalMount”
“ReadOnlyMount”
“ReadWriteMount”
URI [必需]输入资产 URI。 字符串

约束:
模式 = [a-zA-Z0-9_] (必需)

TritonModelJobOutput

名称 DESCRIPTION 价值
jobOutputType [必需]指定作业的类型。 “triton_model”(必需)
模式 输出资产传送模式。 “Direct”
“ReadWriteMount”
“Upload”
URI 输出资产 URI。 字符串

截断选择策略

名称 DESCRIPTION 价值
policyType [必需]策略配置的名称 “TruncationSelection”(必需)
截断百分比 要在每个评估间隔取消的运行百分比。 整数 (int)

UriFileJobInput

名称 DESCRIPTION 价值
jobInputType (作业输入类型) [必需]指定作业的类型。 “uri_file”(必需)
模式 输入资产传送模式。 “Direct”
“下载”
“EvalDownload”
“EvalMount”
“ReadOnlyMount”
“ReadWriteMount”
URI [必需]输入资产 URI。 字符串

约束:
模式 = [a-zA-Z0-9_] (必需)

UriFileJobOutput

名称 DESCRIPTION 价值
jobOutputType [必需]指定作业的类型。 “uri_file”(必需)
模式 输出资产传送模式。 “Direct”
“ReadWriteMount”
“Upload”
URI 输出资产 URI。 字符串

UriFolderJobInput

名称 DESCRIPTION 价值
jobInputType (作业输入类型) [必需]指定作业的类型。 “uri_folder”(必需)
模式 输入资产传送模式。 “Direct”
“下载”
“EvalDownload”
“EvalMount”
“ReadOnlyMount”
“ReadWriteMount”
URI [必需]输入资产 URI。 字符串

约束:
模式 = [a-zA-Z0-9_] (必需)

UriFolderJobOutput

名称 DESCRIPTION 价值
jobOutputType [必需]指定作业的类型。 “uri_folder”(必需)
模式 输出资产传送模式。 “Direct”
“ReadWriteMount”
“Upload”
URI 输出资产 URI。 字符串

用户身份

名称 DESCRIPTION 价值
身份类型 [必需]指定标识框架的类型。 “UserIdentity”(必需)

用法示例

Azure 快速入门模板

以下 Azure 快速入门模板 部署此资源类型。

模板 DESCRIPTION
创建 Azure 机器学习 AutoML 分类作业

部署到 Azure
此模板创建一个 Azure 机器学习 AutoML 分类作业,以找出用于预测客户是否会与金融机构订阅固定期存款的最佳模型。
创建 Azure 机器学习命令作业

部署到 Azure
此模板使用基本hello_world脚本创建 Azure 机器学习命令作业
创建 Azure 机器学习扫描作业

部署到 Azure
此模板创建用于超参数优化的 Azure 机器学习扫描作业。

Terraform (AzAPI 提供程序)资源定义

可以使用目标作部署工作区/作业资源类型:

  • 资源组

有关每个 API 版本中已更改属性的列表,请参阅 更改日志

资源格式

若要创建 Microsoft.MachineLearningServices/workspaces/jobs 资源,请将以下 Terraform 添加到模板。

resource "azapi_resource" "symbolicname" {
  type = "Microsoft.MachineLearningServices/workspaces/jobs@2022-10-01-preview"
  name = "string"
  parent_id = "string"
  body = {
    properties = {
      componentId = "string"
      computeId = "string"
      description = "string"
      displayName = "string"
      experimentName = "string"
      identity = {
        identityType = "string"
        // For remaining properties, see IdentityConfiguration objects
      }
      isArchived = bool
      properties = {
        {customized property} = "string"
      }
      services = {
        {customized property} = {
          endpoint = "string"
          jobServiceType = "string"
          nodes = {
            nodesValueType = "string"
            // For remaining properties, see Nodes objects
          }
          port = int
          properties = {
            {customized property} = "string"
          }
        }
      }
      tags = {
        {customized property} = "string"
      }
      jobType = "string"
      // For remaining properties, see JobBaseProperties objects
    }
  }
}

季节性对象

设置 模式 属性以指定对象的类型。

对于 自动,请使用:

{
  mode = "Auto"
}

对于 “自定义”,请使用:

{
  mode = "Custom"
  value = int
}

ForecastHorizon 对象

设置 模式 属性以指定对象的类型。

对于 自动,请使用:

{
  mode = "Auto"
}

对于 “自定义”,请使用:

{
  mode = "Custom"
  value = int
}

JobOutput 对象

设置 jobOutputType 属性以指定对象的类型。

对于 custom_model,请使用:

{
  jobOutputType = "custom_model"
  mode = "string"
  uri = "string"
}

对于 mlflow_model,请使用:

{
  jobOutputType = "mlflow_model"
  mode = "string"
  uri = "string"
}

对于 mltable,请使用:

{
  jobOutputType = "mltable"
  mode = "string"
  uri = "string"
}

对于 triton_model,请使用:

{
  jobOutputType = "triton_model"
  mode = "string"
  uri = "string"
}

对于 uri_file,请使用:

{
  jobOutputType = "uri_file"
  mode = "string"
  uri = "string"
}

对于 uri_folder,请使用:

{
  jobOutputType = "uri_folder"
  mode = "string"
  uri = "string"
}

IdentityConfiguration 对象

设置 identityType 属性以指定对象的类型。

对于 AMLToken,请使用:

{
  identityType = "AMLToken"
}

对于 托管,请使用:

{
  clientId = "string"
  identityType = "Managed"
  objectId = "string"
  resourceId = "string"
}

对于 UserIdentity,请使用:

{
  identityType = "UserIdentity"
}

DistributionConfiguration 对象

设置 distributionType 属性以指定对象的类型。

对于 Mpi,请使用:

{
  distributionType = "Mpi"
  processCountPerInstance = int
}

对于 PyTorch,请使用:

{
  distributionType = "PyTorch"
  processCountPerInstance = int
}

对于 TensorFlow,请使用:

{
  distributionType = "TensorFlow"
  parameterServerCount = int
  workerCount = int
}

MLAssistConfiguration 对象

设置 mlAssist 属性以指定对象的类型。

对于 禁用,请使用:

{
  mlAssist = "Disabled"
}

对于 “已启用”,请使用:

{
  inferencingComputeBinding = "string"
  mlAssist = "Enabled"
  trainingComputeBinding = "string"
}

EarlyTerminationPolicy 对象

设置 policyType 属性以指定对象的类型。

对于 Bandit,请使用:

{
  policyType = "Bandit"
  slackAmount = int
  slackFactor = int
}

对于 MedianStopping,请使用:

{
  policyType = "MedianStopping"
}

对于 TruncationSelection,请使用:

{
  policyType = "TruncationSelection"
  truncationPercentage = int
}

TargetRollingWindowSize 对象

设置 模式 属性以指定对象的类型。

对于 自动,请使用:

{
  mode = "Auto"
}

对于 “自定义”,请使用:

{
  mode = "Custom"
  value = int
}

SparkJobEntry 对象

设置 sparkJobEntryType 属性以指定对象的类型。

对于 SparkJobPythonEntry,请使用:

{
  file = "string"
  sparkJobEntryType = "SparkJobPythonEntry"
}

对于 SparkJobScalaEntry,请使用:

{
  className = "string"
  sparkJobEntryType = "SparkJobScalaEntry"
}

AutoMLVertical 对象

设置 taskType 属性以指定对象的类型。

对于 分类,请使用:

{
  cvSplitColumnNames = [
    "string"
  ]
  featurizationSettings = {
    blockedTransformers = [
      "string"
    ]
    columnNameAndTypes = {
      {customized property} = "string"
    }
    datasetLanguage = "string"
    enableDnnFeaturization = bool
    mode = "string"
    transformerParams = {
      {customized property} = [
        {
          fields = [
            "string"
          ]
          parameters = ?
        }
      ]
    }
  }
  fixedParameters = {
    booster = "string"
    boostingType = "string"
    growPolicy = "string"
    learningRate = int
    maxBin = int
    maxDepth = int
    maxLeaves = int
    minDataInLeaf = int
    minSplitGain = int
    modelName = "string"
    nEstimators = int
    numLeaves = int
    preprocessorName = "string"
    regAlpha = int
    regLambda = int
    subsample = int
    subsampleFreq = int
    treeMethod = "string"
    withMean = bool
    withStd = bool
  }
  limitSettings = {
    enableEarlyTermination = bool
    exitScore = int
    maxConcurrentTrials = int
    maxCoresPerTrial = int
    maxTrials = int
    sweepConcurrentTrials = int
    sweepTrials = int
    timeout = "string"
    trialTimeout = "string"
  }
  nCrossValidations = {
    mode = "string"
    // For remaining properties, see NCrossValidations objects
  }
  positiveLabel = "string"
  primaryMetric = "string"
  searchSpace = [
    {
      booster = "string"
      boostingType = "string"
      growPolicy = "string"
      learningRate = "string"
      maxBin = "string"
      maxDepth = "string"
      maxLeaves = "string"
      minDataInLeaf = "string"
      minSplitGain = "string"
      modelName = "string"
      nEstimators = "string"
      numLeaves = "string"
      preprocessorName = "string"
      regAlpha = "string"
      regLambda = "string"
      subsample = "string"
      subsampleFreq = "string"
      treeMethod = "string"
      withMean = "string"
      withStd = "string"
    }
  ]
  sweepSettings = {
    earlyTermination = {
      delayEvaluation = int
      evaluationInterval = int
      policyType = "string"
      // For remaining properties, see EarlyTerminationPolicy objects
    }
    samplingAlgorithm = "string"
  }
  taskType = "Classification"
  testData = {
    description = "string"
    jobInputType = "string"
    mode = "string"
    uri = "string"
  }
  testDataSize = int
  trainingSettings = {
    allowedTrainingAlgorithms = [
      "string"
    ]
    blockedTrainingAlgorithms = [
      "string"
    ]
    enableDnnTraining = bool
    enableModelExplainability = bool
    enableOnnxCompatibleModels = bool
    enableStackEnsemble = bool
    enableVoteEnsemble = bool
    ensembleModelDownloadTimeout = "string"
    stackEnsembleSettings = {
      stackMetaLearnerKWargs = ?
      stackMetaLearnerTrainPercentage = int
      stackMetaLearnerType = "string"
    }
  }
  validationData = {
    description = "string"
    jobInputType = "string"
    mode = "string"
    uri = "string"
  }
  validationDataSize = int
  weightColumnName = "string"
}

对于 预测,请使用:

{
  cvSplitColumnNames = [
    "string"
  ]
  featurizationSettings = {
    blockedTransformers = [
      "string"
    ]
    columnNameAndTypes = {
      {customized property} = "string"
    }
    datasetLanguage = "string"
    enableDnnFeaturization = bool
    mode = "string"
    transformerParams = {
      {customized property} = [
        {
          fields = [
            "string"
          ]
          parameters = ?
        }
      ]
    }
  }
  fixedParameters = {
    booster = "string"
    boostingType = "string"
    growPolicy = "string"
    learningRate = int
    maxBin = int
    maxDepth = int
    maxLeaves = int
    minDataInLeaf = int
    minSplitGain = int
    modelName = "string"
    nEstimators = int
    numLeaves = int
    preprocessorName = "string"
    regAlpha = int
    regLambda = int
    subsample = int
    subsampleFreq = int
    treeMethod = "string"
    withMean = bool
    withStd = bool
  }
  forecastingSettings = {
    countryOrRegionForHolidays = "string"
    cvStepSize = int
    featureLags = "string"
    forecastHorizon = {
      mode = "string"
      // For remaining properties, see ForecastHorizon objects
    }
    frequency = "string"
    seasonality = {
      mode = "string"
      // For remaining properties, see Seasonality objects
    }
    shortSeriesHandlingConfig = "string"
    targetAggregateFunction = "string"
    targetLags = {
      mode = "string"
      // For remaining properties, see TargetLags objects
    }
    targetRollingWindowSize = {
      mode = "string"
      // For remaining properties, see TargetRollingWindowSize objects
    }
    timeColumnName = "string"
    timeSeriesIdColumnNames = [
      "string"
    ]
    useStl = "string"
  }
  limitSettings = {
    enableEarlyTermination = bool
    exitScore = int
    maxConcurrentTrials = int
    maxCoresPerTrial = int
    maxTrials = int
    sweepConcurrentTrials = int
    sweepTrials = int
    timeout = "string"
    trialTimeout = "string"
  }
  nCrossValidations = {
    mode = "string"
    // For remaining properties, see NCrossValidations objects
  }
  primaryMetric = "string"
  searchSpace = [
    {
      booster = "string"
      boostingType = "string"
      growPolicy = "string"
      learningRate = "string"
      maxBin = "string"
      maxDepth = "string"
      maxLeaves = "string"
      minDataInLeaf = "string"
      minSplitGain = "string"
      modelName = "string"
      nEstimators = "string"
      numLeaves = "string"
      preprocessorName = "string"
      regAlpha = "string"
      regLambda = "string"
      subsample = "string"
      subsampleFreq = "string"
      treeMethod = "string"
      withMean = "string"
      withStd = "string"
    }
  ]
  sweepSettings = {
    earlyTermination = {
      delayEvaluation = int
      evaluationInterval = int
      policyType = "string"
      // For remaining properties, see EarlyTerminationPolicy objects
    }
    samplingAlgorithm = "string"
  }
  taskType = "Forecasting"
  testData = {
    description = "string"
    jobInputType = "string"
    mode = "string"
    uri = "string"
  }
  testDataSize = int
  trainingSettings = {
    allowedTrainingAlgorithms = [
      "string"
    ]
    blockedTrainingAlgorithms = [
      "string"
    ]
    enableDnnTraining = bool
    enableModelExplainability = bool
    enableOnnxCompatibleModels = bool
    enableStackEnsemble = bool
    enableVoteEnsemble = bool
    ensembleModelDownloadTimeout = "string"
    stackEnsembleSettings = {
      stackMetaLearnerKWargs = ?
      stackMetaLearnerTrainPercentage = int
      stackMetaLearnerType = "string"
    }
  }
  validationData = {
    description = "string"
    jobInputType = "string"
    mode = "string"
    uri = "string"
  }
  validationDataSize = int
  weightColumnName = "string"
}

对于 ImageClassification,请使用:

{
  limitSettings = {
    maxConcurrentTrials = int
    maxTrials = int
    timeout = "string"
  }
  modelSettings = {
    advancedSettings = "string"
    amsGradient = bool
    augmentations = "string"
    beta1 = int
    beta2 = int
    checkpointFrequency = int
    checkpointModel = {
      description = "string"
      jobInputType = "string"
      mode = "string"
      uri = "string"
    }
    checkpointRunId = "string"
    distributed = bool
    earlyStopping = bool
    earlyStoppingDelay = int
    earlyStoppingPatience = int
    enableOnnxNormalization = bool
    evaluationFrequency = int
    gradientAccumulationStep = int
    layersToFreeze = int
    learningRate = int
    learningRateScheduler = "string"
    modelName = "string"
    momentum = int
    nesterov = bool
    numberOfEpochs = int
    numberOfWorkers = int
    optimizer = "string"
    randomSeed = int
    stepLRGamma = int
    stepLRStepSize = int
    trainingBatchSize = int
    trainingCropSize = int
    validationBatchSize = int
    validationCropSize = int
    validationResizeSize = int
    warmupCosineLRCycles = int
    warmupCosineLRWarmupEpochs = int
    weightDecay = int
    weightedLoss = int
  }
  primaryMetric = "string"
  searchSpace = [
    {
      amsGradient = "string"
      augmentations = "string"
      beta1 = "string"
      beta2 = "string"
      distributed = "string"
      earlyStopping = "string"
      earlyStoppingDelay = "string"
      earlyStoppingPatience = "string"
      enableOnnxNormalization = "string"
      evaluationFrequency = "string"
      gradientAccumulationStep = "string"
      layersToFreeze = "string"
      learningRate = "string"
      learningRateScheduler = "string"
      modelName = "string"
      momentum = "string"
      nesterov = "string"
      numberOfEpochs = "string"
      numberOfWorkers = "string"
      optimizer = "string"
      randomSeed = "string"
      stepLRGamma = "string"
      stepLRStepSize = "string"
      trainingBatchSize = "string"
      trainingCropSize = "string"
      validationBatchSize = "string"
      validationCropSize = "string"
      validationResizeSize = "string"
      warmupCosineLRCycles = "string"
      warmupCosineLRWarmupEpochs = "string"
      weightDecay = "string"
      weightedLoss = "string"
    }
  ]
  sweepSettings = {
    earlyTermination = {
      delayEvaluation = int
      evaluationInterval = int
      policyType = "string"
      // For remaining properties, see EarlyTerminationPolicy objects
    }
    samplingAlgorithm = "string"
  }
  taskType = "ImageClassification"
  validationData = {
    description = "string"
    jobInputType = "string"
    mode = "string"
    uri = "string"
  }
  validationDataSize = int
}

对于 ImageClassificationMultilabel,请使用:

{
  limitSettings = {
    maxConcurrentTrials = int
    maxTrials = int
    timeout = "string"
  }
  modelSettings = {
    advancedSettings = "string"
    amsGradient = bool
    augmentations = "string"
    beta1 = int
    beta2 = int
    checkpointFrequency = int
    checkpointModel = {
      description = "string"
      jobInputType = "string"
      mode = "string"
      uri = "string"
    }
    checkpointRunId = "string"
    distributed = bool
    earlyStopping = bool
    earlyStoppingDelay = int
    earlyStoppingPatience = int
    enableOnnxNormalization = bool
    evaluationFrequency = int
    gradientAccumulationStep = int
    layersToFreeze = int
    learningRate = int
    learningRateScheduler = "string"
    modelName = "string"
    momentum = int
    nesterov = bool
    numberOfEpochs = int
    numberOfWorkers = int
    optimizer = "string"
    randomSeed = int
    stepLRGamma = int
    stepLRStepSize = int
    trainingBatchSize = int
    trainingCropSize = int
    validationBatchSize = int
    validationCropSize = int
    validationResizeSize = int
    warmupCosineLRCycles = int
    warmupCosineLRWarmupEpochs = int
    weightDecay = int
    weightedLoss = int
  }
  primaryMetric = "string"
  searchSpace = [
    {
      amsGradient = "string"
      augmentations = "string"
      beta1 = "string"
      beta2 = "string"
      distributed = "string"
      earlyStopping = "string"
      earlyStoppingDelay = "string"
      earlyStoppingPatience = "string"
      enableOnnxNormalization = "string"
      evaluationFrequency = "string"
      gradientAccumulationStep = "string"
      layersToFreeze = "string"
      learningRate = "string"
      learningRateScheduler = "string"
      modelName = "string"
      momentum = "string"
      nesterov = "string"
      numberOfEpochs = "string"
      numberOfWorkers = "string"
      optimizer = "string"
      randomSeed = "string"
      stepLRGamma = "string"
      stepLRStepSize = "string"
      trainingBatchSize = "string"
      trainingCropSize = "string"
      validationBatchSize = "string"
      validationCropSize = "string"
      validationResizeSize = "string"
      warmupCosineLRCycles = "string"
      warmupCosineLRWarmupEpochs = "string"
      weightDecay = "string"
      weightedLoss = "string"
    }
  ]
  sweepSettings = {
    earlyTermination = {
      delayEvaluation = int
      evaluationInterval = int
      policyType = "string"
      // For remaining properties, see EarlyTerminationPolicy objects
    }
    samplingAlgorithm = "string"
  }
  taskType = "ImageClassificationMultilabel"
  validationData = {
    description = "string"
    jobInputType = "string"
    mode = "string"
    uri = "string"
  }
  validationDataSize = int
}

对于 ImageInstanceSegmentation,请使用:

{
  limitSettings = {
    maxConcurrentTrials = int
    maxTrials = int
    timeout = "string"
  }
  modelSettings = {
    advancedSettings = "string"
    amsGradient = bool
    augmentations = "string"
    beta1 = int
    beta2 = int
    boxDetectionsPerImage = int
    boxScoreThreshold = int
    checkpointFrequency = int
    checkpointModel = {
      description = "string"
      jobInputType = "string"
      mode = "string"
      uri = "string"
    }
    checkpointRunId = "string"
    distributed = bool
    earlyStopping = bool
    earlyStoppingDelay = int
    earlyStoppingPatience = int
    enableOnnxNormalization = bool
    evaluationFrequency = int
    gradientAccumulationStep = int
    imageSize = int
    layersToFreeze = int
    learningRate = int
    learningRateScheduler = "string"
    maxSize = int
    minSize = int
    modelName = "string"
    modelSize = "string"
    momentum = int
    multiScale = bool
    nesterov = bool
    nmsIouThreshold = int
    numberOfEpochs = int
    numberOfWorkers = int
    optimizer = "string"
    randomSeed = int
    stepLRGamma = int
    stepLRStepSize = int
    tileGridSize = "string"
    tileOverlapRatio = int
    tilePredictionsNmsThreshold = int
    trainingBatchSize = int
    validationBatchSize = int
    validationIouThreshold = int
    validationMetricType = "string"
    warmupCosineLRCycles = int
    warmupCosineLRWarmupEpochs = int
    weightDecay = int
  }
  primaryMetric = "string"
  searchSpace = [
    {
      amsGradient = "string"
      augmentations = "string"
      beta1 = "string"
      beta2 = "string"
      boxDetectionsPerImage = "string"
      boxScoreThreshold = "string"
      distributed = "string"
      earlyStopping = "string"
      earlyStoppingDelay = "string"
      earlyStoppingPatience = "string"
      enableOnnxNormalization = "string"
      evaluationFrequency = "string"
      gradientAccumulationStep = "string"
      imageSize = "string"
      layersToFreeze = "string"
      learningRate = "string"
      learningRateScheduler = "string"
      maxSize = "string"
      minSize = "string"
      modelName = "string"
      modelSize = "string"
      momentum = "string"
      multiScale = "string"
      nesterov = "string"
      nmsIouThreshold = "string"
      numberOfEpochs = "string"
      numberOfWorkers = "string"
      optimizer = "string"
      randomSeed = "string"
      stepLRGamma = "string"
      stepLRStepSize = "string"
      tileGridSize = "string"
      tileOverlapRatio = "string"
      tilePredictionsNmsThreshold = "string"
      trainingBatchSize = "string"
      validationBatchSize = "string"
      validationIouThreshold = "string"
      validationMetricType = "string"
      warmupCosineLRCycles = "string"
      warmupCosineLRWarmupEpochs = "string"
      weightDecay = "string"
    }
  ]
  sweepSettings = {
    earlyTermination = {
      delayEvaluation = int
      evaluationInterval = int
      policyType = "string"
      // For remaining properties, see EarlyTerminationPolicy objects
    }
    samplingAlgorithm = "string"
  }
  taskType = "ImageInstanceSegmentation"
  validationData = {
    description = "string"
    jobInputType = "string"
    mode = "string"
    uri = "string"
  }
  validationDataSize = int
}

对于 ImageObjectDetection,请使用:

{
  limitSettings = {
    maxConcurrentTrials = int
    maxTrials = int
    timeout = "string"
  }
  modelSettings = {
    advancedSettings = "string"
    amsGradient = bool
    augmentations = "string"
    beta1 = int
    beta2 = int
    boxDetectionsPerImage = int
    boxScoreThreshold = int
    checkpointFrequency = int
    checkpointModel = {
      description = "string"
      jobInputType = "string"
      mode = "string"
      uri = "string"
    }
    checkpointRunId = "string"
    distributed = bool
    earlyStopping = bool
    earlyStoppingDelay = int
    earlyStoppingPatience = int
    enableOnnxNormalization = bool
    evaluationFrequency = int
    gradientAccumulationStep = int
    imageSize = int
    layersToFreeze = int
    learningRate = int
    learningRateScheduler = "string"
    maxSize = int
    minSize = int
    modelName = "string"
    modelSize = "string"
    momentum = int
    multiScale = bool
    nesterov = bool
    nmsIouThreshold = int
    numberOfEpochs = int
    numberOfWorkers = int
    optimizer = "string"
    randomSeed = int
    stepLRGamma = int
    stepLRStepSize = int
    tileGridSize = "string"
    tileOverlapRatio = int
    tilePredictionsNmsThreshold = int
    trainingBatchSize = int
    validationBatchSize = int
    validationIouThreshold = int
    validationMetricType = "string"
    warmupCosineLRCycles = int
    warmupCosineLRWarmupEpochs = int
    weightDecay = int
  }
  primaryMetric = "string"
  searchSpace = [
    {
      amsGradient = "string"
      augmentations = "string"
      beta1 = "string"
      beta2 = "string"
      boxDetectionsPerImage = "string"
      boxScoreThreshold = "string"
      distributed = "string"
      earlyStopping = "string"
      earlyStoppingDelay = "string"
      earlyStoppingPatience = "string"
      enableOnnxNormalization = "string"
      evaluationFrequency = "string"
      gradientAccumulationStep = "string"
      imageSize = "string"
      layersToFreeze = "string"
      learningRate = "string"
      learningRateScheduler = "string"
      maxSize = "string"
      minSize = "string"
      modelName = "string"
      modelSize = "string"
      momentum = "string"
      multiScale = "string"
      nesterov = "string"
      nmsIouThreshold = "string"
      numberOfEpochs = "string"
      numberOfWorkers = "string"
      optimizer = "string"
      randomSeed = "string"
      stepLRGamma = "string"
      stepLRStepSize = "string"
      tileGridSize = "string"
      tileOverlapRatio = "string"
      tilePredictionsNmsThreshold = "string"
      trainingBatchSize = "string"
      validationBatchSize = "string"
      validationIouThreshold = "string"
      validationMetricType = "string"
      warmupCosineLRCycles = "string"
      warmupCosineLRWarmupEpochs = "string"
      weightDecay = "string"
    }
  ]
  sweepSettings = {
    earlyTermination = {
      delayEvaluation = int
      evaluationInterval = int
      policyType = "string"
      // For remaining properties, see EarlyTerminationPolicy objects
    }
    samplingAlgorithm = "string"
  }
  taskType = "ImageObjectDetection"
  validationData = {
    description = "string"
    jobInputType = "string"
    mode = "string"
    uri = "string"
  }
  validationDataSize = int
}

对于 回归,请使用:

{
  cvSplitColumnNames = [
    "string"
  ]
  featurizationSettings = {
    blockedTransformers = [
      "string"
    ]
    columnNameAndTypes = {
      {customized property} = "string"
    }
    datasetLanguage = "string"
    enableDnnFeaturization = bool
    mode = "string"
    transformerParams = {
      {customized property} = [
        {
          fields = [
            "string"
          ]
          parameters = ?
        }
      ]
    }
  }
  fixedParameters = {
    booster = "string"
    boostingType = "string"
    growPolicy = "string"
    learningRate = int
    maxBin = int
    maxDepth = int
    maxLeaves = int
    minDataInLeaf = int
    minSplitGain = int
    modelName = "string"
    nEstimators = int
    numLeaves = int
    preprocessorName = "string"
    regAlpha = int
    regLambda = int
    subsample = int
    subsampleFreq = int
    treeMethod = "string"
    withMean = bool
    withStd = bool
  }
  limitSettings = {
    enableEarlyTermination = bool
    exitScore = int
    maxConcurrentTrials = int
    maxCoresPerTrial = int
    maxTrials = int
    sweepConcurrentTrials = int
    sweepTrials = int
    timeout = "string"
    trialTimeout = "string"
  }
  nCrossValidations = {
    mode = "string"
    // For remaining properties, see NCrossValidations objects
  }
  primaryMetric = "string"
  searchSpace = [
    {
      booster = "string"
      boostingType = "string"
      growPolicy = "string"
      learningRate = "string"
      maxBin = "string"
      maxDepth = "string"
      maxLeaves = "string"
      minDataInLeaf = "string"
      minSplitGain = "string"
      modelName = "string"
      nEstimators = "string"
      numLeaves = "string"
      preprocessorName = "string"
      regAlpha = "string"
      regLambda = "string"
      subsample = "string"
      subsampleFreq = "string"
      treeMethod = "string"
      withMean = "string"
      withStd = "string"
    }
  ]
  sweepSettings = {
    earlyTermination = {
      delayEvaluation = int
      evaluationInterval = int
      policyType = "string"
      // For remaining properties, see EarlyTerminationPolicy objects
    }
    samplingAlgorithm = "string"
  }
  taskType = "Regression"
  testData = {
    description = "string"
    jobInputType = "string"
    mode = "string"
    uri = "string"
  }
  testDataSize = int
  trainingSettings = {
    allowedTrainingAlgorithms = [
      "string"
    ]
    blockedTrainingAlgorithms = [
      "string"
    ]
    enableDnnTraining = bool
    enableModelExplainability = bool
    enableOnnxCompatibleModels = bool
    enableStackEnsemble = bool
    enableVoteEnsemble = bool
    ensembleModelDownloadTimeout = "string"
    stackEnsembleSettings = {
      stackMetaLearnerKWargs = ?
      stackMetaLearnerTrainPercentage = int
      stackMetaLearnerType = "string"
    }
  }
  validationData = {
    description = "string"
    jobInputType = "string"
    mode = "string"
    uri = "string"
  }
  validationDataSize = int
  weightColumnName = "string"
}

对于 TextClassification,请使用:

{
  featurizationSettings = {
    datasetLanguage = "string"
  }
  fixedParameters = {
    gradientAccumulationSteps = int
    learningRate = int
    learningRateScheduler = "string"
    modelName = "string"
    numberOfEpochs = int
    trainingBatchSize = int
    validationBatchSize = int
    warmupRatio = int
    weightDecay = int
  }
  limitSettings = {
    maxConcurrentTrials = int
    maxNodes = int
    maxTrials = int
    timeout = "string"
    trialTimeout = "string"
  }
  primaryMetric = "string"
  searchSpace = [
    {
      gradientAccumulationSteps = "string"
      learningRate = "string"
      learningRateScheduler = "string"
      modelName = "string"
      numberOfEpochs = "string"
      trainingBatchSize = "string"
      validationBatchSize = "string"
      warmupRatio = "string"
      weightDecay = "string"
    }
  ]
  sweepSettings = {
    earlyTermination = {
      delayEvaluation = int
      evaluationInterval = int
      policyType = "string"
      // For remaining properties, see EarlyTerminationPolicy objects
    }
    samplingAlgorithm = "string"
  }
  taskType = "TextClassification"
  validationData = {
    description = "string"
    jobInputType = "string"
    mode = "string"
    uri = "string"
  }
}

对于 TextClassificationMultilabel,请使用:

{
  featurizationSettings = {
    datasetLanguage = "string"
  }
  fixedParameters = {
    gradientAccumulationSteps = int
    learningRate = int
    learningRateScheduler = "string"
    modelName = "string"
    numberOfEpochs = int
    trainingBatchSize = int
    validationBatchSize = int
    warmupRatio = int
    weightDecay = int
  }
  limitSettings = {
    maxConcurrentTrials = int
    maxNodes = int
    maxTrials = int
    timeout = "string"
    trialTimeout = "string"
  }
  searchSpace = [
    {
      gradientAccumulationSteps = "string"
      learningRate = "string"
      learningRateScheduler = "string"
      modelName = "string"
      numberOfEpochs = "string"
      trainingBatchSize = "string"
      validationBatchSize = "string"
      warmupRatio = "string"
      weightDecay = "string"
    }
  ]
  sweepSettings = {
    earlyTermination = {
      delayEvaluation = int
      evaluationInterval = int
      policyType = "string"
      // For remaining properties, see EarlyTerminationPolicy objects
    }
    samplingAlgorithm = "string"
  }
  taskType = "TextClassificationMultilabel"
  validationData = {
    description = "string"
    jobInputType = "string"
    mode = "string"
    uri = "string"
  }
}

对于 TextNER,请使用:

{
  featurizationSettings = {
    datasetLanguage = "string"
  }
  fixedParameters = {
    gradientAccumulationSteps = int
    learningRate = int
    learningRateScheduler = "string"
    modelName = "string"
    numberOfEpochs = int
    trainingBatchSize = int
    validationBatchSize = int
    warmupRatio = int
    weightDecay = int
  }
  limitSettings = {
    maxConcurrentTrials = int
    maxNodes = int
    maxTrials = int
    timeout = "string"
    trialTimeout = "string"
  }
  searchSpace = [
    {
      gradientAccumulationSteps = "string"
      learningRate = "string"
      learningRateScheduler = "string"
      modelName = "string"
      numberOfEpochs = "string"
      trainingBatchSize = "string"
      validationBatchSize = "string"
      warmupRatio = "string"
      weightDecay = "string"
    }
  ]
  sweepSettings = {
    earlyTermination = {
      delayEvaluation = int
      evaluationInterval = int
      policyType = "string"
      // For remaining properties, see EarlyTerminationPolicy objects
    }
    samplingAlgorithm = "string"
  }
  taskType = "TextNER"
  validationData = {
    description = "string"
    jobInputType = "string"
    mode = "string"
    uri = "string"
  }
}

TargetLags 对象

设置 模式 属性以指定对象的类型。

对于 自动,请使用:

{
  mode = "Auto"
}

对于 “自定义”,请使用:

{
  mode = "Custom"
  values = [
    int
  ]
}

LabelingJobMediaProperties 对象

设置 mediaType 属性以指定对象的类型。

对于 映像,请使用:

{
  annotationType = "string"
  mediaType = "Image"
}

对于 文本,请使用:

{
  annotationType = "string"
  mediaType = "Text"
}

JobInput 对象

设置 jobInputType 属性以指定对象的类型。

对于 custom_model,请使用:

{
  jobInputType = "custom_model"
  mode = "string"
  uri = "string"
}

对于 文本,请使用:

{
  jobInputType = "literal"
  value = "string"
}

对于 mlflow_model,请使用:

{
  jobInputType = "mlflow_model"
  mode = "string"
  uri = "string"
}

对于 mltable,请使用:

{
  jobInputType = "mltable"
  mode = "string"
  uri = "string"
}

对于 triton_model,请使用:

{
  jobInputType = "triton_model"
  mode = "string"
  uri = "string"
}

对于 uri_file,请使用:

{
  jobInputType = "uri_file"
  mode = "string"
  uri = "string"
}

对于 uri_folder,请使用:

{
  jobInputType = "uri_folder"
  mode = "string"
  uri = "string"
}

JobBaseProperties 对象

设置 jobType 属性以指定对象的类型。

对于 AutoML,请使用:

{
  environmentId = "string"
  environmentVariables = {
    {customized property} = "string"
  }
  jobType = "AutoML"
  outputs = {
    {customized property} = {
      description = "string"
      jobOutputType = "string"
      // For remaining properties, see JobOutput objects
    }
  }
  resources = {
    dockerArgs = "string"
    instanceCount = int
    instanceType = "string"
    properties = {
      {customized property} = ?
    }
    shmSize = "string"
  }
  taskDetails = {
    logVerbosity = "string"
    targetColumnName = "string"
    trainingData = {
      description = "string"
      jobInputType = "string"
      mode = "string"
      uri = "string"
    }
    taskType = "string"
    // For remaining properties, see AutoMLVertical objects
  }
}

对于 命令,请使用:

{
  autologgerSettings = {
    mlflowAutologger = "string"
  }
  codeId = "string"
  command = "string"
  distribution = {
    distributionType = "string"
    // For remaining properties, see DistributionConfiguration objects
  }
  environmentId = "string"
  environmentVariables = {
    {customized property} = "string"
  }
  inputs = {
    {customized property} = {
      description = "string"
      jobInputType = "string"
      // For remaining properties, see JobInput objects
    }
  }
  jobType = "Command"
  limits = {
    jobLimitsType = "string"
    timeout = "string"
  }
  outputs = {
    {customized property} = {
      description = "string"
      jobOutputType = "string"
      // For remaining properties, see JobOutput objects
    }
  }
  resources = {
    dockerArgs = "string"
    instanceCount = int
    instanceType = "string"
    properties = {
      {customized property} = ?
    }
    shmSize = "string"
  }
}

对于 标记,请使用:

{
  dataConfiguration = {
    dataId = "string"
    incrementalDataRefreshEnabled = bool
  }
  jobInstructions = {
    uri = "string"
  }
  jobType = "Labeling"
  labelCategories = {
    {customized property} = {
      classes = {
        {customized property} = {
          displayName = "string"
          subclasses = {
            {customized property} = ...
          }
        }
      }
      displayName = "string"
      multiSelectEnabled = bool
    }
  }
  labelingJobMediaProperties = {
    mediaType = "string"
    // For remaining properties, see LabelingJobMediaProperties objects
  }
  mlAssistConfiguration = {
    mlAssist = "string"
    // For remaining properties, see MLAssistConfiguration objects
  }
}

对于 管道,请使用:

{
  inputs = {
    {customized property} = {
      description = "string"
      jobInputType = "string"
      // For remaining properties, see JobInput objects
    }
  }
  jobs = {
    {customized property} = ?
  }
  jobType = "Pipeline"
  outputs = {
    {customized property} = {
      description = "string"
      jobOutputType = "string"
      // For remaining properties, see JobOutput objects
    }
  }
  settings = ?
  sourceJobId = "string"
}

对于 Spark,请使用:

{
  archives = [
    "string"
  ]
  args = "string"
  codeId = "string"
  conf = {
    {customized property} = "string"
  }
  entry = {
    sparkJobEntryType = "string"
    // For remaining properties, see SparkJobEntry objects
  }
  environmentId = "string"
  files = [
    "string"
  ]
  inputs = {
    {customized property} = {
      description = "string"
      jobInputType = "string"
      // For remaining properties, see JobInput objects
    }
  }
  jars = [
    "string"
  ]
  jobType = "Spark"
  outputs = {
    {customized property} = {
      description = "string"
      jobOutputType = "string"
      // For remaining properties, see JobOutput objects
    }
  }
  pyFiles = [
    "string"
  ]
  resources = {
    instanceType = "string"
    runtimeVersion = "string"
  }
}

对于 扫描,请使用:

{
  earlyTermination = {
    delayEvaluation = int
    evaluationInterval = int
    policyType = "string"
    // For remaining properties, see EarlyTerminationPolicy objects
  }
  inputs = {
    {customized property} = {
      description = "string"
      jobInputType = "string"
      // For remaining properties, see JobInput objects
    }
  }
  jobType = "Sweep"
  limits = {
    jobLimitsType = "string"
    maxConcurrentTrials = int
    maxTotalTrials = int
    timeout = "string"
    trialTimeout = "string"
  }
  objective = {
    goal = "string"
    primaryMetric = "string"
  }
  outputs = {
    {customized property} = {
      description = "string"
      jobOutputType = "string"
      // For remaining properties, see JobOutput objects
    }
  }
  samplingAlgorithm = {
    samplingAlgorithmType = "string"
    // For remaining properties, see SamplingAlgorithm objects
  }
  searchSpace = ?
  trial = {
    codeId = "string"
    command = "string"
    distribution = {
      distributionType = "string"
      // For remaining properties, see DistributionConfiguration objects
    }
    environmentId = "string"
    environmentVariables = {
      {customized property} = "string"
    }
    resources = {
      dockerArgs = "string"
      instanceCount = int
      instanceType = "string"
      properties = {
        {customized property} = ?
      }
      shmSize = "string"
    }
  }
}

节点对象

设置 nodesValueType 属性以指定对象的类型。

对于 “全部”,请使用:

{
  nodesValueType = "All"
}

SamplingAlgorithm 对象

设置 samplingAlgorithmType 属性以指定对象的类型。

对于 Bayesian,请使用:

{
  samplingAlgorithmType = "Bayesian"
}

对于 网格,请使用:

{
  samplingAlgorithmType = "Grid"
}

对于 Random,请使用:

{
  rule = "string"
  samplingAlgorithmType = "Random"
  seed = int
}

NCrossValidations 对象

设置 模式 属性以指定对象的类型。

对于 自动,请使用:

{
  mode = "Auto"
}

对于 “自定义”,请使用:

{
  mode = "Custom"
  value = int
}

属性值

Microsoft.MachineLearningServices/workspaces/jobs

名称 DESCRIPTION 价值
姓名 资源名称 字符串

约束:
模式 = ^[a-zA-Z0-9][a-zA-Z0-9\-_]{0,254}$ (必需)
parent_id 此资源的父资源的 ID。 类型资源的 ID: 工作区
属性 [必需]实体的其他属性。 JobBaseProperties (必需)
类型 资源类型 “Microsoft.MachineLearningServices/workspaces/jobs@2022-10-01-preview”

所有节点

名称 DESCRIPTION 价值
nodesValueType [必需]Nodes 值的类型 “全部”(必需)

AmlToken

名称 DESCRIPTION 价值
身份类型 [必需]指定标识框架的类型。 “AMLToken”(必需)

自动预测地平线

名称 DESCRIPTION 价值
模式 [必需]设置预测地平线值选择模式。 “Auto”(必需)

Autologger 设置

名称 DESCRIPTION 价值
mlflow自动记录器 [必需]指示是否启用 mlflow 自动记录器。 “Disabled”
“Enabled”(必需)

AutoMLJob

名称 DESCRIPTION 价值
环境 ID 作业的环境规范的 ARM 资源 ID。
这是一个可选值,如果未提供,AutoML 将在运行作业时将其默认为生产 AutoML 特选环境版本。
字符串
环境变量 作业中包含的环境变量。 AutoMLJobEnvironmentVariables
职位类型 [必需]指定作业的类型。 “AutoML”(必需)
输出 作业中使用的输出数据绑定的映射。 AutoMLJob 输出
资源 作业的计算资源配置。 JobResourceConfiguration
taskDetails [必需]这表示可以是表/NLP/Image 之一的方案 AutoMLVertical (必需)

AutoMLJobEnvironmentVariables

名称 DESCRIPTION 价值

AutoMLJob 输出

名称 DESCRIPTION 价值

AutoMLVertical

名称 DESCRIPTION 价值
logVerbosity (对数详细程度) 作业的详细记录。 “Critical”
“Debug”
“Error”
“Info”
“NotSet”
“Warning”
targetColumnName 目标列名称:这是预测值列。
也称为分类任务的上下文中的标签列名称。
字符串
任务类型 设置为类型 “分类”的“分类”。 设置为“ 预测”类型。 设置为 ImageClassification 类型的“ImageClassification”。 设置为 ImageClassificationMultilabel 类型的“ImageClassificationMultilabel”。 设置为 ImageInstanceSegmentation 类型的“ImageInstanceSegmentation”。 设置为 ImageObjectDetection 类型的“ImageObjectDetection”。 设置为“ 回归”类型。 设置为 TextClassification 类型的“TextClassification”。 对于 TextClassificationMultilabel,设置为“TextClassificationMultilabel”。 设置为 TextNer 类型的“TextNER”。 “Classification”
“预测”
“ImageClassification”
“ImageClassificationMultilabel”
“ImageInstanceSegmentation”
“ImageObjectDetection”
“回归”
“TextClassification”
“TextClassificationMultilabel”
“TextNER”(必需)
trainingData (训练数据) [必需]训练数据输入。 MLTableJobInput (必需)

AutoNCross验证

名称 DESCRIPTION 价值
模式 [必需]用于确定 N 交叉验证的模式。 “Auto”(必需)

自动季节性

名称 DESCRIPTION 价值
模式 [必需]季节性模式。 “Auto”(必需)

AutoTargetLags 自动目标滞后

名称 DESCRIPTION 价值
模式 [必需]设置目标滞后模式 - 自动/自定义 “Auto”(必需)

AutoTargetRollingWindowSize (自动目标滚动窗口大小)

名称 DESCRIPTION 价值
模式 [必需]TargetRollingWindowSiz 检测模式。 “Auto”(必需)

BanditPolicy (强盗政策)

名称 DESCRIPTION 价值
policyType [必需]策略配置的名称 “强盗”(必需)
slackAmount 从性能最佳的运行中允许的绝对距离。 整数 (int)
slackFactor 的 与性能最佳的运行距离的允许距离比率。 整数 (int)

BayesianSamplingAlgorithm

名称 DESCRIPTION 价值
采样算法类型 [必需]用于生成超参数值的算法以及配置属性 “贝伊西亚”(必需)

分类

名称 DESCRIPTION 价值
cvSplitColumnNames 用于 CVSplit 数据的列。 字符串[]
featurizationSettings AutoML 作业所需的特征化输入。 TableVerticalFeaturizationSettings
固定参数 在整个训练过程中将保持不变的模型/训练参数。 TableFixedParameters (表固定参数)
limitSettings AutoMLJob 的执行约束。 TableVerticalLimitSettings
nCrossValidations 要应用于训练数据集的交叉验证折叠数
如果未提供验证数据集,则为 。
NCross验证
积极标签 二进制指标计算的正标签。 字符串
primaryMetric 任务的主要指标。 “准确性”
“AUCWeighted”
“AveragePrecisionScoreWeighted”
“NormMacroRecall”
“PrecisionScoreWeighted”
搜索空间 用于采样模型及其超参数的不同组合的搜索空间。 TableParameterSubspace[]
扫描设置 模型扫描和超参数优化的设置。 TableSweepSettings (表格扫描设置)
任务类型 [必需]AutoMLJob 的任务类型。 “分类”(必需)
测试数据 测试数据输入。 MLTableJobInput
testDataSize 需要为验证目的预留的测试数据集的分数。
介于 (0.0、 1.0) 之间的值
未提供验证数据集时应用。
整数 (int)
trainingSettings AutoML 作业训练阶段的输入。 分类训练设置
validationData (验证数据) 验证数据输入。 MLTableJobInput
validationDataSize 需要留出用于验证的定型数据集的分数。
介于 (0.0、 1.0) 之间的值
未提供验证数据集时应用。
整数 (int)
权重列名称 示例权重列的名称。 自动化 ML 支持加权列作为输入,导致数据中的行向上或向下加权。 字符串

分类训练设置

名称 DESCRIPTION 价值
allowedTrainingAlgorithms 分类任务的允许模型。 包含任一项的字符串数组:
“BernoulliNaiveBayes”
“DecisionTree”
“ExtremeRandomTrees”
“GradientBoosting”
“KNN”
“LightGBM”
“LinearSVM”
“LogisticRegression”
“MultinomialNaiveBayes”
“RandomForest”
“ZN”
“SVM”
“XGBoostClassifier”
blockedTrainingAlgorithms 分类任务的阻止模型。 包含任一项的字符串数组:
“BernoulliNaiveBayes”
“DecisionTree”
“ExtremeRandomTrees”
“GradientBoosting”
“KNN”
“LightGBM”
“LinearSVM”
“LogisticRegression”
“MultinomialNaiveBayes”
“RandomForest”
“ZN”
“SVM”
“XGBoostClassifier”
enableDnnTraining 启用 DNN 模型的建议。 布尔
enableModelExplainability 标志以在最佳模型上启用可解释性。 布尔
enableOnnxCompatibleModels 用于启用 onnx 兼容模型的标志。 布尔
enableStackEnsemble 启用堆栈合奏运行。 布尔
enableVoteEnsemble 启用投票合奏运行。 布尔
ensembleModelDownloadTimeout 在 VotingEnsemble 和 StackEnsemble 模型生成期间,将下载先前子运行中的多个拟合模型。
如果需要更多时间,请将此参数配置为大于 300 秒的值。
字符串
stackEnsembleSettings 堆栈合奏的堆栈合奏设置。 StackEnsembleSettings

ColumnTransformer (列变换器)

名称 DESCRIPTION 价值
字段 要应用转换器逻辑的字段。 字符串[]
参数 要传递给转换器的不同属性。
输入应为 JSON 格式的键值对字典。
任何

CommandJob

名称 DESCRIPTION 价值
autologger设置 作业的分发配置。 如果已设置,则应为 Mpi、Tensorflow、PyTorch 或 null 之一。 Autologger 设置
代码 Id 代码资产的 ARM 资源 ID。 字符串
指令 [必需]在启动作业时执行的命令。 例如 “python train.py” 字符串

约束:
最小长度 = 1
模式 = [a-zA-Z0-9_] (必需)
分配 作业的分发配置。 如果已设置,则应为 Mpi、Tensorflow、PyTorch 或 null 之一。 分发配置
环境 ID [必需]作业的环境规范的 ARM 资源 ID。 字符串

约束:
模式 = [a-zA-Z0-9_] (必需)
环境变量 作业中包含的环境变量。 CommandJobEnvironmentVariables
输入 作业中使用的输入数据绑定的映射。 CommandJobInputs 命令作业输入
职位类型 [必需]指定作业的类型。 “Command”(必需)
限制 命令作业限制。 CommandJobLimits 命令作业限制
输出 作业中使用的输出数据绑定的映射。 CommandJobOutputs 命令作业输出
资源 作业的计算资源配置。 JobResourceConfiguration

CommandJobEnvironmentVariables

名称 DESCRIPTION 价值

CommandJobInputs 命令作业输入

名称 DESCRIPTION 价值

CommandJobLimits 命令作业限制

名称 DESCRIPTION 价值
jobLimits类型 [必需]JobLimit 类型。 “Command”
“扫描”(必需)
超时 ISO 8601 格式的最大运行持续时间,之后作业将被取消。 仅支持精度为秒的持续时间。 字符串

CommandJobOutputs 命令作业输出

名称 DESCRIPTION 价值

CustomForecastHorizon

名称 DESCRIPTION 价值
模式 [必需]设置预测地平线值选择模式。 “Custom”(必需)
价值 [必需]预测地平线值。 int (必需)

CustomModelJobInput (自定义模型作业输入)

名称 DESCRIPTION 价值
jobInputType (作业输入类型) [必需]指定作业的类型。 “custom_model”(必需)
模式 输入资产传送模式。 “Direct”
“下载”
“EvalDownload”
“EvalMount”
“ReadOnlyMount”
“ReadWriteMount”
URI [必需]输入资产 URI。 字符串

约束:
模式 = [a-zA-Z0-9_] (必需)

CustomModelJobOutput

名称 DESCRIPTION 价值
jobOutputType [必需]指定作业的类型。 “custom_model”(必需)
模式 输出资产传送模式。 “Direct”
“ReadWriteMount”
“Upload”
URI 输出资产 URI。 字符串

CustomNCross验证

名称 DESCRIPTION 价值
模式 [必需]用于确定 N 交叉验证的模式。 “Custom”(必需)
价值 [必需]N 交叉验证值。 int (必需)

CustomSeasonality (自定义季节性)

名称 DESCRIPTION 价值
模式 [必需]季节性模式。 “Custom”(必需)
价值 [必需]季节性值。 int (必需)

CustomTargetLags (自定义目标滞后)

名称 DESCRIPTION 价值
模式 [必需]设置目标滞后模式 - 自动/自定义 “Custom”(必需)
价值, 价值观 [必需]设置目标滞后值。 int[] (必需)

CustomTargetRollingWindowSize

名称 DESCRIPTION 价值
模式 [必需]TargetRollingWindowSiz 检测模式。 “Custom”(必需)
价值 [必需]TargetRollingWindowSize 值。 int (必需)

分发配置

名称 DESCRIPTION 价值
distributionType 对于 Mpi 类型,设置为“ Mpi”。 对于 PyTorch 类型,设置为“ PyTorch”。 设置为 TensorFlow 类型的“TensorFlow”。 “Mpi”
“PyTorch”
“TensorFlow”(必需)

提前终止政策

名称 DESCRIPTION 价值
delay评估 延迟第一次计算的间隔数。 整数 (int)
evaluationInterval 策略评估之间的间隔(运行数)。 整数 (int)
policyType 设置为“ BanditPolicy”类型为“BanditPolicy”。 对于 MedianStoppingPolicy,设置为“MedianStoppingPolicy”。 对于 TruncationSelectionPolicy 类型,设置为“TruncationSelection”。 “Bandit”
“MedianStopping”
“TruncationSelection”(必需)

预测地平线

名称 DESCRIPTION 价值
模式 设置为“ AutoForecastHorizon”类型。 设置为 CustomForecastHorizon 类型的“Custom”。 “Auto”
“Custom”(必需)

预测

名称 DESCRIPTION 价值
cvSplitColumnNames 用于 CVSplit 数据的列。 字符串[]
featurizationSettings AutoML 作业所需的特征化输入。 TableVerticalFeaturizationSettings
固定参数 在整个训练过程中将保持不变的模型/训练参数。 TableFixedParameters (表固定参数)
forecasting设置 预测任务特定的输入。 ForecastingSettings
limitSettings AutoMLJob 的执行约束。 TableVerticalLimitSettings
nCrossValidations 要应用于训练数据集的交叉验证折叠数
如果未提供验证数据集,则为 。
NCross验证
primaryMetric 预测任务的主要指标。 “NormalizedMeanAbsoluteError”
“NormalizedRootMeanSquaredError”
“R2Score”
'SpearmanCorrelation'
搜索空间 用于采样模型及其超参数的不同组合的搜索空间。 TableParameterSubspace[]
扫描设置 模型扫描和超参数优化的设置。 TableSweepSettings (表格扫描设置)
任务类型 [必需]AutoMLJob 的任务类型。 “预测”(必需)
测试数据 测试数据输入。 MLTableJobInput
testDataSize 需要为验证目的预留的测试数据集的分数。
介于 (0.0、 1.0) 之间的值
未提供验证数据集时应用。
整数 (int)
trainingSettings AutoML 作业训练阶段的输入。 ForecastingTrainingSettings
validationData (验证数据) 验证数据输入。 MLTableJobInput
validationDataSize 需要留出用于验证的定型数据集的分数。
介于 (0.0、 1.0) 之间的值
未提供验证数据集时应用。
整数 (int)
权重列名称 示例权重列的名称。 自动化 ML 支持加权列作为输入,导致数据中的行向上或向下加权。 字符串

ForecastingSettings

名称 DESCRIPTION 价值
国家/地区或地区为假期 用于预测任务的假日国家或地区。
这些代码应为 ISO 3166 双字母国家/地区代码,例如“US”或“GB”。
字符串
cvStepSize 一个 CV 折叠的起始时间与下一个折叠之间的句点数。 为
例如,如果 CVStepSize = 3 表示每日数据,则每个折叠的源时间将为
三天相隔。
整数 (int)
featureLags 使用“auto”或 null 为数值特征生成滞后的标志。 “Auto”
“None”
forecastHorizon (预测地平线) 所需最大预测范围(以时序频率单位为单位)。 预测地平线
频率 预测时,此参数表示需要预测的时间段,例如每日、每周、每年等。默认情况下,预测频率为数据集频率。 字符串
季节性 将时序季节性设置为序列频率的整数倍数。
如果季节性设置为“auto”,则会推断它。
季节性
shortSeriesHandlingConfig 定义 AutoML 如何处理短时序的参数。 “Auto”
“掉落”
“None”
“Pad”
targetAggregateFunction 用于聚合符合用户指定频率的时序目标列的函数。
如果设置了 TargetAggregateFunction,即不是“None”,但未设置 freq 参数,则会引发错误。 可能的目标聚合函数包括:“sum”、“max”、“min”和“mean”。
“Max”
“Mean”
“Min”
“None”
“Sum”
目标拉格 要从目标列滞后的过去时间段数。 目标滞后
targetRollingWindowSize 用于创建目标列的滚动窗口平均值的过去时间段数。 TargetRollingWindowSize
timeColumnName (时间列名称) 时间列的名称。 当预测在用于生成时序并推断其频率的输入数据中指定日期/时间列时,此参数是必需的。 字符串
timeSeriesIdColumnNames 用于对时间序列进行分组的列的名称。 它可用于创建多个序列。
如果未定义粒度,则假定数据集为一个时序。 此参数用于任务类型预测。
字符串[]
useStl 配置时序目标列的 STL 分解。 “None”
“季度”
“SeasonTrend”

ForecastingTrainingSettings

名称 DESCRIPTION 价值
allowedTrainingAlgorithms 允许用于预测任务的模型。 包含任一项的字符串数组:
“Arimax”
“AutoArima”
“Average”
“DecisionTree”
“ElasticNet”
“ExponentialSmoothing”
“ExtremeRandomTrees”
“GradientBoosting”
“KNN”
“LassoLars”
“LightGBM”
“Naive”
“先知”
“RandomForest”
“SeasonalAverage”
“SeasonalNaive”
“ZN”
“TCNForecaster”
“XGBoostRegressor”
blockedTrainingAlgorithms 用于预测任务的阻止模型。 包含任一项的字符串数组:
“Arimax”
“AutoArima”
“Average”
“DecisionTree”
“ElasticNet”
“ExponentialSmoothing”
“ExtremeRandomTrees”
“GradientBoosting”
“KNN”
“LassoLars”
“LightGBM”
“Naive”
“先知”
“RandomForest”
“SeasonalAverage”
“SeasonalNaive”
“ZN”
“TCNForecaster”
“XGBoostRegressor”
enableDnnTraining 启用 DNN 模型的建议。 布尔
enableModelExplainability 标志以在最佳模型上启用可解释性。 布尔
enableOnnxCompatibleModels 用于启用 onnx 兼容模型的标志。 布尔
enableStackEnsemble 启用堆栈合奏运行。 布尔
enableVoteEnsemble 启用投票合奏运行。 布尔
ensembleModelDownloadTimeout 在 VotingEnsemble 和 StackEnsemble 模型生成期间,将下载先前子运行中的多个拟合模型。
如果需要更多时间,请将此参数配置为大于 300 秒的值。
字符串
stackEnsembleSettings 堆栈合奏的堆栈合奏设置。 StackEnsembleSettings

GridSampling算法

名称 DESCRIPTION 价值
采样算法类型 [必需]用于生成超参数值的算法以及配置属性 “Grid”(必需)

身份配置

名称 DESCRIPTION 价值
身份类型 对于 AmlToken 类型,设置为“AMLToken”。 设置为 “ManagedIdentity”类型。 对于 UserIdentity 类型,设置为“UserIdentity”。 “AMLToken”
“Managed”
“UserIdentity”(必需)

图像分类

名称 DESCRIPTION 价值
limitSettings [必需]限制 AutoML 作业的设置。 ImageLimitSettings (必需)
modelSettings 用于训练模型的设置。 ImageModelSettings分类
primaryMetric 要针对此任务进行优化的主要指标。 “准确性”
“AUCWeighted”
“AveragePrecisionScoreWeighted”
“NormMacroRecall”
“PrecisionScoreWeighted”
搜索空间 用于采样模型及其超参数的不同组合的搜索空间。 ImageModelDistributionSettingsClassification[]
扫描设置 模型扫描和超参数扫描相关设置。 ImageSweepSettings (图像扫描设置)
任务类型 [必需]AutoMLJob 的任务类型。 “ImageClassification”(必需)
validationData (验证数据) 验证数据输入。 MLTableJobInput
validationDataSize 需要留出用于验证的定型数据集的分数。
介于 (0.0、 1.0) 之间的值
未提供验证数据集时应用。
整数 (int)

ImageClassificationMultilabel

名称 DESCRIPTION 价值
limitSettings [必需]限制 AutoML 作业的设置。 ImageLimitSettings (必需)
modelSettings 用于训练模型的设置。 ImageModelSettings分类
primaryMetric 要针对此任务进行优化的主要指标。 “准确性”
“AUCWeighted”
“AveragePrecisionScoreWeighted”
“IOU”
“NormMacroRecall”
“PrecisionScoreWeighted”
搜索空间 用于采样模型及其超参数的不同组合的搜索空间。 ImageModelDistributionSettingsClassification[]
扫描设置 模型扫描和超参数扫描相关设置。 ImageSweepSettings (图像扫描设置)
任务类型 [必需]AutoMLJob 的任务类型。 “ImageClassificationMultilabel”(必需)
validationData (验证数据) 验证数据输入。 MLTableJobInput
validationDataSize 需要留出用于验证的定型数据集的分数。
介于 (0.0、 1.0) 之间的值
未提供验证数据集时应用。
整数 (int)

ImageInstanceSegmentation

名称 DESCRIPTION 价值
limitSettings [必需]限制 AutoML 作业的设置。 ImageLimitSettings (必需)
modelSettings 用于训练模型的设置。 ImageModelSettingsObjectDetection
primaryMetric 要针对此任务进行优化的主要指标。 “MeanAveragePrecision”
搜索空间 用于采样模型及其超参数的不同组合的搜索空间。 ImageModelDistributionSettingsObjectDetection[]
扫描设置 模型扫描和超参数扫描相关设置。 ImageSweepSettings (图像扫描设置)
任务类型 [必需]AutoMLJob 的任务类型。 “ImageInstanceSegmentation”(必需)
validationData (验证数据) 验证数据输入。 MLTableJobInput
validationDataSize 需要留出用于验证的定型数据集的分数。
介于 (0.0、 1.0) 之间的值
未提供验证数据集时应用。
整数 (int)

ImageLimitSettings

名称 DESCRIPTION 价值
maxConcurrentTrials 最大并发 AutoML 迭代数。 整数 (int)
maxTrials AutoML 迭代的最大数目。 整数 (int)
超时 AutoML 作业超时。 字符串

ImageModelDistributionSettings分类

名称 DESCRIPTION 价值
amsGradient 优化器为“adam”或“adamw”时启用 AMSGrad。 字符串
扩充 使用扩充的设置。 字符串
贝塔1 优化器为“adam”或“adamw”时“beta1”的值。 必须是 [0, 1] 范围内的浮点。 字符串
贝塔2 优化器为“adam”或“adamw”时“beta2”的值。 必须是 [0, 1] 范围内的浮点。 字符串
分散式 是否使用分布式程序训练。 字符串
earlyStopping (早期停止) 在训练期间启用提前停止逻辑。 字符串
earlyStoppingDelay 在主要指标改进之前等待的最小纪元数或验证评估数
跟踪早期停止。 必须是正整数。
字符串
早点停止耐心 之前没有主要指标改进的最小纪元或验证评估数
运行已停止。 必须是正整数。
字符串
enableOnnxNormalization 导出 ONNX 模型时启用规范化。 字符串
evaluationFrequency 评估验证数据集以获取指标分数的频率。 必须是正整数。 字符串
梯度累积步骤 渐变累积意味着在不运行配置数量的“GradAccumulationStep”步骤的情况下
更新模型权重,同时累积这些步骤的渐变,然后使用
用于计算权重更新的累积渐变。 必须是正整数。
字符串
layersToFreeze (图层冻结) 要冻结模型的层数。 必须是正整数。
例如,将 2 作为“seresnext”的值传递意味着
冻结 layer0 和 layer1。 有关支持的模型的完整列表以及有关层冻结的详细信息,请
请参阅:/azure/machine-learning/how-to-auto-train-image-models。
字符串
learningRate 初始学习速率。 必须是 [0, 1] 范围内的浮点。 字符串
learningRateScheduler 的 学习速率计划程序的类型。 必须是“warmup_cosine”或“step”。 字符串
模型名称 要用于训练的模型的名称。
有关可用模型的详细信息,请访问官方文档:
/azure/machine-learning/how-to-auto-train-image-models。
字符串
动量 优化器为“zn”时的动量值。 必须是 [0, 1] 范围内的浮点。 字符串
涅斯特罗夫 优化器为“zn”时启用 nesterov。 字符串
纪元数 训练纪元数。 必须是正整数。 字符串
工人数 数据加载程序辅助角色数。 必须是非负整数。 字符串
优化器 优化器的类型。 必须是“zn”、“adam”或“adamw”。 字符串
随机种子 使用确定性训练时要使用的随机种子。 字符串
stepLR伽玛 当学习速率计划程序为“step”时,gamma 的值。 必须是 [0, 1] 范围内的浮点。 字符串
stepLRStepSize 学习速率计划程序为“step”时步骤大小的值。 必须是正整数。 字符串
trainingBatchSize 训练批大小。 必须是正整数。 字符串
trainingCropSize 训练数据集的神经网络输入的图像裁剪大小。 必须是正整数。 字符串
validationBatchSize 验证批大小。 必须是正整数。 字符串
validationCropSize 输入到神经网络的验证数据集的图像裁剪大小。 必须是正整数。 字符串
validationResizeSize 在裁剪验证数据集之前要调整其大小的图像大小。 必须是正整数。 字符串
warmupCosineLRCycles 学习速率计划程序为“warmup_cosine”时的余弦周期值。 必须是 [0, 1] 范围内的浮点。 字符串
warmupCosineLRWarmupEpochs 当学习速率计划程序为“warmup_cosine”时,预热时期的值。 必须是正整数。 字符串
weightDecay (权重衰减) 优化器为“zn”、“adam”或“adamw”时的权重衰减值。 必须是范围[0, 1] 中的浮点。 字符串
weightedLoss 减肥。 对于无加权损失,接受的值为 0。
1 用于与 sqrt 一起减肥。(class_weights)。 2 用于减肥与class_weights。 必须为 0 或 1 或 2。
字符串

ImageModelDistributionSettingsObjectDetection

名称 DESCRIPTION 价值
amsGradient 优化器为“adam”或“adamw”时启用 AMSGrad。 字符串
扩充 使用扩充的设置。 字符串
贝塔1 优化器为“adam”或“adamw”时“beta1”的值。 必须是 [0, 1] 范围内的浮点。 字符串
贝塔2 优化器为“adam”或“adamw”时“beta2”的值。 必须是 [0, 1] 范围内的浮点。 字符串
boxDetectionsPerImage (每图像检测) 每个图像的最大检测数,适用于所有类。 必须是正整数。
注意:“yolov5”算法不支持此设置。
字符串
boxScoreThreshold (盒分数阈值) 在推理期间,仅返回分类分数大于
BoxScoreThreshold。 必须是范围[0, 1] 中的浮点。
字符串
分散式 是否使用分布式程序训练。 字符串
earlyStopping (早期停止) 在训练期间启用提前停止逻辑。 字符串
earlyStoppingDelay 在主要指标改进之前等待的最小纪元数或验证评估数
跟踪早期停止。 必须是正整数。
字符串
早点停止耐心 之前没有主要指标改进的最小纪元或验证评估数
运行已停止。 必须是正整数。
字符串
enableOnnxNormalization 导出 ONNX 模型时启用规范化。 字符串
evaluationFrequency 评估验证数据集以获取指标分数的频率。 必须是正整数。 字符串
梯度累积步骤 渐变累积意味着在不运行配置数量的“GradAccumulationStep”步骤的情况下
更新模型权重,同时累积这些步骤的渐变,然后使用
用于计算权重更新的累积渐变。 必须是正整数。
字符串
图像大小 用于训练和验证的图像大小。 必须是正整数。
注意:如果大小太大,训练运行可能会进入 CUDA OOM。
注意:仅“yolov5”算法支持此设置。
字符串
layersToFreeze (图层冻结) 要冻结模型的层数。 必须是正整数。
例如,将 2 作为“seresnext”的值传递意味着
冻结 layer0 和 layer1。 有关支持的模型的完整列表以及有关层冻结的详细信息,请
请参阅:/azure/machine-learning/how-to-auto-train-image-models。
字符串
learningRate 初始学习速率。 必须是 [0, 1] 范围内的浮点。 字符串
learningRateScheduler 的 学习速率计划程序的类型。 必须是“warmup_cosine”或“step”。 字符串
最大大小 将图像馈送至主干之前要重新缩放的最大大小。
必须是正整数。 注意:如果大小太大,训练运行可能会进入 CUDA OOM。
注意:“yolov5”算法不支持此设置。
字符串
最小大小 将图像馈送到主干之前要重新缩放的最小大小。
必须是正整数。 注意:如果大小太大,训练运行可能会进入 CUDA OOM。
注意:“yolov5”算法不支持此设置。
字符串
模型名称 要用于训练的模型的名称。
有关可用模型的详细信息,请访问官方文档:
/azure/machine-learning/how-to-auto-train-image-models。
字符串
modelSize 模型大小。 必须是“small”、“medium”、“large”或“xlarge”。
注意:如果模型大小太大,训练运行可能会进入 CUDA OOM。
注意:仅“yolov5”算法支持此设置。
字符串
动量 优化器为“zn”时的动量值。 必须是 [0, 1] 范围内的浮点。 字符串
多尺度 按 +/- 50%的不同图像大小启用多缩放图像。
注意:如果没有足够的 GPU 内存,训练运行可能会进入 CUDA OOM。
注意:仅“yolov5”算法支持此设置。
字符串
涅斯特罗夫 优化器为“zn”时启用 nesterov。 字符串
nmsIouThreshold 在 NMS 后期处理的推理期间使用的 IOU 阈值。 必须在 [0, 1] 范围内浮动。 字符串
纪元数 训练纪元数。 必须是正整数。 字符串
工人数 数据加载程序辅助角色数。 必须是非负整数。 字符串
优化器 优化器的类型。 必须是“zn”、“adam”或“adamw”。 字符串
随机种子 使用确定性训练时要使用的随机种子。 字符串
stepLR伽玛 当学习速率计划程序为“step”时,gamma 的值。 必须是 [0, 1] 范围内的浮点。 字符串
stepLRStepSize 学习速率计划程序为“step”时步骤大小的值。 必须是正整数。 字符串
tileGridSize (平铺网格大小) 用于平铺每个图像的网格大小。 注意:TileGridSize 不得为
无可启用小型对象检测逻辑。 一个字符串,其中包含两个整数(采用格式)。
注意:“yolov5”算法不支持此设置。
字符串
tileOverlapRatio (平铺重叠比率) 每个维度中相邻磁贴之间的重叠比率。 必须在 [0, 1] 范围内浮动。
注意:“yolov5”算法不支持此设置。
字符串
tilePredictionsNmsThreshold 用于执行 NMS 的 IOU 阈值,同时合并来自磁贴和图像的预测。
用于验证/推理。 必须在 [0, 1] 范围内浮动。
注意:“yolov5”算法不支持此设置。
NMS:非最大抑制
字符串
trainingBatchSize 训练批大小。 必须是正整数。 字符串
validationBatchSize 验证批大小。 必须是正整数。 字符串
validationIouThreshold 计算验证指标时要使用的 IOU 阈值。 必须在 [0, 1] 范围内浮动。 字符串
validationMetricType 用于验证指标的指标计算方法。 必须是“none”、“coco”、“voc”或“coco_voc”。 字符串
warmupCosineLRCycles 学习速率计划程序为“warmup_cosine”时的余弦周期值。 必须是 [0, 1] 范围内的浮点。 字符串
warmupCosineLRWarmupEpochs 当学习速率计划程序为“warmup_cosine”时,预热时期的值。 必须是正整数。 字符串
weightDecay (权重衰减) 优化器为“zn”、“adam”或“adamw”时的权重衰减值。 必须是范围[0, 1] 中的浮点。 字符串

ImageModelSettings分类

名称 DESCRIPTION 价值
高级设置 高级方案的设置。 字符串
amsGradient 优化器为“adam”或“adamw”时启用 AMSGrad。 布尔
扩充 使用扩充的设置。 字符串
贝塔1 优化器为“adam”或“adamw”时“beta1”的值。 必须是 [0, 1] 范围内的浮点。 整数 (int)
贝塔2 优化器为“adam”或“adamw”时“beta2”的值。 必须是 [0, 1] 范围内的浮点。 整数 (int)
检查点频率 存储模型检查点的频率。 必须是正整数。 整数 (int)
checkpoint模型 用于增量训练的预先训练检查点模型。 MLFlowModelJobInput
检查点RunId 上一次运行的 ID,该运行具有用于增量训练的预先训练检查点。 字符串
分散式 是否使用分布式训练。 布尔
earlyStopping (早期停止) 在训练期间启用提前停止逻辑。 布尔
earlyStoppingDelay 在主要指标改进之前等待的最小纪元数或验证评估数
跟踪早期停止。 必须是正整数。
整数 (int)
早点停止耐心 之前没有主要指标改进的最小纪元或验证评估数
运行已停止。 必须是正整数。
整数 (int)
enableOnnxNormalization 导出 ONNX 模型时启用规范化。 布尔
evaluationFrequency 评估验证数据集以获取指标分数的频率。 必须是正整数。 整数 (int)
梯度累积步骤 渐变累积意味着在不运行配置数量的“GradAccumulationStep”步骤的情况下
更新模型权重,同时累积这些步骤的渐变,然后使用
用于计算权重更新的累积渐变。 必须是正整数。
整数 (int)
layersToFreeze (图层冻结) 要冻结模型的层数。 必须是正整数。
例如,将 2 作为“seresnext”的值传递意味着
冻结 layer0 和 layer1。 有关支持的模型的完整列表以及有关层冻结的详细信息,请
请参阅:/azure/machine-learning/how-to-auto-train-image-models。
整数 (int)
learningRate 初始学习速率。 必须是 [0, 1] 范围内的浮点。 整数 (int)
learningRateScheduler 的 学习速率计划程序的类型。 必须是“warmup_cosine”或“step”。 “None”
“Step”
“WarmupCosine”
模型名称 要用于训练的模型的名称。
有关可用模型的详细信息,请访问官方文档:
/azure/machine-learning/how-to-auto-train-image-models。
字符串
动量 优化器为“zn”时的动量值。 必须是 [0, 1] 范围内的浮点。 整数 (int)
涅斯特罗夫 优化器为“zn”时启用 nesterov。 布尔
纪元数 训练纪元数。 必须是正整数。 整数 (int)
工人数 数据加载程序辅助角色数。 必须是非负整数。 整数 (int)
优化器 优化器的类型。 “Adam”
“Adamw”
“None”
“Zn”
随机种子 使用确定性训练时要使用的随机种子。 整数 (int)
stepLR伽玛 当学习速率计划程序为“step”时,gamma 的值。 必须是 [0, 1] 范围内的浮点。 整数 (int)
stepLRStepSize 学习速率计划程序为“step”时步骤大小的值。 必须是正整数。 整数 (int)
trainingBatchSize 训练批大小。 必须是正整数。 整数 (int)
trainingCropSize 训练数据集的神经网络输入的图像裁剪大小。 必须是正整数。 整数 (int)
validationBatchSize 验证批大小。 必须是正整数。 整数 (int)
validationCropSize 输入到神经网络的验证数据集的图像裁剪大小。 必须是正整数。 整数 (int)
validationResizeSize 在裁剪验证数据集之前要调整其大小的图像大小。 必须是正整数。 整数 (int)
warmupCosineLRCycles 学习速率计划程序为“warmup_cosine”时的余弦周期值。 必须是 [0, 1] 范围内的浮点。 整数 (int)
warmupCosineLRWarmupEpochs 当学习速率计划程序为“warmup_cosine”时,预热时期的值。 必须是正整数。 整数 (int)
weightDecay (权重衰减) 优化器为“zn”、“adam”或“adamw”时的权重衰减值。 必须是范围[0, 1] 中的浮点。 整数 (int)
weightedLoss 减肥。 对于无加权损失,接受的值为 0。
1 用于与 sqrt 一起减肥。(class_weights)。 2 用于减肥与class_weights。 必须为 0 或 1 或 2。
整数 (int)

ImageModelSettingsObjectDetection

名称 DESCRIPTION 价值
高级设置 高级方案的设置。 字符串
amsGradient 优化器为“adam”或“adamw”时启用 AMSGrad。 布尔
扩充 使用扩充的设置。 字符串
贝塔1 优化器为“adam”或“adamw”时“beta1”的值。 必须是 [0, 1] 范围内的浮点。 整数 (int)
贝塔2 优化器为“adam”或“adamw”时“beta2”的值。 必须是 [0, 1] 范围内的浮点。 整数 (int)
boxDetectionsPerImage (每图像检测) 每个图像的最大检测数,适用于所有类。 必须是正整数。
注意:“yolov5”算法不支持此设置。
整数 (int)
boxScoreThreshold (盒分数阈值) 在推理期间,仅返回分类分数大于
BoxScoreThreshold。 必须是范围[0, 1] 中的浮点。
整数 (int)
检查点频率 存储模型检查点的频率。 必须是正整数。 整数 (int)
checkpoint模型 用于增量训练的预先训练检查点模型。 MLFlowModelJobInput
检查点RunId 上一次运行的 ID,该运行具有用于增量训练的预先训练检查点。 字符串
分散式 是否使用分布式训练。 布尔
earlyStopping (早期停止) 在训练期间启用提前停止逻辑。 布尔
earlyStoppingDelay 在主要指标改进之前等待的最小纪元数或验证评估数
跟踪早期停止。 必须是正整数。
整数 (int)
早点停止耐心 之前没有主要指标改进的最小纪元或验证评估数
运行已停止。 必须是正整数。
整数 (int)
enableOnnxNormalization 导出 ONNX 模型时启用规范化。 布尔
evaluationFrequency 评估验证数据集以获取指标分数的频率。 必须是正整数。 整数 (int)
梯度累积步骤 渐变累积意味着在不运行配置数量的“GradAccumulationStep”步骤的情况下
更新模型权重,同时累积这些步骤的渐变,然后使用
用于计算权重更新的累积渐变。 必须是正整数。
整数 (int)
图像大小 用于训练和验证的图像大小。 必须是正整数。
注意:如果大小太大,训练运行可能会进入 CUDA OOM。
注意:仅“yolov5”算法支持此设置。
整数 (int)
layersToFreeze (图层冻结) 要冻结模型的层数。 必须是正整数。
例如,将 2 作为“seresnext”的值传递意味着
冻结 layer0 和 layer1。 有关支持的模型的完整列表以及有关层冻结的详细信息,请
请参阅:/azure/machine-learning/how-to-auto-train-image-models。
整数 (int)
learningRate 初始学习速率。 必须是 [0, 1] 范围内的浮点。 整数 (int)
learningRateScheduler 的 学习速率计划程序的类型。 必须是“warmup_cosine”或“step”。 “None”
“Step”
“WarmupCosine”
最大大小 将图像馈送至主干之前要重新缩放的最大大小。
必须是正整数。 注意:如果大小太大,训练运行可能会进入 CUDA OOM。
注意:“yolov5”算法不支持此设置。
整数 (int)
最小大小 将图像馈送到主干之前要重新缩放的最小大小。
必须是正整数。 注意:如果大小太大,训练运行可能会进入 CUDA OOM。
注意:“yolov5”算法不支持此设置。
整数 (int)
模型名称 要用于训练的模型的名称。
有关可用模型的详细信息,请访问官方文档:
/azure/machine-learning/how-to-auto-train-image-models。
字符串
modelSize 模型大小。 必须是“small”、“medium”、“large”或“xlarge”。
注意:如果模型大小太大,训练运行可能会进入 CUDA OOM。
注意:仅“yolov5”算法支持此设置。
“ExtraLarge”
“Large”
“Medium”
“None”
“Small”
动量 优化器为“zn”时的动量值。 必须是 [0, 1] 范围内的浮点。 整数 (int)
多尺度 按 +/- 50%的不同图像大小启用多缩放图像。
注意:如果没有足够的 GPU 内存,训练运行可能会进入 CUDA OOM。
注意:仅“yolov5”算法支持此设置。
布尔
涅斯特罗夫 优化器为“zn”时启用 nesterov。 布尔
nmsIouThreshold 在 NMS 后期处理的推理期间使用的 IOU 阈值。 必须是 [0, 1] 范围内的浮点。 整数 (int)
纪元数 训练纪元数。 必须是正整数。 整数 (int)
工人数 数据加载程序辅助角色数。 必须是非负整数。 整数 (int)
优化器 优化器的类型。 “Adam”
“Adamw”
“None”
“Zn”
随机种子 使用确定性训练时要使用的随机种子。 整数 (int)
stepLR伽玛 当学习速率计划程序为“step”时,gamma 的值。 必须是 [0, 1] 范围内的浮点。 整数 (int)
stepLRStepSize 学习速率计划程序为“step”时步骤大小的值。 必须是正整数。 整数 (int)
tileGridSize (平铺网格大小) 用于平铺每个图像的网格大小。 注意:TileGridSize 不得为
无可启用小型对象检测逻辑。 一个字符串,其中包含两个整数(采用格式)。
注意:“yolov5”算法不支持此设置。
字符串
tileOverlapRatio (平铺重叠比率) 每个维度中相邻磁贴之间的重叠比率。 必须在 [0, 1] 范围内浮动。
注意:“yolov5”算法不支持此设置。
整数 (int)
tilePredictionsNmsThreshold 用于执行 NMS 的 IOU 阈值,同时合并来自磁贴和图像的预测。
用于验证/推理。 必须在 [0, 1] 范围内浮动。
注意:“yolov5”算法不支持此设置。
整数 (int)
trainingBatchSize 训练批大小。 必须是正整数。 整数 (int)
validationBatchSize 验证批大小。 必须是正整数。 整数 (int)
validationIouThreshold 计算验证指标时要使用的 IOU 阈值。 必须在 [0, 1] 范围内浮动。 整数 (int)
validationMetricType 用于验证指标的指标计算方法。 “Coco”
“CocoVoc”
“None”
“Voc”
warmupCosineLRCycles 学习速率计划程序为“warmup_cosine”时的余弦周期值。 必须是 [0, 1] 范围内的浮点。 整数 (int)
warmupCosineLRWarmupEpochs 当学习速率计划程序为“warmup_cosine”时,预热时期的值。 必须是正整数。 整数 (int)
weightDecay (权重衰减) 优化器为“zn”、“adam”或“adamw”时的权重衰减值。 必须是范围[0, 1] 中的浮点。 整数 (int)

ImageObjectDetection

名称 DESCRIPTION 价值
limitSettings [必需]限制 AutoML 作业的设置。 ImageLimitSettings (必需)
modelSettings 用于训练模型的设置。 ImageModelSettingsObjectDetection
primaryMetric 要针对此任务进行优化的主要指标。 “MeanAveragePrecision”
搜索空间 用于采样模型及其超参数的不同组合的搜索空间。 ImageModelDistributionSettingsObjectDetection[]
扫描设置 模型扫描和超参数扫描相关设置。 ImageSweepSettings (图像扫描设置)
任务类型 [必需]AutoMLJob 的任务类型。 “ImageObjectDetection”(必需)
validationData (验证数据) 验证数据输入。 MLTableJobInput
validationDataSize 需要留出用于验证的定型数据集的分数。
介于 (0.0、 1.0) 之间的值
未提供验证数据集时应用。
整数 (int)

ImageSweepSettings (图像扫描设置)

名称 DESCRIPTION 价值
early终止 提前终止策略的类型。 提前终止政策
sampling算法 [必需]超参数采样算法的类型。 “贝贝西亚语”
“Grid”
“Random”(必需)

JobBaseProperties

名称 DESCRIPTION 价值
组件 ID 组件资源的 ARM 资源 ID。 字符串
计算 ID 计算资源的 ARM 资源 ID。 字符串
描述 资产说明文本。 字符串
displayName (显示名称) 作业的显示名称。 字符串
实验名称 作业所属的试验的名称。 如果未设置,作业将放置在“默认”试验中。 字符串
标识 标识配置。 如果已设置,则应为 AmlToken、ManagedIdentity、UserIdentity 或 null 之一。
如果为 null,则默认为 AmlToken。
身份配置
isArchived 已存档 资产是否已存档? 布尔
职位类型 设置为 AutoMLJob 类型的“AutoML”。 设置为 CommandJob 类型的“Command”。 设置为 “LabelingJobProperties”类型的“标记”。 设置为 PipelineJob 类型的“Pipeline”。 设置为“ SparkJob”类型的“Spark”。 设置为“ SweepJob”类型。 “AutoML”
“Command”
“标记”
“Pipeline”
“Spark”
“扫描”(必需)
属性 资产属性字典。 ResourceBaseProperties
服务 JobEndpoints 列表。
对于本地作业,作业终结点的终结点值为 FileStreamObject。
JobBase服务
标签 标记字典。 可以添加、删除和更新标记。 ResourceBaseTags

JobBase服务

名称 DESCRIPTION 价值

作业输入

名称 DESCRIPTION 价值
描述 输入的说明。 字符串
jobInputType (作业输入类型) 设置为 CustomModelJobInput 类型的“custom_model”。 设置为 Type LiteralJobInput 的“literal”。 设置为 MLFlowModelJobInput 类型的“mlflow_model”。 设置为 MLTableJobInput 类型的“mltable”。 设置为 TritonModelJobInput 类型的“triton_model”。 设置为 UriFileJobInput 类型的“uri_file”。 设置为 UriFolderJobInput 类型的“uri_folder”。 “custom_model”
“literal”
“mlflow_model”
“mltable”
“triton_model”
“uri_file”
“uri_folder”(必需)

JobOutput (作业输出)

名称 DESCRIPTION 价值
描述 输出的说明。 字符串
jobOutputType 设置为 CustomModelJobOutput 类型的“custom_model”。 设置为 MLFlowModelJobOutput 类型的“mlflow_model”。 设置为 MLTableJobOutput 类型的“mltable”。 设置为 TritonModelJobOutput 类型的“triton_model”。 设置为 UriFileJobOutput 类型的“uri_file”。 设置为 UriFolderJobOutput 类型的“uri_folder”。 “custom_model”
“mlflow_model”
“mltable”
“triton_model”
“uri_file”
“uri_folder”(必需)

JobResourceConfiguration

名称 DESCRIPTION 价值
dockerArgs 要传递给 Docker run 命令的额外参数。 这将替代系统设置的任何参数,或在本部分中。 此参数仅支持 Azure ML 计算类型。 字符串
instanceCount 计算目标使用的实例或节点数可选。 整数 (int)
instanceType 计算目标支持的可选 VM 类型。 字符串
属性 其他属性包。 ResourceConfigurationProperties
shmSize docker 容器的共享内存块的大小。 这应采用 (number)(unit) 格式,其中数字大于 0,单位可以是 b(字节)、k(千字节)、m(兆字节)或 g(GB)。 字符串

约束:
图案 = \d+[bBkKmMgG]

工作服务

名称 DESCRIPTION 价值
终结点 终结点的 URL。 字符串
jobServiceType 终结点类型。 字符串
节点 用户希望启动服务的节点。
如果未将 Nodes 设置为 null,则服务将仅在领导节点上启动。
节点
移植 用户设置的终结点的端口。 整数 (int)
属性 在终结点上设置的其他属性。 JobServiceProperties

JobServiceProperties

名称 DESCRIPTION 价值

标签类别

名称 DESCRIPTION 价值
此类别中标签类的字典。 标签类别类
displayName (显示名称) 标签类别的显示名称。 字符串
multiSelectEnabled 已启用 指示是否允许在此类别中选择多个类。 布尔

标签类别类

名称 DESCRIPTION 价值

标签类

名称 DESCRIPTION 价值
displayName (显示名称) 标签类的显示名称。 字符串
标签类的子类的字典。 LabelClass子类

LabelClass子类

名称 DESCRIPTION 价值

LabelingDataConfiguration

名称 DESCRIPTION 价值
数据 ID 要执行标记的数据资产的资源 ID。 字符串
incrementalDataRefreshEnabled 指示是否启用增量数据刷新。 布尔

LabelingJobImageProperties

名称 DESCRIPTION 价值
annotationType 图像标记作业的批注类型。 “BoundingBox”
“Classification”
“InstanceSegmentation”
mediaType [必需]作业的媒体类型。 “Image”(必需)

TagJobInstructions

名称 DESCRIPTION 价值
URI 指向页面的链接,其中包含标签器的详细标记说明。 字符串

LabelingJobLabel类别

名称 DESCRIPTION 价值

LabelingJobMediaProperties

名称 DESCRIPTION 价值
mediaType 设置为“Image”,类型 为 LabelingJobImageProperties。 对于 LabelingJobTextProperties 类型,设置为“Text”。 “Image”
“Text”(必需)

LabelingJobProperties

名称 DESCRIPTION 价值
dataConfiguration 配置作业中使用的数据。 LabelingDataConfiguration
工作说明 标记作业的说明。 TagJobInstructions
职位类型 [必需]指定作业的类型。 “标记”(必需)
标签类别 作业的标签类别。 LabelingJobLabel类别
labelingJobMediaProperties 作业中的媒体类型特定属性。 LabelingJobMediaProperties
mlAssistConfiguration 在作业中配置 MLAssist 功能。 MLAssistConfiguration

LabelingJobTextProperties

名称 DESCRIPTION 价值
annotationType 文本标记作业的批注类型。 “Classification”
'NamedEntityRecognition' (命名实体识别)
mediaType [必需]作业的媒体类型。 “Text”(必需)

LiteralJobInput (文字作业输入)

名称 DESCRIPTION 价值
jobInputType (作业输入类型) [必需]指定作业的类型。 “literal”(必需)
价值 [必需]输入的文本值。 字符串

约束:
模式 = [a-zA-Z0-9_] (必需)

ManagedIdentity (托管身份)

名称 DESCRIPTION 价值
客户端 ID 按客户端 ID 指定用户分配的标识。 对于系统分配,请不要设置此字段。 字符串

约束:
最小长度 = 36
最大长度 = 36
图案 = ^[0-9a-fA-F]{8}-([0-9a-fA-F]{4}-){3}[0-9a-fA-F]{12}$
身份类型 [必需]指定标识框架的类型。 “Managed”(必需)
对象 ID 按对象 ID 指定用户分配的标识。 对于系统分配,请不要设置此字段。 字符串

约束:
最小长度 = 36
最大长度 = 36
图案 = ^[0-9a-fA-F]{8}-([0-9a-fA-F]{4}-){3}[0-9a-fA-F]{12}$
资源ID 按 ARM 资源 ID 指定用户分配的标识。 对于系统分配,请不要设置此字段。 字符串

MedianStoppingPolicy (中值停止策略)

名称 DESCRIPTION 价值
policyType [必需]策略配置的名称 “MedianStopping”(必需)

MLAssistConfiguration

名称 DESCRIPTION 价值
mlAssist 设置为 MLAssistConfigurationDisabled 类型的“Disabled”。 设置为 MLAssistConfigurationEnabled 类型的“Enabled”。 “Disabled”
“Enabled”(必需)

MLAssistConfigurationDisabled

名称 DESCRIPTION 价值
mlAssist [必需]指示是否启用 MLAssist 功能。 “Disabled”(必需)

MLAssistConfiguration已启用

名称 DESCRIPTION 价值
inferencingComputeBinding [必需]推理中使用的 AML 计算绑定。 字符串

约束:
模式 = [a-zA-Z0-9_] (必需)
mlAssist [必需]指示是否启用 MLAssist 功能。 “Enabled”(必需)
trainingComputeBinding 的 [必需]训练中使用的 AML 计算绑定。 字符串

约束:
模式 = [a-zA-Z0-9_] (必需)

MLFlowModelJobInput

名称 DESCRIPTION 价值
jobInputType (作业输入类型) [必需]指定作业的类型。 “mlflow_model”(必需)
模式 输入资产传送模式。 “Direct”
“下载”
“EvalDownload”
“EvalMount”
“ReadOnlyMount”
“ReadWriteMount”
URI [必需]输入资产 URI。 字符串

约束:
模式 = [a-zA-Z0-9_] (必需)

MLFlowModelJobInput

名称 DESCRIPTION 价值
描述 输入的说明。 字符串
jobInputType (作业输入类型) [必需]指定作业的类型。 “custom_model”
“literal”
“mlflow_model”
“mltable”
“triton_model”
“uri_file”
“uri_folder”(必需)
模式 输入资产传送模式。 “Direct”
“下载”
“EvalDownload”
“EvalMount”
“ReadOnlyMount”
“ReadWriteMount”
URI [必需]输入资产 URI。 字符串

约束:
模式 = [a-zA-Z0-9_] (必需)

MLFlowModelJobOutput

名称 DESCRIPTION 价值
jobOutputType [必需]指定作业的类型。 “mlflow_model”(必需)
模式 输出资产传送模式。 “Direct”
“ReadWriteMount”
“Upload”
URI 输出资产 URI。 字符串

MLTableJobInput

名称 DESCRIPTION 价值
描述 输入的说明。 字符串
jobInputType (作业输入类型) [必需]指定作业的类型。 “custom_model”
“literal”
“mlflow_model”
“mltable”
“triton_model”
“uri_file”
“uri_folder”(必需)
模式 输入资产传送模式。 “Direct”
“下载”
“EvalDownload”
“EvalMount”
“ReadOnlyMount”
“ReadWriteMount”
URI [必需]输入资产 URI。 字符串

约束:
模式 = [a-zA-Z0-9_] (必需)

MLTableJobInput

名称 DESCRIPTION 价值
jobInputType (作业输入类型) [必需]指定作业的类型。 “mltable”(必需)
模式 输入资产传送模式。 “Direct”
“下载”
“EvalDownload”
“EvalMount”
“ReadOnlyMount”
“ReadWriteMount”
URI [必需]输入资产 URI。 字符串

约束:
模式 = [a-zA-Z0-9_] (必需)

MLTableJobOutput

名称 DESCRIPTION 价值
jobOutputType [必需]指定作业的类型。 “mltable”(必需)
模式 输出资产传送模式。 “Direct”
“ReadWriteMount”
“Upload”
URI 输出资产 URI。 字符串

MPI

名称 DESCRIPTION 价值
distributionType [必需]指定分发框架的类型。 “Mpi”(必需)
processCountPerInstance 每个 MPI 节点的进程数。 整数 (int)

NCross验证

名称 DESCRIPTION 价值
模式 对于 AutoNCrossValidations 类型,设置为“自动”。 设置为 CustomNCrossValidations 类型的“Custom”。 “Auto”
“Custom”(必需)

NlpFixedParameters

名称 DESCRIPTION 价值
梯度累积步骤 在运行向后传递之前累积渐变的步骤数。 整数 (int)
learningRate 训练过程的学习速率。 整数 (int)
learningRateScheduler 的 训练过程中要使用的学习速率计划的类型。 “Constant”
“ConstantWithWarmup”
“余弦”
“CosineWithRestarts”
“Linear”
“None”
“多项式”
模型名称 要训练的模型的名称。 字符串
纪元数 训练纪元数。 整数 (int)
trainingBatchSize 训练过程的批大小。 整数 (int)
validationBatchSize 要在评估期间使用的批大小。 整数 (int)
warmupRatio 与 LrSchedulerType 一起使用的预热比率。 整数 (int)
weightDecay (权重衰减) 训练过程的重量衰减。 整数 (int)

NlpParameterSubspace

名称 DESCRIPTION 价值
梯度累积步骤 在运行向后传递之前累积渐变的步骤数。 字符串
learningRate 训练过程的学习速率。 字符串
learningRateScheduler 的 训练过程中要使用的学习速率计划的类型。 字符串
模型名称 要训练的模型的名称。 字符串
纪元数 训练纪元数。 字符串
trainingBatchSize 训练过程的批大小。 字符串
validationBatchSize 要在评估期间使用的批大小。 字符串
warmupRatio 与 LrSchedulerType 一起使用的预热比率。 字符串
weightDecay (权重衰减) 训练过程的重量衰减。 字符串

NlpSweepSettings

名称 DESCRIPTION 价值
early终止 扫描作业的提前终止策略的类型。 提前终止政策
sampling算法 [必需]采样算法的类型。 “贝贝西亚语”
“Grid”
“Random”(必需)

NlpVerticalFeaturizationSettings

名称 DESCRIPTION 价值
datasetLanguage 数据集语言,适用于文本数据。 字符串

NlpVerticalLimitSettings

名称 DESCRIPTION 价值
maxConcurrentTrials 最大并发 AutoML 迭代次数。 整数 (int)
最大节点数 用于在任何单个试用版中训练的最大节点数。 控制多节点分布式训练。 整数 (int)
maxTrials AutoML 迭代数。 整数 (int)
超时 AutoML 作业超时。 字符串
trialTimeout (试用超时) 单个 HD 试用版的超时。 字符串

节点

名称 DESCRIPTION 价值
nodesValueType 对于 AllNodes 类型,设置为“All”。 “全部”(必需)

目的

名称 DESCRIPTION 价值
目标 [必需]定义超参数优化支持的指标目标 “最大化”
“最小化”(必需)
primaryMetric [必需]要优化的指标的名称。 字符串

约束:
模式 = [a-zA-Z0-9_] (必需)

管道作业

名称 DESCRIPTION 价值
输入 管道作业的输入。 管道作业输入
工作 作业构造管道作业。 PipelineJobJob 作业
职位类型 [必需]指定作业的类型。 “Pipeline”(必需)
输出 管道作业的输出 PipelineJobOutputs
设置 管道设置,例如 ContinueRunOnStepFailure 等。 任何
源作业 ID 源作业的 ARM 资源 ID。 字符串

管道作业输入

名称 DESCRIPTION 价值

PipelineJobJob 作业

名称 DESCRIPTION 价值

PipelineJobOutputs

名称 DESCRIPTION 价值

PyTorch

名称 DESCRIPTION 价值
distributionType [必需]指定分发框架的类型。 “PyTorch”(必需)
processCountPerInstance 每个节点的进程数。 整数 (int)

RandomSamplingAlgorithm 算法

名称 DESCRIPTION 价值
规则 随机算法的特定类型 “Random”
“Sobol”
采样算法类型 [必需]用于生成超参数值的算法以及配置属性 “Random”(必需)
种子 用作随机数生成的种子的可选整数 整数 (int)

回归

名称 DESCRIPTION 价值
cvSplitColumnNames 用于 CVSplit 数据的列。 字符串[]
featurizationSettings AutoML 作业所需的特征化输入。 TableVerticalFeaturizationSettings
固定参数 在整个训练过程中将保持不变的模型/训练参数。 TableFixedParameters (表固定参数)
limitSettings AutoMLJob 的执行约束。 TableVerticalLimitSettings
nCrossValidations 要应用于训练数据集的交叉验证折叠数
如果未提供验证数据集,则为 。
NCross验证
primaryMetric 回归任务的主要指标。 “NormalizedMeanAbsoluteError”
“NormalizedRootMeanSquaredError”
“R2Score”
'SpearmanCorrelation'
搜索空间 用于采样模型及其超参数的不同组合的搜索空间。 TableParameterSubspace[]
扫描设置 模型扫描和超参数优化的设置。 TableSweepSettings (表格扫描设置)
任务类型 [必需]AutoMLJob 的任务类型。 “回归”(必需)
测试数据 测试数据输入。 MLTableJobInput
testDataSize 需要为验证目的预留的测试数据集的分数。
介于 (0.0、 1.0) 之间的值
未提供验证数据集时应用。
整数 (int)
trainingSettings AutoML 作业训练阶段的输入。 回归训练设置
validationData (验证数据) 验证数据输入。 MLTableJobInput
validationDataSize 需要留出用于验证的定型数据集的分数。
介于 (0.0、 1.0) 之间的值
未提供验证数据集时应用。
整数 (int)
权重列名称 示例权重列的名称。 自动化 ML 支持加权列作为输入,导致数据中的行向上或向下加权。 字符串

回归训练设置

名称 DESCRIPTION 价值
allowedTrainingAlgorithms 回归任务的允许模型。 包含任一项的字符串数组:
“DecisionTree”
“ElasticNet”
“ExtremeRandomTrees”
“GradientBoosting”
“KNN”
“LassoLars”
“LightGBM”
“RandomForest”
“ZN”
“XGBoostRegressor”
blockedTrainingAlgorithms 回归任务的阻止模型。 包含任一项的字符串数组:
“DecisionTree”
“ElasticNet”
“ExtremeRandomTrees”
“GradientBoosting”
“KNN”
“LassoLars”
“LightGBM”
“RandomForest”
“ZN”
“XGBoostRegressor”
enableDnnTraining 启用 DNN 模型的建议。 布尔
enableModelExplainability 标志以在最佳模型上启用可解释性。 布尔
enableOnnxCompatibleModels 用于启用 onnx 兼容模型的标志。 布尔
enableStackEnsemble 启用堆栈合奏运行。 布尔
enableVoteEnsemble 启用投票合奏运行。 布尔
ensembleModelDownloadTimeout 在 VotingEnsemble 和 StackEnsemble 模型生成期间,将下载先前子运行中的多个拟合模型。
如果需要更多时间,请将此参数配置为大于 300 秒的值。
字符串
stackEnsembleSettings 堆栈合奏的堆栈合奏设置。 StackEnsembleSettings

ResourceBaseProperties

名称 DESCRIPTION 价值

ResourceBaseTags

名称 DESCRIPTION 价值

ResourceConfigurationProperties

名称 DESCRIPTION 价值

采样算法

名称 DESCRIPTION 价值
采样算法类型 设置为 “Bayesian”类型的 BayesianSamplingAlgorithm。 设置为 GridSamplingAlgorithm 类型的“Grid”。 设置为 RandomSamplingAlgorithm 类型的“Random”。 “贝贝西亚语”
“Grid”
“Random”(必需)

季节性

名称 DESCRIPTION 价值
模式 设置为“ AutoSeasonality”类型为“自动”。 设置为“ CustomSeasonality”类型。 “Auto”
“Custom”(必需)

SparkJob

名称 DESCRIPTION 价值
档案 存档作业中使用的文件。 字符串[]
参数 作业的参数。 字符串
代码 Id [必需]代码资产的 ARM 资源 ID。 字符串

约束:
模式 = [a-zA-Z0-9_] (必需)
会议 Spark 配置的属性。 SparkJobConf 函数
输入 [必需]在启动作业时要执行的条目。 SparkJobEntry (必需)
环境 ID 作业的环境规范的 ARM 资源 ID。 字符串
文件 作业中使用的文件。 字符串[]
输入 作业中使用的输入数据绑定的映射。 SparkJobInputs
罐子 作业中使用的 Jar 文件。 字符串[]
职位类型 [必需]指定作业的类型。 “Spark”(必需)
输出 作业中使用的输出数据绑定的映射。 SparkJob输出
py文件 作业中使用的 Python 文件。 字符串[]
资源 作业的计算资源配置。 SparkResourceConfiguration

SparkJobConf 函数

名称 DESCRIPTION 价值

SparkJobEntry

名称 DESCRIPTION 价值
sparkJobEntryType 设置为 SparkJobPythonEntry 类型的“SparkJobPythonEntry”。 设置为“ SparkJobScalaEntry”类型的“SparkJobScalaEntry”。 “SparkJobPythonEntry”
“SparkJobScalaEntry”(必需)

SparkJobInputs

名称 DESCRIPTION 价值

SparkJob输出

名称 DESCRIPTION 价值

SparkJobPython条目

名称 DESCRIPTION 价值
文件 [必需]作业入口点的相对 python 文件路径。 字符串

约束:
最小长度 = 1
模式 = [a-zA-Z0-9_] (必需)
sparkJobEntryType [必需]作业入口点的类型。 “SparkJobPythonEntry”(必需)

SparkJobScalaEntry

名称 DESCRIPTION 价值
类名 [必需]用作入口点的 Scala 类名称。 字符串

约束:
最小长度 = 1
模式 = [a-zA-Z0-9_] (必需)
sparkJobEntryType [必需]作业入口点的类型。 “SparkJobScalaEntry”(必需)

SparkResourceConfiguration

名称 DESCRIPTION 价值
instanceType 计算目标支持的可选 VM 类型。 字符串
runtimeVersion (运行时版本) 用于作业的 spark 运行时的版本。 字符串

StackEnsembleSettings

名称 DESCRIPTION 价值
stackMetaLearnerKWargs 要传递给元学习器初始值设定项的可选参数。 任何
stackMetaLearnerTrainPercentage 指定要保留用于训练元学习者的训练集(选择训练和训练类型的训练)的比例。 默认值为 0.2。 整数 (int)
stackMetaLearnerType 元学习器是在单个异类模型的输出上训练的模型。 “ElasticNet”
“ElasticNetCV”
“LightGBMClassifier”
“LightGBMRegressor”
“LinearRegression”
“LogisticRegression”
“LogisticRegressionCV”
“None”

SweepJob (扫描作业)

名称 DESCRIPTION 价值
early终止 提前终止策略可在完成之前取消性能不佳的运行 提前终止政策
输入 作业中使用的输入数据绑定的映射。 SweepJobInputs
职位类型 [必需]指定作业的类型。 “扫描”(必需)
限制 扫描作业限制。 SweepJobLimits (扫描作业限制)
目的 [必需]优化目标。 目标 (必需)
输出 作业中使用的输出数据绑定的映射。 SweepJobOutputs (扫描作业输出)
sampling算法 [必需]超参数采样算法 SamplingAlgorithm (必需)
搜索空间 [必需]包含每个参数及其分布的字典。 字典键是参数的名称 任何(必需)
试用 [必需]试用组件定义。 TrialComponent (必需)

SweepJobInputs

名称 DESCRIPTION 价值

SweepJobLimits (扫描作业限制)

名称 DESCRIPTION 价值
jobLimits类型 [必需]JobLimit 类型。 “Command”
“扫描”(必需)
maxConcurrentTrials 扫描作业最大并发试用版。 整数 (int)
maxTotalTrials 扫描作业最大总试用版数。 整数 (int)
超时 ISO 8601 格式的最大运行持续时间,之后作业将被取消。 仅支持精度为秒的持续时间。 字符串
trialTimeout (试用超时) 扫描作业试用超时值。 字符串

SweepJobOutputs (扫描作业输出)

名称 DESCRIPTION 价值

TableFixedParameters (表固定参数)

名称 DESCRIPTION 价值
助 推 器 指定提升类型,例如 XGBoost 的 gbdt。 字符串
boosting类型 指定提升类型,例如 LightGBM 的 gbdt。 字符串
增长策略 指定增长策略,该策略控制新节点添加到树的方式。 字符串
learningRate 训练过程的学习速率。 整数 (int)
最大 Bin 指定存储桶连续功能的最大离散箱数。 整数 (int)
最大深度 指定显式限制树深度的最大深度。 整数 (int)
最大叶数 指定显式限制树叶的最大叶数。 整数 (int)
minDataInLeaf 的 每个叶的最小数据数。 整数 (int)
minSplitGain 最小分度增益 在树的叶节点上进行进一步分区所需的最小损失减少。 整数 (int)
模型名称 要训练的模型的名称。 字符串
nEstimator 指定模型中的树数(或舍入)。 整数 (int)
叶数 指定叶数。 整数 (int)
preprocessorName 要使用的预处理器的名称。 字符串
regAlpha 权重的 L1 正则化术语。 整数 (int)
regLambda L2 权重的正则化术语。 整数 (int)
子样本 训练实例的子采样比率。 整数 (int)
subsampleFreq 子采样的频率。 整数 (int)
treeMethod 指定树方法。 字符串
withMean 如果为 true,在使用 StandardScalar 缩放数据之前居中。 布尔
withStd 如果为 true,请使用 StandardScalar 缩放具有单位方差的数据。 布尔

TableParameterSubspace

名称 DESCRIPTION 价值
助 推 器 指定提升类型,例如 XGBoost 的 gbdt。 字符串
boosting类型 指定提升类型,例如 LightGBM 的 gbdt。 字符串
增长策略 指定增长策略,该策略控制新节点添加到树的方式。 字符串
learningRate 训练过程的学习速率。 字符串
最大 Bin 指定存储桶连续功能的最大离散箱数。 字符串
最大深度 指定显式限制树深度的最大深度。 字符串
最大叶数 指定显式限制树叶的最大叶数。 字符串
minDataInLeaf 的 每个叶的最小数据数。 字符串
minSplitGain 最小分度增益 在树的叶节点上进行进一步分区所需的最小损失减少。 字符串
模型名称 要训练的模型的名称。 字符串
nEstimator 指定模型中的树数(或舍入)。 字符串
叶数 指定叶数。 字符串
preprocessorName 要使用的预处理器的名称。 字符串
regAlpha 权重的 L1 正则化术语。 字符串
regLambda L2 权重的正则化术语。 字符串
子样本 训练实例的子采样比率。 字符串
subsampleFreq 子采样的频率 字符串
treeMethod 指定树方法。 字符串
withMean 如果为 true,在使用 StandardScalar 缩放数据之前居中。 字符串
withStd 如果为 true,请使用 StandardScalar 缩放具有单位方差的数据。 字符串

TableSweepSettings (表格扫描设置)

名称 DESCRIPTION 价值
early终止 扫描作业的提前终止策略的类型。 提前终止政策
sampling算法 [必需]采样算法的类型。 “贝贝西亚语”
“Grid”
“Random”(必需)

TableVerticalFeaturizationSettings

名称 DESCRIPTION 价值
阻塞变压器 这些转换器不应用于特征化。 包含任一项的字符串数组:
“CatTargetEncoder”
“CountVectorizer”
“HashOneHotEncoder”
“LabelEncoder”
“NaiveBayes”
“OneHotEncoder”
“TextTargetEncoder”
“TfIdf”
“WoETargetEncoder”
“WordEmbedding”
columnNameAnd类型 列名及其类型(int、float、string、datetime 等)的字典。 TableVerticalFeaturizationSettingsColumnNameAndTypes
datasetLanguage 数据集语言,适用于文本数据。 字符串
enableDnnFeaturization 确定是否使用基于 Dnn 的特征化器进行数据特征化。 布尔
模式 特征化模式 - 用户可以保留默认的“自动”模式,AutoML 将负责在特征化阶段对数据进行必要的转换。
如果选择了“关闭”,则不会完成特征化。
如果选择“自定义”,则用户可以指定其他输入以自定义特征化完成方式。
“Auto”
“Custom”
“关闭”
transformer参数 用户可以指定要用于的其他转换器以及要向其应用它的列以及转换器构造函数的参数。 TableVerticalFeaturizationSettingsTransformerParams

TableVerticalFeaturizationSettingsColumnNameAndTypes

名称 DESCRIPTION 价值

TableVerticalFeaturizationSettingsTransformerParams

名称 DESCRIPTION 价值

TableVerticalLimitSettings

名称 DESCRIPTION 价值
enableEarlyTermination 启用提前终止,确定如果最近 20 次迭代中没有分数改进,AutoMLJob 是否会提前终止。 布尔
退出评分 AutoML 作业的退出分数。 整数 (int)
maxConcurrentTrials 最大并发迭代数。 整数 (int)
maxCoresPerTrial 每次迭代的最大核心数。 整数 (int)
maxTrials 迭代数。 整数 (int)
sweepConcurrentTrials 用户想要触发的并发扫描运行数。 整数 (int)
sweepTrials 用户想要触发的扫描运行数。 整数 (int)
超时 AutoML 作业超时。 字符串
trialTimeout (试用超时) 迭代超时。 字符串

目标滞后

名称 DESCRIPTION 价值
模式 对于 AutoTargetLags 类型,设置为“自动”。 设置为 CustomTargetLags 类型的“Custom”。 “Auto”
“Custom”(必需)

TargetRollingWindowSize

名称 DESCRIPTION 价值
模式 设置为“ AutoTargetRollingWindowSize”类型的“自动”。 设置为 CustomTargetRollingWindowSize 类型的“Custom”。 “Auto”
“Custom”(必需)

TensorFlow

名称 DESCRIPTION 价值
distributionType [必需]指定分发框架的类型。 “TensorFlow”(必需)
parameterServerCount 参数服务器任务数。 整数 (int)
workerCount 工人计数 工人数。 如果未指定,则默认为实例计数。 整数 (int)

文本分类

名称 DESCRIPTION 价值
featurizationSettings AutoML 作业所需的特征化输入。 NlpVerticalFeaturizationSettings
固定参数 在整个训练过程中将保持不变的模型/训练参数。 NlpFixedParameters
limitSettings AutoMLJob 的执行约束。 NlpVerticalLimitSettings
primaryMetric Text-Classification 任务的主要指标。 “准确性”
“AUCWeighted”
“AveragePrecisionScoreWeighted”
“NormMacroRecall”
“PrecisionScoreWeighted”
搜索空间 用于采样模型及其超参数的不同组合的搜索空间。 NlpParameterSubspace[]
扫描设置 模型扫描和超参数优化的设置。 NlpSweepSettings
任务类型 [必需]AutoMLJob 的任务类型。 “TextClassification”(必需)
validationData (验证数据) 验证数据输入。 MLTableJobInput

TextClassificationMultilabel

名称 DESCRIPTION 价值
featurizationSettings AutoML 作业所需的特征化输入。 NlpVerticalFeaturizationSettings
固定参数 在整个训练过程中将保持不变的模型/训练参数。 NlpFixedParameters
limitSettings AutoMLJob 的执行约束。 NlpVerticalLimitSettings
搜索空间 用于采样模型及其超参数的不同组合的搜索空间。 NlpParameterSubspace[]
扫描设置 模型扫描和超参数优化的设置。 NlpSweepSettings
任务类型 [必需]AutoMLJob 的任务类型。 “TextClassificationMultilabel”(必需)
validationData (验证数据) 验证数据输入。 MLTableJobInput

TextNer (文本生成器)

名称 DESCRIPTION 价值
featurizationSettings AutoML 作业所需的特征化输入。 NlpVerticalFeaturizationSettings
固定参数 在整个训练过程中将保持不变的模型/训练参数。 NlpFixedParameters
limitSettings AutoMLJob 的执行约束。 NlpVerticalLimitSettings
搜索空间 用于采样模型及其超参数的不同组合的搜索空间。 NlpParameterSubspace[]
扫描设置 模型扫描和超参数优化的设置。 NlpSweepSettings
任务类型 [必需]AutoMLJob 的任务类型。 “TextNER”(必需)
validationData (验证数据) 验证数据输入。 MLTableJobInput

TrialComponent (试用组件)

名称 DESCRIPTION 价值
代码 Id 代码资产的 ARM 资源 ID。 字符串
指令 [必需]在启动作业时执行的命令。 例如 “python train.py” 字符串

约束:
最小长度 = 1
模式 = [a-zA-Z0-9_] (必需)
分配 作业的分发配置。 如果已设置,则应为 Mpi、Tensorflow、PyTorch 或 null 之一。 分发配置
环境 ID [必需]作业的环境规范的 ARM 资源 ID。 字符串

约束:
模式 = [a-zA-Z0-9_] (必需)
环境变量 作业中包含的环境变量。 TrialComponentEnvironmentVariables
资源 作业的计算资源配置。 JobResourceConfiguration

TrialComponentEnvironmentVariables

名称 DESCRIPTION 价值

TritonModelJobInput

名称 DESCRIPTION 价值
jobInputType (作业输入类型) [必需]指定作业的类型。 “triton_model”(必需)
模式 输入资产传送模式。 “Direct”
“下载”
“EvalDownload”
“EvalMount”
“ReadOnlyMount”
“ReadWriteMount”
URI [必需]输入资产 URI。 字符串

约束:
模式 = [a-zA-Z0-9_] (必需)

TritonModelJobOutput

名称 DESCRIPTION 价值
jobOutputType [必需]指定作业的类型。 “triton_model”(必需)
模式 输出资产传送模式。 “Direct”
“ReadWriteMount”
“Upload”
URI 输出资产 URI。 字符串

截断选择策略

名称 DESCRIPTION 价值
policyType [必需]策略配置的名称 “TruncationSelection”(必需)
截断百分比 要在每个评估间隔取消的运行百分比。 整数 (int)

UriFileJobInput

名称 DESCRIPTION 价值
jobInputType (作业输入类型) [必需]指定作业的类型。 “uri_file”(必需)
模式 输入资产传送模式。 “Direct”
“下载”
“EvalDownload”
“EvalMount”
“ReadOnlyMount”
“ReadWriteMount”
URI [必需]输入资产 URI。 字符串

约束:
模式 = [a-zA-Z0-9_] (必需)

UriFileJobOutput

名称 DESCRIPTION 价值
jobOutputType [必需]指定作业的类型。 “uri_file”(必需)
模式 输出资产传送模式。 “Direct”
“ReadWriteMount”
“Upload”
URI 输出资产 URI。 字符串

UriFolderJobInput

名称 DESCRIPTION 价值
jobInputType (作业输入类型) [必需]指定作业的类型。 “uri_folder”(必需)
模式 输入资产传送模式。 “Direct”
“下载”
“EvalDownload”
“EvalMount”
“ReadOnlyMount”
“ReadWriteMount”
URI [必需]输入资产 URI。 字符串

约束:
模式 = [a-zA-Z0-9_] (必需)

UriFolderJobOutput

名称 DESCRIPTION 价值
jobOutputType [必需]指定作业的类型。 “uri_folder”(必需)
模式 输出资产传送模式。 “Direct”
“ReadWriteMount”
“Upload”
URI 输出资产 URI。 字符串

用户身份

名称 DESCRIPTION 价值
身份类型 [必需]指定标识框架的类型。 “UserIdentity”(必需)