你当前正在访问 Microsoft Azure Global Edition 技术文档网站。 如果需要访问由世纪互联运营的 Microsoft Azure 中国技术文档网站,请访问 https://docs.azure.cn

ImageClassificationJob 类

AutoML 多类图像分类作业的配置。

初始化新的 AutoML 多类图像分类作业。

继承
azure.ai.ml.entities._job.automl.image.automl_image_classification_base.AutoMLImageClassificationBase
ImageClassificationJob

构造函数

ImageClassificationJob(*, primary_metric: str | ClassificationPrimaryMetrics | None = None, **kwargs)

参数

primary_metric
必需

用于优化的主要指标

kwargs
必需

特定于作业的参数

方法

dump

将作业内容转储到 YAML 格式的文件中。

extend_search_space

为 AutoML 图像分类和图像分类多标签任务添加搜索空间。

set_data
set_limits

限制所有 AutoML 垂直图像的设置。

set_sweep

所有 AutoML 垂直图像的扫描设置。

set_training_parameters

为 AutoML 图像分类和图像分类多标签任务设置图像训练参数。

dump

将作业内容转储到 YAML 格式的文件中。

dump(dest: str | PathLike | IO, **kwargs) -> None

参数

dest
Union[<xref:PathLike>, str, IO[AnyStr]]
必需

要向其写入 YAML 内容的本地路径或文件流。 如果 dest 是文件路径,则将创建一个新文件。 如果 dest 是打开的文件,则将直接写入该文件。

kwargs
dict

要传递给 YAML 序列化程序的其他参数。

例外

如果 dest 是文件路径且文件已存在,则引发。

如果 dest 是打开的文件且文件不可写,则引发。

extend_search_space

为 AutoML 图像分类和图像分类多标签任务添加搜索空间。

extend_search_space(value: SearchSpace | List[SearchSpace]) -> None

参数

value
Union[ImageClassificationSearchSpace, List[ImageClassificationSearchSpace]]
必需

指定 ImageClassificationSearchSpace 的实例或 ImageClassificationSearchSpace 的列表以搜索参数空间

例外

如果 dest 是文件路径且文件已存在,则引发。

如果 dest 是打开的文件且文件不可写,则引发。

set_data

set_data(*, training_data: Input, target_column_name: str, validation_data: Input | None = None, validation_data_size: float | None = None) -> None

例外

如果 dest 是文件路径且文件已存在,则引发。

如果 dest 是打开的文件且文件不可写,则引发。

set_limits

限制所有 AutoML 垂直图像的设置。

set_limits(*, max_concurrent_trials: int | None = None, max_trials: int | None = None, timeout_minutes: int | None = None) -> None

参数

timeout_minutes
timedelta

AutoML 作业超时。

例外

如果 dest 是文件路径且文件已存在,则引发。

如果 dest 是打开的文件且文件不可写,则引发。

set_sweep

所有 AutoML 垂直图像的扫描设置。

set_sweep(*, sampling_algorithm: str | Random | Grid | Bayesian, early_termination: BanditPolicy | MedianStoppingPolicy | TruncationSelectionPolicy | None = None) -> None

参数

sampling_algorithm

必需。 [必需]超参数采样算法的类型。 可能的值包括:“Grid”、“Random”、“Bayesian”。

early_termination
Union[ BanditPolicy, MedianStoppingPolicy, TruncationSelectionPolicy]

提前终止策略的类型。

例外

如果 dest 是文件路径且文件已存在,则引发。

如果 dest 是打开的文件且文件不可写,则引发。

set_training_parameters

为 AutoML 图像分类和图像分类多标签任务设置图像训练参数。

set_training_parameters(*, advanced_settings: str | None = None, ams_gradient: bool | None = None, beta1: float | None = None, beta2: float | None = None, checkpoint_frequency: int | None = None, checkpoint_run_id: str | None = None, distributed: bool | None = None, early_stopping: bool | None = None, early_stopping_delay: int | None = None, early_stopping_patience: int | None = None, enable_onnx_normalization: bool | None = None, evaluation_frequency: int | None = None, gradient_accumulation_step: int | None = None, layers_to_freeze: int | None = None, learning_rate: float | None = None, learning_rate_scheduler: str | LearningRateScheduler | None = None, model_name: str | None = None, momentum: float | None = None, nesterov: bool | None = None, number_of_epochs: int | None = None, number_of_workers: int | None = None, optimizer: str | StochasticOptimizer | None = None, random_seed: int | None = None, step_lr_gamma: float | None = None, step_lr_step_size: int | None = None, training_batch_size: int | None = None, validation_batch_size: int | None = None, warmup_cosine_lr_cycles: float | None = None, warmup_cosine_lr_warmup_epochs: int | None = None, weight_decay: float | None = None, training_crop_size: int | None = None, validation_crop_size: int | None = None, validation_resize_size: int | None = None, weighted_loss: int | None = None) -> None

参数

advanced_settings
str

高级方案的设置。

ams_gradient
bool

当优化器为“adam”或“adamw”时启用 AMSGrad。

beta1
float

当优化器为“adam”或“adamw”时,“beta1”的值。 必须是 [0, 1] 范围内的浮点数。

beta2
float

当优化器为“adam”或“adamw”时,“beta2”的值。 必须是 [0, 1] 范围内的浮点数。

checkpoint_frequency
int

存储模型检查点所遵循的频率。 必须是正整数。

checkpoint_run_id
str

具有增量训练的预训练检查点的上一个运行的 ID。

distributed
bool

是否使用分布式训练。

early_stopping
bool

在训练期间启用提前停止逻辑。

early_stopping_delay
int

跟踪主要指标改进以提前停止之前等待的最小时期数或验证评估。 必须是正整数。

early_stopping_patience
int

在停止运行之前,没有主要指标改进的最小时期数或验证评估。 必须是正整数。

enable_onnx_normalization
bool

导出 ONNX 模型时启用规范化。

evaluation_frequency
int

评估验证数据集以获得指标分数所遵循的频率。 必须是正整数。

gradient_accumulation_step
int

梯度累积是指运行配置数量的“GradAccumulationStep”步骤,但不更新模型权重,同时累积这些步骤的梯度,然后使用累积的渐变计算权重更新。 必须是正整数。

layers_to_freeze

模型要冻结的层数。 必须是正整数。 例如,将 2 作为“seresnext”的值传递意味着冻结 layer0 和 layer1。 有关支持模型的完整列表以及有关层冻结的详细信息,请参阅: https://docs.microsoft.com/en-us/azure/machine-learning/reference-automl-images-hyperparameters#model-agnostic-hyperparameters。 # pylint: disable=line-too-long

learning_rate
float

初始学习速率。 必须是 [0, 1] 范围内的浮点数。

learning_rate_scheduler

学习速率计划程序的类型。 必须为“warmup_cosine”或“step”。 可能的值包括:“None”、“WarmupCosine”、“Step”。

model_name

用于训练的模型的名称。 有关可用模型的详细信息,请访问官方文档: https://docs.microsoft.com/en-us/azure/machine-learning/how-to-auto-train-image-models

momentum
float

优化器为“sgd”时的动量值。 必须是 [0, 1] 范围内的浮点数。

nesterov
bool

当优化器为“sgd”时启用 nesterov。

number_of_epochs
int

训练循环数。 必须是正整数。

number_of_workers
int

数据加载程序辅助角色的数目。 必须是非负整数。

optimizer

优化器的类型。 可能的值包括:“None”、“Sgd”、“Adam”、“Adamw”。

random_seed
int

使用确定性训练时要使用的随机种子。

step_lr_gamma
float

当学习速率计划程序为“step”时,gamma 的值。 必须是 [0, 1] 范围内的浮点数。

step_lr_step_size
int

当学习速率计划程序为“step”时,步骤大小的值。 必须是正整数。

training_batch_size
int

训练批大小。 必须是正整数。

validation_batch_size
int

验证批大小。 必须是正整数。

warmup_cosine_lr_cycles
float

学习速率计划程序为“warmup_cosine”时的余弦周期值。 必须是 [0, 1] 范围内的浮点数。

warmup_cosine_lr_warmup_epochs
int

当学习速率计划程序为“warmup_cosine”时,预热时期的值。 必须是正整数。

weight_decay
float

当优化器为“sgd”、“adam”或“adamw”时,权重衰减的值。 必须是范围[0, 1] 中的浮点数。

training_crop_size
int

输入到训练数据集的神经网络的图像裁剪大小。 必须是正整数。

validation_crop_size
int

输入到验证数据集的神经网络的图像裁剪大小。 必须是正整数。

validation_resize_size
int

在为验证数据集裁剪之前要将图像调整到的大小。 必须是正整数。

weighted_loss
int

减肥。 接受的值为 0,表示没有加权损失。 1 用于使用 sqrt. (class_weights) 的加权损失。 2 表示使用 class_weights 计算的加权损失。 必须为 0、1 或 2。

例外

如果 dest 是文件路径且文件已存在,则引发。

如果 dest 是打开的文件且文件不可写,则引发。

属性

base_path

资源的基路径。

返回

资源的基路径。

返回类型

str

creation_context

资源的创建上下文。

返回

资源的创建元数据。

返回类型

id

资源 ID。

返回

资源的全局 ID,Azure 资源管理器 (ARM) ID。

返回类型

inputs

limits

log_files

作业输出文件。

返回

日志名称和 URL 的字典。

返回类型

log_verbosity

outputs

primary_metric

search_space

status

作业的状态。

返回的常见值包括“正在运行”、“已完成”和“失败”。 所有可能的值为:

  • NotStarted - 这是客户端 Run 对象在云提交之前处于的临时状态。

  • 正在启动 - 运行已开始在云中处理。 调用方此时具有运行 ID。

  • 预配 - 正在为给定的作业提交创建按需计算。

  • 准备 - 运行环境正在准备中,处于以下两个阶段之一:

    • Docker 映像生成

    • Conda 环境设置

  • 已排队 - 作业在计算目标上排队。 例如,在 BatchAI 中,作业处于排队状态

    等待所有请求的节点准备就绪时。

  • 正在运行 - 作业已开始在计算目标上运行。

  • 正在完成 - 用户代码执行已完成,运行处于后处理阶段。

  • 已请求取消 - 已请求取消作业。

  • 已完成 - 运行已成功完成。 这包括用户代码执行和运行

    后期处理阶段。

  • 失败 - 运行失败。 通常,运行上的 Error 属性会提供有关原因的详细信息。

  • 已取消 - 遵循取消请求并指示运行现已成功取消。

  • 未响应 - 对于启用了检测信号的运行,最近未发送任何检测信号。

返回

作业的状态。

返回类型

studio_url

Azure ML Studio 终结点。

返回

作业详细信息页的 URL。

返回类型

sweep

task_type

获取任务类型。

返回

要运行的任务的类型。 可能的值包括:“classification”、“regression”、“forecasting”。

返回类型

str

test_data

获取测试数据。

返回

测试数据输入

返回类型

training_data

获取训练数据。

返回

训练数据输入

返回类型

training_parameters

type

作业的类型。

返回

作业的类型。

返回类型

validation_data

获取验证数据。

返回

验证数据输入

返回类型