EstimatorStep 类
已弃用。 创建要为 Azure ML 模型训练运行 Estimator 的管道步骤。
创建 Azure ML 管道步骤,以运行估算器进行机器学习模型训练。
已弃用。 请改用 CommandStep。 有关示例,请参阅如何使用 CommandStep 在管道中运行 ML 训练脚本。
- 继承
-
EstimatorStep
构造函数
EstimatorStep(name=None, estimator=None, estimator_entry_script_arguments=None, runconfig_pipeline_params=None, inputs=None, outputs=None, compute_target=None, allow_reuse=True, version=None)
参数
名称 | 说明 |
---|---|
name
|
步骤的名称。 默认值: None
|
estimator
|
此步骤的关联估算器对象。 可以是预配置的估算器,例如 Chainer、PyTorch、TensorFlow 或 SKLearn。 默认值: None
|
estimator_entry_script_arguments
|
[必需] 命令行参数的列表。 如果估算器的输入脚本不接受命令行参数,请将此参数值设置为空列表。 默认值: None
|
runconfig_pipeline_params
|
在运行时使用键值对替代 runconfig 属性,每个键值对分别具有 runconfig 属性的名称和该属性的 PipelineParameter。 支持的值:“NodeCount”、“MpiProcessCountPerNode”、“TensorflowWorkerCount”、“TensorflowParameterServerCount” 默认值: None
|
inputs
|
要使用的输入的列表。 默认值: None
|
outputs
|
PipelineData 对象的列表。 默认值: None
|
compute_target
|
[必需] 要使用的计算目标。 默认值: None
|
allow_reuse
|
指示当使用相同的设置重新运行时,该步骤是否应重用以前的结果。 默认情况下启用重用。 如果步骤内容(脚本/依赖项)以及输入和参数保持不变,则重用此步骤以前运行的输出。 重用该步骤时,不是将作业提交到计算,而是使前一运行的结果立即可供后续步骤使用。 如果使用 Azure 机器学习数据集作为输入,则重用取决于数据集的定义是否已更改,而不是基础数据是否已更改。 默认值: True
|
version
|
用于表示模块功能更改的可选版本标记。 默认值: None
|
name
必需
|
步骤的名称。 |
estimator
必需
|
<xref:Estimator>
此步骤的关联估算器对象。 可以是预配置的估算器,例如 Chainer、PyTorch、TensorFlow 或 SKLearn。 |
estimator_entry_script_arguments
必需
|
[str]
[必需] 命令行参数的列表。 如果估算器的输入脚本不接受命令行参数,请将此参数值设置为空列表。 |
runconfig_pipeline_params
必需
|
在运行时使用键值对替代 runconfig 属性,每个键值对分别具有 runconfig 属性的名称和该属性的 PipelineParameter。 支持的值:“NodeCount”、“MpiProcessCountPerNode”、“TensorflowWorkerCount”、“TensorflowParameterServerCount” |
inputs
必需
|
list[Union[PipelineData, PipelineOutputAbstractDataset, DataReference, DatasetConsumptionConfig, PipelineOutputTabularDataset, PipelineOutputFileDataset]]
要使用的输入的列表。 |
outputs
必需
|
PipelineData 对象的列表。 |
compute_target
必需
|
[必需] 要使用的计算目标。 |
allow_reuse
必需
|
指示当使用相同的设置重新运行时,该步骤是否应重用以前的结果。 默认情况下启用重用。 如果步骤内容(脚本/依赖项)以及输入和参数保持不变,则重用此步骤以前运行的输出。 重用该步骤时,不是将作业提交到计算,而是使前一运行的结果立即可供后续步骤使用。 如果使用 Azure 机器学习数据集作为输入,则重用取决于数据集的定义是否已更改,而不是基础数据是否已更改。 |
version
必需
|
版本 |
注解
请注意,在实例化 EstimatorStep 时,在 Estimator 对象中使用的条目脚本的参数必须通过 estimator_entry_script_arguments
参数指定为“list”。 估算器参数 script_params
接受字典。 然而,estimator_entry_script_argument
参数需要参数作为列表。
EstimatorStep 初始化涉及使用 inputs
参数指定输入列表,你不需要使用估算器指定输入,如果那样做,将引发异常。 有关允许的输入类型,请参阅 inputs
参数。 还可以选择为此步骤指定任何输出。 有关允许的输出类型,请参阅 outputs
参数。
使用 EstimatorStep 的最佳做法是将单独的文件夹用于脚本以及与该步骤关联的任何依赖文件,并将该文件夹指定为 Estimator 对象的 source_directory
。 这样做有两个优点。 首先,它有助于减少为该步骤创建的快照的大小,因为只有该步骤需要进行快照操作。 其次,如果 source_directory
没有任何更改会触发快照的重新上载,则可以重复使用前一次运行的步骤输出。
方法
create_node |
从估算器步骤创建一个节点,并将其添加到指定的图中。 已弃用。 请改用 CommandStep。 有关示例,请参阅如何使用 CommandStep 在管道中运行 ML 训练脚本。 此方法不能直接使用。 通过此步骤实例化管道时,Azure ML 会自动通过此方法传递所需的参数,以便可以将步骤添加到表示工作流的管道图形中。 |
create_node
从估算器步骤创建一个节点,并将其添加到指定的图中。
已弃用。 请改用 CommandStep。 有关示例,请参阅如何使用 CommandStep 在管道中运行 ML 训练脚本。
此方法不能直接使用。 通过此步骤实例化管道时,Azure ML 会自动通过此方法传递所需的参数,以便可以将步骤添加到表示工作流的管道图形中。
create_node(graph, default_datastore, context)
参数
名称 | 说明 |
---|---|
graph
必需
|
要添加节点的图形对象。 |
default_datastore
必需
|
默认数据存储。 |
context
必需
|
<xref:azureml.pipeline.core._GraphContext>
图形上下文。 |
返回
类型 | 说明 |
---|---|
创建的节点。 |
反馈
https://aka.ms/ContentUserFeedback。
即将发布:在整个 2024 年,我们将逐步淘汰作为内容反馈机制的“GitHub 问题”,并将其取代为新的反馈系统。 有关详细信息,请参阅:提交和查看相关反馈