Share via


EstimatorStep クラス

非推奨。 Azure ML モデル トレーニング用に Estimator を実行するパイプライン ステップを作成します。

Azure ML Pipeline ステップを作成して、Estimator for Machine Learning モデル トレーニングを実行します。

非推奨。 代わりに CommandStep を使用してください。 例については、「CommandStep を使用してパイプラインで ML トレーニングを実行する方法」を参照してください。

継承
EstimatorStep

コンストラクター

EstimatorStep(name=None, estimator=None, estimator_entry_script_arguments=None, runconfig_pipeline_params=None, inputs=None, outputs=None, compute_target=None, allow_reuse=True, version=None)

パラメーター

name
str
既定値: None

ステップの名前。

estimator
Estimator
既定値: None

このステップに関連付けられている推定器オブジェクト。 ChainerPyTorchTensorFlowSKLearn などの事前構成された推定器 を指定できます。

estimator_entry_script_arguments
list[str]
既定値: None

[必須] コマンドライン引数の一覧。 推定器のエントリ スクリプトがコマンド ライン引数を受け入れない場合は、このパラメーター値を空のリストに設定します。

runconfig_pipeline_params
dict[str, PipelineParameter]
既定値: None

キーと値のペアを使用した実行時の runconfig プロパティのオーバーライド。それぞれに runconfig プロパティの名前とそのプロパティの PipelineParameter が含まれています。

サポートされる値は、'NodeCount'、'MpiProcessCountPerNode'、'TensorflowWorkerCount'、'TensorflowParameterServerCount' です。

inputs
list[Union[PipelineData, PipelineOutputAbstractDataset, DataReference, DatasetConsumptionConfig]]
既定値: None

使用する入力のリスト。

outputs
list[Union[PipelineData, OutputDatasetConfig, PipelineOutputAbstractDataset]]
既定値: None

PipelineData オブジェクトのリスト。

compute_target
Union[DsvmCompute, AmlCompute, RemoteCompute, str]
既定値: None

[必須] 使用するコンピューティング先。

allow_reuse
bool
既定値: True

同じ設定で再実行されたときに、ステップで前の結果を再利用するかどうかを示します。 再利用は既定で有効になっています。 ステップの内容 (スクリプトや依存関係) だけでなく、入力とパラメーターも変更されていない場合は、このステップの前の実行からの出力が再利用されます。 ステップを再利用する場合、計算するジョブを送信する代わりに、前の実行の結果を後続のステップですぐに利用できるようにします。 Azure Machine Learning データセットを入力として使用する場合、再利用は、基になるデータが変更されたかどうかではなく、データセットの定義が変更されたかどうかによって決まります。

version
str
既定値: None

モジュールの機能変更を示すオプションのバージョン タグ。

name
str
必須

ステップの名前。

estimator
<xref:Estimator>
必須

このステップに関連付けられている推定器オブジェクト。 ChainerPyTorchTensorFlowSKLearn などの事前構成された推定器 を指定できます。

estimator_entry_script_arguments
[str]
必須

[必須] コマンドライン引数の一覧。 推定器のエントリ スクリプトがコマンド ライン引数を受け入れない場合は、このパラメーター値を空のリストに設定します。

runconfig_pipeline_params
dict[str, PipelineParameter]
必須

キーと値のペアを使用した実行時の runconfig プロパティのオーバーライド。それぞれに runconfig プロパティの名前とそのプロパティの PipelineParameter が含まれています。

サポートされる値は、'NodeCount'、'MpiProcessCountPerNode'、'TensorflowWorkerCount'、'TensorflowParameterServerCount' です。

outputs
list[Union[PipelineData, PipelineOutputAbstractDataset]
必須

PipelineData オブジェクトのリスト。

compute_target
Union[DsvmCompute, AmlCompute, RemoteCompute, str]
必須

[必須] 使用するコンピューティング先。

allow_reuse
bool
必須

同じ設定で再実行されたときに、ステップで前の結果を再利用するかどうかを示します。 再利用は既定で有効になっています。 ステップの内容 (スクリプトや依存関係) だけでなく、入力とパラメーターも変更されていない場合は、このステップの前の実行からの出力が再利用されます。 ステップを再利用する場合、計算するジョブを送信する代わりに、前の実行の結果を後続のステップですぐに利用できるようにします。 Azure Machine Learning データセットを入力として使用する場合、再利用は、基になるデータが変更されたかどうかではなく、データセットの定義が変更されたかどうかによって決まります。

version
str
必須

version

注釈

Estimator オブジェクトで使用されるエントリ スクリプトへの引数は、EstimatorStep をインスタンス化するときに、estimator_entry_script_arguments パラメーターを使用してリストとして指定する必要があることに注意してください。 推定器パラメーター script_params は辞書を受け入れます。 ただし、estimator_entry_script_argument パラメーターの引数はリストである必要があります。

EstimatorStep の初期化では、inputs パラメーターで入力リストを指定する必要があり、推定器で入力を指定する必要はありません。指定した場合は例外がスローされます。 許可されている入力の種類については、inputs パラメーターを参照してください。 必要に応じて、ステップの出力を指定することもできます。 許可されている出力の種類については、outputs パラメーターを参照してください。

EstimatorStep を使用する場合のベスト プラクティスは、ステップに関連付けられているスクリプトと任意の依存ファイルに対して別のフォルダーを使用し、そのフォルダーを Estimator オブジェクトの source_directory として指定することです。 これには 2 つの利点があります。 まず、ステップに必要なものだけがスナップショットされるため、ステップに対して作成されるスナップショットのサイズを小さくするのに役立ちます。 そして、スナップショットの再アップロードをトリガーする source_directory に変更がない場合に、以前の実行からのステップの出力を再利用することができます。

メソッド

create_node

推定器ステップからノードを作成し、指定したグラフに追加します。

非推奨。 代わりに CommandStep を使用してください。 例については、「CommandStep を使用してパイプラインで ML トレーニングを実行する方法」を参照してください。

このメソッドは直接使用するためのものではありません。 このステップでパイプラインがインスタンス化されると、Azure ML は、ワークフローを表すパイプライン グラフにステップを追加できるように、このメソッドで必要なパラメーターを自動的に渡します。

create_node

推定器ステップからノードを作成し、指定したグラフに追加します。

非推奨。 代わりに CommandStep を使用してください。 例については、「CommandStep を使用してパイプラインで ML トレーニングを実行する方法」を参照してください。

このメソッドは直接使用するためのものではありません。 このステップでパイプラインがインスタンス化されると、Azure ML は、ワークフローを表すパイプライン グラフにステップを追加できるように、このメソッドで必要なパラメーターを自動的に渡します。

create_node(graph, default_datastore, context)

パラメーター

graph
Graph
必須

ノードを追加するグラフ オブジェクト。

default_datastore
Union[AbstractAzureStorageDatastore, AzureDataLakeDatastore]
必須

既定のデータストア。

context
<xref:azureml.pipeline.core._GraphContext>
必須

グラフ コンテキスト。

戻り値

作成されたノード。

の戻り値の型 :