EstimatorStep クラス

リファレンス

非推奨。 Azure ML モデルトレーニング用に Estimator を実行するパイプラインステップを作成します。

Azure ML Pipeline ステップを作成して、Estimator for Machine Learning モデルトレーニングを実行します。

非推奨。代わりに CommandStep を使用してください。例については、「CommandStep を使用してパイプラインで ML トレーニングを実行する方法」を参照してください。

継承: PythonScriptStep

EstimatorStep

コンストラクター

EstimatorStep(name=None, estimator=None, estimator_entry_script_arguments=None, runconfig_pipeline_params=None, inputs=None, outputs=None, compute_target=None, allow_reuse=True, version=None)

パラメーター

name: str

既定値: None

ステップの名前。

estimator: Estimator

既定値: None

このステップに関連付けられている推定器オブジェクト。 Chainer、PyTorch、TensorFlow、SKLearn などの事前構成された推定器を指定できます。

estimator_entry_script_arguments: list[str]

既定値: None

[必須] コマンドライン引数の一覧。推定器のエントリスクリプトがコマンドライン引数を受け入れない場合は、このパラメーター値を空のリストに設定します。

runconfig_pipeline_params: dict[str, PipelineParameter]

既定値: None

キーと値のペアを使用した実行時の runconfig プロパティのオーバーライド。それぞれに runconfig プロパティの名前とそのプロパティの PipelineParameter が含まれています。

サポートされる値は、'NodeCount'、'MpiProcessCountPerNode'、'TensorflowWorkerCount'、'TensorflowParameterServerCount' です。

inputs: list[Union[PipelineData, PipelineOutputAbstractDataset, DataReference, DatasetConsumptionConfig]]

既定値: None

使用する入力のリスト。

outputs: list[Union[PipelineData, OutputDatasetConfig, PipelineOutputAbstractDataset]]

既定値: None

PipelineData オブジェクトのリスト。

compute_target: Union[DsvmCompute, AmlCompute, RemoteCompute, str]

既定値: None

[必須] 使用するコンピューティング先。

allow_reuse: bool

既定値: True

同じ設定で再実行されたときに、ステップで前の結果を再利用するかどうかを示します。再利用は既定で有効になっています。ステップの内容 (スクリプトや依存関係) だけでなく、入力とパラメーターも変更されていない場合は、このステップの前の実行からの出力が再利用されます。ステップを再利用する場合、計算するジョブを送信する代わりに、前の実行の結果を後続のステップですぐに利用できるようにします。 Azure Machine Learning データセットを入力として使用する場合、再利用は、基になるデータが変更されたかどうかではなく、データセットの定義が変更されたかどうかによって決まります。

version: str

既定値: None

モジュールの機能変更を示すオプションのバージョンタグ。

name: str

必須

ステップの名前。

estimator: <xref:Estimator>

必須

このステップに関連付けられている推定器オブジェクト。 Chainer、PyTorch、TensorFlow、SKLearn などの事前構成された推定器を指定できます。

estimator_entry_script_arguments: [str]

必須

runconfig_pipeline_params: dict[str, PipelineParameter]

必須

サポートされる値は、'NodeCount'、'MpiProcessCountPerNode'、'TensorflowWorkerCount'、'TensorflowParameterServerCount' です。

inputs: list[Union[PipelineData, PipelineOutputAbstractDataset, DataReference, DatasetConsumptionConfig, PipelineOutputTabularDataset, PipelineOutputFileDataset]]

必須

使用する入力のリスト。

outputs: list[Union[PipelineData, PipelineOutputAbstractDataset]

必須

PipelineData オブジェクトのリスト。

compute_target: Union[DsvmCompute, AmlCompute, RemoteCompute, str]

必須

[必須] 使用するコンピューティング先。

allow_reuse: bool

必須

version: str

必須

version

注釈

Estimator オブジェクトで使用されるエントリスクリプトへの引数は、EstimatorStep をインスタンス化するときに、estimator_entry_script_arguments パラメーターを使用してリストとして指定する必要があることに注意してください。推定器パラメーター script_params は辞書を受け入れます。ただし、estimator_entry_script_argument パラメーターの引数はリストである必要があります。

EstimatorStep の初期化では、inputs パラメーターで入力リストを指定する必要があり、推定器で入力を指定する必要はありません。指定した場合は例外がスローされます。許可されている入力の種類については、inputs パラメーターを参照してください。必要に応じて、ステップの出力を指定することもできます。許可されている出力の種類については、outputs パラメーターを参照してください。

EstimatorStep を使用する場合のベストプラクティスは、ステップに関連付けられているスクリプトと任意の依存ファイルに対して別のフォルダーを使用し、そのフォルダーを Estimator オブジェクトの source_directory として指定することです。これには 2 つの利点があります。まず、ステップに必要なものだけがスナップショットされるため、ステップに対して作成されるスナップショットのサイズを小さくするのに役立ちます。そして、スナップショットの再アップロードをトリガーする source_directory に変更がない場合に、以前の実行からのステップの出力を再利用することができます。

メソッド

create_node

推定器ステップからノードを作成し、指定したグラフに追加します。

このメソッドは直接使用するためのものではありません。このステップでパイプラインがインスタンス化されると、Azure ML は、ワークフローを表すパイプライングラフにステップを追加できるように、このメソッドで必要なパラメーターを自動的に渡します。

create_node

推定器ステップからノードを作成し、指定したグラフに追加します。

create_node(graph, default_datastore, context)

パラメーター

graph: Graph

必須

ノードを追加するグラフオブジェクト。

default_datastore: Union[AbstractAzureStorageDatastore, AzureDataLakeDatastore]

必須

既定のデータストア。

context: <xref:azureml.pipeline.core._GraphContext>

必須

グラフコンテキスト。

戻り値

作成されたノード。

の戻り値の型 :

Node

Share via

EstimatorStep クラス

コンストラクター

パラメーター

注釈

メソッド

create_node

パラメーター

戻り値

の戻り値の型 :

フィードバック

フィードバック

その他のリソース