OutputPortBinding クラス

パイプラインステップの名前付き出力を定義します。

OutputPortBinding を使用して、ステップによって生成されるデータの種類とデータの生成方法を指定できます。 InputPortBindingと共に使用して、ステップ出力が別のステップの必須入力であることを指定できます。

OutputPortBinding を初期化します。

コンストラクター

OutputPortBinding(name, datastore=None, output_name=None, bind_mode='mount', path_on_compute=None, is_directory=None, overwrite=None, data_type=None, pipeline_output_name=None, training_output=None, dataset_registration=None, dataset_output=None)

パラメーター

名前	説明
name 必須	str OutputPortBinding オブジェクトの名前。文字、数字、アンダースコアのみを含めることができます。
datastore	Union[AbstractAzureStorageDatastore, AzureDataLakeDatastore] PipelineData が存在するデータストア。規定値: None
output_name	str None 名が使用されている場合は、出力の名前。文字、数字、アンダースコアのみを含めることができます。規定値: None
bind_mode	str 生成ステップでデータにアクセスするために "upload" メソッドまたは "mount" メソッドまたは "hdfs" メソッドのどちらを使用するかを指定します。規定値: mount
path_on_compute	str "upload" モードの場合、モジュールが出力を書き込むパス。規定値: None
is_directory	bool 出力がディレクトリか単一ファイルか。規定値: None
overwrite	bool "アップロード" モードの場合、既存のデータを上書きするかどうか。規定値: None
data_type	str 省略可。データ型を使用して、出力の予想される型を指定し、使用する手順でデータを使用する方法を詳しく説明できます。任意のユーザー定義文字列を指定できます。規定値: None
pipeline_output_name	str 指定された場合、この出力は PipelineRun.get_pipeline_output() を使用して使用できます。パイプラインの出力名は、パイプライン内で一意である必要があります。規定値: None
training_output	TrainingOutput トレーニング結果の出力を定義します。これは、メトリックやモデルなど、さまざまな種類の出力が生成される特定のトレーニングにのみ必要です。たとえば、 AutoMLStep 結果はメトリックとモデルになります。また、最適なモデルを取得するために使用される特定のトレーニングイテレーションまたはメトリックを定義することもできます。 HyperDriveStepでは、出力に含める特定のモデルファイルを定義することもできます。規定値: None
dataset_registration	DatasetRegistration 省略可。これは内部パラメーターです。代わりにPipelineData.as_datasetを使用する必要があります。規定値: None
dataset_output	OutputDatasetConfig 省略可。これは内部パラメーターです。 OutputFileDatasetConfig intead を使用している必要があります。規定値: None
name 必須	str OutputPortBinding オブジェクトの名前。文字、数字、アンダースコアのみを含めることができます。
datastore 必須	Union[AbstractAzureStorageDatastore, AzureDataLakeDatastore] PipelineData が存在するデータストア。
output_name 必須	str None 名が使用されている場合は、出力の名前。文字、数字、アンダースコアのみを含めることができます。
bind_mode 必須	str 生成ステップでデータにアクセスするために "upload" メソッドまたは "mount" メソッドまたは "hdfs" メソッドのどちらを使用するかを指定します。
path_on_compute 必須	str "upload" モードの場合、モジュールが出力を書き込むパス。
is_directory 必須	bool 出力がディレクトリの場合
overwrite 必須	bool "アップロード" モードの場合、既存のデータを上書きするかどうか。
data_type 必須	str 省略可。データ型を使用して、出力の予想される型を指定し、使用する手順でデータを使用する方法を詳しく説明できます。任意のユーザー定義文字列を指定できます。
pipeline_output_name 必須	str 指定された場合、この出力は PipelineRun.get_pipeline_output() を使用して使用できます。パイプラインの出力名は、パイプライン内で一意である必要があります。
training_output 必須	TrainingOutput トレーニング結果の出力を定義します。これは、メトリックやモデルなど、さまざまな種類の出力が生成される特定のトレーニングにのみ必要です。たとえば、 AutoMLStep 結果はメトリックとモデルになります。また、最適なモデルを取得するために使用される特定のトレーニングイテレーションまたはメトリックを定義することもできます。 HyperDriveStepでは、出力に含める特定のモデルファイルを定義することもできます。
dataset_registration 必須	DatasetRegistration 省略可。これは内部パラメーターです。代わりにPipelineData.as_datasetを使用する必要があります。
dataset_output 必須	OutputDatasetConfig 省略可。これは内部パラメーターです。 OutputFileDatasetConfig intead を使用している必要があります。

注釈

OutputPortBinding は、パイプラインを構築してステップの入力と出力を指定する際の PipelineData と同様の方法で使用できます。違いは、OutputPortBinding を別のステップへの入力として使用するために、 InputPortBinding で使用する必要がある点です。

OutputPortBinding を使用してパイプラインを構築する例を次に示します。


   from azureml.pipeline.core import OutputPortBinding, InputPortBinding, Pipeline
   from azureml.pipeline.steps import PythonScriptStep

   step_1_output = OutputPortBinding("output", datastore=datastore)

   step_1 = PythonScriptStep(
       name='process data',
       script_name="process_data.py",
       compute_target=compute,
       arguments=["--output", step_1_output],
       outputs=[step_1_output]
   )

   step_2_input = InputPortBinding("input", bind_object=step_1_output)

   step_2 = PythonScriptStep(
       name='train',
       script_name="train.py",
       compute_target=compute,
       arguments=["--input", step_2_input],
       inputs=[step_2_input]
   )

   pipeline = Pipeline(workspace=workspace, steps=[step_1, step_2])

これにより、2 つの手順でパイプラインが作成されます。プロセスステップが最初に実行され、完了した後、トレーニングステップが実行されます。 Azure ML は、OutputPortBinding オブジェクトの説明に従って、プロセスステップによって生成された出力をトレーニングステップに提供します。

属性

bind_mode

生成ステップがデータの作成に使用するモード ("upload" または "mount" または "hdfs") を取得します。

戻り値

型	説明
str	バインドモード。

data_type

生成されるデータの型を取得します。

戻り値

型	説明
str	データ型名。

dataset_registration

データセット登録情報を取得します。

戻り値

型	説明
DatasetRegistration	データセット登録情報。

datastore

PipelineData が存在するデータストア。

戻り値

型	説明
Union[AbstractAzureStorageDatastore, AzureDataLakeDatastore]	データストアオブジェクト。

is_directory

出力がディレクトリかどうか。

戻り値

型	説明
bool	is_directory

name

OutputPortBinding オブジェクトの名前。

戻り値

型	説明
str	名前。

overwrite

"アップロード" モードの場合は、既存のデータを上書きするかどうかを指定します。

戻り値

型	説明
bool	_上書き

path_on_compute

"upload" モードの場合、モジュールが出力を書き込むパス。

戻り値

型	説明
str	path_on_compute

pipeline_output_name

この OutputPortBinding に対応するパイプライン出力の名前を取得します。

戻り値

型	説明
str	パイプライン出力名。

training_output

トレーニング出力を取得します。

戻り値

型	説明
TrainingOutput	トレーニング出力