OutputPortBinding Класс

Ссылка

Определяет именованные выходные данные этапа конвейера.

Класс OutputPortBinding позволяет задать тип данных, которые будут создаваться на этапе, и способ их создания. Его можно использовать с InputPortBinding, чтобы указать, что выходные данные этапа являются обязательными входными данными для другого этапа.

Инициализация OutputPortBinding.

Наследование: builtins.object

OutputPortBinding

Конструктор

OutputPortBinding(name, datastore=None, output_name=None, bind_mode='mount', path_on_compute=None, is_directory=None, overwrite=None, data_type=None, pipeline_output_name=None, training_output=None, dataset_registration=None, dataset_output=None)

Параметры

Имя	Описание
name Обязательно	str Имя объекта OutputPortBinding, которое может содержать только буквы, цифры и символы подчеркивания.
datastore	Union[AbstractAzureStorageDatastore, AzureDataLakeDatastore] Хранилище данных, в котором будет размещаться PipelineData. значение по умолчанию: None
output_name	str При значении None используется имя выходных данных. Может содержать только буквы, цифры и символы подчеркивания. значение по умолчанию: None
bind_mode	str Указывает, будет ли этап создания использовать для доступа к данным метод "upload", "mount" или "hdfs". значение по умолчанию: mount
path_on_compute	str Для режима "upload" (отправка) — путь, по которому модуль записывает выходные данные. значение по умолчанию: None
is_directory	bool Являются ли выходные данные каталогом или отдельным файлом. значение по умолчанию: None
overwrite	bool Для режима "upload" (отправка) указывает, следует ли перезаписывать существующие данные. значение по умолчанию: None
data_type	str Необязательный элемент. Тип данных можно использовать для указания ожидаемого типа выходных данных, а также для детализации способа использования данных соответствующими этапами. Это может быть любая определяемая пользователем строка. значение по умолчанию: None
pipeline_output_name	str Если этот параметр указан, выходные данные будут доступны с помощью PipelineRun.get_pipeline_output(). Имена выходных данных конвейера должны быть уникальными в рамках конвейера. значение по умолчанию: None
training_output	TrainingOutput Определяет выходные данные для результатов обучения. Это необходимо только для конкретных видов обучения с различными типами выходных данных, таким как метрики и модели. Например, результат AutoMLStep — создание метрик и модели. Можно также определить конкретную итерацию или метрику обучения, используемую для получения оптимальной модели. Для HyperDriveStep можно также определить конкретные файлы модели, которые будут включаться в выходные данные. значение по умолчанию: None
dataset_registration	DatasetRegistration Необязательный элемент. Это внутренний параметр. Вместо него следует использовать PipelineData.as_dataset. значение по умолчанию: None
dataset_output	OutputDatasetConfig Необязательный элемент. Это внутренний параметр. Вместо него следует использовать OutputFileDatasetConfig. значение по умолчанию: None
name Обязательно	str Имя объекта OutputPortBinding, которое может содержать только буквы, цифры и символы подчеркивания.
datastore Обязательно	Union[AbstractAzureStorageDatastore, AzureDataLakeDatastore] Хранилище данных, в котором будет размещаться PipelineData.
output_name Обязательно	str При значении None используется имя выходных данных. Может содержать только буквы, цифры и символы подчеркивания.
bind_mode Обязательно	str Указывает, будет ли этап создания использовать для доступа к данным метод "upload", "mount" или "hdfs".
path_on_compute Обязательно	str Для режима "upload" (отправка) — путь, по которому модуль записывает выходные данные.
is_directory Обязательно	bool Значение , если выходные данные являются каталогом
overwrite Обязательно	bool Для режима "upload" (отправка) указывает, следует ли перезаписывать существующие данные.
data_type Обязательно	str Необязательный элемент. Тип данных можно использовать для указания ожидаемого типа выходных данных, а также для детализации способа использования данных соответствующими этапами. Это может быть любая определяемая пользователем строка.
pipeline_output_name Обязательно	str Если этот параметр указан, выходные данные будут доступны с помощью PipelineRun.get_pipeline_output(). Имена выходных данных конвейера должны быть уникальными в рамках конвейера.
training_output Обязательно	TrainingOutput Определяет выходные данные для результатов обучения. Это необходимо только для конкретных видов обучения с различными типами выходных данных, таким как метрики и модели. Например, результат AutoMLStep — создание метрик и модели. Можно также определить конкретную итерацию или метрику обучения, используемую для получения оптимальной модели. Для HyperDriveStep можно также определить конкретные файлы модели, которые будут включаться в выходные данные.
dataset_registration Обязательно	DatasetRegistration Необязательный элемент. Это внутренний параметр. Вместо него следует использовать PipelineData.as_dataset.
dataset_output Обязательно	OutputDatasetConfig Необязательный элемент. Это внутренний параметр. Вместо него следует использовать OutputFileDatasetConfig.

OutputPortBinding можно использовать таким же образом, как PipelineData, при построении конвейера для указания входных и выходных данных этапа. Разница заключается в том, что OutputPortBinding необходимо использовать с InputPortBinding для использования в качестве входных данных для другого этапа.

Пример создания конвейера с помощью OutputPortBinding выглядит следующим образом:


   from azureml.pipeline.core import OutputPortBinding, InputPortBinding, Pipeline
   from azureml.pipeline.steps import PythonScriptStep

   step_1_output = OutputPortBinding("output", datastore=datastore)

   step_1 = PythonScriptStep(
       name='process data',
       script_name="process_data.py",
       compute_target=compute,
       arguments=["--output", step_1_output],
       outputs=[step_1_output]
   )

   step_2_input = InputPortBinding("input", bind_object=step_1_output)

   step_2 = PythonScriptStep(
       name='train',
       script_name="train.py",
       compute_target=compute,
       arguments=["--input", step_2_input],
       inputs=[step_2_input]
   )

   pipeline = Pipeline(workspace=workspace, steps=[step_1, step_2])

Будет создан конвейер с двумя этапами. В первую очередь выполняется этап обработки, а после его завершения выполняется этап обучения. Azure ML предоставит выходные данные, созданные на этапе обработки, как описано в объекте OutputPortBinding, на этап обучения.

Атрибуты

bind_mode

Получение режима ("upload", "mount" или "hdfs"), который будет использоваться для создания данных.

Возвращаемое значение

Тип	Описание
str	Режим привязки.

data_type

Получение типа данных, которые будут созданы.

Возвращаемое значение

Тип	Описание
str	Имя типа данных.

dataset_registration

Получение сведений о регистрации набора данных.

Возвращаемое значение

Тип	Описание
DatasetRegistration	Сведения о регистрации набора данных.

datastore

Хранилище данных, в котором будет размещаться PipelineData.

Возвращаемое значение

Тип	Описание
Union[AbstractAzureStorageDatastore, AzureDataLakeDatastore]	Объект хранилища данных.

is_directory

Являются ли выходные данные каталогом.

Возвращаемое значение

Тип	Описание
bool	is_directory

name

Имя объекта OutputPortBinding.

Возвращаемое значение

Тип	Описание
str	Имя.

overwrite

Для режима "upload" (отправка) указывает, следует ли перезаписывать существующие данные.

Возвращаемое значение

Тип	Описание
bool	_overwrite

path_on_compute

Для режима "upload" (отправка) — путь, по которому модуль записывает выходные данные.

Возвращаемое значение

Тип	Описание
str	path_on_compute

pipeline_output_name

Получение имени выходных данных конвейера, соответствующих этому объекту OutputPortBinding.

Возвращаемое значение

Тип	Описание
str	Имя выходных данных конвейера.

training_output

Получение выходных данных обучения.

Возвращаемое значение

Тип	Описание
TrainingOutput	Выходные данные обучения

Поделиться через

OutputPortBinding Класс

Конструктор

Параметры

Комментарии

Атрибуты

bind_mode

Возвращаемое значение

data_type

Возвращаемое значение

dataset_registration

Возвращаемое значение

datastore

Возвращаемое значение

is_directory

Возвращаемое значение

name

Возвращаемое значение

overwrite

Возвращаемое значение

path_on_compute

Возвращаемое значение

pipeline_output_name

Возвращаемое значение

training_output

Возвращаемое значение

Обратная связь

Обратная связь

Дополнительные ресурсы