Поделиться через


OutputPortBinding Класс

Определяет именованные выходные данные этапа конвейера.

Класс OutputPortBinding позволяет задать тип данных, которые будут создаваться на этапе, и способ их создания. Его можно использовать с InputPortBinding, чтобы указать, что выходные данные этапа являются обязательными входными данными для другого этапа.

Инициализация OutputPortBinding.

Наследование
builtins.object
OutputPortBinding

Конструктор

OutputPortBinding(name, datastore=None, output_name=None, bind_mode='mount', path_on_compute=None, is_directory=None, overwrite=None, data_type=None, pipeline_output_name=None, training_output=None, dataset_registration=None, dataset_output=None)

Параметры

Имя Описание
name
Обязательно
str

Имя объекта OutputPortBinding, которое может содержать только буквы, цифры и символы подчеркивания.

datastore

Хранилище данных, в котором будет размещаться PipelineData.

значение по умолчанию: None
output_name
str

При значении None используется имя выходных данных. Может содержать только буквы, цифры и символы подчеркивания.

значение по умолчанию: None
bind_mode
str

Указывает, будет ли этап создания использовать для доступа к данным метод "upload", "mount" или "hdfs".

значение по умолчанию: mount
path_on_compute
str

Для режима "upload" (отправка) — путь, по которому модуль записывает выходные данные.

значение по умолчанию: None
is_directory

Являются ли выходные данные каталогом или отдельным файлом.

значение по умолчанию: None
overwrite

Для режима "upload" (отправка) указывает, следует ли перезаписывать существующие данные.

значение по умолчанию: None
data_type
str

Необязательный элемент. Тип данных можно использовать для указания ожидаемого типа выходных данных, а также для детализации способа использования данных соответствующими этапами. Это может быть любая определяемая пользователем строка.

значение по умолчанию: None
pipeline_output_name
str

Если этот параметр указан, выходные данные будут доступны с помощью PipelineRun.get_pipeline_output(). Имена выходных данных конвейера должны быть уникальными в рамках конвейера.

значение по умолчанию: None
training_output

Определяет выходные данные для результатов обучения. Это необходимо только для конкретных видов обучения с различными типами выходных данных, таким как метрики и модели. Например, результат AutoMLStep — создание метрик и модели. Можно также определить конкретную итерацию или метрику обучения, используемую для получения оптимальной модели. Для HyperDriveStep можно также определить конкретные файлы модели, которые будут включаться в выходные данные.

значение по умолчанию: None
dataset_registration

Необязательный элемент. Это внутренний параметр. Вместо него следует использовать PipelineData.as_dataset.

значение по умолчанию: None
dataset_output

Необязательный элемент. Это внутренний параметр. Вместо него следует использовать OutputFileDatasetConfig.

значение по умолчанию: None
name
Обязательно
str

Имя объекта OutputPortBinding, которое может содержать только буквы, цифры и символы подчеркивания.

datastore
Обязательно

Хранилище данных, в котором будет размещаться PipelineData.

output_name
Обязательно
str

При значении None используется имя выходных данных. Может содержать только буквы, цифры и символы подчеркивания.

bind_mode
Обязательно
str

Указывает, будет ли этап создания использовать для доступа к данным метод "upload", "mount" или "hdfs".

path_on_compute
Обязательно
str

Для режима "upload" (отправка) — путь, по которому модуль записывает выходные данные.

is_directory
Обязательно

Значение , если выходные данные являются каталогом

overwrite
Обязательно

Для режима "upload" (отправка) указывает, следует ли перезаписывать существующие данные.

data_type
Обязательно
str

Необязательный элемент. Тип данных можно использовать для указания ожидаемого типа выходных данных, а также для детализации способа использования данных соответствующими этапами. Это может быть любая определяемая пользователем строка.

pipeline_output_name
Обязательно
str

Если этот параметр указан, выходные данные будут доступны с помощью PipelineRun.get_pipeline_output(). Имена выходных данных конвейера должны быть уникальными в рамках конвейера.

training_output
Обязательно

Определяет выходные данные для результатов обучения. Это необходимо только для конкретных видов обучения с различными типами выходных данных, таким как метрики и модели. Например, результат AutoMLStep — создание метрик и модели. Можно также определить конкретную итерацию или метрику обучения, используемую для получения оптимальной модели. Для HyperDriveStep можно также определить конкретные файлы модели, которые будут включаться в выходные данные.

dataset_registration
Обязательно

Необязательный элемент. Это внутренний параметр. Вместо него следует использовать PipelineData.as_dataset.

dataset_output
Обязательно

Необязательный элемент. Это внутренний параметр. Вместо него следует использовать OutputFileDatasetConfig.

Комментарии

OutputPortBinding можно использовать таким же образом, как PipelineData, при построении конвейера для указания входных и выходных данных этапа. Разница заключается в том, что OutputPortBinding необходимо использовать с InputPortBinding для использования в качестве входных данных для другого этапа.

Пример создания конвейера с помощью OutputPortBinding выглядит следующим образом:


   from azureml.pipeline.core import OutputPortBinding, InputPortBinding, Pipeline
   from azureml.pipeline.steps import PythonScriptStep

   step_1_output = OutputPortBinding("output", datastore=datastore)

   step_1 = PythonScriptStep(
       name='process data',
       script_name="process_data.py",
       compute_target=compute,
       arguments=["--output", step_1_output],
       outputs=[step_1_output]
   )

   step_2_input = InputPortBinding("input", bind_object=step_1_output)

   step_2 = PythonScriptStep(
       name='train',
       script_name="train.py",
       compute_target=compute,
       arguments=["--input", step_2_input],
       inputs=[step_2_input]
   )

   pipeline = Pipeline(workspace=workspace, steps=[step_1, step_2])

Будет создан конвейер с двумя этапами. В первую очередь выполняется этап обработки, а после его завершения выполняется этап обучения. Azure ML предоставит выходные данные, созданные на этапе обработки, как описано в объекте OutputPortBinding, на этап обучения.

Атрибуты

bind_mode

Получение режима ("upload", "mount" или "hdfs"), который будет использоваться для создания данных.

Возвращаемое значение

Тип Описание
str

Режим привязки.

data_type

Получение типа данных, которые будут созданы.

Возвращаемое значение

Тип Описание
str

Имя типа данных.

dataset_registration

Получение сведений о регистрации набора данных.

Возвращаемое значение

Тип Описание

Сведения о регистрации набора данных.

datastore

Хранилище данных, в котором будет размещаться PipelineData.

Возвращаемое значение

Тип Описание

Объект хранилища данных.

is_directory

Являются ли выходные данные каталогом.

Возвращаемое значение

Тип Описание

is_directory

name

Имя объекта OutputPortBinding.

Возвращаемое значение

Тип Описание
str

Имя.

overwrite

Для режима "upload" (отправка) указывает, следует ли перезаписывать существующие данные.

Возвращаемое значение

Тип Описание

_overwrite

path_on_compute

Для режима "upload" (отправка) — путь, по которому модуль записывает выходные данные.

Возвращаемое значение

Тип Описание
str

path_on_compute

pipeline_output_name

Получение имени выходных данных конвейера, соответствующих этому объекту OutputPortBinding.

Возвращаемое значение

Тип Описание
str

Имя выходных данных конвейера.

training_output

Получение выходных данных обучения.

Возвращаемое значение

Тип Описание

Выходные данные обучения