Поделиться через


ParallelTask Класс

Параллельная задача.

Наследование
azure.ai.ml.entities._mixins.RestTranslatableMixin
ParallelTask
azure.ai.ml.entities._mixins.DictMixin
ParallelTask

Конструктор

ParallelTask(*, type: str | None = None, code: str | None = None, entry_script: str | None = None, program_arguments: str | None = None, model: str | None = None, append_row_to: str | None = None, environment: Environment | str | None = None, **kwargs: Any)

Параметры

Имя Описание
type
Обязательно
str

Тип параллельной задачи. Возможные значения: "run_function" и "модель".

code
Обязательно
str

Локальный или удаленный путь, указывающий на исходный код.

entry_script
Обязательно
str

Пользовательский скрипт, который будет выполняться параллельно на нескольких узлах. Это значение указывается в качестве пути к локальному файлу. entry_script должен содержать две функции: init() — эта функция должна использоваться для любой дорогостоящей или распространенной подготовки к последующим выводам, например, десериализации и загрузки модели в глобальный объект. run(mini_batch): Метод для параллелизации. Каждый вызов будет иметь один мини-пакет. mini_batch: пакетный вывод вызывает метод run и передает ему в качестве аргумента список либо кадр данных Pandas. Каждая запись в min_batch содержит одно из следующих значений: путь к файлу для входных данных в формате FileDataset и Pandas DataFrame для входных данных в формате TabularDataset. Метод run() должен возвращать Pandas DataFrame или массив. Для append_row output_action эти возвращаемые элементы добавляются в общий выходной файл. Для summary_only содержимое элементов игнорируется. Для всех выходных действий каждый возвращаемый элемент обозначает один успешный вывод для входного элемента во входном мини-пакете. Каждый параллельный рабочий процесс будет вызывать метод init один раз, а затем выполнять циклический проход функции run до тех пор, пока не будут обработаны все мини-пакеты.

program_arguments
Обязательно
str

Аргументы параллельной задачи.

model
Обязательно
str

Модель параллельной задачи.

append_row_to
Обязательно
str

Все значения, выходные по вызовам метода run(), будут объединяться в один уникальный файл, который создается в выходном расположении. Если он не задан, вызовет summary_only, что означает, что пользовательский скрипт должен хранить сам выходные данные.

environment
Обязательно

Среда, в которой будет выполняться задание обучения.

Параметры Keyword-Only

Имя Описание
type
Обязательно
code
Обязательно
entry_script
Обязательно
program_arguments
Обязательно
model
Обязательно
append_row_to
Обязательно
environment
Обязательно

Методы

get
has_key
items
keys
update
values

get

get(key: Any, default: Any | None = None) -> Any

Параметры

Имя Описание
key
Обязательно
default
значение по умолчанию: None

has_key

has_key(k: Any) -> bool

Параметры

Имя Описание
k
Обязательно

items

items() -> list

keys

keys() -> list

update

update(*args: Any, **kwargs: Any) -> None

values

values() -> list