ParallelComponent Класс

Версия параллельного компонента, используемая для определения параллельного компонента.

Наследование
azure.ai.ml.entities._component.component.Component
ParallelComponent
azure.ai.ml.entities._job.parallel.parameterized_parallel.ParameterizedParallel
ParallelComponent
azure.ai.ml.entities._component.code.ComponentCodeMixin
ParallelComponent

Конструктор

ParallelComponent(*, name: str | None = None, version: str | None = None, description: str | None = None, tags: Dict[str, Any] | None = None, display_name: str | None = None, retry_settings: RetrySettings | None = None, logging_level: str | None = None, max_concurrency_per_instance: int | None = None, error_threshold: int | None = None, mini_batch_error_threshold: int | None = None, task: ParallelTask | None = None, mini_batch_size: str | None = None, partition_keys: List | None = None, input_data: str | None = None, resources: JobResourceConfiguration | None = None, inputs: Dict | None = None, outputs: Dict | None = None, code: str | None = None, instance_count: int | None = None, is_deterministic: bool = True, **kwargs: Any)

Параметры

Имя Описание
name
Обязательно
str

Имя компонента. Значение по умолчанию — Нет.

version
Обязательно
str

Версия компонента. Значение по умолчанию — Нет.

description
Обязательно
str

Описание компонента. Значение по умолчанию — Нет.

tags
Обязательно

Словарь тегов. Теги можно добавлять, удалять и обновлять. Значение по умолчанию — Нет.

display_name
Обязательно
str

Отображаемое имя компонента. Значение по умолчанию — Нет.

retry_settings
Обязательно

Не удалось повторить попытку параллельного запуска компонента. Значение по умолчанию — Нет.

logging_level
Обязательно
str

Строка с именем уровня ведения журнала. Значение по умолчанию — Нет.

max_concurrency_per_instance
Обязательно
int

Максимальный параллелизм, имеющийся у каждого вычислительного экземпляра. Значение по умолчанию — Нет.

error_threshold
Обязательно
int

Количество сбоев обработки элементов следует игнорировать. Значение по умолчанию — Нет.

mini_batch_error_threshold
Обязательно
int

Количество сбоев мини-пакетной обработки следует игнорировать. Значение по умолчанию — Нет.

task
Обязательно

Параллельная задача. Значение по умолчанию — Нет.

mini_batch_size
Обязательно
str

Для входных данных FileDataset значением этого поля является число файлов, которые может обработать пользовательский скрипт в одном вызове метода run(). Для входных данных TabularDataset значение этого поля представляет приблизительный размер данных, которые может обработать пользовательский скрипт в одном вызове метода run(). Примеры значений: 1024, 1024 КБ, 10 МБ и 1 ГБ. (Необязательно. Значение по умолчанию — 10 файлов для FileDataset и 1 МБ для TabularDataset.) Это значение можно задать с помощью PipelineParameter.

partition_keys
Обязательно

Ключи, используемые для секционирования набора данных на мини-пакеты. Значение по умолчанию — Нет. Если этот параметр указан, данные с одним и тем же ключом будут секционированы в один мини-пакет. Если указаны partition_keys и mini_batch_size, partition_keys вступит в силу. Входные данные должны быть секционированными наборами данных, а partition_keys должен представлять собой подмножество ключей каждого входного набора.

input_data
Обязательно
str

Входные данные. Значение по умолчанию — Нет.

resources
Обязательно

Конфигурация вычислительных ресурсов для компонента. Значение по умолчанию — Нет.

inputs
Обязательно

Входные данные компонента. Значение по умолчанию — Нет.

outputs
Обязательно

Выходные данные компонента. Значение по умолчанию — Нет.

code
Обязательно
str

свойство promoted из task.code

instance_count
Обязательно
int

свойство promoted из resources.instance_count. Значение по умолчанию — Нет.

is_deterministic
Обязательно

Является ли параллельный компонент детерминированным. По умолчанию задано значение True

Параметры Keyword-Only

Имя Описание
name
Обязательно
version
Обязательно
description
Обязательно
tags
Обязательно
display_name
Обязательно
retry_settings
Обязательно
logging_level
Обязательно
max_concurrency_per_instance
Обязательно
error_threshold
Обязательно
mini_batch_error_threshold
Обязательно
task
Обязательно
mini_batch_size
Обязательно
partition_keys
Обязательно
input_data
Обязательно
resources
Обязательно
inputs
Обязательно
outputs
Обязательно
code
Обязательно
instance_count
Обязательно
is_deterministic
значение по умолчанию: True

Методы

dump

Дамп содержимого компонента в файл в формате YAML.

dump

Дамп содержимого компонента в файл в формате YAML.

dump(dest: str | PathLike | IO, **kwargs: Any) -> None

Параметры

Имя Описание
dest
Обязательно
Union[<xref:PathLike>, str, IO[AnyStr]]

Назначение для получения содержимого этого компонента. Должен быть либо путем к локальному файлу, либо уже открытым файловым потоком. Если dest — это путь к файлу, будет создан новый файл и создается исключение, если файл существует. Если dest является открытым файлом, файл будет записан напрямую, и если файл недоступен для записи, будет создано исключение.

Атрибуты

base_path

Базовый путь к ресурсу.

Возвращаемое значение

Тип Описание
str

Базовый путь к ресурсу.

code

Возвращает значение повышенного свойства task.code, которое представляет собой локальный или удаленный путь, указывающий на исходный код.

Возвращаемое значение

Тип Описание

Значение task.code.

creation_context

Контекст создания ресурса.

Возвращаемое значение

Тип Описание

Метаданные создания для ресурса.

display_name

Отображаемое имя компонента.

Возвращаемое значение

Тип Описание
str

Отображаемое имя компонента.

environment

Возвращаемое значение повышенного свойства task.environment, укажите среду, в которой будет выполняться задание обучения.

Возвращаемое значение

Тип Описание

Значение task.environment.

id

Идентификатор ресурса.

Возвращаемое значение

Тип Описание

Глобальный идентификатор ресурса, идентификатор Resource Manager Azure (ARM).

inputs

Входные данные компонента.

Возвращаемое значение

Тип Описание

Входные данные компонента.

instance_count

Возвращаемое значение resources.instance_count повышенного свойства.

Возвращаемое значение

Тип Описание

Значение resources.instance_count.

is_deterministic

Является ли компонент детерминированным.

Возвращаемое значение

Тип Описание

Является ли компонент детерминированным

outputs

Выходные данные компонента.

Возвращаемое значение

Тип Описание

Выходные данные компонента.

resources

retry_settings

task

type

Тип компонента, по умолчанию — "command".

Возвращаемое значение

Тип Описание
str

Тип компонента.

version

Версия компонента.

Возвращаемое значение

Тип Описание
str

Версия компонента.