Поделиться через


HyperDriveConfig Класс

Конфигурация, определяющая работу HyperDrive.

Конфигурация HyperDrive включает в себя сведения о выборке пространства гиперпараметров, политике завершения, основной метрике, возобновлении из конфигурации, оценщике и целевом объекте вычислений для выполнения эксперимента.

Инициализируйте HyperDriveConfig.

Наследование
builtins.object
HyperDriveConfig

Конструктор

HyperDriveConfig(hyperparameter_sampling, primary_metric_name, primary_metric_goal, max_total_runs, max_concurrent_runs=None, max_duration_minutes=10080, policy=None, estimator=None, run_config=None, resume_from=None, resume_child_runs=None, pipeline=None, debug_flag=None, custom_run_id=None)

Параметры

Имя Описание
estimator

Оценщик, который будет вызываться с отобранными гиперпараметрами. Укажите один из следующих параметров: estimator, run_config или pipeline.

значение по умолчанию: None
hyperparameter_sampling
Обязательно

Пространство выборки гиперпараметров.

policy

Используемая политика досрочного завершения. Если указано значение по умолчанию None, политика досрочного завершения применяться не будет.

Для начала рекомендуется политика завершения MedianStoppingPolicy со значением delay_evaluation 5. Это консервативные настройки, которые могут обеспечить экономию 25–35 % без потерь по основной метрике (на основе наших оценочных данных).

значение по умолчанию: None
primary_metric_name
Обязательно
str

Имя основной метрики, передаваемой при выполнении эксперимента.

primary_metric_goal
Обязательно

PrimaryMetricGoal.MINIMIZE либо PrimaryMetricGoal.MAXIMIZE. Этот параметр определяет за сворачивание и разворачивание основной метрики при оценке выполнения.

max_total_runs
Обязательно
int

Максимальное общее число создаваемых запусков. Это верхняя граница. Количество выполнений может быть меньше, если размер выборки меньше этого значения. Если указаны одновременно параметры max_total_runs и max_duration_minutes, эксперимент по настройке гиперпараметров прекращается при достижении первого из двух пороговых значений.

max_concurrent_runs
int

Максимальное количество параллельных выполнений. Если задано значение None, параллельно запускаются все выполнения. Количество параллельных прогонов зависит от ресурсов, доступных в заданном целевом объекте вычисления. Следовательно, вам нужно обеспечить в целевом объекте вычислений наличие ресурсов для требуемого уровня параллелизма.

значение по умолчанию: None
max_duration_minutes
int

Максимальная продолжительность выполнения HyperDrive. По истечении этого времени все работающие выполнения отменяются. Если указаны одновременно параметры max_total_runs и max_duration_minutes, эксперимент по настройке гиперпараметров прекращается при достижении первого из двух пороговых значений.

значение по умолчанию: 10080
resume_from

Выполнение HyperDrive или список выполнений HyperDrive, которые будут наследоваться в качестве точек данных для горячего запуска нового выполнения.

значение по умолчанию: None
resume_child_runs
Run или list[Run]

Дочернее выполнение HyperDrive или список дочерних выполнений HyperDrive, которые будут возобновлены в качестве новых дочерних выполнений нового выполнения HyperDrive.

значение по умолчанию: None
run_config

Объект для настройки конфигурации выполнения сценариев или записных книжек. Укажите один из следующих параметров: estimator, run_config или pipeline.

значение по умолчанию: None
pipeline

Объект конвейера для настройки конфигурации для выполнения конвейера. Объект конвейера будет вызываться с выбранными гиперпараметрами для отправки выполнений конвейера. Укажите один из следующих параметров: estimator, run_config или pipeline.

значение по умолчанию: None
custom_run_id
str

Пользовательский идентификатор запуска, предоставленный пользователем

значение по умолчанию: None
hyperparameter_sampling
Обязательно

Определение выборки пространства гиперпараметров.

primary_metric_name
Обязательно
str

Имя основной метрики, передаваемой при выполнении эксперимента.

primary_metric_goal
Обязательно

PrimaryMetricGoal.MINIMIZE либо PrimaryMetricGoal.MAXIMIZE. Этот параметр определяет за сворачивание и разворачивание основной метрики при оценке выполнения.

max_total_runs
Обязательно
int

Максимальное общее число создаваемых запусков. Это верхняя граница. Количество выполнений может быть меньше, если размер выборки меньше этого значения.

max_concurrent_runs
Обязательно
int

Максимальное количество параллельных выполнений. Если задано значение None, параллельно запускаются все выполнения.

max_duration_minutes
Обязательно
int

Максимальная продолжительность выполнения HyperDrive. По истечении этого времени все работающие выполнения отменяются.

policy
Обязательно

Используемая политика досрочного завершения. Если указано значение по умолчанию None, политика досрочного завершения применяться не будет.

Для начала рекомендуется политика завершения <xref:azureml.train.hyperdrive.MedianTerminationPolicy> со значением delay_evaluation 5. Это консервативные настройки, которые могут обеспечить экономию 25–35 % без потерь по основной метрике (на основе наших оценочных данных).

estimator
Обязательно

Оценщик, который будет вызываться с выбранными гиперпараметрами. Укажите один из следующих параметров: estimator, run_config или pipeline.

run_config
Обязательно

Объект для настройки конфигурации выполнения сценариев или записных книжек. Укажите один из следующих параметров: estimator, run_config или pipeline.

resume_from
Обязательно

Выполнение HyperDrive или список выполнений HyperDrive, которые будут наследоваться в качестве точек данных для горячего запуска нового выполнения.

resume_child_runs
Обязательно
Run | list[Run]

Дочернее выполнение HyperDrive или список дочерних выполнений HyperDrive, которые будут возобновлены в качестве новых дочерних выполнений нового выполнения HyperDrive.

pipeline
Обязательно

Объект конвейера для настройки конфигурации для выполнения конвейера. Объект конвейера будет вызываться с выбранными гиперпараметрами для отправки выполнений конвейера. Укажите один из следующих параметров: estimator, run_config или pipeline.

custom_run_id
Обязательно
str

Пользовательский идентификатор запуска, предоставленный пользователем

debug_flag
значение по умолчанию: None

Комментарии

В примере ниже показано создание объекта HyperDriveConfig для настройки гиперпараметра. В этом примере имя основной метрики соответствует значению, записанному в скрипте обучения.


   hd_config = HyperDriveConfig(run_config=src,
                    hyperparameter_sampling=ps,
                    policy=early_termination_policy,
                    primary_metric_name='validation_acc',
                    primary_metric_goal=PrimaryMetricGoal.MAXIMIZE,
                    max_total_runs=4,
                    max_concurrent_runs=4)

Дополнительные сведения о работе с HyperDriveConfig см. в руководстве по настройке гиперпараметров для модели.

Атрибуты

estimator

Возвращает оценщика, используемого при запуске HyperDrive.

Значение будет None, если для запуска используется конфигурация запуска скрипта или конвейер.

Возвращаемое значение

Тип Описание

Оценщик.

pipeline

Возвращает конвейер, используемый при запуске HyperDrive.

Значение будет None, если для запуска используется конфигурация запуска скрипта или оценщик.

Возвращаемое значение

Тип Описание

Конвейер.

run_config

Возвращает конфигурацию скрипта и/или записной книжки, используемой при запуске HyperDrive.

Значение будет None, если для запуска используется оценщик или конвейер.

Возвращаемое значение

Тип Описание

Конфигурация выполнения.

source_directory

Возвращает исходный каталог из конфигурации для запуска.

Возвращаемое значение

Тип Описание
str

Исходный каталог