Введение

Завершено

В машинном обучении модели обучены прогнозировать неизвестные результаты с помощью шаблонов обучения из помеченных обучающих данных. Способ обучения модели влияет не только на сами данные, но и гиперпараметры — параметры, управляющие процессом обучения. Они не учатся из данных, но настраиваются вручную перед началом обучения, например:

  • В логистической регрессии скорость нормализации помогает предотвратить переполнение, наказав чрезмерно сложные модели.
  • В нейронных сетях скорость обучения определяет, насколько быстро модель обновляет вес, влияя на скорость и точность.

Замечание

В терминологии машинного обучения значения, полученные из данных, называются параметрами. Чтобы отличить их от значений, которые настраивают процесс обучения, мы используем гиперпараметры терминов.

Выбор правильных гиперпараметров имеет решающее значение. Плохие варианты могут привести к моделям, которые работают несполна или не обобщаются на новые данные. С другой стороны, хорошо настроенные гиперпараметры могут значительно повысить точность модели, надежность и эффективность.

Вот где выполняется настройка гиперпараметра — процесс систематического тестирования различных сочетаний значений гиперпараметров, чтобы найти оптимальную настройку для конкретных данных и задач.

В Azure Databricks можно использовать библиотеку Optuna для автоматизации этого процесса. Optuna интеллектуально изучает пространство гиперпараметров, обучение и оценку моделей многократно, пока не определит наиболее эффективную конфигурацию. Это помогает создавать модели, которые не только хорошо работают, но и лучше обобщают на новые, ранее невиданные данные.

В Azure Databricks можно использовать такие библиотеки, как Optuna или Ray Tune для оптимизации гиперпараметров. Хотя оба являются мощными инструментами, в этом модуле мы сосредоточимся на Optuna. Optuna интеллектуально изучает пространство гиперпараметров, обучение и оценку моделей многократно, пока не определит наиболее эффективную конфигурацию. Это помогает создавать модели, которые не только хорошо работают, но и лучше обобщают на новые данные.