Автоматическая оптимизация Персонализатора (предварительная версия)

Important

Начиная с 20 сентября 2023 г. вы не сможете создавать новые ресурсы Персонализатора. Служба Персонализатора выводится из эксплуатации 1 октября 2026 года. Рекомендуем перейти на проект с открытым исходным кодом microsoft/learning-loop.

Introduction

Автоматическая оптимизация Персонализатора избавляет вас от ручных усилий, обеспечивая максимальную производительность машинного обучения цикла Персонализатора за счет автоматического поиска улучшенных параметров обучения, используемых для обучения ваших моделей, и их применения. Персонализатор имеет строгие критерии для применения новых настроек обучения, чтобы гарантировать, что улучшения вряд ли приведут к потере вознаграждения.

Автоматическая оптимизация Персонализатора находится в общедоступной предварительной версии, и функции, подходы и процессы будут меняться в зависимости от отзывов пользователей.

Когда следует использовать автоматическую оптимизацию

В большинстве случаев лучше всего включить автоматическую оптимизацию. Автоматическая оптимизация включена по умолчанию для новых циклов Персонализатора.

Автоматическая оптимизация может помочь в следующих ситуациях:

  • Вы создаете приложения, которые используются многими арендаторами, и каждое получает свой собственный цикл (-ы) Персонализатора; например, если вы размещаете несколько сайтов электронной коммерции. Автоматическая оптимизация позволяет избежать ручных усилий, необходимых для настройки параметров обучения для большого количества циклов Персонализатора.
  • Вы развернули Персонализатор и подтвердили, что он работает хорошо, получает хорошие награды, и вы убедились, что в ваших функциях нет ошибок или проблем.

Note

Функция автоматической оптимизации будет периодически перезаписывать настройки обучения Персонализатора. Если вашему варианту использования или отрасли требуется аудит и архив моделей и параметров или если вам нужны резервные копии предыдущих параметров, вы можете использовать API Персонализатора для получения параметров обучения или скачать их с помощью портала Azure.

Как включить и отключить автоматическую оптимизацию

Чтобы включить автоматическую оптимизацию, используйте переключатель в разделе "Параметры модели и обучения" на портале Azure.

Помимо этого, вы можете активировать автоматическую оптимизацию с помощью API Персонализатора /configurations/service.

Чтобы отключить автоматическую оптимизацию, выключите переключатель.

Отчеты автоматической оптимизации

В колонке «Параметры модели и обучения» можно просмотреть историю запусков автоматической оптимизации и действия, предпринятые для каждого из них.

В таблице представлены следующие сведения:

  • Когда была выполнена автоматическая оптимизация,
  • Какое окно данных было включено,
  • Какова была эффективность интерактивных, базовых и наиболее эффективных настроек обучения,
  • Предпринятые действия: были ли обновлены настройки обучения или нет.

Вознаграждение за эффективность различных настроек обучения в каждой строке истории автоматической оптимизации отображается в абсолютных числах и в процентах относительно базовой производительности.

Пример. Если ваше базовое среднее вознаграждение оценивается в 0,20, а поведение персонализатора в Интернете достигает 0,30, они будут показаны как 100% и 150% соответственно. Если автоматическая оптимизация обнаружила, что настройки обучения позволяют получить среднее вознаграждение 0,40, оно будет показано как 200% (0,40 - это 200% от 0,20). Предполагая, что пределы достоверности позволяют это, новые настройки будут применены, и затем они будут управлять Персонализатором как онлайн-настройки до следующего запуска.

Для целей анализа сохраняется история до 24 предыдущих запусков автоматической оптимизации. Вы можете получить более подробную информацию об этих автономных оценках и отчетах по каждому из них. Помимо этого, отчеты содержат любые настройки обучения, которые есть в этой истории, которые вы можете найти, загрузить или применить.

Принцип работы

Персонализатор проводит постоянное обучение моделей искусственного интеллекта, которые он использует, на основе вознаграждений. Обучение выполняется в соответствии с некоторыми настройками обучения, которые содержат гиперпараметры и другие значения, используемые в процессе обучения. Данные настройки обучения можно «настроить» на ваш конкретный экземпляр Персонализатора.

Персонализатор также может выполнять автономные оценки. Автономные оценки рассматривают прошлые данные и могут дать статистическую оценку среднего вознаграждения, которое могли бы получить различные алгоритмы и модели Персонализатора. Во время этого процесса Персонализатор также будет искать лучшие настройки обучения, оценивая их эффективность (сколько наград они получили бы) за прошедший период времени.

Частота автоматической оптимизации

Автоматическая оптимизация будет запускаться периодически и будет выполнять автоматическую оптимизацию на основе прошлых данных

  • Если ваше приложение отправляет в Персонализатор более 20 МБ данных за последние две недели, оно будет использовать данные за последние две недели.
  • Если ваше приложение отправляет меньше, чем данное количество, Персонализатор будет добавлять данные за предыдущие дни до тех пор, пока не будет достаточно данных для оптимизации или до тех пор, пока не будут достигнуты самые ранние сохраненные данные (до количества дней хранения данных).

Точное время и дни, когда запускается автоматическая оптимизация, определяется службой Персонализатора и может меняться со временем.

Критерии обновления настроек обучения

Персонализатор использует эти оценки вознаграждения, чтобы решить, менять ли текущие настройки обучения для других. Каждая оценка представляет собой кривую распределения с верхним и нижним доверительным интервалом 95%. Персонализатор применит новые настройки обучения, только если:

  • Они показали более высокие средние вознаграждения в период оценки, И
  • У них есть нижняя граница 95% доверительного интервала, что выше, чем нижняя граница 95% доверительного интервала настроек онлайн-обучения. Данный критерий для максимального увеличения вознаграждения при попытке устранить вероятность потери вознаграждения в будущем управляется Персонализатором и основан на исследованиях в области алгоритмов Селдона и безопасности искусственного интеллекта.

Ограничения автоматической оптимизации

Функция автоматической оптимизации Персонализатора полагается на оценку прошлого периода для оценки производительности в будущем. Возможно, что из-за внешних факторов в мире, вашем приложении и ваших пользователях эти оценки и прогнозы о моделях Персонализатора, сделанные за прошлый период, не будут репрезентативными для будущего.

Предварительный просмотр автоматической оптимизации недоступен для циклов Персонализатора, в которых включена функция предварительного просмотра API Многослотовой персонализации.

Дальнейшие шаги