Поделиться через


Точно настроенные модели в Azure AI Studio

Внимание

Некоторые функции, описанные в этой статье, могут быть доступны только в предварительной версии. Эта предварительная версия предоставляется без соглашения об уровне обслуживания, и мы не рекомендуем ее для рабочих нагрузок. Некоторые функции могут не поддерживаться или их возможности могут быть ограничены. Дополнительные сведения см. в статье Дополнительные условия использования Предварительных версий Microsoft Azure.

Когда мы говорим о тонкой настройке, мы действительно говорим о защищенной тонкой настройке не непрерывной предварительной подготовки или подкреплении Обучение через RLHF. Контролируемый тонкой настройкой относится к процессу переобучения предварительно обученных моделей для определенных наборов данных, как правило, для повышения производительности модели для конкретных задач или представления сведений, которые не были хорошо представлены при первоначальной подготовке базовой модели.

В этой статье вы узнаете, является ли настройка правильным решением для конкретного варианта использования и как Azure AI Studio может поддерживать ваши потребности в точной настройке.

Начало работы с тонкой настройкой

При выборе правильной настройки правильного решения для изучения конкретного варианта использования есть некоторые ключевые термины, с которыми полезно ознакомиться:

  • Инженерия запросов — это метод разработки запросов для моделей обработки естественного языка. Этот процесс повышает точность и релевантность в ответах, оптимизируя производительность модели.
  • Получение дополненного поколения (RAG) повышает производительность крупной языковой модели (LLM), извлекая данные из внешних источников и включив его в запрос. RAG позволяет предприятиям достичь настраиваемых решений при сохранении релевантности данных и оптимизации затрат.
  • Переобучение существующей крупной языковой модели с использованием примеров данных, что приводит к новой "пользовательской" крупной языковой модели, оптимизированной с помощью приведенных примеров.

Тонкое настройка — это расширенная методика, требующая опыта использования соответствующим образом. Приведенные ниже вопросы помогут оценить, готовы ли вы к настройке и насколько хорошо вы думали о процессе. Их можно использовать для выполнения следующих действий или определения других подходов, которые могут быть более подходящими.

Почему вы хотите точно настроить модель?

Вы можете быть готовы к тонкой настройке, если вы:

  • Вы должны иметь возможность четко сформулировать конкретный вариант использования для точной настройки и определить модель , которой вы надеетесь точно настроить.
  • Хорошие варианты использования для точной настройки включают управление моделью для вывода содержимого в определенном и настраиваемом стиле, тоне или формате, или сценариях, в которых информация, необходимая для управления моделью, слишком длинна или сложна для размещения в окне запроса.
  • Получите четкие примеры того, как вы подошли к проблемам в альтернативных подходах и что было проверено как возможные решения для повышения производительности.
  • Вы определили недостатки, используя базовую модель, например несогласованную производительность в пограничных случаях, неспособность соответствовать достаточному числу запросов снимка в окне контекста, чтобы управлять моделью, высокой задержкой и т. д.

Возможно, вы не готовы к тонкой настройке, если:

  • Недостаточно знаний из модели или источника данных.
  • Неспособность найти правильные данные для обслуживания модели.
  • Нет четкого варианта использования для тонкой настройки или неспособности сформулировать больше, чем "Я хочу сделать модель лучше".
  • Если вы определяете стоимость как основной мотиватор, будьте осторожны. Точное настройка может снизить затраты для определенных вариантов использования, сокращая запросы или позволяя использовать меньшую модель, но есть более высокие предварительные затраты на обучение, и вам придется платить за размещение собственной пользовательской модели. Дополнительные сведения о затратах на настройку Azure OpenAI см. на странице цен.
  • Если вы хотите добавить в модель знания о домене, следует начать с получения дополненного поколения (RAG) с такими функциями, как Azure OpenAI в данных или внедрениях. Часто это более дешевый, более адаптируемый и потенциально более эффективный вариант в зависимости от варианта использования и данных.

Что не работает с альтернативными подходами?

Понимание того, где инженерные запросы не хватает, должны предоставить рекомендации по настройке. Происходит ли сбой базовой модели в пограничных случаях или исключениях? Не является ли базовая модель согласованной предоставлением выходных данных в правильном формате, и вы не можете ввести достаточно примеров в окне контекста, чтобы исправить его?

Примеры сбоев с базовой моделью и проектированием запросов помогут вам определить данные, необходимые для точной настройки, и как следует оценивать настраиваемую модель.

Ниже приведен пример: клиент хотел использовать GPT-3.5-Turbo для перевода вопросов естественного языка в запросы в определенном, нестандартном языке запросов. Они предоставили инструкции в запросе (Always return GQL) и использовали RAG для получения схемы базы данных. Однако синтаксис не всегда был правильным и часто завершился ошибкой для пограничных вариантов. Они собрали тысячи примеров вопросов естественного языка и эквивалентных запросов к базе данных, включая случаи, когда модель не удалась раньше, и использовала эти данные для точной настройки модели. Объединение новой точно настроенной модели с их инженерным запросом и получением привело к точности выходных данных модели до приемлемых стандартов для использования.

Что ты пытался до сих пор?

Улучшенная настройка — это расширенная возможность, а не отправная точка для процесса создания искусственного интеллекта. Вы уже должны ознакомиться с основами использования больших языковых моделей (LLM). Сначала следует оценить производительность базовой модели с помощью разработки запросов и (или) получения расширенного поколения (RAG), чтобы получить базовые показатели производительности.

Наличие базовых показателей производительности без точной настройки является важным для того, чтобы узнать, улучшилась ли производительность модели. Точное настройка с плохими данными делает базовую модель хуже, но без базовых показателей трудно обнаружить регрессии.

Если вы готовы к тонкой настройке, выполните следующие действия.

  • Должны быть в состоянии продемонстрировать доказательства и знания о подходах на основе командной техники и RAG.
  • Вы можете обмениваться конкретным опытом и проблемами с методами, отличными от тонкой настройки, которые уже были проверены для вашего варианта использования.
  • По возможности необходимо иметь количественные оценки базовой производительности.

Распространенные признаки, которые вы еще не готовы к тонкой настройке:

  • Начиная с тонкой настройки без тестирования других методов.
  • Недостаточно знаний или понимания того, как тонкой настройке применяется специально к крупным языковым моделям (LLM).
  • Нет показателей производительности для оценки точной настройки.

Какие данные вы собираетесь использовать для точной настройки?

Даже с большим вариантом использования тонкой настройкой является только так же хорошо, как качество данных, которые вы можете предоставить. Вы должны быть готовы инвестировать время и усилия, чтобы сделать тонкой настройки работы. Для разных моделей требуются разные объемы данных, но часто требуется обеспечить достаточно большое количество высококачественных курируемых данных.

Еще одним важным моментом является даже высокий уровень качества данных, если данные не являются необходимым форматом для точной настройки, необходимо зафиксировать инженерные ресурсы для правильного форматирования данных. Дополнительные сведения о подготовке данных к тонкой настройке см. в документации по тонкой настройке.

Если вы готовы к тонкой настройке, выполните следующие действия.

  • Определили набор данных для точной настройки.
  • Набор данных находится в соответствующем формате для обучения.
  • Для обеспечения качества набора данных используется некоторый уровень курирования.

Распространенные признаки, которые вы еще не готовы к тонкой настройке:

  • Набор данных еще не определен.
  • Формат набора данных не соответствует модели, которую вы хотите точно настроить.

Как вы будете измерять качество вашей точно настроенной модели?

Существует не один правильный ответ на этот вопрос, но у вас должны быть четко определенные цели для того, что успех с тонкой настройкой выглядит как. В идеале это не должно быть качественным, но должно включать количественные меры успеха, такие как использование набора данных для проверки, а также тестирование пользовательских приемок или А/B тестирование точно настроенной модели на основе базовой модели.

Поддерживаемые модели для точной настройки в Azure AI Studio

Теперь, когда вы знаете, когда следует использовать точную настройку для вашего варианта использования, вы можете перейти в Azure AI Studio, чтобы найти несколько моделей, доступных для точной настройки, включая:

  • Модели Azure OpenAI
  • Семейные модели Ламы 2

Модели Azure OpenAI

Следующие модели Azure OpenAI поддерживаются в Azure AI Studio для точной настройки:

Model ID Точное настройка регионов Максимальный запрос (токены) Учебные данные (до)
babbage-002 Северная часть США
Центральная Швеция
Западная Швейцария
16,384 Сентябрь 2021 г.
davinci-002 Северная часть США
Центральная Швеция
Западная Швейцария
16,384 Сентябрь 2021 г.
gpt-35-turbo (0613) Восточная часть США2
Северная часть США
Центральная Швеция
Западная Швейцария
4096 Сентябрь 2021 г.
gpt-35-turbo (1106) Восточная часть США2
Северная часть США
Центральная Швеция
Западная Швейцария
Входные данные: 16 385
Выходные данные: 4096
Сентябрь 2021 г.
gpt-35-turbo (0125) Восточная часть США2
Северная часть США
Центральная Швеция
Западная Швейцария
16,385 Сентябрь 2021 г.
gpt-4 (0613) 1 Северная часть США
Центральная Швеция
8192 Сентябрь 2021 г.

В настоящее время предварительная версия 1 GPT-4 доступна в общедоступной предварительной версии. Дополнительные сведения см. в руководстве по оценке безопасности GPT-4.

Обратите внимание, что для точной настройки моделей Azure OpenAI необходимо добавить подключение к ресурсу Azure OpenAI с поддерживаемым регионом в проект.

Семейные модели Ламы 2

Следующие модели семейства Llama 2 поддерживаются в Azure AI Studio для точной настройки:

  • Llama-2-70b
  • Llama-2-7b
  • Llama-2-13b

В настоящее время в проектах, расположенных в западной части США 3, поддерживается точная настройка моделей Llama 2.