Когда следует использовать точную настройку Azure OpenAI

При выборе правильной настройки правильного решения для изучения конкретного варианта использования есть некоторые ключевые термины, с которыми полезно ознакомиться:

  • Инженерия запросов — это метод разработки запросов для моделей обработки естественного языка. Этот процесс повышает точность и релевантность в ответах, оптимизируя производительность модели.
  • Получение дополненного поколения (RAG) повышает производительность крупной языковой модели (LLM), извлекая данные из внешних источников и включив его в запрос. RAG позволяет предприятиям достичь настраиваемых решений при сохранении релевантности данных и оптимизации затрат.
  • Переобучение существующей крупной языковой модели с использованием примеров данных, что приводит к оптимизации новой пользовательской модели большого языка, оптимизированной с помощью приведенных примеров.

Что такое точную настройку с помощью Azure OpenAI?

Когда мы говорим о тонкой настройке, мы действительно имеем в виду защищенную точную настройку, а не непрерывную предварительную подготовку или подкрепление Обучение через RLHF. В защищенной тонкой настройке описывается процесс переобучения предварительно обученных моделей для определенных наборов данных, как правило, для повышения производительности модели для конкретных задач или представления сведений, которые не были хорошо представлены при первоначальной подготовке базовой модели.

Тонкое настройка — это расширенная методика, требующая опыта использования соответствующим образом. Приведенные ниже вопросы помогут вам оценить, готовы ли вы к настройке и насколько хорошо вы думали о процессе. Их можно использовать для выполнения следующих действий или определения других подходов, которые могут быть более подходящими.

Почему вы хотите точно настроить модель?

  • Вы должны иметь возможность четко сформулировать конкретный вариант использования для точной настройки и определить модель , которой вы надеетесь точно настроить.
  • Хорошие варианты использования для точной настройки включают управление моделью для вывода содержимого в определенном и настраиваемом стиле, тоне или формате, или сценариях, в которых информация, необходимая для управления моделью, слишком длинна или сложна для размещения в окне запроса.

Распространенные признаки, которые вы еще не готовы к тонкой настройке:

  • Нет четкого варианта использования для тонкой настройки, или неспособность сформулировать гораздо больше, чем "Я хочу сделать модель лучше".
  • Если вы определяете стоимость как основной мотиватор, будьте осторожны. Точное настройка может снизить затраты для определенных вариантов использования, сокращая запросы или позволяя использовать меньшую модель, но есть более высокие предварительные затраты на обучение, и вам придется платить за размещение собственной пользовательской модели. Дополнительные сведения о затратах на настройку Azure OpenAI см. на странице цен.
  • Если вы хотите добавить в модель знания о домене, следует начать с получения дополненного поколения (RAG) с такими функциями, как Azure OpenAI в данных или внедрениях. Часто это более дешевый, более адаптируемый и потенциально более эффективный вариант в зависимости от варианта использования и данных.

Что ты пытался до сих пор?

Улучшенная настройка — это расширенная возможность, а не отправная точка для процесса создания искусственного интеллекта. Вы уже должны ознакомиться с основами использования больших языковых моделей (LLM). Сначала следует оценить производительность базовой модели с помощью разработки запросов и (или) получения расширенного поколения (RAG), чтобы получить базовые показатели производительности.

Наличие базовых показателей производительности без точной настройки является важным для того, чтобы узнать, улучшилась ли производительность модели. Точное настройка с плохими данными делает базовую модель хуже, но без базовых показателей трудно обнаружить регрессии.

Если вы готовы к тонкой настройке, выполните следующие действия.

  • Должны быть в состоянии продемонстрировать доказательства и знания о подходах на основе командной техники и RAG.
  • Вы можете обмениваться конкретным опытом и проблемами с методами, отличными от тонкой настройки, которые уже были проверены для вашего варианта использования.
  • По возможности необходимо иметь количественные оценки базовой производительности.

Распространенные признаки, которые вы еще не готовы к тонкой настройке:

  • Начиная с тонкой настройки без тестирования других методов.
  • Недостаточно знаний или понимания того, как тонкой настройке применяется специально к крупным языковым моделям (LLM).
  • Нет показателей производительности для оценки точной настройки.

Что не работает с альтернативными подходами?

Понимание того, где инженерные запросы не хватает, должны предоставить рекомендации по настройке. Происходит ли сбой базовой модели в пограничных случаях или исключениях? Не является ли базовая модель согласованной предоставлением выходных данных в правильном формате, и вы не можете ввести достаточно примеров в окне контекста, чтобы исправить его?

Примеры сбоев с базовой моделью и проектированием запросов помогут вам определить данные, необходимые для точной настройки, и как следует оценивать настраиваемую модель.

Ниже приведен пример: клиент хотел использовать GPT-3.5-Turbo для перевода вопросов естественного языка в запросы в определенном, нестандартном языке запросов. Они предоставили инструкции в запросе (Always return GQL) и использовали RAG для получения схемы базы данных. Однако синтаксис не всегда был правильным и часто завершился ошибкой для пограничных вариантов. Они собрали тысячи примеров вопросов естественного языка и эквивалентных запросов к базе данных, включая случаи, когда модель не удалась раньше, и использовала эти данные для точной настройки модели. Объединение новой точно настроенной модели с их инженерным запросом и получением привело к точности выходных данных модели до приемлемых стандартов для использования.

Если вы готовы к тонкой настройке, выполните следующие действия.

  • Получите четкие примеры того, как вы подошли к проблемам в альтернативных подходах и что было проверено как возможные решения для повышения производительности.
  • Вы определили недостатки, используя базовую модель, например несогласованную производительность в пограничных случаях, неспособность соответствовать достаточному числу запросов снимка в окне контекста, чтобы управлять моделью, высокой задержкой и т. д.

Распространенные признаки, которые вы еще не готовы к тонкой настройке:

  • Недостаточно знаний из модели или источника данных.
  • Неспособность найти правильные данные для обслуживания модели.

Какие данные вы собираетесь использовать для точной настройки?

Даже с большим вариантом использования тонкой настройкой является только так же хорошо, как качество данных, которые вы можете предоставить. Вы должны быть готовы инвестировать время и усилия, чтобы сделать тонкой настройки работы. Для разных моделей требуются разные объемы данных, но часто требуется обеспечить достаточно большое количество высококачественных курируемых данных.

Еще одним важным моментом является даже высокий уровень качества данных, если данные не являются необходимым форматом для точной настройки, необходимо зафиксировать инженерные ресурсы для правильного форматирования данных.

Data Babbage-002 & Davinci-002 GPT-35-Turbo
Громкость Тысячи примеров Тысячи примеров
Формат Запрос и завершение Беседный чат

Если вы готовы к тонкой настройке, выполните следующие действия.

  • Определили набор данных для точной настройки.
  • Набор данных находится в соответствующем формате для обучения.
  • Для обеспечения качества набора данных используется некоторый уровень курирования.

Распространенные признаки, которые вы еще не готовы к тонкой настройке:

  • Набор данных еще не определен.
  • Формат набора данных не соответствует модели, которую вы хотите точно настроить.

Как вы будете измерять качество вашей точно настроенной модели?

Существует не один правильный ответ на этот вопрос, но у вас должны быть четко определенные цели для того, что успех с тонкой настройкой выглядит как. В идеале это не должно быть качественным, но должно включать количественные меры успеха, такие как использование набора данных для проверки, а также тестирование пользовательских приемок или А/B тестирование точно настроенной модели на основе базовой модели.

Следующие шаги