Точное настройка моделей Meta Llama в Azure AI Studio
Внимание
Элементы, обозначенные в этой статье как (предварительная версия), сейчас предлагаются в общедоступной предварительной версии. Эта предварительная версия предоставляется без соглашения об уровне обслуживания, и мы не рекомендуем ее для рабочих нагрузок. Некоторые функции могут не поддерживаться или их возможности могут быть ограничены. Дополнительные сведения см. в статье Дополнительные условия использования Предварительных версий Microsoft Azure.
Azure AI Studio позволяет адаптировать большие языковые модели к личным наборам данных с помощью процесса, известного как тонкой настройки.
Точная настройка имеет большое значение, позволяя настраивать и оптимизировать конкретные задачи и приложения. Это приводит к повышению производительности, экономичности, снижению задержки и адаптации выходных данных.
Из этой статьи вы узнаете, как настроить модели Meta Llama в Azure AI Studio.
Семейство Meta Llama больших языковых моделей (LLMs) — это коллекция предварительно обученных и точно настроенных моделей создания текста, начиная от 7 миллиардов до 70 миллиардов параметров. Семейство моделей также включает в себя точно настроенные версии, оптимизированные для вариантов использования диалогов с подкреплением обучения из RLHF), называемых Лама-Инструктирование.
Внимание
Модели, которые находятся в предварительной версии, помечены как предварительный просмотр на своих карточках моделей в каталоге моделей.
Модели
Следующие модели доступны в Azure Marketplace для Llama 3.1 при тонкой настройке в качестве службы с выставлением счетов по мере использования:
Meta-Llama-3.1-70B-Instruct
(предварительная версия)Meta-LLama-3.1-8b-Instruct
(предварительная версия)
В настоящее время в проектах, расположенных в западной части США 3.1, поддерживается точная настройка моделей Llama 3.
Внимание
В настоящее время мы не можем выполнить точную настройку для Llama 3.1 с длиной последовательности 128K.
Необходимые компоненты
Подписка Azure с допустимым методом оплаты. Бесплатные или пробные подписки Azure не будут работать. Если у вас нет подписки Azure, создайте платную учетную запись Azure, чтобы начать работу.
-
Внимание
Для моделей Meta Llama 3.1 предложение точной настройки модели с оплатой по мере использования доступно только в центрах, созданных в западной части США 3 регионов.
Проект Azure AI Studio в Azure AI Studio.
Управление доступом на основе ролей Azure (Azure RBAC) используется для предоставления доступа к операциям в Azure AI Studio. Чтобы выполнить действия, описанные в этой статье, учетной записи пользователя должна быть назначена роль владельца или участника для подписки Azure. Кроме того, вашей учетной записи может быть назначена настраиваемая роль, которая имеет следующие разрешения:
В подписке Azure необходимо подписать проект AI Studio на предложение Azure Marketplace один раз для каждого проекта:
Microsoft.MarketplaceOrdering/agreements/offers/plans/read
Microsoft.MarketplaceOrdering/agreements/offers/plans/sign/action
Microsoft.MarketplaceOrdering/offerTypes/publishers/offers/plans/agreements/read
Microsoft.Marketplace/offerTypes/publishers/offers/plans/agreements/read
Microsoft.SaaS/register/action
Для создания и использования ресурса SaaS в группе ресурсов выполните следующие действия:
Microsoft.SaaS/resources/read
Microsoft.SaaS/resources/write
В проекте AI Studio для развертывания конечных точек (роль разработчика ИИ Azure уже содержит эти разрешения):
Microsoft.MachineLearningServices/workspaces/marketplaceModelSubscriptions/*
Microsoft.MachineLearningServices/workspaces/serverlessEndpoints/*
Дополнительные сведения о разрешениях см. в статье "Управление доступом на основе ролей" в Azure AI Studio.
Регистрация поставщика подписки
Убедитесь, что подписка зарегистрирована в поставщике Microsoft.Network
ресурсов.
Войдите на портал Azure.
Выберите подписки в меню слева.
Выберите подписку, которую нужно использовать.
Выберите поставщики> ресурсов параметров в меню слева.
Убедитесь, что Microsoft.Network находится в списке поставщиков ресурсов. В противном случае добавьте его.
Подготовка данных
Подготовьте данные обучения и проверки для точной настройки модели. Данные обучения и наборы данных для проверки состоят из входных и выходных примеров того, как должна работать модель.
Убедитесь, что все примеры обучения соответствуют ожидаемому формату вывода. Для эффективной настройки моделей убедитесь, что сбалансированный и разнообразный набор данных.
Это включает поддержание баланса данных, включая различные сценарии, и периодическое уточнение обучающих данных для выравнивания с реальными ожиданиями, что в конечном итоге приводит к более точным и сбалансированным ответам модели.
Для различных типов моделей требуется другой формат обучающих данных.
Используемые данные обучения и проверки должны быть отформатированы в виде документа JSON Lines (JSONL). Для Meta-Llama-3.1-70B-Instruct
набора данных тонкой настройки необходимо отформатировать в формате беседы, который используется API завершения чата.
Пример формата файла
{"messages": [{"role": "system", "content": "You are an Xbox customer support agent whose primary goal is to help users with issues they are experiencing with their Xbox devices. You are friendly and concise. You only provide factual answers to queries, and do not provide answers that are not related to Xbox."}, {"role": "user", "content": "Is Xbox better than PlayStation?"}, {"role": "assistant", "content": "I apologize, but I cannot provide personal opinions. My primary job is to assist you with any issues related to your Xbox device. Do you have any Xbox-related issues that need addressing?"}]}
{"messages": [{"role": "system", "content": "You are an Xbox customer support agent whose primary goal is to help users with issues they are experiencing with their Xbox devices. You are friendly and concise. You only provide factual answers to queries, and do not provide answers that are not related to Xbox."}, {"role": "user", "content": "Can I play PC games on my Xbox?"}, {"role": "assistant", "content": "While Xbox consoles don't natively support PC games, they can play an array of Xbox games, many of which are also available on PC. Can I assist you with finding games compatible with your Xbox device?"}]}
{"messages": [{"role": "system", "content": "You are an Xbox customer support agent whose primary goal is to help users with issues they are experiencing with their Xbox devices. You are friendly and concise. You only provide factual answers to queries, and do not provide answers that are not related to Xbox."}, {"role": "user", "content": "I'm having trouble connecting my Xbox to the Wi-Fi."}, {"role": "assistant", "content": "No worries, let's go through the network settings on your Xbox. Can you please tell me what happens when you try to connect it to the Wi-Fi?"}]}
Поддерживаемый тип файла — СТРОКИ JSON. Файлы загружаются в хранилище данных по умолчанию и становятся доступными в вашем проекте.
Точное настройка модели Meta Llama
Чтобы точно настроить модель LLama 3.1, выполните действия.
Войдите в Azure AI Studio.
Выберите модель, которую нужно настроить в каталоге моделей Azure AI Studio.
На странице сведений о модели выберите детальную настройку.
Выберите проект, в котором необходимо точно настроить модели. Чтобы использовать модель с оплатой по мере использования, ваша рабочая область должна принадлежать региону "Западная часть США 3 ".
В мастере точной настройки выберите ссылку на Условия Azure Marketplace, чтобы узнать больше об условиях использования. Вы также можете выбрать вкладку сведений о предложении Marketplace, чтобы узнать о ценах на выбранную модель.
Если вы впервые настроите модель в проекте, необходимо подписаться на проект для конкретного предложения (например, Meta-Llama-3.1-70B-Instruct) из Azure Marketplace. На этом шаге требуется, чтобы у вашей учетной записи были разрешения подписки Azure и разрешения группы ресурсов, перечисленные в предварительных требованиях. Каждый проект имеет собственную подписку на конкретное предложение Azure Marketplace, что позволяет контролировать расходы и отслеживать расходы. Выберите " Подписаться" и "Точно настроить".
Примечание.
Подписывание проекта в определенное предложение Azure Marketplace (в данном случае Meta-Llama-3.1-70B-Instruct) требует, чтобы у вашей учетной записи был доступ участника или владельца на уровне подписки, где создается проект. Кроме того, учетная запись пользователя может быть назначена настраиваемой роли с разрешениями подписки Azure и разрешениями группы ресурсов, перечисленными в предварительных требованиях.
После регистрации проекта для конкретного предложения Azure Marketplace последующие тонкой настройки того же предложения в том же проекте не требуют повторной подписки. Поэтому вам не нужно иметь разрешения на уровне подписки для последующих заданий точной настройки. Если этот сценарий применяется к вам, нажмите кнопку "Продолжить" для точной настройки.
Введите имя для вашей точно настроенной модели и необязательные теги и описание.
Выберите обучающие данные для точной настройки модели. Дополнительные сведения см. в статье о подготовке данных.
Примечание.
Если у вас есть файлы обучения и проверки в хранилище данных меньше учетных данных, вам потребуется разрешить управляемому удостоверению рабочей области доступ к хранилищу данных, чтобы продолжить работу с MaaS тонкой настройкой с учетными данными меньше хранилища. На странице "Хранилище данных" после нажатия кнопки "Обновить проверку подлинности" > выберите следующий параметр:
Убедитесь, что все примеры обучения соответствуют ожидаемому формату вывода. Для эффективной настройки моделей убедитесь, что сбалансированный и разнообразный набор данных. Это включает поддержание баланса данных, включая различные сценарии, и периодическое уточнение обучающих данных для выравнивания с реальными ожиданиями, что в конечном итоге приводит к более точным и сбалансированным ответам модели.
- Размер пакета, используемый для обучения. Если задано значение -1, batch_size вычисляется как 0,2% примеров в обучающем наборе, а максимальное значение — 256.
- Скорость обучения точной настройки — это исходная скорость обучения, используемая для предварительного обучения, умноженного на этот умножитель. Рекомендуется экспериментировать со значениями от 0,5 до 2. Эмпирически было обнаружено, что более крупные показатели скорости обучения, как правило, работают лучше с большими размерами пакетов. Должно быть от 0.0 до 5.0.
- Число эпох обучения. Эпоха относится к одному полному циклу через набор данных.
Параметры задачи являются необязательным шагом и расширенным параметром. Настройка гиперпараметра необходима для оптимизации больших языковых моделей (LLM) в реальных приложениях. Это позволяет повысить производительность и эффективное использование ресурсов. Параметры по умолчанию можно использовать или расширенные пользователи могут настраивать такие параметры, как эпохи или скорость обучения.
Просмотрите выбранные варианты и перейдите к обучению модели.
После точной настройки модели можно развернуть модель и использовать ее в собственном приложении, на детской площадке или в потоке запросов. Дополнительные сведения см. в статье "Развертывание семейства Лломы 3.1 больших языковых моделей с помощью Azure AI Studio".
Очистка точно настроенных моделей
Вы можете удалить точно настроенную модель из списка моделей точной настройки в Azure AI Studio или на странице сведений о модели. Выберите настраиваемую модель, чтобы удалить на странице тонкой настройки, а затем нажмите кнопку "Удалить", чтобы удалить настраиваемую модель.
Примечание.
Вы не можете удалить пользовательскую модель, если она имеет существующее развертывание. Прежде чем удалить пользовательскую модель, необходимо сначала удалить развертывание модели.
Стоимость и квоты
Рекомендации по затратам и квотам для моделей Meta Llama, настроенных как услуга
Мета-Лама модели, настроенные как услуга, предлагаются мета через Azure Marketplace и интегрированы с Azure AI Studio для использования. Цены на Azure Marketplace можно найти при развертывании или настройке моделей.
Каждый раз, когда проект подписывается на данное предложение из Azure Marketplace, создается новый ресурс для отслеживания затрат, связанных с его потреблением. Тот же ресурс используется для отслеживания затрат, связанных с выводом и настройкой; однако для отслеживания каждого сценария по отдельности можно использовать несколько счетчиков.
Дополнительные сведения о том, как отслеживать затраты, см. в разделе "Мониторинг затрат для моделей, предлагаемых в Azure Marketplace".
Фильтрация содержимого
Модели, развернутые как услуга с выставлением счетов по мере использования, защищены безопасностью содержимого ИИ Azure. При развертывании в конечных точках в режиме реального времени вы можете отказаться от этой возможности. С включенной безопасностью содержимого ИИ Azure запрос и завершение проходят через ансамбль моделей классификации, направленных на обнаружение и предотвращение выходных данных вредного содержимого. Система фильтрации содержимого (предварительная версия) обнаруживает и принимает меры по определенным категориям потенциально вредного содержимого как в запросах ввода, так и в завершениях выходных данных. Дополнительные сведения о безопасности содержимого ИИ Azure.