Поделиться через


Точное настройка моделей Meta Llama в Azure AI Studio

Внимание

Некоторые функции, описанные в этой статье, могут быть доступны только в предварительной версии. Эта предварительная версия предоставляется без соглашения об уровне обслуживания, и мы не рекомендуем ее для рабочих нагрузок. Некоторые функции могут не поддерживаться или их возможности могут быть ограничены. Дополнительные сведения см. в статье Дополнительные условия использования Предварительных версий Microsoft Azure.

Azure AI Studio позволяет адаптировать большие языковые модели к личным наборам данных с помощью процесса, известного как тонкой настройки.

Точная настройка имеет большое значение, позволяя настраивать и оптимизировать конкретные задачи и приложения. Это приводит к повышению производительности, экономичности, снижению задержки и адаптации выходных данных.

Из этой статьи вы узнаете, как настроить модели Meta Llama в Azure AI Studio.

Семейство Meta Llama больших языковых моделей (LLMs) — это коллекция предварительно обученных и точно настроенных моделей создания текста, начиная от 7 миллиардов до 70 миллиардов параметров. Семейство моделей также включает в себя точно настроенные версии, оптимизированные для вариантов использования диалога с подкреплением Обучение из RLHF, называется Llama-2-chat.

Модели

В настоящее время не поддерживается настройка моделей Llama 3.

Необходимые компоненты

В настоящее время не поддерживается настройка моделей Llama 3.

Регистрация поставщика подписки

Убедитесь, что подписка зарегистрирована в поставщике Microsoft.Network ресурсов.

  1. Войдите на портал Azure.

  2. Выберите подписки в меню слева.

  3. Выберите подписку, которую нужно использовать.

  4. Выберите поставщики Параметры> Resource в меню слева.

  5. Убедитесь, что Microsoft.Network находится в списке поставщиков ресурсов. В противном случае добавьте его.

    Снимок экрана: поставщики ресурсов подписки в портал Azure.

Подготовка данных

Подготовьте данные обучения и проверки для точной настройки модели. Данные обучения и наборы данных для проверки состоят из входных и выходных примеров того, как должна работать модель.

Убедитесь, что все примеры обучения соответствуют ожидаемому формату вывода. Для эффективной настройки моделей убедитесь, что сбалансированный и разнообразный набор данных.

Это включает поддержание баланса данных, включая различные сценарии, и периодическое уточнение обучающих данных для выравнивания с реальными ожиданиями, что в конечном итоге приводит к более точным и сбалансированным ответам модели.

Для различных типов моделей требуется другой формат обучающих данных.

Используемые данные обучения и проверки должны быть отформатированы в виде документа JSON Lines (JSONL). Для Llama-3-80B-chat набора данных тонкой настройки необходимо отформатировать в формате беседы, который используется API завершения чата.

Пример формата файла

    {"messages": [{"role": "system", "content": "You are an Xbox customer support agent whose primary goal is to help users with issues they are experiencing with their Xbox devices. You are friendly and concise. You only provide factual answers to queries, and do not provide answers that are not related to Xbox."}, {"role": "user", "content": "Is Xbox better than PlayStation?"}, {"role": "assistant", "content": "I apologize, but I cannot provide personal opinions. My primary job is to assist you with any issues related to your Xbox device. Do you have any Xbox-related issues that need addressing?"}]}
    {"messages": [{"role": "system", "content": "You are an Xbox customer support agent whose primary goal is to help users with issues they are experiencing with their Xbox devices. You are friendly and concise. You only provide factual answers to queries, and do not provide answers that are not related to Xbox."}, {"role": "user", "content": "Can I play PC games on my Xbox?"}, {"role": "assistant", "content": "While Xbox consoles don't natively support PC games, they can play an array of Xbox games, many of which are also available on PC. Can I assist you with finding games compatible with your Xbox device?"}]}
    {"messages": [{"role": "system", "content": "You are an Xbox customer support agent whose primary goal is to help users with issues they are experiencing with their Xbox devices. You are friendly and concise. You only provide factual answers to queries, and do not provide answers that are not related to Xbox."}, {"role": "user", "content": "I'm having trouble connecting my Xbox to the Wi-Fi."}, {"role": "assistant", "content": "No worries, let's go through the network settings on your Xbox. Can you please tell me what happens when you try to connect it to the Wi-Fi?"}]}

Поддерживаемый тип файла — СТРОКИ JSON. Файлы загружаются в хранилище данных по умолчанию и становятся доступными в вашем проекте.

Точное настройка модели Meta Llama

В настоящее время не поддерживается настройка моделей Llama 3.

Очистка точно настроенных моделей

Вы можете удалить точно настроенную модель из списка моделей точной настройки в Azure AI Studio или на странице сведений о модели. Выберите настраиваемую модель, чтобы удалить на странице тонкой настройки, а затем нажмите кнопку "Удалить", чтобы удалить настраиваемую модель.

Примечание.

Вы не можете удалить пользовательскую модель, если она имеет существующее развертывание. Прежде чем удалить пользовательскую модель, необходимо сначала удалить развертывание модели.

Стоимость и квоты

Рекомендации по затратам и квотам для моделей Meta Llama, настроенных как услуга

Мета-Лама модели, настроенные как услуга, предлагаются мета через Azure Marketplace и интегрированы с Azure AI Studio для использования. Цены на Azure Marketplace можно найти при развертывании или настройке моделей.

Каждый раз, когда проект подписывается на данное предложение из Azure Marketplace, создается новый ресурс для отслеживания затрат, связанных с его потреблением. Тот же ресурс используется для отслеживания затрат, связанных с выводом и точной настройкой; однако для отслеживания каждого сценария можно отслеживать несколько метров независимо.

Дополнительные сведения о том, как отслеживать затраты, см. в разделе "Мониторинг затрат для моделей, предлагаемых в Azure Marketplace".

Фильтрация содержимого

Модели, развернутые как услуга с выставлением счетов с оплатой по мере использования, защищены с помощью Сейф содержимого ИИ Azure. При развертывании в конечных точках в режиме реального времени вы можете отказаться от этой возможности. С включенной безопасностью содержимого ИИ Azure запрос и завершение проходят через ансамбль моделей классификации, направленных на обнаружение и предотвращение выходных данных вредного содержимого. Система фильтрации содержимого обнаруживает и принимает меры по определенным категориям потенциально вредного содержимого как в запросах ввода, так и в завершении выходных данных. Дополнительные сведения о содержимом ИИ Azure Сейф ty.

Следующие шаги