Поделиться через


Каталог моделей и коллекции в Azure AI Studio

Внимание

Некоторые функции, описанные в этой статье, могут быть доступны только в предварительной версии. Эта предварительная версия предоставляется без соглашения об уровне обслуживания, и мы не рекомендуем ее для рабочих нагрузок. Некоторые функции могут не поддерживаться или их возможности могут быть ограничены. Дополнительные сведения см. в статье Дополнительные условия использования Предварительных версий Microsoft Azure.

Каталог моделей в Студии ИИ Azure — это центр для обнаружения и использования широкого спектра моделей, позволяющих создавать приложения сгенерируемым ИИ. Каталог моделей включает сотни моделей в таких поставщиках моделей, как служба Azure OpenAI, Mistral, Meta, Cohere, Nvidia, Hugging Face, включая модели, обученные корпорацией Майкрософт. Модели от поставщиков, отличных от корпорации Майкрософт, являются продуктами, отличными от Майкрософт, как определено в условиях продукта Майкрософт, и соответствуют условиям, предоставленным моделью.

Коллекции моделей

Каталог моделей упорядочивает модели в коллекции. В каталоге моделей существует три типа коллекций:

  • Модели, курируемые Azure AI: самые популярные сторонние открытые модели веса и собственные модели упакованы и оптимизированы для эффективной работы на платформе ИИ Azure. Использование этих моделей распространяется на условия лицензии поставщика моделей, предоставляемые моделью. При развертывании в Azure AI Studio доступность модели распространяется на применимые соглашения об уровне обслуживания Azure, а корпорация Майкрософт предоставляет поддержку проблем с развертыванием. Модели от партнеров, таких как Meta, NVIDIA, Mistral AI, являются примерами моделей, доступных в коллекции "Курируемый Azure AI" в каталоге. Эти модели можно обозначить зеленой галочкой на плитках моделей в каталоге, или вы можете отфильтровать их по коллекции "Курируемый ИИ Azure".
  • Модели Azure OpenAI, доступные исключительно в Azure: флагманские модели Azure OpenAI через коллекцию Azure OpenAI через интеграцию со службой Azure OpenAI. Корпорация Майкрософт поддерживает эти модели и их использование в соответствии с условиями продукта и соглашением об уровне обслуживания для Azure OpenAI Service.
  • Открытые модели из концентратора распознавания лиц Hugging: сотни моделей из концентратора HuggingFace доступны через коллекцию Hugging Face для вывода в режиме реального времени с управляемыми вычислениями. Hugging face создает и поддерживает модели, перечисленные в коллекции HuggingFace. Для получения помощи воспользуйтесь форумом HuggingFace или службой поддержки HuggingFace. Дополнительные сведения см. в разделе "Развертывание открытых моделей ".

Предложение дополнений в Каталог моделей: вы можете отправить запрос на добавление модели в каталог моделей с помощью этой формы.

Общие сведения о возможностях каталога моделей

Сведения о моделях Azure OpenAI см. в службе Azure OpenAI.

Некоторые модели в курируемых azure AI и Открытых моделях из коллекций Концентраторов распознавания лиц можно развернуть с помощью управляемого вычислительного параметра, а некоторые модели доступны для развертывания с помощью бессерверных API с выставлением счетов по мере использования. Эти модели можно обнаружить, сравнить, оценить, точно настроить (при поддержке) и развернуть в масштабе и интегрировать в приложения Генерированного ИИ с корпоративным классом безопасности и управления данными.

  • Обнаружение: просмотр моделей карта, примеры вывода и просмотр примеров кода для оценки, точной настройки или развертывания модели.
  • Сравнение: сравнивайте тесты между моделями и наборами данных, доступными в отрасли, чтобы оценить, какой из них соответствует вашему бизнес-сценарию.
  • Оценка. Оцените, подходит ли модель для конкретной рабочей нагрузки, предоставив собственные тестовые данные. Метрики оценки позволяют легко визуализировать, насколько хорошо выбранная модель работает в вашем сценарии.
  • Тонкой настройки. Настройка точной настройки моделей с помощью собственных обучающих данных и выбор оптимальной модели путем сравнения метрик во всех заданиях точной настройки. Встроенные оптимизации ускоряют настройку и сокращают объем памяти и вычислительные ресурсы, необходимые для точной настройки.
  • Развертывание: развертывание предварительно обученных моделей или точно настроенных моделей для вывода. Можно также скачать модели, которые можно развернуть для управляемых вычислений.

Развертывание модели: управляемые вычислительные ресурсы и бессерверный API (оплата по мере использования)

Каталог моделей предлагает два различных способа развертывания моделей из каталога для использования: управляемых вычислительных и бессерверных API. Варианты развертывания, доступные для каждой модели, различаются; Дополнительные сведения о функциях параметров развертывания и параметрах, доступных для конкретных моделей, см. в следующих таблицах. Дополнительные сведения об обработке данных с параметрами развертывания.

Функции Управляемые вычисления бессерверный API (оплата по мере использования)
Интерфейс развертывания и выставление счетов Вес модели развертывается в выделенных Виртуальные машины с управляемыми конечными точками Online. Управляемая конечная точка в сети, которая может иметь одно или несколько развертываний, предоставляет REST API для вывода. Плата взимается за базовые часы виртуальных машин, используемых развертываниями. Доступ к моделям осуществляется через развертывание, которое подготавливает API для доступа к модели. API предоставляет доступ к модели, размещенной и управляемой корпорацией Майкрософт, для вывода. Этот режим доступа называется "Модели как услуга". Плата за входные и выходные данные в API обычно взимается в маркерах; Перед развертыванием предоставляются сведения о ценах.
Проверка подлинности API Ключи и проверка подлинности идентификатора Microsoft Entra. Только ключи.
Безопасность содержимого Используйте API службы содержимого Azure Сейф ty. Фильтры содержимого azure AI Сейф ty доступны интегрированными с API вывода. Счета за Сейф фильтры содержимого ИИ Azure могут взиматься отдельно.
Сетевая изоляция Настройка управляемой сети. Подробнее.
Модель Управляемые вычисления Бессерверный API (оплата по мере использования)
Семейные модели Ламы Лама-2-7b
Лама-2-7b-чат
Лама-2-13b
Ллома-2-13b-чат
Лама-2-70b
Ллома-2-70b-чат
Лама-3-8B-Instruct
Лама-3-70B-Instruct
Лама-3-8B
Лама-3-70B
Лама-3-70B-Instruct
Лама-3-8B-Instruct
Лама-2-7b
Лама-2-7b-чат
Лама-2-13b
Ллома-2-13b-чат
Лама-2-70b
Ллома-2-70b-чат
Модели семейства Мистралей mistralai-Mixtral-8x22B-v0-1
mistralai-Mixtral-8x22B-Instruct-v0-1
mistral-community-Mixtral-8x22B-v0-1
mistralai-Mixtral-8x7B-v01
mistralai-Mistral-7B-Instruct-v0-2
mistralai-Mistral-7B-v01
mistralai-Mixtral-8x7B-Instruct-v01
mistralai-Mistral-7B-Instruct-v01
Мистраль-большой
Мистраль-маленький
Модели семейства Cohere Недоступно Cohere-command-r-plus
Cohere-command-r
Cohere-embed-v3-english
Cohere-embed-v3-многоязычный
JAIS Недоступно jais-30b-chat
Семейные модели Phi3 Phi-3-small-128k-Instruct
Phi-3-small-8k-Instruct
Phi-3-mini-4k-Instruct
Phi-3-mini-128k-Instruct
Phi3-medium-128k-instruct
Phi3-medium-4k-instruct
Phi-3-mini-4k-Instruct
Phi-3-mini-128k-Instruct
Phi3-medium-128k-instruct
Phi3-medium-4k-instruct
Phi-3-vision-128k-instruct
Nixtla Недоступно TimeGEN-1
Другие модели Доступно Недоступно

Схема, на которой показаны модели как услуга и цикл службы конечных точек реального времени.

Управляемые вычисления

Возможность развертывать модели как управляемые вычислительные ресурсы на основе возможностей платформы Машинное обучение Azure для обеспечения простой интеграции в течение всего жизненного цикла LLMOps в широком наборе моделей в каталоге моделей.

Схема жизненного цикла LLMops.

Как модели становятся доступными для развертывания как управляемых вычислений?

Модели становятся доступными с помощью Машинное обучение Azure реестров, которые позволяют машинному обучению использовать первый подход к размещению и распространению Машинное обучение ресурсов, таких как вес модели, среды выполнения контейнеров для выполнения моделей, конвейеров для оценки и точной настройки моделей и наборов данных для тестов и примеров. Эти реестры машинного обучения создаются на основе высокомасштабируемой и корпоративной готовой инфраструктуры, которая:

  • Предоставляет артефакты модели доступа с низкой задержкой во всех регионах Azure с встроенным геоизбытием реплика.

  • Поддерживает корпоративные требования к безопасности в качестве ограничения доступа к моделям с Политика Azure и безопасным развертыванием с управляемыми виртуальными сетями.

Развертывание моделей вывода с помощью управляемых вычислений

Модели, доступные для развертывания в управляемом вычислении, можно развернуть для Машинное обучение Azure конечных точек Online для вывода в режиме реального времени. При развертывании на управляемых вычислительных ресурсах требуется квота виртуальной машины в подписке Azure для конкретных номеров SKU, необходимых для оптимального запуска модели. Некоторые модели позволяют развертывать временно общую квоту для тестирования модели. Дополнительные сведения о развертывании моделей:

Создание созданных приложений ИИ с помощью управляемых вычислений

Поток запросов предлагает отличный интерфейс для прототипа. Модели, развернутые с управляемыми вычислениями, можно использовать в потоке запросов с помощью средства Open Model LLM. Вы также можете использовать REST API, предоставляемый управляемыми вычислениями, в популярных инструментах LLM, таких как LangChain с расширением Машинное обучение Azure.

Безопасность содержимого для моделей, развернутых как управляемые вычислительные ресурсы

Служба azure AI Content Сейф ty (AACS) доступна для использования с управляемыми вычислениями на экране для различных категорий вредного содержимого, таких как сексуальное содержимое, насилие, ненависть, а также дополнительные угрозы, такие как обнаружение рисков в тюрьме и обнаружение защищенного текста. Эту записную книжку можно использовать для справки по интеграции с AACS для Llama 2 или использовать средство Content Сейф ty (text) в потоке запросов для передачи ответов от модели в AACS для проверки. Плата взимается отдельно по тарифам AACS для такого использования.

Бессерверные API с выставлением счетов по мере использования

Некоторые модели в каталоге моделей можно развернуть как бессерверные API с выставлением счетов по мере использования; этот метод развертывания называется Models-as-a Service (MaaS), предоставляя способ их использования в качестве API без размещения их в подписке. Модели, доступные через MaaS, размещаются в инфраструктуре, управляемой корпорацией Майкрософт, которая обеспечивает доступ на основе API к модели поставщика моделей. Доступ на основе API может значительно сократить затраты на доступ к модели и значительно упростить процесс подготовки. Большинство моделей MaaS приходят с ценами на основе токенов.

Как доступны сторонние модели в MaaS?

Схема, на которой показан цикл службы издателя модели.

Модели, доступные для развертывания в качестве бессерверных API с выставлением счетов по мере использования, предлагаются поставщиком моделей, но размещены в инфраструктуре Azure, управляемой Корпорацией Майкрософт, и доступ к ним осуществляется через API. Поставщики моделей определяют условия лицензии и задают цену на использование своих моделей, а служба Машинное обучение Azure управляет инфраструктурой размещения, делает интерфейсы API вывода доступными и выступает в качестве обработчика данных для запросов, отправленных и выходных данных содержимого моделями, развернутыми с помощью MaaS. Дополнительные сведения об обработке данных для MaaS см. в статье о конфиденциальности данных.

Оплата использования модели в MaaS

Интерфейс обнаружения, подписки и потребления моделей, развернутых с помощью MaaS, находится в Azure AI Studio и Студия машинного обучения Azure. Пользователи принимают условия лицензии для использования моделей, а во время развертывания предоставляются сведения о ценах на потребление. Счета за модели сторонних поставщиков выставляются через Azure Marketplace в соответствии с условиями использования коммерческой платформы; модели от Майкрософт выставляются с помощью счетчиков Azure в качестве служб потребления первой стороны. Как описано в условиях продукта, службы потребления первой стороны покупаются с помощью счетчиков Azure, но не применяются к условиям обслуживания Azure. Использование этих моделей распространяется на условия лицензии.

Развертывание моделей вывода с помощью MaaS

Развертывание модели с помощью MaaS позволяет пользователям получать доступ к готовым к использованию API вывода без необходимости настраивать инфраструктуру или подготавливать графические процессоры, экономя время и ресурсы. Эти API можно интегрировать с несколькими средствами LLM и использованием, как описано в предыдущем разделе.

Детализируйте модели с помощью MaaS с оплатой по мере использования

Для моделей, доступных с помощью MaaS и поддержки точной настройки, пользователи могут воспользоваться преимуществами размещенной точной настройки с оплатой по мере использования для настройки моделей с использованием предоставленных данных. Дополнительные сведения см. в обзоре тонкой настройки.

RAG с моделями, развернутыми как бессерверные API

Azure AI Studio позволяет пользователям использовать векторные индексы и получение дополненного поколения. Модели, которые можно развернуть с помощью бессерверного API, можно использовать для создания внедрения и вывода на основе пользовательских данных для создания ответов, характерных для их варианта использования. Дополнительные сведения см. в статье "Создание векторного индекса".

Региональная доступность предложений и моделей

Выставление счетов по мере использования доступно только для пользователей, подписка Azure которой принадлежит учетной записи выставления счетов в стране, где поставщик модели сделал предложение доступным (см. раздел "Регион доступности предложения" в таблице в следующем разделе). Если предложение доступно в соответствующем регионе, пользователь должен иметь концентратор или проект в регионе Azure, где модель доступна для развертывания или тонкой настройки, как применимо (см. столбцы "концентратор или регион проекта" в таблице ниже).

Модель Регион доступности предложения Концентратор или регион проекта для развертывания Центр или регион проекта для точной настройки
Лама-3-70B-Instruct
Лама-3-8B-Instruct
Управляемые страны Майкрософт Восточная часть США 2, Центральная Швеция Недоступно
Лама-2-7b
Лама-2-13b
Llama-2-70b
Управляемые страны Майкрософт Восточная часть США 2, западная часть США 3 Западная часть США — 3
Лама-2-7b-чат
Ллома-2-13b-чат
Ллома-2-70b-чат
Управляемые страны Майкрософт Восточная часть США 2, западная часть США 3 Недоступно
Мистраль-Большой
Мистраль Маленький
Управляемые страны Майкрософт Восточная часть США 2, Центральная Швеция Недоступно
Cohere-command-r-plus
Cohere-command-r
Cohere-embed-v3-english
Cohere-embed-v3-многоязычный
Управляемые страны Майкрософт
Япония
Восточная часть США 2, Центральная Швеция Недоступно

Безопасность содержимого для моделей, развернутых с помощью бессерверного API

Внимание

Некоторые функции, описанные в этой статье, могут быть доступны только в предварительной версии. Эта предварительная версия предоставляется без соглашения об уровне обслуживания, и мы не рекомендуем ее для рабочих нагрузок. Некоторые функции могут не поддерживаться или их возможности могут быть ограничены. Дополнительные сведения см. в статье Дополнительные условия использования Предварительных версий Microsoft Azure.

Azure AI Studio реализует конфигурацию содержимого ИИ Azure по умолчанию Сейф сти фильтров модерации текста для вредного содержимого (ненависти, самоповредения, сексуального и насилия) в языковых моделях, развернутых с помощью MaaS. Дополнительные сведения о фильтрации содержимого (предварительная версия) см. в статьях "Категории вреда" в Сейф содержимого ИИ Azure. Фильтрация содержимого (предварительная версия) выполняется синхронно, так как процессы службы запрашивают создание контента, и вы можете выставляться отдельно по тарифам AACS для такого использования. При первом развертывании языковой модели или на странице сведений о развертывании можно отключить фильтрацию содержимого для отдельных бессерверных конечных точек, щелкнув переключатель фильтрации содержимого. Вы можете столкнуться с более высоким риском предоставления пользователям вредного содержимого при отключении фильтров содержимого.

Следующие шаги