Примечание
Для доступа к этой странице требуется авторизация. Вы можете попробовать войти или изменить каталоги.
Для доступа к этой странице требуется авторизация. Вы можете попробовать изменить каталоги.
Модели Azure AI Foundry — это универсальное местоположение для обнаружения, оценки и развертывания мощных моделей ИИ, будь то создание пользовательского помощника, создание агента, улучшение существующего приложения или изучение новых возможностей ИИ.
С помощью моделей Foundry можно:
- Изучите широкий каталог передовых моделей от Майкрософт, OpenAI, DeepSeek, Hugging Face, Meta и многое другое.
- Сравнение и оценка моделей параллельно с использованием реальных задач и собственных данных.
- Благодаря встроенным инструментам для точной настройки, наблюдаемости и ответственного ИИ вы можете развёртывать с уверенностью.
- Выберите свой путь— принесите собственную модель, используйте размещенную модель или легко интегрируйте с службами Azure.
- Независимо от того, является ли вы разработчиком, специалистом по обработке и анализу данных или корпоративным архитектором, Foundry Models, предоставляет гибкость и контроль над созданием решений искусственного интеллекта, которые масштабируемы, безопасно, ответственно и быстро.
Azure AI Foundry предлагает полный каталог моделей ИИ. Существует более 1900+ моделей, начиная от базовых моделей, моделей причин, небольших языковых моделей, многомодальных моделей, конкретных предметных моделей, отраслевых моделей и т. д.
Наш каталог организован в две основные категории:
Понимание различий между этими категориями помогает выбрать правильные модели на основе конкретных требований и стратегических целей.
Модели, проданные напрямую Azure
Это модели, размещенные и проданные корпорацией Майкрософт по условиям продукта Майкрософт. Эти модели прошли строгую оценку и глубоко интегрированы в экосистему ИИ Azure. Модели приходят от различных ведущих поставщиков, и они предлагают расширенную интеграцию, оптимизированную производительность и прямую поддержку Майкрософт, включая соглашения об уровне обслуживания корпоративного уровня (СОГЛАШЕНИЯ об уровне обслуживания).
Характеристики этих прямых моделей:
- Официальная поддержка от корпорации Майкрософт
- Высокий уровень интеграции со службами и инфраструктурой Azure
- Расширенное тестирование производительности и проверка
- Соблюдение стандартов ответственного искусственного интеллекта Майкрософт
- Масштабируемость, надежность и безопасность корпоративного уровня
Эти модели также имеют преимущество взаимозаменяемой подготовленной пропускной способности, что означает, что вы можете гибко использовать квоту и резервирования в любой из этих моделей.
Модели от партнеров и сообщества
Эти модели представляют собой подавляющее большинство моделей Azure AI Foundry. Эти модели предоставляются доверенными сторонними организациями, партнерами, исследовательскими лабораториями и участниками сообщества. Эти модели предлагают специализированные и разнообразные возможности искусственного интеллекта, охватывающие широкий спектр сценариев, отраслей и инноваций.
Характеристики моделей от партнеров и сообщества:
- Разработан и поддерживается внешними партнерами и участниками сообщества
- Разнообразный спектр специализированных моделей, предназначенных для нишевых или более широких вариантов использования.
- Как правило, проверяется самими поставщиками с рекомендациями по интеграции, предоставляемыми Azure
- Инновации, управляемые сообществом, и быстрая доступность передовых моделей
- Стандартная интеграция Azure AI, поддержка и обслуживание которой осуществляются соответствующими поставщиками.
Модели можно развертывать в виде управляемых вычислительных ресурсов или стандартных (оплата по мере использования). Поставщик модели выбирает способ развертывания моделей.
Выбор между прямыми моделями и моделями партнеров и сообщества
При выборе моделей из Моделей Azure AI Foundry рассмотрите следующее:
- Вариант использования и требования. Модели, проданные непосредственно в Azure, идеально подходят для сценариев, требующих глубокой интеграции Azure, гарантированной поддержки и корпоративных соглашений об уровне обслуживания. Модели экосистем Azure превосходят в специализированных вариантах использования и сценариях с упором на инновации.
- Ожидания поддержки. Модели, проданные непосредственно Azure, предоставляют надежную поддержку и обслуживание корпорации Майкрософт. Эти модели поддерживаются их поставщиками с различными уровнями соглашения об уровне обслуживания и структурами поддержки.
- Инновации и специализация: модели от партнеров и сообщества предлагают быстрый доступ к специализированным инновациям и нишевым возможностям, часто разработанным ведущими исследовательскими лабораториями и новыми поставщиками ИИ.
Коллекции моделей
Каталог моделей упорядочивает модели в разные коллекции:
Модели Azure OpenAI, доступные исключительно в Azure: флагманские модели Azure OpenAI, доступные через интеграцию с Azure OpenAI в модели Azure AI Foundry. Корпорация Майкрософт поддерживает эти модели и их использование в соответствии с условиями продукта и соглашением об уровне обслуживания для Azure OpenAI в моделях Azure AI Foundry.
Откройте модели из хаба Hugging Face: сотни моделей из хаба Hugging Face для инференции в реальном времени с управляемыми вычислениями. Hugging Face создает и поддерживает модели, перечисленные в этой коллекции. Для получения помощи воспользуйтесь форумом Hugging Face или обращайтесь в поддержку Hugging Face. Дополнительные сведения см. в разделе "Развертывание открытых моделей с помощью Azure AI Foundry".
Вы можете отправить запрос на добавление модели в каталог моделей с помощью этой формы.
Общие сведения о возможностях каталога моделей
Каталог моделей на портале Azure AI Foundry — это центр для обнаружения и использования широкого спектра моделей для создания создаваемых приложений ИИ. Каталог моделей включает сотни моделей в таких поставщиках моделей, как Azure OpenAI, Mistral, Meta, Cohere, NVIDIA и Hugging Face, включая модели, обученные Корпорацией Майкрософт. Модели от поставщиков, отличных от корпорации Майкрософт, являются продуктами, не являющихся корпорацией Майкрософт, как определено в условиях продуктов Майкрософт, и применяются к условиям, предоставленным моделями.
Вы можете искать и обнаруживать модели, соответствующие вашим требованиям, с помощью поиска ключевых слов и фильтров. Каталог моделей также предлагает рейтинг производительности модели и эталонные метрики для выбранных моделей. К ним можно получить доступ, выбрав "Обзор лидеров " и "Сравнить модели". Данные бенчмарка также доступны на вкладке "Эталонная карта модели".
В фильтрах каталога моделей вы найдете:
- Коллекция: можно фильтровать модели на основе коллекции поставщиков моделей.
- Отрасль: можно отфильтровать модели, обучаемые по определенному набору данных в отрасли.
- Возможности: можно фильтровать уникальные функции модели, такие как умозаключение и вызов инструментов.
- Варианты развертывания: можно отфильтровать модели, поддерживающие определенные варианты развертывания.
- Стандартный: этот параметр позволяет платить за вызов API.
- Подготовленная модель: лучше всего подходит для оценки в режиме реального времени для большого постоянного объема.
- Пакетная обработка: лучше всего подходит для оптимизированных по затратам пакетных заданий, но не для работы, требующей низкой задержки. Для пакетного развертывания не предоставляется поддержка игровой площадки.
- Управляемые вычислительные ресурсы: этот параметр позволяет развернуть модель на виртуальной машине Azure. Вам будет выставлен счет за размещение и инференцию.
- Задачи вывода: можно фильтровать модели на основе типа задачи вывода.
- Задачи точной настройки: можно фильтровать модели на основе типа задачи точной настройки.
- Лицензии: можно фильтровать модели на основе типа лицензии.
На карточке модели вы найдете:
- Краткие факты: вы увидите ключевые сведения о модели на быстром взгляде.
- Сведения: эта страница содержит подробные сведения о модели, включая описание, сведения о версии, поддерживаемый тип данных и т. д.
- Тесты: вы найдете метрики теста производительности для выбора моделей.
- Существующие развертывания: если вы уже развернули модель, ее можно найти на вкладке "Существующие развертывания".
- Лицензия: вы найдете юридическую информацию, связанную с лицензированием модели.
- Артефакты: эта вкладка будет отображаться только для открытых моделей. Вы можете просмотреть ресурсы модели и скачать их через пользовательский интерфейс.
Развертывание модели: управляемые вычислительные ресурсы и стандартные развертывания
Помимо моделей Azure OpenAI, каталог моделей предлагает два различных способа развертывания моделей для использования: управляемых вычислений и стандартных развертываний.
Варианты развертывания и функции, доступные для каждой модели, зависят, как описано в следующих таблицах. Узнайте больше об обработке данных с параметрами развертывания.
Возможности параметров развертывания модели
Функции | Управляемые вычисления | Стандартные развертывания |
---|---|---|
Опыт развертывания и выставления счетов | Веса модели развертываются на выделенных виртуальных машинах с управляемыми вычислениями. Управляемый вычислительный ресурс, который может иметь одно или несколько развертываний, предоставляет REST API для выполнения выводов. С вас взимается плата за часы работы ядер виртуальных машин, которые используются развертываниями. | Доступ к моделям осуществляется через развертывание, которое подготавливает API для доступа к модели. API предоставляет доступ к модели, размещённой и управляемой Microsoft для выполнения операций вывода. Плата за входные и выходные данные в API обычно взимается в токенах. Сведения о ценах предоставляются перед развертыванием. |
Проверка подлинности API | Ключи и проверка подлинности Microsoft Entra. | Только ключи. |
Безопасность содержимого | Используйте API службы безопасности содержимого Azure. | Фильтры безопасности содержимого Azure AI доступны в интеграции с API инференции. Фильтры безопасности содержимого Azure оплачиваются отдельно. |
Сетевая изоляция | Настройте управляемые сети для узлов Azure AI Foundry. | Управляемые вычисления следуют параметру флага доступа к общедоступной сети (PNA) концентратора. Дополнительные сведения см. в разделе "Сетевая изоляция для моделей, развернутых с помощью стандартных развертываний " далее в этой статье. |
Доступные модели для поддерживаемых вариантов развертывания
Каталог моделей предлагает два различных способа развертывания моделей из каталога для использования: управляемые вычислительные ресурсы и стандартные развертывания. Для каждой модели доступны различные варианты развертывания. В приведенных ниже таблицах содержатся дополнительные сведения о функциях вариантов развертывания и вариантах, предусмотренных для определенных моделей. Получите дополнительные сведения об обработке данных и вариантах развертывания.
Функции | Управляемые вычисления | Стандартные развертывания |
---|---|---|
Опыт развертывания и выставления счетов | Весовые коэффициенты для моделей развертываются в выделенных виртуальных машинах с управляемыми сетевыми конечными точками. Управляемая конечная точка в сети, которая может иметь одно или несколько развертываний, предоставляет REST API для вывода. Плата взимается за базовые часы виртуальных машин, используемые развертываниями. | Доступ к моделям осуществляется через развертывание, которое подготавливает API для доступа к модели. API предоставляет доступ для вывода к модели, размещенной в центральном пуле GPU, управляемом корпорацией Microsoft. Этот режим доступа называется «Модели как услуга». Взимается плата за входные и выходные данные в API, обычно в маркерах; перед развертыванием предоставляются сведения о ценах. |
Проверка подлинности API | Ключи и проверка подлинности Microsoft Entra ID Подробнее. | Только ключи. |
Безопасность содержимого | Используйте API сервиса безопасности содержимого Azure. | Фильтры безопасности содержимого Azure AI доступны в интеграции с API инференции. Фильтры безопасности содержимого ИИ Azure могут оплачиваться отдельно. |
Сетевая изоляция | Управляемая виртуальная сеть с конечными точками в сети. Подробнее. |
Управляемые вычисления
Возможность развертывания моделей с управляемыми вычислительными ресурсами на платформах возможностей Машинное обучение Azure для обеспечения простой интеграции во всем жизненном цикле GenAIOps (иногда называемых LLMOps) широкой коллекции моделей в каталоге моделей.
Доступность моделей для развертывания как управляемых вычислительных сервисов
Модели предоставляются с помощью реестров Машинного обучения Azure, которые обеспечивают Машинному обучению первоочередной доступ к размещению и распространению ресурсов Машинного обучения, таких как весовые коэффициенты для моделей, среды выполнения контейнеров для запуска моделей, конвейеры для оценки и тонкой настройки моделей, а также наборы данных для тестирования и демонстрации примеров. Эти реестры Машинного обучения создаются на основе высокомасштабируемой, готовой к корпоративному использованию инфраструктуры, которая
предоставляет артефакты модели доступа с низкой задержкой во всех регионах Azure благодаря встроенной георепликации;
поддерживает корпоративные требования к безопасности, например, ограничение доступа к моделям за счет Политики Azure и безопасное развертывание с управляемыми виртуальными сетями.
Развертывание моделей для вывода с помощью управляемых вычислений
Модели, доступные для развертывания с управляемыми вычислительными ресурсами, можно развернуть для Машинное обучение Azure сетевых конечных точек для вывода в режиме реального времени или использовать для Машинное обучение Azure пакетного вывода для пакетной обработки данных. При развертывании на управляемых вычислительных ресурсах требуется квота виртуальной машины в подписке Azure для конкретных номеров SKU, необходимых для оптимального запуска модели. Некоторые модели позволяют развертывать временно общую квоту для тестирования модели. Дополнительные сведения о развертывании моделей:
- Развертывание моделей Meta Llama
- Развертывание открытых моделей, созданных СИ Azure
- Развертывание моделей распознавания лиц
Создание генеративных ИИ приложений с помощью управляемых вычислительных ресурсов
Поток запросов располагает возможностями для создания прототипов, экспериментирования, итерации и развертывания ваших приложений ИИ. Развертываемые в управляемой вычислительной среде модели можно использовать в потоке запросов с помощью средства Open Model LLM. Вы также можете использовать REST API, предоставляемый управляемой вычислительной средой в популярных инструментах для работы с LLM, таких как LangChain с расширением «Машинное обучение Azure».
Безопасность содержимого для моделей, развернутых как управляемые вычислительные ресурсы
Служба "Безопасность содержимого ИИ Azure" (AACS) доступна для использования с моделями, развернутыми для управляемых вычислений на экране для различных категорий вредного содержимого, таких как сексуальное содержимое, насилие, ненависть, а также дополнительные угрозы, такие как обнаружение рисков в тюрьме и обнаружение защищенного текста. Эту записную книжку можно использовать для справки по интеграции с AACS для Llama 2 или использовать средство "Безопасность содержимого ( текст) в потоке запросов для передачи ответов от модели в AACS для проверки. Вы будете выставляться отдельно по тарифам AACS для такого использования.
Стандартные развертывания со стандартной системой выставления счетов
Некоторые модели в каталоге моделей можно развернуть как стандартные развертывания с помощью стандартного выставления счетов; этот метод развертывания называется стандартными развертываниями. Модели, доступные через MaaS, размещаются в инфраструктуре, управляемой корпорацией Майкрософт, которая обеспечивает доступ на основе API к модели поставщика моделей. Доступ на основе API может значительно сократить затраты на доступ к модели и значительно упростить процесс подготовки. Большинство моделей MaaS приходят с ценами на основе токенов.
Как доступны сторонние модели в MaaS?
Модели, доступные для развертывания в качестве стандартных развертываний с помощью стандартного выставления счетов, предоставляются поставщиком моделей, но размещаются в инфраструктуре Azure, управляемой корпорацией Майкрософт, и доступ к ним осуществляется через API. Поставщики моделей определяют условия лицензии и задают цену на использование своих моделей, а служба Машинное обучение Azure управляет инфраструктурой размещения, делает интерфейсы API вывода доступными и выступает в качестве обработчика данных для запросов, отправленных и выходных данных содержимого моделями, развернутыми с помощью MaaS. Дополнительные сведения об обработке данных для MaaS см. в статье о конфиденциальности данных.
Замечание
Подписки поставщика облачных решений (CSP) не имеют возможности приобретать стандартные модели развертывания.
Выставление счетов
Опыт обнаружения, подписки и потребления моделей, развернутых с помощью MaaS, представлен в портале Azure AI Foundry и студии машинного обучения Azure. Пользователи принимают условия лицензии для использования моделей. Сведения о ценах на потребление предоставляются во время развертывания.
Счета за модели от поставщиков, отличных от Майкрософт, выставляются через Azure Marketplace в соответствии с условиями использования Коммерческой платформы Майкрософт.
Счета за модели от Microsoft выставляются через счетчики Azure как сервисы потребления первой стороны. Как описано в условиях продукта, вы приобретаете службы потребления первой стороны с помощью счетчиков Azure, но они не применяются к условиям службы Azure. Использование этих моделей подпадает под указанные лицензионные условия.
Тонкая настройка моделей
Для моделей, доступных через MaaS и поддерживающих точную настройку, пользователи могут использовать размещенную точную настройку со стандартной тарификацией для адаптации моделей с предоставленными данными. Дополнительные сведения см. в статье о точной настройке модели Llama 2 на портале Azure AI Foundry.
RAG с моделями, которые развернуты как стандартные конфигурации.
Azure AI Foundry позволяет пользователям использовать векторные индексы и получение дополненного поколения. Модели, которые можно развернуть в качестве стандартных развертываний, можно использовать для генерации эмбеддингов и инференса на основе пользовательских данных, чтобы создавать ответы, специфичные для их вариантов использования. Дополнительные сведения см. в разделе "Получение дополненного поколения" и индексов.
Региональная доступность предложений и моделей
Стандартное выставление счетов доступно только пользователям, подписка Azure которого принадлежит учетной записи для выставления счетов в стране или регионе, где предложение поставщика модели доступно. Если предложение доступно в соответствующем регионе, пользователь должен иметь концентратор или проект в регионе Azure, где модель доступна для развертывания или тонкой настройки, как применимо. Подробные сведения см. в разделе "Доступность регионов" для моделей в стандартных развертываниях .
Безопасность содержимого для моделей, развернутых с помощью стандартных развертываний
Это важно
Эта функция сейчас доступна в общедоступной предварительной версии. Эта предварительная версия предоставляется без соглашения об уровне обслуживания, и мы не рекомендуем использовать её для производственных нагрузок. Некоторые функции могут не поддерживаться или их возможности могут быть ограничены.
Для получения дополнительной информации см. Дополнительные условия использования для предварительных версий Microsoft Azure.
Для языковых моделей, развернутых с помощью бессерверного API, Azure AI реализует стандартные фильтры модерации текста безопасности содержимого ИИ Azure , которые обнаруживают вредное содержимое, например ненависть, самоповредение, сексуальное и насильственное содержимое. Дополнительные сведения о фильтрации содержимого см. в разделе Guardrails и элементы управления для моделей, проданных непосредственно в Azure.
Подсказка
Фильтрация содержимого недоступна для определенных типов моделей, развернутых через бессерверный API. Эти типы моделей включают модели встраивания и модели временных рядов.
Фильтрация содержимого выполняется синхронно, когда служба обрабатывает запросы на создание контента. Вам могут выставить счет отдельно в соответствии с ценами на безопасность содержимого Azure AI для такого использования. Вы можете отключить фильтрацию содержимого для отдельных бессерверных конечных точек:
- Во время первого развертывания языковой модели
- Позже, выбрав переключатель фильтрации содержимого на странице сведений о развертывании
Предположим, вы решили использовать API, отличный от API вывода модели , для работы с моделью, развернутой через бессерверный API. В такой ситуации фильтрация содержимого не включена, если только вы не реализуете его отдельно с помощью безопасности содержимого ИИ Azure.
Чтобы начать работу с безопасностью контента Azure AI, см. краткое руководство: Анализ текстового контента. Если при работе с моделями, развернутыми через бессерверный API, вы не используете фильтрацию содержимого, вы рискуете предоставить пользователям вредное содержимое.
Сетевая изоляция для моделей, развернутых с помощью стандартных развертываний
Конечные точки для моделей, развернутых как стандартные развертывания, следуют параметру флага доступа к общедоступной сети (PNA) рабочей области, в которой выполняется развертывание. Чтобы защитить конечную точку MaaS, отключите флаг PNA в рабочей области. Вы можете защитить входящий трафик от клиента к конечной точке с помощью частной конечной точки для рабочей области.
Чтобы задать флаг PNA для рабочей области, выполните следующие действия.
- Перейдите на портал Azure.
- Найдите Машинное обучение Azure и выберите рабочую область из списка рабочих областей.
- На странице "Обзор" перейдите в раздел "Параметры>сети" с помощью левой панели.
- На вкладке "Общедоступный доступ" можно настроить параметры для флага доступа к общедоступной сети.
- Сохраните ваши изменения. Для распространения изменений может потребоваться до пяти минут.
Ограничения
- Если у вас есть рабочая область с частной конечной точкой, созданной до 11 июля 2024 г., новые конечные точки MaaS, добавленные в эту рабочую область, не будут следовать его конфигурации сети. Вместо этого необходимо создать частную конечную точку для рабочей области и создать стандартные развертывания в рабочей области, чтобы новые развертывания могли следовать конфигурации сети рабочей области.
- Если у вас есть рабочая область с развертываниями MaaS, созданными до 11 июля 2024 г., и вы включите частную конечную точку в этой рабочей области, существующие развертывания MaaS не будут соответствовать конфигурации сети рабочей области. Чтобы стандартные развертывания в рабочей области следовали конфигурации рабочей области, необходимо снова создать развертывания.
- В настоящее время поддержка данных недоступна для развертываний MaaS в частных рабочих областях, так как в частных рабочих областях флаг PNA отключен.
- Любое изменение конфигурации сети (например, включение или отключение флага PNA) может занять до пяти минут для распространения.