Бөлісу құралы:


Обслуживание прогнозов в режиме реального времени с помощью конечных точек модели машинного обучения (предварительная версия)

Это важно

Эта функция доступна в предварительной версии.

Microsoft Fabric позволяет выполнять прогнозы в режиме реального времени из моделей машинного обучения с безопасными, масштабируемыми и удобными сетевыми конечными точками. Эти конечные точки доступны как встроенные свойства большинства моделей Fabric, и они не требуют установки для запуска полностью управляемых развертываний в режиме реального времени.

Вы можете активировать, настроить и запрашивать конечные точки модели с помощью общедоступного REST API. Вы также можете начать работу непосредственно из интерфейса Fabric, используя низкокодовый интерфейс для мгновенной активации конечных точек модели и предварительных прогнозов.

Снимок экрана: модель машинного обучения в Fabric со встроенным свойством конечной точки для обслуживания прогнозов в режиме реального времени.

Предпосылки

Ограничения

  • Конечные точки в настоящее время доступны для ограниченного набора вариантов модели машинного обучения, включая Keras, LightGBM, Sklearn и XGBoost.
  • Конечные точки в настоящее время недоступны для моделей с тензорными схемами или без схем.

Замечание

По состоянию на январь 2026 г. конечные точки машинного обучения теперь поддерживают обученные модели AutoML. Это предыдущее ограничение было удалено.

Начало работы с конечными точками модели

Модели машинного обучения в Fabric готовы к использованию с онлайн-конечными точками, которые можно использовать для выполнения прогнозов в режиме реального времени. Каждая зарегистрированная версия модели имеет URL-адрес выделенной конечной точки, который можно найти в заголовке "Сведения о конечной точке" в интерфейсе Fabric. Этот URL-адрес заканчивается подпатом, указывающим эту конкретную версию (например, /versions/1/score).

Снимок экрана: свойства конечной точки модели машинного обучения, которая может использоваться для обслуживания прогнозов в режиме реального времени.

Конечные точки модели имеют следующие свойства:

Свойство Описание По умолчанию
Версия по умолчанию Это свойство (Yes или No) указывает, задана ли версия как значение по умолчанию модели для обслуживания реальных прогнозов. Вы можете настроить версию по умолчанию в параметрах модели. No
Статус Это свойство указывает, готова ли конечная точка обслуживать прогнозы. Состояние может бытьInactive, , Activating, ActiveDeactivatingили Failed. Только активные конечные точки могут служить прогнозами. Inactive
Автоматический спящий режим Это свойство (On или Off) указывает, должна ли конечная точка, после активации, снижать использование емкости до нуля при отсутствии трафика. Если включен автоматический спящий режим, конечная точка вводит состояние простоя через пять минут без входящих запросов. Первый вызов к пробуждению неактивной конечной точки сопровождается короткой задержкой. On

Активация конечных точек модели

Конечные точки модели можно активировать непосредственно из интерфейса Fabric. Перейдите к версии, которую вы хотите использовать для предсказаний в режиме реального времени, и выберите "Активировать конечную точку версии" в интерфейсе.

Снимок экрана: активация конечной точки модели машинного обучения из интерфейса Fabric.

Всплывающее сообщение показывает, что Fabric готовит конечную точку к работе с прогнозами, а состояние конечной точки изменяется на "Активация". За кулисами Структура запускает базовую инфраструктуру контейнеров для размещения модели. Через несколько минут конечная точка готова к использованию для предсказаний.

Снимок экрана: конечная точка модели машинного обучения, которая активируется.

Каждая конечная точка имеет состояние, указывающее, готова ли она обслуживать прогнозы в режиме реального времени:

Статус Описание
Inactive Конечная точка не активируется для обслуживания прогнозов в режиме реального времени и не потребляет емкость Fabric.
Activating Конечная точка настроена для обслуживания прогнозов в режиме реального времени. За кулисами Fabric настраивает базовую контейнерную инфраструктуру для размещения модели. Через несколько минут конечная точка активна.
Active Конечная точка готова обслуживать прогнозы в режиме реального времени. За кулисами Fabric управляет базовой инфраструктурой, масштабируя использование ресурсов в зависимости от объемов входящего трафика. Более высокий трафик приводит к повышению использования емкости Fabric.
Deactivating Конечная точка деактивируется, поэтому она больше не будет обслуживать прогнозы в режиме реального времени или потреблять емкость Fabric. За кулисами Fabric разбирает базовую инфраструктуру контейнеров.

Замечание

Модели машинного обучения могут поддерживать активные конечные точки до пяти версий одновременно. Для предоставления прогнозов из шестой версии необходимо сначала отключить активную конечную точку.

Управление конечными точками модели

Для обзора активных конечных точек модели выберите "Управление конечными точками" на ленте в интерфейсе. Каждая модель имеет настраиваемую конечную точку по умолчанию, которая обслуживает прогнозы из выбранной версии. Версию по умолчанию можно обновить с помощью раскрывающегося селектора в области параметров.

Снимок экрана: URL-адрес конечной точки модели машинного обучения по умолчанию, который можно настроить для обслуживания прогнозов из определенной версии.

Это важно

Если вы планируете использовать это свойство, убедитесь, что оно установлено на активную версию. Если свойство по умолчанию не задано или переключено на неактивную версию, тогда попытки вызовов конечной точки по умолчанию приводят к сбою.

Все версии с активными конечными точками перечислены в параметрах конечной точки модели. Можно изменить свойство автоматического спящего режима для каждой конечной точки, переключив переключатель на значение "Вкл." или "Выкл.".

Снимок экрана: изменение свойства автоматического спящего режима в конечных точках модели машинного обучения.

Подсказка

Активные конечные точки с режимом автоматического сна включенным входят в состояние простоя через пять минут без движения, и первый вызов, чтобы их разбудить, происходит с короткой задержкой. Это свойство может потребоваться отключить для конечных точек в рабочей среде.

Конечные точки модели запросов для прогнозирования в режиме реального времени

Конечные точки модели доступны для мгновенного тестирования с низким уровнем кода в Fabric. Перейдите к версии с активной конечной точкой и выберите "Предварительный просмотр прогнозов" на ленте в интерфейсе. Вы можете отправлять примеры запросов в конечную точку и получать примеры прогнозов в режиме реального времени с помощью полей форм, соответствующих входной подписи модели.

Снимок экрана: встроенный интерфейс предварительной версии для получения примеров прогнозов из активной конечной точки модели машинного обучения.

Чтобы заполнить поля формы случайными значениями, выберите "Автозаполнение". Можно добавить дополнительные наборы значений формы для тестирования эндпоинта с несколькими входными данными. Выберите "Получить прогнозы", чтобы отправить пример запроса сервису.

Снимок экрана: представление на основе форм для отправки примеров запросов в активную конечную точку модели машинного обучения.

Если вы предпочитаете форматировать примеры запросов как полезные данные JSON, используйте раскрывающийся селектор для изменения представления.

Снимок экрана: представление на основе JSON для отправки примеров запросов в активную конечную точку модели машинного обучения.

Деактивация конечных точек модели

Конечные точки модели можно отключить прямо через интерфейс Fabric. Перейдите к версии, которая больше не нужна для предоставления прогнозов в режиме реального времени, и выберите в интерфейсе на ленте "Деактивировать конечную точку версии".

Снимок экрана: отключение конечной точки модели машинного обучения из интерфейса Fabric.

Уведомление показывает, что Fabric отключает ваше активное развертывание, а статус конечной точки изменяется на "деактивация". Конечная точка больше не может обслуживать прогнозы в режиме реального времени, если вы не активируете её повторно.

Снимок экрана: конечная точка модели машинного обучения, которая теперь деактивируется.

Вы можете отключить конечные точки для нескольких версий одновременно в окне настроек модели. Выберите "Управление конечными точками" на ленте в интерфейсе и выберите одну или несколько активных конечных точек для деактивации.

Снимок экрана: отключение нескольких конечных точек модели машинного обучения одновременно из интерфейса Fabric.

Уровень потребления

Размещение активных конечных точек модели потребляет единицы емкости Fabric (CU). Конечные точки работают на вычислительных узлах и могут автоматически масштабироваться до трёх узлов в зависимости от входящего трафика. Стоимость рассчитывается за каждый узел в период активности конечной точки. В таблице ниже показано использование CU для активной точки завершения модели машинного обучения.

Операция Единица измерения операций коэффициент потребления
конечная точка модели 1 конечная точка модели (версия) в секунду на каждый узел 5 секунд CU

В таблице ниже показаны примеры сценариев и соответствующие показатели потребления и почасовые затраты.

Сценарий Описание коэффициент потребления Почасовая стоимость
Модели с неактивными конечными точками Эти модели не имеют активных конечных точек версии и не связаны с использованием ресурсов. Они не требуют дополнительных затрат. 0 CU секунд 0 CU час
Модели с активными, но простаивающими конечными точками Эти модели имеют одну или несколько активных конечных точек версии, но без регулярного трафика все масштабируются до нуля, уменьшая затраты автоматически. 5 секунд CU 0.42 CU-часы
Модели с 1 активной конечной точкой и постоянным низким трафиком Эти модели имеют только одну активную конечную точку версии, обслуживающую прогнозы, но недостаточно трафика для запуска полного масштабирования. Один узел способен обработать весь трафик. Другие конечные точки версии могут быть неактивными или простаивающими. 5 секунд CU 5 учётных часов (CU)
Модели с 1 активной конечной точкой и постоянным высоким трафиком Эти модели имеют только 1 активную конечную точку версии, обслуживающую прогнозы, при этом достаточно трафика для активации полного масштабирования. Другие конечные точки версии могут быть неактивными или бездействующими. 15 секунд CU 15 часов CU
Модели с 5 активными конечными точками и постоянным высоким трафиком Эти модели имеют 5 активных конечных точек версии (текущее ограничение), обслуживающих прогнозы, при этом трафика на каждой из них достаточно, чтобы запустить полное масштабирование. 75 CU-секунд 75 часов CU

Приложение Fabric Capacity Metrics отображает общее использование емкости для операций конечной точки модели под именем "Model Endpoint". Кроме того, пользователи могут просмотреть сводку по выставленным счетам за использование конечной точки модели в рамках выставления по позиции "Использование емкости конечной точки модели ML CU".

Операция конечной точки модели классифицируется как фоновые операции.

Ставки потребления в любое время изменяются. Корпорация Майкрософт использует разумные усилия для предоставления уведомления по электронной почте или через уведомление о продукте. Изменения должны применяться к дате, указанной в заметках о выпуске Майкрософт или блоге Microsoft Fabric. Если какое-либо изменение конечной точки модели в коэффициенте потребления Структуры существенно увеличивает единицу емкости (CU), необходимые для использования, клиенты могут использовать параметры отмены, доступные для выбранного метода оплаты.