Ограничения службы пользовательского распознавания именованных сущностей

В этой статье описываются ограничения данных и службы при использовании пользовательского распознавания именованных сущностей (NER).

Ограничения языкового ресурса

  • Языковой ресурс должен быть создан в одном из поддерживаемых регионов.

  • Ресурс должен находиться в одной из поддерживаемых ценовых категорий.

    Уровень Описание Ограничение
    F0 Уровень служб "Бесплатный" Для каждой подписки разрешен только один языковой ресурс уровня F0.
    S Платный уровень Для каждой подписки можно использовать неограниченное количество языковых ресурсов уровня S.
  • Для каждого ресурса можно подключить только одну учетную запись хранения. Это необратимый процесс. Если вы подключите учетную запись хранения к ресурсу, позднее вы не сможете ее отключить. См. дополнительные сведения о подключении учетной записи хранения.

  • У вас может быть до 500 проектов для каждого ресурса.

  • Имена проектов должны быть уникальными в пределах одного ресурса для всех пользовательских функций.

Доступность по регионам

Пользовательское распознавание именованных сущностей доступно только в некоторых регионах Azure. Некоторые регионы доступны как для разработки, так и для прогнозирования, а в других — только для прогнозирования. Языковые ресурсы в регионах разработки позволяют создавать, редактировать, обучать и развертывать проекты. Языковые ресурсы в регионах прогнозирования позволяют получать прогнозы из развертывания.

Регион Разработка Прогнозирование
Восточная Австралия
Brazil South
Центральная Канада
Центральная Индия
Центральная часть США
Восточная Азия
Восточная часть США
восточная часть США 2
Центральная Франция
Восточная Япония
Западная Япония
Западная Индия (Jio)
Республика Корея, центральный регион
Центрально-северная часть США
Северная Европа
Восточная Норвегия;
Северная часть ЮАР;
Центрально-южная часть США
Юго-Восточная Азия
Центральная Швеция
Северная Швейцария
Северная часть ОАЭ;
южная часть Соединенного Королевства
центрально-западная часть США
Западная Европа

Ограничения API

Item Тип запроса Максимальное ограничение
Разработка API POST 10 в минуту
Разработка API GET 100 в минуту
API прогнозирования GET/POST 1000 в минуту
Размер документа -- 125 000 символов. Можно отправить до 25 документов, если их общий размер не превышает 125 000 символов.

Совет

Если необходимо отправить файлы большего размера, то прежде чем отправлять их в API, текст можно разбить на фрагменты меньшего размера. Для этого можно использовать команду chunk из CLUtils.

Квоты

Ценовая категория Элемент Ограничение
F Время обучения 1 час в месяц
S Время обучения Без ограничений, оплата по мере использования
F Прогнозирующие вызовы 5000 текстовых записей в месяц
S Прогнозирующие вызовы Без ограничений, оплата по мере использования

Ограничения документов

  • Можно использовать только файлы .txt журнала. Если данные имеют другой формат, можно использовать команду Parse из CLUtils, чтобы открыть документ и извлечь текст.

  • Все файлы, отправленные в контейнер, должны содержать данные. Использование в обучении пустых файлов не допускается.

  • Все файлы должны быть доступны в корне контейнера.

Ограничения данных

Для пользовательского распознавания именованных сущностей соблюдаются перечисленные ниже ограничения.

Item Нижний предел Верхний предел
Число документов 10 100 000
Длина документа в символах 1 128 000 символов; приблизительно 28 000 слов или 56 страниц.
Число типов сущностей 1 200
Длина сущности в символах 1 500
Количество обученных моделей в проекте 0 10
Количество развертываний в проекте 0 10

Ограничения имен

Элемент Ограничения
Имя проекта Вы можете использовать только буквы (a-z, A-Z), цифры (0-9) и символы _ . - без пробелов. Максимально допустимая длина — 50 символов.
Имя модели Вы можете использовать только буквы (a-z, A-Z), цифры (0-9) и символы _ . -. Максимально допустимая длина — 50 символов.
Deployment name (Имя развертывания) Вы можете использовать только буквы (a-z, A-Z), цифры (0-9) и символы _ . -. Максимально допустимая длина — 50 символов.
Имя сущности Вы можете использовать только буквы (a-z, A-Z), цифры (0-9) и символы, кроме :, $ & % * ( ) + ~ # / ?. Максимально допустимая длина — 50 символов.
Имя документа Вы можете использовать только буквы (a-z, A-Z) и цифры (0-9) без пробелов.

Дальнейшие действия