Ограничения пользовательской классификации текста

Статья
12/19/2023

В этой статье описываются ограничения данных и службы использовании пользовательской классификации текстов.

Ограничения языкового ресурса

Языковой ресурс должен быть создан в одном из поддерживаемых регионов и ценовых категорий, перечисленных ниже.
Для каждого ресурса можно подключить только одну учетную запись хранения. Это необратимый процесс. Если вы подключите учетную запись хранения к ресурсу, позднее вы не сможете ее отключить. См. дополнительные сведения о подключении учетной записи хранения.
У вас может быть до 500 проектов для каждого ресурса.
Имена проектов должны быть уникальными в пределах одного ресурса для всех пользовательских функций.

Ценовые категории

Предлагаются следующие ценовые категории настраиваемой классификации текстов:

Уровень	Описание	Ограничение
F0	Уровень служб "Бесплатный"	Для каждой подписки разрешен только один языковой ресурс уровня F0.
S	Платный уровень	Для каждой подписки можно использовать неограниченное количество языковых ресурсов уровня S.

Дополнительные сведения см. на странице цен.

Доступность по регионам

См. статью Доступность языковой службы по регионам.

Ограничения API

Item	Тип запроса	Максимальное ограничение
Разработка API	POST	10 в минуту
Разработка API	GET	100 в минуту
API прогнозирования	GET/POST	1000 в минуту
Размер документа	--	125 000 символов. Можно отправить до 25 документов, если их общий размер не превышает 125 000 символов.

Совет

Если необходимо отправить файлы большего размера, то прежде чем отправлять их в API, текст можно разбить на фрагменты меньшего размера. Для этого можно использовать команду chunk из CLUtils.

Квоты

Ценовая категория	Элемент	Ограничение
F	Время обучения	1 час в месяц
S	Время обучения	Без ограничений, оплата по мере использования
F	Прогнозирующие вызовы	5000 текстовых записей в месяц
S	Прогнозирующие вызовы	Без ограничений, оплата по мере использования

Ограничения документов

Можно использовать только файлы .txt журнала. Если данные имеют другой формат, можно использовать команду Parse из CLUtils, чтобы открыть документ и извлечь текст.
Все файлы, отправленные в контейнер, должны содержать данные. Использование в обучении пустых файлов не допускается.
Все файлы должны быть доступны в корне контейнера.

Ограничения данных

Для пользовательской классификации текстов соблюдаются перечисленные ниже ограничения.

Item	Нижний предел	Верхний предел
Число документов	10	100 000
Длина документа в символах	1	128 000 символов; приблизительно 28 000 слов или 56 страниц.
Количество классов	1	200
Количество обученных моделей в проекте	0	10
Количество развертываний на проект (платный уровень)	0	10
Количество развертываний на проект (уровень "Бесплатный")	0	1

Ограничения имен

Элемент	Ограничения
Имя проекта	Вы можете использовать только буквы `(a-z, A-Z)`, цифры `(0-9)` и символы `_ . -` без пробелов. Максимально допустимая длина — 50 символов.
Имя модели	Вы можете использовать только буквы `(a-z, A-Z)`, цифры `(0-9)` и символы `_ . -`. Максимально допустимая длина — 50 символов.
Deployment name (Имя развертывания)	Вы можете использовать только буквы `(a-z, A-Z)`, цифры `(0-9)` и символы `_ . -`. Максимально допустимая длина — 50 символов.
Имя класса	Вы можете использовать только буквы `(a-z, A-Z)`, цифры `(0-9)` и символы, кроме :, `$ & % * ( ) + ~ # / ?`. Максимально допустимая длина — 50 символов.
Имя документа	Вы можете использовать только буквы `(a-z, A-Z)` и цифры `(0-9)` без пробелов.

Дальнейшие действия

Общие сведения о пользовательской классификации текстов