Поделиться через


Создание конечных точек для развернутых веб-сервисов классической Студии машинного обучения

ОБЛАСТЬ ПРИМЕНЕНИЯ:применимо к:.Студия машинного обучения (классическая версия) не применяется к.Машинное обучение Azure

Внимание

Поддержка Студии машинного обучения (классической) будет прекращена 31 августа 2024 г. Мы рекомендуем перейти на Машинное обучение Azure по этой дате.

Начиная с 1 декабря 2021 года вы не сможете создавать новые ресурсы Студии машинного обучения (классической). Существующие ресурсы Студии машинного обучения (классической) можно будет использовать до 31 августа 2024 г.

Прекращается поддержка документации по Студии машинного обучения (классической). В будущем она может не обновляться.

После развертывания веб-службы для нее создается конечная точка по умолчанию. Эту конечную точку можно вызвать, используя ключ API. На портале веб-служб вы можете добавить больше конечных точек с их собственными ключами. Каждая конечная точка в веб-службе адресуется, регулируется и управляется независимо. Каждая конечная точка представляет собой уникальный URL-адрес с ключом авторизации, который вы можете передавать своим клиентам.

Добавление конечных точек в веб-службу

Вы можете добавить конечную точку в веб-службу с помощью портала веб-служб Машинного обучения. После создания конечная точка может быть использована в синхронных API, пакетных API и на листах Excel.

Примечание.

Если в веб-службу добавлены дополнительные конечные точки, вы не можете удалить конечную точку по умолчанию.

  1. В Студии машинного обучения (классическая модель) в левой области навигации щелкните "Веб-службы".
  2. В нижней части панели мониторинга веб-службы щелкните "Управление конечными точками". Портал веб-сервиса Машинного Обучения открывается на странице конечных точек для веб-сервиса.
  3. Нажмите кнопку "Создать".
  4. Введите имя и описание новой конечной точки. Имена конечных точек должны состоять из строчных букв или цифр и не должны превышать 24 символа в длину. Выберите уровень ведения журнала и включите или отключите выборку данных. Дополнительные сведения о ведении журнала см. в разделе "Включение ведения журнала для веб-служб машинного обучения".

Масштабирование веб-службы путем добавления дополнительных конечных точек

По умолчанию каждая опубликованная веб-служба настраивается для поддержки 20 параллельных запросов, а максимальное число параллельных запросов может доходить до 200. Студия машинного обучения (классическая) автоматически оптимизирует этот параметр, обеспечивая максимальную производительность веб-службы. Значение, указанное на портале, при этом игнорируется.

Если для API планируется более высокая нагрузка, чем максимальное поддерживаемое значение в 200 одновременных вызовов, следует создать для такой веб-службы несколько конечных точек. Это позволит случайным образом распределять нагрузку между ними.

Масштабирование веб-службы — достаточно распространенная задача. Например, масштабирование будет полезным для поддержки более 200 одновременных запросов, для повышения доступности путем использования нескольких конечных точек или для разделения конечных точек веб-службы. Вы можете увеличить масштаб, добавив дополнительные конечные точки для той же веб-службы с помощью портала веб-службы машинного обучения .

Помните, что высокий уровень параллелизма может быть неблагоприятным, если вы не вызываете API с соответствующей высокой частотой. Если вы создаете относительно низкую нагрузку на API, который настроен для высокой нагрузки, вы можете столкнуться с периодическими тайм-аутами и увеличением времени задержки.

Синхронные API обычно используются в ситуациях, когда требуется низкий уровень задержки. Под задержкой здесь подразумевается время, необходимое для того, чтобы API завершил один запрос, и в ней не учитывается время сетевой задержки. Предположим, что имеется API с задержкой в 50 мс. Чтобы полностью задействовать доступный объем с использованием высокого уровня ускорения и максимальным количеством одновременных вызовов = 20, необходимо вызывать этот API 20 * 1000 / 50 = 400 раз в секунду. Аналогично, при максимальном количестве одновременных вызовов в 200 и задержке в 50 мс этот API можно вызывать 4000 раз в секунду.

Следующие шаги

Использование веб-службы машинного обучения.