Поделиться через


Службы машинного обучения в Управляемом экземпляре SQL Azure

Службы машинного обучения — это функция Управляемого экземпляра SQL Azure, который предоставляет машинное обучение в базе данных, поддерживая скрипты Python и R. Эта функция включает пакеты Microsoft Python и R для высокопроизводительной прогнозной аналитики и машинного обучения. Реляционные данные можно использовать в сценариях с помощью хранимых процедур, скрипта T-SQL, содержащего инструкции Python или R, или код Python или R, содержащий T-SQL.

Что такое службы машинного обучения?

Службы машинного обучения в Управляемом экземпляре SQL Azure позволяют выполнять скрипты Python и R в базе данных. С их помощью можно подготавливать и очищать данные, выполнять проектирование признаков, а также обучать, оценивать и развертывать модели машинного обучения в базе данных. Этот компонент выполняет скрипты там, где хранятся данные, и устраняет необходимость перемещения данных по сети на другой сервер.

Использование служб машинного обучения с поддержкой R/Python в Управляемом экземпляре SQL Azure для:

  • Запустите скрипты R и Python для подготовки данных и обработки данных общего назначения . Теперь вы можете перенести скрипты R/Python в Управляемый экземпляр SQL Azure, где находятся данные, а не переносить данные на другой сервер для запуска скриптов R и Python. Вы можете устранить необходимость перемещения данных и связанных с ними проблем, связанных с задержкой, безопасностью и соответствием.

  • Обучение моделей машинного обучения в базе данных — вы можете обучать модели с помощью любых алгоритмов с открытым исходным кодом. Вы можете легко масштабировать обучение до всего набора данных, а не полагаться на примеры наборов данных, извлекаемых из базы данных.

  • Развертывание моделей и скриптов в рабочей среде в хранимых процедурах . Скрипты и обученные модели можно использовать просто путем внедрения их в хранимые процедуры T-SQL. Приложения, подключающиеся к Управляемому экземпляру SQL Azure, могут воспользоваться прогнозами и аналитикой в этих моделях, просто вызывая хранимую процедуру. Вы также можете использовать встроенную функцию T-SQL PREDICT для внедрения моделей для быстрого вычисления в условиях высококонкурентных сценариев оценки в реальном времени.

Базовые распределения Python и R включены в Службы машинного обучения. Вы можете установить и использовать пакеты с открытым кодом и платформы, такие как PyTorch, TensorFlow и scikit-learn, помимо пакетов Майкрософт revoscalepy и microsoftml для Python, и RevoScaleR, MicrosoftML, olapR и sqlrutils для R.

Как включить службы машинного обучения

Службы машинного обучения можно включить в Управляемом экземпляре SQL Azure, включив расширяемость со следующими командами SQL (Управляемый экземпляр SQL перезапустится и будет недоступным в течение нескольких секунд):

sp_configure 'external scripts enabled', 1;
RECONFIGURE WITH OVERRIDE;

Дополнительные сведения о том, как эта команда влияет на ресурсы управляемого экземпляра SQL, см. в разделе "Управление ресурсами".

Включение служб машинного обучения в группе отработки отказа

В группе отработки отказа системные базы данных не реплицируются во вторичный экземпляр; дополнительные сведения см. в разделе Ограничения групп отработки отказа.

Если управляемый экземпляр SQL, который вы используете, является частью группы обеспечения бесперебойной работы, сделайте следующее:

  • Выполните команды sp_configure и RECONFIGURE на каждом экземпляре группы отказоустойчивости, чтобы включить службы машинного обучения.

  • Установите библиотеки R/Python в пользовательской базе данных, а не в master базе данных.

Дальнейшие шаги