Службы машинного обучения в управляемом экземпляре SQL Azure

Службы машинного обучения — это функция Управляемого экземпляра SQL Azure, которая обеспечивает машинное обучение в базе данных, поддерживающее скрипты Python и R. Эта функция включает в себя пакеты Python и R Майкрософт для высокопроизводительной прогнозной аналитики и машинного обучения. Реляционные данные можно использовать в сценариях с помощью хранимых процедур, скрипта T-SQL, содержащего инструкции Python или R, или кода Python или R, содержащего T-SQL.

Что такое Службы машинного обучения?

Службы машинного обучения в Управляемом экземпляре SQL Azure можно использовать для запуска скриптов R или Python в базе данных. С их помощью можно подготавливать и очищать данные, выполнять проектирование признаков, а также обучать, оценивать и развертывать модели машинного обучения в базе данных. Этот компонент выполняет скрипты там, где хранятся данные, и устраняет необходимость перемещения данных по сети на другой сервер.

Используйте Службы машинного обучения с поддержкой R/Python в Управляемом экземпляре SQL Azure:

  • Выполнение скриптов R и Python для подготовки данных и обработки данных общего назначения. Теперь вы можете перенести сценарии R или Python в Управляемый экземпляр SQL Azure, где хранятся ваши данные, вместо того, чтобы перемещать данные на другой сервер для выполнения скриптов R и Python. Вы можете избежать перемещения данных и сопутствующих проблем, связанных с задержкой, безопасностью и соответствием.

  • Обучение моделей машинного обучения в базе данных. Вы можете обучить модели с помощью любых алгоритмов с открытым кодом. Вы можете легко масштабировать обучение по всему набору данных, не полагаясь на образцы наборов данных, извлеченных из базы.

  • Развертывание моделей и скриптов в рабочей среде в хранимых процедурах. Скрипты и обученные модели можно просто внедрить в хранимые процедуры T-SQL. Приложения, подключающиеся к Управляемому экземпляру SQL Azure, могут воспользоваться преимуществами прогнозов и средств искусственного интеллекта в этих моделях, просто вызвав хранимую процедуру. Можно также использовать собственную функцию T-SQL PREDICT, чтобы включить модели для быстрой оценки в сценариях оценки в реальном времени с высокой степенью параллелизма.

Базовые распределения Python и R включены в Службы машинного обучения. Вы можете установить и использовать платформы и пакеты с открытым исходным кодом, такие как PyTorch, TensorFlow и scikit-learn, в дополнение к пакетам Microsoft revoscalepy и microsoftml для Python и RevoScaleR, MicrosoftML, OLAP и sqlrutils для R.

Включение Служб машинного обучения

Вы можете включить Службы машинного обучения в Управляемом экземпляре SQL Azure, включив расширяемость с помощью следующих команд SQL (Управляемый экземпляр SQL перезапустится и будет недоступен в течение нескольких секунд):

sp_configure 'external scripts enabled', 1;
RECONFIGURE WITH OVERRIDE;

Дополнительные сведения о влиянии этой команды на ресурсы Управляемого экземпляра SQL см. в разделе Управление ресурсами.

Включение Служб машинного обучения в группе отработки отказа

В группе отработки отказа системные базы данных не реплицируются на дополнительный экземпляр (дополнительные сведения см. в разделе Ограничения групп отработки отказа).

Если Управляемый экземпляр SQL, который вы используете, является частью группы отработки отказа, выполните следующие действия:

  • Выполните команды sp_configure и RECONFIGURE на каждом экземпляре группы отработки отказа, чтобы включить Службы машинного обучения.

  • Установите библиотеки R/Python в пользовательской базе данных, а не в master базе данных.

Следующие шаги