Ескертпе
Бұл бетке кіру үшін қатынас шегін айқындау қажет. Жүйеге кіруді немесе каталогтарды өзгертуді байқап көруге болады.
Бұл бетке кіру үшін қатынас шегін айқындау қажет. Каталогтарды өзгертуді байқап көруге болады.
Применимо к: SQL Server 2016 (13.x) и более поздних версий
Внимание
Поддержка сервера Машинное обучение (ранее известного как R Server) закончилась 1 июля 2022 года. Дополнительные сведения см. в статье "Что происходит с сервером машинного обучения"?
SQL Server поддерживает установку изолированного сервера R Server или Machine Learning Server, который работает независимо от SQL Server. В зависимости от версии SQL Server изолированный сервер основан на среде R с открытым кодом и, возможно, на среде Python, поверх которых работают высокопроизводительные библиотеки Майкрософт, добавляющие возможности статистической и прогнозной аналитики. Библиотеки также обеспечивают задачи машинного обучения, реализованные как скрипты на R или Python.
В SQL Server 2016 эта функция называется R Server (автономной) и доступна только для R. В SQL Server 2017 он называется сервером машинного обучения (автономным) и включает как R, так и Python.
Примечание.
Как установлено программой установки SQL Server, автономный сервер функционально эквивалентен версиям Microsoft Machine Learning Server без фирменной символики SQL, поддерживая те же пользовательские сценарии, включая удаленное выполнение, эксплуатацию и веб-службы, а также полную коллекцию библиотек R и Python.
Компоненты
SQL Server 2016 поддерживает только язык R. SQL Server 2017 поддерживает R и Python. В приведенной ниже таблице описаны функции каждой версии.
| Компонент | Описание |
|---|---|
| Пакеты R |
RevoScaleR — это основная библиотека для масштабируемого R с функциями для обработки данных, преобразования, визуализации и анализа. MicrosoftML добавляет алгоритмы машинного обучения для создания пользовательских моделей для анализа текста, анализа изображений и анализа тональности. sqlRUtils предоставляет вспомогательные функции для размещения скриптов R в хранимую процедуру T-SQL, регистрации хранимой процедуры в базе данных и выполнения хранимой процедуры из среды разработки R. olapR предназначен для указания MDX-запросов в R. |
| Microsoft R Open (MRO) | Microsoft R Open (отставлено) — это дистрибутив R с открытым исходным кодом Майкрософт. |
| Средства R | Окна консоли и командные строки R являются стандартными средствами в дистрибутиве R. Они находятся в папке \Program files\Microsoft SQL Server\140\R_SERVER\bin\x64. |
| Примеры и скрипты R | Пакеты R и RevoScaleR с открытым кодом включают в себя встроенные наборы данных, позволяющие создавать и запускать скрипты с использованием предварительно установленных данных. Они находятся в папке \Program files\Microsoft SQL Server\140\R_SERVER\library\datasets and \library\RevoScaleR. |
| Пакеты Python |
revoscalepy — это основная библиотека для масштабируемого Python с функциями для обработки данных, преобразования, визуализации и анализа. Microsoftml добавляет алгоритмы машинного обучения для создания пользовательских моделей для анализа текста, анализа изображений и анализа тональности. |
| Средства Python | Встроенная программа командной строки Python полезна для автоматизированного тестирования и других задач. Она находятся в папке \Program files\Microsoft SQL Server\140\PYTHON_SERVER\python.exe. |
| Анаконда | Anaconda — это дистрибутив Python с открытым кодом, включающий в себя ряд важных пакетов. |
| Примеры и скрипты Python | Как и в случае с R, дистрибутив Python включает в себя встроенные наборы данных и скрипты. Данные revoscalepy находятся в папке \Program files\Microsoft SQL Server\140\PYTHON_SERVER\lib\site-packages\revoscalepy\data\sample-data. |
| Предварительно обученные модели на R и Python | Предварительно обученные модели создаются для конкретных вариантов использования и поддерживаются командой специалистов Майкрософт по обработке и анализу данных. Их можно использовать "как есть" для оценки положительной или отрицательной тональности в тексте или для обнаружения признаков на изображениях с использованием предоставляемых вами новых входных данных. Предварительно обученные модели поддерживаются и могут использоваться на изолированном сервере, но их нельзя установить с помощью программы установки SQL Server. Дополнительные сведения см. в статье "Установка предварительно обученных моделей машинного обучения в SQL Server". |
Использование изолированного сервера
Разработчики на R и Python обычно выбирают изолированный сервер, чтобы избежать ограничений памяти и процессорных ресурсов, налагаемых средами R и Python с открытым кодом. Библиотеки R и Python, которые выполняются на изолированном сервере, позволяют загружать и обрабатывать большие объемы данных на нескольких ядрах и объединять результаты в единый выходной объект. Высокопроизводительные функции обеспечивают как масштабирование, так и максимальную эффективность. Они предоставляют возможности прогнозной аналитики, статистического моделирования, визуализации данных, а также алгоритмы машинного обучения в рамках коммерческого серверного продукта, разработанного и поддерживаемого корпорацией Майкрософт.
В качестве независимого сервера, отделенного от SQL Server, среда R и Python настраивается, защищена и доступна с помощью базовой операционной системы и стандартных средств, предоставляемых на отдельном сервере, не являющимся SQL Server. Встроенная поддержка реляционных данных SQL Server отсутствует. Если нужно использовать данные SQL Server, можно создать объекты и подключения к источникам данных так же, как из любого клиента.
Как дополнение SQL Server, изолированный сервер также полезен в качестве эффективной среды разработки, если требуются как локальные, так и удаленные вычисления. Пакеты R и Python на автономном сервере совпадают с теми, которые предоставляются при установке ядра СУБД, что позволяет переносить код и переключение контекста вычислений.
Как приступить к работе
Начните с установки, добавьте двоичные файлы в свое любимое средство разработки и напишите свой первый скрипт.
Шаг 1. Установка программного обеспечения
Установите одну из следующих версий:
- SQL Server 2017 Machine Learning Server (автономный)
- SQL Server 2016 R Server (автономный) — только R
Шаг 2. Настройка средства разработки
На изолированном сервере часто работают локально с использованием среды разработки, установленной на том же компьютере.
Шаг 3. Создание первого скрипта
Напишите скрипт R или Python, используя функции из RevoScaleR и revoscalepy, а также алгоритмы машинного обучения.
Изучите R и RevoScaleR в 25 функциях: начните с базовых команд R, а затем перейдите к распространяемым аналитическим функциям RevoScaleR, которые обеспечивают высокую производительность и масштабирование решений R. Она содержит параллелизуемые версии многих популярных пакетов моделирования для R, например кластеризацию методом К-средних, деревья и леса принятия решений, а также средства для работы с данными.
Краткое руководство. Пример двоичной классификации с пакетом Microsoftml Python: создание модели двоичной классификации с помощью функций из microsoftml и известного набора данных рака молочной железы.
Выберите оптимальный язык для задачи. R лучше всего подходит для статистических вычислений, проведение которых с помощью SQL может вызывать трудности. Для операций на основе набора данных используйте возможности SQL Server для достижения максимальной производительности. Для очень быстрых вычислений на основе столбцов используйте выполняющееся в памяти ядро СУБД.
Шаг 4. Эксплуатация решения
Автономные серверы могут использовать функциональные возможности управления сервера Microsoft Machine Learning Server, который не имеет маркировки SQL. Настройка изолированного сервера для ввода в эксплуатацию дает следующие преимущества: развертывание и размещение кода как веб-служб, проведение диагностики и проверка емкости веб-служб.
Шаг 5. Обслуживание сервера
Для SQL Server регулярно выпускаются накопительные пакеты обновления. Их применение повышает безопасность и расширяет функциональные возможности существующей установки.
Описания новых или измененных функций можно найти в статье "Загрузки CAB" и в статьях о версиях сборки для SQL Server 2016, SQL Server 2017 и SQL Server 2019.
Дополнительные сведения о применении обновлений к существующему экземпляру см. в инструкциях по установке.