Ескертпе
Бұл бетке кіру үшін қатынас шегін айқындау қажет. Жүйеге кіруді немесе каталогтарды өзгертуді байқап көруге болады.
Бұл бетке кіру үшін қатынас шегін айқындау қажет. Каталогтарды өзгертуді байқап көруге болады.
Применимо к: SQL Server 2016 (13.x) и более поздним версиям
Azure SQL Managed Instance
В этой серии руководств для программистов SQL вы узнаете об интеграции R в Службах машинного обучения SQL Server или в кластерах больших данных.
В этой серии (из пяти частей) руководств для программистов SQL вы узнаете об интеграции R в Службах машинного обучения SQL Server.
В этой серии из пяти руководств для программистов SQL вы узнаете об интеграции R в Службы R для SQL Server 2016.
В этой серии (из пяти частей) руководств для программистов SQL вы узнаете об интеграции R в службы машинного обучения в управляемом экземпляре SQL Azure.
Вы создадите и развернете решение для машинного обучения на базе R, используя образец базы данных на SQL Server. Вы будете использовать T-SQL, Visual Studio Code или SQL Server Management Studio, а также экземпляр ядра СУБД с поддержкой машинного обучения SQL и языка R
В этой серии руководств описываются функции R, используемые в рабочем процессе моделирования данных. Серия содержит следующие этапы: исследование данных, сборка и обучение модели двоичной классификации и развертывание модели. Вы будете использовать образец данных Комиссии по такси и лимузинам Нью‑Йорка. Модель, которую вы создадите, будет предсказывать, приведет ли поездка к чаевым, в зависимости от времени суток, пройденного расстояния и места посадки.
В первой части этой серии вы установите необходимые компоненты и восстановите образец базы данных. Во второй и третьей частях вы создадите сценарии R для подготовки данных и обучения модели машинного обучения. Затем в четвертой и пятой частях вы запустите эти скрипты R в базе данных с помощью хранимых процедур T-SQL.
Работая с этой статьей, вы узнаете о следующем.
- Установка необходимых компонентов
- Восстановление примера базы данных
Во второй части вы ознакомитесь с образцом данных и создадите несколько графиков.
В третьей части вы узнаете, как создавать функции из необработанных данных с помощью функции Transact-SQL. Затем вы вызовите эту функцию из хранимой процедуры, чтобы создать таблицу, содержащую значения характеристик.
В четвертой части вы научитесь загружать модули и вызывать необходимые функции для создания и обучения модели с помощью хранимой процедуры SQL Server.
Из пятой части вы узнаете, как перевести в рабочее состояние модели, обученные и сохранённые в четвертой части.
Примечание.
Это руководство доступно как для языка R, так и для Python. Для версии на Python см. Руководство по Python: прогнозирование тарифов на такси в Нью-Йорке с помощью двоичной классификации.
Предварительные требования
- Установите SQL Server 2016 R Services
- Начиная с SQL Server 2019, механизм изоляции требует предоставления соответствующих разрешений каталогу, в котором хранится файл графика. Дополнительные сведения о настройке этих разрешений смотрите в разделе "Разрешения файлов" в SQL Server 2019 на Windows: изменения изоляции для служб машинного обучения.
- Восстановление демонстрационной базы данных нью-йоркского такси
Все задачи можно выполнить с помощью Transact-SQL хранимых процедур в Visual Studio Code или Management Studio.
В этом руководстве предполагается, что вы уже знакомы с основными операциями с базой данных, такими как создание баз данных и таблиц, импорт данных и написание запросов SQL. Знание языка R не требуется. Поэтому весь код на R предоставляется в готовом виде.
Основы для разработчиков SQL
Процесс создания решения машинного обучения — это сложная задача, для которой может потребоваться использование нескольких средств, а также координация работы экспертов в различных областях, и которая состоит из нескольких этапов:
- получение и очистка данных;
- изучение данных и выявление характеристик, полезных для моделирования;
- обучение и настройка модели;
- развертывание в рабочей среде.
Разработку и тестирование написанного кода лучше выполнять в выделенной среде разработки R. Однако после полного тестирования скрипта его можно легко развернуть в SQL Server с помощью Transact-SQL хранимых процедур в знакомой среде Visual Studio Code или Management Studio. Упаковка внешнего кода в хранимые процедуры является основным механизмом для эксплуатации кода в SQL Server.
Сохранив модель в базе данных, вы сможете вызвать ее для получения прогнозов из Transact-SQL с помощью хранимых процедур.
Если вы программист SQL, который малознаком с R, или разработчиком на R, малознакомым с SQL, в этой серии руководств можно увидеть типичный рабочий процесс для реализации аналитики в базе данных с помощью R и SQL Server.
Следующие шаги
В этой статье вы:
- Установленные предварительные условия
- Восстановлена демонстрационная база данных