Поделиться через


Руководство по Python. Прогнозирование аренды лыж с помощью линейной регрессии с помощью машинного обучения SQL

Область применения: SQL Server 2017 (14.x) и более поздних версий Управляемый экземпляр SQL Azure

В этом цикле учебников, состоящем из четырех частей, вы будете использовать Python и линейную регрессию в Службах машинного обучения SQL Server или Кластерах больших данных SQL Server 2019 для прогнозирования количества прокатов лыж. В этом учебнике используется записная книжка Python в Azure Data Studio.

В этом учебнике, состоящем из четырех частей, вы будете использовать Python и линейную регрессию в Службах машинного обучения SQL Server для прогнозирования количества прокатов лыж. В этом учебнике используется записная книжка Python в Azure Data Studio.

В этом учебнике, состоящем из четырех частей, вы будете использовать Python и линейную регрессию в Службах машинного обучения Управляемого экземпляра SQL Azure для прогнозирования количества прокатов лыж. В этом учебнике используется записная книжка Python в Azure Data Studio.

Представьте, что вы владеете прокатом лыж и хотите предсказать количество аренды, которые вы будете иметь в будущем. Эта информация поможет вам подготовить запасы, персонал и помещения.

В первой части учебника вы установите необходимые компоненты. Во второй и третьей частях вы создадите сценарии Python в записной книжке для подготовки данных и обучения модели машинного обучения. Затем в третьей части вы запустите эти скрипты Python в базе данных с помощью хранимых процедур T-SQL.

В этой статье вы узнаете, как выполнять следующие задачи.

  • Импорт образца базы данных

Во второй части вы узнаете, как загрузить данные из базы данных в кадр данных Python, а также подготовить данные в Python.

В третьей части вы узнаете, как обучить модель машинного обучения линейной регрессии в Python.

В четвертой части вы узнаете, как сохранить модель в базе данных, а затем создать хранимые процедуры на основе сценариев Python, разработанных во второй и третьей частях. Хранимые процедуры будут запускаться на сервере, чтобы формировать прогнозы на основе новых данных.

Необходимые компоненты

  • Службы SQL Server Машинное обучение — установка служб Машинное обучение см. в руководстве по установке Windows.
  • Управляемый экземпляр SQL Azure Машинное обучение службы . Дополнительные сведения см. в обзоре служб Управляемый экземпляр SQL Azure Машинное обучение.

  • SQL Server Management Studio (SSMS) — используйте SSMS для восстановления образца базы данных до Управляемый экземпляр SQL Azure. Чтобы скачать, см. статью SQL Server Management Studio.

  • Интегрированная среда разработки Python. В этом руководстве используется записная книжка Python в Azure Data Studio. Дополнительные сведения см. в статье Использование записных книжек в Azure Data Studio.

  • Средство sql-запросов. В этом руководстве предполагается, что вы используете Azure Data Studio.

  • Дополнительные пакеты Python. Примеры в этом руководстве используют следующие пакеты Python, которые могут не быть установлены по умолчанию:

    • pandas
    • pyodbc
    • scikit-learn

    Чтобы установить эти пакеты, выполните приведенные ниже действия.

    1. В записной книжке Azure Data Studio выберите Управление пакетами.
    2. В области Управление пакетами выберите вкладку Добавить новые.
    3. Для каждого из следующих пакетов введите имя пакета, нажмите Поиск, а затем — Установить.

    В качестве альтернативы можно открыть командную строку, изменить путь установки для версии Python, используемой в Azure Data Studio (например, cd %LocalAppData%\Programs\Python\Python37-32), а затем выполнить pip install для каждого пакета.

Восстановление примера базы данных

Пример базы данных, используемой в этом руководстве, был сохранен в файл резервной .bak копии базы данных для скачивания и использования.

Примечание.

Если вы используете Службы машинного обучения в кластерах больших данных SQL Server 2019, ознакомьтесь со статьей Восстановление базы данных на главном экземпляре кластера больших данных.

  1. Скачайте файл TutorialDB.bak.

  2. Следуйте инструкциям из раздела Восстановление базы данных из файла резервной копии в Azure Data Studio, используя следующие сведения:

    • Выполните импорт из скачанного файла TutorialDB.bak.
    • Присвойте целевой базе данных имя TutorialDB.
  3. Чтобы убедиться, что восстановленная база данных существует, выполните запрос к таблице dbo.rental_data:

    USE TutorialDB;
    SELECT * FROM [dbo].[rental_data];
    
  1. Скачайте файл TutorialDB.bak.

  2. Следуйте инструкциям в разделе Восстановление базы данных в Управляемый экземпляр SQL Azure в SQL Server Management Studio, используя следующие сведения.

    • Выполните импорт из скачанного файла TutorialDB.bak.
    • Присвойте целевой базе данных имя TutorialDB.
  3. Чтобы убедиться, что восстановленная база данных существует, выполните запрос к таблице dbo.rental_data:

    USE TutorialDB;
    SELECT * FROM [dbo].[rental_data];
    

Очистка ресурсов

Если вы не собираетесь продолжать работу с этим учебником, удалите базу данных TutorialDB.

Следующий шаг

В первой части этого учебника вы выполнили следующие действия:

  • Установка необходимых компонентов
  • Импорт образца базы данных

Чтобы подготовить данные из базы данных TutorialDB, перейдите ко второй части этого учебника: