Рабочая нагрузка для обработки и анализа данных в Visual Studio

Рабочая нагрузка по обработке и анализу данных в Visual Studio объединяет несколько языков и их соответствующих дистрибутивов среды выполнения:

Python — это основной язык сценариев, используемый для обработки и анализа данных. Python легко изучаем и поддерживается богатой экосистемой пакетов. Эти пакеты рассматривают широкий спектр сценариев, таких как получение данных, очистка, обучение модели, развертывание и создание графиков. F# также является мощным функциональным языком .NET, применимым для различных задач обработки данных.

Снимок экрана: Visual Studio с проектами кода R, Python и F#.

Установка рабочей нагрузки

Рабочая нагрузка для обработки и анализа данных доступна в установщике Visual Studio в разделе Рабочие нагрузки>Другие наборы инструментов:

Снимок экрана: выбор рабочей нагрузки приложений для обработки и анализа данных в Установщике Visual Studio.

По умолчанию рабочая нагрузка устанавливает следующие параметры, которые можно изменить в разделе сводки для рабочей нагрузки в Установщике Visual Studio:

  • Поддержка языка рабочего стола F#
  • Питон:
    • Поддержка языка Python
    • Поддержка веб-сайтов Python
    • Собственные средства разработки Python

Интеграция SQL Server

SQL Server поддерживает использование Python для расширенной аналитики непосредственно внутри SQL Server. Поддержка Python доступна в SQL Server 2017 CTP 2.0 и более поздних версий.

Вы пользуетесь следующими преимуществами от запуска вашего кода там, где уже находятся ваши данные:

  • Устранение перемещения данных: вместо перемещения данных из базы данных в приложение или модель можно создавать приложения в базе данных. Эта возможность устраняет барьеры безопасности, соответствия, управления, целостности и ряда аналогичных проблем, связанных с перемещением больших объемов данных. Вы также можете использовать наборы данных, которые не вписываются в память клиентского компьютера.

  • Простое развертывание. После подготовки модели развертывание в рабочей среде является простым вопросом внедрения модели в скрипт T-SQL. Затем любое клиентское приложение SQL, написанное на любом языке, может воспользоваться моделями и аналитикой с помощью вызова хранимой процедуры. Не требуется никаких конкретных интеграции языка.

  • Производительность и масштабирование корпоративного уровня: вы можете использовать расширенные возможности SQL Server, такие как таблица в памяти и индексы хранилища столбцов с высокопроизводительными масштабируемыми API в пакетах RevoScale. Устранение перемещения данных также означает, что вы избегаете ограничений памяти клиента по мере роста или повышения производительности приложения.

  • Расширенная расширяемость. Вы можете установить и запустить любой из последних пакетов с открытым исходным кодом в SQL Server для создания приложений глубокого обучения и ИИ на огромных объемах данных в SQL Server. Установка пакета в SQL Server выполняется так же просто, как установка пакета на локальном компьютере.

  • Широкая доступность без дополнительных затрат: интеграция языков доступна во всех выпусках SQL Server 2017 и более поздних версий, включая выпуск Express.

Установка интеграции SQL Server

Чтобы воспользоваться всеми преимуществами интеграции SQL Server, используйте Установщик Visual Studio для установки рабочих нагрузок>других инструментов>хранения и обработки данных. Выберите параметр SQL Server Data Tools , чтобы включить IntelliSense SQL, выделение синтаксиса и развертывание:

Снимок экрана, на котором показано, как выбрать рабочую нагрузку хранилища данных и обработки в установщике Visual Studio.

Дополнительные сведения см. в статье Python в SQL Server 2017: расширенное машинное обучение в базе данных (блог).

Другие службы и пакеты SDK

Помимо рабочих нагрузок приложений для обработки и анализа данных, записные книжки в Visual Studio Code и пакете SDK Azure для Python также полезны для обработки и анализа данных.

Пакет SDK Azure для Python упрощает использование служб Microsoft Azure и управление ими из приложений, работающих в Windows, Mac и Linux. Дополнительные сведения см. в статье Azure для разработчиков Python.

Расширение Jupyter можно объединить с Jupyter notebooks в Visual Studio Code для поддержки разработки на Jupyter и расширения вашего проекта с помощью дополнительных языковых расширений. Служба включает примеры записных книжек в Python, R и F#, чтобы приступить к работе. Для получения дополнительной информации обратитесь к опыту использования ноутбуков от компаний Microsoft и GitHub.

Снимок экрана, показывающий использование записных книжек Jupyter в вводном примере с R.