Использование записных книжек Jupyter в Azure Data Studio

Статья
10/18/2023

Область применения: SQL Server 2019 (15.x)

Jupyter Notebook представляет собой веб-приложение с открытым исходным кодом, которое позволяет создавать документы, содержащие код, формулы, визуализации и текстовое описание, и обмениваться этими документами. Использование включает в себя очистку и преобразование данных, числовое моделирование, статистическое моделирование, визуализацию данных и машинное обучение.

Эта статья содержит сведения о создании записной книжки в актуальном выпуске Azure Data Studio и создании собственных записных книжек с помощью разных ядер.

Просмотрите это короткое пятиминутное видео, чтобы ознакомиться с записными книжками в Azure Data Studio.

Создание записной книжки

Создать записную книжку можно разными способами. В каждом случае открывается новый файл с именем Notebook-1.ipynb.

В Azure Data Studio откройте меню Файл и выберите Создать записную книжку.
Щелкните правой кнопкой мыши подключение SQL Server и выберите Создать записную книжку.
Откройте палитру команд (CTRL+SHIFT+P), введите "создать записную книжку" и выберите Создать записную книжку.

Подключение к ядру

Записные книжки Azure Data Studio поддерживают ряд различных ядер, в том числе SQL Server, Python, PySpark и др. Каждое ядро поддерживает разные языки в ячейках кода записной книжки. Например, при подключении к ядру SQL Server можно вводить и выполнять инструкции T-SQL в ячейке кода записной книжки.

Параметр Присоединить к предоставляет контекст для ядра. Например, если вы используете ядро SQL, вы можете подключиться к любому из экземпляров SQL Server. Если вы используете ядро Python3, вы подключаетесь к localhost и можете использовать этот ядро для локальной разработки на Python.

Ядро SQL также можно применять для подключения к экземплярам сервера PostgreSQL. Разработчики PostgreSQL, которым требуется подключить записные книжки к серверу PostgreSQL, должны скачать расширение PostgreSQL в магазине расширений Azure Data Studio и подключиться к серверу PostgreSQL.

Если вы подключены к кластеру больших данных SQL Server 2019, то параметр по умолчанию Присоединить к является конечной точкой этого кластера. Вы можете отправить код Python, Scala и R с использованием вычислительных ресурсов Spark кластера.

Ядро	Description
Ядро SQL	Написание кода SQL, предназначенного для реляционной базы данных.
Ядро PySpark3 и PySpark	Написание кода Python с использованием вычислительных ресурсов Spark из кластера.
Ядро Spark	Написание кода Scala и R с использованием вычислительных ресурсов Spark из кластера.
Ядро Python	Написание кода Python для локальной разработки.

Дополнительные сведения о конкретных ядрах см. в следующих статьях:

Создание и запуск записной книжки SQL Server
Создание и запуск записной книжки Python
Расширение Kqlmagic в Azure Data Studio расширяет возможности ядра Python.

Добавление ячейки кода

Ячейки кода позволяют интерактивно запускать код в записной книжке.

Добавьте новую ячейку кода, щелкнув команду +Ячейка на панели инструментов и выбрав Ячейка кода. Новая ячейка кода добавляется после текущей выбранной ячейки.

Введите код в ячейке для выбранного ядра. Например, если вы используете ядро SQL, в ячейку кода можно ввести команды T-SQL.

Ввод кода с использованием ядра SQL аналогичен редактору SQL-запросов. Ячейка кода поддерживает современные возможности написания кода SQL с использованием встроенных функций, таких как редактор SQL, IntelliSense и встроенные фрагменты кода. Фрагменты кода позволяют формировать правильный синтаксис SQL для создания баз данных, таблиц, представлений, хранимых процедур, а также для обновления существующих объектов базы данных. С помощью фрагментов кода можно быстро создавать копии базы данных для разработки или тестирования, а также генерировать и выполнять сценарии.

Ядро SQL

Добавление текстовой ячейки

Текстовые ячейки позволяют документировать код путем добавления блоков текста Markdown между ячейками кода.

Добавьте новую текстовую ячейку, щелкнув команду +Ячейка на панели инструментов и выбрав Текстовая ячейка.

Ячейка запускается в режиме редактирования, в котором можно ввести текст Markdown. По мере ввода отображается показанный ниже предварительный просмотр.

Ячейка с разметкой Markdown

Щелкните вне текстовой ячейки, чтобы отобразить текст с разметкой Markdown.

Текст Markdown

Если щелкнуть текстовую ячейку еще раз, она перейдет в режим редактирования.

Выполнение ячейки

Чтобы выполнить одну ячейку, щелкните Выполнить ячейку (скругленная черная стрелка) слева от ячейки либо выделите ячейку и нажмите клавишу F5. Можно запустить все ячейки в записной книжке, щелкнув Запустить все на панели инструментов, при этом ячейки запускаются по одной за раз, а при возникновения ошибки в ячейке выполнение останавливается.

Результаты из ячейки отображаются под ней. Для очистки результатов всех выполненных ячеек в записной книжке нажмите кнопку Очистить результаты на панели инструментов.

Сохранение записной книжки

Чтобы сохранить записную книжку, выполните одно из указанных ниже действий.

Нажмите CTRL+S.
В меню Файл выберите команду Сохранить.
В меню Файл выберите команду Сохранить как....
В меню Файл выберите Сохранить все, чтобы сохранить все открытые записные книжки.
В палитре команд введите файл: Сохранить

Записные книжки сохраняются в виде файлов .ipynb.

Доверенные и недоверенные

Записные книжки, открытые в Azure Data Studio, являются доверенными по умолчанию.

Записная книжка, открываемая из другого источника, откроется в недоверенном режиме, после чего ее можно сделать доверенной.

Примеры

В следующих примерах демонстрируется использование разных ядер для выполнения простой команды Hello World. Выберите ядро, введите код примера в ячейку и щелкните Выполнить ячейку.

Pyspark

Приложение Spark

Spark | Язык Scala

Spark Scala

Spark | Язык R

Spark R

Python 3

Локальная разработка на Python

Поделиться через