Отправка заданий Spark на Кластеры больших данных SQL Server в Azure Data Studio

Область применения: SQL Server 2019 (15.x)

Важно!

Поддержка надстройки "Кластеры больших данных" Microsoft SQL Server 2019 будет прекращена. Мы прекратим поддержку Кластеров больших данных SQL Server 2019 28 февраля 2025 г. Все существующие пользователи SQL Server 2019 с Software Assurance будут полностью поддерживаться на платформе, а программное обеспечение будет продолжать поддерживаться через SQL Server накопительных обновлений до этого времени. Дополнительные сведения см. в записи блога объявлений и в статье о параметрах больших данных на платформе Microsoft SQL Server.

Одним из основных сценариев для кластеров больших данных является возможность отправки заданий Spark для SQL Server. Функция отправки заданий Spark позволяет отправлять локальные файлы JAR или PY со ссылками на кластер больших данных SQL Server 2019. Она также позволяет выполнять файлы JAR или PY, которые уже находятся в файловой системе HDFS.

Предварительные требования

Открытие диалогового окна отправки заданий Spark

Диалоговое окно отправки заданий Spark можно открыть несколькими способами. К ним относятся панель мониторинга, контекстное меню в обозревателе объектов и палитра команд.

  • Чтобы открыть диалоговое окно отправки заданий Spark, щелкните Создать задание Spark на панели мониторинга.

    Открытие меню отправки посредством щелчка на панели мониторинга

  • Либо щелкните правой кнопкой мыши кластер в обозревателе объектов и выберите пункт Отправить задание Spark в контекстном меню.

    Открытие меню отправки из контекстного меню файла

  • Чтобы открыть диалоговое окно отправки заданий Spark с предварительно заполненными полями JAR/PY, щелкните правой кнопкой мыши файл JAR/PY в обозревателе объектов и выберите пункт Отправить задание Spark в контекстном меню.

    Открытие меню отправки из контекстного меню кластера

  • Используйте элемент Отправить задание Spark из палитры команд, нажав клавиши CTRL+SHIFT+P (в Windows) и CMD+SHIFT+P (в Mac).

    Палитра команд меню отправки в Windows

    Открытие меню отправки из палитры команд в Mac

Отправка задания Spark

Диалоговое окно отправки заданий Spark отображается в указанном ниже виде. Заполните имя задания, путь к файлу JAR/PY, основной класс и другие поля. Источником файла JAR/PY может быть локальная файловая система или HDFS. Если задание Spark содержит ссылки на файлы JAR, PY или другие, перейдите на вкладку Дополнительно и введите соответствующие пути к файлам. Нажмите кнопку Отправить, чтобы отправить задание Spark.

Диалоговое окно создания задания Spark

Диалоговое окно

Мониторинг отправки задания Spark

После отправки задания Spark сведения о состоянии его отправки и выполнения отображаются в журнале задач слева. Сведения о ходе выполнения и журналах также отображаются в окне Вывод внизу.

  • По мере выполнения задания Spark панель Журнал задач и окно Вывод обновляются.

    Мониторинг выполняющегося задания Spark

  • После успешного завершения задания Spark в окне Вывод отображаются ссылки пользовательского интерфейса Spark и Yarn. Щелкните эти ссылки для получения дополнительных сведений.

    Ссылка на задание Spark в выходных данных

Дальнейшие действия

Дополнительные сведения о кластере больших данных SQL Server и связанных сценариях см. в статье Общие сведения о Кластеры больших данных SQL Server.