Установка средств для работы с большими данными SQL Server 2019

Область применения: SQL Server 2019 (15.x)

Важно!

Поддержка надстройки "Кластеры больших данных" Microsoft SQL Server 2019 будет прекращена. Мы прекратим поддержку Кластеров больших данных SQL Server 2019 28 февраля 2025 г. Все существующие пользователи SQL Server 2019 с Software Assurance будут полностью поддерживаться на платформе, и программное обеспечение будет продолжать поддерживаться с помощью накопительных обновлений SQL Server до этого времени. Дополнительные сведения см. в записи блога объявлений и в статье о параметрах больших данных на платформе Microsoft SQL Server.

В этой статье описываются клиентские средства, которые необходимо установить для создания, управления и использования кластеров больших данных SQL Server 2019. В следующем разделе приведен список средств и ссылки на инструкции по установке. Перед развертыванием кластера больших данных настройте средства, отмеченные как обязательные в Windows или Linux.

Средства кластеров больших данных

В следующей таблице перечислены общие инструменты кластера больших данных и способы их установки.

Инструмент Обязательно Описание Установка
python да Python — это интерпретируемый объектно-ориентированный высокоуровневый язык программирования с динамической семантикой. Многие части кластеров больших данных для SQL Server используют Python. Установка Python
Azure Data CLI (azdata) да Программа командной строки для установки кластера больших данных и управления им. Установка
kubectl1 да Программа командной строки для мониторинга базового кластера Kubernetes (дополнительные сведения). Windows | Linux
Azure Data Studio да Кроссплатформенный графический инструмент для запроса SQL Server. Установка
Расширение Data Virtualization да Расширение для Azure Data Studio, предоставляющее мастер виртуализации данных. Установка
Azure CLI2 Для AKS Современный интерфейс командной строки для управления службами Azure. Используется с развертываниями кластера больших данных AKS (дополнительные сведения). Установка
mssql-cli Необязательно Современный интерфейс командной строки для запроса SQL Server (дополнительные сведения). Windows | Linux
sqlcmd Для некоторых сценариев Старый интерфейс командной строки для запроса SQL Server (дополнительные сведения). Перед установкой пакета SQLCMD может потребоваться установка драйвера Microsoft ODBC 11 для SQL Server. Windows | Linux
curl3 Для некоторых сценариев Программа командной строки для передачи данных по URL-адресам. Windows | Linux: установите пакет cURL
oc Требуется для развертываний Red Hat OpenShift и Azure Red Hat OpenShift. oc — это интерфейс командной строки (CLI) в Open Shift. Установка CLI

1 Необходимо использовать kubectl версии 1.13 или более поздней. Кроме того, версия kubectl должна отстоять от младшей версии кластера Kubernetes не более чем на единицу. Если вы хотите установить определенную версию в клиенте kubectl, см. статью Установка двоичных файлов kubectl с помощью curl (для запуска curl в Windows 10 м Windows 11 используйте cmd.exe, а не Windows PowerShell).

Совет

Чтобы использовать kubectl с ранее развернутым кластером в службе Azure Kubernetes (AKS), необходимо задать контекст кластера с помощью следующей команды Azure CLI:

az aks get-credentials --name <aks_cluster_name> --resource-group <azure_resource_group_name>

2 Необходимо использовать Azure CLI версии 2.0.4 или более поздней. При необходимости выполните команду az --version, чтобы определить версию.

3 Если вы используете Windows 10 или Windows 11, средство curl уже будет указано в каталоге PATH при запуске из командной строки cmd. Если используются другие версии Windows, скачайте curl по ссылке и поместите его в каталоге PATH.

Какие средства требуются?

В предыдущей таблице представлены все общие средства, используемые с кластерами больших данных. Необходимые инструменты зависят от вашего сценария. Но в целом следующие средства наиболее важны для управления, подключения к кластеру и запросов к нему.

  • Azure Data CLI (azdata)
  • kubectl
  • Azure Data Studio
  • Расширение Data Virtualization

Остальные инструменты требуются только в отдельных сценариях. Azure CLI можно использовать для управления службами Azure, связанными с развертываниями AKS. mssql-cli — это необязательное, но полезное средство, которое позволяет подключаться к главному экземпляру SQL Server в кластере и запускать запросы из командной строки. Если вы планируете установить демонстрационные данные с помощью скрипта GitHub, вам потребуются sqlcmd и curl.

Установка Python в автономном режиме

  1. На компьютере с доступом в Интернет скачайте один из следующих сжатых файлов с Python.

    Операционная система Скачивание
    Windows https://go.microsoft.com/fwlink/?linkid=2074021
    Linux https://go.microsoft.com/fwlink/?linkid=2065975
    OSX https://go.microsoft.com/fwlink/?linkid=2065976
  2. Скопируйте сжатый файл на целевой компьютер и извлеките его в выбранную папку.

  3. Только для Windows: запустите installLocalPythonPackages.bat из этой папки и передайте полный путь к ней в виде параметра.

    installLocalPythonPackages.bat "C:\python-3.6.6-win-x64-0.0.1-offline\0.0.1"
    

Скачивание и установка Azure Data Studio

Azure Data Studio предоставляет функциональные возможности и компоненты специально для работы с кластерами больших данных SQL Server.

Получите последнюю версию Azure Data Studio.

Подробнее см. в заметках о выпуске.

Дальнейшие действия

После настройки всех средств разверните кластер больших данных SQL Server 2019 в Kubernetes в облаке или в локальной среде. Дополнительные сведения см. в следующих статьях по развертыванию:

Дополнительные сведения о кластерах больших данных см. в разделе "Общие сведения о кластерах больших данных SQL Server 2019".