Поделиться через


Ресурсы, развернутые с помощью кластеров больших данных SQL Server

Область применения: SQL Server 2019 (15.x)

Это важно

Надстройка "Кластеры больших данных Microsoft SQL Server 2019" будет прекращена. Поддержка кластеров больших данных SQL Server 2019 завершится 28 февраля 2025 г. Все существующие пользователи SQL Server 2019 с Software Assurance будут полностью поддерживаться на этой платформе, а программное обеспечение будет продолжать поддерживаться с помощью накопительных обновлений для SQL Server до этого времени. Для получения дополнительной информации см. запись блога об объявлении и параметры работы с большими данными на платформе Microsoft SQL Server.

В этой статье описываются ресурсы, развернутые кластером больших данных SQL Server.

Кластер больших данных развертывает pods на основе профиля развертывания. Дополнительные сведения см. в конфигурациях по умолчанию.

В этой статье описываются модули, развернутые с помощью профиля aks-dev-test-ha и содержащие пул Spark. Запросите Kubernetes, чтобы просмотреть поды, развернутые в вашем кластере. В следующем примере возвращается список pod в определённом неймспейсе.

kubectl get pods -n <namespace>

Замените <namespace> именем кластера больших данных.

Дополнительные сведения см. в статье "Развертывание кластеров больших данных SQL Server в Kubernetes".

На следующей схеме показаны компоненты, развернутые в кластере больших данных:

схема больших данных-кластеров

Сведения об архитектуре см. в разделе "Общие сведения о кластерах больших данных SQL Server".

Развернутые модули pod

В следующей таблице перечислены модули pod, развернутые в кластере больших данных.

Имя Площадь
control-<nnnn> Элемент управления
controldb-<#> Элемент управления
controlwd-<nnnn> Элемент управления
logsdb-<#> Элемент управления
logsui-<nnnn> Элемент управления
metricsdb-<#> Элемент управления
metricsdc-<nnnn> Элемент управления
metricsui-<nnnn> Элемент управления
mgmtproxy-<nnnn> Элемент управления
zookeeper-<#> Элемент управления
dns-<nnnn> Элемент управления
master-<#n> Главный экземпляр
operator-<nnnn> Главный экземпляр
compute-<#n>-<#m> Пул вычислений
data-<#>-<#> Пул данных
storage-<#>-<#> Пул носителей
nmnode-<#>-<#> Пул носителей
sparkhead-<#> Пул носителей
appproxy-<#m> Пул приложений
gateway-<#> Служба шлюза

Не все pods входят в каждый кластер больших данных. Развертывания с высокой доступностью или интеграцией с Active Directory включают определенные поды.

Специфические высокодоступные модули.

  • operator-<nnnn>
  • zookeeper-<#>

Специфичные поды Active Directory:

  • dns-<nnnn>

В следующих разделах описываются поды и перечисляются контейнеры в каждом поде.

Контроль

Модули pod управления предоставляют службу управления.

Имя pod Численность Тип контроллера Kubernetes Контейнеры
control-# 1 Реплики - controller

- security-support

- fluentbit
controldb 1 StatefulSet - mssql-server

- fluentbit
controlwd 1 Реплики - controlwatchdog
logsdb-# 1 StatefulSet - elasticsearch
logsui 1 Реплики - kibana
metricsdb-# 1 StatefulSet - influxdb
metricsdc 1 на узел Kubernetes. DaemonSet - telegraf
metricsui-nnnn 1 Реплики - grafana
mgmtproxy-nnnn 1 Реплики - service-proxy

- fluentbit
dns-nnnn 0 или 1 для интеграции Active Directory Реплики - dns

- fluentbit

Основной экземпляр

master-<#n> — главный экземпляр SQL Server.

  • Управляет пулом данных с помощью DDL
  • Управление данными в пуле данных с помощью DML
  • Переносит выполнение аналитических запросов на пул данных
Имя pod Численность Тип контроллера Kubernetes Контейнеры
master-<#n> 1 или более для обеспечения высокой доступности. StatefulSet - mssql-server

- fluentbit

- collectd

- mssql-ha-supervisor *
operator* 0 или 1 для обеспечения высокой доступности Реплики - mssql-ha-operator

* Только развертывания с высоким уровнем доступности. Оператор реализует и регистрирует пользовательское определение ресурсов для SQL Server и ресурсов группы доступности. При развертывании оператора он регистрируется в качестве прослушивателя уведомлений о ресурсах SQL Server, развертываемых в кластере Kubernetes. mssql-ha-supervisor поддерживает группу доступности.

Каждый master модуль pod содержит один экземпляр SQL Server. Развертывание с высоким уровнем доступности включает 3 модуля pod. Каждый модуль pod включает экземпляр SQL Server с базами данных в группе доступности AlwaysOn SQL Server.

Включите дополнительные pod во время развертывания в зависимости от рабочей нагрузки.

Пул вычислений

Пул вычислений предоставляет экземпляр SQL Server для вычислений.

Имя pod Численность Тип контроллера Kubernetes Контейнеры
compute-<#n>-<#m> 1 или более. StatefulSet - mssql-server

- fluentbit

- collectd
  • #n определяет пул вычислений.
  • #m определяет идентификатор экземпляра в пуле.

Экземпляры SQL Server пула вычислений не имеют состояния. Им требуется только место для хранения tempdb.

Включите дополнительные pod во время развертывания в зависимости от рабочей нагрузки.

Пул данных

Пул данных предоставляет экземпляры SQL Server для хранения и вычислений.

Имя pod Численность Тип контроллера Kubernetes Контейнеры
data-<#n>-<#m> 0 или более StatefulSet - mssql-server

- fluentbit

- collectd
  • #n определяет пул данных.
  • #m определяет идентификатор экземпляра в пуле.

Добавьте дополнительные контейнеры при развертывании, в зависимости от рабочей нагрузки.

Пул хранения

Пул хранения данных поддерживает прием данных через Spark, хранение в HDFS, доступ к данным через конечные точки HDFS и SQL Server.

Имя pod Численность Тип контроллера Kubernetes Контейнеры
storage-0-# 1 или более. Добавьте дополнительные контейнеры при развертывании, в зависимости от рабочей нагрузки. StatefulSet - hadoop

- mssql-server

- fluentbit

nmnode-0-# 1 или более для обеспечения высокой доступности StatefulSet - hadoop

- fluentbit
sparkehead-# 1 или более для обеспечения высокой доступности StatefulSet - hadoop-yarn-jobhistory

- hadoop-livy-sparkhistory

- hadoop-hivemetastore

-- fluentbit
zookeeper 0 или 3 для обеспечения высокой доступности. StatefulSet - zookeeper

- fluentbit

Пул приложений

Пул приложений включается в некоторые профили конфигурации тестов. Пул приложений размещает прокси-серверы службы приложений, которые определяются при развертывании приложений для кластеров больших данных.

appproxy — это веб-API, который располагается перед пулом приложений. Он проходит проверку подлинности пользователей, а затем направляет запросы в приложения.

Имя pod Тип контроллера Kubernetes Контейнеры
appproxy Реплики - app-service-proxy

- fluentbit

Дополнительные сведения см. в разделе "Знакомство с развертыванием приложений в кластере больших данных".

Добавьте дополнительные контейнеры при развертывании, в зависимости от рабочей нагрузки.

Служба шлюза

Службы шлюза предоставляют шлюз Knox для Spark, HDFS, Yarn, пользовательского интерфейса Yarn и пользовательского интерфейса Spark.

Имя pod Тип контроллера Kubernetes Контейнеры
gateway-<#> StatefulSet - knox

- fluentbit

Поддерживается только один шлюз.

Ссылки на контейнеры с открытым кодом

Дополнительные сведения о конкретных проектах и версиях с открытым исходным кодом см. в справочнике по программному обеспечению с открытым кодом.

Дальнейшие шаги

Дополнительные сведения о кластерах больших данных SQL Server см. в следующих ресурсах: