Ресурсы, развернутые с помощью кластеров больших данных SQL Server

2021-02-11

Область применения: SQL Server 2019 (15.x)

Это важно

Надстройка "Кластеры больших данных Microsoft SQL Server 2019" будет прекращена. Поддержка кластеров больших данных SQL Server 2019 завершится 28 февраля 2025 г. Все существующие пользователи SQL Server 2019 с Software Assurance будут полностью поддерживаться на этой платформе, а программное обеспечение будет продолжать поддерживаться с помощью накопительных обновлений для SQL Server до этого времени. Для получения дополнительной информации см. запись блога об объявлении и параметры работы с большими данными на платформе Microsoft SQL Server.

В этой статье описываются ресурсы, развернутые кластером больших данных SQL Server.

Кластер больших данных развертывает pods на основе профиля развертывания. Дополнительные сведения см. в конфигурациях по умолчанию.

В этой статье описываются модули, развернутые с помощью профиля aks-dev-test-ha и содержащие пул Spark. Запросите Kubernetes, чтобы просмотреть поды, развернутые в вашем кластере. В следующем примере возвращается список pod в определённом неймспейсе.

kubectl get pods -n <namespace>

Замените <namespace> именем кластера больших данных.

Дополнительные сведения см. в статье "Развертывание кластеров больших данных SQL Server в Kubernetes".

На следующей схеме показаны компоненты, развернутые в кластере больших данных:

схема больших данных-кластеров

Сведения об архитектуре см. в разделе "Общие сведения о кластерах больших данных SQL Server".

Развернутые модули pod

В следующей таблице перечислены модули pod, развернутые в кластере больших данных.

Имя	Площадь
`control-<nnnn>`	Элемент управления
`controldb-<#>`	Элемент управления
`controlwd-<nnnn>`	Элемент управления
`logsdb-<#>`	Элемент управления
`logsui-<nnnn>`	Элемент управления
`metricsdb-<#>`	Элемент управления
`metricsdc-<nnnn>`	Элемент управления
`metricsui-<nnnn>`	Элемент управления
`mgmtproxy-<nnnn>`	Элемент управления
`zookeeper-<#>`	Элемент управления
`dns-<nnnn>`	Элемент управления
`master-<#n>`	Главный экземпляр
`operator-<nnnn>`	Главный экземпляр
`compute-<#n>-<#m>`	Пул вычислений
`data-<#>-<#>`	Пул данных
`storage-<#>-<#>`	Пул носителей
`nmnode-<#>-<#>`	Пул носителей
`sparkhead-<#>`	Пул носителей
`appproxy-<#m>`	Пул приложений
`gateway-<#>`	Служба шлюза

Не все pods входят в каждый кластер больших данных. Развертывания с высокой доступностью или интеграцией с Active Directory включают определенные поды.

Специфические высокодоступные модули.

operator-<nnnn>
zookeeper-<#>

Специфичные поды Active Directory:

dns-<nnnn>

В следующих разделах описываются поды и перечисляются контейнеры в каждом поде.

Контроль

Модули pod управления предоставляют службу управления.

Имя pod	Численность	Тип контроллера Kubernetes	Контейнеры
`control-#`	1	Реплики	- `controller` - `security-support` - `fluentbit`
`controldb`	1	StatefulSet	- `mssql-server` - `fluentbit`
`controlwd`	1	Реплики	- `controlwatchdog`
`logsdb-#`	1	StatefulSet	- `elasticsearch`
`logsui`	1	Реплики	- `kibana`
`metricsdb-#`	1	StatefulSet	- `influxdb`
`metricsdc`	1 на узел Kubernetes.	DaemonSet	- `telegraf`
`metricsui-nnnn`	1	Реплики	- `grafana`
`mgmtproxy-nnnn`	1	Реплики	- `service-proxy` - `fluentbit`
`dns-nnnn`	0 или 1 для интеграции Active Directory	Реплики	- `dns` - `fluentbit`

Основной экземпляр

master-<#n> — главный экземпляр SQL Server.

Управляет пулом данных с помощью DDL
Управление данными в пуле данных с помощью DML
Переносит выполнение аналитических запросов на пул данных

Имя pod	Численность	Тип контроллера Kubernetes	Контейнеры
`master-<#n>`	1 или более для обеспечения высокой доступности.	StatefulSet	- `mssql-server` - `fluentbit` - `collectd` - `mssql-ha-supervisor` ^*
`operator`^*	0 или 1 для обеспечения высокой доступности	Реплики	- `mssql-ha-operator`

^* Только развертывания с высоким уровнем доступности. Оператор реализует и регистрирует пользовательское определение ресурсов для SQL Server и ресурсов группы доступности. При развертывании оператора он регистрируется в качестве прослушивателя уведомлений о ресурсах SQL Server, развертываемых в кластере Kubernetes. mssql-ha-supervisor поддерживает группу доступности.

Каждый master модуль pod содержит один экземпляр SQL Server. Развертывание с высоким уровнем доступности включает 3 модуля pod. Каждый модуль pod включает экземпляр SQL Server с базами данных в группе доступности AlwaysOn SQL Server.

Включите дополнительные pod во время развертывания в зависимости от рабочей нагрузки.

Пул вычислений

Пул вычислений предоставляет экземпляр SQL Server для вычислений.

Имя pod	Численность	Тип контроллера Kubernetes	Контейнеры
`compute-<#n>-<#m>`	1 или более.	StatefulSet	- `mssql-server` - `fluentbit` - `collectd`

#n определяет пул вычислений.
#m определяет идентификатор экземпляра в пуле.

Экземпляры SQL Server пула вычислений не имеют состояния. Им требуется только место для хранения tempdb.

Включите дополнительные pod во время развертывания в зависимости от рабочей нагрузки.

Пул данных

Пул данных предоставляет экземпляры SQL Server для хранения и вычислений.

Имя pod	Численность	Тип контроллера Kubernetes	Контейнеры
`data-<#n>-<#m>`	0 или более	StatefulSet	- `mssql-server` - `fluentbit` - `collectd`

#n определяет пул данных.
#m определяет идентификатор экземпляра в пуле.

Добавьте дополнительные контейнеры при развертывании, в зависимости от рабочей нагрузки.

Пул хранения

Пул хранения данных поддерживает прием данных через Spark, хранение в HDFS, доступ к данным через конечные точки HDFS и SQL Server.

Имя pod	Численность	Тип контроллера Kubernetes	Контейнеры
`storage-0-#`	1 или более. Добавьте дополнительные контейнеры при развертывании, в зависимости от рабочей нагрузки.	StatefulSet	- `hadoop` - `mssql-server` - `fluentbit`
`nmnode-0-#`	1 или более для обеспечения высокой доступности	StatefulSet	- `hadoop` - `fluentbit`
`sparkehead-#`	1 или более для обеспечения высокой доступности	StatefulSet	- `hadoop-yarn-jobhistory` - `hadoop-livy-sparkhistory` - `hadoop-hivemetastore` -- `fluentbit`
`zookeeper`	0 или 3 для обеспечения высокой доступности.	StatefulSet	- `zookeeper` - `fluentbit`

Пул приложений

Пул приложений включается в некоторые профили конфигурации тестов. Пул приложений размещает прокси-серверы службы приложений, которые определяются при развертывании приложений для кластеров больших данных.

appproxy — это веб-API, который располагается перед пулом приложений. Он проходит проверку подлинности пользователей, а затем направляет запросы в приложения.

Имя pod	Тип контроллера Kubernetes	Контейнеры
`appproxy`	Реплики	- `app-service-proxy` - `fluentbit`

Дополнительные сведения см. в разделе "Знакомство с развертыванием приложений в кластере больших данных".

Добавьте дополнительные контейнеры при развертывании, в зависимости от рабочей нагрузки.

Служба шлюза

Службы шлюза предоставляют шлюз Knox для Spark, HDFS, Yarn, пользовательского интерфейса Yarn и пользовательского интерфейса Spark.

Имя pod	Тип контроллера Kubernetes	Контейнеры
`gateway-<#>`	StatefulSet	- `knox` - `fluentbit`

Поддерживается только один шлюз.

Ссылки на контейнеры с открытым кодом

Дополнительные сведения о конкретных проектах и версиях с открытым исходным кодом см. в справочнике по программному обеспечению с открытым кодом.

Дальнейшие шаги

Дополнительные сведения о кластерах больших данных SQL Server см. в следующих ресурсах: