Recursos implementados con clústeres de macrodatos de SQL Server

2021-02-11

Se aplica a: SQL Server 2019 (15.x)

Importante

El complemento Clústeres de macrodatos de Microsoft SQL Server 2019 se va a retirar. La compatibilidad con Clústeres de macrodatos de SQL Server 2019 finalizará el 28 de febrero de 2025. Todos los usuarios existentes de SQL Server 2019 con Software Assurance serán totalmente compatibles con la plataforma, y el software se seguirá conservando a través de actualizaciones acumulativas de SQL Server hasta ese momento. Para más información, consulte la entrada de blog sobre el anuncio y Opciones de macrodatos en la plataforma Microsoft SQL Server.

En este artículo se describen los recursos que implementa un clúster de macrodatos de SQL Server.

Un clúster de macrodatos implementa pods basados en el perfil de implementación. Para obtener más información, consulte Configuraciones predeterminadas.

En este artículo se describen los pods implementados con aks-dev-test-ha el perfil e incluye un grupo de Spark. Consulte Kubernetes para ver los pods implementados en el clúster. En el ejemplo siguiente se devuelve una lista de pods en un espacio de nombres específico.

kubectl get pods -n <namespace>

Reemplace <namespace> por el nombre del clúster de macrodatos.

Para obtener más información, vea Cómo implementar Clústeres de macrodatos de SQL Server en Kubernetes.

En el diagrama siguiente se muestran los componentes implementados en un clúster de macrodatos:

big-data-cluster-diagram

Para obtener información sobre la arquitectura, vea Introducción a clústeres de macrodatos de SQL Server.

Pods implementados

En la tabla siguiente se enumeran los pods implementados en un clúster de macrodatos.

Nombre	Ámbito
`control-<nnnn>`	Control
`controldb-<#>`	Control
`controlwd-<nnnn>`	Control
`logsdb-<#>`	Control
`logsui-<nnnn>`	Control
`metricsdb-<#>`	Control
`metricsdc-<nnnn>`	Control
`metricsui-<nnnn>`	Control
`mgmtproxy-<nnnn>`	Control
`zookeeper-<#>`	Control
`dns-<nnnn>`	Control
`master-<#n>`	Instancia maestra
`operator-<nnnn>`	Instancia maestra
`compute-<#n>-<#m>`	Grupo de proceso
`data-<#>-<#>`	Grupo de datos
`storage-<#>-<#>`	Grupo de almacenamiento
`nmnode-<#>-<#>`	Grupo de almacenamiento
`sparkhead-<#>`	Grupo de almacenamiento
`appproxy-<#m>`	Grupo de aplicaciones
`gateway-<#>`	Servicio de puerta de enlace

No todos los pods se incluyen en todos los clústeres de macrodatos. Las implementaciones con alta disponibilidad o la integración de Active Directory incluyen pods específicos.

Pods específicos de alta disponibilidad:

operator-<nnnn>
zookeeper-<#>

Pods específicos de Active Directory:

dns-<nnnn>

En las siguientes secciones se describen los "pods" y se enumeran los contenedores de cada "pod".

Supervisión

Los pods de control proporcionan el servicio de control.

Nombre del pod	Contar	Tipo de controlador de Kubernetes	Contenedores
`control-#`	1	ReplicaSet	- `controller` - `security-support` - `fluentbit`
`controldb`	1	StatefulSet	- `mssql-server` - `fluentbit`
`controlwd`	1	ReplicaSet	- `controlwatchdog`
`logsdb-#`	1	StatefulSet	- `elasticsearch`
`logsui`	1	ReplicaSet	- `kibana`
`metricsdb-#`	1	StatefulSet	- `influxdb`
`metricsdc`	1 por nodo de Kubernetes.	DaemonSet	- `telegraf`
`metricsui-nnnn`	1	ReplicaSet	- `grafana`
`mgmtproxy-nnnn`	1	ReplicaSet	- `service-proxy` - `fluentbit`
`dns-nnnn`	0 o 1 para la integración de Active Directory	ReplicaSet	- `dns` - `fluentbit`

Instancia maestra

master-<#n> es la instancia maestra de SQL Server.

Administra el grupo de datos a través de DDL.
Manipula datos en el grupo de datos a través de DML
Descarga la ejecución de consultas analíticas en el grupo de datos

Nombre del pod	Contar	Tipo de controlador de Kubernetes	Contenedores
`master-<#n>`	1 o más para alta disponibilidad.	StatefulSet	- `mssql-server` - `fluentbit` - `collectd` - `mssql-ha-supervisor` ^*
`operator`^*	0 o 1 para alta disponibilidad	ReplicaSet	- `mssql-ha-operator`

^* Solo implementaciones de alta disponibilidad. El operador implementa y registra la definición de recursos personalizados para SQL Server y los recursos del grupo de disponibilidad. Cuando se implementa el operador, se registra como agente de escucha para recibir notificaciones sobre los recursos de SQL Server que se implementan en el clúster de Kubernetes. mssql-ha-supervisor admite el grupo de disponibilidad.

Cada master pod contiene una instancia de SQL Server. Una implementación de alta disponibilidad incluye 3 pods. Cada pod incluye una instancia de SQL Server con bases de datos en un grupo de disponibilidad AlwaysOn de SQL Server.

Incluya pods adicionales en el momento de la implementación, en función de la carga de trabajo.

Grupo de cómputo

El grupo de proceso proporciona una instancia de SQL Server para el cálculo.

Nombre del pod	Contar	Tipo de controlador de Kubernetes	Contenedores
`compute-<#n>-<#m>`	1 o más.	StatefulSet	- `mssql-server` - `fluentbit` - `collectd`

#n identifica el grupo de computación.
#m identifica el identificador de instancia dentro del grupo.

Las instancias de SQL Server del grupo de proceso no tienen estado. Solo requieren almacenamiento para tempdb.

Incluya pods adicionales en el momento de la implementación, en función de la carga de trabajo.

Grupo de datos

El grupo de datos proporciona instancias de SQL Server para el almacenamiento y el proceso.

Nombre del pod	Contar	Tipo de controlador de Kubernetes	Contenedores
`data-<#n>-<#m>`	0 o más	StatefulSet	- `mssql-server` - `fluentbit` - `collectd`

#n identifica el grupo de datos.
#m identifica el identificador de instancia dentro del grupo.

Incluya módulos adicionales al momento de la implementación, dependiendo de la carga de trabajo.

Bloque de almacenamiento

El grupo de almacenamiento proporciona ingesta de datos a través de Spark, almacenamiento en HDFS, acceso a datos a través de puntos de conexión de HDFS y SQL Server.

Nombre del pod	Contar	Tipo de controlador de Kubernetes	Contenedores
`storage-0-#`	1 o más. Incluya módulos adicionales al momento de la implementación, dependiendo de la carga de trabajo.	StatefulSet	- `hadoop` - `mssql-server` - `fluentbit`
`nmnode-0-#`	1 o más para alta disponibilidad	StatefulSet	- `hadoop` - `fluentbit`
`sparkehead-#`	1 o más para alta disponibilidad	StatefulSet	- `hadoop-yarn-jobhistory` - `hadoop-livy-sparkhistory` - `hadoop-hivemetastore` -- `fluentbit`
`zookeeper`	0 o 3 para alta disponibilidad.	StatefulSet	- `zookeeper` - `fluentbit`

Grupo de aplicaciones

El grupo de aplicaciones se incluye en algunos de los perfiles de configuración de prueba. El grupo de aplicaciones hospeda servidores proxy de servicio de aplicaciones que se definen al implementar las aplicaciones para clústeres de macrodatos.

appproxy es una API web que se sitúa delante de las aplicaciones del grupo de aplicaciones. Autentica a los usuarios y, a continuación, enruta las solicitudes a través de las aplicaciones.

Nombre del pod	Tipo de controlador de Kubernetes	Contenedores
`appproxy`	ReplicaSet	- `app-service-proxy` - `fluentbit`

Para obtener más información, consulte Introducción a la implementación de aplicaciones en un clúster de macrodatos.

Incluya módulos adicionales al momento de la implementación, dependiendo de la carga de trabajo.

Servicio de puerta de enlace

Los servicios de puerta de enlace proporcionan acceso a través de la puerta de enlace de Knox a Spark, HDFS, Yarn, la interfaz de usuario de Yarn y la interfaz de usuario de Spark.

Nombre del pod	Tipo de controlador de Kubernetes	Contenedores
`gateway-<#>`	StatefulSet	- `knox` - `fluentbit`

Solo se admite una puerta de enlace.

Referencias de contenedor de código abierto

Para ver proyectos y versiones de código abierto específicos, consulte Referencia de software de código abierto.

Pasos siguientes

Para obtener más información sobre Clústeres de macrodatos de SQL Server, vea los recursos siguientes:

Compartir a través de