Componentes de Parallel Data Warehouse - Analytics Platform System

En este artículo se explican los componentes de software del dispositivo y de software que no es del dispositivo de Analytics Platform System.

Parallel Data Warehouse software

Software del dispositivo: procesamiento de consultas y almacenamiento de datos de usuario

Nodo Control

Motor MPP
El motor MPP es el cerebro del sistema de procesamiento paralelo masivo (MPP). Realiza las acciones siguientes:

  • Crea planes de consulta paralelos y coordina la ejecución de consultas paralelas en los nodos Proceso.

  • Almacena y coordina los metadatos y los datos de configuración de todas las bases de datos.

  • Administra la autenticación y autorización de la base de datos de SQL Server PDW.

  • Realiza un seguimiento del estado del hardware y del software.

Servicio de movimiento de datos (DMS)

El Servicio de movimiento de datos (DMS) es una de las prestaciones fundamentales de PDW. Realiza las acciones siguientes:

  • Transfiere datos hacia y desde los nodos de SQL Server PDW.

  • Procesa las operaciones de consulta que requieren la transferencia de datos entre los nodos.

  • Mejora el rendimiento de las consultas mediante la optimización de las velocidades de transferencia de datos.

Consola de administrador

La consola de administración es una aplicación web que muestra el estado del dispositivo e información del rendimiento.

Configuration Manager

Configuration Manager (dwconfig.exe) es la herramienta que usan los administradores del dispositivo para configurar Analytics Platform System.

Bases de datos del nodo Control

SQL Server administra todas las bases de datos en el nodo Control.

  • La base de datos de Shell administra los metadatos de todas las bases de datos de usuario distribuidas.

  • TempDB contiene los metadatos de todas las tablas temporales de usuario en el dispositivo.

  • Master es la tabla maestra de SQL Server en el nodo Control.

Nodo Proceso

Los nodos Proceso son unidades de procesamiento de datos y almacenamiento paralelos. Tienen almacenamiento conectado directo y usan SQL Server para administrar los datos de usuario.

Servicio de movimiento de datos (DMS)

El Servicio de movimiento de datos (DMS) se ejecuta en cada nodo Proceso para hacer lo siguiente:

  • Como parte del procesamiento de consultas paralelas, DMS transfiere datos hacia y desde otros nodos Proceso y el nodo Control.

  • DMS, que se ejecuta en cada nodo Proceso, recibe cargas de datos en paralelo. Los datos se cargan en paralelo directamente desde el servidor de carga a los nodos Proceso

  • DMS transfiere datos de cada nodo Proceso directamente al servidor de copia de seguridad.

  • Con PolyBase, DMS transfiere datos hacia y desde un clúster externo de Hadoop o Azure Blob Storage.

Bases de datos del nodo Proceso

Cada nodo Proceso ejecuta una instancia de SQL Server para procesar consultas y administrar datos de usuario.

Tejido del dispositivo

El tejido del dispositivo proporciona el sistema operativo, los servicios y la infraestructura de red para el dispositivo.

Controlador de dominio

Active Directory (AD) Domain Services (DS)
Analytics Platform System realiza la autenticación entre los nodos de Analytics Platform System y administra la autenticación de los inicios de sesión de autenticación de Windows de SQL Server PDW.

Servicio DNS
El Servicio de nombres de dominio de Windows (DNS) resuelve los nombres de dominio en direcciones IP para el dispositivo de Analytics Platform System.

Servicio de implementación de Windows

El Servicio de implementación de Windows (WDS) implementa el sistema operativo Windows Server en el dispositivo. Se implementa en todos los hosts y máquinas virtuales del dispositivo.

El servicio DHCP crea direcciones IP para que los hosts del dominio del dispositivo puedan unirse a la red del dispositivo sin tener una dirección IP preconfigurada.

Virtual Machine Manager

Analytics Platform System usa la virtualización para lograr una alta disponibilidad. Virtual Machine Manager hospeda System Center para implementar el sistema operativo en los hosts físicos.

Windows Server Update Services (WSUS) para aplicar o eliminar actualizaciones de Windows en todos los hosts y máquinas virtuales.

Windows Server

Todos los hosts y máquinas virtuales del dispositivo ejecutan el sistema operativo Windows Server.

Clústeres de conmutación por error

Los clústeres de conmutación por error de Windows proporcionan la capacidad de reiniciar los procesos en un host pasivo en caso de que se produzca un error en un host.

Espacios de almacenamiento

Espacios de almacenamiento de Windows administra los datos de usuario como un grupo de almacenamiento para un pequeño grupo de nodos Proceso. Si se produce un error en un nodo Proceso, los datos siguen siendo accesibles a través de otro nodo Proceso del grupo.

Hyper-V

Microsoft Hyper-V Server proporciona una solución de virtualización sencilla y confiable. Analytics Platform System usa las virtualizaciones para equilibrar los recursos de CPU y proporcionar alta disponibilidad para los nodos de PDW y los componentes del tejido del dispositivo.

Datos no relacionales

La tecnología PolyBase integra datos de SQL Server PDW con datos externos de Hadoop. Los datos de Hadoop se pueden almacenar en cualquiera de estos orígenes de datos de Hadoop:

  • Distribución Hortonworks de Hadoop

  • Distribución Cloudera de Hadoop

  • Datos de HDInsight almacenados en Azure Blob Storage

Herramientas de consulta

Las consultas se escriben con Transact-SQL modificado para ajustarse a la naturaleza MPP de las consultas. Todas las consultas se envían al nodo Control, que genera un plan de consulta paralelo para ejecutar la consulta en los nodos Proceso.

SQL Server Data Tools (SSDT)

SQL Server Data Tools se ejecuta dentro de Visual Studio y es nuestra herramienta de GUI recomendada para enviar consultas a SQL Server PDW. Es similar a SQL Server Management Studio, ya que permite navegar por un explorador de objetos.

Si aún no tiene Visual Studio, puede descargar las herramientas que necesita de forma gratuita.

Herramienta de consulta de línea de comandos sqlcmd

sqlcmd es la herramienta de línea de comandos de SQL Server para ejecutar instrucciones Transact-SQL y comandos del sistema. Funciona con SQL Server PDW y es nuestra herramienta de línea de comandos recomendada para consultar SQL Server PDW. Con sqlcmd puede ejecutar instrucciones Transact-SQL de forma interactiva desde la línea de comandos, como un archivo por lotes, o desde Windows PowerShell.

Integration Services

Puede usar Integration Services para consultar SQL Server PDW.

Servidor vinculado

Mediante una conexión de servidor vinculado de SQL Server, puede usar SQL Server para enviar instrucciones Transact-SQL a SQL Server PDW.

Herramientas de inteligencia empresarial

Analysis Services

SQL Server PDW es un origen de datos válido para bases de datos de Analysis Services y modelos Power Pivot de Excel. Con el proveedor OLE DB, puede configurar un cubo de Analysis Services para usar el procesamiento analítico en línea multidimensional (MOLAP) o el almacenamiento de procesamiento analítico en línea relacional (ROLAP).

Report Builder

Puede usar SQL Server PDW como origen de datos de SQL Server para informes que desarrolle para Reporting Services mediante SQL Server Report Builder. También puede usar SQL Server PDW como origen de SQL Server para los modelos de informe. Mediante el Administrador de informes o la API del servidor de informes, puede generar un modelo a partir de una base de datos de SQL Server PDW.

Power Pivot para Excel

Puede conectarse a SQL Server PDW con Power Pivot para Excel, una descarga gratuita que amplía significativamente las funcionalidades de análisis de datos de Excel.

Herramientas de carga

Integration Services

Instala adaptadores de destino específicos de Sistema de plataforma de análisis (PDW) que te permiten usar SQL Server Integration Services para cargar datos en Sistema de plataforma de análisis (PDW).

Cargador de línea de comandos dwloader

dwloader es una herramienta de carga de línea de comandos que carga datos en paralelo desde el servidor de carga a los nodos Proceso de SQL Server PDW.

Integración de PolyBase para Hadoop

Con la tecnología PolyBase, puede cargar datos no relacionales desde un clúster de Hadoop en una tabla relacional en SQL Server PDW. Los datos de Hadoop se pueden ubicar en un clúster de Hadoop externo o en Azure Blob Storage.

Copia de seguridad y restauración de bases de datos

SQL Server PDW usa comandos de copia de seguridad y restauración de bases de datos de Transact-SQL para realizar copias de seguridad y restaurar bases de datos de usuario, en paralelo, hacia y desde un servidor de copia de seguridad. SQL Server PDW escribe la copia de seguridad en un directorio de un recurso compartido de archivos de Windows y, a continuación, restaura los datos de un recurso compartido de archivos de Windows.

Para obtener más información, consulte Planeamiento de copia de seguridad y carga de hardware y Descripción general de la copia de seguridad y restauración

Copia de tabla remota

La característica de Copia de tabla remota permite copiar tablas de bases de datos de SQL Server PDW en bases de datos de SQL Server SMP (que no son del dispositivo) remotas. Esto permite escenarios radiales para SQL Server PDW.

Supervisión

Analytics Platform System tiene varias maneras de supervisar la actividad del dispositivo

Consola de administrador

La consola de administración permite ver el estado actual del dispositivo. Se ejecuta como una aplicación web en el nodo Control y es accesible a través de https.

Para obtener más información, consulte Supervisión del dispositivo mediante la consola de administración (Analytics Platform System)

Vistas del sistema

La consola de administración se basa en consultas de vista del sistema. Puede consultar las vistas del sistema individualmente para obtener la información específica que necesita.

Para obtener más información, consulte Supervisión del dispositivo mediante vistas del sistema (Analytics Platform System)

System Center Operations Manager

Hay módulos de administración de System Center Operations Manager (SCOM) para SQL Server PDW.

Para configurar el dispositivo para SCOM, consulte Supervisión del dispositivo mediante el uso de System Center Operations Manager (Analytics Platform System)