Compartir vía


Carga de datos en Almacenamiento de datos paralelos

Puede cargar o insertar datos en Almacenamiento de datos paralelos (PDW) de SQL Server mediante Integration Services, la utilidad bcp, el cargador de línea de comandos dwloader o la instrucción INSERT de SQL.

Entorno de carga

Para cargar datos, necesita uno o varios servidores de carga. Puede usar un ETL existente propio u otros servidores, o bien puede comprar nuevos servidores. Para más información, vea Compra y configuración de un servidor de carga. Estas instrucciones incluyen una hoja de cálculo de planeamiento de capacidad del servidor de carga a fin de ayudarle a planear la solución adecuada para la carga.

Carga con dwloader

El uso del cargador de línea de comandos dwloader es la forma más rápida de cargar datos en PDW.

Loading process

dwloader carga los datos directamente en los nodos de ejecución sin que pasen por el nodo de control. Para cargar datos, dwloader primero se comunica con el nodo de control a fin de obtener información de contacto para los nodos de ejecución. dwloader configura un canal de comunicación con cada nodo de ejecución y, después, envía fragmentos de 256KB de datos a los nodos de ejecución de forma equilibrada.

En cada nodo de ejecución, el Servicio de movimiento de datos (DMS) recibe y procesa los fragmentos de datos. El procesamiento de los datos incluye la conversión de cada fila en formato nativo de SQL Server y la computación del hash de distribución para determinar el nodo de ejecución al que pertenece cada fila.

Después de procesar las filas, DMS usa un movimiento aleatorio para transferir cada fila al nodo de ejecución y la instancia correctos de SQL Server. A medida que SQL Server recibe las filas, las procesa por lotes según el parámetro de tamaño de lote -b establecido en dwloader y, después, carga el lote de forma masiva.

Carga con instrucciones preparadas

Puede usar instrucciones preparadas para cargar datos en tablas distribuidas y replicadas. Cuando los datos de entrada no coinciden con el tipo de datos de destino, se realiza una conversión implícita. Las conversiones implícitas admitidas por las instrucciones preparadas de PDW son un subconjunto de las conversiones compatibles con SQL Server. Es decir, solo se admite un subconjunto de conversiones, pero las admitidas coinciden con las conversiones implícitas de SQL Server. Independientemente de si la tabla de destino que se va a cargar se define como una tabla distribuida o replicada, las conversiones implícitas se aplican (si es necesario) a todas las columnas que existen en la tabla de destino.

Tarea Descripción
Creación de la base de datos de almacenamiento provisional. Creación de la base de datos de almacenamiento provisional
Carga con Integration Services. Carga con Integration Services
Descripción de las conversiones de tipos para dwloader. Reglas de conversión de tipos de datos para dwloader
Carga de datos con dwloader. Cargador de línea de comandos dwloader
Descripción de las conversiones de tipos para INSERT. Carga de datos con INSERT