Partager via


Chargement de données dans Parallel Data Warehouse

Vous pouvez charger ou insérer des données dans SQL Server Parallel Data Warehouse (PDW) à l’aide d’Integration Services, de l’utilitaire bcp, du chargeur de ligne de commande dwloader ou de l’instruction SQL INSERT.

Chargement de l’environnement

Pour charger des données, vous avez besoin d’un ou plusieurs serveurs de chargement. Vous pouvez utiliser votre propre etL existant ou d’autres serveurs, ou vous pouvez acheter de nouveaux serveurs. Pour plus d’informations, consultez Acquérir et configurer un serveur de chargement. Ces instructions incluent une feuille de calcul de planification de la capacité du serveur de chargement pour vous aider à planifier la solution appropriée pour le chargement.

Charger avec dwloader

L’utilisation du chargeur de ligne de commande dwloader est le moyen le plus rapide de charger des données dans PDW.

Loading process

dwloader charge des données directement sur les nœuds de calcul sans passer les données via le nœud Contrôle. Pour charger des données, dwloader communique d’abord avec le nœud Control pour obtenir des informations de contact pour les nœuds de calcul. dwloader configure un canal de communication avec chaque nœud de calcul, puis envoie 256 Ko de blocs de données aux nœuds de calcul de manière round robin.

Sur chaque nœud de calcul, le service de déplacement des données (DMS) reçoit et traite les blocs de données. Le traitement des données inclut la conversion de chaque ligne au format natif SQL Server et le calcul du hachage de distribution pour déterminer le nœud de calcul auquel chaque ligne appartient.

Après avoir traité les lignes, DMS utilise un déplacement aléatoire pour transférer chaque ligne vers le nœud de calcul et l’instance corrects de SQL Server. À mesure que SQL Server reçoit les lignes, il les lot en fonction du paramètre de taille de lot -b défini dans dwloader, puis charge en bloc le lot.

Charger avec des instructions préparées

Vous pouvez utiliser des instructions préparées pour charger des données dans des tables distribuées et répliquées. Lorsque les données d’entrée ne correspondent pas au type de données cible, une conversion implicite est effectuée. Les conversions implicites prises en charge par les instructions préparées par PDW sont un sous-ensemble de conversions prises en charge par SQL Server. Autrement dit, seul un sous-ensemble de conversions est pris en charge, mais les conversions prises en charge correspondent aux conversions implicites SQL Server. Que la table cible à charger soit définie comme une table distribuée ou répliquée, les conversions implicites sont appliquées (si nécessaire) à toutes les colonnes qui existent dans la table cible.

Task Description
Créez la base de données intermédiaire. Créer la base de données intermédiaire
Charger avec Integration Services. Charger avec Integration Services
Comprendre les conversions de type pour dwloader. Règles de conversion du type de données pour dwloader
Chargez des données avec dwloader. chargeur de ligne de commande dwloader
Comprendre les conversions de type pour INSERT. Charger des données avec INSERT