Freigeben über


Laden von Daten in Parallel Data Warehouse

Sie können Daten mithilfe von Integration Services, bcp Utility, dwloader Command-Line Loader oder der SQL INSERT-Anweisung in SQL Server Parallel Data Warehouse (PDW) laden oder einfügen.

Ladeumgebung

Zum Laden von Daten benötigen Sie einen oder mehrere Ladeserver. Sie können Ihre eigenen vorhandenen ETL- oder anderen Server verwenden oder neue Server erwerben. Weitere Informationen finden Sie unter Abrufen und Konfigurieren eines Ladeservers. Diese Anweisungen umfassen ein Arbeitsblatt für die Kapazitätsplanung des Ladeservers, mit dem Sie die richtige Lösung für das Laden planen können.

Laden mit Dwloader

Die Verwendung des Dwloader-Befehlszeilenladeprogramms ist die schnellste Methode zum Laden von Daten in PDW.

Loading process

Dwloader lädt Daten direkt auf die Computeknoten, ohne die Daten über den Control-Knoten zu übergeben. Zum Laden von Daten kommuniziert dwloader zunächst mit dem Knoten "Steuerelement", um Kontaktinformationen für die Computeknoten abzurufen. Dwloader richtet einen Kommunikationskanal mit jedem Computeknoten ein und sendet dann 256 KB Datenblöcke auf Roundrobin-Weise an die Computeknoten.

Auf jedem Computeknoten empfängt und verarbeitet der Data Movement Service (DMS) die Datenblöcke. Die Verarbeitung der Daten umfasst die Konvertierung jeder Zeile in das systemeigene SQL Server-Format und das Berechnen des Verteilungshashs, um den Computeknoten zu bestimmen, zu dem jede Zeile gehört.

Nach der Verarbeitung der Zeilen verwendet DMS eine Shuffle-Verschiebung, um jede Zeile auf den richtigen Computeknoten und die richtige Instanz von SQL Server zu übertragen. Wenn SQL Server die Zeilen empfängt, werden sie gemäß dem parameter "-b batch size" in dwloader festgelegt, und anschließend wird der Batch geladen.

Laden mit vorbereiteten Anweisungen

Sie können vorbereitete Anweisungen verwenden, um Daten in verteilte und replizierte Tabellen zu laden. Wenn die Eingabedaten nicht mit dem Zieldatentyp übereinstimmen, wird eine implizite Konvertierung ausgeführt. Die impliziten Konvertierungen, die von PDW vorbereiteten Anweisungen unterstützt werden, sind eine Teilmenge von Konvertierungen, die von SQL Server unterstützt werden. Dies bedeutet, dass nur eine Teilmenge von Konvertierungen unterstützt wird, aber die unterstützten Konvertierungen stimmen mit impliziten SQL Server-Konvertierungen überein. Unabhängig davon, ob die zu ladende Zieltabelle als verteilte oder replizierte Tabelle definiert ist, werden implizite Konvertierungen (falls erforderlich) auf alle Spalten angewendet, die in der Zieltabelle vorhanden sind.

Aufgabe Beschreibung
Erstellen Sie die Stagingdatenbank. Erstellen der Stagingdatenbank
Laden sie mit Integration Services. Laden mit Integration Services
Grundlegendes zu Typkonvertierungen für dwloader. Regeln für das Konvertieren von Datentypen für dwloader
Laden von Daten mit dwloader. Dwloader-Befehlszeilenladeprogramm
Grundlegendes zu Typkonvertierungen für INSERT. Laden von Daten mit SSIS