Condividi tramite


Caricamento di dati in Parallel Data Warehouse

È possibile caricare o inserire dati in SQL Server Parallel Data Warehouse (PDW) usando Integration Services, utilità bcp, il caricatore da riga di comando dwloader o l'istruzione INSERT SQL.

Ambiente di caricamento

Per caricare i dati, sono necessari uno o più server di caricamento. È possibile usare i propri server ETL o altri server, oppure è possibile acquistarne di nuovi. Per altre informazioni, vedere Acquisire e configurare un server di caricamento. Queste istruzioni includono un Foglio di lavoro per la pianificazione della capacità del server di caricamento che consente di pianificare la soluzione più adatta per il caricamento.

Caricare con dwloader

L'uso del caricatore da riga di comando dwloader è il modo più rapido per caricare i dati in PDW.

Loading process

dwloader carica i dati direttamente nei nodi di calcolo senza passare i dati attraverso il nodo di controllo. Per caricare i dati, dwloader comunica prima con il nodo di controllo per ottenere le informazioni di contatto per i nodi di calcolo. dwloader imposta un canale di comunicazione con ciascun nodo di calcolo e invia quindi pezzi di dati da 256 KB ai nodi di calcolo in modo round-robin.

Su ogni nodo di calcolo, il Servizio postamento dati (DMS) riceve ed elabora i blocchi di dati. L'elaborazione dei dati include la conversione di ogni riga in formato nativo di SQL Server e il calcolo dell'hash di distribuzione per determinare il nodo di calcolo a cui appartiene ogni riga.

Dopo l'elaborazione delle righe, il servizio Migrazione del database usa uno spostamento casuale per trasferire ogni riga nel nodo di calcolo e nell'istanza di SQL Server corretti. Quando SQL Server riceve le righe, le raggruppa in batch in base al parametro batch size -b impostato in dwloader e quindi carica il batch in blocco.

Caricare con istruzioni preparate

È possibile usare istruzioni preparate per caricare i dati in tabelle distribuite e replicate. Quando i dati di input non corrispondono al tipo di dati di destinazione, viene eseguita una conversione implicita. Le conversioni implicite supportate dalle istruzioni preparate di PDW sono un sottoinsieme di conversioni supportate da SQL Server. Questo vale a dire che è supportato solo un sottoinsieme di conversioni, ma le conversioni supportate corrispondono alle conversioni implicite di SQL Server. Indipendentemente dal fatto che la tabella di destinazione da caricare sia definita come tabella distribuita o replicata, le conversioni implicite vengono applicate (se necessario) a tutte le colonne esistenti nella tabella di destinazione.

Attività Descrizione
Creare un database dell'area di gestione temporanea Creare un database dell'area di gestione temporanea
Caricare con Integration Services Caricare con Integration Services
Comprendere i tipi di conversione per dwloader. Regole di conversione del tipo di dati per dwloader
Caricare dati con dwloader. Caricatore da riga di comando dwloader
Comprendere i tipi di conversione per INSERT. Caricare i dati con INSERT