Поделиться через


Загрузка данных в параллельное хранилище данных

Вы можете загружать или вставлять данные в хранилище параллельных данных SQL Server (PDW) с помощью служб Integration Services, служебной программы bcp, загрузчика командной строки dwloader или инструкции SQL INSERT.

Загрузка среды

Для загрузки данных требуется один или несколько серверов загрузки. Вы можете использовать собственные ETL или другие серверы или приобрести новые серверы. Дополнительные сведения см. в разделе "Получение и настройка сервера загрузки". Эти инструкции включают в себя лист планирования емкости сервера загрузки, чтобы помочь вам спланировать правильное решение для загрузки.

Загрузка с помощью dwloader

Использование загрузчика командной строки dwloader — самый быстрый способ загрузки данных в PDW.

Loading process

Dwloader загружает данные непосредственно на вычислительные узлы без передачи данных через узел control. Чтобы загрузить данные, dwloader сначала взаимодействует с узлом Control, чтобы получить контактные данные для вычислительных узлов. Dwloader настраивает канал связи с каждым вычислительным узлом, а затем отправляет 256 КБ блоков данных на вычислительные узлы в циклический перебор.

На каждом вычислительном узле служба перемещения данных (DMS) получает и обрабатывает блоки данных. Обработка данных включает преобразование каждой строки в собственный формат SQL Server и вычисление хэша распределения, чтобы определить вычислительный узел, к которому принадлежит каждая строка.

После обработки строк DMS использует перетасовку для передачи каждой строки на правильный вычислительный узел и экземпляр SQL Server. Так как SQL Server получает строки, он пакетирует их в соответствии с параметром размера пакета -b , заданным в dwloader, а затем массовая загрузка пакета.

Загрузка с подготовленными операторами

Для загрузки данных в распределенные и реплицированные таблицы можно использовать подготовленные инструкции. Если входные данные не соответствуют целевому типу данных, выполняется неявное преобразование. Неявные преобразования, поддерживаемые подготовленными инструкциями PDW, представляют собой подмножество преобразований, поддерживаемых SQL Server. То есть поддерживается только подмножество преобразований, но поддерживаемые преобразования соответствуют неявным преобразованиям SQL Server. Независимо от того, определена ли целевая таблица как распределенная или реплицированная таблица, неявные преобразования применяются (при необходимости) ко всем столбцам, существующим в целевой таблице.

Задача Description
Создайте промежуточную базу данных. Создание промежуточной базы данных
Загрузка с помощью служб Integration Services. Загрузка с помощью служб Integration Services
Общие сведения о преобразованиях типов для dwloader. Правила преобразования типов данных для dwloader
Загрузка данных с помощью dwloader. Загрузчик командной строки dwloader
Общие сведения о преобразованиях типов для INSERT. Загрузка данных с помощью INSERT