Поделиться через


Загрузка листа планирования емкости сервера для системы платформы аналитики

Этот лист планирования емкости помогает определить требования для сервера загрузки для загрузки данных в SQL Server PDW. Используйте это для создания плана приобретения или подготовки существующих серверов загрузки.

Заметки на листе

  1. Этот лист применяется к серверам, которые будут загружать данные с помощью средства загрузки командной строки dwloader .

  2. Для загрузки данных с помощью служб Integration Services или стороннего средства загрузки требования могут отличаться в зависимости от различий в процессе загрузки.

  3. Большинство требований применяются к загрузке сжатых или несжатых файлов данных; Все различия в требованиях отмечены полужирным шрифтом.

Clipboard Лист планирования емкости

Распечатайте этот лист и заполните его собственными требованиями.

Компонент Требование Заполните этот столбец собственными требованиями Рекомендации
Память Максимальное количество байтов, которые вы планируете хранить на сервере загрузки в любой момент времени. Pencil icon Чтобы определить требования к хранилищу, узнайте, сколько данных планируется хранить на сервере загрузки в любой момент времени. Требования к емкости предназначены только для загрузки файлов; Операционная система и файлы загрузки должны находиться в разных массивах дисков.

Например, если вы планируете загружать 100 ГБ данных с диска 3 раза в день, но не удалять файлы данных до конца недели, для хранения файлов данных потребуется не менее 2,1 ТБ. Мы рекомендуем быть консервативным и получать около 30 % больше хранилища для учета дисперсий и роста. В этом примере было бы лучше 2,73 ТБ дискового пространства.
Скорость загрузки Максимальное количество байтов в час данных для загрузки в PDW. Pencil icon Это оценка. При вычислении этого требования предположим, что файлы уже находятся на сервере загрузки и что другие условия загрузки максимально хороши.

Например: нет необходимости учитывать сжатие данных, так как dwloader всегда отправляет несжатые данные в PDW. Нет необходимости учитывать преобразования типов данных и размер целевой таблицы.
Сеть Тип сетевого подключения. Pencil icon Определите оптимальный тип сетевого подключения для требований к скорости нагрузки.

Например: InfiniBand или 10 Гбит Ethernet обеспечит оптимальную скорость загрузки. 1 Гбит Ethernet ограничивает скорость загрузки до 360 ГБ в час или меньше.
ВВОД-ВЫВОД Байты в час для операций чтения и записи. Pencil icon Чтобы загрузить данные, dwloader должен считывать все данные с диска перед отправкой в PDW.

Каждый сервер загрузки не может загружать данные быстрее, чем устройство может получать данные из всех источников загрузки. Чтобы сэкономить деньги, запланируйте емкость чтения ввода-вывода для загрузки, чтобы она не превысила нагрузку устройства.

Например:
PDW получает и загружает данные в 1 стойку устройства с максимальной скоростью 1,8 ТБ в час. Для устройства с 2 или более стойками максимальная скорость загрузки составляет 3,6 ТБ в час.

Если вы планируете загружать с нескольких серверов загрузки одновременно, требования ввода-вывода для каждого сервера загрузки будут меньше, чем при выполнении каждой загрузки одного сервера.

Например, один сервер загрузки может загружать не более 1,8 ТБ в час для 1-стойочного устройства. Два сервера загрузки могут одновременно загружать 900 ГБ в час на 1 стойку. Более высокие уровни параллелизма могут снизить эффективность и максимальную пропускную способность.

Для емкости ввода-вывода учитывайте все операции ввода-вывода на сервере загрузки. Если сервер загрузки имеет другой трафик ввода-вывода в дополнение к нагрузке данных, например получение файлов данных с сервера ETL, требования ввода-вывода будут увеличиваться.

Для сжатых данных требования ввода-вывода зависят от скорости сжатия данных. Dwloader считывает сжатые данные, а затем распаковывает его перед отправкой в PDW. Чем выше коэффициент сжатия, тем меньше данных на сервере загрузки потребуется считывать с диска.

Например, если требуемая скорость загрузки составляет 1,8 ТБ в час, а данные хранятся на сервере загрузки с сжатием 2:1, то сервер загрузки должен считывать только 900 ГБ в час с диска вместо 1,8 ТБ. Коэффициент сжатия 3:1 означает, что сервер загрузки должен считывать 600 ГБ в час с диска.
ЦП Количество сокетов. Pencil icon Для загрузки несжатых данных dwloader не является приложением с большим объемом ЦП. Как минимум, рекомендуется использовать недавно выпущенный 2-сокетовый сервер.

Для загрузки сжатых данных требуется достаточно ресурсов ЦП, чтобы распаковывать данные перед отправкой в PDW. Dwloader может одновременно запускать 10 активных потоков. Если вы планируете загружать 10 сжатых файлов одновременно, рекомендуется использовать по крайней мере 10-ядер ЦП или два 6-ядра ЦП.
ОЗУ ГБ памяти, которая позволяет Windows кэшировать файлы во время загрузки. Pencil icon Dwloader использует очень мало ОЗУ на сервере загрузки. Для повышения производительности Windows использует память для кэширования файлов загрузки после их чтения с диска.

Чтобы определить требования к ОЗУ, ознакомьтесь с установкой Windows Server и любыми сторонними требованиями к приложению. Рекомендуется не менее 32 ГБ, если у вас нет требований из других источников.

Для сжатых данных быстрее ОЗУ полезно, так как это ускорит декомпрессию.

См. также

Получение и настройка загрузчикасервера dwloader командной строки