Поделиться через


Занятие 1. Создание проекта и основного пакета

На этом занятии будет рассмотрено создание простого ETL-пакета, который будет получать данные из отдельного источника плоских файлов, преобразовывать полученные данные при помощи двух компонентов преобразования «Уточняющий запрос», а затем записывать эти данные в таблицу фактов FactCurrencyRate, находящуюся в базе данных AdventureWorksDW. На этом занятии предстоит узнать, как создавать новые пакеты, добавлять и настраивать соединения с источниками данных и назначениями, а также работать с новыми компонентами потока управления и потока данных.

Важное примечаниеВажно!

Для выполнения упражнений этого учебника нужен образец базы данных AdventureWorksDW. Дополнительные сведения об установке и развертывании базы данных AdventureWorksDW см. в разделе Вопросы установки образцов кода и образцов баз данных SQL Server.

Основные сведения о требованиях пакета

Перед созданием пакета необходимо знать о форматировании в источнике данных и в назначении. Если эти форматы данных известны, можно определить преобразования, необходимые для сопоставления формата данных источника формату назначения.

Анализ источника

Для этого учебника данные источника представлены в виде набора курсов валют, содержащегося в плоском файле SampleCurrencyData.txt. Данные источника в этом файле имеют четыре столбца: средний курс валюты, ключ валюты, ключ даты и курс на конец дня.

Здесь приведен пример данных источника, содержащихся в файле SampleCurrencyData.txt:

1.00010001   ARS   9/3/2001 0:00    0.99960016

1.00010001   ARS   9/4/2001 0:00    1.001001001

1.00020004   ARS   9/5/2001 0:00    0.99990001

1.00020004   ARS   9/6/2001 0:00    1.00040016

1.00050025   ARS   9/7/2001 0:00    0.99990001

1.00050025   ARS   9/8/2001 0:00    1.001001001

1.00050025   ARS   9/9/2001 0:00    1

1.00010001   ARS   9/10/2001 0:00   1.00040016

1.00020004   ARS   9/11/2001 0:00   0.99990001

1.00020004   ARS   9/12/2001 0:00   1.001101211

 

При работе с данными источника плоских файлов важно понимать, как диспетчер соединений с плоскими файлами интерпретирует данные плоских файлов. Если плоский файл является документом в Юникоде, диспетчер соединений с плоскими файлами определяет все столбцы как [DT_WSTR] с шириной, по умолчанию равной 50. Если же исходный файл является документом в кодировке ANSI, столбцы определяются как [DT_STR] с шириной 50. Возможно, потребуется изменить эти настройки, чтобы оптимизировать столбцы для конкретных данных. Чтобы сделать это, необходимо узнать тип данных в назначении, куда будут заноситься эти данные, а затем выбрать правильный тип данных в диспетчере соединений с плоскими файлами.

Анализ назначения

Конечным назначением источника данных является таблица фактов FactCurrencyRate в базе данных AdventureWorksDW. Таблица фактов FactCurrencyRate имеет четыре столбца и связи с двумя таблицами измерений, как показано в следующей таблице.

Имя столбца

Тип данных

Таблица уточняющих запросов

Столбец подстановки

AverageRate

float

Нет

Нет

CurrencyKey

int (FK)

DimCurrency

CurrencyKey (PK)

TimeKey

Int (FK)

DimTime

CurrencyKey (PK)

EndOfDayRate

float

Нет

Нет

Сопоставление совместимых данных источника с назначением

Анализ форматов данных источника и назначения показывает, что для значений CurrencyKey и TimeKey необходимы преобразования «Уточняющий запрос». Преобразования, которые будут выполнены, получат значения CurrencyKey и TimeKey, используя альтернативные ключи из таблиц измерений DimCurrency и DimTime.

Столбец плоских файлов

Имя таблицы

Имя столбца

Тип данных

0

FactCurrencyRate

AverageRate

Float

1

DimCurrency

CurrencyAlternateKey

nchar(3)

2

DimTime

FullDateAlternateKey

Datetime

3

FactCurrencyRate

EndOfDayRate

Float

Задачи занятия

Это занятие содержит следующие задачи.

Начало занятия

Задача 1. Создание нового проекта служб Integration Services

Значок служб Integration Services (маленький)Будьте в курсе новых возможностей cлужб Integration Services

Чтобы загружать новейшую документацию, статьи, образцы и видеоматериалы от корпорации Майкрософт, а также лучшие решения от участников сообщества, посетите страницу служб Integration Services на сайтах MSDN или TechNet:

Чтобы получать автоматические уведомления об этих обновлениях, подпишитесь на RSS-каналы, предлагаемые на этой странице.