Занятие 1. Создание проекта и основного пакета
На этом занятии будет рассмотрено создание простого ETL-пакета, который будет извлекать данные из отдельного источника неструктурированных файлов, преобразовывать полученные данные при помощи двух компонентов преобразования «Уточняющий запрос», а затем записывать эти данные в таблицу фактов FactCurrency, находящуюся в базе данных AdventureWorksDW2012. На этом занятии предстоит узнать, как создавать новые пакеты, добавлять и настраивать соединения с источниками данных и назначениями, а также работать с новыми компонентами потока управления и потока данных.
![]() |
---|
Для выполнения упражнений этого учебника потребуется образец базы данных AdventureWorksDW2012. Дополнительные сведения об установке и развертывании базы данных AdventureWorksDW2012 см. в разделе Приступая к работе с образцами SQL Server и баз данных. |
Основные сведения о требованиях пакета
Для выполнения упражнений этого учебника требуется Microsoft SQL Server Data Tools.
Дополнительные сведения об установке SQL Server Data Tools см. в разделе Загрузка SQL Server Data Tools.
Перед созданием пакета необходимо знать о форматировании в источнике данных и в назначении. Если эти форматы данных известны, можно определить преобразования, необходимые для сопоставления формата данных источника формату назначения.
Анализ источника
Для этого учебника данные источника представлены в виде набора курсов валют, содержащегося в неструктурированном файле SampleCurrencyData.txt. Исходные данные указаны в следующих четырех столбцах: средний курс валюты, ключ валюты, ключ даты и курс на конец дня.
Здесь приведен пример данных источника, содержащихся в файле SampleCurrencyData.txt:
1.00070049USD9/3/05 0:001.001201442
1.00020004USD9/4/05 0:001
1.00020004USD9/5/05 0:001.001201442
1.00020004USD9/6/05 0:001
1.00020004USD9/7/05 0:001.00070049
1.00070049USD9/8/05 0:000.99980004
1.00070049USD9/9/05 0:001.001502253
1.00070049USD9/10/05 0:000.99990001
1.00020004USD9/11/05 0:001.001101211
1.00020004USD9/12/05 0:000.99970009
При работе с данными источника неструктурированных файлов важно понимать, как диспетчер соединений с неструктурированными файлами интерпретирует данные неструктурированных файлов. Если неструктурированный файл является документом в Юникоде, диспетчер соединений с неструктурированными файлами определяет все столбцы как [DT_WSTR] с шириной, по умолчанию равной 50. Если неструктурированный файл является документом в кодировке ANSI, все столбцы определяются как [DT_STR] с шириной, равной 50. Возможно, потребуется изменить эти настройки, чтобы оптимизировать столбцы для конкретных данных. Чтобы сделать это, необходимо узнать тип данных в назначении, куда будут заноситься эти данные, а затем выбрать правильный тип данных в диспетчере соединений с неструктурированными файлами.
Анализ назначения
Конечным назначением источника данных является таблица фактов FactCurrency в базе данных AdventureWorksDW. Таблица фактов FactCurrency имеет четыре столбца и связи с двумя таблицами измерений, как показано в следующей таблице.
Имя столбца |
Тип данных |
Таблица уточняющих запросов |
Столбец подстановки |
---|---|---|---|
AverageRate |
float |
Отсутствует |
Отсутствует |
CurrencyKey |
int (FK) |
DimCurrency |
CurrencyKey (PK) |
DateKey |
Int (FK) |
DimDate |
DateKey (PK) |
EndOfDayRate |
float |
Отсутствует |
Отсутствует |
Сопоставление совместимых данных источника с назначением
Анализ форматов данных источника и назначения показывает, что для значений CurrencyKey и DateKey требуются уточняющие запросы. Преобразования, которые выполнят эти уточняющие запросы, получат значения CurrencyKey и DateKey, используя альтернативные ключи из таблиц измерений DimCurrency и DimDate.
Столбец неструктурированных файлов |
Имя таблицы |
Имя столбца |
Тип данных |
---|---|---|---|
0 |
FactCurrency |
AverageRate |
float |
1 |
DimCurrency |
CurrencyAlternateKey |
nchar(3) |
2 |
DimDate |
FullDateAlternateKey |
дата |
3 |
FactCurrency |
EndOfDayRate |
float |
Задачи занятия
Это занятие содержит следующие задачи:
Шаг 2. Добавление и настройка диспетчера соединений с неструктурированными файлами
Шаг 5. Добавление и настройка источника неструктурированных файлов
Шаг 6. Добавление и настройка преобразований «Уточняющий запрос»