Поделиться через


Занятие 1. Создание проекта и основного пакета

На этом занятии будет рассмотрено создание простого ETL-пакета, который будет извлекать данные из отдельного источника неструктурированных файлов, преобразовывать полученные данные при помощи двух компонентов преобразования «Уточняющий запрос», а затем записывать эти данные в таблицу фактов FactCurrency, находящуюся в базе данных AdventureWorksDW2012. На этом занятии предстоит узнать, как создавать новые пакеты, добавлять и настраивать соединения с источниками данных и назначениями, а также работать с новыми компонентами потока управления и потока данных.

Важное примечаниеВажно!

Для выполнения упражнений этого учебника потребуется образец базы данных AdventureWorksDW2012. Дополнительные сведения об установке и развертывании базы данных AdventureWorksDW2012 см. в разделе Приступая к работе с образцами SQL Server и баз данных.

Основные сведения о требованиях пакета

Для выполнения упражнений этого учебника требуется Microsoft SQL Server Data Tools.

Дополнительные сведения об установке SQL Server Data Tools см. в разделе Загрузка SQL Server Data Tools.

Перед созданием пакета необходимо знать о форматировании в источнике данных и в назначении. Если эти форматы данных известны, можно определить преобразования, необходимые для сопоставления формата данных источника формату назначения.

Анализ источника

Для этого учебника данные источника представлены в виде набора курсов валют, содержащегося в неструктурированном файле SampleCurrencyData.txt. Исходные данные указаны в следующих четырех столбцах: средний курс валюты, ключ валюты, ключ даты и курс на конец дня.

Здесь приведен пример данных источника, содержащихся в файле SampleCurrencyData.txt:

1.00070049USD9/3/05 0:001.001201442

1.00020004USD9/4/05 0:001

1.00020004USD9/5/05 0:001.001201442

1.00020004USD9/6/05 0:001

1.00020004USD9/7/05 0:001.00070049

1.00070049USD9/8/05 0:000.99980004

1.00070049USD9/9/05 0:001.001502253

1.00070049USD9/10/05 0:000.99990001

1.00020004USD9/11/05 0:001.001101211

1.00020004USD9/12/05 0:000.99970009

При работе с данными источника неструктурированных файлов важно понимать, как диспетчер соединений с неструктурированными файлами интерпретирует данные неструктурированных файлов. Если неструктурированный файл является документом в Юникоде, диспетчер соединений с неструктурированными файлами определяет все столбцы как [DT_WSTR] с шириной, по умолчанию равной 50. Если неструктурированный файл является документом в кодировке ANSI, все столбцы определяются как [DT_STR] с шириной, равной 50. Возможно, потребуется изменить эти настройки, чтобы оптимизировать столбцы для конкретных данных. Чтобы сделать это, необходимо узнать тип данных в назначении, куда будут заноситься эти данные, а затем выбрать правильный тип данных в диспетчере соединений с неструктурированными файлами.

Анализ назначения

Конечным назначением источника данных является таблица фактов FactCurrency в базе данных AdventureWorksDW. Таблица фактов FactCurrency имеет четыре столбца и связи с двумя таблицами измерений, как показано в следующей таблице.

Имя столбца

Тип данных

Таблица уточняющих запросов

Столбец подстановки

AverageRate

float

Отсутствует

Отсутствует

CurrencyKey

int (FK)

DimCurrency

CurrencyKey (PK)

DateKey

Int (FK)

DimDate

DateKey (PK)

EndOfDayRate

float

Отсутствует

Отсутствует

Сопоставление совместимых данных источника с назначением

Анализ форматов данных источника и назначения показывает, что для значений CurrencyKey и DateKey требуются уточняющие запросы. Преобразования, которые выполнят эти уточняющие запросы, получат значения CurrencyKey и DateKey, используя альтернативные ключи из таблиц измерений DimCurrency и DimDate.

Столбец неструктурированных файлов

Имя таблицы

Имя столбца

Тип данных

0

FactCurrency

AverageRate

float

1

DimCurrency

CurrencyAlternateKey

nchar(3)

2

DimDate

FullDateAlternateKey

дата

3

FactCurrency

EndOfDayRate

float

Задачи занятия

Это занятие содержит следующие задачи:

Начало занятия

Шаг 1. Создание нового проекта служб Integration Services