Шаг 2. Добавление и настройка диспетчера соединений с неструктурированными файлами
В этом задании к только что созданному пакету будет добавлен диспетчер соединений с неструктурированными файлами. Диспетчер соединений с неструктурированными файлами позволяет пакету извлекать данные из неструктурированных файлов. С помощью диспетчера соединений с неструктурированными файлами можно указать имя и расположение файла, локали и кодовую страницу, а также формат файла, включая разделители столбцов. Эти данные будут использованы при извлечении пакета из неструктурированного файла. Кроме того, можно вручную указать тип данных для каждого столбца или в диалоговом окне Предлагаемые типы столбцов указать автоматическое сопоставление столбцов извлекаемых данных с типами данных в службах Службы Integration Services.
Для каждого используемого формата файла необходимо создать отдельный диспетчер соединений с неструктурированными файлами. Так как в данном учебнике данные извлекаются из неструктурированных файлов одинакового формата, в пакет необходимо добавить только один диспетчер соединений с неструктурированными файлами.
В этом учебнике предстоит настроить следующие свойства диспетчера соединений с неструктурированными файлами:
Имена столбцов. Так как в неструктурированном файле не указаны имена столбцов, диспетчер соединений с неструктурированными файлами создает имена столбцов по умолчанию. Указанные имена по умолчанию не дают представления о содержащихся в столбцах данных. Чтобы сделать имена по умолчанию более понятными, следует заменить их именами, взятыми из таблицы фактов, в которую производится загрузка данных из неструктурированных файлов.
Сопоставление данных. Сопоставление типов данных, указанное для диспетчера соединений с неструктурированными файлами, используется всеми компонентами источников данных «неструктурированный файл», которые обращаются к диспетчеру соединений. Можно сопоставить типы данных вручную с помощью диспетчера соединений с неструктурированными файлами или использовать диалоговое окно Предлагаемые типы столбцов. В данном учебнике предстоит просмотреть сопоставления, предложенные в диалоговом окне Предлагаемые типы столбцов, а затем вручную создать необходимые сопоставления в диалоговом окне Редактор диспетчера соединений с неструктурированными файлами.
Диспетчер соединений с неструктурированными файлами предоставляет сведения о локали файла данных. Если компьютер не настроен на использование региональных параметров «Русский (Россия)», нужно установить дополнительные свойства в диалоговом окне Редактор диспетчера соединений с неструктурированными файлами.
Добавление диспетчера соединений с неструктурированными файлами в пакет служб SSIS
Щелкните правой кнопкой мыши область Диспетчеры соединений и выберите команду Создать соединение с неструктурированным файлом.
В диалоговом окне Редактор диспетчера соединений с неструктурированными файлами в поле Имя диспетчера соединений введите «Образец источника данных "неструктурированный файл"».
Нажмите кнопку Обзор.
В диалоговом окне Открыть найдите файл SampleCurrencyData.txt на компьютере.
Образцы данных включаются в состав с пакетами занятий по службам Службы SSIS. Чтобы загрузить образцы данных и пакеты занятий, выполните следующие действия.
Перейдите к образцам продуктов служб Integration Services.
Перейдите на вкладку DOWNLOADS.
Щелкните файл SQL2012.Integration_Services.Create_Simple_ETL_Tutorial.Sample.zip.
Снимите флажок «Имена столбцов в первой строке данных».
Установка свойств, зависящих от локали и региональных стандартов
В диалоговом окне Редактор диспетчера соединений с неструктурированными файлами нажмите кнопку Общие.
Установите свойство Локаль в значение «Русский (Россия)», а свойство Кодовая страница в значение 1251.
Переименование столбцов диспетчера соединений с неструктурированными файлами
В диалоговом окне Редактор диспетчера соединений с неструктурированными файлами нажмите кнопку Дополнительно.
На панели свойств сделайте следующие изменения.
Измените имя Column 0 на AverageRate.
Измените имя Column 1 на CurrencyID.
Измените имя Column 2 на CurrencyDate.
Измените имя Column 3 на EndOfDayRate.
Примечание По умолчанию для всех четырех столбцов указан строковый тип данных [DT_STR] со значением параметра OutputColumnWidth, равным 50.
Сопоставление типов данных столбцов
В диалоговом окне Редактор диспетчера соединений с неструктурированными файлами нажмите кнопку Предложить типы.
Службы Службы Integration Services автоматически предлагают большинство соответствующих типов данных на основании первых 200 строк данных. Можно изменить параметры предложения по большему или меньшему количеству данных, чтобы указать тип данных по умолчанию для целочисленных и логических данных или чтобы добавить пробелы в дополнение к строковым столбцам.
На данный момент не изменяйте значения параметров в диалоговом окне Предполагаемые типы столбцов и нажмите кнопку ОК, чтобы службы Службы Integration Services предложили типы данных для столбцов. Вернется панель Дополнительно диалогового окна Редактор диспетчера соединений с неструктурированными файлами, где можно просмотреть типы данных столбцов, предложенные службами Службы Integration Services. (Если нажать кнопку Отмена, предположения по поводу метаданных столбца и используемому типу данных строки по умолчанию (DT_STR) сделаны не будут.)
В этом учебнике для данных из файла SampleCurrencyData.txt в службах Службы Integration Services предлагаются типы данных, приведенные во втором столбце следующей ниже таблицы. Типы данных, требуемые для столбцов назначения, которые будут определены позже, приведены в последнем столбце следующей ниже таблицы.
Столбец неструктурированных файлов
Предложенный тип
Целевой столбец
Тип назначения
AverageRate
float [DT_R4]
FactCurrency.AverageRate
float
CurrencyID
string [DT_STR]
DimCurrency.CurrencyAlternateKey
nchar(3)
CurrencyDate
date [DT_DATE]
DimDate.FullDateAlternateKey
date
EndOfDayRate
float [DT_R4]
FactCurrency.EndOfDayRate
float
Тип данных, предложенный для столбца CurrencyID, несовместим с типом данных поля целевой таблицы. Необходимо изменить тип данных столбца CurrencyID со строкового [DT_STR] на строковый [DT_WSTR], так как типом данных поля DimCurrency.CurrencyAlternateKey является nchar (3). Кроме того, поле DimDate.FullDateAlternateKey определяется в качестве типа данных date, поэтому необходимо изменить тип параметра CurrencyDate с типа даты [DT_Date] на тип даты базы данных [DT_DBDATE].
Выберите из списка столбец CurrencyID, после чего на панели свойств измените тип данных столбца CurrencyID со строкового [DT_STR] на тип строки в Юникоде [DT_WSTR].
На панели свойств измените тип данных столбца CurrencyDate с типа даты [DT_DATE] на тип даты базы данных [DT_DBDATE].
Нажмите кнопку ОК.
Следующая задача занятия
Шаг 3. Добавление и настройка диспетчера соединений OLE DB