Добавление представления источника данных с вложенными таблицами (учебник по интеллектуальному анализу данных — средний уровень)
Чтобы создать модель интеллектуального анализа данных, которая будет использоваться для анализа покупательского поведения, необходимо создать новое представление источника данных. Это представление также будет использоваться в сценарии кластеризации последовательностей.
Это представление источника данных отличается от других, с которыми выполнялись предыдущие операции, поскольку оно содержит вложенную таблицу. Вложенная таблица — это таблица, содержащая несколько строк сведений об одной строке в таблице вариантов. Например, если модель анализирует покупательское поведение клиентов, в качестве таблицы вариантов обычно используется таблица, в которой каждому клиенту соответствует уникальная строка. Однако каждый клиент может совершить несколько покупок, и может понадобиться проанализировать последовательность покупок или товары, которые часто приобретаются вместе. Чтобы логически представить такие покупки в модели, в представление источника данных добавляется другая таблица, в которой перечислены покупки для каждого клиента. Эта вложенная таблица покупок имеет связь «многие к одному» с таблицей клиентов. Вложенная таблица может содержать множество строк для каждого клиента, а в каждой строке будет указываться отдельный приобретенный товар и, возможно, дополнительные сведения о заказе, в рамках которого были совершены покупки, цена на момент заказа и действующие специальные акции. Сведения вложенной таблицы можно использовать в качестве входных данных для модели или прогнозируемого атрибута.
В этом занятии будет добавлено новое представление источника данных к источнику данных AdventureWorksDW2008, в это представление будут добавлены таблица вариантов и вложенная таблица, а также указана связь «многие к одному» между таблицей вариантов и вложенной таблицей. Этот процесс состоит из двух частей.
Сначала определяется связь между таблицей вариантов и вложенной таблицей.
Затем задается способ использования столбцов данных в модели.
Важно правильно задать связь между таблицей вариантов и вложенной таблицей, чтобы избежать ошибок при обработке модели. Дополнительные сведения о работе с таблицами вариантов и вложенными таблицами, а также о выборе ключа вложенной таблицы см. в разделе Вложенные таблицы (службы Analysis Services — интеллектуальный анализ данных).
Добавление представления источника данных
В обозревателе решений щелкните правой кнопкой мыши элемент Представления источников данных и выберите команду Создать представление источника данных.
Будет открыт мастер представлений источников данных.
На странице Мастер представлений источников данных щелкните Далее.
На странице Выбор источника данных в меню Реляционные источники данных выберите источник данных Adventure Works DW2008, созданный в учебнике по интеллектуальному анализу данных (начальный уровень). Нажмите кнопку Далее.
На странице Выбор таблиц и представлений выберите следующие таблицы, а затем щелкните стрелку вправо, чтобы включить их в новое представление источника данных.
vAssocSeqOrders
vAssocSeqLineItems
Нажмите кнопку Далее.
На странице Завершение работы мастера по умолчанию представление источника данных имеет имя Adventure Works DW2008. Измените это имя на Заказы и нажмите кнопку Готово.
Откроется конструктор представлений источников данных, где будет отображено представление источника данных Заказы.
Создание новой связи между таблицами
В конструкторе представлений источников данных расположите две таблицы горизонтально друг напротив друга, поместив таблицу vAssocSeqLineItems слева, а vAssocSeqOrders — справа.
Выделите столбец OrderNumber в таблице vAssocSeqLineItems.
Перетащите этот столбец на столбец OrderNumber таблицы vAssocSeqOrders.
Важно! Обязательно перетащите столбец OrderNumber из вложенной таблицы vAssocSeqLineItems, которая представляет сторону соединения «многие», в таблицу вариантов vAssocSeqOrders, которая представляет сторону соединения «один».
Между таблицами vAssocSeqLineItems и vAssocSeqOrders создана новая связь многие к одному. Если соединение таблиц выполнено правильно, должно появиться следующее представление источника данных:
Следующая задача занятия
См. также