Поделиться через


Добавление представления источника данных с вложенными таблицами (учебник по интеллектуальному анализу данных — средний уровень)

Чтобы создать модель интеллектуального анализа данных, которая будет использоваться для анализа покупательского поведения, необходимо создать новое представление источника данных. Это представление также будет использоваться в сценарии кластеризации последовательностей.

Это представление источника данных отличается от других, с которыми выполнялись предыдущие операции, поскольку оно содержит вложенную таблицу. Вложенная таблица — это таблица, содержащая несколько строк сведений об одной строке в таблице вариантов. Например, если модель анализирует покупательское поведение клиентов, в качестве таблицы вариантов обычно используется таблица, в которой каждому клиенту соответствует уникальная строка. Однако каждый клиент может совершить несколько покупок, и может понадобиться проанализировать последовательность покупок или товары, которые часто приобретаются вместе. Чтобы логически представить такие покупки в модели, в представление источника данных добавляется другая таблица, в которой перечислены покупки для каждого клиента. Эта вложенная таблица покупок имеет связь «многие к одному» с таблицей клиентов. Вложенная таблица может содержать множество строк для каждого клиента, а в каждой строке будет указываться отдельный приобретенный товар и, возможно, дополнительные сведения о заказе, в рамках которого были совершены покупки, цена на момент заказа и действующие специальные акции. Сведения вложенной таблицы можно использовать в качестве входных данных для модели или прогнозируемого атрибута.

В этом занятии будет добавлено новое представление источника данных к источнику данных AdventureWorksDW2008, в это представление будут добавлены таблица вариантов и вложенная таблица, а также указана связь «многие к одному» между таблицей вариантов и вложенной таблицей. Этот процесс состоит из двух частей.

  • Сначала определяется связь между таблицей вариантов и вложенной таблицей.

  • Затем задается способ использования столбцов данных в модели.

Важно правильно задать связь между таблицей вариантов и вложенной таблицей, чтобы избежать ошибок при обработке модели. Дополнительные сведения о работе с таблицами вариантов и вложенными таблицами, а также о выборе ключа вложенной таблицы см. в разделе Вложенные таблицы (службы Analysis Services — интеллектуальный анализ данных).

Добавление представления источника данных

  1. В обозревателе решений щелкните правой кнопкой мыши элемент Представления источников данных и выберите команду Создать представление источника данных.

    Будет открыт мастер представлений источников данных.

  2. На странице Мастер представлений источников данных щелкните Далее.

  3. На странице Выбор источника данных в меню Реляционные источники данных выберите источник данных Adventure Works DW2008, созданный в учебнике по интеллектуальному анализу данных (начальный уровень). Нажмите кнопку Далее.

  4. На странице Выбор таблиц и представлений выберите следующие таблицы, а затем щелкните стрелку вправо, чтобы включить их в новое представление источника данных.

    • vAssocSeqOrders

    • vAssocSeqLineItems

  5. Нажмите кнопку Далее.

  6. На странице Завершение работы мастера по умолчанию представление источника данных имеет имя Adventure Works DW2008. Измените это имя на Заказы и нажмите кнопку Готово.

    Откроется конструктор представлений источников данных, где будет отображено представление источника данных Заказы.

Создание новой связи между таблицами

  1. В конструкторе представлений источников данных расположите две таблицы горизонтально друг напротив друга, поместив таблицу vAssocSeqLineItems слева, а vAssocSeqOrders — справа.

  2. Выделите столбец OrderNumber в таблице vAssocSeqLineItems.

  3. Перетащите этот столбец на столбец OrderNumber таблицы vAssocSeqOrders.

    Важное примечаниеВажно!

    Обязательно перетащите столбец OrderNumber из вложенной таблицы vAssocSeqLineItems, которая представляет сторону соединения «многие», в таблицу вариантов vAssocSeqOrders, которая представляет сторону соединения «один».

    Между таблицами vAssocSeqLineItems и vAssocSeqOrders создана новая связь многие к одному. Если соединение таблиц выполнено правильно, должно появиться следующее представление источника данных:

    ожидаемое соединение «многие к одному» вложенной таблицы и таблицы вариантов