Изучение модели «Потребительская корзина» (учебник по интеллектуальному анализу данных — средний уровень)
После создания модели Взаимосвязь можно изучить ее, используя средство просмотра взаимосвязей Microsoft на вкладке Средство просмотра моделей интеллектуального анализа данных конструктора интеллектуального анализа данных. В данном учебнике рассказано, как использовать средство просмотра для изучения взаимосвязей между элементами. С помощью средства просмотра можно визуально определить, какие продукты имеют тенденцию появляться вместе, а также получить общее представление о появляющихся закономерностях.
В средстве просмотра взаимосвязей Microsoft доступны три вкладки: Правила, Наборы элементов и Сеть зависимостей. Поскольку каждая вкладка отображает немного отличающееся представление данных, при изучении обычно нужно переключаться несколько раз между различными областями для понимания модели.
Вкладка «Сеть зависимостей»
Вкладка «Наборы элементов»
Вкладка «Правила»
Представление общего содержимого
В данном учебнике сначала рассматривается Сеть зависимостей, а затем использование вкладок Правила и Наборы элементов для более глубокого понимания связей, выявленных с помощью средства просмотра. Также следует использовать Средство просмотра деревьев содержимого общего вида (Майкрософт) для получения детальной статистики по отдельным правилам или наборам элементов.
Вкладка «Сеть зависимостей»
С помощью вкладки Сеть зависимостей можно исследовать взаимодействие различных элементов модели. Каждый из узлов в средстве просмотра отображает элемент, а линии между ними представляют правила. Выбрав узел, можно просмотреть, какие другие узлы предсказывают выбранный элемент, либо какие элементы предсказывает текущий элемент. В некоторых случаях между элементами возникает двухсторонняя взаимосвязь. Это означает, что они часто встречаются в одной транзакции. Чтобы определить направление связи, можно обратиться к цветовым условным обозначениям в нижней части вкладки.
Соединяющая два элемента линия означает, что такие элементы с большой долей вероятности будут присутствовать в одной транзакции. Другими словами, покупатели, скорее всего, покупают эти два элемента одновременно. Ползунок связан со значением вероятности правила. Передвигая ползунок вверх или вниз, можно отфильтровать слабые взаимосвязи, то есть правила с низкой вероятностью.
Диаграмма сети зависимостей показывает парные правила, которые могут быть представлены логически как A->B. Это означает, что если приобретается товар A, то покупка товара B имеет определенную вероятность. Диаграмма не отображает правила типа AB->C. Если переместить ползунок в положение, в котором должны отображаться все правила, а на диаграмме никакие линии не появляются, это означает, что отсутствуют парные правила, которые соответствуют критериям параметров алгоритма.
Также имеется возможность поиска узлов по имени. Для этого необходимо ввести первые буквы имени атрибута. Дополнительные сведения см. в разделе Диалоговое окно «Найти узел» (представление средства просмотра моделей интеллектуального анализа данных).
Открытие режима взаимосвязей в средстве просмотра правил взаимосвязей (Майкрософт)
В окне Обозреватель решений дважды щелкните структуру взаимосвязей.
В конструкторе интеллектуального анализа данных перейдите на вкладку Средство просмотра моделей интеллектуального анализа данных.
Выберите «Взаимосвязь» из раскрывающегося списка Модель интеллектуального анализа данных.
Перемещение по диаграмме зависимостей и поиск определенных узлов
На вкладке Средство просмотра моделей интеллектуального анализа данных щелкните вкладку Сеть зависимостей.
Несколько раз щелкните Увеличить, пока не будут четко видны метки всех узлов.
По умолчанию на диаграмме отображаются все узлы. В сложной модели может быть много узлов, из-за чего их изображение будет достаточно мелким.
Щелкните значок +, расположенный в нижнем правом углу средства просмотра, после чего нажмите и удерживайте кнопку мыши для панорамирования диаграммы.
Перетащите ползунок, расположенный в левой части средства просмотра, из положения по умолчанию Все связи в самое нижнее положение.
В результате этого на диаграмме будут отображаться только самые тесные взаимосвязи, в данном случае между шиной и камерой для шины туристического велосипеда.
Щелкните узел с меткой Камера для шины туристического велосипеда = Существует.
В результате этого на диаграмме будут выделены только те элементы, которые явно связаны с данным элементом. Обратите внимание на стрелку между двумя такими элементами.
Перетащите ползунок, расположенный в левой части средства просмотра, в среднее положение.
Обратите внимание на изменения стрелки, соединяющей такие элементы.
Выберите значение Отобразить только имя атрибута из раскрывающегося списка, расположенного вверху области «Сеть зависимостей».
После обновления текстовые метки на диаграмме будут содержать только имя модели.
В начало
Вкладка «Наборы элементов»
Далее будет рассказано о правилах и наборах элементов, сформированных моделью для шин и камер для туристических велосипедов. На вкладке Наборы элементов отображаются три важных аспекта сведений, имеющих отношение к наборам элементов, которые выявляются с алгоритмом взаимосвязей (Microsoft):
**Поддержка: **число транзакций, в которых возникает набор элементов.
**Размер: **количество элементов в наборе.
**Элементы: **список элементов, входящих в каждый набор элементов.
В зависимости от того, каким образом настроены параметры алгоритма, он может сформировать большое число наборов элементов. Каждый набор элементов, отображаемый средством просмотра, содержит сведения о транзакциях, в которых был продан определенный элемент. С помощью элементов управления в верхней части вкладки Наборы элементов, в средстве отображения можно отображать только наборы, содержащие конкретные минимальные значения числа транзакций и размера набора элементов.
Если при работе с какой-либо другой моделью интеллектуального анализа данных отсутствуют наборы элементов, это объясняется тем, что ни один из наборов элементов не удовлетворяет условиям параметров алгоритма. В такой ситуации можно изменить параметры алгоритма с целью снижения требований к наборам элементов.
Фильтр по имени наборов элементов, отображаемых в средстве просмотра
Перейдите на вкладку Наборы элементов средства просмотра.
В поле Фильтровать набор элементов введите Шина для туристического велосипеда и щелкните в любом месте за пределами поля.
В результате этого фильтр отобразит все элементы, в которых присутствует указанная строка.
В списке Отобразить выберите пункт Отобразить только имя атрибута.
Установите флажок Показывать длинное имя.
После обновления в списке наборов элементов будут отображаться только те наборы, которые содержат строку «Шина для туристического велосипеда». Длинное имя набора элементов состоит из имени таблицы, содержащей атрибут, и значения для каждого элемента.
Снимите флажок Показывать длинное имя.
После обновления в списке наборов элементов будут отображаться только короткие имена.
Значения столбца Поддержка показывают количество транзакций для каждого набора элементов. Транзакция для набора элементов означает покупку, в состав которой входят все элементы набора.
По умолчанию в средстве просмотра отображаются наборы элементов в порядке уменьшения поддержки. Чтобы выполнить сортировку по другому столбцу, например по столбцу, в котором содержится размер или имя набора элементов, следует щелкнуть заголовок такого столбца. Если требуется получить дополнительную информацию об отдельных транзакциях, которые входят в какой-либо набор элементов, можно выполнить детализацию из набора элементов до уровня отдельных вариантов. Столбцы структуры в результатах детализации представляют собой уровень доходов покупателя и идентификатор покупателя, которые в данной модели не используются.
Просмотр подробных сведений о наборе элементов
В списке наборов элементов щелкните заголовок столбца «Набор элементов», чтобы выполнить сортировку по имени.
Найдите элемент «Шина для туристического велосипеда» (без второго элемента).
Щелкните правой кнопкой мыши элемент «Шина для туристического велосипеда», выберите пункт Детализация, а затем выберите Столбцы модели и структуры.
В диалоговом окне Детализация отображаются отдельные транзакции, которые используются в качестве поддержки данного набора элементов.
Разверните вложенную таблицу vAssocSeqLineItems, чтобы просмотреть фактический список покупок в транзакции.
Фильтр набора элементов по значению поддержки или размеру
Очистите текстовое поле Фильтровать набор элементов. Использование текстового фильтра совместно с числовым фильтром не допускается.
В поле Минимальная поддержка введите 100 и щелкните где-либо в основном окне средства просмотра.
После обновления в списке наборов элементов будут отображаться только те наборы элементов, у которых поддержка имеет значение не меньше 100.
В начало
Вкладка «Правила»
На вкладке Правила отображаются следующие, связанные с правилами сведения, которые выявляет алгоритм.
**Вероятность. **Вероятность правила определяется как вероятность элемента, находящегося в правой части, при наличии элемента, находящегося в левой части.
**Важность. **Представляет собой степень полезности правила. Чем больше значение, тем лучше правило.
Важность служит для оценки полезности правила, поскольку значение одной вероятности может привести к неверным выводам. Например, если в каждой транзакции содержится фляга для воды (возможно, эта фляга предоставлялась каждому покупателю автоматически в качестве рекламной акции), модель в этом случае создаст правило, которое прогнозирует продажу фляги для воды с вероятностью 1. На основе одной вероятности данное правило имеет высокую точность, но не предоставляет полезной информации.
**Правило. **Определение правила. Для модели потребительской корзины правило описывает определенное сочетание товаров элементов.
Каждое из правил можно использовать для прогноза наличия позиции в транзакции на основе наличия других позиций. Как и на вкладке Наборы элементов, здесь можно фильтровать правила таким образом, чтобы отображались только нужные правила. Если в используемой модели интеллектуального анализа данных отсутствуют какие-либо правила, возможно, потребуется изменить параметры алгоритма, чтобы снизить порог вероятности для правил.
Просмотр правил, в которых имеется только модель велосипеда Mountain-200
На вкладке Средство просмотра моделей интеллектуального анализа данных щелкните вкладку Правила.
В поле Правило фильтра введите Mountain-200.
Снимите флажок Показывать длинное имя.
В списке Отобразить выберите пункт Отобразить только имя атрибута.
Теперь в средстве просмотра будут отображаться лишь те правила, которые содержат слова «Mountain-200». Вероятность данного правила говорит о вероятности того, что при покупке велосипеда Mountain-200 тот же человек купит также и другие перечисленные товары.
Правила отображаются в нисходящем порядке, однако можно изменить порядок сортировки, щелкнув заголовок столбца. Если существует необходимость дополнительных данных о конкретном правиле, можно получить результаты детализации для изучения поддерживаемых вариантов.
Просмотр вариантов, которые поддерживают определенное правило
На вкладке Правила щелкните правой кнопкой мыши требуемое правило.
Выберите пункт Детализация, затем выберите либо Только столбцы модели, либо Столбцы модели и структуры.
В диалоговом окне Детализация в верхней части области отображаются сводные данные о правиле и перечисляются все варианты, которые использовались для этого правила в качестве поддерживающих данных.
В начало
Средство просмотра деревьев содержимого общего вида
Это средство просмотра может использоваться для всех моделей независимо от типа модели и алгоритма. Средство просмотра деревьев содержимого общего вида (Майкрософт) доступно из раскрывающегося списка Средство просмотра.
Дерево содержимого представляет модель интеллектуального анализа данных в виде ряда узлов, каждый из которых представляет полученные знания о каком-либо подмножестве данных. Узел может содержать закономерность, набор правил, кластер или определение интервала дат, объединяемых некоторыми общими характеристиками. Конкретное содержимое узлов зависит от алгоритма и типа прогнозируемого атрибута, но общее представление содержимого одинаково. Каждый узел можно раскрыть, чтобы увеличить уровень детализации, и скопировать содержимое любого узла в буфер обмена.
Просмотр подробных сведений о правиле с помощью средства просмотра содержимого
На вкладке Средство просмотра моделей интеллектуального анализа данных выберите Средство просмотра деревьев содержимого общего вида (Майкрософт) из списка Средство просмотра.
В области «Заголовок узла» прокрутите список вниз до конца и щелкните последний узел.
В средстве просмотра будут вначале показаны наборы элементов со следующими за ними правилами, но без группировки. Самый простой способ найти определенный узел — это создать запрос к содержимому. Дополнительные сведения см. в разделе Запрос модели взаимосвязей (службы Analysis Services — интеллектуальный анализ данных).
В области «Сведения об узле» проверьте значения NODE_TYPE и NODE_DESCRIPTION.
Тип узла 8 представляет собой правило, а тип узла 7 представляет собой набор элементов. Значение NODE_DESCRIPTION для правила содержит условия, из которых состоит такое правило. Значение NODE_DESCRIPTION для набора элементов содержит элементы, включенные в набор.
Также можно создать запрос к содержимому для получения подробной статистики и правил. Дополнительные сведения о содержимом модели интеллектуального анализа данных и его интерпретации см. в разделе Содержимое моделей интеллектуального анализа данных для моделей взаимосвязей (службы Analysis Services — интеллектуальный анализ данных).
В начало
Следующая задача занятия
См. также