Поделиться через


Изучение модели прогнозирования (учебник по интеллектуальному анализу данных — средний уровень)

После создания модели интеллектуального анализа для прогнозирования полученные результаты можно изучить на вкладке Средство просмотра моделей интеллектуального анализа данных конструктора интеллектуального анализа данных. Средство просмотра временных рядов (Майкрософт) содержит две вкладки: Диаграммы и Модель.

Созданная модель интеллектуального анализа данных прогнозирования описывает продажи товаров в трех различных регионах — Европе, Северной Америке и Тихоокеанском регионе за 2001–2004 годы. В соответствии с этим алгоритм временных рядов (Майкрософт) создает одну модель временных рядов, которая содержит несколько деревьев, в каждом из которых содержится различное сочетание из региона, товара и прогнозируемого атрибута.

Каждая из вкладок средства просмотра позволяет получить различное представление сведений, имеющихся во всей модели временных рядов.

  • Вкладка «Диаграммы»

  • Вкладка «Модель»

  • Представление общего содержимого

Вкладка «Диаграммы»

На вкладке Диаграммы средства просмотра временных рядов (Майкрософт) в графическом виде отображаются все деревья, созданные алгоритмом. Дерево временного ряда содержит в себе уникальное сочетание из товара, региона и прогнозируемого атрибута.

В условных обозначениях, расположенных в правой части средства просмотра, перечислены выбранные в раскрывающемся списке временные ряды вместе с соответствующими им флажками. Устанавливая и снимая соответствующие флажки в условных обозначениях, можно управлять отображением временных рядов в средстве просмотра.

Также можно изменить такие параметры отображения, как цвет каждого временного ряда, либо просмотреть значения любой точки диаграммы.

Выбор временных рядов

  1. Перейдите на вкладку Диаграммы вкладки Средство просмотра моделей интеллектуального анализа данных, если она еще не открыта.

  2. Установите все флажки в раскрывающемся списке, расположенном справа от представления диаграммы. На диаграмме должны располагаться 24 различные линии рядов.

  3. Нажмите кнопку ОК.

  4. Снимите флажки, расположенные справа от диаграммы, чтобы временно скрыть строки всех рядов на основе значения Amount.

  5. Теперь снимите флажки, связанные с моделями велосипедов R750 и R250.

    В результате этих действий сейчас на диаграмме представлены следующие 6 линий рядов, что позволяет упростить сравнение трендов для моделей велосипедов M200 и T1000.

    • M200 Europe: Quantity

    • M200 North America: Quantity

    • M200 Pacific: Quantity

    • T1000 Europe: Quantity t

    • T1000 North America: Quantity

    • T1000 Pacific: Quantity

Ряды, прогнозирующие количество M200 и T1000Ряды, прогнозирующие количество M200 и T1000

Диаграмма отображает как данные с предысторией, так и прогнозируемые данные. Прогнозируемые данные выделены затенением, чтобы они отличались от исторических. Для упрощения сравнения различных рядов можно изменить цвета, соответствующие каждой линии графа. Дополнительные сведения см. в разделе Как изменить цвета, используемые в средстве просмотра интеллектуального анализа данных.

Линии трендов показывают, что общий объем продаж по всем регионам в целом растет, при этом пик наступает каждые 12 месяцев в декабре. В целом прогнозы предсказывают продолжение этого тренда. Анализируя данную диаграмму, можно также сказать, что велосипеды модели T1000 имеют не такой большой объем исторических данных, как другие ряды товаров.

По умолчанию службы Analysis Services показывают пять этапов прогнозирования для каждого временного ряда. Количество этапов прогнозирования можно увеличить или уменьшить. Также можно графически отобразить стандартное отклонение для прогноза путем добавления в диаграмму значений погрешностей.

Изменение параметров прогноза и отображения в представлении диаграммы

  1. Измените значение Этапы прогнозирования последовательно от 5 до 10, а затем обратно до 6.

    Обратите внимание, что прогнозируемая амплитуда колебаний возрастает для тех линий трендов, которые соответствуют данным со значительной амплитудой колебаний в прошлом.

  2. Установите флажок Отображать отклонения.

  3. Наведите указатель мыши на планки погрешностей для ряда модели M200.

  4. Наведите указатель мыши на планки погрешностей для ряда модели T1000, продаваемой в Тихоокеанском регионе.

Эти результаты будут использоваться для дальнейшего анализа. Позднее будет разработана усредненная по всем регионам модель, не подверженная таким значительным колебаниям.

В начало

Вкладка «Модель»

Вкладка Модель средства просмотра временных рядов (Майкрософт) в конструкторе интеллектуального анализа данных позволяет просматривать временные ряды в виде диаграммы дерева принятия решений. Для каждого ряда модели вычисляется отдельное дерево. В модели временных рядов диаграмма дерева принятия решений может иметь единственный узел, если временной ряд линейный, или несколько узлов и условий, связанных с каждой веткой, как и обычное дерево принятия решений.

Узлы временных рядов диаграммы дерева принятия решений содержат различные типы сведений.

  • Концентрация вариантов состояния прогнозируемого атрибута, которая задается в элементе управления Окружение. Точное число вариантов указано в окне Условные обозначения узла, а также во всплывающих подсказках, которые появляются при наведении указателя мыши на объект дерева.

  • Формула регрессии для узла. Формула регрессии ARTXP может использоваться только в конечных узлах. Уравнение ARIMA может использоваться в корневом узле дерева.

  • Диаграмма-ромб, отображающая диапазон атрибута. Ромб расположен в точке среднего арифметического для узла, ширина ромба отражает дисперсию атрибута в этом узле.

Просмотр дерева принятия решений для модели временных рядов

  1. В списке Дерево на вкладке Модель средства просмотра выберите ряд M200 North America: Amount.

    На диаграмме будет отображен единственный узел.

  2. Наведите курсор мыши на узел.

    Для узла Все всплывающая подсказка будет содержать такие данные, как количество вариантов во всем ряду и уравнения временного ряда, полученные в ходе анализа данных.

  3. Щелкните узел, чтобы просмотреть Обозначения интеллектуального анализа данных.

    Обозначения интеллектуального анализа данных содержат информацию, аналогичную всплывающим подсказкам, и дополнительные сведения, включая гистограмму значений.

  4. В списке Дерево на вкладке Модель средства просмотра выберите ряд M200 Pacific: Amount.

    Диаграмма дерева сейчас включает в себя узел Все и два дочерних узла. Текст в дочерних узлах описывает условия, которые привели к разветвлению дерева.

  5. Наведите курсор мыши на один из дочерних узлов и изучите содержимое всплывающей подсказки. Кроме того, можно щелкнуть узел и просмотреть Обозначения интеллектуального анализа данных.

    В описании дочерних узлов приводится количество вариантов в каждой ветке дерева и любые дополнительные условия, которые привели к его разветвлению.

В начало

Средство просмотра деревьев содержимого общего вида

В дополнение к собственному средству просмотра временных рядов, службы Analysis Services предоставляют возможность использовать Средство просмотра деревьев содержимого общего вида(Майкрософт). Это средство просмотра может использоваться для всех моделей интеллектуального анализа данных независимо от используемого алгоритма. Средство просмотра деревьев содержимого общего вида доступно из раскрывающегося списка Средство просмотра.

В данном средстве просмотра каждая модель интеллектуального анализа данных, независимо от данных или используемого для анализа алгоритма, представлена в виде дерева, содержащего ряд узлов. Каждый узел представляет полученные знания о некотором подмножестве данных. Конкретное содержимое узлов зависит от алгоритма и типа прогнозируемого атрибута, но общая схема содержимого одинакова.

Поскольку созданная модель интеллектуального анализа данных представляет собой смешанную модель, в которой используются алгоритмы ARTXP и ARIMA, службы Analysis Services используют каждый из алгоритмов для создания отдельных моделей ARTXP и ARIMA для каждого временного ряда. При использовании средства просмотра временных рядов (Майкрософт) для изучения модели интеллектуального анализа данных для прогнозирования службы Analysis Services совмещают результаты двух алгоритмов и отображают модель в виде единого дерева, в котором каждый узел содержит информацию, полученную из обоих алгоритмов.

Однако, когда используется Средство просмотра деревьев содержимого общего вида(Майкрософт), содержимое, сформированное каждым алгоритмом, отображается в модели интеллектуального анализа данных для прогнозирования в виде двух узлов разного типа. Можно выполнить детализацию углублением сведений о модели, полученных с помощью алгоритма ARTXP или ARIMA.

Просмотр сведений для определенного ряда данных в средстве просмотра содержимого общего вида

  1. На вкладке Средство просмотра моделей интеллектуального анализа данных выберите Средство просмотра деревьев содержимого общего вида (Майкрософт) из раскрывающегося списка Средство просмотра.

  2. В области Заголовок узла щелкните самый верхний узел («Все»).

  3. В области Сведения об узле обратите внимание на значение ATTRIBUTE_NAME.

    Данное значение указывает, какой ряд, или сочетание товара и региона, содержится в этом узле. В примере с фирмой AdventureWorks самый верхний узел соответствует ряду M200 Europe.

  4. В области Заголовок узла найдите первый узел, у которого присутствуют дочерние узлы.

    Если узел ряда имеет дочерние узлы, представление дерева, которое отображается на вкладке Модель средства просмотра временных рядов (Майкрософт), также будет иметь разветвленную структуру.

  5. Разверните узел и щелкните один из его дочерних узлов.

    Столбец NODE_DESCRIPTION схемы содержит условие, которые привело к разветвлению дерева.

  6. В области Заголовок узла щелкните самый верхний узел ARIMA и разверните его таким образом, чтобы отобразились все дочерние узлы.

  7. В области Сведения об узле обратите внимание на значение ATTRIBUTE_NAME.

    Данное значение указывает, какой ряд содержится в этом узле. Самый верхний узел в разделе ARIMA должен совпадать с самым верхним узлом в разделе («Все»). В примере с фирмой AdventureWorks данный узел содержит результаты алгоритма ARIMA для ряда M200 Europe.

Дополнительные сведения см. в разделе Содержимое модели интеллектуального анализа данных для моделей временных рядов (службы Analysis Services — интеллектуальный анализ данных).

В начало