Поделиться через


Изучение модели прогнозирования (пошаговое руководство по интеллектуальному анализу данных)

Теперь, когда вы создали модель прогнозирования интеллектуального анализа данных, вы можете изучить результаты, используя вкладку "Просмотрщик моделей" в конструкторе интеллектуального анализа данных. Средство просмотра временных рядов Майкрософт содержит две вкладки: диаграммы и модель.

Кроме того, вы можете использовать Microsoft Generic Tree Viewer со всеми моделями. Каждый вид представляет слегка изменяющуюся картину данных в модели временных рядов.

Вкладка "Диаграммы"

Вкладка "Диаграммы " в средстве просмотра временных рядов Майкрософт графически показывает каждую из рядов, включая исторические данные и прогнозы. Каждая строка в графе временных рядов представляет собой уникальное сочетание продуктов, регионов и прогнозируемых атрибутов.

Легенда справа от средства просмотра перечисляет доступные временные последовательности на основе выбранных элементов в раскрывающемся списке. Вы можете выбрать и снять флажки в условных обозначениях, чтобы контролировать, какие временные ряды отображаются в графе.

Вы также можете изменить параметры отображения, такие как цвета, используемые для каждого временных рядов, или отображаться ли значения в точках диаграммы.

Выбор временных рядов

  1. Перейдите на вкладку " Диаграммы " на вкладке "Средство просмотра моделей интеллектуального анализа данных ", если оно не отображается.

  2. Щелкните раскрывающийся список справа от представления диаграммы и установите все флажки. Нажмите кнопку ОК.

    Теперь диаграмма должна содержать 24 разных линий рядов.

  3. В полях справа от диаграммы снимите флажки, чтобы временно скрыть линии для всех рядов, основанных на значении 'Сумма'.

    Теперь снимите флажки, связанные с велосипедами R750 и R250.

    Диаграмма теперь содержит только следующие шесть линий серии, чтобы можно было проще сравнить тенденции для велосипедов M200 и T1000.

    • M200 Европа: Количество

    • M200 Северная Америка: Количество

    • M200 Pacific: Количество

    • T1000 Европа: Количество

    • T1000 Северная Америка: Количество

    • T1000 Pacific: Количество

Серия, предсказывающая количество M200 и T1000

Диаграмма, отображаемая в этом средстве просмотра, включает как исторические, так и прогнозируемые данные. Прогнозируемые данные затеняются, чтобы отличить их от исторических данных. Чтобы упростить сравнение различных рядов, можно также изменить цвета, связанные с каждой строкой в графе. Дополнительные сведения см. в разделе "Изменение цветов", используемых в средстве просмотра интеллектуального анализа данных.

Из линий тренда видно, что общий объем продаж для всех регионов обычно увеличивается, с пиком каждые 12 месяцев в декабре. На диаграмме можно также увидеть, что данные для велосипеда T1000 начинаются гораздо позже, чем данные для другой серии продуктов. Это связано с тем, что это более новый продукт, но поскольку эта серия основана на гораздо меньше данных, прогнозы могут быть не столь точными.

По умолчанию для каждого временных рядов отображаются пять шагов прогнозирования, отображаемых как пунктирные строки. Это значение можно изменить, чтобы просмотреть больше или меньше прогнозов. Вы также можете графически просмотреть стандартное отклонение прогнозов, добавив в диаграмму полосы ошибок.

Изменить параметры прогнозирования и отображения в режиме диаграммы

  1. Попробуйте постепенно изменить значение для шагов прогнозирования , увеличив его с 5 до 10, а затем вернуться к 6.

    Если исторические данные имеют большие колебания, колебания, как правило, повторяются или даже увеличиваются при увеличении числа прогнозов. Возможно, вам нужно выполнить некоторые исследования на этом этапе, чтобы понять причину большого увеличения исторических данных, а затем решить, следует ли принимать эти результаты, искать какой-то исправление в исходных данных или применять какой-то сглаживание в модели.

  2. Установите флажок "Показать отклонения ".

    Этот параметр отображает предполагаемую ошибку для каждого прогнозируемого значения.

  3. Обратите внимание на масштаб оси X. Изменения по сравнению с историческими и прогнозируемыми данными всегда выражаются в процентах, но фактические значения настраиваются автоматически, чтобы соответствовать всем значениям на графе. Поэтому при сравнении моделей необходимо быть осторожным, чтобы не полагаться только на визуальные элементы. Чтобы получить точное значение, или процентное увеличение и значение прогнозов, наведите курсор мыши на пунктирную или сплошную линии, или щелкните по линиям, чтобы просмотреть значения в Легенда анализа.

    Совет: Если легенда анализа данных не отображается, перейдите в представление модели, щелкните правой кнопкой мыши по любому узлу и выберите Показать легенду.

Из анализа этих тенденций вы обеспокоены отсутствием данных для некоторых серий и задаетесь вопросом, можете ли вы получить более надежные прогнозы путем усреднения продаж по модели или, возможно, усреднением продаж по регионам. Вы изучите этот подход в следующем уроке в этом руководстве.

В начало

Вкладка "Модель"

Вкладка "Модель " средства просмотра временных рядов Майкрософт в конструкторе интеллектуального анализа данных позволяет просматривать модель прогнозирования в виде диаграммы дерева.

Во-первых, обратите внимание на то, что данные описывают две разные меры (количество и количество) для продаж нескольких линий продуктов (T1000 и т. д.) в трех разных регионах (Европа, Северная Америка и Тихоокеанский регион), созданная модель фактически содержит 24 различных деревьев, каждое дерево, представляющее модель шаблонов продаж для разного сочетания регионов, продуктов, и прогнозируемый атрибут.

Вы можете выбрать сочетание линейки продуктов, региона и метрик продаж, которые вы хотите просмотреть, выбрав ряд из раскрывающегося списка "Дерево " на вкладке "Модель ".

Так что можно узнать о просмотре модели в виде дерева? В качестве примера давайте сравним две модели: одну с несколькими уровнями в дереве и одну с одним узлом.

  • Если диаграмма дерева содержит один узел, это означает, что тенденция, найденная в модели, в основном однородна с течением времени. Этот один узел с меткой All можно использовать для просмотра формулы, описывающей связь между входными переменными и результатом.

  • Если диаграмма дерева для временных рядов имеет несколько ветвей, это означает, что обнаруженные временные ряды слишком сложны для представления в виде одного уравнения. Вместо этого диаграмма дерева может содержать несколько ветвей, каждая ветвь с меткой условий, вызвавших разделение дерева. Когда дерево разбивается, каждая ветвь представляет собой другой сегмент времени, внутри которого тенденция может быть описана как одно уравнение.

    Например, если вы посмотрите на диаграмму и увидите внезапный скачок объема продаж, начинающийся в сентябре и продолжающийся до новогодних праздников, вы можете переключиться в режим модели, чтобы увидеть точную дату изменения тренда. Ветви дерева, представляющие "до сентября" и "после сентября", будут содержать разные формулы: одна формула, которая математически описывает тенденции продаж до момента разделения, и другая формула, описывающая тенденции продаж с сентября до конца года, включая праздничный период.

Изучение дерева принятия решений для модели временных рядов

  1. В списке «Дерево» на вкладке «Модель» средства просмотра выберите серию T1000 Europe: количество.

    Щелкните узел с меткой "Все".

    Для узла All подсказка, которая отображается, содержит такие сведения, как количество случаев в целом ряде и уравнения временных рядов, производные от анализа данных.

  2. Если Легенда майнинга не отображается, щелкните узел правой кнопкой мыши и выберите Показать легенду.

    Легенда добычи предоставляет те же сведения, что и в тултипе. Если какие-либо независимые переменные являются дискретными, вы также увидите гистограмму, которая показывает распределение переменных в узле.

  3. Теперь выберите другой временный ряд для просмотра. Используя список Tree на вкладке Model средства просмотра, выберите серию M200 Северная Америка: Сумма.

    Теперь граф дерева содержит все узлы и два дочерних узла. Просмотрев метки на дочерних узлах, вы можете понять, в какой момент линия тренда изменилась.

    Для каждого дочернего узла описание в легенде майнинга также включает количество случаев в каждой ветви дерева.

В следующем списке описаны некоторые дополнительные функции в средстве просмотра деревьев:

  • Переменную, представленную на диаграмме, можно изменить с помощью элемента управления Background . По умолчанию узлы, которые являются темными, содержат больше случаев, так как для параметра Background задано значение "Население". Чтобы увидеть, сколько случаев есть в узле, приостановите указатель мыши над узлом и просмотрите подсказку, которая отображается, или щелкните узел и просмотрите числа в окне Легенда узла.

  • Формулу регрессии для узла также можно просмотреть в подсказке или щелкнув узел. Если вы создали смешанную модель, можно увидеть две формулы, одну для ARTXP (на конечных узлах) и одну для ARIMA (в корневом узле дерева).

  • Маленькие алмазы используются на узлах, представляющих непрерывные числа. Диапазон атрибутов отображается на панели, на которой находится алмаз. Диамант располагается на среднем значении для узла, а его ширина отражает дисперсию атрибута на этом узле.

В начало

(Необязательно) Средство просмотра универсального дерева содержимого

Помимо пользовательского средства просмотра временных рядов служба Analysis Services предоставляет средство просмотра дерева содержимого MicrosoftGeneric для использования со всеми моделями интеллектуального анализа данных. Это средство просмотра предоставляет некоторые преимущества:

  • Средство просмотра временных рядов Майкрософт: это представление объединяет результаты двух алгоритмов. Хотя вы можете просматривать каждую серию отдельно, нельзя определить, как были объединены результаты каждого алгоритма. Кроме того, в этом представлении всплывающие подсказки и легенда обработки данных показывают только наиболее важную статистику.

  • Средство просмотра универсального дерева контента: позволяет просматривать все серии данных, которые использовались в модели одновременно, а если вы создали смешанную модель, деревья ARIMA и ARTXP отображаются на одном графике.

    С помощью этого средства просмотра можно получить всю статистику из обоих алгоритмов, а также распределения значений.

    Рекомендуется для экспертов по интеллектуальному анализу данных, которые хотят узнать больше об анализах ARIMA и ARTXP.

Просмотр сведений для определенного ряда данных в универсальном средстве просмотра содержимого

  1. На вкладке Средство просмотра моделей интеллектуального анализа данных выберите Microsoft Generic Content Tree Viewer в раскрывающемся списке Средство просмотра.

  2. В области заголовка узла щелкните самый верхний узел (все).

  3. В области сведений о узле просмотрите значение ATTRIBUTE_NAME.

    Это значение показывает, какая серия или комбинация продукта и региона содержится в этом узле. В примере AdventureWorks самый верхний узел предназначен для серии M200 Europe.

  4. В области заголовка узла найдите первый узел с дочерними узлами.

    Если узел серии имеет дочерние элементы, представление дерева, отображаемое на вкладке "Модель " средства просмотра временных рядов Майкрософт, также будет иметь структуру ветвления.

  5. Разверните узел и щелкните на один из дочерних узлов.

    Столбец NODE_DESCRIPTION схемы содержит условие, которое вызвало разделение дерева.

  6. В области Заголовка узла щелкните самый верхний узел ARIMA и разверните узел, пока не будут видны все дочерние узлы.

  7. В области сведений о узле просмотрите значение ATTRIBUTE_NAME.

    Это значение указывает, какие временные ряды содержатся в этом узле. Самый верхний узел в разделе ARIMA должен соответствовать самому верхнему узлу в разделе (Все). В примере AdventureWorks этот узел содержит анализ ARIMA для серии M200 Europe.

Дополнительные сведения см. в разделе "Содержимое модели интеллектуального анализа данных" для моделей временных рядов (службы Analysis Services — интеллектуальный анализ данных).

В начало

Следующая задача на занятии

Создание прогнозов временных рядов (учебник по интеллектуальному анализу промежуточных данных)

См. также

Примеры запросов модели временных рядов
Технический справочник по алгоритму временных рядов Майкрософт