Поделиться через


Продвинутые прогнозы временных рядов (учебник по интеллектуальному анализу данных среднего уровня)

Вы видели, изучая модель прогнозирования, что хотя продажи в большинстве регионов следуют аналогичной модели, некоторые регионы и некоторые модели, такие как модель M200 в Тихоокеанском регионе, демонстрируют очень разные тенденции. Это не удивительно, так как вы знаете, что различия между регионами являются общими и могут быть вызваны многими факторами, включая маркетинговые акции, неточные отчеты или геополитические события.

Однако пользователи запрашивают модель, которая может применяться по всему миру. Таким образом, чтобы свести к минимуму влияние отдельных факторов на проекции, вы решили создать модель, основанную на агрегированных мерах по всему миру продаж. Затем эту модель можно использовать для прогнозирования для каждого отдельного региона.

В этой задаче вы создадите все источники данных, необходимые для выполнения сложных задач прогнозирования. Вы создадите два представления источника данных для использования в качестве входных данных для прогнозирующего запроса и одно представление источника данных для создания новой модели.

Шаги

  1. Подготовка расширенных данных о продажах (для прогнозирования)

  2. Подготовка агрегированных данных (для создания модели)

  3. Подготовка данных серии (для перекрестного прогнозирования)

  4. Прогнозирование с помощью EXTEND

  5. Создание модели перекрестного прогнозирования

  6. Прогнозирование с помощью REPLACE

  7. Просмотр новых прогнозов

Создание новых расширенных данных о продажах

Чтобы обновить данные о продажах, вам потребуется получить последние данные о продажах. В частности, представляют интерес данные, недавно поступившие из тихоокеанского региона, который начал региональную рекламную акцию, чтобы привлечь внимание к новым магазинам и повысить осведомлённость о продуктах.

В этом сценарии предполагается, что данные импортированы из книги Excel, содержащей всего три месяца новых данных для нескольких регионов. Вы создадите таблицу для данных с помощью скрипта Transact-SQL, а затем определите представление источника данных для прогнозирования.

Создание таблицы с новыми данными о продажах

  1. В окне запроса Transact-SQL выполните следующую инструкцию, чтобы добавить данные о продажах в базу данных AdventureWorksDW (или любую другую базу данных).

    USE [database name];  
    GO  
    IF OBJECT_ID ([dbo].[NewSalesData]) IS NOT NULL   
        DROP TABLE [dbo].[NewSalesData];  
    GO  
    CREATE TABLE [dbo].[NewSalesData]([Series] [nvarchar](255) NULL,  
    [NewDate] [datetime] NULL,  
    [NewQty] [float] NULL,  
    [NewAmount] [money] NULL) ON [PRIMARY]  
    
    GO  
    
  2. Вставьте новые значения с помощью следующего скрипта.

    INSERT INTO [NewSalesData]  
    (Series,NewDate,NewQty,NewAmount)  
    VALUES('T1000 Pacific', '7/25/08', 55, '$130,170.22'),  
    ('T1000 Pacific', '8/25/08', 50, '$114,435.36 '),  
    ('T1000 Pacific', '9/25/08', 50, '$117,296.24 '),  
    ('T1000 Europe', '7/25/08', 37, '$88,210.00 '),  
    ('T1000 Europe', '8/25/08', 41, '$97,746.00 '),  
    ('T1000 Europe', '9/25/08', 37, '$88,210.00 '),  
    ('T1000 North America', '7/25/08', 69, '$164,500.00 '),  
    ('T1000 North America', '8/25/08', 66, '$157,348.00 '),  
    ('T1000 North America', '9/25/08', 58, '$138,276.00 '),  
    ('M200 Pacific', '7/25/08', 65, '$149,824.35'),  
    ('M200 Pacific', '8/25/08', 54,  '$124,619.46'),  
    ('M200 Pacific', '9/25/08', 61, '$141,143.39'),  
    ('M200 Europe', '7/25/08', 75, '$173,026.00'),  
    ('M200 Europe', '8/25/08', 76, '$175,212.00'),  
    ('M200 Europe', '9/25/08', 84, '$193,731.00'),  
    ('M200 North America', '7/25/08', 94, '$216,916.00'),  
    ('M200 North America', '8/25/08', 94, '$216,891.00'),  
    ('M200 North America', '9/25/08', 91,'$209,943.00');  
    

    Предупреждение

    Кавычки используются со значениями валют, чтобы предотвратить проблемы с разделителем запятых и символом валюты. Вы также можете передать значения валют в этом формате: 130170.22

    Обратите внимание, что даты, используемые в образце базы данных, изменились для этого выпуска. Если вы используете более раннюю версию AdventureWorks, может потребоваться соответствующим образом настроить даты вставки.

Создание представления источника данных с помощью новых данных о продажах

  1. В обозревателе решений щелкните правой кнопкой мыши представления источников данных и выберите "Создать представление источника данных".

  2. В мастере представления источников данных сделайте следующее:

    Источник данных: Adventure Works DW Multidimensional 2012

    Выберите таблицы и представления: выберите только что созданную таблицу NewSalesData.

  3. Нажмите кнопку Готово.

  4. В области конструктора представления источников данных щелкните правой кнопкой мыши NewSalesData, а затем выберите Просмотреть данные, чтобы проверить данные.

Предупреждение

Эти данные будут использоваться только для прогнозирования, поэтому не имеет значения, что данные не являются неполными.

Создание данных для модели перекрестного прогнозирования

Данные, которые использовались в исходной модели прогнозирования, уже были частично сгруппированы по представлению vTimeSeries, которое свернуло несколько моделей велосипедов в меньшее количество категорий и объединило результаты из отдельных стран в регионы. Чтобы создать модель, которую можно использовать для глобальных проекций, вы создадите дополнительные простые агрегаты прямо в дизайнере представления источника данных. Новое представление источника данных будет содержать только сумму и среднее значение продаж всех продуктов для всех регионов.

После создания источника данных, используемого для модели, необходимо создать новое представление источника данных для прогнозирования. Например, если вы хотите прогнозировать продажи для Европы с помощью новой мировой модели, необходимо передавать данные только в регионе Европы. Таким образом, вы настроите новое представление источника данных, которое фильтрует исходные данные и измените условие фильтра для каждого набора прогнозирующих запросов.

Создание данных модели с помощью пользовательского представления источника данных

  1. В обозревателе решений щелкните правой кнопкой мыши представления источников данных и выберите "Создать представление источника данных".

  2. На странице приветствия мастера нажмите кнопку "Далее".

  3. На странице "Выбор источника данных " выберите Adventure Works DW Multidimensional 2012 и нажмите кнопку "Далее".

  4. На странице выбор таблиц и представлений не добавляйте таблицы просто нажмите кнопку "Далее".

  5. На странице Завершение мастера введите имя AllRegions и нажмите Завершить.

  6. Затем щелкните правой кнопкой мыши пустую область конструктора представления источника данных и выберите новый именованный запрос.

  7. В диалоговом окне "Создание именованного запроса" для имени, типа и описания введите AllRegionsсумму и среднее значение продаж для всех моделей и регионов.

  8. В текстовой области SQL введите следующую инструкцию и нажмите кнопку ОК:

    SELECT ReportingDate,   
    SUM([Quantity]) as SumQty, AVG([Quantity]) as AvgQty,  
    SUM([Amount]) AS SumAmt, AVG([Amount]) AS AvgAmt,  
    'All Regions' as [Region]  
    FROM dbo.vTimeSeries   
    GROUP BY ReportingDate  
    
  9. Щелкните таблицу правой AllRegions кнопкой мыши и выберите команду "Просмотреть данные".

Создание данных серии для перекрестного прогнозирования

  1. В обозревателе решений щелкните правой кнопкой мыши представления источников данных и выберите "Создать представление источника данных".

  2. В мастере представления источников данных сделайте следующее:

    Источник данных: Adventure Works DW Multidimensional 2012

    Выбор таблиц и представлений: Не выбирайте никакие таблицы

    Имя: T1000 Pacific Region

  3. Нажмите кнопку Готово.

  4. Щелкните правой кнопкой мыши пустую область конструктора для T1000 Pacific Region.dsv и выберите Новый именованный запрос.

    Откроется диалоговое окно "Создать именованный запрос ". Перепечатайте имя, а затем добавьте следующее описание:

    Имя: T1000 Pacific Region

    Описание. ФильтрацияvTimeSeriesпо регионам и моделям

  5. В текстовой области введите следующий запрос и нажмите кнопку ОК:

    SELECT ReportingDate, ModelRegion, Quantity, Amount  
    FROM dbo.vTimeSeries  
    WHERE (ModelRegion = N'T1000 Pacific')  
    

    Замечание

    Так как вам потребуется создать прогнозы для каждой серии отдельно, может потребоваться скопировать текст запроса и сохранить его в текстовый файл, чтобы его можно было повторно использовать для других рядов данных.

  6. В области конструктора представления источника данных щелкните правой кнопкой мыши T1000 Pacific, а затем выберите Просмотреть данные, чтобы проверить правильность фильтрации данных.

    Эти данные будут использоваться в качестве входных данных для модели при создании кросс-прогнозирующих запросов.

Следующая задача на занятии

Прогнозирование временных рядов с помощью обновленных данных (учебник по интеллектуальному анализу промежуточных данных)

См. также

Алгоритм временных рядов Майкрософт
Технический справочник по алгоритму временных рядов Майкрософт
Представления источников данных в многомерных моделях