Поделиться через


Занятие 3. Обработка структуры интеллектуального анализа данных «Покупатель велосипеда»

На этом занятии с помощью инструкции INSERT INTO и представления vTargetMail из образца базы данных База данных AdventureWorksDW2008R2 обрабатываются структуры и модели интеллектуального анализа данных, созданные на занятиях Занятие 1. Создание структуры интеллектуального анализа данных для покупателя велосипеда и Занятие 2. Добавление моделей интеллектуального анализа к структуре интеллектуального анализа «Покупатель велосипеда».

При обработке структуры интеллектуального анализа данных службы Службы Analysis Services считывают исходные данные и создают структуры, поддерживающие модели интеллектуального анализа данных. При обработке модели интеллектуального анализа данных данные, определенные структурой интеллектуального анализа данных, проходят через выбранный пользователем алгоритм интеллектуального анализа данных. Алгоритм находит тренды и шаблоны и сохраняет эти данные в модели интеллектуального анализа данных. Поэтому в модели интеллектуального анализа данных содержатся не фактические исходные данные, а данные, выявленные алгоритмом. Дополнительные сведения об обработке структур интеллектуального анализа данных см. в разделе Обработка объектов интеллектуального анализа данных.

Повторная обработка структуры интеллектуального анализа данных нужна только в том случае, когда изменяются столбцы структуры или исходные данные. При добавлении модели интеллектуального анализа данных к уже обработанной структуре интеллектуального анализа данных можно использовать инструкцию INSERT INTO MINING MODEL для обучения новой модели интеллектуального анализа данных.

Шаблон обучения структуры

Для обучения структуры интеллектуального анализа данных и связанных с ней моделей интеллектуального анализа данных используется инструкция INSERT INTO (расширения интеллектуального анализа данных). Код инструкции можно разбить на следующие части:

  • Определение структуры интеллектуального анализа данных

  • Список столбцов структуры интеллектуального анализа

  • Определение обучающих данных

В следующем фрагменте показан общий пример инструкции INSERT INTO:

INSERT INTO MINING STRUCTURE [<mining structure name>]
(
   <mining structure columns>
)
OPENQUERY([<datasource>],'<SELECT statement>')

В первой строчке кода задается структура интеллектуального анализа данных, которую необходимо обучить:

INSERT INTO MINING STRUCTURE [<mining structure name>]

Следующая строка кода указывает столбцы, определенные структурой интеллектуального анализа данных. Необходимо перечислить все столбцы структуры интеллектуального анализа данных, и каждый столбец должен соответствовать какому-либо столбцу из данных исходного запроса.

(
   <mining structure columns>
)

Последней строчкой кода определяются данные, с помощью которых будет проводиться обучение структуры интеллектуального анализа данных.

OPENQUERY([<datasource>],'<SELECT statement>')

На этом занятии требуется определить исходные данные с помощью инструкции OPENQUERY. Дополнительные сведения о других способах определения исходного запроса см. в разделе <source data query>.

Задачи занятия

На этом занятии требуется выполнить следующую задачу:

  • Обработка структуры интеллектуального анализа данных «Покупатель велосипеда»

Обработка прогнозирующей структуры интеллектуального анализа данных

Обработка структуры интеллектуального анализа данных с помощью инструкции INSERT INTO

  1. В окне Обозреватель объектов щелкните правой кнопкой мыши экземпляр служб Службы Analysis Services, укажите Создать запрос, а затем выберите пункт Расширения интеллектуального анализа данных.

    Откроется редактор запросов, содержащий новый, пустой запрос.

  2. Скопируйте стандартный пример использования инструкции INSERT INTO в пустое окно запроса.

  3. Замените следующий код:

    [<mining structure name>] 
    

    на

    Bike Buyer
    
  4. Замените следующий код:

    <mining structure columns>
    

    на

    [Customer Key],
    [Age],
    [Bike Buyer],
    [Commute Distance],
    [Education],
    [Gender],
    [House Owner Flag],
    [Marital Status],
    [Number Cars Owned],
    [Number Children At Home],
    [Occupation],
    [Region],
    [Total Children],
    [Yearly Income]
    
  5. Замените:

    OPENQUERY([<datasource>],'<SELECT statement>')
    

    на:

    OPENQUERY([Adventure Works DW2008R2],
       'SELECT CustomerKey, Age, BikeBuyer,
             CommuteDistance,EnglishEducation,
             Gender,HouseOwnerFlag,MaritalStatus,
             NumberCarsOwned,NumberChildrenAtHome, 
             EnglishOccupation,Region,TotalChildren,
             YearlyIncome 
        FROM dbo.vTargetMail')
    

    В инструкции OPENQUERY для доступа к представлению vTargetMail указан источник данных Adventure Works DW2008R2. В указанном представлении содержатся исходные данные, которые будут использоваться для обучения моделей интеллектуального анализа данных.

    Полная инструкция теперь должна выглядеть следующим образом.

    INSERT INTO MINING STRUCTURE [Bike Buyer]
    (
       [Customer Key],
       [Age],
       [Bike Buyer],
       [Commute Distance],
       [Education],
       [Gender],
       [House Owner Flag],
       [Marital Status],
       [Number Cars Owned],
       [Number Children At Home],
       [Occupation],
       [Region],
       [Total Children],
       [Yearly Income]   
    )
    OPENQUERY([Adventure Works DW2008R2],
       'SELECT CustomerKey, Age, BikeBuyer,
             CommuteDistance,EnglishEducation,
             Gender,HouseOwnerFlag,MaritalStatus,
             NumberCarsOwned,NumberChildrenAtHome, 
             EnglishOccupation,Region,TotalChildren,
             YearlyIncome 
        FROM dbo.vTargetMail')
    
  6. В меню Файл щелкните Сохранить DMXQuery1.dmx как.

  7. В диалоговом окне Сохранить как укажите путь к соответствующей папке и присвойте файлу имя Process Bike Buyer Structure.dmx.

  8. На панели инструментов нажмите кнопку Выполнить.

На следующем занятии будет изучено содержимое моделей интеллектуального анализа данных, добавленных к структуре интеллектуального анализа данных на текущем занятии.