Поделиться через


Добавление моделей интеллектуального анализа данных в структуру (службы Analysis Services — интеллектуальный анализ данных)

Структура интеллектуального анализа данных определяет домен данных, а модель интеллектуального анализа данных определяет, как использовать данные этого домена для решения конкретной задачи. К созданной структуре интеллектуального анализа данных можно добавить несколько моделей интеллектуального анализа данных. Каждая новая модель создается для решения своей конкретной задачи бизнеса. Например, можно изменить параметры, чтобы изменить подход, или использовать другое подмножество данных для получения других результатов или выявления закономерностей, специфичных для целевой совокупности.

Дополнительные сведения см. в разделахСоздание новой структуры интеллектуального анализа данных, Мастер интеллектуального анализа данных (службы Analysis Services — интеллектуальный анализ данных), Управление структурами интеллектуального анализа данных в конструкторе интеллектуального анализа данных

Создание новой модели интеллектуального анализа данных

Новую модель интеллектуального анализа данных можно построить двумя способами. Можно определить структуру интеллектуального анализа данных, а затем экспериментировать с различными моделями, использующими ту же структуру. Другой способ — создать нужную модель, а потом использовать созданную структуру для создания дополнительных моделей.

При создании новой модели интеллектуального анализа данных с помощью мастера интеллектуального анализа данных, вначале создается структура интеллектуального анализа данных. Затем мастер предоставляет возможность добавить в структуру исходную модель интеллектуального анализа данных и настроить внутри структуры набор данных для обучения и проверочный набор данных. Однако не обязательно создавать модель сразу. Если создать только структуру, не нужно решать, какой столбец использовать в качестве прогнозируемого атрибута или как использовать данные в конкретной модели. Вместо этого можно просто настроить общую структуру данных, которую предполагается использовать в дальнейшем, а затем с помощью средства Конструктор интеллектуального анализа данных добавлять новые модели интеллектуального анализа данных, основанные на этой структуре.

Если уже известен тип модели интеллектуального анализа данных, которую предполагается построить, можно создать структуру, а затем с помощью мастера интеллектуального анализа данных добавить к структуре интеллектуального анализа данных первую модель. По завершении работы мастера можно добавить в структуру и другие модели.

ПримечаниеПримечание

В языке расширений интеллектуального анализа данных инструкция CREATE MINING MODEL начинается с модели интеллектуального анализа данных. Это значит, что после выбора модели интеллектуального анализа данных службы Analysis Services автоматически создают базовую структуру. Затем к этой структуре можно добавлять новые модели интеллектуального анализа данных с помощью инструкции ALTER STRUCTURE… ADD MODEL.

Дополнительные сведения см. в разделеУправление моделями интеллектуального анализа данных в конструкторе интеллектуального анализа данных

Определение модели интеллектуального анализа данных

  1. После определения домена данных нужно сообщить службам Analysis Services, как используется каждый столбец данных, указав его содержимое и способ использования. Не обязательно использовать в новой модели интеллектуального анализа данных все столбцы структуры интеллектуального анализа данных. Даже если две модели созданы на основе одной и той же структуры, можно указать службам Analysis Services, что одна из моделей должна пропускать определенный столбец. Дополнительные сведения см. в разделе Логическая архитектура (службы Analysis Services — интеллектуальный анализ данных).

Выбор алгоритма

При добавлении модели к структуре, нужно выбрать для нее алгоритм интеллектуального анализа данных. У каждого алгоритма свой способ анализа данных. У некоторых алгоритмов свои требования к числу и типу столбцов данных, используемых для ввода или прогноза.

Поэтому возможно, в зависимости от выбранного алгоритма, что некоторые столбцы структуры интеллектуального анализа данных не будут учитываться, а некоторые придется преобразовать в другой тип данных или же удалить. Мастер интеллектуального анализа данных автоматически изменит некоторые значения, чтобы модель работала. Однако мастер может порекомендовать сначала исправить данные или добавить необходимый столбец — например ключ варианта.

Иногда алгоритм, использованный в модели, можно изменить. Но большинство изменений в определении модели требуют повторной обработки модели и ее данных. В общем случае при изменении алгоритма, который используется в модели, следует считать эту модель новой и провести ее повторную обработку.

Дополнительные сведения см. в разделеАлгоритмы интеллектуального анализа данных (службы Analysis Services — интеллектуальный анализ данных)

Указание использования столбцов

После выбора алгоритма нужно указать, как он должен обрабатывать содержащиеся в структуре данные. Нужно выбрать прогнозируемый столбец или столбцы, если они требуются для модели, выбрать столбцы, содержащие входные данные, и указать вариант или ключ вложенной таблицы. У каждого алгоритма свои требования. Поэтому у каждой модели определения столбцов могут отличаться, даже если эти модели построены на одних и тех же данных. Рекомендуется выбирать по возможности только столбцы, полезные для анализа, поскольку лишние данные замедляют обработку и могут негативно повлиять на качество результата. В мастере интеллектуального анализа данных есть дополнительная функциональная возможность — Предложить. При включении этой возможности мастер анализирует столбцы в составе структуры и рекомендует наиболее информативные, выбирая их по рейтингу на основе энтропии.

Дополнительные сведения см. в разделах Столбцы модели интеллектуального анализа данных, Настройка свойств в модели интеллектуального анализа данных

Указание содержимого столбцов

  1. Для некоторых столбцов нужно также задавать содержимое столбца. При интеллектуальном анализе данных в SQL Server алгоритм обрабатывает данные из столбца в соответствии со свойством «Тип содержимого» этого столбца. Например, если в данных есть столбец «Доход» с различными значениями, нужно указать, что столбец содержит непрерывный числовой показатель, задав для него тип содержимого «Непрерывный». Можно также указать, что числа в столбце «Доход» следует сгруппировать в сегменты, задав тип содержимого «Дискретизированный». По желанию можно задать точное количество сегментов. Можно создавать различные модели, которые будут по-разному обрабатывать столбцы: например, одна модель разобьет множество всех заказчиков на три возрастных группы, а другая — на десять.

Дополнительные сведения см. в разделах Типы данных (интеллектуальный анализ данных), Типы содержимого (интеллектуальный анализ данных)