Статья
09/28/2010

Содержимое модели интеллектуального анализа данных (службы Analysis Services — интеллектуальный анализ данных)

После создания и обработки модели интеллектуального анализа данных на основе данных из базовой структуры интеллектуального анализа данных, эта модель считается завершенной и содержит содержимое модели интеллектуального анализа данных. На основе этого содержимого производится создание прогнозов и анализ данных.

Модель интеллектуального анализа данных включает метаданные о модели, статистику по данным, а также закономерности, выявленные алгоритмом интеллектуального анализа данных. В зависимости от применяемого алгоритма содержимое модели может включать формулы регрессии, определения правил, наборы элементов, весовые коэффициенты и другие статистические данные.

Но независимо от применяемого алгоритма содержимое модели интеллектуального анализа данных представляется стандартной структурой. Ее можно просмотреть в средстве просмотра деревьев содержимого общего вида (Майкрософт), которое включено в среду Business Intelligence Development Studio, а затем переключиться в одно из пользовательских представлений, чтобы просмотреть, каким образом данные интерпретируются и отображаются в графическом виде для каждого типа модели. К модели интеллектуального анализа данных можно также создавать запросы при помощи любого клиента, поддерживающего набор строк схемы MINING_MODEL_CONTENT. Дополнительные сведения см. в разделе Запрос моделей интеллектуального анализа данных: инструкции (службы Analysis Services — интеллектуальный анализ данных).

В этом разделе содержится описание базовой структуры содержимого для всех типов моделей интеллектуального анализа данных. В нем описаны все типы узлов, общие для всех моделей интеллектуального анализа данных, а также приведены рекомендации по интерпретации этих сведений.

Структура содержимого модели интеллектуального анализа данных

Узлы

Содержимое модели интеллектуального анализа данных по типу алгоритма

Средства просмотра содержимого модели интеллектуального анализа данных

Средства запроса содержимого модели интеллектуального анализа данных

Структура содержимого модели интеллектуального анализа данных

Содержимое каждой из моделей представлено в виде последовательности узлов. Узлом называется объект модели интеллектуального анализа данных, который содержит метаданные и сведения о фрагменте модели. Узлы упорядочены в виде иерархии. Значение и способ упорядочивания узлов в иерархии зависят от применяемого алгоритма. Например, при создании модели дерева принятия решений она будет содержать несколько деревьев, выходящих из корневого элемента модели. Модель нейронной сети может содержать одну или несколько сетей, а также узел статистики.

Первый узел любой модели называется корневым узлом, или родительским узлом модели. Корневой узел (NODE_TYPE = 1) есть в каждой модели. Как правило, он содержит метаданные о модели и дочерние узлы, но может также содержать некоторые дополнительные сведения о выявленных моделью закономерностях.

Число дочерних узлов корневого узла зависит от от алгоритма, применявшегося при создании модели. Дочерние узлы имеют разное назначение и содержат разные данные. Это зависит от алгоритма, сложности и уровня вложенности данных.

В начало

Узлы

В модели интеллектуального анализа данных узел является универсальным контейнером, в котором хранится фрагмент данных модели или ее части. Все узлы имеют одинаковую структуру. Они содержат столбцы, определенные набором строк интеллектуального анализа данных. Дополнительные сведения см. в разделе Набор строк DMSCHEMA_MINING_MODEL_CONTENT.

Каждый узел содержит метаданные об этом узле, в том числе уникальный идентификатор в пределах модели, идентификатор родительского узла и число дочерних узлов. Метаданные идентифицируют модель, в которую входит данный узел, а также каталог базы данных, в котором хранится эта модель. В зависимости от типа алгоритма, применяемого для создания модели, метаданные могут содержать следующие дополнительные сведения.

Число вариантов в обучающих данных, которые поддерживают прогнозируемое значение.
Статистика — среднее, стандартное отклонение и дисперсия.
Коэффициенты и формулы.
Определения правил и боковых указателей.
XML-фрагменты, описывающие часть модели.

Список типов узлов

В следующей таблице перечислены различные типы узлов, создаваемых в моделях интеллектуального анализа данных. Поскольку алгоритмы обрабатывают данные по-разному, для каждой из моделей создаются только определенные типы узлов. После смены алгоритма типы узлов также могут измениться. Кроме этого, при повторной обработке модели может измениться содержимое каждого из узлов.

Примечание
При использовании службы интеллектуального анализа, отличной от тех, что поставляются в составе служб SQL Server 2008 Analysis Services, или при создании собственных подключаемых алгоритмов могут появиться другие пользовательские типы узлов.

При использовании службы интеллектуального анализа, отличной от тех, что поставляются в составе служб SQL Server 2008 Analysis Services, или при создании собственных подключаемых алгоритмов могут появиться другие пользовательские типы узлов.

NODE_TYPE ID	Метка узла	Содержимое узла
1	Model	Метаданные и корневой узел содержимого. Все типы моделей.
2	Tree	Корневой узел дерева классификации. Модели дерева принятия решений.
3	Interior	Внутренняя узловая точка дерева. Модели дерева принятия решений.
4	Distribution	Конечный узел дерева. Модели дерева принятия решений.
5	Cluster	Кластер, выявленный алгоритмом. Модели кластеризации и модели кластеризации последовательностей.
6	Unknown	Неизвестный тип узла.
7	ItemSet	Набор элементов, выявленный алгоритмом. Модели взаимосвязей или модели кластеризации последовательностей.
8	AssociationRule	Правило взаимосвязи, выявленное алгоритмом. Модели взаимосвязей или модели кластеризации последовательностей.
9	PredictableAttribute	Прогнозируемый атрибут. Все типы моделей.
10	InputAttribute	Входной атрибут. Деревья принятия решений и модели упрощенного алгоритма Байеса.
11	InputAttributeState	Статистика о состоянии входного атрибута. Деревья принятия решений и модели упрощенного алгоритма Байеса.
13	Sequence	Верхний узел компонента кластеризации последовательностей марковской модели. Модели кластеризации последовательностей.
14	Transition	Марковская матрица переходов. Модели кластеризации последовательностей.
15	TimeSeries	Узел дерева временных рядов (кроме корневого). Только модель временных рядов.
16	TsTree	Корневой узел дерева временных рядов, который соответствует прогнозируемому временному ряду. Модели временных рядов, созданные с параметром MIXED.
17	NNetSubnetwork	Единичная подсеть. Модели нейронных сетей.
18	NNetInputLayer	Группа, содержащая узлы входного слоя. Модели нейронных сетей.
19	NNetHiddenLayer	Группа, содержащая узлы, которые описывают скрытый слой. Модели нейронных сетей.
21	NNetOutputLayer	Группа, содержащая узлы выходного слоя. Модели нейронных сетей.
21	NNetInputNode	Узел во входном слое, который соответствует входному атрибуту с соответствующими состояниями. Модели нейронных сетей.
22	NNetHiddenNode	Узел в скрытом слое. Модели нейронных сетей.
23	NNetOutputNode	Узел в выходном слое. Этот узел обычно соответствует выходному атрибуту и соответствующим состояниям. Модели нейронных сетей.
24	NNetMarginalNode	Граничная статистика по обучающему набору. Модели нейронных сетей.
25	RegressionTreeRoot	Корневой узел дерева регрессии. Модели линейной регрессии и модели дерева принятия решений, содержащие входные атрибуты.
26	NaiveBayesMarginalStatNode	Граничная статистика по обучающему набору. Модели упрощенного алгоритма Байеса.
27	ArimaRoot	Корневой узел модели ARIMA. Модели временных рядов, использующие алгоритм ARIMA.
28	ArimaPeriodicStructure	Периодическая структура модели ARIMA. Модели временных рядов, использующие алгоритм ARIMA.
29	ArimaAutoRegressive	Коэффициент авторегрессии для единичного термина модели ARIMA. Модели временных рядов, использующие алгоритм ARIMA.
30	ArimaMovingAverage	Коэффициент скользящего среднего для единичного термина модели ARIMA. Модели временных рядов, использующие алгоритм ARIMA.
1000	CustomBase	Начальная точка для пользовательских типов узлов. Пользовательский тип узла должен быть целым числом, значение которого больше этой константы. Любые модели, создаваемые с использованием пользовательских подключаемых алгоритмов.

Идентификатор, имя, заголовок и описание узла

Корневой узел для любой модели всегда имеет уникальный идентификатор (NODE_UNIQUE_NAME) со значением 0. Идентификаторы узлов назначаются автоматически службами Analysis Services и не могут быть изменены.

Корневой узел каждой модели содержит также некоторые основные метаданные о модели. Они описывают базу данных Analysis Services, где хранится модель (MODEL_CATALOG), схему (MODEL_SCHEMA) и имя модели (MODEL_NAME). Эти сведения дублируются во всех узлах модели, поэтому для доступа к ним нет необходимости запрашивать корневой узел.

Помимо уникального идентификатора, каждый узел имеет имя (NODE_NAME). Оно создается алгоритмом автоматически для отображения и не может быть изменено.

Примечание
Алгоритм кластеризации (Майкрософт) позволяет пользователям назначать каждому из кластеров понятные имена. Однако эти имена не сохраняются на сервере и поэтому после повторной обработки модели алгоритм сформирует их заново.

Алгоритм кластеризации (Майкрософт) позволяет пользователям назначать каждому из кластеров понятные имена. Однако эти имена не сохраняются на сервере и поэтому после повторной обработки модели алгоритм сформирует их заново.

Алгоритм автоматически формирует для каждого из узлов заголовок и описание, которые выполняют роль меток, давая пользователю представление о содержимом узла. Текст, формируемый для каждого из этих полей, зависит от типа модели. В некоторых случаях имя, заголовок и описание могут содержать один и тот же текст, но в некоторых моделях описание может действительно содержать дополнительные сведения. Дополнительные сведения о реализации см. в разделе, посвященному соответствующему типу модели.

Примечание
Сервер Analysis Services поддерживает переименование узлов только в том случае, если пользовательский подключаемый алгоритм, с помощью которого была построена модель, поддерживает переименование. Эта возможность реализуется переопределением методов при создании подключаемого алгоритма.

Сервер Analysis Services поддерживает переименование узлов только в том случае, если пользовательский подключаемый алгоритм, с помощью которого была построена модель, поддерживает переименование. Эта возможность реализуется переопределением методов при создании подключаемого алгоритма.

Родительские и дочерние узлы и число элементов

Связь между родительским и дочерними узлами в древовидной структуре определяется значением столбца PARENT_UNIQUE_NAME. Это значение хранится в дочернем узле и содержит идентификатор родительского узла. Ниже приведено несколько примеров, демонстрирующих использование этих данных.

Если PARENT_UNIQUE_NAME имеет значение NULL, то узел является корневым узлом модели.
Если PARENT_UNIQUE_NAME имеет значение 0, то узел должен быть прямым потомком корневого узла модели. Это вызвано тем, что корневой узел всегда имеет идентификатор 0.
Для поиска родителей и потомков узла можно применяются функции в DMX-запросе. Дополнительные сведения об этих функциях см. в разделе Запрос моделей интеллектуального анализа данных (службы Analysis Services — интеллектуальный анализ данных).

Количеством элементов называют число элементов в наборе. В контексте обработанной модели интеллектуального анализа данных количество элементов указывает на число дочерних узлов, имеющихся у некоторого узла. Например, если в модели дерева принятия решений есть узел [Годовой доход], который имеет два дочерних узла — условие «[Годовой доход] = Высокий» и условие «[Годовой доход] = Низкий», то значение CHILDREN_CARDINALITY для узла [Годовой доход] будет равно двум.

Примечание
В службах Analysis Services в количество элементов включаются только прямые дочерние узлы. Однако при создании пользовательского подключаемого алгоритма можно переопределить подсчет CHILDREN_CARDINALITY другим способом. Например, эта возможность может оказаться полезной в тех случаях, когда необходимо подсчитать общее число потомков, а не только прямых дочерних узлов.

В службах Analysis Services в количество элементов включаются только прямые дочерние узлы. Однако при создании пользовательского подключаемого алгоритма можно переопределить подсчет CHILDREN_CARDINALITY другим способом. Например, эта возможность может оказаться полезной в тех случаях, когда необходимо подсчитать общее число потомков, а не только прямых дочерних узлов.

Хотя количество элементов для всех моделей подсчитывается одинаково, интерпретация этого значения зависит от типа модели. Например, в модели кластеризации количество элементов корневого узла указывает на общее число обнаруженных кластеров. В других моделях количество элементов может принимать значение в зависимости от типа узла. Дополнительные сведения об интерпретации количества элементов см. в разделе для соответствующего типа модели.

Примечание
Некоторые модели – в частности, созданные с использованием алгоритма нейронной сети (Майкрософт) — включают дополнительные типы узлов, содержащие описательную статистику по обучающим данным для всей модели. Эти узлы по определению не могут иметь дочерних узлов.

Некоторые модели – в частности, созданные с использованием алгоритма нейронной сети (Майкрософт) — включают дополнительные типы узлов, содержащие описательную статистику по обучающим данным для всей модели. Эти узлы по определению не могут иметь дочерних узлов.

Распределение узла

Столбец NODE_DISTRIBUTION содержит вложенную таблицу, которая для многих узлов содержит подробные и важные сведения о закономерностях, выявленных алгоритмом. Точные статистические данные в этой таблице изменяются в зависимости от типа модели, положения узла в дереве, а также от того, является прогнозируемый атрибут непрерывным числовым или дискретным значением. Они могут включать минимальное и максимальное значение атрибута, назначенные весовые коэффициенты, количество вариантов в узле, коэффициенты, используемые в формулах регрессии, а также статистические меры (например, стандартное отклонение и дисперсия). Дополнительные сведения об интерпретации распределения узла см. в разделе, посвященном соответствующему типу модели.

Примечание
Таблица NODE_DISTRIBUTION для некоторых типов моделей может оказаться пустой. Например, некоторые узлы предназначены только для упорядочивания набора дочерних узлов, которые содержат подробные статистические сведения.

Вложенная таблица NODE_DISTRIBUTION всегда содержит следующие столбцы. Содержимое каждого из них зависит от типа модели. Дополнительные сведения о типах моделей см. в разделе Содержимое модели интеллектуального анализа данных по типам алгоритмов.

ATTRIBUTE_NAME
Содержимое зависит от алгоритма. Здесь может содержаться имя столбца, например прогнозируемый атрибут, правило, набор элементов или внутренних данных алгоритма (например, фрагмент формулы).

Кроме того, этот столбец содержит пару «атрибут-значение».
ATTRIBUTE_VALUE
Значение атрибута, имя которого содержится в столбце ATTRIBUTE_NAME.

Если именем атрибута является столбец, то в самом простом случае ATTRIBUTE_VALUE содержит одно из дискретных значений для этого столбца.

В зависимости от значений, переданных алгоритмом, столбец ATTRIBUTE_VALUE может также содержать флажок, который определяет, существует ли значение для атрибута (Existing), или же оно равно значению null (Missing).

Например, если модель предназначена для поиска клиентов, приобретавших определенную позицию как минимум один раз, то столбец ATTRIBUTE_NAME может содержать пару «атрибут-значение», которая определяет нужную позицию (например, Model = 'Water bottle'), а столбец ATTRIBUTE_VALUE будет содержать только ключевое слово — Existing или Missing.

SUPPORT
Количество вариантов, имеющих пару «значение-атрибут», либо содержащих правило или набор элементов.

В общем случае для каждого из узлов значение несущего множества указывает число вариантов обучающего набора, включенных в текущий узел. Для большинства типов моделей несущее множество представляет точное число вариантов. Это значение позволяет просмотреть распределение данных по обучающим вариантам без запроса самих обучающих данных. Сервер Analysis Services также использует эти сохраненные значения для вычисления соотношения хранимых и априорных вероятностей, чтобы определить силу их влияния.

Например, в дереве классификации значение несущего множество определяет число вариантов, для которых описано сочетание атрибутов.

В дереве принятия решений несущее несущих множеств на каждом уровне дерева является суммой несущих множеств его родительского узла. Например, если модель содержит 1200 вариантов, поделенных пополам по половому признаку, а затем поровну по трем значениям дохода (низкий, средний и высокий), то для узла (2) дочерние узлы (4), (5) и (6) всегда дадут то же суммарное число вариантов, что и для узла (2).

Идентификатор и атрибуты узла	Число несущих множеств
(1) Корневой узел модели	1200
(2) Пол = Мужской (3) Пол = Женский	600 600
(4) Пол = Мужской и Доход = Высокий (5) Пол = Мужской и Доход = Средний (6) Пол = Мужской и Доход = Низкий	200 200 200
(7) Пол = Женский и Доход = Высокий (8) Пол = Женский и Доход = Средний (9) Пол = Женский и Доход = Низкий	200 200 200

(1) Корневой узел модели

1200

(2) Пол = Мужской

(3) Пол = Женский

600

(4) Пол = Мужской и Доход = Высокий

(5) Пол = Мужской и Доход = Средний

(6) Пол = Мужской и Доход = Низкий

200

(7) Пол = Женский и Доход = Высокий

(8) Пол = Женский и Доход = Средний

(9) Пол = Женский и Доход = Низкий

200

Для модели кластеризации число несущих множеств может взвешенным, включая вероятность принадлежность к нескольким кластерам. Участие в нескольких кластерах является методом кластеризации по умолчанию. Поскольку в этом случае каждый вариант не должен обязательно принадлежать одному и только одному кластеру, несущее множество для всех кластеров в этой модели может составить значение, отличное от 100%.

PROBABILITY
Указывает вероятность для определенного узла в пределах всей подели.

Как правило, вероятность представляет несущее множество для конкретного значения, поделенное на общее число вариантов в узле (NODE_SUPPORT).

Однако вероятность слегка корректируется — из нее исключается смещение, вызванное пропусками данных.

Например, если текущими значениями атрибутов [Всего детей] являются «Один» и «Два», то следует избегать создания моделей, которые прогнозируют невозможность отсутствия детей, как и наличие трех и более детей. Чтобы убедиться, что отсутствующие значения неправдоподобны, но не невозможны, алгоритм для любого атрибута всегда добавляет к числу фактических значений единицу.

Пример:

Вероятность [Всего детей = Один] = [Число вариантов где Всего детей = Один] + 1/[Число всех вариантов] + 3

Вероятность [Всего детей = Два] = [Число вариантов где Всего детей = Два] + 1/[Число всех вариантов] + 3

Примечание

Корректировка 3 получается добавлением единицы к общему числу существующих значений n.

После корректировки, вероятности для всех значений по-прежнему сводятся к 1. Вероятность для значения, для которого нет данных (в данном примере [Всего детей = «Ноль», «Три» или любое другое значение]), начинается на очень низком ненулевом уровне и медленно возрастает по мере добавления вариантов.
VARIANCE
Показывает дисперсию значений в пределах узла. По определению, дисперсия для дискретных значений всегда равна 0. Если модель поддерживает непрерывные значения, то дисперсия вычисляется как σ (сигма) от знаменателя n, или числа вариантов в узле.

Для представления стандартного отклонения (StDev) существует два общих определения. Первый метод вычисления стандартного отклонения учитывает смещение, а второй его не учитывает. В общем случае алгоритмы интеллектуального анализа данных Майкрософт не пользуются отклонением при вычислении стандартного отклонения.

Значение, отображаемое в таблице NODE_DISTRIBUTION, является фактическим значением для всех дискретных и дискретизированных атрибутов или средним для непрерывных значений.

Примечание
Корректировка 3 получается добавлением единицы к общему числу существующих значений n.

VALUE_TYPE
Указывает тип данных значения или атрибута и способ его использования. Определенные типы значений относятся только к определенным типам моделей.

VALUE_TYPE ID	Метка значения	Имя типа значения
1	Отсутствует	Указывает, что данные вариантов не содержат значения для этого атрибута. Состояние Missing вычисляется отдельно от атрибутов, имеющих значения.
2	Существующий	Указывает, что данные вариантов содержат значение для этого атрибута.
3	Continuous	Указывает, что значение атрибута является непрерывным числовым значением и поэтому может быть представлено средним значением, вместе с дисперсией и стандартным отклонением.
4	Discrete	Указывает, что значение (либо числовое, либо текстовое) должно рассматриваться как дискретное. Примечание. Дискретные значения также могут отсутствовать. Эта ситуация, однако, при вычислениях обрабатывается иначе. Дополнительные сведения см. в разделе Отсутствующие значения (службы Analysis Services — интеллектуальный анализ данных).
5	Discretized	Указывает, что атрибут содержит дискретизированные числовые значения. Это значение представляет собой строку форматирования, которая описывает сегменты дискретизации.
6	Существующий	Указывает, что атрибут имеет непрерывные числовые значения, и что эти значения представлены в данных (нет отсутствующих или выводимых значений).
7	Коэффициент	Указывает числовое значение, представляющее коэффициент. Коэффициент – это значение, которое применяется при вычислении значения зависимой переменной. Например, если модель создает формулу регрессии, которая прогнозирует доход на основе возраста, то в ней используется коэффициент, связывающий возраст и уровень дохода.
8	Рост оценки	Указывает числовое значение, представляющее рост оценки для атрибута.
9	Статистика	Указывает числовое значение, представляющее статистику для регрессора.
10	Уникальное имя узла	Указывает, что значение должно обрабатываться не как числовое или символьное, а как уникальный идентификатор другого узла содержимого модели. Например, в модели нейронной сети идентификаторы представляют собой указатели из узлов выходного слоя на узлы скрытого слоя, а также из узлов скрытого слоя на узлы входного слоя.
11	Отсекаемый отрезок	Указывает числовое значение, представляющее отсекаемый отрезок в формуле регрессии.
12	Периодичность	Указывает, что значение определяет в модели периодическую структуру. Применяется только в моделях временных рядов, в которых используется алгоритм ARIMA. Примечание Алгоритм временных рядов (Майкрософт) автоматически определяет периодические структуры на основе обучающих данных. В результате этого периодичности в конечной модели могут включать значения периодичности, которые не были заданы в качестве параметров при создании модели.
13	Авторегрессивный порядок	Указывает, что значение представляет число авторегрессивных рядов. Применяется в моделях временных рядов, использующих алгоритм ARIMA.
14	Порядок скользящего среднего	Представляет значение, которое представляет число скользящих средних в одном ряде Применяется в моделях временных рядов, использующих алгоритм ARIMA.
15	Разностный порядок	Указывает, что значение определяет, сколько раз был продиферренцирован ряд. Применяется в моделях временных рядов, использующих алгоритм ARIMA.
16	Логическое	Представляет логический тип данных.
17	Другое	Представляет пользовательское значение, определяемое алгоритмом.
18	Подготовленная строка	Представляет пользовательское значение, которое алгоритм возвращает в виде строки. Никакое форматирование к ней моделью не применяется.

Типы значений наследуются от перечисления ADMOMD.NET. Дополнительные сведения см. в разделе MiningValueType.

Оценка узла

Значение оценки узла различается в зависимости от типа модели, а также для разных узлов. Сведения о том, каким образом вычисляется столбец NODE_SCORE для каждой модели и типа узла, см. в разделе Содержимое модели интеллектуального анализа данных по типам алгоритмов.

Вероятность узла и граничная вероятность

Набор строк схемы модели интеллектуального анализа данных включает столбцы NODE_PROBABILITY и MARGINAL_PROBABILITY для всех типов моделей. Значения в этих столбцах содержатся только для тех узлов, где значение вероятности является осмысленным. Например, корневой узел модели никогда не содержит оценки вероятности.

В узлах, содержащих оценки вероятности, вероятность узла и граничная вероятность представляют разные вычисления.

Граничная вероятность — это вероятность достижения узла из его родителя.
Вероятность узла — это вероятность достижения узла из корневого узла.
Вероятность узла всегда меньше или равна граничной вероятности.

Например, если база заказчиков в дереве принятия решений разделилась на две равные части по половому признаку (и при этом нет отсутствующих значений), то вероятности обоих дочерних узлов будет равна 0,5. Однако предположим, что каждый из этих узлов поделен на три равные части по уровню дохода — Высокий, Средний и Низкий. В этом случае оценка MARGINAL_PROBABILITY для каждого узла будет равен примерно 0,33, а вот значение NODE_PROBABILTY будет произведением всех вероятностей, ведущих к этому узлу и поэтому будет всегда меньше значения MARGINAL_PROBABILITY.

Уровень и значение узла (атрибута)	Граничная вероятность	Вероятность узла
Корневой элемент модели Все целевые заказчики	1	1
Целевые заказчики, разбитые по половому признаку	.5	.5
Целевые заказчики, разбитые по половому признаку, а затем по уровню дохода	.33	.5 * .33 = .165

Корневой элемент модели

Все целевые заказчики

Целевые заказчики, разбитые по половому признаку

Целевые заказчики, разбитые по половому признаку, а затем по уровню дохода

.33

.5 * .33 = .165

Правило узла и граничное правило

Набор строк схемы модели интеллектуального анализа данных включает столбцы NODE_PROBABILITY и MARGINAL_PROBABILITY для всех типов моделей. В этих столбцах хранятся XML-фрагменты, которые могут быть использованы для сериализации модели или для представления некоторой части ее структуры. Эти столбцы могут оказаться пустыми для тех узлов, где они не имеют смысла.

Предусмотрено два типа XML-правил, как и для значений вероятности. XML-фрагмент в столбце MARGINAL_RULE определяет атрибут и значение текущего узла, а XML-фрагмент в столбце NODE_RULE описывает путь до текущего узла от корневого узла модели.

В начало

Содержимое модели интеллектуального анализа данных по типу алгоритма

Каждый алгоритм в пределах своей схемы содержимого хранит различные типы сведений. Например, алгоритм кластеризации (Майкрософт) формирует множество дочерних узлов, каждый из которых представляет вероятный кластер. Каждый узел кластера содержит правила, описывающие характеристики, общие для всех его элементов. Алгоритм линейной регрессии (Майкрософт), наоборот, не содержит дочерних узлов. Вместо этого родительский узел модели содержит уравнение, которое описывает линейное соотношение, обнаруженное в процессе анализа.

В следующей таблице приведены ссылки на разделы для каждого из типов алгоритмов.

Разделы содержимого модели. Объясняет значение каждого типа узла для каждого из типов алгоритмов и содержит рекомендации о том, какие из узлов представляют наибольший интерес для конкретного типа модели.
Разделы запросов. Содержит примеры запросов к модели определенного типа и рекомендации, касающиеся интерпретации результатов.

Алгоритм или тип модели	Содержимое модели	Запрос моделей интеллектуального анализа
Модели ассоциативных правил	Содержимое моделей интеллектуального анализа данных для моделей взаимосвязей (службы Analysis Services — интеллектуальный анализ данных)	Запрос модели взаимосвязей (службы Analysis Services — интеллектуальный анализ данных)
Модели кластеризации	Содержимое моделей интеллектуального анализа данных для моделей дерева принятия решений (службы Analysis Services — интеллектуальный анализ данных)	Запрос модели кластеризации (службы Analysis Services — интеллектуальный анализ данных)
Модели дерева принятия решений	Содержимое моделей интеллектуального анализа данных для моделей дерева принятия решений (службы Analysis Services — интеллектуальный анализ данных)	Запрос модели дерева принятия решений (службы Analysis Services — интеллектуальный анализ данных)
Модели линейной регрессии	Содержимое моделей интеллектуального анализа данных для моделей линейной регрессии (службы Analysis Services — интеллектуальный анализ данных)	Запросы к модели линейной регрессии (службы Analysis Services - интеллектуальный анализ данных)
Модели логистической регрессии	Содержимое моделей интеллектуального анализа данных для моделей логистической регрессии (службы Analysis Services — интеллектуальный анализ данных)	Запросы к модели линейной регрессии (службы Analysis Services - интеллектуальный анализ данных)
Модели упрощенного алгоритма Байеса	Содержимое моделей интеллектуального анализа данных для моделей упрощенного алгоритма Байеса (службы Analysis Services — интеллектуальный анализ данных)	Запрос модели упрощенного алгоритма Байеса (службы Analysis Services — интеллектуальный анализ данных)
Модели нейронных сетей	Содержимое моделей интеллектуального анализа данных для моделей нейронных сетей (службы Analysis Services — интеллектуальный анализ данных)	Запросы к модели нейронной сети (Майкрософт) (службы Analysis Services — интеллектуальный анализ данных)
Кластеризация последовательности	Содержимое моделей интеллектуального анализа данных для моделей кластеризации последовательностей (службы Analysis Services — интеллектуальный анализ данных)	Запросы к модели кластеризации последовательностей (службы Analysis Services — интеллектуальный анализ данных)
Модели временных рядов	Содержимое модели интеллектуального анализа данных для моделей временных рядов (службы Analysis Services — интеллектуальный анализ данных)	Запрос модели временных рядов (службы Analysis Services — интеллектуальный анализ данных)

Средства просмотра содержимого модели интеллектуального анализа данных

При просмотре и исследовании модели в среде Business Intelligence Development Studio просмотр данных производится с помощью средства просмотра деревьев содержимого общего вида (Майкрософт), включенного в состав сред Business Intelligence Development Studio и SQL Server Management Studio.

Это средство отображает столбцы, правила, свойства, атрибуты, узлы и другое содержимое модели на основе данных, доступных через наборы строк схемы содержимого модели интеллектуального анализа данных. Набор строк схемы содержимого представляет собой общую платформу, предназначенную для предоставления подробной информации о содержимом модели интеллектуального анализа данных. Содержимое модели можно просмотреть в любом клиенте, поддерживающем иерархические наборы строк. Средство просмотра в среде Business Intelligence Development Studio представляет эти данные в виде HTML-таблицы, обеспечивая представление всех моделей в согласованном формате, что значительно облегчает понимание структуры создаваемой модели. Дополнительные сведения см. в разделе Просмотр данных модели в средстве просмотра деревьев содержимого общего вида (Майкрософт).

В начало

Средства запроса содержимого модели интеллектуального анализа данных

Чтобы получить содержимое модели интеллектуального анализа данных, необходимо создать запрос к модели интеллектуального анализа данных.

Простейший способ создания запроса содержимого — выполнить следующую инструкцию DMX в среде SQL Server Management Studio.

SELECT * FROM [<mining model name>].CONTENT

Дополнительные сведения см. в разделе Запрос моделей интеллектуального анализа данных (службы Analysis Services — интеллектуальный анализ данных).

Запрос к содержимому модели интеллектуального анализа данных можно также выполнить с помощью наборов строк схемы интеллектуального анализа данных. Такой набор строк имеет стандартную структуру, которая дает возможность клиентам анализировать, просматривать и запрашивать данные о структурах и моделях интеллектуального анализа данных. Запросы к наборам строк схемы могут быть выполнены с помощью инструкций XMLA, Transact-SQL и DMX.

Кроме этого, SQL Server 2008 дает возможность производить доступ к данным наборов строк схемы интеллектуального анализа данных через открытие соединения с сервером Analysis Services и выполнение запросов к системным таблицам. Дополнительные сведения об использовании инструкции SELECT для запроса наборов строк схемы интеллектуального анализа данных см. в разделе Средства устранения неполадок (службы Analysis Services — интеллектуальный анализ данных).

В начало

См. также

Справочник

Средство просмотра деревьев содержимого общего вида (Майкрософт) (конструктор интеллектуального анализа данных)

Основные понятия

Алгоритмы интеллектуального анализа данных (службы Analysis Services — интеллектуальный анализ данных)

Поделиться через

Содержимое модели интеллектуального анализа данных (службы Analysis Services — интеллектуальный анализ данных)

Структура содержимого модели интеллектуального анализа данных

Узлы

Список типов узлов

Идентификатор, имя, заголовок и описание узла

Родительские и дочерние узлы и число элементов

Распределение узла

Оценка узла

Вероятность узла и граничная вероятность

Правило узла и граничное правило

Содержимое модели интеллектуального анализа данных по типу алгоритма

Средства просмотра содержимого модели интеллектуального анализа данных

Средства запроса содержимого модели интеллектуального анализа данных

См. также

Справочник

Основные понятия

Дополнительные ресурсы