Поделиться через


Флаги моделирования (интеллектуальный анализ данных)

Применимо к: SQL Server 2019 и более ранних версий Analysis Services Azure Analysis Services Fabric/Power BI Premium

Это важно

Интеллектуальный анализ данных был признан устаревшим в службах SQL Server 2017 Analysis Services и теперь прекращён в службах SQL Server 2022 Analysis Services. Документация не обновляется для устаревших и прекращённых функций. Дополнительные сведения см. в статье о обратной совместимости служб Analysis Services.

Вы можете использовать флаги моделирования в службах SQL Server Analysis Services для предоставления дополнительных сведений алгоритму интеллектуального анализа данных о данных, определенных в таблице случаев. Алгоритм может использовать эти сведения для создания более точной модели интеллектуального анализа данных.

Некоторые флаги моделирования определяются на уровне структуры данных, а другие — на уровне столбца модели данных. Например, флаг моделирования NOT NULL используется в столбцах структур данных для интеллектуального анализа. Можно определить дополнительные флаги моделирования в столбцах модели интеллектуального анализа данных в зависимости от алгоритма, используемого для создания модели.

Замечание

Сторонние подключаемые модули могут иметь другие флаги моделирования, помимо предварительно определенных SQL Server Analysis Services.

Список флагов моделирования

В следующем списке описаны флаги моделирования, поддерживаемые в службах SQL Server Analysis Services. Сведения о флагах моделирования, поддерживаемых определенными алгоритмами, см. в технической справочной статье по алгоритму, который использовался для создания модели.

НЕТ NULL
Указывает, что значения для столбца атрибутов никогда не должны содержать значение NULL. Произойдет ошибка, если службы SQL Server Analysis Services обнаружат значение NULL для этого столбца атрибута во время процесса обучения модели.

MODEL_EXISTENCE_ONLY
Указывает, что столбец будет рассматриваться как наличие двух состояний: "Отсутствует " и "Существующий". Если значение равно NULL, оно рассматривается как отсутствующее. Флаг MODEL_EXISTENCE_ONLY применяется к прогнозируемой атрибуту и поддерживается большинством алгоритмов.

Фактически, при установке флага MODEL_EXISTENCE_ONLY в положение True представление значений изменяется таким образом, что существует только два состояния: Отсутствует и Существует. Все состояния, которые не отсутствуют, объединяются в одно существующее значение.

Обычное использование этого флага моделирования будет в атрибутах, для которых состояние NULL имеет неявное значение, и явное значение состояния NOT NULL может не быть столь важным, как тот факт, что столбец имеет любое значение. Например, столбец [DateContractSigned] может иметь значение NULL , если контракт никогда не был подписан и НЕ ИМЕЕТ значения NULL , если контракт был подписан. Таким образом, если цель модели заключается в прогнозировании того, будет ли подписан контракт, можно использовать флаг MODEL_EXISTENCE_ONLY, чтобы игнорировать точное значение даты в случаях NOT NULL и различать только те случаи, когда контракт отсутствует или существует.

Замечание

Отсутствует — это специальное состояние, используемое алгоритмом, и отличается от текстового значения "Отсутствует" в столбце. Дополнительные сведения см. в разделе "Отсутствующие значения " (службы Analysis Services — интеллектуальный анализ данных)".

РЕГРЕССОР
Указывает, что столбец является кандидатом для использования в качестве регрессии во время обработки. Этот флаг определен в столбце модели анализа данных и может применяться только к столбцам с непрерывным числовым типом данных. Дополнительные сведения об использовании этого флага см. в разделе, посвященном использованию флага моделирования REGRESSOR.

Просмотр и изменение флагов моделирования

Флаги моделирования, связанные с столбцом структуры интеллектуального анализа данных или столбцом модели, можно просмотреть в конструкторе интеллектуального анализа данных, просмотрев свойства структуры или модели.

Чтобы определить, какие флаги моделирования были применены к текущей структуре интеллектуального анализа данных, можно создать запрос к набору строк схемы интеллектуального анализа данных, который возвращает флаги моделирования только для столбцов структуры, используя следующий запрос:

SELECT COLUMN_NAME, MODELING_FLAG  
FROM $system.DMSCHEMA_MINING_STRUCTURE_COLUMNS  
WHERE STRUCTURE_NAME = '<structure name>'  

Вы можете добавлять или изменять флаги моделирования, используемые в модели, с помощью конструктора интеллектуального анализа данных и редактирования свойств связанных столбцов. Такие изменения требуют повторной обработки структуры или модели.

Вы можете указать флаги моделирования в новой структуре интеллектуального анализа данных или модели интеллектуального анализа данных с помощью dmX или с помощью скриптов AMO или XMLA. Однако вы не можете изменить флаги моделирования, используемые в существующей модели и структуре интеллектуального анализа данных, с помощью DMX. Необходимо создать новую модель добычи данных с помощью синтаксиса ALTER MINING STRUCTURE....ADD MINING MODEL.

Использование флага моделирования REGRESSOR

При установке флага моделирования REGRESSOR на столбец, вы указываете алгоритму, что этот столбец содержит потенциальные регрессоры. Фактические регрессии, используемые в модели, определяются алгоритмом. Потенциальный регрессор можно отменить, если он не моделировал прогнозируемый атрибут.

При создании модели с помощью Мастера интеллектуального анализа данных все непрерывные входные столбцы помечены как возможные регрессоры. Таким образом, даже если флаг REGRESSOR в столбце явно не задан, столбец может использоваться в качестве регрессии в модели.

Вы можете определить регрессоры, которые фактически использовались в обработанной модели, выполнив запрос к набору строк схемы для модели анализа данных, как показано в следующем примере:

SELECT COLUMN_NAME, MODELING_FLAG  
FROM $system.DMSCHEMA_MINING_COLUMNS  
WHERE MODEL_NAME = '<model name>'  

Примечание При изменении модели интеллектуального анализа данных и изменении типа контента столбца с непрерывной на дискретную, необходимо вручную изменить флаг в столбце интеллектуального анализа данных, а затем повторно обработать модель.

Регрессии в моделях линейной регрессии

Модели линейной регрессии основаны на алгоритме деревьев принятия решений Майкрософт. Даже если вы не используете алгоритм линейной регрессии Майкрософт, любая модель дерева принятия решений может содержать дерево или узлы, представляющие регрессию для непрерывного атрибута.

Поэтому в этих моделях не нужно указывать, что непрерывный столбец представляет регрессию. Алгоритм деревьев принятия решений Майкрософт секционирует набор данных в регионы с значимыми шаблонами, даже если флаг REGRESSOR не задан в столбце. Разница заключается в том, что при установке флага моделирования алгоритм пытается найти уравнения регрессии следующей формы, чтобы соответствовать шаблонам в узлах дерева.

a*C1 + b*C2 + ...

Затем вычисляется сумма остатков, и если отклонение слишком велико, в дереве принудительно выполняется разделение.

Например, если вы прогнозируете поведение покупки клиентов с помощью дохода в качестве атрибута и задает флаг моделирования REGRESSOR в столбце, алгоритм сначала попытается соответствовать значениям дохода с помощью стандартной формулы регрессии. Если отклонение слишком велико, формула регрессии отбрасывается, и дерево будет разделено на другой атрибут. Затем алгоритм дерева принятия решений попытается применить регрессию для дохода в каждой из ветвей после разделения.

Вы можете использовать параметр FORCE_REGRESSOR, чтобы гарантировать, что алгоритм будет использовать конкретный регрессор. Этот параметр можно использовать с алгоритмом дерева принятия решений и алгоритмом линейной регрессии.

Чтобы узнать больше об использовании флагов моделирования, воспользуйтесь приведенными ниже ссылками.

Задача Тема
Изменение флагов моделирования с помощью конструктора интеллектуального анализа данных Просмотр или изменение флагов моделирования (интеллектуальный анализ данных)
Дайте алгоритму указание рекомендовать вероятные регрессоры. Указание столбца для использования в качестве регрессии в модели
См. флаги моделирования, поддерживаемые определенными алгоритмами (в разделе "Флаги моделирования" для каждого справочного раздела алгоритма) Алгоритмы интеллектуального анализа данных (службы Analysis Services — интеллектуальный анализ данных)
Узнайте больше о столбцах структуры обработки данных и свойствах, которые можно задать для них Столбцы структуры интеллектуального анализа данных
Узнайте о столбцах модели интеллектуального анализа данных и флагах, используемых для моделирования, которые можно применить на уровне модели. Столбцы модели анализа данных
См. синтаксис для работы с флагами моделирования в инструкциях DMX Флаги моделирования (DMX)
Понимание отсутствующих значений и работа с ними Отсутствующие значения (Analysis Services - интеллектуальный анализ данных)
Сведения об управлении моделями и структурами и настройке свойств использования Перемещение объектов интеллектуального анализа данных