Выбор столбца, используемого для тестирования модели интеллектуального анализа данных

2013-07-30

Прежде чем измерять точность модели интеллектуального анализа данных, необходимо решить, какие результаты вы хотите оценить. Для большинства моделей интеллектуального анализа данных необходимо выбрать хотя бы один столбец, который будет использоваться в качестве прогнозируемого атрибута при создании модели. Поэтому при проверке точности модели обычно необходимо выбрать для проверки этот атрибут.

В следующем списке указаны некоторые дополнительные соображения, связанные с выбором прогнозируемого атрибута для использования при проверке.

Некоторые типы моделей интеллектуального анализа данных могут прогнозировать несколько атрибутов — например, нейронные сети, которые могут исследовать связи между большим количеством атрибутов.
Другие типы моделей интеллектуального анализа данных (например, модели кластеризации) могут вообще не иметь прогнозируемого атрибута. Модели кластеризации невозможно проверить, если они не имеют прогнозируемого атрибута.
Чтобы создать точечную диаграмму или измерить точность модели логистической регрессии, необходимо выбрать в качестве результата непрерывный прогнозируемый атрибут. В этом случае невозможно указать целевое значение. Если создается не точечная диаграмма, базовый столбец структуры интеллектуального анализа данных должен также иметь тип содержимого Дискретный или Дискретизированный.
Если выбрать в качестве результата дискретный атрибут, можно также указать целевое значение для прогнозируемого столбца или оставить поле Прогнозируемое значение пустым. Если включить параметр Прогнозируемое значение, диаграмма покажет только эффективность модели в прогнозировании этого целевого значения. Если не указать целевой результат, измеряется точность модели в прогнозировании всех результатов.
Если нужно включить несколько моделей и сравнить их на одной диаграмме точности, все модели должны использовать один и тот же прогнозируемый столбец.
Если создается отчет перекрестной проверки, службы Analysis Services автоматически проанализируют все модели с одним и тем же прогнозируемым атрибутом.
Если флажок Синхронизировать столбцы и значения прогноза установлен, службы Analysis Services автоматически выбирают прогнозируемые столбцы с одинаковыми именами и соответствующими типами данных. Если столбцы не удовлетворяют этим критериям, можно снять этот флажок и выбрать прогнозируемый столбец вручную. Это может потребоваться для проверки модели с внешним набором данных, столбцы которого отличаются от столбцов модели. Однако, если выбрать столбец с неправильным типом данных, это приведет к ошибке или плохим результатам.

Укажите прогнозируемый столбец.

Дважды щелкните структуру интеллектуального анализа данных, чтобы открыть ее в конструкторе интеллектуального анализа данных.
Перейдите на вкладку Диаграмма точности интеллектуального анализа данных.
Перейдите на вкладку Выбор входа.
На вкладке Выбор входа, в списке Имя прогнозируемого столбца выберите прогнозируемый столбец для каждой модели, которую хотите включить в диаграмму.

В окне Имя прогнозируемого столбца доступны только те столбцы модели интеллектуального анализа данных, которые имеют тип Прогноз или Только прогноз.
Чтобы определить точность модели, необходимо указать конкретное значение результата, выбрав его в списке Значение прогнозирования.

См. также

Задания

Выбрать и сопоставить данные проверки модели

Основные понятия

Выбор типа диаграммы точности и задание параметров диаграммы