создать отчет перекрестной проверки
В данном разделе описывается создание отчета перекрестной проверки с помощью вкладки «Диаграмма точности» в конструкторе интеллектуального анализа данных. Дополнительные сведения о том, как выглядит отчет перекрестной проверки, и содержащихся в нем статистических мерах см. в разделе Перекрестная проверка (службы Analysis Services — интеллектуальный анализ данных).
Отчет перекрестной проверки существенно отличается от диаграммы точности, в том числе от диаграммы точности прогнозов или матрицы классификации.
Перекрестная проверка оценивает общее распределение данных, используемых в модели или структуре. Таким образом, пользователь не указывает тестируемый набор данных. При перекрестной проверке всегда задействованы только исходные данные, использованные для обучения модели или структуры интеллектуального анализа данных.
Перекрестная проверка может выполняться только в отношении одного прогнозируемого результата. Если структура поддерживает модели, имеющие разные прогнозируемые атрибуты, необходимо создать отдельные отчеты для каждого прогнозируемого результата.
Для перекрестной проверки доступны только те модели, которые связаны со структурой, выбранной в данный момент.
Если выбранная в данный момент структура поддерживает сочетание кластеризованных и некластеризованных моделей, то при нажатии кнопки Получить результаты хранимая процедура перекрестной проверки автоматически загрузит модели, имеющие одинаковый прогнозируемый столбец, и проигнорирует кластеризованные модели, у которых нет одинакового прогнозируемого атрибута.
Отчет перекрестной проверки для кластеризованной модели, не имеющей предсказуемого атрибута, можно создать, только если структура интеллектуального анализа данных не поддерживает другие прогнозируемые атрибуты.
Выбор структуры интеллектуального анализа данных
В среде SQL Server Data Tools (SSDT) откройте конструктор интеллектуального анализа данных.
В обозревателе решений откройте базу данных, содержащую структуру или модель, для которой создается отчет.
Дважды щелкните по структуре интеллектуального анализа данных, чтобы открыть структуру и связанные с ней модели в конструкторе интеллектуального анализа данных.
Перейдите на вкладку Диаграмма точности интеллектуального анализа.
Перейдите на вкладку Перекрестная проверка.
Установка параметров перекрестной проверки
На вкладке Перекрестная проверка щелкните стрелку вниз в поле Количество сверток и выберите число от 1 до 10. Значение по умолчанию — 10.
Значение Количество сверток представляет число секций, которое будет создано в оригинальном наборе данных. Если установить в поле «Количество сверток» значение 1, обучающий набор будет использован без секционирования.
Щелкните стрелку вниз поля Целевой атрибут и выберите из списка столбец. При работе с моделью кластеризации выберите значение #Cluster, чтобы указать, что модель не имеет прогнозируемого атрибута. Обратите внимание, что значение #Cluster доступно, только когда структура интеллектуального анализа данных не поддерживает других типов прогнозируемых атрибутов.
Для каждого отчета можно выбрать только один прогнозируемый атрибут. По умолчанию в отчет включаются все связанные модели, имеющие один и тот же прогнозируемый атрибут.
В поле Максимальное число вариантов введите число, достаточное для обеспечения репрезентативной выборки данных при их разбиении между указанным числом сверток. Если это число больше числа вариантов в обучающем наборе модели, будут использованы все варианты.
При большом размере набора данных для обучения установка значения Максимальное число вариантов ограничивает общее число обработанных вариантов и позволяет ускорить обработку отчета. Однако не следует занижать значение Максимальное число вариантов, поскольку это может привести к недостатку данных для перекрестной проверки.
Дополнительно можно ввести в поле Целевое состояние значение прогнозируемого атрибута, который следует моделировать. Например, если у столбца «Покупатель велосипеда» есть два возможных значения, 1 (Да) и 2 (Нет), то можно ввести значение 1 для оценки точности модели для получения только нужного результата.
Примечание Если значение не было введено, то параметр Целевой порог будет недоступен, а оценка модели будет проведена по всем возможным значениям прогнозируемого атрибута.
Дополнительно можно ввести в поле Целевой порог десятичную дробь от 0 до 1, чтобы указать минимальную вероятность, при которой прогноз может считаться точным.
Дополнительные советы по установке порогов вероятности см. в разделе Меры в отчете перекрестной проверки.
Щелкните Получить результаты.
Печать отчета перекрестной проверки
Щелкните правой кнопкой мыши готовый отчет на вкладке Перекрестная проверка.
В контекстном меню выберите пункт Печать или Предварительный просмотр печати, чтобы выполнить предварительный просмотр отчета.
Создание копии отчета в Microsoft Excel
Щелкните правой кнопкой мыши готовый отчет на вкладке Перекрестная проверка.
В контекстном меню выберите команду Выделить все.
Щелкните правой кнопкой мыши выделенный текст и выберите пункт Копировать.
Вставьте выбранный текст в открытую книгу Excel. Если использовалась команда Вставить, отчет будет вставлен в Excel как HTML; это сохранит форматирование строк и столбцов. Если для вставки отчета использовалась команда Специальная вставка для текста и текста в формате Юникод, отчет будет вставлен в формате с разделителями строк.