Поделиться через


создать отчет перекрестной проверки

В данном разделе описывается создание отчета перекрестной проверки с помощью вкладки «Диаграмма точности» в конструкторе интеллектуального анализа данных. Дополнительные сведения о том, как выглядит отчет перекрестной проверки, и содержащихся в нем статистических мерах см. в разделе Перекрестная проверка (службы Analysis Services — интеллектуальный анализ данных).

Отчет перекрестной проверки существенно отличается от диаграммы точности, в том числе от диаграммы точности прогнозов или матрицы классификации.

  • Перекрестная проверка оценивает общее распределение данных, используемых в модели или структуре. Таким образом, пользователь не указывает тестируемый набор данных. При перекрестной проверке всегда задействованы только исходные данные, использованные для обучения модели или структуры интеллектуального анализа данных.

  • Перекрестная проверка может выполняться только в отношении одного прогнозируемого результата. Если структура поддерживает модели, имеющие разные прогнозируемые атрибуты, необходимо создать отдельные отчеты для каждого прогнозируемого результата.

  • Для перекрестной проверки доступны только те модели, которые связаны со структурой, выбранной в данный момент.

  • Если выбранная в данный момент структура поддерживает сочетание кластеризованных и некластеризованных моделей, то при нажатии кнопки Получить результаты хранимая процедура перекрестной проверки автоматически загрузит модели, имеющие одинаковый прогнозируемый столбец, и проигнорирует кластеризованные модели, у которых нет одинакового прогнозируемого атрибута.

  • Отчет перекрестной проверки для кластеризованной модели, не имеющей предсказуемого атрибута, можно создать, только если структура интеллектуального анализа данных не поддерживает другие прогнозируемые атрибуты.

Выбор структуры интеллектуального анализа данных

  1. В среде SQL Server Data Tools (SSDT) откройте конструктор интеллектуального анализа данных.

  2. В обозревателе решений откройте базу данных, содержащую структуру или модель, для которой создается отчет.

  3. Дважды щелкните по структуре интеллектуального анализа данных, чтобы открыть структуру и связанные с ней модели в конструкторе интеллектуального анализа данных.

  4. Перейдите на вкладку Диаграмма точности интеллектуального анализа.

  5. Перейдите на вкладку Перекрестная проверка.

Установка параметров перекрестной проверки

  1. На вкладке Перекрестная проверка щелкните стрелку вниз в поле Количество сверток и выберите число от 1 до 10. Значение по умолчанию — 10.

    Значение Количество сверток представляет число секций, которое будет создано в оригинальном наборе данных. Если установить в поле «Количество сверток» значение 1, обучающий набор будет использован без секционирования.

  2. Щелкните стрелку вниз поля Целевой атрибут и выберите из списка столбец. При работе с моделью кластеризации выберите значение #Cluster, чтобы указать, что модель не имеет прогнозируемого атрибута. Обратите внимание, что значение #Cluster доступно, только когда структура интеллектуального анализа данных не поддерживает других типов прогнозируемых атрибутов.

    Для каждого отчета можно выбрать только один прогнозируемый атрибут. По умолчанию в отчет включаются все связанные модели, имеющие один и тот же прогнозируемый атрибут.

  3. В поле Максимальное число вариантов введите число, достаточное для обеспечения репрезентативной выборки данных при их разбиении между указанным числом сверток. Если это число больше числа вариантов в обучающем наборе модели, будут использованы все варианты.

    При большом размере набора данных для обучения установка значения Максимальное число вариантов ограничивает общее число обработанных вариантов и позволяет ускорить обработку отчета. Однако не следует занижать значение Максимальное число вариантов, поскольку это может привести к недостатку данных для перекрестной проверки.

  4. Дополнительно можно ввести в поле Целевое состояние значение прогнозируемого атрибута, который следует моделировать. Например, если у столбца «Покупатель велосипеда» есть два возможных значения, 1 (Да) и 2 (Нет), то можно ввести значение 1 для оценки точности модели для получения только нужного результата.

    ПримечаниеПримечание

    Если значение не было введено, то параметр Целевой порог будет недоступен, а оценка модели будет проведена по всем возможным значениям прогнозируемого атрибута.

  5. Дополнительно можно ввести в поле Целевой порог десятичную дробь от 0 до 1, чтобы указать минимальную вероятность, при которой прогноз может считаться точным.

    Дополнительные советы по установке порогов вероятности см. в разделе Меры в отчете перекрестной проверки.

  6. Щелкните Получить результаты.

Печать отчета перекрестной проверки

  1. Щелкните правой кнопкой мыши готовый отчет на вкладке Перекрестная проверка.

  2. В контекстном меню выберите пункт Печать или Предварительный просмотр печати, чтобы выполнить предварительный просмотр отчета.

Создание копии отчета в Microsoft Excel

  1. Щелкните правой кнопкой мыши готовый отчет на вкладке Перекрестная проверка.

  2. В контекстном меню выберите команду Выделить все.

  3. Щелкните правой кнопкой мыши выделенный текст и выберите пункт Копировать.

  4. Вставьте выбранный текст в открытую книгу Excel. Если использовалась команда Вставить, отчет будет вставлен в Excel как HTML; это сохранит форматирование строк и столбцов. Если для вставки отчета использовалась команда Специальная вставка для текста и текста в формате Юникод, отчет будет вставлен в формате с разделителями строк.

См. также

Основные понятия

Меры в отчете перекрестной проверки