Поделиться через


SystemGetCrossValidationResults (службы Analysis Services — интеллектуальный анализ данных)

Применимо к: SQL Server 2019 и более ранних версий Analysis Services Azure Analysis Services Fabric/Power BI Premium

Это важно

Интеллектуальный анализ данных был признан устаревшим в службах SQL Server 2017 Analysis Services и теперь прекращён в службах SQL Server 2022 Analysis Services. Документация не обновляется для устаревших и прекращённых функций. Дополнительные сведения см. в статье о обратной совместимости служб Analysis Services.

Секционирует структуру интеллектуального анализа данных по указанному количеству перекрестных разделов, обучает модель для каждой секции, а затем возвращает метрики точности для каждой секции.

Замечание

Эту хранимую процедуру нельзя использовать для перекрестной проверки моделей кластеризации или моделей, созданных с помощью алгоритма временных рядов Майкрософт или алгоритма кластеризации последовательностей Майкрософт. Для перекрестной проверки моделей кластеризации можно использовать отдельную хранимую процедуру SystemGetClusterCrossValidationResults (службы Analysis Services — интеллектуальный анализ данных).

Синтаксис

  
SystemGetCrossValidationResults(  
<mining structure>  
[, <mining model list>]  
,<fold count>  
,<max cases>  
,<target attribute>  
[,<target state>]  
[,<target threshold>]  
[,<test list>])  

Arguments

Структура интеллектуального анализа данных
Имя структуры интеллектуального анализа данных в текущей базе данных.

(required)

Список моделей интеллектуального анализа данных
Разделенный запятыми список моделей интеллектуального анализа данных для проверки.

Если имя модели содержит какие-либо символы, недопустимые в имени идентификатора, имя должно быть заключено в скобки.

Если список моделей интеллектуального анализа данных не указан, перекрестная проверка выполняется для всех моделей, связанных с указанной структурой и содержащих прогнозируемый атрибут.

Замечание

Для перекрестной проверки моделей кластеризации необходимо использовать отдельную хранимую процедуру SystemGetClusterCrossValidationResults (службы Analysis Services — интеллектуальный анализ данных).

(необязательно).

количество сверток
Целое число, указывающее количество секций, в которые следует разделить набор данных. Минимальное значение — 2. Максимальное число сверток — максимальное целое число или число случаев, в зависимости от того, что меньше.

Каждая секция будет содержать примерно это число случаев: максимальное число случаев/свертывания.

Значения по умолчанию нет.

Замечание

Количество сверток значительно влияет на время, необходимое для выполнения перекрестной проверки. Если выбрать слишком большое число, запрос может выполняться в течение очень длительного времени, и в некоторых случаях сервер может перестать отвечать или истекать.

(required)

максимальное число случаев
Целое число, указывающее максимальное количество случаев, которые можно протестировать во всех свертках.

Значение 0 указывает, что будут использоваться все варианты в источнике данных.

Если указать значение, превышающее фактическое число случаев в наборе данных, будут использоваться все случаи в источнике данных.

Значения по умолчанию нет.

(required)

целевой атрибут
Строка, содержащая имя прогнозируемого атрибута. Прогнозируемый атрибут может быть столбцом, вложенным столбцом таблицы или вложенным ключевым столбцом таблицы модели интеллектуального анализа данных.

Замечание

Существование целевого атрибута проверяется только во время выполнения.

(required)

целевое состояние
Формула, указывающая значение для прогнозирования. Если задано целевое значение, метрики собираются только для указанного значения.

Если значение не указано или равно NULL, метрики вычисляются для наиболее вероятного состояния для каждого прогноза.

Значение по умолчанию равно NULL.

Ошибка возникает во время проверки, если указанное значение недопустимо для указанного атрибута или если формула не является правильным типом для указанного атрибута.

(необязательно).

целевоепороговое значение
В два раза больше 0 и меньше 1. Указывает минимальную оценку вероятности, которая должна быть получена для прогнозирования указанного целевого состояния, которое будет считаться правильным.

Прогноз, который имеет вероятность меньше или равно этому значению, считается неверным.

Если значение не указано или равно null, используется наиболее вероятное состояние независимо от его оценки вероятности.

Значение по умолчанию равно NULL.

Замечание

Службы SQL Server Analysis Services не будут вызывать ошибку, если задано пороговое значение состояния 0.0, но это значение никогда не следует использовать. В действительности пороговое значение 0,0 означает, что прогнозы с вероятностью 0 процентов считаются правильными.

(необязательно).

список тестов
Строка, указывающая параметры тестирования.

Примечание Этот параметр зарезервирован для дальнейшего использования.

(необязательно).

Тип возвращаемых данных

Возвращаемый набор строк содержит оценки для каждой секции в каждой модели.

В следующей таблице описываются столбцы в наборе строк.

Имя столбца Description
НазваниеМодели Имя протестированной модели.
ИмяАтрибута Имя прогнозируемого столбца.
AttributeState Указанное целевое значение в прогнозируемом столбце. Если это значение равно NULL, используется наиболее вероятный прогноз.

Если этот столбец содержит значение, точность модели оценивается только по этому значению.
PartitionIndex 1-й индекс, определяющий, к какой секции применяются результаты.
Размер раздела Целое число, указывающее, сколько случаев было включено в каждую секцию.
Test Категория выполненного теста. Описание категорий и тестов, включенных в каждую категорию, см. в разделе "Меры" в отчете о перекрестной проверке.
Мера Имя меры, возвращаемой тестом. Меры для каждой модели зависят от типа прогнозируемого значения. Определение каждой меры см. в разделе " Перекрестная проверка" (службы Analysis Services — интеллектуальный анализ данных).

Список мер, возвращаемых для каждого прогнозируемого типа, см. в разделе "Меры" в отчете о перекрестной проверке.
Ценность Значение указанной тестовой меры.

Замечания

Чтобы вернуть метрики точности для полного набора данных, используйте SystemGetAccuracyResults (службы Analysis Services — интеллектуальный анализ данных).

Если модель интеллектуального анализа данных уже секционирована по сверткам, можно обойти обработку и вернуть только результаты перекрестной проверки с помощью SystemGetAccuracyResults (службы Analysis Services — интеллектуальный анализ данных).

Примеры

В следующем примере показано, как секционировать структуру интеллектуального анализа данных для перекрестной проверки на два свертывания, а затем протестировать две модели интеллектуального анализа данных, связанные со структурой интеллектуального анализа данных. [v Target Mail]

В трех строках кода перечислены модели интеллектуального анализа данных, которые требуется протестировать. Если список не указан, используются все некластикционные модели, связанные со структурой. Строка четыре кода указывает количество секций. Так как значение не указано для максимального числа случаев, все случаи в структуре интеллектуального анализа данных используются и распределяются равномерно по секциям.

Строка пять указывает прогнозируемый атрибут, Байкер велосипедов и шесть строк указывает значение для прогнозирования, 1 (то есть, будет покупать).

Значение NULL в строке семь указывает на отсутствие минимальной полосы вероятности, которую необходимо выполнить. Поэтому первый прогноз с ненулевым вероятностью будет использоваться при оценке точности.

CALL SystemGetCrossValidationResults(  
[v Target Mail],  
[Target Mail DT], [Target Mail NB],  
2,  
'Bike Buyer',  
1,  
NULL  
)  

Пример результатов:

НазваниеМодели ИмяАтрибута AttributeState PartitionIndex Размер раздела Test Мера Ценность
Целевая почта DT Покупатель велосипедов 1 1 500 Classification Истинное положительное значение 144
Целевая почта DT Покупатель велосипедов 1 1 500 Classification Ложноположительный результат 105
Целевая почта DT Покупатель велосипедов 1 1 500 Classification Истинно отрицательный 186
Целевая почта DT Покупатель велосипедов 1 1 500 Classification Ложный отрицательный 65
Целевая почта DT Покупатель велосипедов 1 1 500 Вероятность Оценка журнала -0.619042807138345
Целевая почта DT Покупатель велосипедов 1 1 500 Вероятность Лифт 0.0740963734002671
Целевая почта DT Покупатель велосипедов 1 1 500 Вероятность Ошибка корневого среднего квадрата 0.346946279977653
Целевая почта DT Покупатель велосипедов 1 2 500 Classification Истинное положительное значение 162
Целевая почта DT Покупатель велосипедов 1 2 500 Classification Ложноположительный результат 86
Целевая почта DT Покупатель велосипедов 1 2 500 Classification Истинно отрицательный 165
Целевая почта DT Покупатель велосипедов 1 2 500 Classification Ложный отрицательный 87
Целевая почта DT Покупатель велосипедов 1 2 500 Вероятность Оценка журнала -0.654117781086519
Целевая почта DT Покупатель велосипедов 1 2 500 Вероятность Лифт 0.038997399132084
Целевая почта DT Покупатель велосипедов 1 2 500 Вероятность Ошибка корневого среднего квадрата 0.342721344892651

Требования

Перекрестная проверка доступна только в SQL Server Enterprise, начиная с SQL Server 2008.

См. также

SystemGetCrossValidationResults
SystemGetAccuracyResults (службы Analysis Services — интеллектуальный анализ данных)
SystemGetClusterCrossValidationResults (службы Analysis Services — интеллектуальный анализ данных)
SystemGetClusterAccuracyResults (службы Analysis Services — интеллектуальный анализ данных)