SystemGetClusterCrossValidationResults(Analysis Services - 데이터 마이닝)

아티클
05/07/2013

마이닝 구조를 지정된 수의 교집합 영역으로 분할하고 각 파티션의 모델을 학습한 다음 각 파티션의 정확도 메트릭을 반환합니다.

참고 이 저장 프로시저는 클러스터링 모델이 적어도 하나 포함되어 있는 마이닝 구조에만 사용할 수 있습니다. 클러스터링 이외의 모델에 대해 교차 유효성 검사를 수행하려면 SystemGetCrossValidationResults(Analysis Services - 데이터 마이닝)를 사용해야 합니다.

구문

SystemGetClusterCrossValidationResults(
<structure name>, 
[,<mining model list>]
,<fold count>}
,<max cases>
<test list>])

인수

mining structure
현재 데이터베이스의 마이닝 구조 이름입니다.

(필수)
mining model list
유효성을 검사할 마이닝 모델의 쉼표로 구분된 목록입니다.

마이닝 모델의 목록을 지정하지 않으면 지정된 구조와 연결된 모든 클러스터링 모델에 대해 교차 유효성 검사가 수행됩니다.

[!참고]

클러스터링 이외의 모델에 대해 교차 유효성 검사를 수행하려면 별도의 저장 프로시저인 SystemGetCrossValidationResults(Analysis Services - 데이터 마이닝)를 사용해야 합니다.

(옵션)
fold count
데이터 집합을 분할할 파티션 수를 지정하는 정수입니다. 최소값은 2입니다. 최대 접기 수는 maximum integer와 사례 수 중 더 작은 값입니다.

각 파티션에는 다음과 거의 같은 수의 사례가 포함됩니다. max cases/fold count.

기본값은 없습니다.

[!참고]

접기 수에 따라 교차 유효성 검사를 수행하는 데 필요한 시간이 크게 달라집니다. 너무 큰 값을 선택하면 쿼리가 장시간 실행될 수 있으며 경우에 따라서는 서버가 응답하지 않거나 제한 시간이 초과될 수 있습니다.

(필수)
max cases
테스트할 수 있는 최대 사례 수를 지정하는 정수입니다.

값을 0으로 지정하면 데이터 원본의 모든 사례가 사용됩니다.

데이터 집합의 실제 사례 수보다 큰 값을 지정하면 데이터 원본의 모든 사례가 사용됩니다.

(필수)
test list
테스트 옵션을 지정하는 문자열입니다.

참고 이 매개 변수는 나중에 사용하기 위해 예약되어 있습니다.

(옵션)

반환 형식

반환 형식 표에는 각 개별 파티션의 점수와 모든 모델에 대한 집계가 포함됩니다.

다음 표에서는 반환되는 열을 설명합니다.

열 이름	설명
ModelName	테스트한 모델의 이름입니다.
AttributeName	예측 가능한 열의 이름입니다. 클러스터 모델의 경우 항상 null입니다.
AttributeState	예측 가능한 열의 지정된 대상 값입니다. 클러스터 모델의 경우 항상 null입니다.
PartitionIndex	결과가 적용되는 파티션을 식별하는 인덱스(1부터 시작)입니다.
PartitionSize	각 파티션에 포함된 사례 수를 나타내는 정수입니다.
Test	수행한 테스트 유형입니다.
Measure	테스트에서 반환한 측정값의 이름입니다. 각 모델의 측정값은 예측 가능한 값의 유형에 따라 달라집니다. 각 측정값의 정의는 교차 유효성 검사(Analysis Services - 데이터 마이닝)를 참조하십시오. 각 예측 가능 유형에 대해 반환된 측정값 목록은 교차 유효성 검사 보고서의 측정값를 참조하십시오.
값	지정된 테스트 측정값의 값입니다.

주의

전체 데이터 집합에 대한 정확도 메트릭을 반환하려면 SystemGetClusterAccuracyResults(Analysis Services - 데이터 마이닝)를 사용합니다.

또한 마이닝 모델이 접기로 이미 분할된 경우에는 SystemGetClusterAccuracyResults(Analysis Services - 데이터 마이닝)를 사용하여 처리를 무시하고 교차 유효성 검사의 결과만 반환할 수 있습니다.

예

다음 예에서는 마이닝 구조를 3개의 접기로 분할한 다음 마이닝 구조에 연결된 클러스터링 모델 두 개를 테스트하는 방법을 보여 줍니다.

코드의 세 번째 줄에는 테스트할 마이닝 모델이 나열됩니다. 목록을 지정하지 않으면 구조에 연결된 모든 클러스터링 모델이 사용됩니다.

코드의 네 번째 줄에서는 접기 수를 지정하고 다섯 번째 줄에서는 사용할 최대 사례 수를 지정합니다.

모두 클러스터링 모델이므로 예측 가능한 특성이나 값을 지정하지 않아도 됩니다.

CALL SystemGetClusterCrossValidationResults(
[v Target Mail],
[Cluster 1], [Cluster 2],
3,
10000
)

예제 결과:

ModelName	PartitionIndex	PartitionSize	Test	측정값	값
Cluster 1	1	3025	Clustering	사례 유사도	0.930524511864121
Cluster 1	2	3025	Clustering	사례 유사도	0.919184178430778
Cluster 1	3	3024	Clustering	사례 유사도	0.929651120490248
Cluster 2	1	1289	Clustering	사례 유사도	0.922789726933607
Cluster 2	2	1288	Clustering	사례 유사도	0.934865535691068
Cluster 2	3	1288	Clustering	사례 유사도	0.924724595688798