SystemGetClusterAccuracyResults(Analysis Services - 数据挖掘)

返回挖掘结构和相关聚类分析模型的交叉验证准确性指标。

此存储过程将为作为单个分区的整个数据集返回指标。若要将数据集分区为交叉部分,并返回每个分区的指标,请使用 SystemGetClusterCrossValidationResults(Analysis Services - 数据挖掘)

注意注意

此存储过程只对聚类分析模型有效。有关非聚类分析模型,请使用 SystemGetAccuracyResults(Analysis Services - 数据挖掘)

语法

SystemGetClusterAccuracyResults(
<mining structure> 
[,<mining model list>]
,<data set>
,<test list>])

参数

  • mining structure
    当前数据库中挖掘结构的名称。

    (必需)

  • mining model list
    要验证的模型的逗号分隔列表。

    默认值为 null,表示使用所有适用的模型。使用默认值时,非聚类分析模型将自动从处理候选列表中排除。

    (可选)

  • data set
    一个整数值,指示挖掘结构中要用于测试的分区。此值派生自位掩码,该位掩码表示以下值的总和,其中任一单个值是可选的:

    定型事例

    0x0001

    测试事例

    0x0002

    模型筛选器

    0x0004

    有关可能的值的完整列表,请参阅本主题的“备注”部分。

    (必需)

  • test list
    指定测试选项的字符串。此参数留待将来使用。

    (可选)

返回类型

一个包含每个分区的分数以及所有模型的聚合的表。

下表列出了 SystemGetClusterAccuracyResults 返回的列。若要了解有关如何解释存储过程返回的信息的详细信息,请参阅交叉验证报表(Analysis Services - 数据挖掘)

列名

说明

ModelName

所测试模型的名称。All 指示结果为所有模型的聚合。

AttributeName

不适用于聚类分析模型。

AttributeState

不适用于聚类分析模型。

PartitionIndex

指示分区的数字。

对于此存储过程,该数字始终为 0。

PartitionCases

一个整数,指示已测试的事例数。

Test

所执行测试的类型。

Measure

测试返回的度量值的名称。每个模型的度量值取决于模型类型以及可预测值的类型。

有关为每个可预测类型返回的度量值的列表,请参阅交叉验证报表(Analysis Services - 数据挖掘)

有关每个度量值的定义,请参阅交叉验证(Analysis Services – 数据挖掘)

Value

指示分类事例可能性的概率分数。

注释

下表提供了一些值的示例,您可以使用这些值指定用于交叉验证的挖掘结构中的数据。如果要将测试事例用于交叉验证,挖掘结构必须已包含测试数据集。有关如何在创建挖掘结构时定义测试数据集的信息,请参阅将数据分区为定型集和测试集(Analysis Services - 数据挖掘)

整数值

说明

1

仅使用定型事例。

2

仅使用测试事例。

3

同时使用定型事例和测试事例。

4

无效组合。

5

仅使用定型事例,并应用模型筛选器。

6

仅使用测试事例,并应用模型筛选器。

7

同时使用定型事例和测试事例,并应用模型筛选器。

有关可以在其中使用交叉验证的应用场景的详细信息,请参阅验证数据挖掘模型(Analysis Services – 数据挖掘)

示例

此示例返回名为 Cluster 1 和 Cluster 2 的两个聚类分析模型的准确性度量值,这两个模型与 vTargetMail 挖掘结构关联。第四行的代码指示结果应只基于测试事例,而不使用任何可能与每个模型关联的筛选器。

CALL SystemGetClusterAccuracyResults (
[vTargetMail],
[Cluster 1], [Cluster 2],
2
)

示例结果:

ModelName

AttributeName

AttributeState

PartitionIndex

PartitionSize

Test

Measure

Value

Cluster 1

 

 

0

5545

Clustering

Case Likelihood

0.796514342249313

Cluster 2

 

 

0

5545

Clustering

Case Likelihood

0.732122471228572

要求

交叉验证仅在 SQL Server 2008 Enterprise 中可用。