新增功能(Analysis Services – 数据挖掘)
注意 |
---|
对于 SQL Server 2008 R2,没有对本主题中所列的内容进行任何更改。 |
Microsoft SQL Server Analysis Services 的这个最新版本引入了新功能和增强功能。有关新的内存中分析功能以及用于 Analysis Services 的 Sharepoint 集成模式的信息,请参阅 PowerPivot for SharePoint。
与 Office 2007 数据挖掘外接程序的兼容性
使用 SQL Server 2008 Office 2007 数据挖掘外接程序时,SQL Server 2008 R2 支持从 Microsoft Excel 创建、管理和使用数据挖掘模型。这一流行的免费外接程序版本可用于连接到使用 SQL Server 2008 R2 或 SQL Server 2008 的 Analysis Services 实例。您不能直接使用通过 PowerPivot for Excel 创建的内存中多维数据集。
与 PowerPivot for Excel 2010 的兼容性
您可以在 PowerPivot for Excel 外接程序所在的计算机上安装数据挖掘外接程序,并且在同一 Excel 2010 工作簿内使用它们。但是,若要使用数据挖掘外接程序,您必须安装有 32 位版本的 Excel 2010。PowerPivot 客户端可在 32 位或 64 位版本的 Excel 2010 上运行。
有关这些外接程序的详细信息,请参阅 Data Mining Add-ins for Office 2007(Office 2007 数据挖掘外接程序)。
新的示例和资源
联机丛书不再包括 SQL Server 示例数据库和示例应用程序。这些示例数据库和示例应用程序现在位于 SQL Server Samples(SQL Server 示例)网站上。该网站便于用户查找这些示例,还提供了与 Microsoft SQL Server 和商业智能相关的其他新示例。在 SQL Server 示例网站上,您可以执行下列操作:
浏览由开发人员、用户和 Microsoft 最有价值专家 (MVP) 社区提供的示例。
下载示例数据库和代码项目。
查看或参与讨论区,您可以在讨论区报告和询问与各技术领域的示例相关的问题。
在 PowerPivot.com 网站上提供使用 PowerPivot 客户端和 Analysis Services 的新的 Sharepoint 集成实例的附加示例。
SQL Server 2008 中的数据挖掘功能
SQL Server 2008 的 R2 版本支持 SQL Server 2008 中新增的以下功能。
创建维持测试集
现在创建挖掘结构时,可以将挖掘结构中的数据分为定型集和测试集。分区的定义与结构存储在一起,因此您可以在基于该结构的任何挖掘模型中重用这些定型集和测试集。
有关如何使用定型数据集和测试数据集的详细信息,请参阅将数据分区为定型集和测试集(Analysis Services - 数据挖掘)。
有关 SQL Server 2008 中的所有模型验证功能的详细信息,请参阅验证数据挖掘模型(Analysis Services – 数据挖掘)。
筛选模型事例
现在,可以将筛选器附加到挖掘模型,并在定型和测试期间应用该筛选器。对模型应用筛选器,可以控制用于给模型定型的数据,也更容易评估出模型对数据子集的准确情况。
有关如何创建挖掘模型筛选器的详细信息,请参阅为挖掘模型创建筛选器(Analysis Services – 数据挖掘)。
有关为挖掘模型测试筛选数据的信息,请参阅模型准确性图表工具(Analysis Services - 数据挖掘)。
多个挖掘模型的交叉验证
交叉验证是用于评估数据挖掘模型的准确性的既定方法。在交叉验证中,可反复将挖掘结构数据分为多个子集,生成子集的模型,然后衡量每个分区的模型的准确性。通过查看返回的统计信息,可以确定挖掘模型的可靠程度,并且可以更容易地对比基于相同结构的模型。
有关详细信息,请参阅交叉验证(Analysis Services – 数据挖掘)。
Microsoft 时序算法的增强功能
为了改进时序模型中某些预测的准确性和稳定性,在 Microsoft 时序算法中增加了一种新的算法。该新算法基于熟知的 ARIMA 算法,它比 Analysis Services 一直使用的 ARTxp 算法可提供更佳的长期预测。(ARTxp 是自动回归树算法,针对单个时间段预测或短期预测进行了优化。)
有关时序挖掘模型的详细信息,请参阅 Microsoft 时序算法和 PredictTimeSeries (DMX)。
钻取到结构事例和结构列
在 SQL Server 2008 中,如果对挖掘结构启用钻取,则可以查询挖掘结构并返回有关用于定型和测试的事例的详细信息。可以使用数据挖掘扩展插件 (DMX) 创建对结构的钻取查询。
有关详细信息,请参阅针对挖掘模型和挖掘结构使用钻取(Analysis Services – 数据挖掘)。
有关挖掘结构的 DMX 查询的示例,请参阅 SELECT FROM <结构>.CASES。
有关从模型到结构数据的钻取的示例,请参阅 SELECT FROM <模型>.CASES (DMX)。
对挖掘模型列使用别名
现在,可以为挖掘模型中的列添加别名,以便于理解列内容和在 DMX 语句中引用列。
有关如何管理和查看别名的详细信息,请参阅设置挖掘模型的属性或如何为模型列创建别名。
有关如何使用 DMX 创建列别名的信息,请参阅 ALTER MINING STRUCTURE (DMX)。
查询数据挖掘架构行集
在 SQL Server 2008 中,许多现有 OLE DB 数据挖掘架构行集已作为可以使用 DMX 语句轻松查询的一组系统表公开。这便于检索与模型和结构有关的元数据、提取挖掘模型内容的详细信息或监视 Analysis Services 实例或服务。
有关详细信息,请参阅查询数据挖掘架构行集(Analysis Services - 数据挖掘)。
聚类模型的更改
在 SQL Server 2008 中,Microsoft 聚类分析算法的默认配置已更改为在默认情况下使用 z-score 规范化。这一更改旨在尽量减小可能具有较大数量级和许多离群值的属性的影响。通常,z-score 规范化能够改善聚类结果。但是,它可能更改非正态分布的聚类结果。同时,将解决方案从较早版本的 Analysis Services 迁移到 SQL Server 2008 Analysis Services 的用户可能会注意到聚类模型现在生成不同的结果。有关详细信息,请参阅Microsoft 聚类分析算法技术参考。
Analysis Services 的增强功能
如果使用 Analysis Services 来创建也用于数据挖掘的 OLAP 多维数据集,您可能会发现可以更容易地设计维度及其相关的层次结构和属性。维度设计器中提供了新的属性关系设计器,可帮助您设计属性关系,并确保属性关系遵循最佳实践。
有关详细信息,请参阅新增功能(Analysis Services - 多维数据库)。