数据挖掘 (SSAS)
适用于:SQL Server 2019 及更早版本的 Analysis Services Azure Analysis Services Fabric/Power BI Premium
重要
数据挖掘在 SQL Server 2017 Analysis Services 中已弃用,现在在 SQL Server 2022 Analysis Services 中已停止使用。 对于已弃用和停止使用的功能,文档不会更新。 若要了解详细信息,请参阅 Analysis Services 后向兼容性。
自 2000 年发布以来,SQL Server通过在 SQL Server Analysis Services 中提供数据挖掘,一直是预测分析领域的领先者。 Integration Services、Reporting Services和SQL Server数据挖掘的组合为预测分析提供了一个集成平台,其中包含数据清理和准备、机器学习和报告。 SQL Server数据挖掘包括多种标准算法,包括 EM 和 K 均值聚类分析模型、神经网络、逻辑回归和线性回归、决策树和朴素贝叶斯分类器。 所有模型具有集成的可视化效果,以帮助开发、优化和评估模型。 将数据挖掘集成到商业智能解决方案可帮助你针对复杂问题做出明智决策。
数据挖掘的优点
数据挖掘(也称为预测分析和机器学习)使用精心研究的统计原则来发现数据中的模式。 通过将 SQL Server Analysis Services 中的数据挖掘算法应用于数据,可以预测趋势、识别模式、创建规则和建议、分析复杂数据集中的事件序列,并获取新的见解。
在 2017 SQL Server,数据挖掘功能强大、可访问,并与许多人喜欢用于分析和报告的工具集成。
关键数据挖掘功能
SQL Server数据挖掘提供以下功能来支持集成数据挖掘解决方案:
多个数据源:对于数据挖掘,可使用任何表格形式的数据源,包括电子表格和文本文件。 还可以轻松挖掘在 SQL Server Analysis Services 中创建的 OLAP 多维数据集。 但是,不能使用内存中数据库的数据。
集成数据清理、数据管理和报告:Integration Services 提供用于分析和清理数据的工具。 可构建 ETL 过程,用于清理数据以准备建模,ssISnoversion 也可使重新定型和更新模型更加容易。
多种可自定义算法:除了提供聚类分析、神经网络和决策树等算法外,SQL Server数据挖掘还支持开发自己的自定义插件算法。
模型测试基础结构:使用重要的统计工具(例如交叉验证、分类矩阵、提升图和散点图)测试您的模型和数据集。 轻松创建和管理测试和定型集。
查询和钻取:SQL Server数据挖掘提供 DMX 语言,用于将预测查询集成到应用程序中。 此外,还可以从模型中检索详细统计信息和模式,并钻取到事例数据。
客户端工具:除了 SQL Server 提供的开发和设计工具之外,您还可以使用 Excel 数据挖掘外接程序来创建、查询和浏览模型。 或者,创建自定义的客户端,包括 Web 服务。
脚本语言支持和托管 API:所有数据挖掘对象都是完全可编程的。 可以通过 MDX、XMLA 或 PowerShell 扩展SQL Server Analysis Services编写脚本。 使用数据挖掘扩展插件 (DMX) 语言来进行快速查询和脚本撰写。
安全性和部署:通过SQL Server Analysis Services提供基于角色的安全性,包括用于钻取模型和结构数据的单独权限。 轻松地将模型部署到其他服务器,以便用户可以访问模式或执行预测。
本节内容
本节中的主题介绍 SQL Server 数据挖掘的主要功能和相关任务。