随着数据的指数增长,组织依赖于 Azure 的无限计算、存储和分析能力来缩放、流式传输、预测和查看其数据。 分析解决方案将大量数据转化为有用的商业智能 (BI),例如报表和可视化效果,以及创造性的人工智能 (AI),例如基于机器学习的预测。
无论组织是刚刚开始评估基于云的分析工具,还是希望扩展当前实现,Azure 都提供了许多选项。 工作流从了解常见方法开始,并围绕云思维模式协调流程和角色。
数据可以分批处理、实时处理、本地处理或在云中处理,但任何分析解决方案的目标都是大规模使用数据。 越来越多的组织希望为人、计算机和物联网 (IoT) 生成的所有关系和非关系数据创建单个事实来源。 通常使用大数据体系结构或 IoT 体系结构将原始数据转换为结构化形式,然后将其移动到分析数据存储。 此存储成为单个事实来源,可为大量富有见解的分析解决方案提供支持。
下载此体系结构的 Visio 文件。
了解 Azure 上的分析
如果你还不熟悉 Azure 上的分析,最好是在免费的联机培训平台 Microsoft Learn 上了解详细信息。 你将找到针对特定产品和服务的视频、教程和实践学习,以及基于工作角色的学习路径,例如开发人员或数据分析师。
组织就绪性
如果你的组织不熟悉云,云采用框架可以帮助你入门。 此文档和最佳做法合集提供了来自 Microsoft 的经过验证的指导,旨在加速云采用旅程。 还列出了用于在 Azure 中大众化数据的创新工具。
为了帮助确保 Azure 上的分析解决方案的质量,我们建议遵循 Azure 架构良好的框架。 它为寻求卓越体系结构的组织提供规范性指导,并讨论如何设计、预配和监视成本优化型 Azure 解决方案。
实现生产的路径
了解如何存储数据是你在 Azure 上进行分析的过程中需要做出的首要决策之一。 然后,可以为方案选择最佳数据分析技术。
要开始操作,请考虑以下示例实现:
最佳实践
高质量的分析始于可靠可信的数据。 在最高级别,信息安全做法有助于确保数据在传输和静态时受到保护。 对该数据的访问也必须是受信任的。 可信数据意味着实现以下功能的设计:
在平台级别,以下大数据最佳做法有助于在 Azure 上进行可信分析:
使用数据工作流或管道解决方案(例如 Azure 数据工厂或 Oozie 支持的解决方案)协调数据引入。
使用分布式数据存储就地处理数据,这是一种支持更大数据量和更多种格式的大数据方法。
作为引入工作流的一部分,尽早清理敏感数据,以避免将其存储在数据湖中。
通过均衡所需计算节点的每单位成本与使用这些节点完成作业的每分钟成本,考虑所需 Azure 资源的总成本。
创建一个数据湖,可以组合使用多种格式的文件存储,无论是结构化的、半结构化的还是非结构化的。 在 Microsoft,我们使用 Azure Data Lake Storage Gen2 作为单个事实来源。 有关示例,请参阅卓越中心的 BI 解决方案体系结构。
其他资源
分析是一个广泛的类别,涵盖一系列解决方案。 以下资源可帮助你了解有关 Azure 的详细信息。
混合
大多数组织都需要通过混合方式来进行分析,因为他们的数据同时托管在本地和云中。 组织通常会将本地数据解决方案扩展到云。 为连接环境,组织必须选择混合网络体系结构。
混合方法可能包括大型机和中型机系统作为 Azure 解决方案的数据源。 例如,组织可能想要现代化大型机和中级机数据,或提供对 Azure 数据库的大型机访问。
示例解决方案
下面是在 Azure 上实现分析的一些示例:
AWS 或 Google Cloud 专业人员
这些文章通过将 Azure 分析选项与其他云服务进行比较来帮助你快速提升: