什么是 Fabric 中的实时分析?

过去几十年来,我们访问和使用信息的方式已经发生了范式转变,因为用户已经习惯了交互式、按需且可供所有人访问的数据。 这种转变由大数据、流式数据引入和基于关键字的索引搜索驱动。 它们共同构成了简化的用户体验。 借助 Microsoft Fabric 中的实时分析,我们使组织能够专注于和纵向扩展其分析解决方案,同时将数据民主化,以满足从公民数据科学家到高级数据工程师的需求。 实时分析在企业世界中的许多场景中都至关重要,例如网络安全、资产跟踪和管理、预测性维护、供应链优化、客户体验、能源管理、库存管理、质量控制、环境监视、舰队管理以及健康和安全。

如何操作? 实时分析降低了复杂性并简化了数据集成。 只需几秒即可对任何数据源或格式进行预配、自动数据流式处理、索引和分区,并可按需查询生成和可视化效果,从而快速访问数据见解。 用户流程得到了简化,同时保留了强大的分析功能。 实时分析使你能够在数据和查询需求的增长之下,通过与服务无缝纵向扩展来专注于分析解决方案。

Screenshot of Real-Time Analytics product showing the database homepage with a quick query pane showing binned ingestion results.

Real-Time Analytics 是一个完全托管的大数据分析平台,针对流式处理和时序数据进行了优化。 它利用性能卓越的查询语言和引擎来搜索结构化、半结构化和非结构化数据。 实时分析与整套 Fabric 产品完全集成,适用于数据加载、数据转换和高级可视化方案。

是什么使实时分析独一无二?

  • 捕获、转换实时事件并将其路由到各种目标,包括自定义应用。
  • 轻松引入或加载来自任何源的、任何格式的数据。
  • 直接对原始数据运行分析查询,而无需生成复杂的数据模型或创建脚本来转换数据。
  • 使用提供高性能、低延迟、高新鲜度数据分析的默认流式处理来导入数据。
  • 导入的数据会进行默认分区(基于时间和哈希的分区)和默认索引
  • 处理多种多样的数据结构,包括查询结构化、半结构化或自由文本。
  • 在不转换的情况下查询原始数据,享受高性能、极低的响应时间和各种可用的运算符
  • 管理从 GB 到 PB 的无限量数据,同时对并发查询和并发用户进行无限缩放。
  • 内置自动缩放可调整资源,以匹配缓存、内存、CPU 使用率和引入等工作负载因素,从而优化性能并降低成本。
  • 与 Microsoft Fabric 中的其他体验和项无缝集成

何时使用实时分析?

如果其中任何一个问题描述了你的数据需求,则实时分析是适合你的解决方案:

  • 我是否需要数据引入到查询的高新鲜度?
  • 我是否要转换流式数据?
  • 我是否有服务需要以低查询延迟(在几秒钟内)访问数据?
  • 我是否需要搜索或访问不同格式的数据,例如结构化数据、半结构化数据(包括复杂数据,如 JSON 或其他数组)或非结构化数据(例如自由文本)?
  • 我是否希望能够查询大量数据?
  • 我的数据是否具有可从时序优化的数据库结构中受益的时间组件?
  • 我是否希望能够在不事先优化的情况下对任何字段或行创建即席查询?

受益于实时分析的数据分析的行业类型多种多样。 例如:金融、运输和物流、智能城市、智能建筑、制造运营、汽车以及石油和天然气。

方案

Marketing

作为实施新活动的营销专家,实时分析使你能够分析市场活动对销售、库存和物流的直接影响。 可以通过 Eventstream 将大量数据流式传输到 KQL 数据库中,延迟只有数秒,然后使用 KQL 查询集分析市场活动的表现,并在可共享的 Power BI 报表中直观地显示发现结果。 可以使用这些见解立即修改市场活动的不同方面,并轻松实时查看效果。 还可以向公司中的不同团队(例如财务和生产团队)授予 KQL 数据库的查看访问权限,以分析流数据,并相应地调整产品的成本和产量。

Sales

作为全球零售连锁店的业务分析师,你负责分析传入的数据,并将见解传达给业务中的关键利益干系人。 你可以从各种不同的来源(例如制造商、承运商、供应商)收集和存储数据,以及各种格式的数据,例如结构化、半结构化和非结构化数据。 所有这些可操作数据都被捕获到 KQL 数据库中,为不断增长的数据提供可缩放的数据解决方案,可以保存数十亿条记录,这些记录可以保留多年,以便查询和比较流数据。 你不仅可以使用 KQL 查询集来执行时序分析,还可以创建 Power BI 报表,可视化陆路和海上路线的地理空间分析,快速检测异常,并与项目经理协作处理仪表板,以做出更好的业务决策。

如何在实时分析中工作?

实时分析中可用的主要项包括:

  • 以无代码体验捕获、转换实时事件并将其路由到各种目标的 Eventstream
  • 用于数据存储和管理的 KQL 数据库。 加载到 KQL 数据库中的数据可以在 OneLake 中访问,并公开给其他 Fabric 体验。
  • 一个 KQL 查询集,用于对数据运行查询、查看和自定义查询结果。 KQL 查询集让你能够保存查询以供将来使用、导出并与他人共享查询,还可以生成 Power BI 报表。

了解这些项在端到端流数据使用和分析方案中如何协同工作:实时分析教程 - 简介

与其他体验集成

Schematic image of architecture of Real-Time Analytics integration with other experiences.