什么是 Microsoft Fabric?

Microsoft Fabric 是面向企业的一体化分析解决方案,涵盖从数据移动到数据科学、实时分析和商业智能的所有内容。 它提供一套全面的服务,包括数据湖、数据工程和数据集成,全部放在一个位置。

使用 Fabric 时,无需将来自多个供应商的不同服务拼凑在一起。 相反,你可以享受高度集成、端到端且易于使用的产品,旨在简化分析需求。

该平台构建在服务型软件 (SaaS) 的基础之上,将简单性和集成性提升到一个全新的水平。

SaaS 基础

Microsoft Fabric 可将 Power BI、Azure Synapse 和 Azure 数据工厂中的新组件和现有组件汇集到单个集成环境中。 然后,这些组件将呈现在各种自定义用户体验中。

Diagram of the software as a service foundation beneath the different experiences of Fabric.

Fabric 将数据工程、数据工厂、数据科学、Data Warehouse、实时分析和 Power BI 等体验汇集到共享 SaaS 基础中。 这种集成具有以下优势:

  • 访问行业内广泛的深度集成分析。
  • 跨熟悉且易于学习的体验共享体验。
  • 开发人员可以轻松访问和重用所有资产。
  • 一个统一的数据湖,允许你在使用首选分析工具时保留数据的位置。
  • 跨所有体验集中管理和治理。

借助 Microsoft Fabric SaaS 体验,所有数据和服务都无缝集成。 IT 团队可以集中配置核心企业功能,并且权限会自动应用于所有基础服务。 此外,数据敏感度标签会自动跨套件中的项继承。

Fabric 使创建者能够专注于生成最佳作品,从而无需集成、管理或了解支持体验的底层基础结构。

Microsoft Fabric 的组件

Microsoft Fabric 提供了一套全面的分析体验,旨在无缝协同工作。 每个体验都针对特定角色和特定任务量身定制。 Fabric 在以下类别中包括行业领先的体验,以满足端到端分析需求。

Screenshot of the Fabric menu of experiences.

  • 数据工程 - 数据工程体验提供了具有出色创作体验的世界级 Spark 平台,使数据工程师能够通过湖屋执行大规模数据转换并实现数据大众化。 通过 Microsoft Fabric Spark 与数据工厂的集成,可以计划和安排笔记本和 Spark 作业。 有关详细信息,请参阅 什么是 Microsoft Fabric 中的数据工程?

  • 数据工厂 - Azure 数据工厂将 Power Query 的简单性与Azure 数据工厂的规模和强大功能相结合。 可以使用 200 多个本地连接器以连接企业内部和云中的数据源。 有关详细信息,请参阅 什么是 Microsoft Fabric 中的数据工厂?

  • 数据科学 - 数据科学体验使你能够在 Fabric 体验中无缝生成、部署和操作机器学习模型。 它与 Azure 机器学习集成,提供内置的试验跟踪和模型注册表。 数据科学家有权通过预测丰富组织数据,并允许业务分析师将这些预测集成到他们的 BI 报表中。 这样,它就从描述性见解转变为预测性见解。 有关详细信息,请参阅 什么是 Microsoft Fabric 中的数据科学?

  • Data Warehouse - Data Warehouse 体验提供行业领先的 SQL 性能和规模。 它将计算与存储完全分开,从而支持这两个组件的独立缩放。 此外,它原生地以开放 Delta Lake 格式存储数据。 有关详细信息,请参阅 什么是 Microsoft Fabric 中的数据仓库?

  • 实时分析 - 从各种源(例如应用、IoT 设备、人机交互等)收集的观察数据。 它是目前增长最快的数据类别。 此数据通常采用 JSON 或文本等格式的半结构化数据。 它以大量方式提供,且架构会不断变化。 这些特征使得传统数据仓库平台难以使用。 实时分析是用于观察数据分析的最佳引擎。 有关更多信息,请参阅 什么是 Fabric 中的实时分析?

  • Power BI - Power BI 是世界领先的商业智能平台。 它确保业务所有者可以快速、直观地访问 Fabric 中的所有数据,以便对数据做出更好的决策。 有关详细信息,请参阅什么是 Power BI?

Fabric 将所有这些体验汇集到一个统一的平台中,以提供业内最全面的大数据分析平台。

Microsoft Fabric 使组织和个人能够将大型和复杂的数据存储库转换为可操作的工作负载和分析,并且是数据网格体系结构的一种实现方式。 若要详细了解数据网格,请访问介绍数据网格体系结构的文章。

OneLake 和 lakehouse - 湖屋的统一

Microsoft Fabric 平台统一了整个企业的 OneLake 和湖屋体系结构。

OneLake

数据湖是构建所有 Fabric 服务的基础。 Microsoft Fabric Lake 也称为 OneLake。 它内置于 Fabric 服务中,提供一个统一的位置,用于存储运行体验的所有组织数据。

OneLake 基于 ADLS (Azure Data Lake Storage) Gen2 构建。 它为面向专业和平民开发者的数据提供单一 SaaS 体验和租户范围的存储。 OneLake SaaS 体验简化了体验,用户无需了解任何基础结构概念,例如资源组、RBAC(基于角色的访问控制)、Azure 资源管理器、冗余或区域等。 此外,它甚至不需要用户拥有 Azure 帐户。

OneLake 消除了当今普遍和混乱的数据孤岛,即单个开发人员在预配和配置自己的独立存储帐户时所创建数据孤岛。 相反,OneLake 为所有开发人员提供了一个统一的存储系统,其中发现和数据共享变得轻而易举,且政策和安全设置的合规性得到了集中统一地执行。 有关详细信息,请参阅什么是 OneLake?

OneLake 和湖屋的组织结构

OneLake 本质上是分层的,用于简化整个组织的管理。 它内置于 Microsoft Fabric 中,无需进行任何预先预配。 每个租户只有一个 OneLake,它提供跨用户、跨区域甚至跨云的单一虚拟管理平台文件系统命名空间。 OneLake 中的数据划分为可管理的容器,以便于处理。

租户会映射到 OneLake 的根目录,且位于层次结构的顶层。 可以在租户中创建任意数量的工作区,可将这些工作区视为文件夹。

下图显示了存储数据的各种 Fabric 项。 这是一个示例,说明 Fabric 中的各种项目如何将数据存储在 OneLake 中。 如此示例所示,可以在租户中创建多个工作区,在每个工作区中创建多个湖屋。 湖屋是文件、文件夹、和表的集合,充当数据湖的数据库。 若要了解详细信息,请参阅什么是湖屋?

Diagram of the hierarchy of items like lakehouses and semantic models within a workspace within a tenant.

租户中的每个开发人员和业务部门都可以在 OneLake 中即刻创建自己的工作区。 他们可以将数据引入自己的湖屋,开始处理、分析和协作处理数据,就像在 Office 中的 OneDrive 一样。

所有 Microsoft Fabric 计算体验都预连接到 OneLake,就像 Office 应用程序预连接以使用组织 OneDrive 一样。 数据工程、Data Warehouse、数据工厂、Power BI 和实时分析等体验使用 OneLake 作为本机存储。 它们不需要任何额外的配置。

Diagram of different experiences all accessing the same OneLake data storage.

OneLake 旨在允许使用快捷方式功能将现有 PaaS 存储帐户即时装载到 OneLake 中。 无需迁移或移动任何现有数据。 使用快捷方式可以访问存储在 Azure Data Lake Storage 中的数据。

此外,快捷方式使你可以轻松地在用户和应用程序之间共享数据,而无需移动或复制信息。 快捷方式功能会扩展到其他存储系统,使你能够通过透明智能缓存跨云编写和分析数据,从而降低流出量成本,使数据更接近计算。

ISV 的 Fabric 解决方案

如果你作为 ISV 有兴趣将你的解决方案与 Microsoft Fabric 集成,那么你可以根据要实现的集成级别,使用以下路径之一:

  • 互操作 - 将你的解决方案与 OneLake Foundation 集成,并与 Fabric 建立基本连接和互操作性。
  • 在 Fabric 上进行开发 - 在 Fabric 平台的基础上构建你的解决方案,或在现有应用程序中无缝嵌入 Fabric 的功能。 它让你可以主动利用 Fabric 功能。
  • 生成 Fabric 工作负载 - 在 Fabric 中创建自定义工作负载和体验。 定制你的产品/服务,在提供它们的价值主张的同时利用 Fabric 生态系统。

有关详细信息,请参阅 Fabric ISV 合作伙伴生态系统