适用于 ISV 的 Microsoft Fabric 集成路径

Microsoft Fabric 为独立软件供应商 (ISV) 提供了三种与 Fabric 无缝集成的方法。 对于从这一旅程开始的 ISV,我们希望演示每种不同路径下可用的各种资源。

该图显示了三种与 Fabric 集成的路径:互操作、开发应用和生成 Fabric 工作负载。

与 Fabric OneLake 的互操作

互操作模型的主要重点是使 ISV 能够将其解决方案与 OneLake Foundation 集成。 为了与 Microsoft Fabric 进行互操作,我们使用数据工厂和实时智能中的大量连接器、OneLake 的 REST API、OneLake 中的快捷方式、Fabric 租户之间的数据共享以及数据库镜像来提供集成。

该图显示了与 OneLake 互操作的不同方式:API、Fabric 数据工厂、实时智能、多云快捷方式、数据共享和数据库镜像。

以下部分介绍了开始使用此模型的一些方法。

OneLake API

  • OneLake 支持现有的 Azure Data Lake Storage (ADLS) Gen2 API 和 SDK 进行直接交互,使开发人员能够在 OneLake 中读取、写入和管理其数据。 详细了解 ADLS Gen2 REST API 以及如何连接到 OneLake
  • 由于并非 ADLS Gen2 中的所有功能都直接映射到 OneLake,OneLake 还强制实施设置文件夹结构以支持 Fabric 工作区和项。 有关在调用这些 API 时 OneLake 和 ADLS Gen2 之间不同行为的完整列表,请参阅 OneLake API 奇偶校验
  • 如果使用的是 Databricks 并想要连接到 Microsoft Fabric,则 Databricks 可与 ADLS Gen2 API 配合使用。 将 OneLake 与 Azure Databricks 集成
  • 要充分利用 Delta Lake 存储格式的功能,请查看并了解格式、表优化和 V-Order。 Delta Lake 表优化和 V-Order
  • 数据进入 OneLake 后,使用 OneLake 文件资源管理器在本地浏览。 OneLake 文件资源管理器将 OneLake 与 Windows 文件资源管理器无缝集成。 此应用程序会自动同步 Windows 文件资源管理器中你有权访问的所有 OneLake 项。 还可以使用与 ADLS Gen2 兼容的任何其他工具,例如 Azure 存储资源管理器

该示意图显示 OneLake API 如何与 Fabric 工作负载交互。

实时智能 API

实时智能简化了数据分析和可视化,通过集中式解决方案对组织内的动态数据进行即时洞察并采取行动。 它通过可靠的查询、转换和存储功能有效地管理大量数据。

  • Eventhouse 是专门为流式处理数据设计的,与实时中心兼容,非常适合基于时间的事件。 将根据引入时间自动对数据编制索引和分区,这为你提供了速度超快且复杂的分析查询功能来处理高粒度数据,可在 OneLake 中访问的这些数据来实现 Fabric 的全套体验。 Eventhouse 支持现有的 Eventhouse API 和 SDK 进行直接交互,使开发人员能够在 Eventhouse 中读取、写入和管理其数据。 了解有关 REST API 的详细信息。
  • 事件流使你可以从各种源引入实时事件,并将其路由到各种目的地,例如 Eventhouse 中的 OneLake、KQL 数据库,以及 Data Activator。 详细了解事件流事件流 API
  • 如果使用 Databricks 或 Jupyter Notebook,则可以利用 Kusto Python 客户端库来处理 Fabric 的 KQL 数据库。 详细了解 Kusto Python SDK
  • 可以利用现有的 Microsoft 逻辑应用Azure 数据工厂Microsoft Power Automate 连接器与 Eventhouse 或 KQL 数据库进行交互。
  • 实时智能中的数据库快捷方式是 Eventhouse 中对源数据库的嵌入引用。 源数据库可以是实时智能中的 KQL 数据库,也可以是 Azure 数据资源管理器数据库。 快捷方式可用于在同一租户内或租户之间的就地数据共享。 详细了解如何使用 API 管理数据库快捷方式

该示意图显示实时智能 API 如何与 Fabric 工作负载交互。

Fabric 中的数据工厂

  • 数据管道拥有一组广泛的连接器,使 ISV 能够毫不费力地连接到无数的数据存储。 无论你是连接传统数据库还是现代基于云的解决方案,我们的连接器都能确保集成过程顺利完成。 连接器概述
  • 借助我们提供的受支持 Dataflow Gen2 连接器,ISV 可以利用 Fabric 数据工厂的强大功能来管理复杂的数据工作流。 此功能对于希望简化数据处理和转换任务的 ISV 大有裨益。 Microsoft Fabric 中的 Dataflow Gen2 连接器
  • 有关 Fabric 中数据工厂支持的功能的完整列表,请查看以下博客:Fabric 中的数据工厂

Fabric 数据工厂接口的屏幕截图。

多云快捷方式

通过 Microsoft OneLake 中的快捷方式,你可通过为整个企业创建单个虚拟数据湖来跨域、云和帐户统一数据。 所有 Fabric 体验和分析引擎都可以通过统一的命名空间直接指向现有数据源,例如不同租户中的 OneLake、Azure Data Lake Storage (ADLS) Gen2Amazon S3 存储帐户Google Cloud Storage(GCS)S3 兼容数据源Dataverse。 OneLake 为 ISV 提供了转换性数据访问解决方案,可以无缝地跨不同域和云平台桥接集成。

该示意图显示 OneLake 中的多云快捷方式。

数据共享

数据共享允许 Fabric 用户跨不同的 Fabric 租户共享数据,而无需复制数据。 该功能通过使数据能够从 OneLake 存储位置“就地”共享来增强协作。 数据以只读方式共享,可通过各种 Fabric 计算引擎(包括 SQL、Spark、KQL 和语义模型)进行访问。 若要使用此功能,Fabric 管理员必须在共享租户和接收租户中都启用它。 此过程包括选择 OneLake 数据中心或工作区中的数据、配置共享设置以及向预期收件人发送邀请。

显示 Fabric 中数据共享的关系图。

数据库镜像

镜像提供了一种现代化方法,用于从外部数据库或数据仓库连续、无缝访问数据以及将数据引入到 Microsoft Fabric 中的数据仓库体验中。 镜像几乎是实时的,用户可以立即访问源中的更改。 详细了解镜像和支持的数据库

关系图显示 Fabric 中的数据库镜像。

在 Fabric 上进行开发

该示意图显示了如何在 Fabric 上生成应用。

借助“在 Fabric 上开发”模型,ISV 可以在 Fabric 上构建其产品和服务,或者将 Fabric 的功能无缝嵌入到其现有应用程序中。 这是从基本集成过渡到主动应用 Fabric 提供的功能。 主要集成外围应用是通过适用于各种 Fabric 工作负载的 REST API 实现的。 下表显示了按 Fabric 体验分组的 REST API 子集。 有关完整列表,请参阅 Fabric REST API 文档

Fabric 体验版 API
数据仓库 - 仓库
- 镜像仓库
数据工程 - Lakehouse
- Spark
- Spark 作业定义
-
- 作业
数据工厂 - DataPipeline
实时智能 - Eventhouse
- KQL 数据库
- KQL 查询集
- 事件流
数据科学 - 笔记本
- ML 试验
- ML 模型
OneLake - 快捷方式
- ADLS Gen2 API
Power BI - Report
- 仪表板
- 语义模型

构建 Fabric 工作负载

该示意图显示如何创建自己的构造工作负载。

构建 Fabric 工作负载”模型旨在使 ISV 能够在 Fabric 平台上创建自定义工作负载和体验。 它为 ISV 提供了必要的工具和功能,以使其产品/服务与 Fabric 生态系统保持一致,从而优化其独特的价值主张与 Fabric 的丰富功能的组合。

Microsoft Fabric 工作负载开发工具包为开发人员提供了一个全面的工具包,用于将应用程序集成到 Microsoft Fabric 工作负载中心。 此集成允许直接在 Fabric 工作区中添加新功能,从而增强用户的分析旅程。 它为开发人员和 ISV 提供了接触客户的新途径,提供熟悉的和新的体验,并利用现有的数据应用程序。 Fabric 管理员能够管理对工作负载中心的访问权限,为整个租户启用它,或者为其分配特定范围来控制组织内的访问。