适用于 ISV 的 Microsoft Fabric 集成路径

Microsoft Fabric 为独立软件供应商 (ISV) 提供了三种与 Fabric 无缝集成的方法。 对于从这一旅程开始的 ISV,我们希望演示每种不同路径下可用的各种资源。

显示与 Fabric 集成的不同方式的图示。

与 Fabric OneLake 的互操作

互操作模型的主要重点是使 ISV 能够将其解决方案与 OneLake Foundation 集成。 为了与 Microsoft Fabric 互作,我们在数据工厂和 Real-Time Intelligence 中使用大量连接器提供集成。 我们还为 OneLake 提供 REST API、OneLake 中的快捷方式、跨 Fabric 租户的数据共享和数据库镜像。

图显示了与 OneLake 互作的不同方法:API、数据工厂、实时智能、多云快捷方式、数据共享和数据库镜像。

以下部分介绍了开始使用此模型的一些方法。

OneLake API

  • OneLake 支持现有的 Azure Data Lake Storage (ADLS) Gen2 API 和 SDK 进行直接交互,使开发人员能够在 OneLake 中读取、写入和管理其数据。 详细了解 ADLS Gen2 REST API 以及如何连接到 OneLake
  • 由于并非 ADLS Gen2 中的所有功能都直接映射到 OneLake,OneLake 还强制实施设置文件夹结构以支持 Fabric 工作区和项。 有关在调用这些 API 时 OneLake 和 ADLS Gen2 之间不同行为的完整列表,请参阅 OneLake API 奇偶校验
  • 如果使用的是 Databricks 并想要连接到 Microsoft Fabric,则 Databricks 可与 ADLS Gen2 API 配合使用。 将 OneLake 与 Azure Databricks 集成
  • 要充分利用 Delta Lake 存储格式的功能,请查看并了解格式、表优化和 V-Order。 Delta Lake 表优化和 V-Order
  • 数据进入 OneLake 后,使用 OneLake 文件资源管理器在本地浏览。 OneLake 文件资源管理器将 OneLake 与 Windows 文件资源管理器无缝集成。 此应用程序会自动同步 Windows 文件资源管理器中你有权访问的所有 OneLake 项。 还可以使用与 ADLS Gen2 兼容的任何其他工具,例如 Azure 存储资源管理器

该示意图显示 OneLake API 如何与 Fabric 工作负载交互。

实时智能 API

Fabric Real-Time Intelligence 是一种全面的解决方案,旨在支持实时数据的整个生命周期,从引入和流处理到分析、可视化和作。 它专为处理高吞吐量流数据而构建,为数据引入、转换、查询和存储提供了可靠的功能,使组织能够及时做出数据驱动的决策。

  • 事件流 使你可以从各种源引入实时事件,并将其路由到各种目标,例如 Lakehouses、Eventhouse 中的 KQL 数据库和 Fabric 激活器。 详细了解 EventstreamsEventstreams API
  • 可以通过包括多种协议在内的方式将流式数据引入到 Eventstreams 中。 Kafka、事件中心、AMQP 以及此处列出的不断增加的连接器列表。
  • 使用无代码体验或使用 SQL 运算符(预览)处理引入的事件后,结果可以路由到多个 Fabric 目标或自定义终结点。 在此处了解有关 Eventstreams 目标的详细信息
  • Eventhouse 专为流式处理数据而设计,与 Real-Time 中心兼容,非常适合基于时间的事件。 将根据引入时间自动对数据编制索引和分区,这为你提供了速度超快且复杂的分析查询功能来处理高粒度数据,可在 OneLake 中访问的这些数据来实现 Fabric 的全套体验。 Eventhouse 支持现有的 Eventhouse API 和 SDK 进行直接交互,使开发人员能够在 Eventhouse 中读取、写入和管理其数据。 了解有关 REST API 的详细信息。
  • 如果使用 Databricks 或 Jupyter Notebook,则可以利用 Kusto Python 客户端库来处理 Fabric 的 KQL 数据库。 详细了解 Kusto Python SDK
  • 可以利用现有的 Microsoft 逻辑应用Azure 数据工厂Microsoft Power Automate 连接器与 Eventhouse 或 KQL 数据库进行交互。
  • 实时智能中的数据库快捷方式是 Eventhouse 中对源数据库的嵌入引用。 源数据库可以是实时智能中的 KQL 数据库,也可以是 Azure 数据资源管理器数据库。 快捷方式可用于在同一租户内或租户之间的就地数据共享。 详细了解如何使用 API 管理数据库快捷方式

该示意图显示实时智能 API 如何与 Fabric 工作负载交互。

Fabric 中的数据工厂

  • 管道拥有一 组广泛的连接器,使 ISV 能够毫不费力地连接到无数的数据存储。 无论你是连接传统数据库还是现代基于云的解决方案,我们的连接器都能确保集成过程顺利完成。 连接器概述
  • 借助我们提供的受支持 Dataflow Gen2 连接器,ISV 可以利用 Fabric 数据工厂的强大功能来管理复杂的数据工作流。 此功能对于希望简化数据处理和转换任务的 ISV 大有裨益。 Microsoft Fabric 中的 Dataflow Gen2 连接器
  • 有关 Fabric 中数据工厂支持的功能的完整列表,请查看 Fabric 博客中的此数据工厂

Fabric 数据工厂接口的屏幕截图。

多云快捷方式

通过 Microsoft OneLake 中的快捷方式,你可通过为整个企业创建单个虚拟数据湖来跨域、云和帐户统一数据。 所有 Fabric 体验和分析引擎都可以直接指向现有数据源,例如不同租户中的 OneLake、 Azure Data Lake Storage (ADLS) Gen2Amazon S3 存储帐户Google Cloud Storage(GCS)S3 兼容数据源,以及通过统一命名空间 的 Dataverse 。 OneLake 为 ISV 提供了转换性数据访问解决方案,可以无缝地跨不同域和云平台桥接集成。

该示意图显示 OneLake 中的多云快捷方式。

数据共享

数据共享允许 Fabric 用户跨不同的 Fabric 租户共享数据,而无需复制数据。 该功能通过使数据能够从 OneLake 存储位置“就地”共享来增强协作。 数据以只读方式共享,可通过各种 Fabric 计算引擎(包括 SQL、Spark、KQL 和语义模型)进行访问。 若要使用此功能,Fabric 管理员必须在共享租户和接收租户中都启用它。 此过程包括选择 OneLake 数据中心或工作区中的数据、配置共享设置以及向预期收件人发送邀请。

关系图显示数据共享过程在 Fabric 中的工作方式。

数据库镜像

“Fabric 中的镜像”功能提供了一种简单的体验,可避免复杂的 ETL(提取转换加载),并可将现有的数据与 Microsoft Fabric 中的其他数据集成到 OneLake。 可以直接将现有数据持续复制到 Fabric 的 OneLake 中。 在 Fabric 中,可以解锁强大的商业智能、人工智能、数据工程、数据科学和数据共享方案。

关系图显示 Fabric 中的数据库镜像。

打开镜像可使 任何应用程序 直接将数据写入 Fabric 中的镜像数据库中。 开放镜像设计为可扩展、可自定义且开放。 这个强大功能在开放式 Delta Lake 表格式的基础上扩展了 Fabric 的镜像功能。 数据进入 Fabric 中的 OneLake 后,开放镜像可以简化复杂数据更改的处理,确保所有镜像数据持续保持最新并可随时用于分析。

在 Fabric 上进行开发

该示意图显示了如何在 Fabric 上生成应用。

借助“在 Fabric 上开发”模型,ISV 可以在 Fabric 上构建其产品和服务,或者将 Fabric 的功能无缝嵌入到其现有应用程序中。 这是从基本集成过渡到主动应用 Fabric 提供的功能。 主要集成外围应用是通过适用于各种 Fabric 体验的 REST API 实现的。 下表显示了按 Fabric 体验分组的 REST API 子集。 有关完整列表,请参阅 Fabric REST API 文档

Fabric 体验版 API
Data Warehouse - 仓库
- 镜像仓库
数据工程 - Lakehouse
- 火花
- Spark 作业定义
-
- 作业
数据工厂 - DataPipeline
实时智能 - Eventhouse
- KQL 数据库
- KQL 查询集
- Eventstream
数据科学 - 笔记本
- ML 试验
- ML 模型
OneLake - 快捷方式
- ADLS Gen2 API
Power BI - 报告
- 仪表板
- 语义模型

构建 Fabric 工作负载

该示意图显示如何创建自己的构造工作负载。

构建 Fabric 工作负载”模型旨在使 ISV 能够在 Fabric 平台上创建自定义体验。 它为 ISV 提供了必要的工具和功能,以使其产品/服务与 Fabric 生态系统保持一致,从而优化其独特的价值主张与 Fabric 的丰富功能的组合。

Microsoft Fabric 工作负载开发工具包为开发人员提供了一个全面的工具包,用于将应用程序集成到 Microsoft Fabric 中心。 此集成允许直接在 Fabric 工作区中添加新功能,从而增强用户的分析旅程。 它为开发人员和 ISV 提供了接触客户的新途径,提供熟悉的和新的体验,并利用现有的数据应用程序。 Fabric 管理员能够管理谁可以在组织中添加工作负荷。

工作负载中心

Microsoft Fabric 中的 工作负荷中心 充当集中界面,用户可以在其中浏览、管理和访问所有可用的工作负载。 Fabric 中的每个工作负荷都与可在 Fabric 工作区中创建的特定项类型相关联。 通过浏览工作负荷中心,用户可以轻松地发现和与各种工作负荷交互,从而增强其分析和作功能。

显示工作负荷中心的屏幕截图。

Fabric 管理员有权管理工作负载可用性,可将其设置为可在整个租户或特定容量内访问。 这种扩展性可确保 Fabric 保持灵活且可缩放的平台,使组织能够定制其工作负载环境以满足不断发展的数据和业务需求。 通过与 Fabric 的安全和管理框架无缝集成,工作负荷中心简化了工作负荷部署和管理。 每个工作负载都附带了一个试用体验,让用户能够快速开始使用。 以下是可用的工作负载:

  • 2TEST:一个全面的质量保证工作负载,可自动执行测试和数据质量检查。

    显示 2test 工作负荷的屏幕截图。

  • Informatica Cloud Data Quality:让我们直接在 Fabric 环境中分析、检测和修复数据问题(例如重复项、缺失值和不一致)。

    显示 Informatica 工作负荷的屏幕截图。

  • Lumel EPM:使企业用户能够在语义模型的基础上构建无代码企业性能管理(EPM)应用。

    显示 Lumel 工作负荷的屏幕截图。

  • Neo4j AuraDB 与 Graph Analytics:从 OneLake 数据创建图形模型、直观分析和浏览数据连接、查询数据,以及运行 Fabric 控制台中具有无缝体验的 65 多种内置算法中的任何一种。

    显示 Neo4j 工作负载的屏幕截图。

  • Osmos AI Data Wrangler:使用 AI 提供支持的数据整理器自动执行数据准备,使数据转换毫不费力。

    显示 Osmos 工作负荷的屏幕截图。

  • Power Designer:适用于公司范围的样式设置和报表模板创建的工具,可改进 Power BI 报表设计。

    显示 PBI 提示的工作负载的屏幕截图。

  • Celonis 进程智能:允许组织在 Microsoft Fabric 中公开 Celonis 的独特数据和上下文类。

    显示 Celonis 工作负荷的屏幕截图。

  • Profisee Master 数据管理: 使用户能够有效地匹配、合并、标准化、修正和验证数据,将其转换为受信任的、可供使用的数据产品,用于分析和 AI。

    显示 Profisee 工作负荷的屏幕截图。

  • Quantexa Unify:通过提供具有高级数据解析功能的 360 度视图来增强 Microsoft OneLake 数据源。

    显示 Quantexa 工作负荷的屏幕截图。

  • SAS 决策生成器:帮助组织自动执行、优化和缩放其决策流程。

    显示 SAS 工作负荷的屏幕截图。

  • Statsig: 将数据可视化和分析直接引入仓库。

    显示 Statsig 工作负荷的屏幕截图。

  • Teradata AI Unlimited:通过 Teradata 的数据库中函数将 Teradata 的分析引擎与 Microsoft Fabric 的数据管理功能相结合。

    显示 Teradata 工作负荷的屏幕截图。

  • SQL2Fabric-Mirroring by Striim:完全托管的零代码复制解决方案,可将本地 SQL Server 数据无缝镜像到 Microsoft Fabric OneLake

    显示 Striim 工作负荷的屏幕截图。

随着更多的工作负载可用,工作负荷中心将继续充当发现新功能的动态空间,确保用户拥有缩放和优化其数据驱动解决方案所需的工具。