在 Fabric 中使用客户数据(预览版)

Microsoft Fabric OneLake 是整个组织的统一逻辑数据湖,旨在作为所有分析数据的单个位置。 它自动附带每个 Microsoft Fabric 租户,且构建在 Azure Data Lake Storage (ADLS) Gen2 的基础之上。 OneLake 支持任何类型的结构化或非结构化文件,并采用 Delta Parquet 格式存储所有表格数据。 它通过提供单个数据湖来实现跨不同业务组的协作,该数据湖在默认情况下由分布式所有权管理,以便在租户边界内进行协作。 租户中的工作区使组织的不同部分能够分配所有权和访问策略,并且 OneLake 中的所有数据都通过湖屋和仓库等数据项进行访问。

就数据存储而言,OneLake 充当引入、转换、实时见解和商业智能可视化的常见存储位置。 它集中了不同的 Fabric 服务,是 Fabric 中所有工作负载使用的数据项的存储。

如何在 Microsoft Fabric 中读取和写入数据

Microsoft Fabric 是一个可用于存储和管理客户数据的平台。 要在 Fabric 中读取和写入数据,需要使用 Fabric REST API 和适当的身份验证方法。

身份验证

在开始使用 Fabric REST API 之前,你需要使用令牌进行身份验证。 可以通过令牌交换流程来获取此令牌。

Fabric 工作负载开发工具包 SDK 提供了在工作负载前端中获取访问令牌的方法。 必须将此客户端令牌传递给工作负载后端,并使用代理流交换具有必要范围的令牌,以访问所需的资源,例如 OneLake。 例如,为了访问和读取 Lakehouse,用户必须已授权应用程序使用 Azure 存储 user_impersonation 权限代表他们进行 API 调用。 然后,必须使用委派范围 https://storage.azure.com/user_impersonation 获取访问令牌才能使用 Azure 存储。

有关令牌身份验证的示例,请参阅 Microsoft Fabric 开发工具包示例。

有关如何获取令牌的更多详细信息,请参阅 Microsoft Fabric 工作负载开发 REST API 文档

读取数据

进行身份验证后,你可以使用 Azure Data Lake Storage REST API 连接到 OneLake,以读取不同类型的数据。 我们建议使用 Delta Lake 协议来读取表。

写入数据

除了使用令牌读取数据之外,还可以使用 ADLS API 将数据写入表中,如 Delta Lake 协议所述。

还可以使用 API 创建文件和目录。

或者,可以使用其他 Fabric 工作负载将数据写入平台中。 例如,可以使用 Fabric 的 Lakehouse 工作负载 API 有效地将常见文件类型加载到优化的 Delta 表。 为此,请将 POST 或 PUT 请求发送到相应的 API 终结点。 有关如何使用 Lakehouse 将数据加载到表中的详细信息,请参阅 Fabric API 参考。

读取元数据

Fabric REST API 还提供访问项目的不同属性的方法。 例如,查询 Get Lakehouse API 可提供特定 Lakehouse 的元数据,包括 OneLake 路径和 SQL 连接字符串等有用属性。

有关实现示例,请参阅 Microsoft Fabric 工作负载开发工具包