数据仓库教程简介

适用于:✅SQL 分析终结点和 Microsoft Fabric 中的仓库

Microsoft Fabric 提供一站式商店,满足每个企业的所有分析需求。 它涵盖了完整的服务范围,包括数据移动、数据湖、数据工程、数据集成和数据科学、实时分析和商业智能。 使用 Microsoft Fabric 时,无需将多个供应商的不同服务拼凑在一起。 相反,客户喜欢易于理解、载入、创建和操作的端到端、高度集成、单一且全面的产品。 市面上其他产品无论在广度、深度还是集成水平方面都不及 Microsoft Fabric。 此久,Microsoft Purview 默认包含在每个租户中,以满足合规性和治理需求。

本教程的目的

虽然数据和分析专业人员可能熟悉 Microsoft Fabric 中的许多概念,但在新环境中应用这些概念可能很困难。 本教程旨在一步一步演示如何完成从数据获取到数据使用的端到端方案,从而对 Microsoft Fabric 用户体验、各种体验及其集成点,以及 Microsoft Fabric 专业开发者和平民开发者体验建立基本了解。

本教程不是参考体系结构、特性和功能的详尽列表或具体最佳做法的建议。

数据仓库端到端方案

作为本教程的先决条件,请完成以下步骤:

  1. 登录 Power BI 联机帐户,或者如果你还没有帐户,请注册免费试用版。
  2. 在租户中启用 Microsoft Fabric

在本教程中,你将在一家名为“Wide World Importers”的虚构公司担任仓库开发者这一角色。你需要在 Microsoft Fabric 门户中完成以下步骤来构建和实施一款端到端数据仓库解决方案:

  1. 创建 Microsoft Fabric 工作区
  2. 创建仓库
  3. 将源中的数据引入具有一个数据管道的数据仓库维度模型。
  4. 在仓库中创建表
  5. 使用 SQL 查询编辑器加载数据与 T-SQL
  6. 在 SQL 查询编辑器中使用 T-SQL 克隆表
  7. 转换数据以使用 T-SQL 创建聚合数据集。
  8. 使用 T-SQL 进行时间旅行查看显示的数据。
  9. 使用可视化查询编辑器查询数据仓库。
  10. 使用笔记本分析数据
  11. 使用 SQL 查询编辑器创建并报告跨仓库查询
  12. 使用 DirectLake 模式创建 Power BI 报表,就地分析数据。
  13. 从 OneLake 数据中心生成报表
  14. 通过删除工作区和其他项来清理资源

数据仓库端到端体系结构

显示数据仓库端到端体系结构的图片。

数据源 - Microsoft Fabric 可以轻松快速地连接到 Azure 数据服务、其他云平台和本地数据源,以便从中引入数据。

引入 - Microsoft Fabric 管道提供超过 200 种连接器,利用数据流进行拖放即可进行数据转换,让你快速为组织生成见解。 快捷方式是 Microsoft Fabric 推出的一项新功能,让用户无需复制或移动现有数据即可连接现有数据。 有关快捷方式功能的更多详细信息,请参阅本教程后面的部分。

转换和存储 - Microsoft Fabric 在 Delta Lake 格式上标准化,这意味着 Microsoft Fabric 的所有引擎都可以读取和处理存储在 OneLake 中的同一据集,无需数据重复。 此存储允许你根据组织需求构建数据仓库或数据网格。 在进行转换时,可以选择使用管道/数据流的低代码或无代码体验,或是使用 T-SQL 的代码优先体验。

使用 - 行业领先的商业智能工具 Power BI 可以使用来自仓库的数据生成报表和可视化效果。 每个仓库都附带一个内置的 TDS 终结点,以便在需要时轻松连接到其他报表工具并从中查询数据。 创建仓库时,将同时生成一个名为“默认语义模型”的辅助项。 只需执行几个步骤即可使用默认语义模型开始可视化数据。

示例数据

在示例数据中,我们使用 Wide World Importers (WWI) 示例数据库。 为了演示我们的数据仓库端到端方案,我们生成了足够多的数据,以便抢先了解 Microsoft Fabric 平台的缩放和性能功能。

Wide World Importers (WWI) 是一家在旧金山湾区运营的批发新奇商品进口商和分销商。 作为一家批发商,WWI 的客户大多是向个人转售产品的公司。 WWI 向美国各地的零售客户销售产品,包括专卖店、超市、计算商店、旅游景区商店和某些人。 WWI 还通过代理网络向其他批发商销售产品,这些代理代表 WWI 推销他们的产品。 若要详细了解这家公司的简介和运营信息,请参阅适用于 Microsoft SQL 的 Wide World Importers 示例数据库

通常会将事务系统(或业务线应用程序)中的数据引入数据湖或数据仓库暂存区域。 但是,在本教程中,我们使用 WWI 提供的维度模型作为初始数据源。 我们将它用作源,将数据引入数据仓库并通过 T-SQL 进行转换。

数据模型

虽然 WWI 维度模型包含多个事实数据表,但本教程仅重点介绍 fact_sale 表及其相关维度,如下所示,以演示此端到端数据仓库场景:

显示在本教程中所使用的数据模型的图,其中包含 fact_sale 表及其相关维度。

下一步