教程:使用笔记本分析数据

适用于:SQL 分析终结点和 Microsoft Fabric 中的仓库

在本教程中,了解如何保存一次数据,然后将其与许多其他服务一起使用。 还可以为存储在 Azure Data Lake Storage 和 S3 中的数据创建快捷方式,使你能够直接从外部系统访问增量表。

创建湖屋

首先,我们创建一个新的湖屋。 若要在 Microsoft Fabric 工作区中创建新的湖屋,请执行以下操作:

  1. 在导航菜单中选择 Data Warehouse Tutorial 工作区。

  2. 选择“+ 新建”>“湖屋”

    Fabric 门户的屏幕截图,其中显示“+ 新建”菜单。“湖屋”在红色框中显示。

  3. 在“名称”字段中输入 ShortcutExercise,然后选择“创建”

    Fabric 门户的屏幕截图,显示新湖屋的名称字段。提供的名称是“ShortcutExercise”。

  4. 新的湖屋将加载,“资源管理器”视图随即打开,包括“获取数据”菜单。 在“在湖屋中加载数据”下,选择“新建快捷方式”按钮。

    Fabric 门户的屏幕截图,显示登录页湖屋菜单中的“加载数据”。“新建快捷方式”按钮在红色框中显示。

  5. 在“新建快捷方式”窗口中,选择“Microsoft OneLake”按钮。

    Fabric 门户的屏幕截图,显示“新建快捷方式”窗口。“Microsoft OneLake”按钮在红色框中显示。

  6. 在“选择数据源类型”窗口中,滚动列表,直到找到之前创建的名为 WideWorldImporters 的仓库。 选择它,然后选择“下一步”。

  7. 在 OneLake 对象浏览器中,展开“表”,展开 dbo 架构,然后选择旁边的 dimension_customer 单选按钮。 选择“创建”按钮。

    Fabric 门户的屏幕截图,显示 OneLake 对象浏览器。在 WideWorldImporters、Tables、dbo 下,“dimension_customer”在红色框中显示。

  8. 如果在“表”下看到名为 Unidentified 的文件夹,请选择水平菜单栏中的“刷新”图标。

    Fabric 门户的屏幕截图,显示水平菜单栏中的“刷新”图标,以及湖屋浏览器中 ShortcutExercise 下的“未识别表”。

  9. 选择“表”列表中的 dimension_customer 以预览数据。 湖屋显示来自仓库的 dimension_customer 表中的数据!

    Fabric 门户的屏幕截图,显示 dimension_customer 表中的数据预览。

  10. 接下来,创建新的笔记本来查询 dimension_customer 表。 在“主页”功能区中,选择“打开笔记本”的下拉列表,然后选择“新建笔记本”

    Fabric 门户的屏幕截图,显示按下“打开笔记本”按钮,选中了“新建笔记本”选项。

  11. 选择,然后将 dimension_customer 从“表”列表中拖动到打开的笔记本单元格中。 可以看到,已编写 PySpark 查询,用于查询 ShortcutExercise.dimension_customer中的所有数据。 此笔记本体验类似于 Visual Studio Code Jupyter 笔记本体验。 还可以在 VS Code 中打开笔记本。

    Fabric 门户笔记本的屏幕截图。箭头表示选择 dimension_customer 的路径,然后将其拖动到打开的笔记本单元格中。

  12. 在“主页”功能区中,选择“全部运行”按钮。 完成查询后,即可轻松使用 PySpark 查询仓库表!

    Fabric 门户笔记本的屏幕截图运行笔记本以显示来自 dimension_customer 的数据的结果。

下一步