教程:使用笔记本分析数据

适用于:✅SQL 分析终结点和 Microsoft Fabric 中的仓库

在本教程中,了解如何使用 T-SQL 笔记本或使用具有 Lakehouse 快捷方式的笔记本来分析数据。

选项 1:在仓库中创建 T-SQL 笔记本

若要开始,请通过以下两种方式之一创建 T-SQL 笔记本:

  1. 从 Microsoft Fabric Warehouse 主页创建 T-SQL 笔记本。 导航到 数据仓库 工作负荷,然后选择 “笔记本”。

  2. 选择 “+ 仓库 ”并添加 WideWorldImporters 仓库。 WideWorldImportersOneLake 数据中心对话框中选择仓库。

    资源管理器“所有源”区域中“仓库”下“添加仓库”按钮的 Fabric 门户屏幕截图。

  3. 从仓库编辑器创建 T-SQL 笔记本。 WideWorldImporters在仓库的顶部导航功能区中,选择“新建 SQL 查询”,然后在笔记本中选择“新建 SQL 查询”。

    笔记本菜单中“新建 SQL 查询”菜单选项的 Fabric 门户的屏幕截图。

  4. 创建笔记本后,可以看到 WideWorldImporters 仓库加载到资源管理器中,功能区将显示 T-SQL 作为默认语言。

  5. 右键单击以启动表上的dimension_city“更多”菜单选项。 选择 SELECT TOP 100 以生成快速 SQL 模板,以浏览表中的 100 行。

    SELECT TOP 100 行选项的 Fabric 门户的屏幕截图。

  6. 运行代码单元,可以看到消息和结果。

    SELECT TOP 100 结果的 Fabric 门户的屏幕截图。

选项 2:使用笔记本创建 Lakehouse 快捷方式并分析数据

首先,我们创建一个新的湖屋。 若要在 Microsoft Fabric 工作区中创建新的湖屋,请执行以下操作:

  1. 在导航菜单中选择 Data Warehouse Tutorial 工作区。

  2. 选择“+ 新建”>“湖屋”

    Fabric 门户的屏幕截图,其中显示“+ 新建”菜单。“湖屋”在红色框中显示。

  3. 在“名称”字段中输入 ShortcutExercise,然后选择“创建”

  4. 新的湖屋将加载,“资源管理器”视图随即打开,包括“获取数据”菜单。 在“在湖屋中加载数据”下,选择“新建快捷方式”按钮。

    Fabric 门户的屏幕截图,显示登录页湖屋菜单中的“加载数据”。“新建快捷方式”按钮在红色框中显示。

  5. 在“新建快捷方式”窗口中,选择“Microsoft OneLake”按钮。

    Fabric 门户的屏幕截图,显示“新建快捷方式”窗口。“Microsoft OneLake”按钮在红色框中显示。

  6. 在“选择数据源类型”窗口中,滚动列表,直到找到之前创建的名为 WideWorldImporters 的仓库。 选择它,然后选择“下一步”。

  7. 在 OneLake 对象浏览器中,展开“表”,展开 dbo 架构,然后选择旁边的 dimension_customer 复选框。 选择下一步。 选择创建

  8. 如果在“表”下看到名为 Unidentified 的文件夹,请选择水平菜单栏中的“刷新”图标。

    Fabric 门户的屏幕截图,显示水平菜单栏中的“刷新”图标,以及湖屋浏览器中 ShortcutExercise 下的“未识别表”。

  9. 选择“表”列表中的 dimension_customer 以预览数据。 湖屋显示来自仓库的 dimension_customer 表中的数据!

    Fabric 门户的屏幕截图,显示 dimension_customer 表中的数据预览。

  10. 接下来,创建新的笔记本来查询 dimension_customer 表。 在“主页”功能区中,选择打开笔记本下拉列表,然后选择“新建笔记本”。

  11. 资源管理器中,选择 Lakehouses 源文件夹。

  12. 选择,然后将 dimension_customer 从“表”列表中拖动到打开的笔记本单元格中。 可以看到,已编写 PySpark 查询,用于查询 ShortcutExercise.dimension_customer中的所有数据。 此笔记本体验类似于 Visual Studio Code Jupyter 笔记本体验。 还可以在 VS Code 中打开笔记本。

    Fabric 门户笔记本的屏幕截图。箭头表示选择 dimension_customer 的路径,然后将其拖动到打开的笔记本单元格中。

  13. 在“主页”功能区中,选择“全部运行”按钮。 查询完成后,你会发现自己可以轻松使用 PySpark 查询仓库表!

    Fabric 门户笔记本的屏幕截图运行笔记本以显示来自 dimension_customer 的数据的结果。

下一步