教程:使用笔记本分析数据
适用于:✅SQL 分析终结点和 Microsoft Fabric 中的仓库
在本教程中,了解如何使用 T-SQL 笔记本或使用具有 Lakehouse 快捷方式的笔记本来分析数据。
选项 1:在仓库中创建 T-SQL 笔记本
若要开始,请通过以下两种方式之一创建 T-SQL 笔记本:
从 Microsoft Fabric Warehouse 主页创建 T-SQL 笔记本。 导航到 数据仓库 工作负荷,然后选择 “笔记本”。
选择 “+ 仓库 ”并添加
WideWorldImporters
仓库。WideWorldImporters
从 OneLake 数据中心对话框中选择仓库。从仓库编辑器创建 T-SQL 笔记本。
WideWorldImporters
在仓库的顶部导航功能区中,选择“新建 SQL 查询”,然后在笔记本中选择“新建 SQL 查询”。创建笔记本后,可以看到
WideWorldImporters
仓库加载到资源管理器中,功能区将显示 T-SQL 作为默认语言。右键单击以启动表上的
dimension_city
“更多”菜单选项。 选择 SELECT TOP 100 以生成快速 SQL 模板,以浏览表中的 100 行。运行代码单元,可以看到消息和结果。
选项 2:使用笔记本创建 Lakehouse 快捷方式并分析数据
首先,我们创建一个新的湖屋。 若要在 Microsoft Fabric 工作区中创建新的湖屋,请执行以下操作:
在导航菜单中选择
Data Warehouse Tutorial
工作区。选择“+ 新建”>“湖屋”。
在“名称”字段中输入
ShortcutExercise
,然后选择“创建”。新的湖屋将加载,“资源管理器”视图随即打开,包括“获取数据”菜单。 在“在湖屋中加载数据”下,选择“新建快捷方式”按钮。
在“新建快捷方式”窗口中,选择“Microsoft OneLake”按钮。
在“选择数据源类型”窗口中,滚动列表,直到找到之前创建的名为
WideWorldImporters
的仓库。 选择它,然后选择“下一步”。在 OneLake 对象浏览器中,展开“表”,展开
dbo
架构,然后选择旁边的dimension_customer
复选框。 选择下一步。 选择创建。如果在“表”下看到名为
Unidentified
的文件夹,请选择水平菜单栏中的“刷新”图标。选择“表”列表中的
dimension_customer
以预览数据。 湖屋显示来自仓库的dimension_customer
表中的数据!接下来,创建新的笔记本来查询
dimension_customer
表。 在“主页”功能区中,选择打开笔记本的下拉列表,然后选择“新建笔记本”。在资源管理器中,选择 Lakehouses 源文件夹。
选择,然后将
dimension_customer
从“表”列表中拖动到打开的笔记本单元格中。 可以看到,已编写 PySpark 查询,用于查询ShortcutExercise.dimension_customer
中的所有数据。 此笔记本体验类似于 Visual Studio Code Jupyter 笔记本体验。 还可以在 VS Code 中打开笔记本。在“主页”功能区中,选择“全部运行”按钮。 查询完成后,你会发现自己可以轻松使用 PySpark 查询仓库表!