注释
此功能目前处于公开预览状态。 此预览版在没有服务级别协议的情况下提供,不建议用于生产工作负荷。 某些功能可能不受支持或者受限。 有关详细信息,请参阅 Microsoft Azure 预览版补充使用条款。
在本教程步骤中,你将从 GitHub 下载 Adventure Works 示例数据并将其加载到 lakehouse 中。 在整个教程中使用此数据来创建和查询图形模型。 如果您已有一个数据湖屋(例如,来自您组织的数据),则可以跳过此步骤。
数据集包含 Parquet 格式的表。 这些表表示虚构的自行车制造公司(如客户、产品、订单和供应商)中的各种实体。
下载示例数据
转到 GitHub 上的 Fabric Graph GQL 示例数据集 。
选择 adventureworks_docs_sample.zip 文件并将其下载到本地计算机。
小窍门
若要从 GitHub 下载文件,请选择该文件,然后选择 “下载原始文件 ”图标。
将下载 的adventureworks_docs_sample.zip 文件解压缩到本地计算机上的文件夹。
小窍门
在文件资源管理器中,右键单击 zip 文件,然后选择“ 全部提取”,然后选择目标文件夹。
创建湖屋
如果您还没有创建 Lakehouse,请创建一个以存储示例数据:
在 Microsoft Fabric 中,选择要创建湖仓的工作区。
选择 + 新建项目。
选择 Store data>Lakehouse。
输入 lakehouse 的名称(例如,“AdventureWorksLakehouse”),清除 Lakehouse 架构 选项,然后选择“ 创建”。
重要
请确保清除 Lakehouse 架构选项。 Microsoft Fabric 中的 Graph 当前不支持那些启用了湖仓架构(预览版)的湖仓。
有关更详细的说明,请参阅 通过 OneLake 创建湖仓。
将示例数据上传到 Lakehouse
在 lakehouse Explorer 中,将鼠标悬停在 文件上。 选择显示的三个省略号(...),然后选择“上传>上传文件夹”。
注释
无法通过上传文件来上传文件夹。
在“ 上传文件夹 ”对话框中,浏览到提取文件夹的位置并选择它。 然后,选择“上传”。 此时可能会显示一个弹出窗口,要求确认上传:再次选择“上传”,然后在“上传文件夹”对话框中选择“上传”。
小窍门
可以一次性选择文件夹中的所有文件,方法是按 Ctrl + A ,然后选择 “打开”。
将数据加载到表中
上传文件后,将其加载到表中。 表是来自 lakehouse 的源数据,用于在图模型中创建节点和边缘。
对于上传 adventureworks_docs_sample 文件夹中的每个子文件夹,请按照以下步骤将数据加载到表中:
展开 “文件” 文件夹。 将鼠标悬停在子文件夹(例如,adventureworks_customers),选择三个省略号(...),然后选择“加载到表>”。
在 “加载文件夹到新表 ”对话框中,输入表名称(默认值使用文件夹名称),并将文件类型设置为 Parquet。 然后选择“ 加载”。
加载所有表后,展开 “表” 文件夹。 如果使用了默认名称,则应在 lakehouse 中看到下表:
- AdventureWorks_客户
- adventureworks_employees
- adventureworks_orders
- adventureworks_productcategories
- adventureworks_products
- adventureworks_productsubcategories
- adventureworks_vendorproduct
- adventureworks_vendors
工作区中的湖屋现已准备好,有 Adventure Works 示例数据可用。 在下一步中,将创建使用此数据的图形模型。