通过


教程:加载数据

注释

此功能目前处于公开预览状态。 此预览版在没有服务级别协议的情况下提供,不建议用于生产工作负荷。 某些功能可能不受支持或者受限。 有关详细信息,请参阅 Microsoft Azure 预览版补充使用条款

在本教程步骤中,你将从 GitHub 下载 Adventure Works 示例数据并将其加载到 lakehouse 中。 在整个教程中使用此数据来创建和查询图形模型。 如果您已有一个数据湖屋(例如,来自您组织的数据),则可以跳过此步骤。

数据集包含 Parquet 格式的表。 这些表表示虚构的自行车制造公司(如客户、产品、订单和供应商)中的各种实体。

下载示例数据

  1. 转到 GitHub 上的 Fabric Graph GQL 示例数据集

  2. 选择 adventureworks_docs_sample.zip 文件并将其下载到本地计算机。

    小窍门

    若要从 GitHub 下载文件,请选择该文件,然后选择 “下载原始文件 ”图标。

  3. 将下载 的adventureworks_docs_sample.zip 文件解压缩到本地计算机上的文件夹。

    小窍门

    在文件资源管理器中,右键单击 zip 文件,然后选择“ 全部提取”,然后选择目标文件夹。

创建湖屋

如果您还没有创建 Lakehouse,请创建一个以存储示例数据:

  1. Microsoft Fabric 中,选择要创建湖仓的工作区。

  2. 选择 + 新建项目

  3. 选择 Store data>Lakehouse

  4. 输入 lakehouse 的名称(例如,“AdventureWorksLakehouse”),清除 Lakehouse 架构 选项,然后选择“ 创建”。

    重要

    请确保清除 Lakehouse 架构选项。 Microsoft Fabric 中的 Graph 当前不支持那些启用了湖仓架构(预览版)的湖仓。

有关更详细的说明,请参阅 通过 OneLake 创建湖仓

将示例数据上传到 Lakehouse

  1. 在 lakehouse Explorer 中,将鼠标悬停在 文件上。 选择显示的三个省略号(...),然后选择“上传>上传文件夹”。

    注释

    无法通过上传文件来上传文件夹。

  2. 在“ 上传文件夹 ”对话框中,浏览到提取文件夹的位置并选择它。 然后,选择“上传”。 此时可能会显示一个弹出窗口,要求确认上传:再次选择“上传”,然后在“上传文件夹”对话框中选择“上传”。

    小窍门

    可以一次性选择文件夹中的所有文件,方法是按 Ctrl + A ,然后选择 “打开”。

将数据加载到表中

上传文件后,将其加载到表中。 表是来自 lakehouse 的源数据,用于在图模型中创建节点和边缘。

对于上传 adventureworks_docs_sample 文件夹中的每个子文件夹,请按照以下步骤将数据加载到表中:

  1. 展开 “文件” 文件夹。 将鼠标悬停在子文件夹(例如,adventureworks_customers),选择三个省略号(...),然后选择“加载到表>”。

  2. “加载文件夹到新表 ”对话框中,输入表名称(默认值使用文件夹名称),并将文件类型设置为 Parquet。 然后选择“ 加载”。

加载所有表后,展开 “表” 文件夹。 如果使用了默认名称,则应在 lakehouse 中看到下表:

  • AdventureWorks_客户
  • adventureworks_employees
  • adventureworks_orders
  • adventureworks_productcategories
  • adventureworks_products
  • adventureworks_productsubcategories
  • adventureworks_vendorproduct
  • adventureworks_vendors

工作区中的湖屋现已准备好,有 Adventure Works 示例数据可用。 在下一步中,将创建使用此数据的图形模型。

后续步骤