教程:将数据引入 Microsoft Fabric 中的仓库

适用于: Microsoft Fabric 中的仓库

在 Microsoft Fabric 中创建仓库后,可以将数据引入该仓库。

引入数据

  1. 从“生成仓库”登陆页中,选择导航菜单中的“数据仓库教程”,返回到工作区项列表。

    导航菜单的屏幕截图,显示在哪里选择“数据仓库教程”。

  2. 选择“新建”>“更多选项”以显示可用项的完整列表。

  3. 在“数据工厂”部分中,选择“数据管道”。

    “数据管道”部分的屏幕截图,显示在哪里选择“数据管道”。

  4. 在“新建管道”对话框中,输入 Load Customer Data 作为名称。

    “新建管道”对话框的屏幕截图,显示在哪里输入名称并选择“创建”。

  5. 选择“创建” 。

  6. 从“开始生成数据管道”登陆页中选择“添加管道活动”。

    “开始生成管道”屏幕的屏幕截图,显示在哪里选择“添加管道活动”。

  7. 从“移动和转换”部分选择“复制数据”。

    “移动和转换”部分的屏幕截图,显示在哪里选择“复制数据”。

  8. 如有必要,请从设计画布中选择新创建的“复制数据”活动,并按照后续步骤对其进行配置。

  9. 在“常规”页上,对于“名称”,输入 CD Load dimension_customer

    “常规”选项卡的屏幕截图,显示在哪里输入复制活动名称。

  10. 在“”页上,为“数据存储类型”选择“外部”。

  11. 在“连接”框旁边,选择“新建”以创建新连接。

    “源”选项卡的屏幕截图,显示在哪里选择“外部”和“新建”。

  12. 在“新建连接”页上,从连接选项列表中选择“Azure Blob 存储”。

    “Azure Blob 存储”选项的屏幕截图。

  13. 选择“继续”。

  14. 在“连接设置”页上,按如下所示配置设置:

    1. 在“帐户名称或 URL”中,输入 https://azuresynapsestorage.blob.core.windows.net/sampledata/

    2. 在“连接凭证”部分中,选择“连接”下拉列表中的“创建新连接”

    3. 对于“连接名称”,请输入 Wide World Importers Public Sample

    4. 将“身份验证类型”设置为“匿名”。

    “连接设置”屏幕的屏幕截图,其中按照前面步骤中的指示填写了“帐户名称”和“连接凭据”字段。

  15. 选择“创建” 。

  16. 按如下所示更改复制活动的“”页上的其余设置,以访问 https://azuresynapsestorage.blob.core.windows.net/sampledata/WideWorldImportersDW/parquet/full/dimension_customer/*.parquet 中的 .parquet 文件:

    1. 在“文件路径”文本框中,提供:

      1. 容器sampledata

      2. 文件路径 - 目录: WideWorldImportersDW/tables

      3. 文件路径 - 文件名: dimension_customer.parquet

    2. 在“文件格式”下拉列表中,选择“Parquet”。

  17. 选择“文件路径”设置旁边的“预览数据”以确保没有错误。

    “源”选项卡的屏幕截图,显示在哪里更改文件路径和格式详细信息并选择“预览数据”。

  18. 在“目标”页上,为“数据存储类型”选择“工作区”。

  19. 为“工作区数据存储类型”选择“数据仓库”。

  20. 在“数据仓库”下拉列表中,从列表中选择“WideWorldImporters”

  21. 在“表选项”配置设置旁边,选择“自动创建表”单选按钮。

  22. “表”配置设置旁边的下拉菜单将自动更改为两个文本框。

  23. 在“”设置旁边的第一个框中,输入 dbo

  24. 在“”设置旁边的第二个框中,输入 dimension_customer

    “目标”选项卡的屏幕截图,显示在哪里输入和选择前面步骤中指定的详细信息。

  25. 在功能区中,选择“运行”。

  26. 从对话框中选择“保存并运行”。 用于加载 dimension_customer 表的管道启动。

  27. 在“输出”页上监视复制活动的进度,并等待其完成。

    “输出”页面的屏幕截图,显示成功运行的外观。

下一步