连接到 Matillion

Matillion ETL 是专为云数据库平台(包括 Azure Databricks)而构建的 ETL/ELT 工具。 Matillion ETL 具有基于浏览器的新式 UI,具有强大的下推 ETL/ELT 功能。

你可以将 Databricks SQL 仓库(以前称为 Databricks SQL 终结点)和 Azure Databricks 群集与 Matillion 集成。

使用 Partner Connect 连接到 Matillion

本部分介绍如何使用 Partner Connect 更轻松地将 Azure Databricks 工作区中的现有 SQL 仓库或群集连接到 Matillion。

要求

请参阅使用 Partner Connect 的要求

连接步骤

若要使用 Partner Connect 连接到 Matillion,请按照本部分中的步骤操作。

提示

如果有现有 Matillion 帐户,Databricks 建议手动连接到 Matillion。 这是因为 Partner Connect 中的连接体验针对新的合作伙伴帐户进行了优化。

  1. 在边栏中,单击 Partner Connect 按钮“Partner Connect”

  2. 单击 “Matillion” 磁贴。

    “电子邮件”框显示 Azure Databricks 帐户的电子邮件地址。 Matillion 使用此电子邮件地址提示你创建新的 Matillion 帐户或登录到现有的 Matillion 帐户。

  3. 单击“连接到 Matillion ETL” 或“登录”。

    此时会在浏览器中打开一个新选项卡,其中显示 Matillion 中心。

  4. 按照 Matillion 中的屏幕说明创建 14 天试用的 Matillion 帐户,或登录现有 Matillion 帐户。

    重要

    如果显示错误提示你组织中的某个人已经使用 Matillion 创建了一个帐户,请联系你组织的一位管理员并让他们将你添加到你组织的 Matillion 帐户。 添加后,登录到现有的 Matillion 帐户。

  5. 完成屏幕说明以提供作业详细信息,然后单击“继续”。

  6. 完成创建组织的屏幕说明,然后单击“继续”。

  7. 单击创建的组织,然后单击“添加 Matillion ETL 实例”。

  8. 单击“在 Azure 中继续”。

    此时会打开 Azure 门户。

  9. 按照 Matillion ETL 文档中的从 Azure ARM 模板启动 Matillion ETL 进行操作,从步骤 6 开始。

  10. 按照 Matillion ETL 文档中的实例关联进行操作。

    Matillion ETL 将在浏览器中打开,此时将显示“创建项目”对话框。

  11. 按照 Matillion 文档中的在 Databricks 项目上创建 Delta Lake 进行操作。

    对于这些说明中的“Delta Lake 连接”部分中的设置,请输入以下信息:

    • 对于“工作区 ID”,请输入 Azure Databricks 每个工作区 URL 的工作区 ID。 请勿在第一个“点”后添加任何内容 (.)。 请参阅工作区实例名称、URL 和 ID
    • 对于“用户名”,请输入单词 token
    • 对于“密码”,请输入 Azure Databricks 个人访问令牌的值。

    若要获取工作区 ID 并生成个人访问令牌,请执行以下操作:

    1. 返回到浏览器中的 Partner Connect 选项卡。

    2. 记下工作区 ID

    3. 单击“生成新令牌”。

      此时会在浏览器中打开一个新选项卡,该选项卡的 Databricks SQL UI 中将显示“设置”页

    4. 单击“生成新令牌”。

    5. 选择性地输入说明(注释)和有效期。

    6. 单击“生成” 。

    7. 复制生成的个人访问令牌,并将其存储在安全的位置。

    8. 在浏览器中,返回到 Matillion 选项卡。

    对于这些说明中的“Delta Lake 默认设置”部分中的设置,对于“群集”,请选择 SQL 仓库或群集的名称。

  12. 继续执行后续步骤。

手动连接到 Matillion

本部分介绍如何将 Azure Databricks 工作区中的现有 SQL 仓库或群集手动连接到 Matillion。

注意

可以使用 Partner Connect 连接到 Matillion 以简化体验。

要求

在手动与 Matillion 集成之前,必须满足以下条件:

连接步骤

若要手动连接到 Matillion,请执行以下操作:

  1. 获取要在工作区中使用的现有计算资源(SQL 仓库或群集)的名称。 稍后,你将选择该名称以完成计算资源与 Matillion ETL 实例之间的连接。

    • 若要查看工作区中的 SQL 仓库,请单击边栏中的 终结点图标“SQL 仓库”。 若要创建新的 SQL 仓库,请参阅创建 SQL 仓库
    • 若要查看工作区中的群集,请在边栏中单击 计算图标“计算”。 要创建群集,请参阅计算配置参考
  2. 按照 Matillion 文档中的连接到 Matillion ETL 实例并登录到该实例进行操作。

  3. 按照 Matillion 文档中的在 Databricks 项目上创建 Delta Lake 进行操作。

    对于这些说明中的“Delta Lake 连接”部分中的设置,请输入以下信息:

    • 对于“工作区 ID”,请输入 Azure Databricks 每个工作区 URL 的工作区 ID。 请勿在第一个“点”后添加任何内容 (.)。 请参阅工作区实例名称、URL 和 ID
    • 对于“用户名”,输入单词
    • 对于“密码”,请输入 Azure Databricks 个人访问令牌或 Microsoft Entra ID 令牌。

    对于这些说明中的“Delta Lake 默认设置”部分中的设置,对于“群集”,请选择 SQL 仓库或群集的名称。

  4. 继续执行后续步骤。

后续步骤

在 Matillion 网站上浏览以下一个或多个资源: