Подключение к Matillion
Matillion ETL — это средство ETL/ELT, предназначенное специально для облачных платформ баз данных, в том числе Azure Databricks. Matillion ETL имеет современный пользовательский интерфейс на основе браузера с эффективными функциональными возможностями ETL/ELT с проталкиванием вниз.
Вы можете интегрировать хранилища Databricks SQL (прежнее название — конечные точки Databricks SQL) и кластеры Azure Databricks с Matillion.
Подключение к Matillion с использованием Partner Connect
В этом разделе показано, как использовать Partner Connect, чтобы упростить процесс подключения существующего хранилища SQL или кластера в рабочей области Azure Databricks к Matillion.
Требования
Ознакомьтесь с требованиями для использования Partner Connect.
Действия по подключению
Чтобы подключиться к Matillion с помощью Partner Connect, выполните действия, описанные в этом разделе.
Совет
Если у вас есть учетная запись Matillion, рекомендуем подключиться к Matillion вручную. Причина в том, что интерфейс настройки подключения в Partner Connect оптимизирован для новых учетных записей партнерского решения.
На боковой панели нажмите кнопку Partner Connect.
Щелкните плитку Matillion.
В поле Электронная почта отображается адрес электронной почты для учетной записи Azure Databricks. Matillion будет использовать этот адрес электронной почты, чтобы предложить вам создать новую учетную запись Matillion или войти в существующую.
Нажмите кнопку Подключиться к Matillion ETL или Войти.
В браузере откроется новая вкладка с центром Matillion.
С помощью инструкций на экране в Matillion создайте 14-дневную пробную учетную запись Matillion или войдите в существующую учетную запись.
Внимание
Если появится сообщение об ошибке, извещающее, что кто-то из вашей организации уже создал учетную запись Matillion, обратитесь к администратору вашей организации и попросите добавить вас в корпоративную учетную запись Matillion. После того как он вас добавит, войдите в существующую учетную запись Matillion.
Следуйте инструкциям на экране, чтобы указать сведения о задании, а затем нажмите кнопку Продолжить.
Следуйте инструкциям на экране, чтобы создать организацию, а затем нажмите кнопку Продолжить.
Щелкните созданную организацию, а затем выберите Добавить экземпляр ETL Matillion.
Выберите Продолжить в Azure.
Открывается портал Azure.
Выполните инструкции по запуску ETL Matillion из шаблона Azure ARM в документации по ETL Matillion, начиная с шага 6.
Следуйте инструкциям в документации по ETL Matillion.
ETL Matillion откроется в браузере, и отобразится диалоговое окно Создание проекта.
Выполните инструкции по созданию Delta Lake в проекте Databricks в документации по Matillion.
Для параметров в разделе Подключение Delta Lake этих инструкций укажите следующие сведения.
- В поле Идентификатор рабочей области укажите идентификатор рабочей области Azure Databricks для URL-адреса каждой рабочей области. Не указывайте ничего после первой точки (
.
). См. Имена экземпляров рабочей области, URL-адреса и идентификаторы. - В поле Имя пользователя введите слово
token
. - В поле "Пароль" введите значение личного маркера доступа Azure Databricks.
Чтобы получить идентификатор рабочей области и создать личный маркер доступа, выполните следующие действия.
Вернитесь на вкладку Partner Connect в браузере.
Запишите идентификатор рабочей области.
Щелкните Создать маркер.
Откроется новая вкладка в браузере, на котором отображается страница "Параметры " пользовательского интерфейса Azure Databricks.
Щелкните Generate new token (Создание нового маркера).
При необходимости введите описание (комментарий) и срок действия.
Щелкните Создать.
Скопируйте созданный личный маркер доступа и сохраните его в безопасном расположении.
Вернитесь на вкладку Matillion в браузере.
Для параметров в разделе Параметры Delta Lake по умолчанию в поле Кластер выберите имя хранилища SQL или кластера.
- В поле Идентификатор рабочей области укажите идентификатор рабочей области Azure Databricks для URL-адреса каждой рабочей области. Не указывайте ничего после первой точки (
Перейдите к дальнейшим действиям.
Подключение к Matillion вручную
В этом разделе описано, как подключить существующее хранилище SQL или кластер в рабочей области Azure Databricks к Matillion вручную.
Примечание.
Чтобы упростить подключение, можно подключиться к Matillion с помощью Partner Connect.
Требования
Перед интеграцией с Matillion вручную необходимо получить следующее:
Экземпляр Matillion ETL, который можно запустить с помощью Azure Marketplace или Azure Resource Manager (ARM).
Личный маркер доступа Azure Databricks или маркер идентификатора Microsoft Entra.
Примечание.
В качестве рекомендации по обеспечению безопасности при проверке подлинности с помощью автоматизированных средств, систем, сценариев и приложений Databricks рекомендуется использовать личные маркеры доступа, принадлежащие субъектам-службам, а не пользователям рабочей области. Сведения о создании маркеров для субъектов-служб см. в разделе "Управление маркерами" для субъекта-службы.
Действия по подключению
Чтобы подключиться к Matillion вручную, выполните следующие действия.
Получите имя существующего вычислительного ресурса, который вы хотите использовать (хранилища SQL или кластера) в рабочей области. Позже вы выберете это имя для завершения подключения между вычислительным ресурсом и экземпляром Matillion ETL.
- Чтобы просмотреть хранилища SQL в рабочей области, щелкните "Хранилища SQL" на боковой панели. Сведения о создании нового хранилища SQL см. в статье "Создание хранилища SQL".
- Чтобы просмотреть кластеры в рабочей области, щелкните "Вычисления" на боковой панели. Сведения о создании кластера см . в справочнике по конфигурации вычислений.
Следуйте инструкциям в статье Подключение к экземпляру Matillion ETL и вход в него в документации по Matillion.
Выполните инструкции по созданию Delta Lake в проекте Databricks в документации по Matillion.
Для параметров в разделе Подключение Delta Lake этих инструкций укажите следующие сведения.
- В поле Идентификатор рабочей области укажите идентификатор рабочей области Azure Databricks для URL-адреса каждой рабочей области. Не указывайте ничего после первой точки (
.
). См. Имена экземпляров рабочей области, URL-адреса и идентификаторы. - В поле Имя пользователя введите слово
token
. - В поле "Пароль" введите личный маркер доступа Azure Databricks или маркер идентификатора Microsoft Entra ID.
Для параметров в разделе Параметры Delta Lake по умолчанию в поле Кластер выберите имя хранилища SQL или кластера.
- В поле Идентификатор рабочей области укажите идентификатор рабочей области Azure Databricks для URL-адреса каждой рабочей области. Не указывайте ничего после первой точки (
Перейдите к дальнейшим действиям.
Следующие шаги
Ознакомьтесь со следующими ресурсами на веб-сайте Matillion: