Поделиться через


Подключение к Dataiku

Dataiku — это сквозная платформа ИИ для подготовки данных, Мозаики AutoML и MLOps. Вы можете интегрировать хранилища SQL Databricks и кластеры Azure Databricks с Dataiku.

Подключение к Dataiku с помощью Partner Connect

Примечание.

Partner Connect поддерживает только хранилища SQL для Dataiku. Чтобы подключить кластер к Dataiku, подключитесь к Dataiku вручную.

Чтобы подключить рабочую область Azure Databricks к Dataiku с помощью Partner Connect, сделайте следующее:

  1. На боковой панели нажмите кнопку Кнопка Partner Connect.

  2. Щелкните плитку партнерского решения.

    Примечание.

    Если в плитке Dataiku есть значок галочки, администратор уже использовал Partner Connect для подключения Dataiku к рабочей области. Перейдите к шагу 5. Партнер использует адрес электронной почты для учетной записи Azure Databricks, чтобы заставить вас войти в существующую учетную запись Dataiku.

  3. Выберите каталог из раскрывающегося списка и нажмите кнопку "Далее".

    Примечание.

    Если рабочая область включена в каталоге Unity, но партнер не поддерживает каталог Unity с помощью Partner Connect, используется каталог рабочей области по умолчанию. Если рабочая область не включена в каталоге Unity, hive_metastore используется.

  4. Выберите схему из раскрывающегося списка и нажмите кнопку "Добавить". Этот шаг можно повторить, чтобы добавить несколько схем.

  5. Нажмите кнопку Далее.

    С помощью Partner Connect в рабочей области создаются следующие ресурсы:

    Partner Connect также предоставляет следующие привилегии субъекту-службе <PARTNER>_USER :

    • (Каталог Unity)USE CATALOG: требуется для взаимодействия с объектами в выбранном каталоге.
    • (Каталог Unity) USE SCHEMA— предоставляет возможность считывать выбранные схемы.
    • (Каталог Unity)CREATE SCHEMA: предоставляет возможность создавать схемы в выбранном каталоге.
    • (Устаревшее хранилище метаданных Hive) USAGE— требуется для взаимодействия с объектами внутри hive_metastore и выбранными схемами.
    • (Устаревшее хранилище метаданных Hive) CREATE— предоставляет возможность создавать схему в hive_metastore.
    • (Устаревшее хранилище метаданных Hive) READ_METADATA. Предоставляет возможность чтения метаданных для выбранных схем.
    • (Устаревшее хранилище метаданных Hive) SELECT: предоставляет возможность считывать выбранные схемы.
  6. Нажмите кнопку Далее.

    В поле Электронная почта отображается адрес электронной почты для учетной записи Azure Databricks. Dataiku использует этот адрес электронной почты для запроса на создание учетной записи партнера или вход в существующую учетную запись партнера.

  7. Нажмите кнопку "Подключиться к Dataiku" или "Войти".

    Откроется новая вкладка в веб-браузере, где отображается веб-сайт Dataiku.

  8. Выполните инструкции на экране на веб-сайте Dataiku, чтобы создать пробную учетную запись Dataiku или войти в существующую учетную запись Dataiku.

Подключение к Dataiku вручную

В этом разделе описывается, как подключить существующее хранилище ИЛИ кластер SQL в рабочей области Azure Databricks к Dataiku вручную.

Примечание.

Для хранилищ SQL Databricks можно подключиться к Dataiku с помощью Partner Connect, чтобы упростить работу.

Требования

Прежде чем подключиться к Dataiku вручную, вам потребуется следующее:

  • Кластер хранилища SQL в рабочей области Azure Databricks.

  • Сведения о подключении для кластера или хранилища SQL, в частности имя узла сервера, порт и путь HTTP.

  • Маркер личного доступа Azure Databricks или токен Microsoft Entra ID (ранее Azure Active Directory). Чтобы создать личный маркер доступа, сделайте следующее:

    1. В рабочей области Azure Databricks щелкните имя пользователя Azure Databricks в верхней строке и выберите "Параметры " в раскрывающемся списке.
    2. Щелкните "Разработчик".
    3. Рядом с маркерами доступа нажмите кнопку "Управление".
    4. Щелкните Generate new token (Создание нового маркера).
    5. (Необязательно) Введите комментарий, который поможет определить этот маркер в будущем и изменить время существования маркера по умолчанию в течение 90 дней. Чтобы создать маркер без времени существования (не рекомендуется), оставьте поле время существования (дни) пустым (пустым).
    6. Щелкните Создать.
    7. Скопируйте отображаемый маркер в безопасное расположение и нажмите кнопку "Готово".

    Примечание.

    Не забудьте сохранить скопированный маркер в безопасном расположении. Не делитесь скопированным маркером с другими пользователями. Если вы потеряете скопированный маркер, вы не сможете повторно создать тот же маркер. Вместо этого необходимо повторить эту процедуру, чтобы создать новый маркер. Если вы потеряете скопированный маркер или считаете, что маркер скомпрометирован, Databricks настоятельно рекомендует немедленно удалить этот маркер из рабочей области, щелкнув значок корзины (отозвать) рядом с маркером на странице маркеров доступа.

    Если вы не можете создавать или использовать маркеры в рабочей области, это может быть связано с тем, что администратор рабочей области отключил маркеры или не предоставил вам разрешение на создание или использование маркеров. Ознакомьтесь с администратором рабочей области или следующими разделами:

    Примечание.

    В качестве рекомендации по обеспечению безопасности при проверке подлинности с помощью автоматизированных средств, систем, сценариев и приложений Databricks рекомендуется использовать личные маркеры доступа, принадлежащие субъектам-службам, а не пользователям рабочей области. Сведения о создании маркеров для субъектов-служб см. в разделе "Управление маркерами" для субъекта-службы.

Действия по подключению

Чтобы подключиться к Dataiku вручную, выполните инструкции Databricks в документации по Dataiku.

Дополнительные ресурсы

Изучите следующие ресурсы Dataiku: