Partilhar via


Conecte-se à Dataiku

Dataiku é uma plataforma de IA de ponta a ponta para preparação de dados, AutoML e MLOps. Você pode integrar seus armazéns SQL do Databricks e clusters do Azure Databricks com o Dataiku.

Conecte-se à Dataiku usando o Partner Connect

Nota

O Partner Connect suporta apenas armazéns SQL para Dataiku. Para conectar um cluster ao Dataiku, conecte-se ao Dataiku manualmente.

Para conectar seu espaço de trabalho do Azure Databricks ao Dataiku usando o Partner Connect, faça o seguinte:

  1. Na barra lateral, clique em Botão Partner Connect Partner Connect.

  2. Clique no bloco de parceiro.

    Nota

    Se o bloco Dataiku tiver um ícone de marca de seleção dentro dele, um administrador já usou o Partner Connect para conectar o Dataiku ao seu espaço de trabalho. Pule para a etapa 5. O parceiro usa o endereço de email da sua conta do Azure Databricks para solicitar que você entre na sua conta Dataiku existente.

  3. Selecione um catálogo na lista suspensa e clique em Avançar.

    Nota

    Se o seu espaço de trabalho estiver habilitado para Unity Catalog, mas o parceiro não oferecer suporte ao Unity Catalog com Partner Connect, o catálogo padrão do espaço de trabalho será usado. Se o seu espaço de trabalho não estiver habilitado para Unity Catalog, hive_metastore será usado.

  4. Selecione um esquema na lista suspensa e clique em Adicionar. Você pode repetir esta etapa para adicionar vários esquemas.

  5. Clique em Next.

    O Partner Connect cria os seguintes recursos no seu espaço de trabalho:

    O Partner Connect também concede os seguintes privilégios à <PARTNER>_USER entidade de serviço:

    • (Unity Catalog)USE CATALOG: Necessário para interagir com objetos dentro do catálogo selecionado.
    • (Unity Catalog) USE SCHEMA: Concede a capacidade de ler os esquemas selecionados.
    • (Unity Catalog)CREATE SCHEMA: Concede a capacidade de criar esquemas no catálogo selecionado.
    • (Metastore do Hive herdado): USAGENecessário para interagir com objetos dentro hive_metastore e com os esquemas selecionados.
    • (metastore herdado do Hive): CREATEConcede a capacidade de criar um esquema no hive_metastore.
    • (Metastore do Hive herdado) READ_METADATA: Concede a capacidade de ler metadados para os esquemas selecionados.
    • (Metastore do Hive herdado) SELECT: Concede a capacidade de ler os esquemas selecionados.
  6. Clique em Next.

    A caixa Email exibe o endereço de email da sua conta do Azure Databricks. A Dataiku usa este endereço de e-mail para solicitar que você crie uma nova conta de parceiro ou entre em sua conta de parceiro existente.

  7. Clique em Conectar à Dataiku ou Entrar.

    Uma nova guia é aberta no seu navegador da Web, que exibe o site da Dataiku.

  8. Preencha as instruções na tela no site da Dataiku para criar sua conta Dataiku de avaliação ou entrar em sua conta Dataiku existente.

Conecte-se ao Dataiku manualmente

Esta seção descreve como conectar um SQL warehouse ou cluster existente em seu espaço de trabalho do Azure Databricks ao Dataiku manualmente.

Nota

Para armazéns SQL Databricks, você pode se conectar ao Dataiku usando o Partner Connect para simplificar a experiência.

Requerimentos

Antes de se conectar ao Dataiku manualmente, você precisa do seguinte:

  • Um cluster ou armazém SQL no seu espaço de trabalho do Azure Databricks.

  • Os detalhes de conexão para seu cluster ou SQL warehouse, especificamente os valores Nome do host do servidor, Porta e Caminho HTTP.

  • Um token de acesso pessoal do Azure Databricks ou um token de ID do Microsoft Entra (anteriormente Azure Ative Directory). Para criar um token de acesso pessoal, faça o seguinte:

    1. No seu espaço de trabalho do Azure Databricks, clique no seu nome de utilizador do Azure Databricks na barra superior e, em seguida, selecione Definições na lista pendente.
    2. Clique em Desenvolvedor.
    3. Ao lado de Tokens de acesso, clique em Gerenciar.
    4. Clique em Gerar novo token.
    5. (Opcional) Insira um comentário que o ajude a identificar esse token no futuro e altere o tempo de vida padrão do token de 90 dias. Para criar um token sem tempo de vida (não recomendado), deixe a caixa Tempo de vida (dias) vazia (em branco).
    6. Clique em Generate (Gerar).
    7. Copie o token exibido para um local seguro e clique em Concluído.

    Nota

    Certifique-se de salvar o token copiado em um local seguro. Não partilhe o seu token copiado com outras pessoas. Se você perder o token copiado, não poderá regenerar exatamente o mesmo token. Em vez disso, você deve repetir esse procedimento para criar um novo token. Se você perder o token copiado ou acreditar que o token foi comprometido, o Databricks recomenda que você exclua imediatamente esse token do seu espaço de trabalho clicando no ícone da lixeira (Revogar) ao lado do token na página de tokens do Access.

    Se você não conseguir criar ou usar tokens em seu espaço de trabalho, isso pode ser porque o administrador do espaço de trabalho desabilitou tokens ou não lhe deu permissão para criar ou usar tokens. Consulte o administrador do espaço de trabalho ou o seguinte:

    Nota

    Como prática recomendada de segurança, quando você se autentica com ferramentas, sistemas, scripts e aplicativos automatizados, o Databricks recomenda que você use tokens de acesso pessoal pertencentes a entidades de serviço em vez de usuários do espaço de trabalho. Para criar tokens para entidades de serviço, consulte Gerenciar tokens para uma entidade de serviço.

Etapas para se conectar

Para se conectar ao Dataiku manualmente, siga o Databricks na documentação do Dataiku.

Recursos adicionais

Explore os seguintes recursos da Dataiku: