Compartilhar via


Conectar o Power BI ao Azure Databricks

O Microsoft Power BI é um serviço de análise de negócios que fornece visualizações interativas com funcionalidades de business intelligence de autoatendimento, permitindo que os usuários finais criem relatórios e dashboards por conta própria sem precisar depender da equipe de tecnologia da informação ou dos administradores de banco de dados.

Ao usar o Azure Databricks como uma fonte de dados com o Power BI, você pode levar as vantagens do desempenho e da tecnologia do Azure Databricks para além de cientistas de dados e engenheiros de dados a todos os usuários empresariais.

Publicar no Power BI Online a partir do Azure Databricks

Ao usar o Azure Databricks como uma fonte de dados com o Power BI Online, você pode criar conjuntos de dados a partir de tabelas ou esquemas diretamente da interface do usuário do Databricks.

Requisitos

  • Seus dados devem estar no Unity Catalog e sua computação (cluster) deve estar habilitada para o Unity Catalog. No momento, não há suporte para metastore do Hive.

  • Você deve ter uma licença premium (capacidade Premium ou licença Premium por usuário ou capacidade do Fabric) do Power BI.

  • Você deve conceder as seguintes permissões ao aplicativo Entra ID registrado, Integração de Publicação de Conjunto de Dados do Databricks, que você está usando para publicar do Databricks para o Power BI:

    • Criar Conteúdo

    • Dataset.ReadWrite.All

    • Workspace.Read.All

      Aplicativo Entra ID

    Para mais informações, consulte Permissões do Microsoft Entra.

    Observação

    O consentimento do administrador do Entra normalmente é necessário para essas permissões, especialmente para acesso no nível do workspace e do conjunto de dados no Power BI. Consulte Revisar solicitações de consentimento do administrador para obter instruções.

  • Você deve habilitar Leitura e Gravação para o Ponto de extremidade XMLA na sua capacidade do Power BI. Siga este link para obter instruções.

  • Se os usuários quiserem editar modelos semânticos no Serviço do Power BI após a publicação, você deverá habilitar Os usuários poderão editar modelos de dados no serviço do Power BI (versão prévia) nas configurações do workspace. Você também pode editar o Modelo Semântico usando o Editor tabular fazendo uma conexão usando o ponto de extremidade XMLA.

  • Se o workspace do Power BI usar um link privado, você deverá atualizar manualmente as credenciais de fonte de dados do conjunto de dados no Power BI.

Publicar tabelas do Azure Databricks em um conjunto de dados do Power BI

  1. Entre no workspace do Databricks e clique no ícone Dados.Catálogo na barra lateral para abrir o Explorador de Catálogo.

  2. Selecione um recurso de computação na lista suspensa no canto superior direito.

  3. Abra um catálogo e selecione o esquema ou as tabelas a serem publicadas. Não selecione de um metastore do Hive ou do catálogo de exemplos.

  4. No canto superior direito, clique em Usar com ferramentas de BI para um esquema ou em Abrir em um dashboard para uma tabela.

  5. Selecione Publicar na área de trabalho do Power BI.

  6. Na caixa de diálogo Conectar-se ao parceiro, clique em Conectar-se ao Microsoft Entra ID para autenticar.

  7. Nos espaços de trabalho do Power BI, selecione o espaço de trabalho do Power BI.

  8. No Modo de Conjunto de Dados, selecione DirectQuery ou Importar.

  9. Em Método de Autenticação no Power BI, selecione OAuth ou PAT (Token de Acesso Pessoal).

    O Databricks recomenda o uso do OAuth, pois ele permite o controle de acesso refinado e a auditoria no nível do usuário. As credenciais do OAuth podem precisar ser configuradas na página de configurações do conjunto de dados do Power BI em Credenciais da fonte de dados. Se você selecionar o PAT (Token de Acesso Pessoal), um PAT será criado em seu nome para permitir que o Power BI acesse o modelo semântico.

  10. Em Nome do conjunto de dados, selecione Publicar como um novo conjunto de dados ou Usar um conjunto de dados existente.

    Quando você escolhe Usar um conjunto de dados existente, o seguinte é verdadeiro:

    • Se o conjunto de dados já existir, não será substituído. As atualizações apenas acrescentam novos registros em um determinado esquema.
      • Se a tabela selecionada não fizer parte do conjunto de dados existente, ela será adicionada.
      • Se a tabela já estiver no conjunto de dados e novas colunas tiverem sido adicionadas após a última atualização, essas colunas serão adicionadas automaticamente.
      • Você pode escolher um modelo de armazenamento diferente para a nova tabela para criar um modelo semântico composto.

    Se você tiver um modelo semântico existente que deseja atualizar enquanto mantém as conexões de dados existentes em vigor, escolha Usar um conjunto de dados existente. Se você quiser criar um novo conjunto de dados com um novo modelo semântico, escolha Publicar como novo conjunto de dados.

  11. Clique em Publicar no Power BI.

  12. Em 10 ou 20 minutos depois que o conjunto de dados for publicado, clique em Abrir Power BI para abrir o Power BI em uma nova guia.

Funcionalidades e notas

  • Ao publicar um esquema que contém várias tabelas, todas as tabelas com colunas serão publicadas. Tabelas sem colunas não são publicadas.
  • Os comentários nas colunas de uma tabela no Azure Databricks são copiados para as descrições das colunas correspondentes no Power BI.
  • Relações de chave estrangeira são preservadas no conjunto de dados publicado. No entanto, o Power BI dá suporte apenas a um caminho de relação ativo entre as duas tabelas. Quando vários caminhos estiverem presentes no esquema no Azure Databricks, algumas das relações correspondentes no Power BI serão definidas como inativas. Posteriormente, você poderá alterar quais relações estão ativas/inativas na exibição do modelo de dados no Power BI.
  • Quando você usar o OAuth ou um gateway de dados local, pode ser necessário configurar as credenciais em "Credenciais da fonte de dados" na página de configurações do conjunto de dados do Power BI.
  • Atualmente, os usuários só podem publicar diretamente em workspaces do Power BI em seu locatário base. Não há suporte para a publicação em locatários em que eles são usuários convidados.

Solução de problemas

Erro Observações
"Aprovação necessária" ao iniciar Publicar no Power BI pela primeira vez Se você vir essa mensagem, precisará da aprovação do Administrador do Entra a fim de conceder permissões para esse recurso de integração. Entre em contato com o Administrador do Entra para aprovar a solicitação. Siga este link para obter instruções.
PowerBINotLicensedException Verifique se você tem uma licença do Power BI Premium.
Não foi possível implantar esse conjunto de dados. Entre em contato com um administrador de capacidade para garantir que o suporte de leitura/gravação XMLA esteja habilitado nas configurações de capacidade do Power BI Premium e tente novamente. Para obter informações adicionais, consulte 'Suporte de leitura/gravação XMLA' na documentação do produto. Entre em contato com o administrador da capacidade do Power BI para habilitar os recursos de Leitura e Gravação no ponto de extremidade XMLA nas configurações de capacidade. Siga este link para obter instruções.
O recurso de ponto de extremidade XMLA está desabilitado. Ative o recurso Analisar no Excel no PowerBI.com para habilitar esse recurso. Entre em contato com o administrador da capacidade do Power BI para habilitar os recursos de Leitura e Gravação no ponto de extremidade XMLA nas configurações de capacidade. Siga este link para obter instruções.
CapacidadeInativa Sua capacidade pode ser pausada. Entre em contato com seu administrador de capacidade para verificar o status da capacidade.
O banco de dados com o nome '<ccon>_</ccon>' já existe no '<ccon>workspace </ccon>' _. Verifique se tem permissões para criar um modelo semântico. Em seguida, tente publicar novamente no Power BI para publicar o modelo semântico com um número de versão incrementado.
Não é possível usar o modo Direct Lake junto com outros modos de armazenamento no mesmo modelo. O modelo composto não dá suporte ao modo Direct Lake. Remova as tabelas sem suporte ou alterne-as para o modo Direct Lake. Já que Publicar no Power BI cria um modelo semântico com o modo DirectQuery ou Importar, ele não pode ser usado para publicar em um conjunto de dados existente que usa o modo Direct Lake. Siga este link para saber mais.
O usuário '<euii> *</euii>' não tem permissão para chamar o método Discover. Verifique se você está publicando em um espaço de trabalho do Power BI com um modo de licença Premium. Não é possível publicar em um espaço de trabalho com um modo de licença Pro.
O usuário '<euii> *</euii>' não tem permissão para criar um novo objeto em '***' ou o objeto não existe. Você pode ter a função de Visualizador no espaço de trabalho do Power BI. Verifique se você tem permissões para criar um modelo semântico. Siga este link para obter mais informações.
"Falha ao atualizar as credenciais da fonte de dados: [Microsoft][thriftextension] (14) Resposta inesperada do servidor durante uma conexão HTTP: resposta de erro não autorizada/proibida retornada, mas nenhuma mensagem expirada de token foi recebida." ao editar credenciais de fonte de dados no Power BI Verifique se seu espaço de trabalho do Databricks é acessível publicamente. Se seu espaço de trabalho estiver usando o Link Privado ou listas de acesso IP, talvez seja necessário configurar um gateway local do Power BI.

Conectar o Power BI Desktop ao Azure Databricks

Você pode conectar o Power BI Desktop aos clusters do Azure Databricks e aos SQL warehouses do Databricks. Você também pode publicar relatórios do Power BI no serviço do Power BI e permitir que os usuários acessem os dados subjacentes do Azure Databricks usando o SSO (logon único), transmitindo as mesmas credenciais do Microsoft Entra ID que eles usam para acessar o relatório.

Requisitos

  • Power BI Desktop 2.85.681.0 ou superior. Para usar dados gerenciados pelo Catálogo do Unity com o Power BI, use o Power BI Desktop 2.98.683.0 ou superior (versão de outubro de 2021).

    Observação

    O Power BI Desktop exige o Windows. Uma alternativa para outros sistemas operacionais é executar o Power BI Desktop em um host físico ou em uma máquina virtual baseada no Windows e se conectar a ele por meio do sistema operacional.

    Se você usar uma versão do Power BI Desktop inferior a 2.85.681.0, também precisará instalar o driver ODBC do Databricks no mesmo ambiente do Power BI Desktop.

Observação

Como prática recomendada de segurança ao autenticar com tokens de acesso pessoal, o Databricks recomenda que você use tokens de acesso pessoal pertencentes a entidades de serviço em vez de usuários do workspace. Para criar tokens para entidades de serviço, consulte Gerenciar tokens para uma entidade de serviço.

Conectar o Power BI Desktop ao Azure Databricks por meio do Partner Connect

Você pode usar o Partner Connect para se conectar a um cluster ou a um SQL warehouse com o Power BI Desktop usando apenas alguns cliques.

  1. Verifique se a sua conta do Azure Databricks, seu workspace e o usuário conectado atendem aos requisitos do Partner Connect.

  2. Na barra lateral, clique em Ícone do MarketplaceMarketplace.

  3. Em Integrações do Partner Connect, clique em Exibir tudo.

  4. Clique no bloco do Power BI.

  5. Na caixa de diálogo Conectar-se ao parceiro, em Computação, escolha o nome do recurso de computação do Azure Databricks que deseja conectar.

  6. Escolha Baixar arquivo de conexão.

  7. Abra o arquivo de conexão baixado, que inicia o Power BI Desktop.

  8. No Power BI Desktop, insira suas credenciais de autenticação:

    • Token de Acesso Pessoal: insira o seu token de acesso pessoal do Azure Databricks.
    • Microsoft Entra ID: clique em Entrar e siga as instruções na tela.
  9. Clique em Conectar.

  10. Selecione os dados do Azure Databricks a serem consultados no Navegador do Power BI.

    Navegador do Power BI

Conectar o Power BI Desktop ao Azure Databricks manualmente

Siga estas instruções, dependendo do método de autenticação escolhido, para se conectar a um cluster ou a um SQL warehouse com o Power BI Desktop. Os Databricks SQL warehouses são recomendados ao usar o Power BI no modo DirectQuery.

Observação

Para se conectar mais rapidamente com o Power BI Desktop, use o Partner Connect.

  1. Obtenha o Nome do Host do Servidor e o Caminho HTTP.

  2. Inicie o Power BI Desktop.

  3. Clique em Obter dados ou Arquivo > Obter dados.

  4. Clique em Obter dados para começar.

  5. Pesquise Databricks e clique no conector:

    • Azure Databricks
  6. Clique em Conectar.

  7. Insira o Nome do Host do Servidor e o Caminho HTTP.

  8. Selecione o Modo de conectividade de dados. Para obter informações sobre a diferença entre a Importação e o DirectQuery, confira Usar o DirectQuery no Power BI Desktop.

  9. Clique em OK.

  10. Selecione um método de autenticação:

    • Token de Acesso Pessoal: Insira seu

      Token de acesso pessoal do Azure Databricks.

    • Microsoft Entra ID: clique em Entrar e siga as instruções na tela.

  11. Clique em Conectar.

  12. Selecione os dados do Azure Databricks a serem consultados no Navegador do Power BI. Se o Catálogo do Unity estiver habilitado para seu workspace, selecione um catálogo antes de selecionar um esquema e uma tabela.

    Navegador do Power BI

Usar uma consulta SQL personalizada

O conector do Databricks fornece a fonte de dados Databricks.Query que permite que um usuário forneça uma consulta SQL personalizada.

  1. Siga as etapas descritas em Conexão com o Power BI Desktop para criar uma conexão, usando Importar como o modo de conectividade de dados.

  2. No Navegador, clique com o botão direito do mouse no item mais acima que contém o nome do host selecionado e o caminho HTTP e clique em Transformar Dados para abrir o Editor do Power Query.

    Clicar em Transformar dados no Navegador

  3. Na barra de funções, substitua o nome da função Databricks.Catalogs por Databricks.Query e aplique a alteração. Isso cria uma função do Power Query que usa uma consulta SQL como parâmetro.

  4. Insira a consulta SQL no campo de parâmetro e clique em Invocar. Isso executa a consulta e uma nova tabela é criada com os resultados da consulta como seu conteúdo.

Acessar uma fonte de dados do Azure Databricks usando o serviço do Power BI

Ao publicar um relatório no serviço do Power BI, você se conecta ao Azure Databricks usando um token de acesso pessoal.

No serviço do Power BI, você também pode habilitar o SSO (logon único) para que os usuários possam acessar relatórios criados usando o modo de armazenamento DirectQuery passando suas credenciais do Microsoft Entra ID para o Azure Databricks.

  1. Publique seu relatório do Power BI por meio do Power BI Desktop no serviço do Power BI.

  2. Habilite o acesso de SSO (logon único) ao relatório e à fonte de dados subjacente.

    1. Acesse o conjunto de dados subjacente do Azure Databricks para o relatório no serviço do Power BI, expanda Credenciais da fonte de dados e clique em Editar credenciais.
    2. Na caixa de diálogo de configuração, selecione Os visualizadores de relatórios só podem acessar esta fonte de dados com identidades próprias do Power BI usando o DirectQuery e clique em Entrar.

    Ativar SSO para o acesso a dados do Databricks

    Com essa opção selecionada, o acesso à fonte de dados é tratado por meio do DirectQuery e gerenciado com a identidade do Microsoft Entra ID do usuário que acessa o relatório. Se você não selecionar essa opção, somente você, como o usuário que publicou o relatório, terá acesso à fonte de dados do Azure Databricks.

Detecção automatizada de proxy HTTP

Power BI Desktop versão 2.104.941.0 e superior (versão de maio de 2022) tem suporte interno para detectar configuração de proxy HTTP em todo o sistema Windows.

O Power BI Desktop pode detectar e usar automaticamente sua configuração de proxy HTTP em todo o sistema Windows.

Se o servidor proxy não fornecer um ponto de distribuição de CRL (CDP), o Power BI poderá mostrar a mensagem de erro:

Details: "ODBC: ERROR [HY000] [Microsoft][DriverSupport] (1200)
-The revocation status of the certificate or one of the certificates in the certificate chain is unknown."

Para corrigir esse erro, use as seguintes etapas:

  1. Crie o arquivo C:\Program Files\Microsoft Power BI Desktop\bin\ODBC Drivers\Simba Spark ODBC Driver\microsoft.sparkodbc.ini se ele não existir.

  2. Adicione a seguinte configuração ao arquivo microsoft.sparkodbc.ini:

    [Driver]
    CheckCertRevocation=0
    

Conector do Delta Sharing do Power BI

O conector de Delta Sharing do Power BI permite aos usuários descobrir, analisar e visualizar conjuntos de dados compartilhados com eles por meio do protocolo aberto do Delta Sharing. O protocolo permite a troca segura de conjuntos de dados em produtos e plataformas aproveitando a REST e o armazenamento em nuvem.

Para obter instruções de conexão, consulte Power BI: ler dados compartilhados.

Limitações

  • O conector do Azure Databricks dá suporte ao proxy Web. No entanto, não há suporte para configurações automáticas de proxy definidas em arquivos .pac.
  • No conector do Azure Databricks, não há suporte para a fonte de dados Databricks.Query combinada ao modo DirectQuery.
  • Os dados carregados pelo conector de Delta Sharing precisam caber na memória do computador. Para garantir isso, o conector limita o número de linhas importadas ao Limite de Linhas definido anteriormente.

Criar uma conexão do Power BI no Catálogo do Unity para orquestração

Você pode orquestrar a publicação no Power BI com uma tarefa do Power BI (versão prévia). Para criar uma tarefa do Power BI, você deve ter uma conexão com o Power BI no Catálogo do Unity para armazenar suas credenciais do Entra.

Observação

Você deve ter o CREATE CONNECTION privilégio no Catálogo do Unity para criar a conexão do Power BI. Se outra pessoa criar a conexão, você deverá ter o privilégio USE CONNECTION para usar a conexão em uma tarefa do Power BI.

Etapa 1: Preparar suas credenciais

Você deve preparar credenciais para autenticação no Power BI. Você pode optar por usar a credencial de serviço, o OAuth Machine to Machine ou os métodos de autenticação OAuth (usuário para computador).

Para criar uma credencial de serviço, consulte Criar credenciais de serviço.

  • Você deve ter o privilégio CREATE CONNECTION na credencial de serviço.
  • Você deve adicionar o conector de acesso para a credencial de serviço ao workspace do Power BI ao qual você está se conectando.
  • O acesso à entidade de serviço deve estar habilitado no portal de administração do Power BI. Consulte Habilitar entidades de serviço.

Para preparar as credenciais do OAuth (Computador a Computador):

  1. Crie um principal de serviço do Azure ou use um existente. Para criar uma nova entidade de serviço do Azure no portal do Azure, consulte Registrar um aplicativo do Microsoft Entra e criar uma entidade de serviço.
  2. Adicione a entidade de serviço ao workspace do Power BI ao qual você está publicando.
  3. Habilite a entidade de serviço no portal de administração do Power BI. Consulte Habilitar entidades de serviço.
  4. Gere um segredo de cliente e salve tanto o ID de cliente quanto o segredo de cliente do principal para usar na próxima etapa.
  5. Salve o endpoint de autorização para ser usado na próxima etapa. O ponto de extremidade da autorização está no formato: https://login.microsoftonline.com/{tenant_id}/oauth2/v2.0/authorize.

Para preparar as credenciais do OAuth (usuário para computador):

  1. Obtenha o ponto de extremidade da autorização para usá-lo na próxima etapa. O ponto de extremidade da autorização está no formato: https://login.microsoftonline.com/{tenant_id}/oauth2/v2.0/authorize. Se o espaço de trabalho do Power BI estiver no seu espaço de trabalho pessoal, use common como {tenant_id}.
  2. Ao criar a conexão na próxima etapa, você será solicitado a fazer logon em sua conta da Microsoft e consentir com o Aplicativo Entra de Integração de Publicação do Conjunto de Dados do Databricks. Este aplicativo Entra é fornecido pelo Azure Databricks e é utilizado para acessar seu espaço de trabalho do Power BI em seu nome, com o objetivo de ler informações e criar e atualizar modelos semânticos. As permissões específicas concedidas são Content.Create, Dataset.ReadWrite.Alle Workspace.Read.All.

Etapa 2: Criar a conexão

  1. Entre no workspace do Databricks e clique no ícone Dados.Catálogo na barra lateral para abrir o Explorador de Catálogo.
  2. Clique em Dados externos, conexões e, em seguida, crie uma conexão.
  3. Na página de noções básicas de Conexões do assistente de configuração de conexão , insira um nome de conexão amigável.
  4. Selecione um tipo de conexão do Power BI.
  5. Para o tipo de autenticação, selecione Credencial de serviço, OAuth Machine to Machine ou OAuth (usuário para computador), com base nas credenciais preparadas anteriormente.
  6. Clique em Próximo.
  7. Na Etapa 2 do assistente de configuração de conexão , você será solicitado a fornecer as informações de credencial que você preparou.
  8. Clique em Criar conexão.

Essa conexão agora pode ser usada ao configurar uma tarefa do Power BI. Se você quiser permitir que outros usuários acessem essa conexão, conceda o USE CONNECTION privilégio a esses usuários.

Recursos adicionais

Suporte