Tutorial: Configurar bancos de dados espelhados do Microsoft Fabric do Azure Databricks (versão prévia)
O espelhamento de banco de dados no Microsoft Fabric é uma tecnologia SaaS corporativa, baseada em nuvem, sem ETL. Este guia ajuda você a estabelecer um banco de dados espelhado do Azure Databricks, que cria uma cópia somente leitura e replicada continuamente dos dados do Azure Databricks no OneLake.
Pré-requisitos
Crie ou use um workspace existente do Azure Databricks com o Catálogo do Unity habilitado.
Você deve ter o
EXTERNAL USE SCHEMA
privilégio no esquema no Catálogo do Unity que contém as tabelas que serão acessadas do Fabric. Para obter mais informações, consulte Controlar o acesso externo aos dados no Catálogo do Unity.Você precisa usar o modelo de permissões do Fabric para definir controles de acesso para catálogos, esquemas e tabelas no Fabric.
Os workspaces do Azure Databricks não devem estar atrás de um ponto de extremidade privado.
As contas de armazenamento que contêm dados do Catálogo do Unity não podem estar protegidas por um firewall.
Criar um banco de dados espelhado do Azure Databricks
Siga estas etapas para criar um novo banco de dados espelhado do Catálogo do Unity do Azure Databricks.
Navegue até https://powerbi.com.
Selecione + Novo e, em seguida, Catálogo espelhado do Azure Databricks.
Selecione uma conexão existente, se você tiver uma configurada.
- Se você não tiver uma conexão existente, crie uma nova conexão e insira todos os detalhes. Você pode se autenticar no workspace do Azure Databricks usando 'Conta organizacional' ou "Entidade de serviço". Para criar uma conexão, você deve ser um usuário ou um administrador do workspace do Azure Databricks.
Depois de se conectar a um workspace do Azure Databricks, na página Escolher tabelas em um catálogo do Databricks, você poderá selecionar o catálogo, os esquemas e as tabelas por meio da lista de inclusão/exclusão que deseja adicionar e acessar do Microsoft Fabric. Escolha o catálogo e seus esquemas e tabelas relacionados que você deseja adicionar ao seu espaço de trabalho do Fabric.
- Você só pode ver os catálogos/esquemas/tabelas aos quais tem acesso de acordo com os privilégios concedidos a eles de acordo com o modelo de privilégio descrito em Privilégios do Catálogo do Unity e objetos protegíveis.
- Por padrão, a opção Sincronizar automaticamente alterações futuras de catálogo para o esquema selecionado está ativada. Para obter mais informações, consulte Espelhando o Catálogo do Unity do Azure Databricks (versão prévia).
- Depois de fazer suas seleções, selecione Avançar.
Por padrão, o nome do item será o nome do catálogo que você está tentando adicionar ao Fabric. Na página Revisar e criar , você pode revisar os detalhes e, opcionalmente, alterar o nome do item de banco de dados espelhado, que deve ser exclusivo em seu espaço de trabalho. Selecione Criar.
Um item de catálogo do Databricks é criado e, para cada tabela, um atalho de tipo do Databricks correspondente também é criado.
- Os esquemas que não têm tabelas não serão mostrados.
Você também pode ver uma visualização dos dados ao acessar um atalho selecionando o ponto de extremidade de análise SQL. Abra o item de ponto de extremidade de análise SQL para iniciar a página do Explorer e do editor de consultas. Você pode consultar suas tabelas espelhadas do Azure Databricks com T-SQL no Editor SQL.
Criar atalhos do Lakehouse para o item de catálogo do Databricks
Você também pode criar atalhos do Lakehouse para o item de catálogo do Databricks para usar os dados do Lakehouse e usar os Notebooks do Spark.
- Primeiro, criamos uma casa do lago. Se você já tiver um lakehouse neste espaço de trabalho, poderá usar um lakehouse existente.
- Selecione seu espaço de trabalho no menu de navegação.
- Selecione + Novo>Lakehouse.
- Forneça um nome para sua casa do lago no campo Nome e selecione Criar.
- No modo de exibição Explorer do lakehouse, no menu Obter dados no lakehouse, em Carregar dados no lakehouse, selecione o botão Novo atalho.
- Selecione Microsoft OneLake. Selecionar um catálogo. Esse é o item de dados que você criou nas etapas anteriores. Em seguida, selecione Avançar.
- Selecione tabelas dentro do esquema e selecione Avançar.
- Selecione Criar.
- Os atalhos agora estão disponíveis em seu Lakehouse para uso com seus outros dados do Lakehouse. Você também pode usar o Notebooks e o Spark para executar o processamento de dados nos dados dessas tabelas de catálogo que você adicionou do workspace do Azure Databricks.
Criar um modelo semântico
Dica
Para obter a melhor experiência, é recomendável usar o Navegador Microsoft Edge para Tarefas de Modelagem Semântica.
Saiba mais sobre o modelo semântico padrão do Power BI.
Além do modelo semântico padrão do Power BI, você tem a opção de atualizar o modelo semântico padrão do Power BI se optar por adicionar/remover tabelas do modelo ou criar um novo Modelo Semântico. Para atualizar o modelo semântico padrão:
- Navegue até o item Espelhado do Azure Databricks em seu workspace.
- Selecione o ponto de extremidade de análise SQL na lista suspensa na barra de ferramentas.
- Em Relatórios, selecione Gerenciar modelo semântico padrão.
Gerenciar suas relações de modelo semântico
- Selecione Layouts de Modelo no Explorer em seu espaço de trabalho.
- Depois que os layouts de modelo são selecionados, você recebe um gráfico das tabelas que foram incluídas como parte do Modelo Semântico.
- Para criar relações entre tabelas, arraste um nome de coluna de uma tabela para outro nome de coluna de outra tabela. Um pop-up é apresentado para identificar a relação e a cardinalidade das tabelas.