Noções básicas sobre datamarts

Este artigo descreve e explica conceitos importantes sobre datamarts.

Entender o modelo semântico (padrão)

Os datamarts fornecem uma camada semântica que é gerada e sincronizada automaticamente com o conteúdo das tabelas de datamart, sua estrutura e dados subjacentes. Essa camada é fornecida em um modelo semântico gerado automaticamente. Essa geração e sincronização automáticas permitem que você descreva ainda mais o domínio de dados com itens como hierarquias, nomes amigáveis e descrições. Você também pode definir a formatação específica para seus requisitos de localidade ou negócios. Com os datamarts, você pode criar medidas e métricas padronizadas para relatórios. O Power BI (e outras ferramentas de cliente) pode criar visuais e fornecer resultados para esses cálculos com base nos dados no contexto.

O modelo semântico padrão do Power BI criado com base em um datamart elimina a necessidade de se conectar a um modelo semântico separado, configurar agendas de atualização e gerenciar vários elementos de dados. Em vez disso, você pode criar sua lógica de negócios em um datamart e seus dados estarão imediatamente disponíveis no Power BI, habilitando o seguinte:

  • Acesso a dados do datamart por meio do hub de modelo semântico.
  • Capacidade de analisar no Excel.
  • Capacidade de criar relatórios rapidamente no serviço Power BI.
  • Não é necessário atualizar, sincronizar dados ou entender detalhes da conexão.
  • Criar soluções na Web sem precisar do Power BI Desktop.

Durante a versão prévia, a conectividade do modelo semântico padrão está disponível apenas com o DirectQuery. A imagem a seguir mostra como os datamarts se encaixam no continuum do processo começando pela conexão com os dados, por meio da criação de relatórios.

Diagram that shows how datamarts fit into the data connection and analysis continuum.

Os modelos semânticos padrão são diferentes dos modelos semânticos tradicionais do Power BI das seguintes maneiras:

  • O ponto de extremidade XMLA dá suporte a operações somente leitura e os usuários não podem editar o modelo semântico diretamente. Com a permissão de somente leitura da XMLA, você pode consultar os dados em uma janela de consulta.
  • Os modelos semânticos padrão não têm configurações de fonte de dados e os usuários não precisam inserir credenciais. Em vez disso, eles usam SSO (Logon Único) automático para consultas.
  • Para operações de atualização, os modelos semânticos usam as credenciais de autor do conjunto de dados para se conectar ao ponto de extremidade SQL do datamart gerenciado.

Com o Power BI Desktop, os usuários podem criar modelos compostos, permitindo que você se conecte ao modelo semântico do datamart e faça o seguinte:

  • Selecionar tabelas específicas para analisar.
  • Adicionar mais fontes de dados.

Por fim, se você não quiser usar o modelo semântico padrão diretamente, poderá se conectar ao ponto de extremidade SQL do datamart. Para obter mais informações, confira Criar relatórios usando datamarts.

Entender o conteúdo do modelo semântico padrão

Atualmente, as tabelas no datamart são adicionadas automaticamente ao modelo semântico padrão. Os usuários também podem selecionar manualmente as tabelas ou exibições do datamart que desejam incluir no modelo para obter mais flexibilidade. Os objetos que estão no modelo semântico padrão serão criados como um layout na exibição de modelo.

A sincronização em segundo plano que inclui objetos (tabelas e exibições) aguardará até que o modelo semântico downstream não esteja em uso para atualizá-lo, respeitando a desatualização limitada. Os usuários sempre podem escolher manualmente as tabelas desejadas ou não no modelo semântico.

Entender a atualização incremental e os datamarts

Você pode criar e modificar a atualização incremental de dados, semelhante a fluxos de dados e atualização incremental do modelo semântico, usando o editor de datamart. A atualização incremental estende as operações de atualização agendadas fornecendo a criação e o gerenciamento automáticos de partições para tabelas de datamart que frequentemente carregam dados novos e atualizados.

Para a maioria dos datamarts, essa atualização incremental envolverá uma ou mais tabelas que contêm dados de transação que são alterados com frequência e podem crescer exponencialmente, como uma tabela de fatos em um esquema de banco de dados relacional ou em estrela. Se você usar uma política de atualização incremental para particionar a tabela e atualizar apenas as partições de importação mais recentes, pode reduzir significativamente a quantidade de dados que devem ser atualizados.

A atualização incremental e os dados em tempo real para datamarts oferecem as seguintes vantagens:

  • Menos ciclos de atualização para dados de alteração rápida
  • As atualizações são mais rápidas
  • As atualizações são mais confiáveis
  • O consumo de recursos é reduzido
  • Permite que você crie grandes datamarts
  • Fácil de configurar

Entender o cache proativo

O cache proativo permite a importação automática dos dados subjacentes para o modelo semântico padrão para que você não precise gerenciar nem orquestrar o modo de armazenamento. O modo de importação do modelo semântico padrão fornece aceleração de desempenho para o modelo semântico do datamart usando o mecanismo rápido Vertipaq. Quando você usa o cache proativo, o Power BI altera o modo de armazenamento do modelo a ser importado, que usa o mecanismo em memória no Power BI e no Analysis Services.

O cache proativo funciona da seguinte maneira: após cada atualização, o modo de armazenamento do modelo semântico padrão é alterado para o DirectQuery. O cache proativo cria um modelo de importação lado a lado de maneira assíncrona e é gerenciado pelo datamart, sem afetar a disponibilidade nem o desempenho do datamart. As consultas que chegarem após a conclusão do modelo semântico padrão usarão o modelo de importação.

A geração automática do modelo de importação ocorre em aproximadamente dez minutos após nenhuma alteração ser detectada no datamart. O modelo semântico de importação é alterado das seguintes maneiras:

  • Atualizações
  • Novas fontes de dados
  • Alterações de esquema:
    • Novas fontes de dados
    • Atualizações das etapas de preparação de dados no Power Query Online
  • Atualizações de modelagem, como:
    • Medidas
    • Hierarquias
    • Descrições

Melhores práticas para o cache proativo

Use Pipelines de implantação para as alterações para garantir o melhor desempenho e para garantir que os usuários estejam usando o modelo de importação. O uso de Pipelines de implantação já é uma melhor prática para a criação de datamarts, mas isso garante que você aproveite o cache proativo com mais frequência.

Considerações e limitações do cache proativo

  • Atualmente, o Power BI limita a duração das operações de cache a dez minutos.
  • Restrições de exclusividade/não nulo para colunas específicas serão impostas ao modelo de importação e causarão falha na compilação do cache, se os dados não estiverem em conformidade.

Este artigo forneceu uma visão geral de conceitos importantes de noções básicas de datamart.

Os artigos a seguir fornecem mais informações sobre datamarts e o Power BI:

Para saber mais sobre fluxos de dados e transformações de dados, confira os seguintes artigos: