Share via


Tutorial: Malha para usuários do Power BI

Neste tutorial, você aprenderá a usar Dataflows Gen2 e Pipelines para ingerir dados em um Lakehouse e criar um modelo dimensional. Você também aprende como gerar um belo relatório automaticamente para exibir os números de vendas mais recentes do início ao fim em apenas 45 minutos.

Vamos começar!

  • Preparar e carregar dados em uma casa de lago
  • Construa um modelo dimensional em uma casa do lago
  • Criar automaticamente um relatório com a criação rápida

Pré-requisitos

Criar uma casa de lago para armazenar dados

Começamos criando um lakehouse para armazenar nossos dados, Dataflows Gen2 para preparar e transformar colunas e um pipeline para lidar com a orquestração de uma atualização agendada e atividade de e-mail.


  1. Navegue até o espaço de trabalho e selecione Novo. Em seguida, selecione Mostrar tudo.

    Screenshot of the Show all option in the new item menu.

  2. Na tela Criação de novo item, selecione Lakehouse na categoria Engenharia de dados.

    Screenshot of Data engineering items.

  3. Defina o nome Lakehouse como SalesLakehouse. Depois, selecione Criar.

    Screenshot of naming a name Lakehouse.

  4. Quando estiver no editor Lakehouse, selecione New Dataflow Gen2.

    Nota

    Você também pode selecionar Obter dados da faixa de opções e, em seguida, Novo Fluxo de Dados Gen2.

    Screenshot of Get data drop down in the Lakehouse editor.

Prepare e carregue dados em sua casa do lago

Siga as seguintes etapas para carregar dados em sua casa no lago:

  1. Quando estiver no editor do Power Query Online para Dataflows Gen2, selecione Importar de um modelo do Power Query e escolha o ficheiro de modelo transferido a partir dos pré-requisitos.

    Screenshot of watermarks in the Dataflows Gen2 editor.

  2. Selecione a consulta DimDate no grupo de consulta Carga dedados e, em seguida, selecione Configurar conexão. Se necessário, defina o tipo de autenticação como Anônimo antes de selecionar Conectar.

    Screenshot of the configure connection menu.

  3. Com a consulta DimDate selecionada, na janela de visualização de dados, altere o tipo de dados da coluna DateKey para Data/Hora selecionando o ícone no canto superior esquerdo.

    Screenshot of changing data types within the Power Query editor.

  4. Selecione Substituir corrente na janela Alterar tipo de coluna.

    Screenshot of the change column type menu.

Adicionar um destino de dados

Execute as seguintes etapas para adicionar um destino de dados:

  1. Com a tabela DimDate selecionada, na guia Página Inicial, selecione Adicionar destino de dados e, em seguida, selecione o item de menu de opções Lakehouse.

    Screenshot of the get data destination Lakehouse option.

  2. Se necessário, defina a autenticação como Conta organizacional e selecione Avançar.

    Screenshot of the Connect to data destination menu.

  3. No navegador, selecione o espaço de trabalho usado para este tutorial e expanda para visualizar todos os itens do Lakehouse . Selecione SalesLakehouse e confirme se a tabela padrão Nova está selecionada antes de selecionar Avançar para continuar.

    Screenshot of the destination target navigator item.

  4. Defina o método Update como Replace e selecione Save settings.

    Atenção

    Definir o método de atualização como Substituir exclui todos os dados existentes e os substitui pelos novos dados em cada atualização subsequente.

    Screenshot of the destination settings menu option.

    Nota

    No canto inferior direito do editor do Power Query Online, pode encontrar as definições de destino de dados configuradas para a sua consulta, onde pode personalizar ou remover ainda mais.

    Screenshot of the configured data destination.

  5. Antes de passar para a próxima seção deste tutorial, certifique-se de executar as mesmas etapas que você executou anteriormente nesta seção para configurar o Lakehouse como seu destino de dados para cada uma das consultas a seguir.

    Query
    DimCustomer
    DimEmployee
    DimProduct
    DimStore
  6. Selecione a consulta FactOnlineSales no grupo de consultas Transformação de dados e, na guia Página Inicial, selecione Adicionar destino de dados e, em seguida, selecione a opção Lakehouse.

    Screenshot of the Data destination Lakehouse target option.

  7. Se necessário, defina a autenticação como Conta organizacional e selecione Avançar.

    Screenshot of the Connect to data destination menu.

  8. No navegador, selecione o espaço de trabalho usado para este tutorial e expanda para visualizar todos os itens do Lakehouse . Selecione SalesLakehouse e confirme se a tabela padrão Nova está selecionada antes de selecionar Avançar para continuar.

    Screenshot of the destination target navigator window.

  9. Defina o método Update como Append e selecione Save settings.

    Nota

    Esse processo insere dados, preservando as linhas existentes dentro da tabela em cada atualização subsequente.

    Screenshot of the destination settings menu selection.

  10. Selecione Publicar para guardar o fluxo de dados e sair do editor do Power Query Online .

    Screenshot of the publish button within Power Query Online.

  11. Passe o cursor sobre o fluxo de dados criado em seu espaço de trabalho, selecione as reticências (...) e a opção Propriedades .

    Screenshot of the dataflows properties in a workspace.

  12. Altere o nome do fluxo de dados para OnlineSalesDataflow e selecione Salvar.

    Screenshot of renaming a dataflow option.

Orquestre um pipeline de dados

Usando pipelines, primeiro orquestramos a atualização de nosso fluxo de dados. Se ocorrer um erro, enviamos um e-mail personalizado do Outlook que inclui detalhes importantes.

  1. Selecione o item Lakehouse chamado SalesLakehouse em seu espaço de trabalho.

    Screenshot of renaming an existing dataflow.

  2. Quando estiver no editor Lakehouse, selecione Novo pipeline de dados.

    Nota

    Você também pode selecionar Obter dados da faixa de opções e, em seguida, Novo pipeline de dados.

    Screenshot of watermarks in the Lakehouse editor.

  3. Defina o nome do pipeline como SalesPipeline. Depois, selecione Criar.

    Screenshot of the pipeline name menu option.

  4. Feche o Assistente de cópia de dados selecionando Cancelar. Se você for solicitado a confirmar a saída da janela de cópia de dados, selecione Sim, cancelar.

    Screenshot of the copy data assistant menu.

  5. Quando estiver no editor de pipeline, selecione Adicionar atividade de pipeline e, em seguida, selecione Fluxo de dados.

    Nota

    Você também pode selecionar Fluxo de dados na faixa de opções.

    Screenshot of the pipeline watermark canvas and the add activity option.

  6. Selecione a atividade de fluxo de dados no editor de pipeline e altere seu valor Name para OnlineSalesActivity na seção Geral.

    Screenshot of the dataflow name value.

  7. Com a atividade de fluxo de dados ainda selecionada, selecione Configurações e escolha OnlineSalesDataflow na lista Fluxo de dados. Se necessário para atualizar a lista, selecione o ícone Atualizar .

    Screenshot of the dataflow selection setting.

  8. Selecione a guia Atividades e, em seguida, a atividade do Office365 Outlook.

    Nota

    Se aparecer uma janela Conceder consentimento, selecione Ok, inicie sessão com a sua conta organizacional e, em seguida, selecione Permitir acesso.

    Screenshot of the Office365 Outlook activity information.

  9. Selecione a atividade do Office365 Outlook no editor de pipeline e altere seu valor Nome para Email em caso de falha na seção Geral.

    Screenshot of the Office365 Outlook activity name.

  10. Com a atividade do Office 365 Outlook ainda selecionada, selecione Configurações. Atualize o campo Para para o seu endereço de e-mail e a falha Sujeito ao pipeline. Selecione Adicionar conteúdo dinâmico [Alt+Shift+D] para o Corpo do email.

    Nota

    Mais opções de configuração de e-mail, como De (Enviar como), Cc, Cco, Rótulo de sensibilidade e muito mais, estão disponíveis nas propriedades Avançadas.

    Screenshot of the Office365 Outlook settings.

  11. No construtor de expressões Pipeline, cole o seguinte bloco de código de expressão:

    @concat(
        'Pipeline: '
        , 
        , '<br>'
        , 'Workspace: '
        , 
        , '<br>'
        , 'Time: '
        , 
    )
    

    Screenshot of the Office365 Outlook activity with expression builder.

  12. Selecione Variáveis do sistema e insira as seguintes variáveis selecionando o nome correspondente na tabela a seguir.

    Nome do valor Line Variável de sistema
    Gasoduto: 3 Pipeline ID
    Espaço de trabalho: 6 ID da área de trabalho

    Screenshot of the pipeline system variables.

  13. Selecione Funções e insira a seguinte função selecionando o nome correspondente na tabela a seguir. Uma vez concluído, selecione OK.

    Nome do valor Line Variável de sistema
    Hora: 9 UTCnow

    Screenshot of pipeline functions.

  14. Selecione OnlineSalesActivity e, nas opções de caminho disponíveis, selecione e mantenha pressionado o botão "X" (On fail) para criar uma seta que será solta na atividade Mail on failure . Essa atividade agora será invocada se a OnlineSalesActivity falhar.

    Screenshot of the on failure path.

  15. Na guia Página Inicial, selecione Agendar. Depois de atualizar as configurações a seguir, selecione Aplicar para salvar as alterações.

    Nome Valor
    Execução programada Em
    Repeat Diariamente
    Tempo 12:00:00

    Screenshot of on failure branch.

  16. Na guia Página Inicial, selecione Executar. Se uma janela de diálogo for exibida, selecione a opção Salvar e executar para continuar.

    Screenshot of the run option from the home tab.

    Para monitorar o status atual do pipeline, você pode exibir a tabela Saída , que exibe o progresso da atividade atual. A tabela será atualizada periodicamente por conta própria, ou você pode selecionar manualmente o ícone de atualização para atualizá-la.

    Screenshot of the current pipeline activity progress.

  17. Quando o status retornar Bem-sucedido, você poderá prosseguir para a próxima seção do tutorial retornando ao seu espaço de trabalho.

    Screenshot of the side rail with workspace selection.

Criar um modelo semântico no Lakehouse

Os dados carregados estão quase prontos para relatórios. Vamos primeiro usar o ponto de extremidade SQL para criar relacionamentos e exibições SQL em nosso lakehouse. Isso nos permite acessar facilmente nossos dados dentro de um modelo semântico, que é um modelo de metadados que contém objetos de banco de dados físicos que são abstraídos e modificados em dimensões lógicas. Ele é projetado para apresentar dados para análise de acordo com a estrutura do negócio.

Criar relações

Este modelo é um esquema em estrela que você pode ver em armazéns de dados: ele se assemelha a uma estrela. O centro da estrela é uma tabela de fatos. As tabelas ao redor são chamadas de tabelas de dimensão, que estão relacionadas à tabela de fatos com relações.


  1. Na exibição do espaço de trabalho, selecione o item SQL Endpoint chamado SalesLakehouse.

    Screenshot of the SQL endpoint item in a workspace.

  2. Uma vez no Explorer, selecione a visualização Modelo na parte inferior da tela para começar a criar relações.

    Screenshot of the Model view selection.

  3. Crie uma relação arrastando e soltando a coluna CustomerKey da tabela FactOnlineSales para a CustomerKey na tabela DimCustomer.

  4. Uma vez na janela Criar relacionamento, certifique-se de ter selecionado as tabelas, colunas e configurações corretas, conforme mostrado na tabela a seguir. Selecione Confirmar para continuar.

    Tornar esta relação ativa De: Tabela 1 (coluna) Para: Tabela 2 (coluna) Cardinalidade Direção do filtro cruzado
    FactOnlineSales (CustomerKey) DimCustomer (CustomerKey) Muitos para um (*:1) Única

    Screenshot of Relationship between the FactOnlineSales and DimCustomer table.

  5. Execute essas mesmas etapas para cada uma das tabelas e colunas restantes listadas na tabela a seguir para criar relações.

    Tornar esta relação ativa De: Tabela 1 (coluna) Para: Tabela 2 (coluna) Cardinalidade Direção do filtro cruzado
    FactOnlineSales (ProductKey) DimProduct (ProductKey) Muitos para um (*:1) Única
    FactOnlineSales (StoreKey) DimStore (StoreKey) Muitos para um (*:1) Única
    FactOnlineSales (DateKey) DimDate (DateKey) Muitos para um (*:1) Única
    DimStore (StoreKey) DimEmployee (StoreKey) Muitos para um (*:1) Ambos

    A imagem a seguir mostra uma visão concluída do modelo semântico com todas as relações criadas incluídas.

    Screenshot of table relationships in the model view pane.

Escrever uma medida no DAX

Vamos escrever uma medida básica que calcula o valor total das vendas.

  1. Selecione a tabela FactOnlineSales na pasta Tabelas . Na guia Página Inicial, selecione Nova medida.

    Screenshot of table relationships in the model view.

  2. No editor de fórmulas, copie e cole ou digite a seguinte medida para calcular o valor total das vendas. Selecione a marca de seleção para confirmar.

    Total Sales Amount = SUM(FactOnlineSales[SalesAmount])
    

    Screenshot of Select the check mark to commit a DAX measure.

Criar uma vista SQL

Vamos escrever uma instrução SQL que calcula o valor total de vendas por mês. Em seguida, salvaremos esta declaração como uma vista em nossa casa do lago. Isso nos permitirá acessar facilmente o valor total de vendas por mês no futuro.

  1. Na guia Página Inicial, selecione Nova consulta SQL.

    Screenshot of New SQL query from the home tab.

  2. No editor de consultas, copie e cole ou digite a consulta abaixo para calcular o valor total de vendas por número mensal em ordem decrescente. Depois de inserido, selecione Executar para visualizar os resultados.

    SELECT 
    MONTH(DateKey) as "MonthNumber",
    SUM(SalesAmount) as "TotalSalesAmount"
    FROM FactOnlineSales
    GROUP BY MONTH(DateKey)
    

    Screenshot of SQL query editor.

  3. Realce o texto completo da consulta e selecione Salvar como exibição.

    Screenshot of Save as view option.

  4. Na janela Salvar como exibição, defina o nome da exibição como TotalSalesByMonth e selecione OK.

    Screenshot of Save as view window.

  5. No Explorer, expanda a seção Modos de exibição e selecione TotalSalesByMonth para exibir os resultados na visualização de dados.

    Screenshot of Views with the Lakehouse explorer.

    Quando terminar de explorar o editor de ponto de extremidade SQL, você poderá prosseguir para a próxima seção do tutorial retornando ao seu espaço de trabalho.

    Screenshot of the side rail and selection of the workspace.

Criar automaticamente um relatório

Agora que você modelou seus dados, é hora de visualizar e explorar seus dados usando a criação rápida.


  1. Na visualização do espaço de trabalho, passe o mouse sobre o tipo de item Dataset (padrão) e o nome do item SalesLakehouse. Selecione as reticências ( ... ) e escolha Criar relatório automaticamente.

    Screenshot of the Autocreate report option with a workspace.

    Um relatório é gerado automaticamente para você e atualizado dinamicamente com base nas seleções de colunas no painel Seus dados .

    • O relatório exibido pode diferir da imagem abaixo.

    Screenshot of the finished Auto-create report.

  2. Selecione Salvar na faixa de opções para salvar uma cópia no espaço de trabalho atual

    • Para inserir a experiência de criação visual completa, você pode selecionar Editar na faixa de opções.

    Screenshot of the Save button when visualizing data.

  3. Na caixa de diálogo Salvar relatório, digite Resumo de vendas no campo Digite um nome para o relatório . Selecione Salvar depois de concluído.

    Screenshot of the Save button completing its process when visualizing data.

Você pode saber mais sobre a criação rápida.

Parabéns pela conclusão do tutorial! Se você criou um espaço de trabalho para o tutorial, pode optar por excluí-lo agora. Como alternativa, você pode remover os itens individuais que foram criados durante o tutorial.

Esperamos que este tutorial tenha mostrado como os usuários do Power BI podem fornecer facilmente informações sobre dados em qualquer nível de escala com o Microsoft Fabric.