Share via


Tutorial: Fabric para usuários do Power BI

Neste tutorial, você aprende a usar Fluxos de Dados Gen2 e Pipelines para ingerir dados em uma Lakehouse e criar um modelo dimensional. Você também aprenderá a gerar automaticamente um belo relatório para exibir os números de vendas mais recentes do início ao fim em apenas 45 minutos.

Vamos começar!

  • Preparar e carregar dados em um lakehouse
  • Construa um modelo dimensional em um lakehouse
  • Criar automaticamente um relatório com criação rápida

Pré-requisitos

Criar um lakehouse para armazenar dados

Começamos criando um lakehouse para armazenar nossos dados, Fluxos de Dados Gen2 para preparar e transformar colunas e um pipeline para lidar com a orquestração de uma atividade de email e atualização programada.


  1. Navegue até o seu espaço de trabalho e escolha Novo. Em seguida, selecione Mostrar tudo.

    Screenshot of the Show all option in the new item menu.

  2. Na tela de criação de Novos itens, selecione Lakehouse na categoria Engenharia de Dados.

    Screenshot of Data engineering items.

  3. Defina o nome do Lakehouse para SalesLakehouse. Em seguida, selecione Criar.

    Screenshot of naming a name Lakehouse.

  4. Quando você estiver no editor do Lakehouse, selecione Novo Fluxo de Dados Gen2.

    Observação

    Você também pode selecionar Obter dados da faixa de opções e, em seguida, Novo Fluxo de Dados Gen2.

    Screenshot of Get data drop down in the Lakehouse editor.

Preparar e carregar os dados no seu lakehouse

Siga as etapas a seguir para carregar os dados no seu lakehouse:

  1. Quando estiver no editor Power Query Online para Fluxos de Dados Gen2, selecione Importar de um modelo do Power Query e escolha o arquivo de modelo baixado dos pré-requisitos.

    Screenshot of watermarks in the Dataflows Gen2 editor.

  2. Selecione a consulta DimDate no grupo de consultas Carga de dados e selecione Configurar conexão. Se necessário, defina o tipo de autenticação como Anônimo antes de selecionar Conectar.

    Screenshot of the configure connection menu.

  3. Com a consulta DimDate selecionada, na janela de visualização de dados, altere o tipo de dados da coluna DateKey para Data/Hora selecionando o ícone no canto superior esquerdo.

    Screenshot of changing data types within the Power Query editor.

  4. Selecione Substituir a atual na janela Alterar tipo de coluna.

    Screenshot of the change column type menu.

Adicionar um destino de dados

Siga as etapas a seguir para adicionar um destino de dados:

  1. Com a tabela DimDate selecionada, na guia Início, selecione Adicionar destino de dados e, em seguida, selecione o item de menu da opção Lakehouse.

    Screenshot of the get data destination Lakehouse option.

  2. Se necessário, defina a autenticação como Conta organizacional e selecione Avançar.

    Screenshot of the Connect to data destination menu.

  3. No navegador, selecione o espaço de trabalho usada para este tutorial e expanda para exibir todos os itens do Lakehouse. Selecione SalesLakehouse e confirme se a Nova tabela padrão está selecionada antes de selecionar Avançar para continuar.

    Screenshot of the destination target navigator item.

  4. Defina o Método de atualização como Substituir e selecione Salvar configurações.

    Cuidado

    A configuração do método de atualização para Substituir exclui todos os dados existentes e os substitui pelos novos dados em cada atualização subsequente.

    Screenshot of the destination settings menu option.

    Observação

    No canto inferior direito do editor do Power Query Online, você pode encontrar as configurações de Destino de dados definidas para sua consulta, em que você pode personalizar ou remover ainda mais.

    Screenshot of the configured data destination.

  5. Antes de passar para a próxima seção deste tutorial, certifique-se de executar as mesmas etapas que você executou anteriormente nesta seção para configurar o Lakehouse como seu destino de dados para cada uma das consultas a seguir.

    Consulta
    DimCustomer
    DimEmployee
    DimProduct
    DimStore
  6. Selecione a consulta FactOnlineSales no grupo de consulta Transformação de dados e, na guia Início, selecione Adicionar destino de dados e selecione a opção Lakehouse.

    Screenshot of the Data destination Lakehouse target option.

  7. Se necessário, defina a autenticação como Conta organizacional e selecione Avançar.

    Screenshot of the Connect to data destination menu.

  8. No navegador, selecione o espaço de trabalho usada para este tutorial e expanda para exibir todos os itens do Lakehouse. Selecione SalesLakehouse e confirme se a Nova tabela padrão está selecionada antes de selecionar Avançar para continuar.

    Screenshot of the destination target navigator window.

  9. Defina o Método de atualização como Acrescentar e selecione Salvar configurações.

    Observação

    Esse processo insere dados, preservando as linhas existentes na tabela em cada atualização subsequente.

    Screenshot of the destination settings menu selection.

  10. Selecione Publicar para salvar seu fluxo de dados e sair do editor Power Query Online.

    Screenshot of the publish button within Power Query Online.

  11. Passe o cursor sobre o fluxo de dados criado no seu espaço de trabalho, selecione as elipses (...) e a opção Propriedades.

    Screenshot of the dataflows properties in a workspace.

  12. Altere o nome do fluxo de dados para OnlineSalesDataflow e selecione Salvar.

    Screenshot of renaming a dataflow option.

Orquestrar um pipeline de dados

Usando pipelines, primeiro orquestramos a atualização do nosso fluxo de dados. Se ocorrer um erro, enviamos um email personalizado do Outlook que inclui detalhes importantes.

  1. Selecione o item Lakehouse denominado SalesLakehouse no seu espaço de trabalho.

    Screenshot of renaming an existing dataflow.

  2. Quando você estiver no editor do Lakehouse, selecione Novo pipeline de dados.

    Observação

    Você também pode selecionar Obter dados da faixa de opções e, em seguida, Novo pipeline de dados .

    Screenshot of watermarks in the Lakehouse editor.

  3. Defina o nome do pipeline para SalesPipeline. Em seguida, selecione Criar.

    Screenshot of the pipeline name menu option.

  4. Feche o assistente Copiar dados selecionando Cancelar. Se você for solicitado a confirmar a saída da janela de cópia de dados, selecione Sim, cancelar.

    Screenshot of the copy data assistant menu.

  5. Quando estiver no editor de pipeline, selecione Adicionar atividade de pipeline e, em seguida, selecione Fluxo de dados.

    Observação

    Você também pode selecionar Fluxo de Dados na faixa de opções.

    Screenshot of the pipeline watermark canvas and the add activity option.

  6. Selecione a atividade de fluxo de dados no editor de pipeline e altere o valor de Nome para OnlineSalesActivity na seção Geral.

    Screenshot of the dataflow name value.

  7. Com a atividade de fluxo de dados ainda selecionada, selecione Configurações e escolha OnlineSalesDataflow na lista Fluxo de Dados. Se necessário para atualizar a lista, selecione o ícone Atualizar.

    Screenshot of the dataflow selection setting.

  8. Selecione a guia Atividades e, em seguida, a atividade Office 365 Outlook.

    Observação

    Se uma janela Dar Consentimento aparecer, selecione Ok, entre com sua conta organizacional e selecione Permitir acesso.

    Screenshot of the Office365 Outlook activity information.

  9. Selecione a atividade Office365 Outlook no editor de pipeline e altere o valor Name para Email em caso de falha na seção General.

    Screenshot of the Office365 Outlook activity name.

  10. Com a atividade do Office 365 Outlook ainda selecionada, selecione Configurações. Atualize o campo Para do seu endereço de email e o Assunto para Falha no pipeline. Selecione Adicionar conteúdo dinâmico [Alt+Shift+D] para o corpo do email.

    Observação

    Mais opções de configuração de email, como De (Enviar como), Cc, Cco, rótulo de confidencialidade e muito mais, estão disponíveis nas Propriedades avançadas.

    Screenshot of the Office365 Outlook settings.

  11. No Construtor de expressões de pipeline, cole o seguinte bloco de códigos de expressão:

    @concat(
        'Pipeline: '
        , 
        , '<br>'
        , 'Workspace: '
        , 
        , '<br>'
        , 'Time: '
        , 
    )
    

    Screenshot of the Office365 Outlook activity with expression builder.

  12. Selecione Variáveis do sistema e insira as seguintes variáveis selecionando o nome correspondente na tabela a seguir.

    Nome do valor Linha Variável do sistema
    Pipeline: 3 ID do pipeline
    Workspace: 6 ID do workspace

    Screenshot of the pipeline system variables.

  13. Selecione Funções e insira a função a seguir selecionando o nome correspondente na tabela a seguir. Depois de concluído, selecione OK.

    Nome do valor Linha Variável do sistema
    Time: 9 utcnow

    Screenshot of pipeline functions.

  14. Selecione OnlineSalesActivity e, nas opções de caminho disponíveis, selecione e segure o "X" (Em caso de falha) para criar uma seta que será lançada na atividade Email em caso de falha. Esta atividade será agora invocada se a OnlineSalesActivity falhar.

    Screenshot of the on failure path.

  15. Na guia Início, selecione Agendar. Depois de atualizar as seguintes configurações, selecione Aplicar para salvar as alterações.

    Nome Valor
    Execução agendada Ativado
    Repetir Diariamente
    Hora 12h00

    Screenshot of on failure branch.

  16. Na guia Início, selecione Executar. Se uma janela de diálogo for exibida, selecione a opção Salvar e executar para continuar.

    Screenshot of the run option from the home tab.

    Para monitorar o status atual do pipeline, você pode exibir a tabela Saída, que exibe o progresso da atividade atual. A tabela será atualizada periodicamente por conta própria ou você pode selecionar manualmente o ícone de atualização para atualizá-la.

    Screenshot of the current pipeline activity progress.

  17. Quando o status retornar Bem-sucedido, você poderá prosseguir para a próxima seção do tutorial retornando ao seu espaço de trabalho.

    Screenshot of the side rail with workspace selection.

Criar um modelo semântico no Lakehouse

Os dados que você carregou estão quase prontos para o relatório. Vamos primeiro usar o ponto de extremidade do SQL para criar relacionamentos e exibições do SQL no nosso lakehouse. Isso nos permite acessar facilmente nossos dados em um modelo semântico, que é um modelo de metadados que contém objetos físicos do banco de dados que são abstraídos e modificados em dimensões lógicas. Ele foi projetado para apresentar dados para análise de acordo com a estrutura do negócio.

Criar relações

Este modelo é um esquema de estrelas que você pode ver em data warehouses: ele se assemelha a uma estrela. O centro da estrela é uma tabela Fact. As tabelas ao redor são chamadas de tabelas Dimension, que estão relacionadas à tabela Fact com relações.


  1. No modo de exibição do espaço de trabalho, selecione o item Ponto de extremidade do SQL denominado SalesLakehouse .

    Screenshot of the SQL endpoint item in a workspace.

  2. Uma vez no Explorer, selecione o modo de exibição Modelo na parte inferior da tela para começar a criar relacionamentos.

    Screenshot of the Model view selection.

  3. Crie um relacionamento arrastando e soltando a coluna CustomerKey da tabela FactOnlineSales para a CustomerKey na tabela DimCustomer.

  4. Uma vez na janela Criar Relacionamento, verifique se você selecionou as tabelas, colunas e configurações corretas, como mostrado na tabela a seguir. Selecione Confirmar para continuar.

    Ativar esta relação De: tabela 1 (coluna) Para: tabela 2 (coluna) Cardinalidade Direção do filtro cruzado
    FactOnlineSales (CustomerKey) DimCustomer (CustomerKey) Muitos para um (*:1) Single

    Screenshot of Relationship between the FactOnlineSales and DimCustomer table.

  5. Execute essas mesmas etapas para cada uma das tabelas e colunas restantes listadas na tabela a seguir para criar relacionamentos.

    Ativar esta relação De: tabela 1 (coluna) Para: tabela 2 (coluna) Cardinalidade Direção do filtro cruzado
    FactOnlineSales (ProductKey) DimProduct (ProductKey) Muitos para um (*:1) Single
    FactOnlineSales (StoreKey) DimStore (StoreKey) Muitos para um (*:1) Single
    FactOnlineSales (DateKey) DimDate (DateKey) Muitos para um (*:1) Single
    DimStore (StoreKey) DimEmployee (StoreKey) Muitos para um (*:1) Ambos

    A imagem a seguir mostra uma exibição finalizada do modelo semântico com todas as relações criadas incluídas.

    Screenshot of table relationships in the model view pane.

Escrever uma medida em DAX

Vamos escrever uma medida básica que calcula o valor total das vendas.

  1. Selecione a tabela FactOnlineSales na pasta Tabelas. Na guia Início, selecione Nova medida.

    Screenshot of table relationships in the model view.

  2. No editor de fórmulas, copie e cole ou digite a seguinte medida para calcular o valor total das vendas. Selecione a marca de seleção para confirmar.

    Total Sales Amount = SUM(FactOnlineSales[SalesAmount])
    

    Screenshot of Select the check mark to commit a DAX measure.

Criar um modo de exibição SQL

Vamos escrever uma instrução SQL que calcule o valor total de vendas por mês. Em seguida, salvaremos essa instrução como uma exibição em nosso lakehouse. Isso nos permitirá acessar facilmente o valor total das vendas por mês no futuro.

  1. Na guia Início, selecione Nova consulta SQL .

    Screenshot of New SQL query from the home tab.

  2. No editor de consultas, copie e cole ou digite a consulta abaixo para calcular o valor total das vendas por número de meses em ordem decrescente. Uma vez inserido, selecione Executar para exibir os resultados.

    SELECT 
    MONTH(DateKey) as "MonthNumber",
    SUM(SalesAmount) as "TotalSalesAmount"
    FROM FactOnlineSales
    GROUP BY MONTH(DateKey)
    

    Screenshot of SQL query editor.

  3. Destaque o texto completo da consulta e selecione Salvar como modo de exibição.

    Screenshot of Save as view option.

  4. Na janela Salvar como exibição, defina o Nome da exibição como TotalSalesByMonth e selecione OK.

    Screenshot of Save as view window.

  5. No Explorer, expanda a seção Exibições e selecione TotalSalesByMonth para exibir os resultados na Pré-visualização de dados.

    Screenshot of Views with the Lakehouse explorer.

    Quando você terminar de explorar o editor de pontos de extremidade do SQL, poderá prosseguir para a próxima seção do tutorial retornando ao seu espaço de trabalho.

    Screenshot of the side rail and selection of the workspace.

Criar automaticamente um relatório

Agora que você modelou seus dados, é hora de visualizá-los e explorá-los usando a criação rápida.


  1. No modo de exibição do espaço de trabalho, passe o mouse acima do tipo de item Conjunto de Dados (padrão) e do nome do item SalesLakehouse. Selecione as elipses ( … ) e escolha Criar relatório automaticamente .

    Screenshot of the Autocreate report option with a workspace.

    Um relatório é gerado automaticamente para você e atualizado dinamicamente com base nas seleções de colunas no painel Seus dados.

    • O relatório exibido pode ser diferente da imagem abaixo.

    Screenshot of the finished Auto-create report.

  2. Selecione Salvar na faixa de opções para salvar uma cópia no espaço de trabalho atual

    • Para inserir a experiência completa de criação visual, você pode selecionar Editar na faixa de opções.

    Screenshot of the Save button when visualizing data.

  3. Na caixa de diálogo Salvar seu relatório, digite Resumo de vendas no campo Inserir um nome para o seu relatório. Selecione Salvar depois de concluído.

    Screenshot of the Save button completing its process when visualizing data.

Você pode saber mais sobre a criação rápida.

Parabéns por concluir o tutorial! Se você criou um espaço de trabalho para o tutorial, poderá optar por excluí-lo agora. Como alternativa, você pode remover os itens individuais criados durante o tutorial.

Esperamos que este tutorial tenha mostrado como os usuários do Power BI podem facilmente fornecer informações sobre dados em qualquer nível de escala com o Microsoft Fabric.