Compartilhar via


Copiar de Armazenamento de Blobs do Azure para Lakehouse

Neste tutorial, você criará um pipeline de dados para mover um arquivo CSV de uma pasta de entrada de uma fonte de Armazenamento de Blobs do Azure para um destino do lakehouse.

Pré-requisitos

Para começar, você deve concluir os seguintes pré-requisitos:

  • Verifique se você tem um espaço de trabalho habilitado para o Project Microsoft Fabric: Criar um espaço de trabalho.

  • Selecione o botão Experimentar agora! para preparar a fonte de dados do Armazenamento de Blobs do Azure da cópia. Crie um novo grupo de recursos para este Armazenamento de Blobs do Azure e selecione Examinar + Criar>Criar.

    Experimente sua primeira demonstração do data factory

    Captura de tela da tela de detalhes do projeto.

    Em seguida, um Armazenamento de Blobs do Azure é criado e moviesDB2.csv é carregado na pasta de entrada do Armazenamento de Blobs do Azure criado.

    Captura de tela mostrando onde o novo armazenamento aparece na pasta.

Criar um pipeline de dados

  1. Alterne para Data factory na página app.powerbi.com.

    Captura de tela do menu no qual a opção Data Factory é exibida.

  2. Crie um novo espaço de trabalho para essa demonstração.

    Captura de tela da tela do espaço de trabalho.

  3. Selecione Novo e, em seguida, selecione Pipeline de dados.

    Captura de tela do menu Novo.

Copiar dados usando o Assistente de Cópia

Nesta sessão, você começará a criar um pipeline de dados usando as etapas a seguir. Essas etapas copiam um arquivo CSV de uma pasta de entrada de um Armazenamento de Blobs do Azure para um destino lakehouse usando a cópia assistente.

Etapa 1: Começar com a cópia assistente

  1. Selecione Assistente de cópia de dados na tela para abrir a ferramenta de assistente de cópia para começar. Ou selecione Usar o assistente de cópia na lista suspensa Copiar dados na guia Atividades da faixa de opções.

    Captura de tela de duas opções para selecionar o assistente de cópia.

Etapa 2: Configure sua fonte

  1. Digite blob no filtro de seleção, selecione Blobs do Azure e selecione Avançar.

    Captura de tela mostrando onde escolher o Armazenamento de Blobs do Azure como fonte de dados.

  2. Forneça o nome da conta ou URL e crie uma conexão com sua fonte de dados selecionando Criar nova conexão na lista suspensa Conexão.

    Captura de tela mostrando onde selecionar uma Nova conexão.

    1. Depois de selecionar Criar nova conexão com a conta de armazenamento especificada, você só precisará preencher o Tipo de autenticação. Nesta demonstração, escolheremos Chave de conta, mas você poderá escolher outro Tipo de autenticação de acordo com suas preferências.

      Captura de tela mostrando a tela Conectar à fonte de dados do assistente de cópia de dados.

    2. Depois que a conexão for criada com êxito, você só precisará selecionar Avançar para Conectar à fonte de dados.

  3. Escolha o arquivo moviesDB2.csv na configuração de origem a ser visualizada e selecione Avançar.

    Captura de tela mostrando como escolher a fonte de dados.

Etapa 3: Configure seu destino

  1. Selecione Lakehouse.

    Captura de tela mostrando a caixa de diálogo Escolher destino de dados com Lakehouse selecionado.

  2. Forneça um nome para o novo Lakehouse. Em seguida, selecione Criar e conectar.

    Captura de tela mostrando a caixa de diálogo Escolher destino dos dados com a nova opção lakehouse selecionada.

  3. Configure e mapeie seus dados de origem para seu destino; em seguida, selecione Avançar para concluir as configurações de destino.

    Captura de tela mostrando a caixa de diálogo Conectar ao destino de dados no assistente de cópia de dados com o nome da tabela MoviesDB preenchido.

Etapa 4: Examinar e criar sua atividade Copy

  1. Examine as configurações da atividade Copy nas etapas anteriores e selecione Salvar + executar para concluir. Ou você pode voltar às etapas anteriores para editar suas configurações, se necessário, na ferramenta.

    Captura de tela mostrando a tela Revisar + criar na caixa de diálogo Assistente de cópia de dados.

  2. Depois de concluída, a atividade Copy é adicionada à tela do pipeline de dados e executada diretamente se você deixou a caixa de seleção Iniciar transferência de dados imediatamente marcada.

    Captura de tela mostrando a atividade Copy concluída.

Executar e agendar seu pipeline de dados

  1. Se você não deixou a caixa de seleção Iniciar transferência de dados imediatamente selecionada na página Revisar + criar, alterne para a guia Início e selecione Executar. Em seguida, selecione Salvar e executar.

    Captura de tela mostrando o botão Executar da atividade Copy na guia Início.

    Captura de tela mostrando a caixa de diálogo Salvar e executar para a atividade Copy.

  2. Na guia Saída, selecione o link com o nome da atividade Copy para monitorar o progresso e verificar os resultados da execução.

    Captura de tela mostrando o botão Detalhes da execução.

  3. A caixa de diálogo Detalhes da cópia dos dados exibe os resultados da execução, incluindo status, volume de dados lidos e gravados, horários de início e parada e duração.

    Captura de tela mostrando a caixa de diálogo Copiar detalhes dos dados.

  4. Você também pode agendar o pipeline para ser executado com uma frequência específica, conforme necessário. O exemplo a seguir mostra como agendar a execução do pipeline a cada 15 minutos.

    Captura de tela mostrando a caixa de diálogo de configuração de agendamento.

    Captura de tela mostrando um pipeline com uma programação configurada para execução a cada 15 minutos.

O pipeline neste exemplo mostra como copiar dados de Armazenamento de Blobs do Azure para o Lakehouse. Você aprendeu a:

  • Crie um pipeline de dados.
  • Copiar dados com o Assistente de Cópia.
  • Execute e agende seu pipeline de dados.

Em seguida, avance para saber mais sobre como monitorar suas execuções de pipeline.