Partilhar via


Introdução Rápida: Criar uma Tarefa de Cópia

Os trabalhos de cópia no Data Factory fazem ingestão de dados sem necessidade de criar um pipeline de dados do Fabric. Ele reúne vários padrões de cópia, como cópia em massa ou em lote, incremental ou contínua em uma experiência unificada. Se você só precisar copiar dados sem transformações, use um trabalho de cópia.

Este guia de início rápido guia o utilizador sobre como copiar dados incrementalmente de uma tabela do Fabric Warehouse para uma tabela do Fabric Lakehouse usando a tarefa de cópia.

Para obter mais informações sobre trabalhos de cópia em geral, consulte:

Pré-requisitos

Antes de começar, preencha estes pré-requisitos:

  • Um inquilino do Microsoft Fabric com uma assinatura ativa. Você pode criar uma conta gratuita.

  • Um espaço de trabalho do Microsoft Fabric..

  • Um armazém de tecidos.

  • Uma tabela no seu armazém de dados que inclui uma coluna incremental, como um timestamp ou uma coluna inteira crescente, que pode servir como indicador para deteção de alterações. Você também pode usar esse script para criar uma tabela Employee de exemplo:

    CREATE TABLE dbo.Employee 
    
    ( 
        EmployeeID INT NOT NULL, 
        FirstName VARCHAR(40), 
        LastName VARCHAR(40), 
        Position VARCHAR(60), 
        ModifiedDate DATETIME2(3) 
    ); 
    

    Inserir dados de exemplo:

    INSERT INTO dbo.Employee (EmployeeID, FirstName, LastName, Position, ModifiedDate) 
    VALUES  
    (1, 'Alice', 'Smith', 'Data Analyst', SYSDATETIME()), 
    (2, 'Bob', 'Johnson', 'Engineer', SYSDATETIME()), 
    (3, 'Carol', 'Lee', 'Manager', SYSDATETIME()), 
    (4, 'David', 'Wong', 'Data Scientist', SYSDATETIME()), 
    (5, 'Eve', 'Garcia', 'Product Owner', SYSDATETIME());
    

    Captura de tela da tabela de funcionários criada.

Criar um trabalho de duplicação

  1. No espaço de trabalho do Microsoft Fabric , selecione + Novo Item e, em Obter dados , escolha Copiar Trabalho.

    Captura de ecrã do espaço de trabalho Fabric com o botão de novo item selecionado e o trabalho de cópia realçado em obter dados.

  2. Nomeie seu trabalho de cópia e selecione Criar.

    Captura de tela do trabalho de cópia nomeado com o botão de criação realçado.

Configurar cópia incremental

  1. Na página Escolher fonte de dados do assistente de cópia de trabalho, selecione o seu Fabric Warehouse.

    Captura de ecrã da página de escolha da fonte de dados do assistente de criação de trabalho de cópia com um armazém selecionado.

  2. Na página Escolher dados , selecione a tabela Armazém de origem que inclui a coluna incremental. Selecione Seguinte.

    Captura de tela da página de dados de escolha com a tabela SQL do funcionário selecionada.

  3. Na página Escolher destino de dados, selecione Lakehouse em Novo item Fabric.

    Captura de tela da página de destino de dados escolhidos, com Lakehouse selecionado.

  4. Forneça um nome para o novo Lakehouse e selecione Criar e conectar.

    Captura de tela da janela de nomeação para o novo Lakehouse com criar e conectar selecionados.

  5. Na página Mapear para destino , escolha Tabelas, opcionalmente renomeie a tabela de destino e selecione Avançar.

    Captura de tela do mapa para a página de destino com a tabela de funcionários selecionada.

  6. Na etapa Configurações , escolha Cópia incremental como o modo Trabalho de cópia. Selecione a coluna que serve como coluna incremental. Para a tabela de exemplo, isso é ModifiedDate.

    Captura de tela da página de configurações com cópia incremental selecionada e a coluna incremental definida como ModifiedDate.

Executar e monitorizar o trabalho de cópia

  1. Na página Rever + guardar , verifique as suas definições. Deixe a opção padrão para Iniciar a transferência de dados imediatamente e, opcionalmente, defina a execução do trabalho Copiar a cada 1 minuto para um controle de alterações mais rápido.

  2. Salve o trabalho de cópia e inicie a primeira execução selecionando o botão Salvar + Executar .

    Captura de tela da página de revisão e salvamento, com as opções de execução definidas para serem executadas dentro do cronograma a cada um minuto.

  3. Depois de o artefacto do trabalho de cópia ser guardado com êxito, tem início a primeira execução para importar os dados iniciais da tabela de origem.

  4. Use o painel de Cópia de Trabalho ou o Hub de Monitorização para monitorizar o progresso. Saiba mais sobre como monitorar trabalhos de cópia.

    Captura de tela do hub de monitoramento, mostrando o trabalho bem-sucedido com cinco linhas lidas e cinco linhas escritas.

Simule alterações com novos dados

  1. Se você usou a tabela de exemplo, use a seguinte consulta SQL para inserir novas linhas na tabela Source Fabric Warehouse.

    INSERT INTO dbo.Employee (EmployeeID, FirstName, LastName, Position, ModifiedDate) VALUES (6, 'John', 'Miller', 'QA Engineer', SYSDATETIME()); 
    INSERT INTO dbo.Employee (EmployeeID, FirstName, LastName, Position, ModifiedDate) VALUES (7, 'Emily', 'Clark', 'Business Analyst', SYSDATETIME()); 
    INSERT INTO dbo.Employee (EmployeeID, FirstName, LastName, Position, ModifiedDate) VALUES (8, 'Michael', 'Brown', 'UX Designer', SYSDATETIME()); 
    
  2. O trabalho Copiar usa a coluna incremental para detetar essas linhas durante sua próxima execução agendada.

    Captura de tela da página de monitoramento mostrando o trabalho bem-sucedido com três linhas lidas e três linhas escritas.

  3. Após a próxima execução, verifique a tabela Fabric Lakehouse de destino para confirmar que a tabela foi transferida.

    Captura de tela da tabela Fabric Lakehouse, mostrando todas as linhas escritas na tabela.