Quickstart: Utilize a ferramenta de dados de cópia no Azure Data Factory Studio para copiar dados

APLICA-SE A: Azure Data Factory Azure Synapse Analytics

Neste início rápido, utilizará a ferramenta Dados de Cópia para criar um pipeline que copia dados da pasta de origem no armazenamento Azure Blob para a pasta alvo.

Pré-requisitos

Subscrição do Azure

Se não tiver uma subscrição do Azure, crie uma conta gratuita antes de começar.

Preparar dados de origem em Armazenamento de Blobs do Azure

Selecione o botão abaixo para experimentá-lo!

Experimente a sua primeira demonstração de fábrica de dados

Será redirecionado para a página de configuração mostrada na imagem abaixo para implementar o modelo. Aqui, só precisa de criar um novo grupo de recursos. (Pode deixar todos os outros valores com os seus incumprimentos.) Em seguida, clique em Rever + criar e clicar Criar para implementar os recursos.

Nota

O utilizador que implementa o modelo precisa de atribuir uma função a uma identidade gerida. Isto requer permissões que podem ser concedidas através das funções de Proprietário, Administrador de Acesso ao Utilizador ou Operador de Identidade Gerido.

Uma nova conta de armazenamento blob será criada no novo grupo de recursos, e o ficheiro moviesDB2.csv será armazenado numa pasta chamada entrada no armazenamento do blob.

Uma imagem do diálogo de criação do modelo de implementação.

Criar uma fábrica de dados

Pode utilizar a sua fábrica de dados existente ou criar uma nova, como descrito no Quickstart: Criar uma fábrica de dados utilizando o portal do Azure.

Utilize a ferramenta de dados de cópia para copiar dados

Os passos abaixo irão acompanhá-lo através de como copiar facilmente dados com a ferramenta de dados de cópia em Azure Data Factory.

Passo 1: Iniciar a ferramenta de dados de cópia

  1. Na página inicial do Azure Data Factory, selecione o azulejo Ingeste para iniciar a ferramenta Dados de Cópia.

    Screenshot que mostra a página inicial Azure Data Factory.

  2. Na página Propriedades da ferramenta Dados de Cópia, escolha a tarefa de cópia incorporada no tipo de Tarefa e, em seguida, selecione Seguinte.

    Screenshot que mostra a página Propriedades.

Passo 2: Configuração completa da fonte

  1. Clique + Crie uma nova ligação para adicionar uma ligação.

  2. Selecione o tipo de serviço ligado que pretende criar para a ligação de origem. Neste tutorial, usamos Armazenamento de Blobs do Azure. Selecione-o na galeria e, em seguida, selecione Continue.

    Screenshot que mostra o diálogo Select Blob.

  3. Na página Nova ligação (Armazenamento de Blobs do Azure), especifique um nome para a sua ligação. Selecione a subscrição do Azure a partir da lista de subscrições do Azure e da sua conta de armazenamento na lista de nomes da conta de Armazenamento , na ligação de teste e, em seguida, selecione Criar.

    Screenshot que mostra onde configurar a conta de armazenamento Azure Blob.

  4. Selecione a ligação recém-criada no bloco De Ligação .

  5. Na secção Ficheiro ou pasta , selecione Navegar para a pasta adftutorial/entrada , selecione o ficheiro emp.txt e, em seguida, clique em OK.

  6. Selecione a caixa de verificação de cópia Binary para copiar o ficheiro como está e, em seguida, selecione Seguinte.

    Screenshot que mostra a página da loja de dados Source.

Passo 3: Configuração completa do destino

  1. Selecione a ligação AzureBlobStorage que criou no bloco De Ligação .

  2. Na secção caminho da pasta , introduza adftutorial/saída para o caminho da pasta.

    Screenshot que mostra a página da loja de dados destino.

  3. Deixe outras definições como padrão e, em seguida, selecione Seguinte.

Passo 4: Rever todas as definições e implantação

  1. Na página Definições, especifique um nome para o pipeline e a sua descrição e, em seguida, selecione Seguinte para utilizar outras configurações padrão.

    Screenshot que mostra a página de definições.

  2. Reveja todas as definições na página Resumo e selecione Seguinte.

  3. Na página Implementação concluída, selecione Monitorização para monitorizar o pipeline que criou.

    Screenshot que mostra a página completa de Implementação.

Passo 5: Monitorizar os resultados de funcionamento

  1. A aplicação muda para o separador Monitor . Vê o estado do oleoduto nesta conta. Selecione Refresh para refrescar a lista. Clique no link no nome Pipeline para ver detalhes de execução de atividade ou reexame o pipeline.

    Screenshot que mostra o botão do gasoduto de atualização.

  2. Na página 'Atividade' executa, selecione o link Detalhes (ícone de óculos) na coluna 'Nome 'Atividade' , para obter mais detalhes sobre a operação de cópia. Para obter os detalhes das propriedades, veja Copy Activity overview (Descrição geral da Atividade Copy).

Passos seguintes

O pipeline neste exemplo copia dados de uma localização para outra localização num armazenamento de Blobs do Azure. Para saber como utilizar o Data Factory em mais cenários, aceda aos tutoriais.