Guia de início rápido: use a ferramenta de cópia de dados no Azure Data Factory Studio para copiar dados

APLICA-SE A: Azure Data Factory Azure Synapse Analytics

Gorjeta

Experimente o Data Factory no Microsoft Fabric, uma solução de análise tudo-em-um para empresas. O Microsoft Fabric abrange tudo, desde a movimentação de dados até ciência de dados, análises em tempo real, business intelligence e relatórios. Saiba como iniciar uma nova avaliação gratuitamente!

Neste início rápido, você usará a ferramenta Copiar Dados para criar um pipeline que copia dados da pasta de origem no armazenamento de Blob do Azure para a pasta de destino.

Pré-requisitos

Subscrição do Azure

Se não tiver uma subscrição do Azure, crie uma conta gratuita antes de começar.

Preparar dados de origem no Armazenamento de Blobs do Azure

Selecione o botão abaixo para experimentar!

Try your first data factory demo

Você será redirecionado para a página de configuração mostrada na imagem abaixo para implantar o modelo. Aqui, você só precisa criar um novo grupo de recursos. (Você pode deixar todos os outros valores com seus padrões.) Em seguida, clique em Rever + criar e clique em Criar para implementar os recursos.

Nota

O usuário que implanta o modelo precisa atribuir uma função a uma identidade gerenciada. Isso requer permissões que podem ser concedidas por meio das funções Proprietário, Administrador de Acesso de Usuário ou Operador de Identidade Gerenciada.

Uma nova conta de armazenamento de blob será criada no novo grupo de recursos e o arquivo moviesDB2.csv será armazenado em uma pasta chamada input no armazenamento de blob.

A screenshot of the deployment template creation dialog.

Criar uma fábrica de dados

Você pode usar sua fábrica de dados existente ou criar uma nova, conforme descrito em Guia de início rápido: criar uma fábrica de dados usando o portal do Azure.

Use a ferramenta Copiar dados para copiar dados

As etapas abaixo orientarão você sobre como copiar dados facilmente com a ferramenta de cópia de dados no Azure Data Factory.

Etapa 1: Iniciar a ferramenta de cópia de dados

  1. Na home page do Azure Data Factory, selecione o bloco Ingest para iniciar a ferramenta Copiar Dados.

    Screenshot that shows the Azure Data Factory home page.

  2. Na página Propriedades da ferramenta Copiar Dados, escolha Tarefa de cópia interna em Tipo de tarefa e selecione Avançar.

    Screenshot that shows the Properties page.

Etapa 2: Concluir a configuração do código-fonte

  1. Clique em + Criar nova ligação para adicionar uma ligação.

  2. Selecione o tipo de serviço vinculado que você deseja criar para a conexão de origem. Neste tutorial, usamos o Armazenamento de Blobs do Azure. Selecione-o na galeria e, em seguida, selecione Continuar.

    Screenshot that shows the Select Blob dialog.

  3. Na página Nova conexão (Armazenamento de Blobs do Azure), especifique um nome para sua conexão. Selecione sua assinatura do Azure na lista de assinaturas do Azure e sua conta de armazenamento na lista Nome da conta de armazenamento, teste a conexão e selecione Criar.

    Screenshot that shows where to configure the Azure Blob storage account.

  4. Selecione a conexão recém-criada no bloco Conexão .

  5. Na seção Arquivo ou pasta, selecione Procurar para navegar até a pasta adftutorial/entrada, selecione o arquivo emp.txt e clique em OK.

  6. Marque a caixa de seleção Cópia binária para copiar o arquivo no estado em que se encontra e selecione Avançar.

    Screenshot that shows the Source data store page.

Etapa 3: Concluir a configuração do destino

  1. Selecione a conexão AzureBlobStorage que você criou no bloco Conexão .

  2. Na seção Caminho da pasta, insira adftutorial/output para o caminho da pasta.

    Screenshot that shows the Destination data store page.

  3. Deixe outras configurações como padrão e selecione Avançar.

Etapa 4: Revisar todas as configurações e implantação

  1. Na página Configurações, especifique um nome para o pipeline e sua descrição e selecione Avançar para usar outras configurações padrão.

    Screenshot that shows the settings page.

  2. Reveja todas as definições na página Resumo e selecione Seguinte.

  3. Na página Implementação concluída, selecione Monitorização para monitorizar o pipeline que criou.

    Screenshot that shows the Deployment complete page.

Etapa 5: Monitorar os resultados da execução

  1. O aplicativo alterna para a guia Monitor . Você vê o status do pipeline nesta guia. Selecione Atualizar para atualizar a lista. Clique no link em Nome do pipeline para exibir os detalhes da execução da atividade ou executar novamente o pipeline .

    Screenshot that shows the refresh pipeline button.

  2. Na página Execuções de atividade, selecione o link Detalhes (ícone de óculos) na coluna Nome da atividade para obter mais detalhes sobre a operação de cópia. Para obter os detalhes das propriedades, veja Copy Activity overview (Descrição geral da Atividade Copy).

O pipeline neste exemplo copia dados de uma localização para outra localização num armazenamento de Blobs do Azure. Para saber como utilizar o Data Factory em mais cenários, aceda aos tutoriais.