Partilhar via


Guia de início rápido: introdução ao Azure Data Factory

APLICA-SE A: Azure Data Factory Azure Synapse Analytics

Gorjeta

Experimente o Data Factory no Microsoft Fabric, uma solução de análise tudo-em-um para empresas. O Microsoft Fabric abrange tudo, desde a movimentação de dados até ciência de dados, análises em tempo real, business intelligence e relatórios. Saiba como iniciar uma nova avaliação gratuitamente!

Bem-vindo ao Azure Data Factory! Este artigo de introdução permitirá que você crie seu primeiro data factory e pipeline em 5 minutos. O modelo ARM abaixo criará e configurará tudo o que você precisa para experimentá-lo. Em seguida, você só precisa navegar até o data factory de demonstração e fazer mais um clique para acionar o pipeline, que move alguns dados de exemplo de um armazenamento de blob do Azure para outro.

Pré-requisitos

Se não tiver uma subscrição do Azure, crie uma conta gratuita antes de começar.

Resumo do vídeo

O vídeo a seguir fornece um passo a passo do exemplo:

Experimente a sua primeira demonstração com um clique

Em seu primeiro cenário de demonstração, você usará a atividade Copiar em uma fábrica de dados para copiar um blob do Azure chamado moviesDB2.csv de uma pasta de entrada em um Armazenamento de Blobs do Azure para uma pasta de saída. Em um cenário do mundo real, essa operação de cópia pode estar entre qualquer uma das muitas fontes de dados suportadas e coletores disponíveis no serviço. Também pode envolver transformações nos dados.

Experimente agora com um clique! Depois de clicar no botão abaixo, os seguintes objetos serão criados no Azure:

  • Uma conta de fábrica de dados
  • Um pipeline dentro do data factory com uma atividade de cópia
  • Um armazenamento de blob do Azure com moviesDB2.csv carregado em uma pasta de entrada como origem
  • Um serviço vinculado para conectar a fábrica de dados ao armazenamento de blob do Azure

Passo 1: Clique no botão para iniciar

Selecione o botão abaixo para experimentar! (Se você já clicou no acima, não precisa fazê-lo novamente.)

Experimente a sua primeira demonstração de fábrica de dados

Você será redirecionado para a página de configuração mostrada na imagem abaixo para implantar o modelo. Aqui, você só precisa criar um novo grupo de recursos. (Você pode deixar todos os outros valores com seus padrões.) Em seguida, clique em Rever + criar e clique em Criar para implementar os recursos.

Nota

O usuário que implanta o modelo precisa atribuir uma função a uma identidade gerenciada. Isso requer permissões que podem ser concedidas por meio das funções Proprietário, Administrador de Acesso de Usuário ou Operador de Identidade Gerenciada.

Todos os recursos mencionados acima serão criados no novo grupo de recursos, para que você possa limpá-los facilmente depois de tentar a demonstração.

Uma captura de tela da caixa de diálogo de criação do modelo de implantação.

Etapa 2: Revisar os recursos implantados

  1. Selecione Ir para o grupo de recursos após a conclusão da implantação. Uma captura de tela da página de implantação concluída no portal do Azure após a implantação bem-sucedida do modelo.

  2. No grupo de recursos, você verá o novo data factory, a conta de armazenamento de blob do Azure e a identidade gerenciada que foram criadas pela implantação. Uma captura de tela do conteúdo do grupo de recursos criado para a demonstração.

  3. Selecione o data factory no grupo de recursos para exibi-lo. Em seguida, selecione o botão Iniciar estúdio para continuar. Uma captura de tela do portal do Azure na página de fábrica de dados recém-criada, destacando o local do botão Abrir o Azure Data Factory Studio.

  4. Selecione na guia Guia Autor Autor e, em seguida, o Pipeline criado pelo modelo. Em seguida, verifique os dados de origem selecionando Abrir.

    Captura de tela do Azure Data Factory Studio mostrando o pipeline criado pelo modelo.

  5. No conjunto de dados de origem que você verá, selecione Procurar e anote o arquivo moviesDB2.csv, que já foi carregado na pasta de entrada.

    Captura de tela do conjunto de dados de origem destacando o botão Procurar, onde o usuário pode ver o arquivo de entrada criado para a demonstração.

    Captura de tela do conteúdo da pasta de entrada mostrando o arquivo de moviesDB2.csv usado na demonstração.

Etapa 3: acionar o pipeline de demonstração para ser executado

  1. Selecione Adicionar gatilho e, em seguida , Acionar agora. Captura de tela do botão Gatilho Agora para o pipeline na demonstração.
  2. No painel direito, em Execução de pipeline, selecione OK.

Monitorizar o pipeline

  1. Selecione a guia Separador MonitorizaçãoMonitor .

  2. Você pode ver uma visão geral das execuções do pipeline na guia Monitor, como hora de início da execução, status, etc.

    Captura de ecrã do separador de monitorização da fábrica de dados.

  3. Neste início rápido, o pipeline tem apenas um tipo de atividade: Copiar. Clique no nome do pipeline e você pode ver os detalhes dos resultados de execução da atividade de cópia.

    Captura de tela dos resultados de execução de uma atividade de cópia na guia de monitoramento do data factory.

  4. Clique nos detalhes e o processo de cópia detalhado é exibido. A partir dos resultados, os dados lidos e gravados são os mesmos, e 1 arquivo foi lido e gravado, o que também prova que todos os dados foram copiados com sucesso para o destino.

    Captura de ecrã dos resultados detalhados da execução da atividade de cópia.

Clean up resources (Limpar recursos)

Você pode limpar todos os recursos criados neste início rápido de duas maneiras. Você pode excluir todo o grupo de recursos do Azure, que inclui todos os recursos criados nele. Ou, se quiser manter alguns recursos intactos, navegue até o grupo de recursos e exclua apenas os recursos específicos desejados, mantendo os outros. Por exemplo, se você estiver usando esse modelo para criar uma fábrica de dados para uso em outro tutorial, poderá excluir os outros recursos, mas manter apenas a fábrica de dados.

Neste início rápido, você criou um Azure Data Factory contendo um pipeline com uma atividade de cópia. Para saber mais sobre o Azure Data Factory, continue no artigo e no módulo Aprenda abaixo.