Carregar dados do Microsoft 365 (Office 365) usando o Azure Data Factory

APLICA-SE A: Azure Data Factory Azure Synapse Analytics

Gorjeta

Experimente o Data Factory no Microsoft Fabric, uma solução de análise tudo-em-um para empresas. O Microsoft Fabric abrange tudo, desde a movimentação de dados até ciência de dados, análises em tempo real, business intelligence e relatórios. Saiba como iniciar uma nova avaliação gratuitamente!

Este artigo mostra como usar os dados de carregamento do Data Factory do Microsoft 365 (Office 365) no armazenamento de Blob do Azure. Você pode seguir etapas semelhantes para copiar dados para o Azure Data Lake Gen1 ou Gen2. Consulte o artigo do conector do Microsoft 365 (Office 365) sobre como copiar dados do Microsoft 365 (Office 365) em geral.

Criar uma fábrica de dados

  1. Se você ainda não criou sua fábrica de dados, siga as etapas em Guia de início rápido: criar uma fábrica de dados usando o portal do Azure e o Azure Data Factory Studio para criar uma. Depois de criá-lo, navegue até o data factory no portal do Azure.

    Home page for the Azure Data Factory, with the Open Azure Data Factory Studio tile.

  2. Selecione Abrir no bloco Abrir o Azure Data Factory Studio para iniciar o aplicativo Integração de Dados em uma guia separada.

Criar um pipeline

  1. Na página inicial, selecione Orquestrar.

    Screenshot that shows the ADF home page.

  2. Na guia Geral do pipeline, digite "CopyPipeline" para Nome do pipeline.

  3. Na caixa de ferramentas Atividades, categoria Mover ou Transformar>, arraste e solte a atividade Copiar da caixa > de ferramentas para a superfície do designer de pipeline. Especifique "CopyFromOffice365ToBlob" como nome da atividade.

Nota

Use o tempo de execução de integração do Azure nos serviços vinculados de origem e coletor. Não há suporte para o tempo de execução de integração auto-hospedado e o tempo de execução de integração de rede virtual gerenciado.

Configurar origem

  1. Vá para a guia Origem do pipeline>, selecione + Novo para criar um conjunto de dados de origem.

  2. Na janela Novo Conjunto de Dados, selecione Microsoft 365 (Office 365) e, em seguida, selecione Continuar.

  3. Agora você está na guia de configuração da atividade de cópia. Selecione no botão Editar ao lado do conjunto de dados do Microsoft 365 (Office 365) para continuar a configuração de dados.

    Config Microsoft 365 (Office 365) dataset general.

  4. Você verá uma nova guia aberta para o conjunto de dados do Microsoft 365 (Office 365). Na guia Geral na parte inferior da janela Propriedades, digite "SourceOffice365Dataset" para Nome.

  5. Vá para a guia Conexão da janela Propriedades. Ao lado da caixa de texto Serviço vinculado, selecione + Novo.

  6. Na janela Novo Serviço Vinculado, digite "Office365LinkedService" como nome, insira a ID da entidade de serviço e a chave da entidade de serviço, teste a conexão e selecione Criar para implantar o serviço vinculado.

    New Microsoft 365 (Office 365) linked service.

  7. Depois de criar o serviço ligado, volta às definições do conjunto de dados. Ao lado de Tabela, escolha a seta para baixo para expandir a lista de conjuntos de dados disponíveis do Microsoft 365 (Office 365) e escolha "BasicDataSet_v0. Message_v0" da lista suspensa:

    Config Microsoft 365 (Office 365) dataset table.

  8. Agora volte para a guia Origem do pipeline>para continuar configurando propriedades adicionais para a extração de dados do Microsoft 365 (Office 365). Escopo do usuário e filtro de escopo do usuário são predicados opcionais que você pode definir para restringir os dados que deseja extrair do Microsoft 365 (Office 365). Consulte a seção Propriedades do conjunto de dados do Microsoft 365 (Office 365) para saber como você define essas configurações.

  9. É necessário escolher um dos filtros de data e fornecer os valores de hora de início e hora de término.

  10. Selecione na guia Importar esquema para importar o esquema para o conjunto de dados Mensagem.

    Config Microsoft 365 (Office 365) dataset schema.

Configurar sink

  1. Vá para a guia Coletor de pipeline >e selecione + Novo para criar um conjunto de dados de coletor.

  2. Na janela Novo Conjunto de Dados, observe que somente os destinos suportados são selecionados ao copiar do Microsoft 365 (Office 365). Selecione Armazenamento de Blobs do Azure, selecione Formato binário e selecione Continuar. Neste tutorial, você copia dados do Microsoft 365 (Office 365) em um Armazenamento de Blob do Azure.

  3. Selecione o botão Editar ao lado do conjunto de dados do Armazenamento de Blob do Azure para continuar a configuração de dados.

  4. Na guia Geral da janela Propriedades, em Nome, digite "OutputBlobDataset".

  5. Vá para a guia Conexão da janela Propriedades. Ao lado da caixa de texto Serviço vinculado, selecione + Novo.

  6. Na janela Novo Serviço Vinculado, digite "AzureStorageLinkedService" como nome, selecione "Entidade de Serviço" na lista suspensa de métodos de autenticação, preencha o Ponto de Extremidade de Serviço, o Locatário, a ID da entidade de serviço e a chave da entidade de serviço e selecione Salvar para implantar o serviço vinculado. Consulte aqui como configurar a autenticação da entidade de serviço para o Armazenamento de Blobs do Azure.

    New Blob linked service

Validar o pipeline

Para validar o pipeline, selecione Validar na barra de ferramentas.

Você também pode ver o código JSON associado ao pipeline clicando em Código no canto superior direito.

Publicar o pipeline

Na barra de ferramentas superior, selecione Publicar tudo. Esta ação publica as entidades (conjuntos de dados e pipeline) que criou no Data Factory.

Publish changes

Acionar o pipeline manualmente

Selecione Adicionar gatilho na barra de ferramentas e, em seguida, selecione Gatilho agora. Na página Execução do pipeline, selecione Concluir.

Monitorizar o pipeline

Vá para o separador Monitorizar, no lado esquerdo. Verá uma execução de pipeline que é acionada por um acionador manual. Pode utilizar as ligações na coluna Ações para ver os detalhes das atividades e para voltar a executar o pipeline.

Monitor pipeline

Para ver as execuções de atividade associadas à execução do pipeline, selecione o link Exibir execuções de atividade na coluna Ações. Neste exemplo, há apenas uma atividade, pelo que só vai ver uma entrada na lista. Para obter detalhes sobre a operação de cópia, selecione o link Detalhes (ícone de óculos) na coluna Ações.

Monitor activity

Se esta for a primeira vez que você está solicitando dados para este contexto (uma combinação de qual tabela de dados está sendo acessada, em qual conta de destino são os dados que estão sendo carregados e qual identidade de usuário está fazendo a solicitação de acesso a dados), você verá o status da atividade de cópia como Em andamento, e somente quando selecionar o link "Detalhes" em Ações verá o status como RequesetingConsent. Um membro do grupo de aprovadores de acesso a dados precisa aprovar a solicitação no Gerenciamento de Acesso Privilegiado antes que a extração de dados possa prosseguir.

Estado como requerente de consentimento:Activity execution details - request consent

Status como extração de dados:

Activity execution details - extract data

Uma vez que o consentimento é fornecido, a extração de dados continuará e, depois de algum tempo, a execução do pipeline será mostrada como bem-sucedida.

Monitor pipeline - succeeded

Agora vá para o Armazenamento de Blobs do Azure de destino e verifique se os dados do Microsoft 365 (Office 365) foram extraídos no formato binário.

Avance para o seguinte artigo para saber mais sobre o suporte do Azure Synapse Analytics: