Perguntas frequentes sobre a Conexão de Dados do Microsoft Graph

O Data Connect do Microsoft Graph permite que os desenvolvedores criem aplicativos que os clientes podem fornecer acesso gerenciado a seus conjuntos de dados em escala do Microsoft Graph. Este artigo fornece dicas que ajudarão você a aproveitar o recurso do Microsoft Graph Data Connect. Para obter uma introdução ao Data Connect do Microsoft Graph, consulte a visão geral.

Para obter mais perguntas, confira solução de problemas ou entre em contato com a equipe do Data Connect.

A Conexão de Dados do Microsoft Graph é adequada para mim?

As APIs do Microsoft Graph Data Connect e do Microsoft Graph fornecem acesso aos mesmos dados subjacentes, mas de maneiras muito diferentes. O Microsoft Graph Data Connect foi projetado para extrair grandes quantidades de conjuntos de dados em massa, escalonáveis para toda a sua organização; enquanto as APIs do Microsoft Graph são adequadas para acessar uma pequena quantidade de dados de usuários e grupos selecionados em sua organização.

Por exemplo, você pode querer usar o Microsoft Graph Data Connect para fazer uma extração inicial do último ano de dados de email e, em seguida, usar APIs do Microsoft Graph para analisar emails em tempo real avançando. As APIs do Microsoft Graph Data Connect e do Microsoft Graph são ferramentas diferentes para trabalhos diferentes. É importante pensar sobre o qual método de acesso melhor se encaixa em seu cenário. Para obter mais informações, consulte Quando devo usar o Microsoft API do Graph ou o Microsoft Graph Data Connect.

Para que são alguns cenários para os quais as empresas usam dados do Microsoft 365?

Há vários casos de uso que podem ser alimentados por dados do Microsoft 365. Veja a seguir alguns cenários principais nos quais os clientes estão interessados:

  • Análise de Relacionamento do Cliente: para líderes comerciais de negócios, vá além dos insights tradicionais do CRM e entenda as interações e relacionamentos do cliente com base em padrões de comunicação e colaboração.

  • Análise do Processo de Negócios: para melhores operações, confira como o trabalho realmente flui pela organização no dia a dia. Identifique os processos manuais e os gargalos de fluxo de trabalho que devem ser automatizados ou otimizados.

  • Análise de Segurança e Conformidade: para proteger dados confidenciais, saiba como os funcionários estão usando e compartilhando informações confidenciais. Implementar detecção de anomalias, inteligência contra ameaças, análise de log de auditoria, gerenciamento de riscos e perícia legal.

  • Pessoas Análise de Produtividade: para impulsionar a transformação, exporte suas Viva métricas de produtividade, para que você possa converter insights em soluções com adoção digital, reuniões inteligentes e conteúdo, locais de trabalho híbridos e mudanças culturais.

Como Viva Insights e o Microsoft Graph Data Connect diferem?  

Viva Insights e o Microsoft Graph Data Connect são complementares. Embora ambos dependam do Microsoft 365, Viva Insights e o Data Connect atendem a diferentes públicos e necessidades.

Quando os clientes estão procurando insights e análises além de Viva Insights, o Data Connect fornece a extensibilidade para fornecer requisitos personalizados. Por exemplo, ele oferece registros e transcrições de chamadas do Teams, bem como conjuntos de dados do SharePoint Online, que atualmente não estão no escopo de Viva Insights. Além disso, os dados brutos do Data Connect fornecem detalhes granulares que não estão disponíveis de outra forma de Viva Insights.

Há alguma sobrecarga inicial com o Microsoft Graph Data Connect?

Como o Data Connect foi projetado para extrair grandes quantidades de dados em massa, ocorre alguma sobrecarga antes que os dados possam ser extraídos. Essa sobrecarga é de aproximadamente 45 minutos, ou seja, todos os pipelines levarão no mínimo esse tempo, independentemente do tamanho dos dados. Se a sobrecarga inicial for muito longa para o caso de uso, entre em contato com a equipe do Microsoft Graph Data Connect.

Observação

Seu administrador de locatário precisará aprovar e consentir dentro de 24 horas após iniciar o pipeline. Se o consentimento não for dado dentro de 24 horas, ele expirará e você precisará reiniciar o processo de consentimento iniciando seus pipelines novamente. O tempo de sobrecarga não inclui o tempo gasto na aprovação do consentimento.

Em quais regiões o Microsoft Graph Data Connect está disponível?

O Microsoft Graph Data Connect está atualmente disponível em várias regiões nas seguintes geografias: América do Norte, Europa, Ásia-Pacífico, Reino Unido/Grã-Bretanha e Austrália. Outras regiões estarão disponíveis no futuro.

Para obter uma lista de regiões e mapeamentos do Office para Azure, confira Conjunto de dados, regiões e coletores.

Quais conjuntos de dados estão disponíveis por meio do Microsoft Graph Data Connect?

Os seguintes tipos de conjuntos de dados estão disponíveis:

  • Básico: conjuntos de dados gerados a partir de conteúdo bruto criado pelo cliente e entradas de aplicativos e serviços do Microsoft 365 (por exemplo, conjuntos de dados Microsoft Entra ID, Outlook ou Teams). 

  • Limpo: conjuntos de dados gerados pela normalização e eliminação de eliminação de conjuntos de dados básicos ou conjuntos de dados criados a partir de sinais de atividade ou comportamento do usuário no Microsoft 365 (por exemplo, SharePoint, Office 365 conjuntos de dados).  

  • Curadoria: conjuntos de dados personalizados gerados para um caso de uso específico ou cenários de análise ou conjuntos de dados de aplicativos de análise do Microsoft 365 de primeira parte para sua extensibilidade, por exemplo, Viva Insights métricas).

Vários conjuntos de dados para cada um dos seguintes estão disponíveis:

  • Teams
  • Outlook
  • Microsoft Entra ID
  • OneDrive/Sharepoint
  • Viva Insights

Novos conjuntos de dados são adicionados ao Microsoft Graph Data Connect regularmente. Para obter uma lista completa, consulte Conjunto de dados, regiões e coletores.

Quais conjuntos de dados estão em versão prévia e quais estão geralmente disponíveis?

Os conjuntos de dados do OneDrive/SharePoint e Viva Insights estão disponíveis atualmente para clientes em versão prévia ou para aqueles que têm a licença Viva Insights, respectivamente.

Para obter informações sobre conjuntos de dados que geralmente estão disponíveis ou somente em versão prévia, confira Conjunto de dados, regiões e coletores.

Como a cobrança é calculada?

O Microsoft Graph Data Connect cobra mensalmente dos clientes e também faz arredondamento fracionável ao calcular a conta. Cada execução de pipeline é cobrada separadamente.

Por exemplo, um cliente tem 20 execuções de pipeline no mês, cada uma rendendo 500 linhas. No total, o cliente executa pipelines para 10.000 linhas naquele mês. No entanto, sua fatura não será de 10.000 linhas/1000 linhas = 10 unidades.

Em vez disso, o cliente será cobrado por 20 unidades porque o Microsoft Graph Data Connect reúne frações. Como 500 linhas /1000 linhas = 0,5 e 0,5 é uma fração, ela arredondará até 1. O cliente será cobrado uma unidade por execução de pipeline, o que resulta em 20 unidades cobradas no total.

O que posso fazer se um conjunto de dados ainda não tiver suporte para meu locatário?

Para conjuntos de dados como OneDrive/SharePoint e Viva Insights, verifique se você atende aos critérios descritos em Conjuntos de dados, regiões e coletores. Esses conjuntos de dados só estão disponíveis para clientes que optaram por eles explicitamente.

Para obter perguntas, entre em contato com a equipe do Microsoft Graph Data Connect.

Para quais cenários o Microsoft Graph Data Connect é melhor?

As organizações que podem explorar grandes conjuntos de dados que potencializem suas ferramentas de produtividade podem obter insights incríveis sobre os desafios e as oportunidades que podem encontrar. Os clientes criam aplicativos em vários cenários, como redes de organização para nalíticos de produtividade de pessoas, compartilhamento excessivo de informações para análise de segurança e conformidade, pontos fortes de relacionamento do vendedor para análise de relacionamento com o cliente e muito mais.

É possível que meus dados permaneçam dentro da assinatura da organização com a Conexão de Dados do Microsoft Graph?

O Microsoft Graph Data Connect respeita o limite de locatário organizacional ao entregar seus conjuntos de dados solicitados. Os recursos do Azure e os serviços do Microsoft 365 devem estar localizados no mesmo Microsoft Entra locação para acessar o conjunto de dados do Microsoft 365. O acesso ao conjunto de dados entre locatários não está disponível hoje.

As entidades de serviços são requeridas com a Conexão de Dados do Microsoft Graph?

Ao criar o pipeline Azure Synapse ou Data Factory, você precisa fornecer uma entidade de serviço ao serviço vinculado do Microsoft 365. No Azure, uma entidade de serviço é uma identidade de segurança que representa um aplicativo ou serviço (e não um usuário). O Data Connect usa essa entidade de serviço como sua identidade ao obter acesso autorizado aos dados do Microsoft 365.

Se você criar um Aplicativo Gerenciado do Azure para que outras pessoas usem em seus locatários, você ainda irá fornecer uma entidade de serviço para uso do aplicativo. A entidade de serviço ficará armazenada em seu (do fornecedor) locatário. No entanto, se o aplicativo precisar de outras entidades de serviço, seu cliente (instalador) irá criá-las em seu próprio locatário. Por exemplo, seu pipeline de Azure Synapse ou Azure Data Factory provavelmente precisa de acesso a um recurso de armazenamento no Azure. O cliente criaria a entidade de serviço com permissões para a conta de armazenamento para uso do pipeline.

Para obter mais informações sobre como criar seu aplicativo com Azure Synapse ou Azure Data Factory, consulte o início rápido do Data Connect.

Como posso marcar para solicitações de PAM (Privileged Access Management) pendentes?

Antes que o Data Connect possa copiar seus dados, um administrador deve aprovar uma solicitação de Gerenciamento de Acesso Privilegiado (PAM). PAM é o mecanismo usado para autorizar seu acesso a dados de pipeline aos dados no Microsoft 365.

Na primeira vez que acionar um pipeline, irá esperar a aprovação da solicitação de acesso de um administrador do Microsoft 365 (ou representante indicado). Embora o status do pipeline mostra Em andamento, a atividade de cópia subjacente terá o status ConsentimentoPendente até que o acesso seja aprovado, conforme mostrado na captura de tela a seguir.

Captura de tela do painel de status da execução de pipeline com um status ConsentimentoPendente

Durante o desenvolvimento, é uma boa ideia para garantir que a execução do seu pipeline não fique preso em ConsentimentoPendente, especialmente após alterar seu pipeline. Por exemplo, se você inserir um campo adicional no esquema, a próxima execução de pipeline emitirá uma nova solicitação de PAM que precisa ser aprovada. Não desperdice tempo esperando um pipeline que aguarda sua aprovação.

Observe que as solicitações de consentimento expirarão após 24 horas se não forem aprovadas e o pipeline falhará. Além disso, a aprovação pam é válida por apenas 6 meses (a menos que revogada).

Como posso aprovar solicitações de PAM por meio do portal de administração do Microsoft 365?

Para aprovar usando a UX do PAM, acesse a interface PAM no portal de administração do Microsoft 365. O portal fornece uma maneira simples e fácil para exibir, aprovar, negar, revogar solicitações PAM.

Para aprovar uma solicitação:

  • Ao habilitar o Microsoft Graph Data Connect, você deve estar dentro do grupo do aprovador.
  • Os usuários devem ter uma função global Administração.
  • Os usuários devem ter uma licença de Exchange Online atribuída.

Use as seguintes etapas para aprovar ou negar uma solicitação PAM:

  1. Entre na interface PAM em Centro de administração do Microsoft 365.
  2. No painel direito, clique em Configurações>Org Settings>Services>Microsoft Graph Data Connect.
  3. Localize a solicitação.
  4. Examine os detalhes da solicitação.
  5. Adicione a eliminação de lista de negação, se necessário.
  6. Aprovar ou negar a solicitação.

Para obter mais detalhes, confira o início rápido do Data Connect.

Desde que o escopo dos dados que estão sendo extraídos permaneça o mesmo para conjuntos de dados, colunas, usuários etc. A execução do pipeline NÃO disparará uma nova solicitação de consentimento. Em vez disso, o pipeline usará o consentimento aprovado que durará seis meses. Executar um pipeline com o mesmo escopo para datas diferentes TAMBÉM NÃO disparará um novo consentimento.

Uma nova solicitação de consentimento será disparada se o escopo dos dados for alterado, como adicionar novo conjunto de dados, selecionar mais colunas ou adicionar outros usuários. Um novo consentimento também pode ser disparado ao alterar o pipeline ou o nome da atividade em Azure Synapse ou Azure Data Factory.

Por que preciso de um segundo usuário para aprovar solicitações PAM?

Quando você solicitar uma execução de pipeline de conjunto de dados, o serviço Microsoft Graph Data Connect verificará e disparará uma solicitação de aprovação pam, se necessário. A solicitação é enviada ao grupo aprovador definido para o locatário ao habilitar o Microsoft Graph Data Connect no Centro de Administração microsoft.

No entanto, mesmo que essa conta faça parte do grupo aprovador que você configurou, você não poderá usá-la para aprovar a solicitação PAM porque as auto-aprovações não são permitidas. Se você tentar, receberá uma mensagem de erro no portal PAM: "Solicitante e aprovador são iguais. Não é permitida autoaprovação.”

Para o desenvolvimento, convém ter uma segunda conta, além da de administrador que aprova as solicitações. O solicitante e o aprovador devem ter contas ativas do Exchange Online.

Posso eliminar a duplicação de emails quando necessário?

Quando você extrair emails do conjunto de dados Message, geralmente haverá vários objetos JSON para o mesmo email. Essas duplicatas existem quando um email é enviado para várias pessoas, há uma cópia do email na caixa de correio de cada destinatário. Como o conjunto de dados é extraído de cada caixa de correio, haverá todas as cópias entre os usuários. Em alguns cenários, talvez seja necessário manter cada cópia, mas em outros talvez você queira remover as duplicatas.

Você pode eliminar as duplicatas dos objetos JSON exportados baseados em internetMessageId das mensagens: duas mensagens com o mesmo internetMessageId são cópias duplicadas da mesma instância. Como as duplicatas podem existir em diferentes blobs, você deve eliminar as duplicatas em todos os blobs em vez de fazer isso em cada blob separadamente.

Posso usar o campo puser para determinar a relevância do usuário?

Os dados extraídos incluem algumas propriedades meta que não existem se forem usadas as APIs correspondentes do Microsoft Graph. Especificamente, o campo puser pode ser útil para determinar de quais usuários os dados foram extraídos. No cenário em que você tem duas cópias do mesmo email em caixas de correio diferentes, você pode usar o campo puser para determinar as caixas de correio de origem das cópias. O campo puser também é útil para conjuntos de dados, como o conjunto de dados Manager. O JSON exportado inclui informações sobre um gerenciador, mas isso é útil apenas se você souber o que gerenciam. O campo puser indicará qual gerenciador corresponde ao objeto JSON.

A configuração do locatário no modo híbrido é compatível?

Se sua configuração do Microsoft 365 tiver alguns usuários no Exchange Online e alguns usuários no Exchange local, os usuários que estão no Exchange local não terão suporte. Infelizmente, hoje não oferecemos suporte aop Data Connect para os usuários do Exchange local.

Há suporte para contas de recursos?

Atualmente não apoiamos o acesso a mensagens ou eventos a partir de contas de recursos.

Por que às vezes vejo vários arquivos por execução de pipeline do ADF, mas outras vezes vejo apenas um arquivo por execução?

O Data Connect do Microsoft Graph leva a lista de usuários para cada execução de pipeline e, em seguida, distribui a extração e curadoria do conjunto de dados em vários trabalhos executados em paralelo. Para cada execução paralela, um arquivo de saída é gerado no coletor de dados definido por você. Para alguns casos, se a lista de usuários for pequena, eles podem ser mapeados em um trabalho de extração e curadoria e, nesses casos, apenas um arquivo de saída seria gerado no coletor de dados.