Microsoft Graph 数据连接常见问题解答

借助 Microsoft Graph 数据连接,开发人员可为客户创建应用程序,用以提供对其大规模 Microsoft Graph 数据集的受管访问权限。 本文提供了一些提示,可帮助你利用 Microsoft Graph 数据连接功能。 有关 Microsoft Graph 数据连接的简介,请参阅概述

有关更多问题,请参阅 故障排除 或使用以下选项创建新的 Azure 支持请求:

  • 服务类型:选择 Microsoft Graph High-Capacity API
  • 问题类型 (MGDC) 选择Microsoft图形数据连接

屏幕截图显示 Azure 支持请求中的主题选择,以引用 Microsoft Graph Data Connect 的问题。

Microsoft Graph 数据连接是否适合我?

Microsoft Graph Data Connect 和 Microsoft Graph API 提供对相同基础数据的访问权限,但方式非常不同。 Microsoft Graph Data Connect 旨在批量提取大量数据集,可缩放到整个组织;而 Microsoft Graph API 适用于访问组织中所选用户和组的少量数据。

例如,你可能希望使用 Microsoft Graph Data Connect 对过去一年的电子邮件数据进行初始提取,然后使用 Microsoft Graph API 实时分析电子邮件。 Microsoft Graph Data Connect 和 Microsoft Graph API 是用于不同作业的不同工具。 有必要思考哪种访问方法最适合你的场景。 有关详细信息,请参阅 何时应使用 Microsoft Graph API 或 Microsoft Graph Data Connect

公司使用 Microsoft 365 数据的场景有哪些?

有任意数量的用例可以由 365 Microsoft数据提供支持。 以下是客户感兴趣的一些热门方案:

  • 客户关系分析:对于商业业务领导者,请超越传统的 CRM 见解,并根据通信和协作模式了解客户交互和关系。

  • 业务流程分析:为了更好地运营,请查看工作如何真正在组织内每天流动。 查明应自动执行或优化的手动流程和工作流瓶颈。

  • 安全性和合规性分析:若要保护敏感数据,请了解员工如何使用和共享敏感信息。 实施异常情况检测、威胁情报、审核日志分析、风险管理和法律取证。

  • 人员生产力分析:若要推动转型,请导出 Viva 生产力指标,以便你可以将见解转换为采用数字、智能会议和内容、混合工作场所和文化变化的解决方案。

Viva Insights 和 Microsoft Graph Data Connect 有何不同?  

Viva Insights 和 Microsoft Graph Data Connect 是互补的。 虽然两者都依赖于 Microsoft 365,但 Viva Insights 和 Data Connect 为不同的受众和需求提供服务。

当客户在 Viva Insights 之外寻找见解和分析时,Data Connect 可提供扩展性来提供自定义要求。 例如,它提供 Teams 通话记录和脚本以及 SharePoint Online 数据集,这些数据集目前不在 Viva Insights 的范围内。 此外,Data Connect 原始数据提供了 Viva Insights 无法提供的精细详细信息。

Microsoft Graph Data Connect 是否有初始开销?

数据连接专用于批量提取大量数据,因此在提取数据之前可能会产生一些开销。 此开销大约为 45 分钟,这意味着无论数据量如何,所有管道至少都将花费这么长时间。 如果初始开销对于你的用例来说太长,请创建新的 Azure 支持请求,包括上一部分中提到的详细信息。

Graph Data Connect Microsoft哪些区域可用?

Microsoft Graph Data Connect 目前在以下地理位置的多个区域可用:北美、欧洲、亚太地区、英国/英国和澳大利亚。 其他区域将来将可用。

有关 Office 到 Azure 区域和映射的列表,请参阅 数据集、区域和接收器

Microsoft Graph Data Connect 提供哪些数据集?

以下类型的数据集可用:

  • 基本:从原始客户创建的内容和来自 Microsoft 365 应用程序和服务的输入生成的数据集 (例如,Microsoft Entra ID、Outlook 或 Teams 数据集) 。 

  • 已清理:由基本数据集的规范化和重复数据删除生成的数据集,或者从 Microsoft 365 (中的用户活动或行为信号创建的数据集,例如 SharePoint、Office 365 数据集) 。  

  • 策展:为特定用例或分析方案自定义生成的数据集,或来自第一方Microsoft 365 个分析应用程序的数据集(例如 Viva Insights 指标) )。

以下各项的多个数据集可用:

  • Teams
  • Outlook
  • Microsoft Entra ID
  • OneDrive/Sharepoint
  • Viva Insights

新数据集会定期添加到 Microsoft Graph Data Connect。 有关完整列表,请参阅 数据集、区域和接收器

哪些数据集处于预览状态,哪些数据集已正式发布?

有关正式版或仅限预览版的数据集的信息,请参阅 数据集、区域和接收器

如何计算计费?

Microsoft Graph Data Connect 按月向客户收费,并在计算帐单时执行可小数舍入。 每个管道运行单独计费。

例如,客户在一个月内有 20 个管道运行,每个管道运行产生 500 行。 客户在当月总共运行 10,000 行的管道。 但是,他们的帐单不会为 10,000 行/1000 行 = 10 个单位。

相反,客户需要按 20 个单位计费,因为Microsoft Graph Data Connect 会舍入分数。 由于 500 行/1000 行 = 0.5 和 0.5 是小数,因此它向上舍入为 1。 每个管道运行向客户计费一个单位,这导致总共计费 20 个单位。

如果租户尚不支持数据集,该怎么办?

对于预览数据集,请确保满足 数据集、区域和接收器中所述的条件。 这些数据集仅适用于已显式选择加入的客户。

对于问题,请创建新的 Azure 支持请求,包括上一部分中提到的详细信息。

Microsoft Graph Data Connect 最适用于哪些方案?

能够利用为其生产力工具提供动力的大型数据集的组织可以对他们可能遇到的挑战和机遇获得巨大的洞察力。 客户跨多个方案构建应用程序,例如用于人员工作效率分析的组织网络、用于安全性和合规性分析的信息过度共享、用于客户关系分析的卖方关系优势等。

使用 Microsoft Graph 数据连接,我的数据是否可保留在组织的订阅内?

Microsoft Graph Data Connect 在传送请求的数据集时遵循组织租户边界。 Azure 资源和 Microsoft 365 服务必须位于同一Microsoft Entra 租户中,才能访问Microsoft 365 数据集。 跨租户数据集访问目前不可用。

使用 Microsoft Graph 数据连接时,是否要求使用服务主体?

创建 Azure Synapse 或数据工厂管道时,必须向 Microsoft 365 链接服务提供服务主体。 在 Azure 中,服务主体是指代表应用程序/服务(与用户相反)的一个安全标识。 在获得针对 Microsoft 365 数据的授权访问权限时,Microsoft Graph 数据连接会使用此服务主体作为其标识。

如果创建供其他人在其租户中使用的 Azure 托管应用程序,仍需为要使用的应用提供服务主体。 该服务主体将存在于你的(发布者的)租户中。 但是如果该应用需要其他服务主体,你的客户(安装者)将在他们自己的租户中自行创建。 例如,Azure Synapse 或 Azure 数据工厂管道可能需要访问 Azure 中的存储资源。 客户创建的服务主体对管道使用的存储帐户具有权限。

有关使用 Azure Synapse 或 Azure 数据工厂生成应用程序的详细信息,请参阅 Data Connect 快速入门

只要对数据集、列、用户和接收器提取的数据范围保持不变,管道运行就不需要新的同意请求。 相反,管道使用已批准的主动同意。 在不同日期运行具有相同范围的管道不需要新的同意。

能否在必要时删除重复的电子邮件?

Message 数据集中提取电子邮件时,同一封电子邮件常常有多个 JSON 对象。 存在这些重复项,因为向多个收件人发送电子邮件时,每个收件人的邮箱中都有一个电子邮件副本。 由于数据集是从每个邮箱中提取的,因此它将包含所有用户的所有副本。 在某些情况下,可能有必要保留每个副本;但在其他情况下,可能需要删除重复项。

可根据邮件的 internetMessageId 删除导出的 JSON 对象中的重复项:具有相同 internetMessageId 的两封邮件是同一实例的重复副本。 由于重复项可存在于不同的 blob 中,因此必须删除所有 blob 中的重复项,而不是分别删除每个 blob 中的重复项。

能否使用 puser 字段来确定相关用户?

提取的数据包含一些在使用相应的 Microsoft Graph API 时不存在的属性。 具体而言,puser 在确定用户数据提取的位置时非常有用。 如果不同邮箱中具有同一电子邮件的两个副本,可使用 puser 字段来确定副本来自哪个邮箱。 puser 字段还对 Manager 数据集之类的数据集很有用。 导出的 JSON 将包含管理器相关信息,但只有当你知道它们是谁的管理器时,这才有用。 puser 字段将指出 JSON 对象对应于谁的管理器。

是否支持混合模式租户设置?

如果你的 Microsoft 365 设置有一些用户在 Exchange Online 中,而一些用户在 Exchange 本地版中,则位于 Exchange 本地版中的用户将不受支持。 遗憾的是,Exchange 本地用户目前不支持 Data Connect。

是否支持资源帐户?

我们目前不支持从资源帐户访问邮件或事件。

为什么我有时会看到每个 ADF 管道运行有多个文件,但有时会看到每个运行只有一个文件?

Microsoft Graph 数据连接会获取每个管道运行的用户列表,然后跨并行运行的多个作业分发数据集提取和策展。 对于每个并行运行,都会在你定义的数据接收器中生成 1 个输出文件。 对于某些情况,如果用户列表较小,则可能会将其映射到 1 个提取和策展作业,在这些情况下,数据接收器中只会生成 1 个输出文件。