Microsoft Graph 数据连接常见问题解答

借助 Microsoft Graph 数据连接,开发人员可为客户创建应用程序,用以提供对其大规模 Microsoft Graph 数据集的受管访问权限。 本文提供有助于利用 Microsoft Graph 数据连接功能的提示。 有关 Microsoft Graph 数据连接的简介,请参阅概述

有关更多问题,请参阅 故障排除或联系 Data Connect 团队

Microsoft Graph 数据连接是否适合我?

Microsoft Graph Data Connect 和 Microsoft Graph API 提供对相同基础数据的访问权限,但方式非常不同。 Microsoft Graph Data Connect 旨在批量提取大量数据集,可缩放到整个组织;而 Microsoft Graph API 适用于访问组织中所选用户和组的少量数据。

例如,你可能希望使用 Microsoft Graph Data Connect 对过去一年的电子邮件数据进行初始提取,然后使用 Microsoft Graph API 实时分析电子邮件。 Microsoft Graph Data Connect 和 Microsoft Graph API 是用于不同作业的不同工具。 有必要思考哪种访问方法最适合你的场景。 有关详细信息,请参阅何时应使用 Microsoft 图形 API 或 Microsoft Graph 数据连接

公司使用 Microsoft 365 数据的场景有哪些?

有任意数量的用例可以由 Microsoft 365 数据提供支持。 以下是客户感兴趣的一些热门方案:

  • 客户关系分析:对于商业业务领导者,请超越传统的 CRM 见解,并根据通信和协作模式了解客户交互和关系。

  • 业务流程分析:为了更好地运营,请查看工作如何真正在组织内每天流动。 查明应自动执行或优化的手动流程和工作流瓶颈。

  • 安全性和合规性分析:若要保护敏感数据,请了解员工如何使用和共享敏感信息。 实施异常情况检测、威胁情报、审核日志分析、风险管理和法律取证。

  • 人员生产力分析:若要推动转型,请导出Viva生产力指标,以便你可以通过数字采用、智能会议与内容、混合工作场所和文化变革将见解转换为解决方案。

Viva Insights和 Microsoft Graph Data Connect 有何不同?  

Viva Insights和 Microsoft Graph Data Connect 是互补的。 虽然两者都依赖于 Microsoft 365,但 Viva Insights 和 Data Connect 为不同的受众和需求提供服务。

当客户寻找Viva Insights以外的见解和分析时,Data Connect 提供扩展性来提供自定义要求。 例如,它提供 Teams 通话记录和脚本以及 SharePoint Online 数据集,这些数据集目前不在Viva Insights范围内。 此外,Data Connect 原始数据提供Viva Insights无法获取的精细详细信息。

Microsoft Graph Data Connect 是否有初始开销?

数据连接专用于批量提取大量数据,因此在提取数据之前可能会产生一些开销。 此开销大约为 45 分钟,这意味着无论数据量如何,所有管道至少都将花费这么长时间。 如果初始开销对于你的用例来说太长,请联系 Microsoft Graph Data Connect 团队

注意

租户管理员需要在启动管道后的 24 小时内批准和同意。 如果同意未在 24 小时内发出,它将过期,你需要通过再次启动管道来重启同意过程。 开销时间不包括同意审批所花费的时间。

Microsoft Graph Data Connect 在哪些区域可用?

Microsoft Graph Data Connect 目前在以下地理位置的多个区域提供:北美、欧洲、亚太地区、英国/英国和澳大利亚。 其他区域将来将可用。

有关 Office 到 Azure 区域和映射的列表,请参阅 数据集、区域和接收器

通过 Microsoft Graph Data Connect 提供哪些数据集?

以下类型的数据集可用:

  • 基本:从原始客户创建的内容和来自 Microsoft 365 应用程序和服务的输入生成的数据集 (例如,Microsoft Entra ID、Outlook 或 Teams 数据集) 。 

  • 已清理:由基本数据集的规范化和重复数据删除生成的数据集,或从 Microsoft 365 (中的用户活动或行为信号创建的数据集,例如 SharePoint Office 365数据集) 。  

  • 策展:为特定用例或分析方案生成的自定义数据集,或来自第一方 Microsoft 365 分析应用程序的数据集(例如,Viva Insights指标) )。

以下各项的多个数据集可用:

  • Teams
  • Outlook
  • Microsoft Entra ID
  • OneDrive/Sharepoint
  • Viva Insights

新数据集会定期添加到 Microsoft Graph Data Connect。 有关完整列表,请参阅 数据集、区域和接收器

哪些数据集处于预览状态,哪些数据集已正式发布?

OneDrive/SharePoint 和 Viva Insights 的数据集目前分别面向预览版客户或拥有Viva Insights许可证的客户。

有关正式版或仅限预览版的数据集的信息,请参阅 数据集、区域和接收器

如何计算计费?

Microsoft Graph Data Connect 每月向客户收费,并在计算帐单时进行可小数舍入。 每个管道运行单独计费。

例如,客户在一个月内有 20 个管道运行,每个管道运行产生 500 行。 客户在当月总共运行 10,000 行的管道。 但是,他们的帐单不会为 10,000 行/1000 行 = 10 个单位。

相反,客户将按 20 个单位计费,因为 Microsoft Graph Data Connect 会舍入分数。 由于 500 行 /1000 行 = 0.5 和 0.5 是小数,因此它将向上舍入到 1。 每个管道运行将向客户收取一个单位的费用,这导致总共计费 20 个单位。

如果租户尚不支持数据集,该怎么办?

对于 OneDrive/SharePoint 和 Viva Insights 等数据集,请确保满足数据集、区域和接收器中所述的条件。 这些数据集仅适用于已显式选择加入的客户。

有关问题,请联系 Microsoft Graph Data Connect 团队

Microsoft Graph Data Connect 最适合哪些方案?

能够利用为其生产力工具提供动力的大型数据集的组织可以对他们可能遇到的挑战和机遇获得巨大的洞察力。 客户跨多种方案构建应用程序,例如用于人员工作效率的组织网络、用于安全性和合规性分析的信息过度共享、用于客户关系分析的卖方关系优势等。

使用 Microsoft Graph 数据连接,我的数据是否可保留在组织的订阅内?

Microsoft Graph Data Connect 在传送请求的数据集时会遵循组织租户边界。 Azure 资源和 Microsoft 365 服务必须位于同一Microsoft Entra租户中,才能访问 Microsoft 365 数据集。 跨租户数据集访问目前不可用。

使用 Microsoft Graph 数据连接时,是否要求使用服务主体?

创建Azure Synapse或数据工厂管道时,必须向 Microsoft 365 链接服务提供服务主体。 在 Azure 中,服务主体是指代表应用程序/服务(与用户相反)的一个安全标识。 在获得针对 Microsoft 365 数据的授权访问权限时,Microsoft Graph 数据连接会使用此服务主体作为其标识。

如果创建供其他人在其租户中使用的 Azure 托管应用程序,仍需为要使用的应用提供服务主体。 该服务主体将存在于你的(发布者的)租户中。 但是如果该应用需要其他服务主体,你的客户(安装者)将在他们自己的租户中自行创建。 例如,Azure Synapse或Azure 数据工厂管道可能需要访问 Azure 中的存储资源。 客户创建的服务主体对管道使用的存储帐户具有权限。

有关使用 Azure Synapse 或 Azure 数据工厂 生成应用程序的详细信息,请参阅 Data Connect 快速入门

如何检查挂起的特权访问管理 (PAM) 请求?

Privileged Access Management (PAM) 请求必须得到管理员的批准,然后 Microsoft Graph 数据连接才可复制你的数据。 PAM 是 Microsoft 365 中向数据管道授予数据访问权限的机制。

首次触发管道时,它将等待 Microsoft 365 管理员(或指定的代理人)批准访问请求。 虽然管道状态显示“正在进行中”,但基础复制活动的状态将为 ConsentPending,直到获得批准,如以下屏幕截图所示。

具有 ConsentPending 状态的管道运行状态窗格屏幕截图

在开发期间,最好确保你的管道运行不一直处于 ConsentPending 状态,尤其是在对管道进行更改之后。 例如,如果向架构额外添加了一个字段,则下一次管道运行将发出一个新的 PAM 请求,而该请求必须获得批准。 不要浪费时间等待一个需要你来批准的管道。

请注意,如果未经批准,同意请求将在 24 小时后过期,管道将失败。 此外,除非) 撤销,否则 PAM 批准仅在 (有效期为 6 个月。

如何通过 Microsoft 365 管理中心审批 PAM 请求?

要使用 PAM UX 进行审批,请访问 Microsoft 365 管理中心中的 PAM 界面。 该管理中心让你能够以简单、快捷的方式查看和审批/拒绝/撤消 PAM 请求。

批准请求:

  • 启用 Microsoft Graph Data Connect 时,你必须在审批者的组中。
  • 用户必须具有全局管理员角色。
  • 用户必须分配Exchange Online许可证。

使用以下步骤批准或拒绝 PAM 请求:

  1. Microsoft 365 管理中心 登录 PAM 接口。
  2. 在右窗格中,单击 “设置”>“组织设置”“>服务>”“Microsoft Graph 数据连接”。
  3. 找到请求。
  4. 查看请求详细信息。
  5. 根据需要添加拒绝列表清理。
  6. 批准或拒绝请求。

有关详细信息,请参阅 Data Connect 快速入门

只要对数据集、列、用户等提取的数据范围保持不变,管道运行就不会触发新的同意请求。 相反,管道将使用已批准的同意,该同意将持续 6 个月。 在不同的日期运行具有相同范围的管道也不会触发新的同意。

如果数据范围发生更改(例如添加新数据集、选择更多列或添加其他用户),将触发新的同意请求。 更改Azure Synapse或Azure 数据工厂中的管道或活动名称时,还可以触发新的同意。

为什么我需要第二个用户来批准 PAM 请求?

请求数据集管道运行时,Microsoft Graph 数据连接服务将验证并在需要时触发 PAM 审批请求。 在 Microsoft 管理员 中心启用 Microsoft Graph 数据连接时,请求将发送到为租户定义的审批者组。

但是,即使此帐户是你设置的审批者组的一部分,也不能使用它来批准 PAM 请求,因为不允许自我批准。 如果尝试此操作,你将在 PAM 门户中获得一个错误消息:“请求者和审批者是同一人。 不允许自我审批。”

在开发时,你将必须在审批请求的管理员之外再拥有一个帐户。 提交者和审批者都必须具有有效的 Exchange Online 帐户。

能否在必要时删除重复的电子邮件?

Message 数据集中提取电子邮件时,同一封电子邮件常常有多个 JSON 对象。 这些重复项存在的原因是在向多名用户发送电子邮件时,每个收件人的邮箱中都有该电子邮件的副本。 由于数据集是从每个邮箱中提取的,因此它将包含所有用户的所有副本。 在某些情况下,可能有必要保留每个副本;但在其他情况下,可能需要删除重复项。

可根据邮件的 internetMessageId 删除导出的 JSON 对象中的重复项:具有相同 internetMessageId 的两封邮件是同一实例的重复副本。 由于重复项可存在于不同的 blob 中,因此必须删除所有 blob 中的重复项,而不是分别删除每个 blob 中的重复项。

能否使用 puser 字段来确定相关用户?

提取的数据包含一些在使用相应的 Microsoft Graph API 时不存在的属性。 具体而言,puser 在确定用户数据提取的位置时非常有用。 如果不同邮箱中具有同一电子邮件的两个副本,可使用 puser 字段来确定副本来自哪个邮箱。 puser 字段还对 Manager 数据集之类的数据集很有用。 导出的 JSON 将包含管理器相关信息,但只有当你知道它们是谁的管理器时,这才有用。 puser 字段将指出 JSON 对象对应于谁的管理器。

是否支持混合模式租户设置?

如果你的 Microsoft 365 设置有一些用户在 Exchange Online 中,而一些用户在 Exchange 本地版中,则位于 Exchange 本地版中的用户将不受支持。 遗憾的是,我们目前不为 Exchange 本地版用户提供 Microsoft Graph 数据连接支持。

是否支持资源帐户?

我们目前不支持从资源帐户访问邮件或事件。

为什么我有时会看到每个 ADF 管道运行有多个文件,但有时会看到每个运行只有一个文件?

Microsoft Graph 数据连接会获取每个管道运行的用户列表,然后跨并行运行的多个作业分发数据集提取和策展。 对于每个并行运行,都会在你定义的数据接收器中生成 1 个输出文件。 对于某些情况,如果用户列表较小,则可能会将其映射到 1 个提取和策展作业,在这些情况下,数据接收器中只会生成 1 个输出文件。