培训
认证
Microsoft Certified: Azure Data Engineer Associate - Certifications
演示如何了解使用多种 Azure 服务在 Microsoft Azure 上实现和管理数据工程工作负荷的常见数据工程任务。
Microsoft Graph 数据连接支持 Microsoft Azure 中的各种数据集、数据区域和存储位置。 本文介绍支持的数据集以及如何访问数据集架构、Microsoft 365 和 Microsoft 支持的 Azure 区域,以及Microsoft Graph 数据连接通过 Azure Synapse 或 Azure 数据工厂利用的存储位置。
Microsoft Graph Data Connect 当前支持以下数据集。 若要查看每个数据集的架构,请在 Azure Synapse 或 Azure 数据工厂中创建一个新数据集,然后转到“架构”选项卡。
数据集名称 | 说明 | 了解详细信息 |
---|---|---|
OutlookContactActivity_v0 | 在 Outlook Microsoft 中为员工提供其联系人的活动。 | OutlookContactActivity_v0数据集 |
OutlookMailActivity_v0 | 在 Outlook 中为员工提供其电子邮件活动。 | OutlookMailActivity_v0数据集 |
OutlookMeetingActivity_v0 | 在 Outlook 中通过会议为员工提供活动。 | OutlookMeetingActivity_v0数据集 |
TeamsChannelActivity_v0 | 在 Microsoft Teams 中提供其频道和提供人员的活动。 | TeamsChannelActivity_v0数据集 |
TeamsConversationActivity_v0 | 通过 Teams 中的团队和聊天为员工提供活动。 | TeamsConversationActivity_v0数据集 |
数据集名称 | 说明 | 了解详细信息 |
---|---|---|
TeamsCallRecords_v1 | 提供 Teams 通话和会议的活动记录。 | TeamsCallRecords_v1数据集 |
数据集名称 | 说明 | 了解详细信息 |
---|---|---|
TeamsChannelDetails_v0 | 生成Microsoft Teams 频道的列表。 | TeamsChannelDetails_v0数据集 |
数据集名称 | 说明 | 了解详细信息 |
---|---|---|
Contact_v0 | 提供每个用户通讯簿中提供的联系人详细信息。 | Contact_v0数据集 |
Contact_v1 | 提供每个用户的通讯簿中提供的联系人详细信息。 | Contact_v1数据集 |
数据集名称 | 说明 | 了解详细信息 |
---|---|---|
OwnedDevices_v0 | 提供与组织中每个用户拥有的所有设备相关的详细信息。 | OwnedDevices_v0数据集 |
RegisteredDevices_v0 | 提供与用户在组织中注册的所有设备相关的详细信息。 | RegisteredDevices_v0数据集 |
LicenseDetails_v0 | 提供有关直接分配的用户许可证以及通过许可组中的成员身份传递分配的用户许可证的详细信息。 | LicenseDetails_v0数据集 |
数据集名称 | 说明 | 了解详细信息 |
---|---|---|
CalendarView_v0 | 根据用户日历中的日历视图提供事件、异常和单个事件实例。 | CalendarView_v0数据集 |
ConferenceRoomCalendar_v0 | 提供为租户创建的会议室的 CalendarView 数据。 | ConferenceRoomCalendar_v0数据集 |
Event_v0 | 提供用户日历中的所有事件。 | Event_v0数据集 |
Event_v1 | 提供用户日历中的所有事件。 | Event_v1数据集 |
数据集名称 | 说明 | 了解详细信息 |
---|---|---|
GroupDetails_v0 | 为租户 (Azure AD) 组数据提供Microsoft Entra ID。 | GroupDetails_v0数据集 |
GroupMembers_v0 | 生成所有组的直接成员的列表。 | GroupMembers_v0数据集 |
GroupOwners_v0 | 检索所有组所有者的列表。 | GroupOwners_v0数据集 |
数据集名称 | 说明 | 了解详细信息 |
---|---|---|
Message_v0 | 提供邮件文件夹中用户接收的所有邮件的集合。 | Message_v0数据集 |
Message_v1 | 提供邮件文件夹中用户接收的所有邮件的集合。 | Message_v1数据集 |
SentItems_v0 | 提供租户所有用户发送的所有电子邮件的集合。 | SentItems_v0数据集 |
SentItems_v1 | 提供包含一些附加字段的所有已发送电子邮件的集合。 | SentItems_v1数据集 |
数据集名称 | 说明 | 了解详细信息 |
---|---|---|
Inbox_v1 | 提供来自用户邮件文件夹的邮件。 | Inbox_v1数据集 |
Mailfolder_v0 | 提供有关在用户邮箱中创建的所有文件夹的信息。 | Mailfolder_v0数据集 |
Mailfolder_v2 | 提供有关在用户邮箱中创建的所有邮件文件夹的信息。 | Mailfolder_v2数据集 |
数据集名称 | 说明 | 了解详细信息 |
---|---|---|
MailboxSettings_v0 | 提供所有用户邮箱设置的详细信息。 | MailboxSettings_v0数据集 |
数据集名称 | 说明 | 了解详细信息 |
---|---|---|
OutlookGroupConversations_v0 | 提供租户用户之间的组对话的集合。 | OutlookGroupConversations_v0数据集 |
TeamChat_v1 | 为一对一和群组聊天消息提供 Teams 聊天消息。 | TeamChat_v1数据集 |
TeamChat_v2 | 为一对一和群组聊天消息提供 Teams 聊天消息。 | TeamChat_v2数据集 |
TeamsStandardChannelMessages_v0 | 在 Teams 中提供来自标准频道的频道帖子和消息。 | TeamsStandardChannelMessages_v0数据集 |
数据集名称 | 说明 | 了解详细信息 |
---|---|---|
TeamsTranscript_v1 | 为会议或通话启用脚本时,在 Teams 中提供通话和会议脚本。 | TeamsTranscript_v1数据集 |
数据集名称 | 说明 | 了解详细信息 |
---|---|---|
DirectReport_v0 | 为用户提供所有直接下属的详细信息。 | DirectReport_v0数据集 |
Manager_v0 | 提供分配为经理的用户的列表。 | Manager_v0数据集 |
数据集名称 | 说明 | 了解详细信息 |
---|---|---|
TodoTaskFolders_v0 | 标识Microsoft Outlook 中跟踪用户级工作项的任务文件夹。 | TodoTaskFolders_v0数据集 |
TodoTasks_v0 | 标识Microsoft Outlook 中跟踪用户级工作项的任务。 | TodoTasks_v0数据集 |
PlannerTasks_v0 | 标识 Planner 中跟踪用户级工作项的任务。 | PlannerTasks_v0数据集 |
数据集名称 | 说明 | 了解详细信息 |
---|---|---|
User_v0 | 提供为特定租户创建的所有Microsoft Entra ID (Azure AD) 用户帐户存储的用户详细信息。 | User_v0数据集 |
User_v1 | 为 Azure AD) 用户帐户 (所有Microsoft Entra ID 提供用户详细信息。 | User_v1数据集 |
数据集名称 | 说明 | 示例和架构 |
---|---|---|
SharePointSites_v1 | 包含有关 SharePoint 网站的信息。 | SharePointSites_v1 |
SharePointPermissions_v1 | 包含有关共享权限的信息。 | SharePointPermissions_v1 |
SharePointGroups_v1 | 包含 SharePoint 组信息,包括有关组成员的详细信息。 | SharePointGroups_v1 |
SharePointFiles_v1 | 包含有关 SharePoint 文件的信息。 | SharePointFiles_v1 |
SharePointFileActions_v1 | 包含有关 SharePoint 文件操作的信息。 | SharePointFileActions_v1 |
OneDriveSyncHealth_v1 | 包含有关运行适用于工作或学校的 OneDrive 的设备的信息。 | OneDriveSyncHealth_v1 |
OneDriveSyncErrors_v1 | 包含有关运行 OneDrive 工作或学校版的设备上的错误的详细信息。 | OneDriveSyncErrors_v1 |
数据集名称 | 说明 | 示例和架构 | 许可证 |
---|---|---|---|
VivaInsightsDataset_Report_v1_{Viva_Insights_Query_Name} | 包含根据 Viva Insights 中用户创作的查询的指标。 | 因报表而异。 | 需要 Viva Insights 许可证。 |
注意:
{Viva_Insights_Query_Name}
表示 Viva Insights 查询名称的占位符,当与 VivaInsightsDataset_Report_v1_ 组合时,该名称构成了数据集名称。
Microsoft Graph Data Connect 支持从各种Microsoft 365区域提取数据。 若要将数据从 Microsoft 365 数据中心成功移动到 Microsoft Azure 存储,Azure Synapse 或 Azure 数据工厂实例和 Azure 存储位置都必须映射到支持的区域,以获取Microsoft 365 数据的位置。
下表指明了支持哪些 Microsoft 365 区域,以及数据移动所需的对应 Azure 区域。
Office 区域 | Azure 区域 |
---|---|
亚太地区 |
|
澳大利亚 |
|
欧洲 |
|
北美 |
|
巴西 |
|
英国 |
|
加拿大 (CAN) |
|
日本 (JPN) |
|
印度 (IND) |
|
韩国 (KOR) |
|
瑞士 (CHE) |
|
德国 (DEU) |
|
挪威 (NOR) |
|
法国 (FRA) |
|
阿联酋 (阿联酋) |
|
接收器是 Azure Synapse 或 Azure 数据工厂用于将数据置于 Azure 存储中的输出位置。 Microsoft Graph Data Connect 支持以下接收器存储类型:
接收器具有以下特点:
对于使用 Microsoft 365 作为来源的复制活动中的所有接收器类型,服务主体身份验证是唯一支持的身份验证机制。
使用 Azure 存储 Blob 作为接收器时,你必须确保应用程序对 Azure 存储 Blob 位置具有存储 Blob 数据参与者访问权限。
对于复制活动,输出文件的格式设置为 JSON。 此格式是固定的,不支持修改格式。 但是,可以使用 Azure Synapse 或 Azure 数据工厂将Microsoft Graph 数据连接管道的结果复制到另一个存储机制 (,例如 Azure SQL 数据库) 。
映射数据流: 从 Microsoft 365 (Office 365) 复制和转换数据 - Azure 数据工厂 & Azure Synapse |Microsoft Learn |
输出可以采用 parquet 格式。 有关支持的数据转换的详细信息,请参阅 映射数据流中的平展转换。
映射数据流上的 Microsoft Graph Data Connect 支持将数据直接输出到 Azure SQL DB 中。
下表指示相应复制活动和映射数据流支持的区域。
领域 | 复制活动 | 映射数据流 |
---|---|---|
支持的输出数据格式 | JSON | JSON、Parquet |
数据转换 (规范化/平展/等 ) | 需要在 ADF/Synapse 管道中执行其他转换步骤 | 支持内联转换 |
支持的数据接收器 | ADLS gen2、Azure Blob | ADLS gen2、Azure Blob、Azure SQL DB |
Azure VNET IR | 不支持 | 支持 |
培训
认证
Microsoft Certified: Azure Data Engineer Associate - Certifications
演示如何了解使用多种 Azure 服务在 Microsoft Azure 上实现和管理数据工程工作负荷的常见数据工程任务。