启用教育版 Data Lake 导出

重要

如果当前使用的是学校数据同步 (经典) 则需要计划 过渡到新的 SDS 体验 以利用此功能。

本文提供有关教育版 Data Lake 导出功能的信息。 它还提供有关使用 Microsoft 的 Open 教育版分析 将教育版 Insights数据导出到 Microsoft Azure Data Lake (Data Lake) 的指导和技术资源。

概述

教育 Data Lake 导出允许客户使用 Data Services 获取包含活动数据的 Data Lake 副本,以便进行自己的自定义分析。

  • 导出使用 Microsoft Azure Data Share (Data Share) 将 Blob 从 Microsoft 订阅复制到客户 Azure 订阅。
  • Data Share生成可导出到组织的 Data Lake 的见解数据的快照。
  • Data Share有助于简化此过程,以安全地导出数据。 然后,组织可以使用 Microsoft Synapse、Azure 机器学习和/或 Power BI 来创建自己的自定义分析和报表。

借助 Azure Data Lake 中的教育版 Insights数据,组织可以将其与其他数据源(例如 SIS、LMS 或评估数据)合并。

注意

如果启用了教育 Data Lake 导出,则活动数据仅存储在 Data Lake 中。

Microsoft Education 还开发了 Open 教育版分析 (OEA)

  • OEA 包括一组开放源代码技术资源,使教育组织能够快速轻松地设置自己的 Azure 数据分析环境。

  • OEA 包括用于教育版 Insights数据的特殊模块,其中包括数据管道、数据组织笔记本、测试数据和 Power BI 模板。

对于希望仅设置教育 Data Lake 导出的租户,需要执行三个步骤来使用教育版 Insights数据进行自定义分析:

  1. 为 Microsoft 365 教育版 租户设置学校数据同步 (SDS)

    • 需要全局管理员权限
    • 已启用学校数据同步计划 若要验证,请导航到管理员中心>用户>许可并验证是否已选择学校数据同步计划。
  2. 设置 Education Data Lake 导出以将名册、Azure AD 用户和组以及活动数据复制到 Azure Data Lake

  3. 使用 OEA 设置 Azure Data Lake

教育 Data Lake 导出如何工作?

教育版 Data Lake 导出利用Data Share作为数据同步管道,在设置时,该管道将数据快照从源存储 Data Lake 传输到租户的 Azure 订阅中的目标存储。

设置 Education Data Lake 导出功能的过程包括:

  • 设置 SDS,为机构的 SIS/SMS 名单数据创建入站数据流。

  • 完成第一次运行,并查看处理入站数据时发现的任何错误或警告的结果。

  • 更正源系统中的任何错误,并等待下一次运行来查看结果。

  • 完成设置教育版 Data Lake 导出功能的步骤。

  • 按照步骤在 Azure 订阅中设置 Open 教育版分析。

  • 在 Azure 订阅中接受邀请并配置目标存储。

为Microsoft 365 教育版租户设置 SDS

步骤 1:在 SDS 中设置入站数据流:

步骤 2:查看 SDS 中入站流运行的结果以确定数据运行状况:

  • 运行状况和监控

  • 如果需要,请修复源系统中识别的任何错误和警告,并等待下一次运行完成。

步骤 3:启用教育版 Data Lake 导出 (请参阅以下步骤)

启用教育版 Data Lake 导出

  1. 在“主页”的“主要操作”下,选择“ 启用教育版 Data Lake 导出”。 你将看到一个浮出窗口。

    启用 EDU Data Lake 导出顶部操作

    打开的浮出控件

    通过设置 Education Data Lake 导出以使机构数据可用,可以表示:

    • 你有权使用此数据
    • 承诺遵守组织的数据治理标准
  2. 从将接收Data Share邀请的可用全局租户管理员列表中选择。

    选择“全局租户管理员

  3. 选择“ 发送邀请 ”以创建数据共享。 所选租户管理员将在租户 Azure 订阅中Data Share邀请。

    选择“发送邀请”

  4. 确认 Education Data Lake 导出请求后,你将看到一条确认消息。

    发送邀请

    已发送邀请

    发送邀请后,所选租户管理员可以登录到其 Azure 订阅以查看数据共享邀请。 若要直接从 Azure 订阅打开邀请,请访问 Azure 订阅中的Data Share邀请。 此操作将转到Data Share邀请列表。

  5. 选择浮出控件顶部的“X”以关闭并返回到主页。

    关闭浮出控件

    你会注意到 Microsoft 365 服务部分下标题为“Education Data Lake 导出”的新卡片。

    注意

    在收件人接受邀请并将目标存储配置为接收快照之前,Education Data Lake 导出状态将处于待处理邀请接受状态。

    收件人接受邀请并将目标存储配置为接收快照后,卡上的状态将更新为 “已启用”。

    重要

    启用 Education Data Lake 导出还会调用一个过程将用户活动数据回填到数据湖中, (大约 90 天 (大约 3 个月) 。 根据用户活动数据量,完成回填可能需要一段时间,因此数据快照将包括截至该点捕获的回填数据。

设置开放教育版分析

接收教育版 Data Lake 导出邀请并配置 Azure 订阅

有关接收邀请和为租户设置 Azure 订阅的步骤,请参阅“教程:使用 ADS 接受和接收数据”,从“先决条件”部分开始。

常见问题

教育版 Insights活动日志输出的范围是什么?

输出适用于所有用户/团队。

从设置 Education Data Lake 导出起,教育版 Insights活动日志包含数据有多远?

自首次启用导出之日起,90 天的数据将存储在教育 Data Lake 中。 它将每天收集数据。

使用教育 Data Lake 导出生成的活动文件的结构是什么?

下面是架构文章:

接受邀请后,目标存储/文件夹将直接在其下创建 Microsoft 365 文件夹。 在此文件夹下方,后跟一个“活动”文件夹。 每天创建一个基于 YYYY-MM-DD 的文件夹,其活动数据基于 CSV 格式的 1-GB 文件,具体取决于以下模式。

  • ApplicationUsage.Part001.csv
  • ApplicationUsage.Part002.csv
  • ApplicationUsege.Part003.csv

更新由 SDS 捕获和链接的用户、类等 (名册数据,) 也会导出。 此外,Azure AD 的副本将放置在同一目标存储/文件夹中。

活动日志将用户和团队 ID 输出为 Azure AD 对象 ID 和 Office 组 ID,这些 ID 可链接到托管 SDS 用户和组 ID。

使用教育 Data Lake 导出生成的活动文件的时间安排是什么?

UTC 时间 00:00 将生成前一天的活动日志。 该天的数据将从 UTC 时间 00:00:00 到 23.59:59 之间。

使用后续 SDS,运行前几天的活动数据将包含在复制到目标存储/文件夹的快照中。

活动日志输出由哪个单元 (团队) ?

没有这样的单位。 每天创建一个 YYYY-MM-DD 文件夹,其中包含基于当天 CSV 格式的 1 GB 文件的活动数据。

是否可以在活动日志中获取操作目标的文件名?

否。 使用审核日志获取文件名。

是否可以从活动日志中的 Teams 聊天获取消息?

否。 使用图形 API检索聊天消息。

是否可以将数据导出到本地环境?

否。

Azure 订阅中的 Microsoft 365 租户和教育 Data Lake 导出目标存储/文件夹是否需要相同?

是的,这是必要的。

Microsoft 365 租户从教育版 Data Lake 导出到 Azure 订阅目标存储/文件夹之间的通信是否通过公共 Internet?

不,通信不会通过公共互联网。

禁用教育版 Data Lake 导出

  1. 在“主页”的“Microsoft 365 服务”部分下,在标题为“Microsoft 365 服务管理操作”的卡片上,选择“ 教育 Data Lake 导出”按钮。 你将看到一个浮出窗口。

    显示主页的屏幕截图。

    显示打开的浮出窗格的屏幕截图。

  2. 选择“ 删除共享 ”按钮。

    显示“删除共享”按钮的屏幕截图。

  3. 查看显示的对话框“是否确实要删除 Education Data Lake 导出?

    注意

    通过确认删除 Education Data Lake 导出,它将停止收集和删除 Data Lake 中收集的活动数据。 如果稍后重新打开, (大约 3 个月) 90 天内收集的活动数据将不会添加回来。 此外,如果接受邀请,它将停止将新数据 (快照) 写入 Azure 租户存储。 这不会删除关联的 Azure 租户存储中存在的任何数据。 需要单独删除 Azure 租户存储中的数据。

    若要确认要删除,请选择“ 确认”。 如果不想删除它,请选择 “取消”。

    显示确认删除共享的提示的屏幕截图。

  4. 确认 Education Data Lake 导出请求后,你将看到一条确认消息。

    显示处理删除请求的屏幕截图。

    显示已接收删除进程的确认的屏幕截图。

  5. 选择浮出控件顶部的“X”以关闭并返回到主页。

    你将注意到 Microsoft 365 服务部分下标题为“Education Data Lake 导出”的卡片不再显示。

    注意

    不再启用服务后,你将看到“Top”操作卡再次出现。

    顶部操作重新出现

相关文章

Data Lake 架构 - 名单

Data Lake 架构 - Azure AD

Data Lake 架构 - 活动