Data Lake 架构 - 名单

学校数据同步 (SDS) 数据湖包含从学校的学生信息系统 (SIS) /学生管理系统 (短信) 导入的数据的内部表示形式。 导出的数据与导入的数据略有不同,因为数据是规范化并纵向存储的。 湖的纵向方面用于帮助提供对 Microsoft 365 中可能不再处于活动状态的用户、类和数据的分析。

在许多情况下,使用 FirstSeenDateTime 和 LastSeenDateTime 增强数据。 SDS 不知道何时从外部 SIS 中添加/删除数据,它只知道何时首次或最后一次看到数据。

FirstSeenDateTime 是 SDS 首次看到记录的时间,以及表中该行的创建数据的时间。 这并不意味着它是 SIS/SMS 中记录的创建日期,因为 SDS 在将数据添加到外部系统后可能运行良好。

以类似的方式,LastSeenDateTime 是 SDS 最后一次看到同步数据的时刻。这不是从 SIS/SMS 中删除记录的日期,而是日期 (时间) SDS 在同步期间上次看到记录的时间。

下面的相关对象列指示此 ID 是否是其他表的外键。

域:系统

系统表表示 SDS 用来将系统保存在一起的数据。 SourceSystem 指示数据来自哪个外部系统。 RefDefinition 是整个系统中使用的值列表 (ENUMS) 。 我们的枚举用于组织类型或用户角色等项。 在 SDS 的未来版本中,客户将能够增加系统中使用的枚举。 在未来版本的 SDS 中,RefTranslation 将允许 IT 为添加到系统的枚举提供翻译文本。

导出类型:SourceSystem

列名称 列类型 相关对象 说明
ID String
名称 String
FirstSeenDateTime DateTimeOffset
LastSeenDateTime DateTimeOffset

导出类型:RefDefinition

了解 loV) 或 ENUMS (值列表。 用于验证与默认值关联的传入数据。 请参阅默认值列表

列名称 列类型 相关对象 说明
ID String
Namespace String 创建 RefDefinition 的实体的命名空间。 由 Microsoft 管理。
RefType String LoV/ENUM 名称。 同名的 RefType 表示相同的 LoV |枚举。
代码 String RefType 的 LoV/ENUM 的值
FirstSeenDateTime DateTimeOffset
LastSeenDateTime DateTimeOffset
SortOrder Int32 允许在 UX 或组织角色中对 LoV /ENUM 进行排序,以帮助定义优先级顺序。

导出类型:RefTranslation

当前未使用。 可用于客户提供的 LoV 值。

列名称 列类型 相关对象 说明
ID String RefDefinition.Id
FirstSeenDateTime DateTimeOffset
LastSeenDateTime DateTimeOffset
语言 String 翻译后的字符串的语言代码。
LocalizedName String 允许 RefDefinition 中的代码具有可翻译成不同语言的显示字符串。

域:时间

会话表示系统中的时间。 角色、节和其他关键对象必须具有一个会话来标识对象在系统中何时可用。 另请参阅学年处理 ,了解有关关联和处理与学年关联的数据的其他信息。

导出类型:会话

列名称 列类型 相关对象 说明
ID String
SourceSystemId String SourceSystem.Id 系统此时间定义来自。
ExternalId String
FirstSeenDateTime DateTimeOffset
LastSeenDateTime DateTimeOffset
名称 String
RefSessionTypeId String RefDefinition.Id 会话类型 LoV
RefAcademicYearId String RefDefinition.Id 学年 Lov - YYYY
StartDate String ISO 6801 日期格式的字符串。
EndDate String ISO 6801 日期格式的字符串。
ParentSessionId String 允许会话层次结构,包括术语和学期。

域:组织

组织表示机构实体。 组织不会链接到会话。 只有该人员与组织和角色的关联才会链接到会话。

导出类型:组织

列名称 列类型 相关对象 说明
ID String
SourceSystemId String SourceSystem.Id 组织来自的系统。
ExternalId String
FirstSeenDateTime DateTimeOffset
LastSeenDateTime DateTimeOffset
名称 String
标示符 String 例子。 组织的 NCES ID。
RefOrganizationTypeId String RefDefinition.Id 组织类型 LoV
ParentOrganizationId String 允许组织层次结构。

域:人员

人员表示人员记录。 这些未链接到会话。 只有该人员与组织和角色的关联才会链接到会话。

导出类型:人员

列名称 列类型 相关对象 说明
ID String
FirstSeenDateTime DateTimeOffset
LastSeenDateTime DateTimeOffset
Surname String 如果未提供,可以加入到Microsoft Entra用户(如果可用)。
GivenName String 如果未提供,可以加入到Microsoft Entra用户(如果可用)。
MiddleName String 如果未提供,可以加入到Microsoft Entra用户(如果可用)。
PreferredSurname String
PreferredGivenName String
PreferredMiddleName String

导出类型:PersonRelationship

PersonRelathionship 表示两个人之间的关系。 关系存储在一个方向上。 例如,如果关系联系人是父/监护人,则子级将由 PersonId 列表示,而联系人将在 RelatedPersonId 列中表示。

列名称 列类型 相关对象 说明
ID String
PersonId String Person.Id
RelatedPersonId String Person.Id
RefPersonRelationshipId String RefDefinition.Id 关系角色 LoV 值
FirstSeenDateTime DateTimeOffset

导出类型:PersonIdentifier

用户可以具有多个系统中的多个标识符。 来自 SIS/SMS、Microsoft Entra ID等的标识符都存储在此表中。

列名称 列类型 相关对象 说明
ID String 从源系统或生成。
PersonId String PersonId 与标识符相关的人员。
SourceSystemId String SourceSystem.Id 标识器来自的系统。
RefIdentifierTypeId String RefDefintion.Id 标识符 ENUM
标示符 String 标识符的值
FirstSeenDateTime DateTimeOffSet
IsPresentInSource 布尔值 指示标识器是否仍存在于其关联的源数据中。

导出类型:PersonEmailAddress

PersonEmailAddress 包含给定 Person 的上次更新信息集。

列名称 列类型 相关对象 说明
ID String
PersonId String PersonId 邮件所属的人员。
EmailAddress String
PriorityOrder Int32
RefEmailAddressTypeId String RefDefinition.Id Email地址 ENUM
FirstSeenDateTime DateTimeOffset

导出类型:PersonPhoneNumber

PersonPhoneNumber 包含给定人员上次更新的信息集。

列名称 列类型 相关对象 说明
ID String
PersonId String PersonId 与电话号码相关的人员
PhoneNumber String
PriorityOrder Int32
RefPhoneNumberTypeId String Refdefinition.Id 电话号码类型 ENUM
FirstSeenDateTime DateTimeOffset

导出类型:PersonDemographic

PersonDemographic 生存期与 Person 的更新节奏相关联;不再更新 Person 后,PersonDemographic 或任何下游表将不会发生任何更改。

列名称 列类型 相关对象 说明
PersonId String PersonId 记录属于的人员
FirstSeenDateTime DateTimeOffset
LastSeenDateTime DateTimeOffset
RefSexId String RefDefinition.Id 人口性别 LoV
生日 String Refdefinition.Id ISO 8601 日期格式的字符串
BirthCity String
BirthState String 值特定于 US。
BirthCountyCode String 未链接到 LoV

导出类型:PersonDemographicEthnicity

PersonDemographicEthnicity 包含给定 Person 的上次更新信息集。

列名称 列类型 相关对象 说明
ID String
PersonId String PersonId 此记录所属的人员
RefEthnicityId String RefDefinition.Id 人口统计种族 LoV 值
FirstSeenDateTime DateTimeOffset
LastSeenDateTime DateTimeOffset

导出类型:PersonDemographicRace

PersonDemographicRace 包含给定 Person 的上次更新信息集。

列名称 列类型 相关对象 说明
ID String
PersonId String PersonId 此记录所属的人员
RefRaceId String RefDefinition.Id 人口统计种族 LoV 值
FirstSeenDateTime DateTimeOffset
LastSeenDateTime DateTimeOffset

导出类型:PersonDemographicPersonFlag

PersonDemographicPersonFlag 包含给定 Person 的上次更新信息集。

列名称 列类型 相关对象 说明
ID String
PersonId String PersonId 此记录所属的人员
RefPersonFlagId String RefDefinition.Id 用户标志 LoV 值
FirstSeenDateTime DateTimeOffset
LastSeenDateTime DateTimeOffset

域:学术组

导出类型:节

列名称 列类型 相关对象 说明
ID String
SourceSystemId String

SourceSystem.Id
系统,该部分来自。
ExternalId String
FirstSeenDateTime DateTimeOffset
LastSeenDateTime DateTimeOffset
名称 String
OrganizatonId String Organization.Id 组织,此部分所属。
CourseId String Course.Id 与本部分关联的课程。
代码 String
位置 String

ExportType:SectionSession

Section 和 Session 之间的交集表。 关系是多对多的。

列名称 列类型 相关对象 说明
ID String
SectionId String Section.Id 关系部分
SessionId String Session.Id 关系的会话
FirstSeenDateTime DateTimeOffset
LastSeenDateTime DateTimeOffset
IsActiveInSession 布尔值 标识分区在当前会话中是否仍然处于活动状态。 如果不再从源同步,则为 FALSE。

导出类型:SectionGradeLevel

SectionGradeLevel 仅包含给定主题的最后一个读取版本。

列名称 列类型 相关对象 说明
ID String
SectionId String Section.Id
RefGradeLevelId String RefDefinition.Id 成绩级别 LoV 值
FirstSeenDateTime DateTimeOffset

导出类型:SectionSubject

SectionSubject 仅包含给定节最后提供的主题集。

列名称 列类型 相关对象 说明
ID String
SectionId String Section.Id 节,此主题相关。
RefAcademicSubjectId String RefDefinition.Id 主题 LoV 值
FirstSeenDateTime DateTimeOffset

导出类型:课程

列名称 列类型 相关对象 说明
ID String
SourceSystemId String SourceSystem.Id 系统,课程来自。
ExternalId String
FirstSeenDateTime DateTimeOffset
LastSeenDateTime DateTimeOffeset
名称 String
OrganizationId String Organization.Id 课程链接到的组织。
IsActiveInSession 布尔值 指示课程在当前会话中是否仍然处于活动状态。 如果不再从源同步,则为 FALSE。
代码 String
AcademicYearSessionId String Session.Id 与本课程关联的类型为“schoolYear”的会话 Session.Id。

导出类型:CourseGradeLevel

CourseGradeLevel 包含课程的最新数据源集。

列名称 列类型 相关对象 说明
ID String
CourseId String Course.Id 课程,此级别与
RefGradeLevelId String RefDefinition.Id 成绩级别 LoV 值
FirstSeenDateTime DateTimeOffset

导出类型:CourseSubject

CourseSubject 包含课程的最新数据源集。

列名称 列类型 相关对象 说明
ID String
CourseId String Course.Id 课程,此主题属于
RefAcademicSubjectId String RefDefinition.Id 主题 LoV 值
FirstSeenDateTime DateTimeOffset

域:隶属关系

导出类型:PersonOrganizationRole

人员、组织和会话 (时间) 之间的关系。

列名称 列类型 相关对象 说明
ID String
SourceSystemId String SourceSystem.Id 系统,组织从属关系。
ExternalId String
FirstSeenDateTime DateTimeOffset
LastSeenDateTime DateTimeOffset
OrganizationId String Organization.Id 此隶属关系所属的组织
PersonId String Person.Id 此从属关系所属的人员
RefRoleId String RefDefinition.Id 组织角色 LoV 值
SessionId String Session.Id 此附属关系有效的会话
IsActiveInSession 布尔值 定义从属关系在当前会话中是否仍处于活动状态。 如果不再从源同步,则为 FALSE
RoleStartDate String 日期组织和角色隶属关系是从此会话的源发送的开始值 (而不是记录第一次看到) 的日期。
RoleEndDate String “日期组织”和“角色隶属关系”已停止从此会话的“源”发送的值 (而不是) 最后一次看到记录的日期。
IsPrimary 布尔值 定义此组织与角色是否是从源发送的主要附属关系。
RefGradeLevelId String RefDefinition.Id 成绩级别 LoV 值

导出类型:注册

人员与分区之间的关系。 时间 (当前) 的内容也很重要,由分区会话关系决定。 SectionSession 表的存在指示注册可能跨越非连续会话。

列名称 列类型 相关对象 说明
ID String
SourceSystemId String SourceSystem.Id 系统,组织从属关系。
ExternalId String
FirstSeenDateTime DateTimeOffset
LastSeenDateTime DateTimeOffset
PersonId String Person.Id 此从属关系所属的人员
SectionId String Section.Id 此隶属关系所属的节
RefSectionRoleId String RefDefinition.Id 组织角色 LoV 值
IsActiveInSession 布尔值 定义从属关系在当前会话中是否仍处于活动状态。 如果不再从源同步,则为 FALSE
IsPrimaryStaffForSection 布尔值 定义此组织与角色是否是从源发送的主要附属关系。
EntryDate String 日期组织和角色隶属关系是从此会话的源发送的开始值 (而不是记录第一次看到) 的日期。
ExitDate String “日期组织”和“角色隶属关系”已停止从此会话的“源”发送的值 (而不是) 最后一次看到记录的日期。

相关文章

如果使用教育版 Data Lake 导出,另请参阅: - Data Lake 架构 – 登记 - Data Lake 架构 – Microsoft Entra ID