Data Lake 架构 - 名单
学校数据同步 (SDS) 数据湖包含从学校的学生信息系统 (SIS) /学生管理系统 (短信) 导入的数据的内部表示形式。 导出的数据与导入的数据略有不同,因为数据是规范化并纵向存储的。 湖的纵向方面用于帮助提供对 Microsoft 365 中可能不再处于活动状态的用户、类和数据的分析。
在许多情况下,使用 FirstSeenDateTime 和 LastSeenDateTime 增强数据。 SDS 不知道何时从外部 SIS 中添加/删除数据,它只知道何时首次或最后一次看到数据。
FirstSeenDateTime 是 SDS 首次看到记录的时间,以及表中该行的创建数据的时间。 这并不意味着它是 SIS/SMS 中记录的创建日期,因为 SDS 在将数据添加到外部系统后可能运行良好。
以类似的方式,LastSeenDateTime 是 SDS 最后一次看到同步数据的时刻。这不是从 SIS/SMS 中删除记录的日期,而是日期 (时间) SDS 在同步期间上次看到记录的时间。
下面的相关对象列指示此 ID 是否是其他表的外键。
域:系统
系统表表示 SDS 用来将系统保存在一起的数据。 SourceSystem 指示数据来自哪个外部系统。 RefDefinition 是整个系统中使用的值列表 (ENUMS) 。 我们的枚举用于组织类型或用户角色等项。 在 SDS 的未来版本中,客户将能够增加系统中使用的枚举。 在未来版本的 SDS 中,RefTranslation 将允许 IT 为添加到系统的枚举提供翻译文本。
导出类型:SourceSystem
列名称 | 列类型 | 相关对象 | 说明 |
---|---|---|---|
ID | String | ||
名称 | String | ||
FirstSeenDateTime | DateTimeOffset | ||
LastSeenDateTime | DateTimeOffset |
导出类型:RefDefinition
了解 loV) 或 ENUMS (值列表。 用于验证与默认值关联的传入数据。 请参阅默认值列表。
列名称 | 列类型 | 相关对象 | 说明 |
---|---|---|---|
ID | String | ||
Namespace | String | 创建 RefDefinition 的实体的命名空间。 由 Microsoft 管理。 | |
RefType | String | LoV/ENUM 名称。 同名的 RefType 表示相同的 LoV |枚举。 | |
代码 | String | RefType 的 LoV/ENUM 的值 | |
FirstSeenDateTime | DateTimeOffset | ||
LastSeenDateTime | DateTimeOffset | ||
SortOrder | Int32 | 允许在 UX 或组织角色中对 LoV /ENUM 进行排序,以帮助定义优先级顺序。 |
导出类型:RefTranslation
当前未使用。 可用于客户提供的 LoV 值。
列名称 | 列类型 | 相关对象 | 说明 |
---|---|---|---|
ID | String | RefDefinition.Id | |
FirstSeenDateTime | DateTimeOffset | ||
LastSeenDateTime | DateTimeOffset | ||
语言 | String | 翻译后的字符串的语言代码。 | |
LocalizedName | String | 允许 RefDefinition 中的代码具有可翻译成不同语言的显示字符串。 |
域:时间
会话表示系统中的时间。 角色、节和其他关键对象必须具有一个会话来标识对象在系统中何时可用。 另请参阅学年处理 ,了解有关关联和处理与学年关联的数据的其他信息。
导出类型:会话
列名称 | 列类型 | 相关对象 | 说明 |
---|---|---|---|
ID | String | ||
SourceSystemId | String | SourceSystem.Id | 系统此时间定义来自。 |
ExternalId | String | ||
FirstSeenDateTime | DateTimeOffset | ||
LastSeenDateTime | DateTimeOffset | ||
名称 | String | ||
RefSessionTypeId | String | RefDefinition.Id | 会话类型 LoV |
RefAcademicYearId | String | RefDefinition.Id | 学年 Lov - YYYY |
StartDate | String | ISO 6801 日期格式的字符串。 | |
EndDate | String | ISO 6801 日期格式的字符串。 | |
ParentSessionId | String | 允许会话层次结构,包括术语和学期。 |
域:组织
组织表示机构实体。 组织不会链接到会话。 只有该人员与组织和角色的关联才会链接到会话。
导出类型:组织
列名称 | 列类型 | 相关对象 | 说明 |
---|---|---|---|
ID | String | ||
SourceSystemId | String | SourceSystem.Id | 组织来自的系统。 |
ExternalId | String | ||
FirstSeenDateTime | DateTimeOffset | ||
LastSeenDateTime | DateTimeOffset | ||
名称 | String | ||
标示符 | String | 例子。 组织的 NCES ID。 | |
RefOrganizationTypeId | String | RefDefinition.Id | 组织类型 LoV |
ParentOrganizationId | String | 允许组织层次结构。 |
域:人员
人员表示人员记录。 这些未链接到会话。 只有该人员与组织和角色的关联才会链接到会话。
导出类型:人员
列名称 | 列类型 | 相关对象 | 说明 |
---|---|---|---|
ID | String | ||
FirstSeenDateTime | DateTimeOffset | ||
LastSeenDateTime | DateTimeOffset | ||
Surname | String | 如果未提供,可以加入到Microsoft Entra用户(如果可用)。 | |
GivenName | String | 如果未提供,可以加入到Microsoft Entra用户(如果可用)。 | |
MiddleName | String | 如果未提供,可以加入到Microsoft Entra用户(如果可用)。 | |
PreferredSurname | String | ||
PreferredGivenName | String | ||
PreferredMiddleName | String |
导出类型:PersonRelationship
PersonRelathionship 表示两个人之间的关系。 关系存储在一个方向上。 例如,如果关系联系人是父/监护人,则子级将由 PersonId 列表示,而联系人将在 RelatedPersonId 列中表示。
列名称 | 列类型 | 相关对象 | 说明 |
---|---|---|---|
ID | String | ||
PersonId | String | Person.Id | |
RelatedPersonId | String | Person.Id | |
RefPersonRelationshipId | String | RefDefinition.Id | 关系角色 LoV 值 |
FirstSeenDateTime | DateTimeOffset |
导出类型:PersonIdentifier
用户可以具有多个系统中的多个标识符。 来自 SIS/SMS、Microsoft Entra ID等的标识符都存储在此表中。
列名称 | 列类型 | 相关对象 | 说明 |
---|---|---|---|
ID | String | 从源系统或生成。 | |
PersonId | String | PersonId | 与标识符相关的人员。 |
SourceSystemId | String | SourceSystem.Id | 标识器来自的系统。 |
RefIdentifierTypeId | String | RefDefintion.Id | 标识符 ENUM |
标示符 | String | 标识符的值 | |
FirstSeenDateTime | DateTimeOffSet | ||
IsPresentInSource | 布尔值 | 指示标识器是否仍存在于其关联的源数据中。 |
导出类型:PersonEmailAddress
PersonEmailAddress 包含给定 Person 的上次更新信息集。
列名称 | 列类型 | 相关对象 | 说明 |
---|---|---|---|
ID | String | ||
PersonId | String | PersonId | 邮件所属的人员。 |
EmailAddress | String | ||
PriorityOrder | Int32 | ||
RefEmailAddressTypeId | String | RefDefinition.Id | Email地址 ENUM |
FirstSeenDateTime | DateTimeOffset |
导出类型:PersonPhoneNumber
PersonPhoneNumber 包含给定人员上次更新的信息集。
列名称 | 列类型 | 相关对象 | 说明 |
---|---|---|---|
ID | String | ||
PersonId | String | PersonId | 与电话号码相关的人员 |
PhoneNumber | String | ||
PriorityOrder | Int32 | ||
RefPhoneNumberTypeId | String | Refdefinition.Id | 电话号码类型 ENUM |
FirstSeenDateTime | DateTimeOffset |
导出类型:PersonDemographic
PersonDemographic 生存期与 Person 的更新节奏相关联;不再更新 Person 后,PersonDemographic 或任何下游表将不会发生任何更改。
列名称 | 列类型 | 相关对象 | 说明 |
---|---|---|---|
PersonId | String | PersonId | 记录属于的人员 |
FirstSeenDateTime | DateTimeOffset | ||
LastSeenDateTime | DateTimeOffset | ||
RefSexId | String | RefDefinition.Id | 人口性别 LoV |
生日 | String | Refdefinition.Id | ISO 8601 日期格式的字符串 |
BirthCity | String | ||
BirthState | String | 值特定于 US。 | |
BirthCountyCode | String | 未链接到 LoV |
导出类型:PersonDemographicEthnicity
PersonDemographicEthnicity 包含给定 Person 的上次更新信息集。
列名称 | 列类型 | 相关对象 | 说明 |
---|---|---|---|
ID | String | ||
PersonId | String | PersonId | 此记录所属的人员 |
RefEthnicityId | String | RefDefinition.Id | 人口统计种族 LoV 值 |
FirstSeenDateTime | DateTimeOffset | ||
LastSeenDateTime | DateTimeOffset |
导出类型:PersonDemographicRace
PersonDemographicRace 包含给定 Person 的上次更新信息集。
列名称 | 列类型 | 相关对象 | 说明 |
---|---|---|---|
ID | String | ||
PersonId | String | PersonId | 此记录所属的人员 |
RefRaceId | String | RefDefinition.Id | 人口统计种族 LoV 值 |
FirstSeenDateTime | DateTimeOffset | ||
LastSeenDateTime | DateTimeOffset |
导出类型:PersonDemographicPersonFlag
PersonDemographicPersonFlag 包含给定 Person 的上次更新信息集。
列名称 | 列类型 | 相关对象 | 说明 |
---|---|---|---|
ID | String | ||
PersonId | String | PersonId | 此记录所属的人员 |
RefPersonFlagId | String | RefDefinition.Id | 用户标志 LoV 值 |
FirstSeenDateTime | DateTimeOffset | ||
LastSeenDateTime | DateTimeOffset |
域:学术组
导出类型:节
列名称 | 列类型 | 相关对象 | 说明 |
---|---|---|---|
ID | String | ||
SourceSystemId | String | SourceSystem.Id |
系统,该部分来自。 |
ExternalId | String | ||
FirstSeenDateTime | DateTimeOffset | ||
LastSeenDateTime | DateTimeOffset | ||
名称 | String | ||
OrganizatonId | String | Organization.Id | 组织,此部分所属。 |
CourseId | String | Course.Id | 与本部分关联的课程。 |
代码 | String | ||
位置 | String |
ExportType:SectionSession
Section 和 Session 之间的交集表。 关系是多对多的。
列名称 | 列类型 | 相关对象 | 说明 |
---|---|---|---|
ID | String | ||
SectionId | String | Section.Id | 关系部分 |
SessionId | String | Session.Id | 关系的会话 |
FirstSeenDateTime | DateTimeOffset | ||
LastSeenDateTime | DateTimeOffset | ||
IsActiveInSession | 布尔值 | 标识分区在当前会话中是否仍然处于活动状态。 如果不再从源同步,则为 FALSE。 |
导出类型:SectionGradeLevel
SectionGradeLevel 仅包含给定主题的最后一个读取版本。
列名称 | 列类型 | 相关对象 | 说明 |
---|---|---|---|
ID | String | ||
SectionId | String | Section.Id | |
RefGradeLevelId | String | RefDefinition.Id | 成绩级别 LoV 值 |
FirstSeenDateTime | DateTimeOffset |
导出类型:SectionSubject
SectionSubject 仅包含给定节最后提供的主题集。
列名称 | 列类型 | 相关对象 | 说明 |
---|---|---|---|
ID | String | ||
SectionId | String | Section.Id | 节,此主题相关。 |
RefAcademicSubjectId | String | RefDefinition.Id | 主题 LoV 值 |
FirstSeenDateTime | DateTimeOffset |
导出类型:课程
列名称 | 列类型 | 相关对象 | 说明 |
---|---|---|---|
ID | String | ||
SourceSystemId | String | SourceSystem.Id | 系统,课程来自。 |
ExternalId | String | ||
FirstSeenDateTime | DateTimeOffset | ||
LastSeenDateTime | DateTimeOffeset | ||
名称 | String | ||
OrganizationId | String | Organization.Id | 课程链接到的组织。 |
IsActiveInSession | 布尔值 | 指示课程在当前会话中是否仍然处于活动状态。 如果不再从源同步,则为 FALSE。 | |
代码 | String | ||
AcademicYearSessionId | String | Session.Id | 与本课程关联的类型为“schoolYear”的会话 Session.Id。 |
导出类型:CourseGradeLevel
CourseGradeLevel 包含课程的最新数据源集。
列名称 | 列类型 | 相关对象 | 说明 |
---|---|---|---|
ID | String | ||
CourseId | String | Course.Id | 课程,此级别与 |
RefGradeLevelId | String | RefDefinition.Id | 成绩级别 LoV 值 |
FirstSeenDateTime | DateTimeOffset |
导出类型:CourseSubject
CourseSubject 包含课程的最新数据源集。
列名称 | 列类型 | 相关对象 | 说明 |
---|---|---|---|
ID | String | ||
CourseId | String | Course.Id | 课程,此主题属于 |
RefAcademicSubjectId | String | RefDefinition.Id | 主题 LoV 值 |
FirstSeenDateTime | DateTimeOffset |
域:隶属关系
导出类型:PersonOrganizationRole
人员、组织和会话 (时间) 之间的关系。
列名称 | 列类型 | 相关对象 | 说明 |
---|---|---|---|
ID | String | ||
SourceSystemId | String | SourceSystem.Id | 系统,组织从属关系。 |
ExternalId | String | ||
FirstSeenDateTime | DateTimeOffset | ||
LastSeenDateTime | DateTimeOffset | ||
OrganizationId | String | Organization.Id | 此隶属关系所属的组织 |
PersonId | String | Person.Id | 此从属关系所属的人员 |
RefRoleId | String | RefDefinition.Id | 组织角色 LoV 值 |
SessionId | String | Session.Id | 此附属关系有效的会话 |
IsActiveInSession | 布尔值 | 定义从属关系在当前会话中是否仍处于活动状态。 如果不再从源同步,则为 FALSE | |
RoleStartDate | String | 日期组织和角色隶属关系是从此会话的源发送的开始值 (而不是记录第一次看到) 的日期。 | |
RoleEndDate | String | “日期组织”和“角色隶属关系”已停止从此会话的“源”发送的值 (而不是) 最后一次看到记录的日期。 | |
IsPrimary | 布尔值 | 定义此组织与角色是否是从源发送的主要附属关系。 | |
RefGradeLevelId | String | RefDefinition.Id | 成绩级别 LoV 值 |
导出类型:注册
人员与分区之间的关系。 时间 (当前) 的内容也很重要,由分区会话关系决定。 SectionSession 表的存在指示注册可能跨越非连续会话。
列名称 | 列类型 | 相关对象 | 说明 |
---|---|---|---|
ID | String | ||
SourceSystemId | String | SourceSystem.Id | 系统,组织从属关系。 |
ExternalId | String | ||
FirstSeenDateTime | DateTimeOffset | ||
LastSeenDateTime | DateTimeOffset | ||
PersonId | String | Person.Id | 此从属关系所属的人员 |
SectionId | String | Section.Id | 此隶属关系所属的节 |
RefSectionRoleId | String | RefDefinition.Id | 组织角色 LoV 值 |
IsActiveInSession | 布尔值 | 定义从属关系在当前会话中是否仍处于活动状态。 如果不再从源同步,则为 FALSE | |
IsPrimaryStaffForSection | 布尔值 | 定义此组织与角色是否是从源发送的主要附属关系。 | |
EntryDate | String | 日期组织和角色隶属关系是从此会话的源发送的开始值 (而不是记录第一次看到) 的日期。 | |
ExitDate | String | “日期组织”和“角色隶属关系”已停止从此会话的“源”发送的值 (而不是) 最后一次看到记录的日期。 |
相关文章
如果使用教育版 Data Lake 导出,另请参阅: - Data Lake 架构 – 登记 - Data Lake 架构 – Microsoft Entra ID