适用于:Microsoft Fabric 中的✅ 仓库
仓库快照是特定时间点仓库项的只读表示形式,最多保留 30 天。 若要开始, 请创建仓库快照。
注释
仓库快照目前是 预览功能。
仓库快照可以按需无缝地“前滚”,使使用者能够连接到同一快照或使用一致的仓库连接字符串来访问过去版本的数据。 向前滚动快照时间戳时,会立即应用更新,就像在单个原子事务中一样。 仓库快照可确保数据工程师可以向分析用户提供一致的数据集,即使发生实时更新也是如此。 分析人员可以根据快照运行 SELECT
查询,而不会造成任何 ETL 干扰。
在 ETL 进程可能已创建数据损坏的情况下,快照非常有用。 此"只读"子项为可能被某些 ETL 进程修改的数据提供稳定性和一致性。
仓库快照决策指南
下表将 Lakehouse 的 SQL 分析终结点与仓库快照进行比较。
功能 / 特点 | Lakehouse 的 SQL 分析端点 | 仓库快照 |
---|---|---|
已创建 | 系统自动生成 | 父仓库的用户创建子项 |
主要功能 | 查询 Lakehouse 中的 Delta 表。 支持对 Lakehouse 的 Delta 表以及通过快捷方式引用的 Delta Lake 文件夹进行分析。 | 查询父仓库的指定时间点 |
数据修改 | 只读 | 只读 |
存储格式 | 三角洲 | 没有单独的存储,依赖于数据源仓库,没有 Parquet 文件 |
数据加载 | Spark、管道、数据流、快捷方式 | 加载到父仓库中的数据 |
T-SQL 支持 | 完全 DQL(数据查询语言),无 DML(数据操作语言),有限的 DDL(数据定义语言),例如支持视图和表值函数。 | 完整的 DQL、没有 DML、没有 DDL(仅限于管理员、成员或贡献者更新快照时间戳),不创建视图或表值函数。 |
用例 | 探索和查询湖仓的增量表、暂存数据、分层湖仓体系结构,以及用于青铜、白银和黄金分析的分区。 | 访问稳定版本的仓库、ETL 一致性、历史分析、报告准确性,通过创建每小时、每日或每周仓库快照来满足特定业务需求 |
权限
必须在源数据库中设置安全权限。
- 具有管理员、成员或参与者 工作区角色 的用户可以创建和管理仓库快照。
- 具有管理员、成员或参与者角色的用户可以通过 T-SQL 和 Fabric 门户修改快照时间戳。
- 在工作区中具有管理员、成员、参与者、查看者角色的用户或在父仓库有访问权限的共享收件人都可以查询子快照。
更新快照时间戳
更新快照时间戳可以为分析使用者提供稳定的数据版本。 正在进行的查询将始终依据其启动时的数据版本完成。 向前滚动快照时间戳时,数据更新将立即可用,数据不会延迟或不一致。
用户可以随时更新现有仓库快照的时间戳。 此操作会马上完成。
若要更新仓库快照的时间戳,请参阅 更新快照时间戳。
运行 T-SQL 查询时,将包含有关所访问数据的当前版本的信息。 例如,可以在 Fabric 门户查询编辑器的消息中看到时间戳:
安全性和治理
- 快照从源仓库继承权限。 无论源仓库中的权限级别如何,对所有用户而言,仓库快照都是只读的。 唯一的例外是管理员/成员/参与者可以通过 TSQL 或 Fabric 门户更新快照的时间戳。
- 源仓库中的任何权限更改都立即应用于快照。 无论快照时间戳如何,用户访问权限(如 GRANT、DENY、REVOKE 和 UNMASK)都反映源仓库的状态。
- 如果用户以后失去访问权限,则无法查询快照。
- 例如,如果消费者的权限被拒绝在下午12:00访问数据,则这适用于仓库和快照。 如果快照时间戳设置为上午 11:00,则会立即在快照中强制实施被拒绝的权限。
注释
Fabric 数据仓库中的稳定报告承诺适用于数据,不适用于架构。 例如,如果报表引用快照中的表、视图或列,并且该对象稍后将从父仓库中删除、重命名或更改,则快照将反映该更改。 因此,报告可能会中断。 预期会出现此行为,因为快照机制旨在保持数据一致性,而不是架构稳定性。
管理快照
- 仓库快照需要具有唯一的名称,该名称不仅在仓库中是唯一的,而且在 SQL 分析终结点中也是唯一的。
- 如果没有源仓库,仓库快照就不存在。 删除仓库后,将删除所有快照。 如果还原了仓库,则必须重新创建仓库快照。
- 仓库快照在过去最多 30 天内有效。 快照日期时间可以设置为过去最多 30 天或数据库创建时间的任何日期(以以后为准)。
局限性
- 只能针对 2025 年 3 月之后创建的新仓库项创建仓库快照。
- 仓库快照不会显示在 SSMS 对象资源管理器中,但确实显示在数据库选择下拉列表中。
- 在快照时间戳之后修改的表、视图和存储过程在快照中变得无效。
- 仓库快照需要 Power BI 中的直接查询或导入模式,并且不支持 Direct Lake 模式。
- Lakehouse 的 SQL 分析终结点不支持仓库快照。
- 数据仓库快照不支持作为 OneLake 快捷方式的源。