Microsoft Fabric 中 Synapse 数据仓库的新增功能和计划

重要

发布计划描述了可能或可能尚未发布的功能。 交付时间线和投影功能可能会更改或无法交付。 有关详细信息,请参阅 Microsoft 策略

Microsoft Fabric 中的 Synapse 数据仓库是第一个支持多表事务的数据仓库,原生采用开放数据格式。 该仓库基于可靠的 SQL Server 查询优化器和企业级分布式查询处理引擎构建,无需配置和管理。 Microsoft Fabric 中的 Synapse 数据仓库与数据引入数据工厂无缝集成,Power BI 用于分析和报告,以及用于数据科学和机器学习的 Synapse Spark。 它通过聚合数据湖和仓库来简化组织的分析投资。

数据仓库工作负载受益于 SQL 引擎丰富的功能,而开放数据格式使客户能够专注于分析和报告。 它们还受益于从 Data Lake Storage 虚拟化服务 OneLake 访问数据。

若要了解详细信息,请参阅文档

投资领域

功能 预计发布时间线
仓库监视体验 2024 年第 2 季度
时间旅行 2024 年第 2 季度
仓库编辑器中的就地还原 2024 年第 2 季度
COPY INTO 对安全存储的支持 2024 年第 2 季度
Copilot 2024 年第 2 季度
不区分大小写的排序规则支持 Q3 2024
ALTER TABLE - 添加可以为 null 的列 Q3 2024
截断 Q3 2024
结果集缓存 Q3 2024
自动统计信息增强功能 Q3 2024
工作负荷执行见解 Q3 2024
查询见解更新 Q3 2024
嵌套 CTE Q3 2024
笔记本集成 Q3 2024
VARCHAR(MAX)/VARBINARY(MAX) 类型 Q3 2024
字符串性能改进 Q3 2024

仓库监视体验

估计版本时间线:2024 年第 2 季度

使用内置的仓库监视体验,可以查看实时查询和历史查询、监视和排查其端到端解决方案的性能问题。

按时间顺序查看

估计版本时间线:2024 年第 2 季度

在 T-SQL 语句级别进行时间旅行的功能使用户能够通过为整个查询指定时间戳一次来查询过去各种时间范围内的历史数据。 时间旅行通过使用 One Lake 中存在的单个数据副本来执行历史趋势分析、故障排除和数据对帐,帮助大幅节省存储成本。 此外,它还通过维护数据仓库内各个表的数据完整性来实现稳定的报告。

仓库编辑器中的就地还原

估计版本时间线:2024 年第 2 季度

现在,可以使用仓库编辑器体验轻松创建还原点,并在发生意外损坏时将仓库还原到已知良好的状态。

COPY INTO 对安全存储的支持

估计版本时间线:2024 年第 2 季度

发布类型:公共预览版

现在,可以使用 COPY INTO 将数据从受防火墙保护的外部 Azure 存储帐户引入仓库。

Copilot

估计版本时间线:2024 年第 2 季度

发布类型:公共预览版

Copilot 使任何技能级别的开发人员能够在 Fabric 中快速生成和查询仓库。 Copilot 提供建议和最佳做法、自动完成代码、帮助修复和文档代码,并提供数据准备、建模和分析方面的帮助。

不区分大小写的排序规则支持

估计版本时间线:2024 年第 3 季度

使用公共 REST API 创建数据仓库包括用于设置默认排序规则的新选项。  这可用于设置新的不区分大小写的排序规则默认值。  还可以将 COLLATE 命令与 CREATE TABLE 配合使用,以直接控制 VARCHAR 字段使用的排序规则。  支持的两个排序规则是Latin1_General_100_CI_AS_KS_WS_SC_UTF8(即不区分大小写)和Latin1_General_100_BIN2_UTF8(区分大小写),并继续是我们的默认排序规则。

ALTER TABLE - 添加可以为 null 的列

估计版本时间线:2024 年第 3 季度

支持 ALTER TABLE ADD COLUMN,以便能够使用允许 NULL 值的新列扩展现有表。

TRUNCATE

估计版本时间线:2024 年第 3 季度

TRUNCATE 命令快速删除表中的所有数据行。

结果集缓存

估计版本时间线:2024 年第 3 季度

结果集缓存会保存适用查询的结果,并在后续运行时立即返回它们,从而通过绕过重新编译和重新计算来大幅减少执行时间。 缓存是自动管理的,无需手动干预。

自动统计信息增强功能

估计版本时间线:2024 年第 3 季度

计划了各种增强功能 - 自动统计信息更新的执行时间较短、对 VARCHAR(MAX) 列类型的机会性支持、改进了中间统计信息步骤的存储、用户查询之外的自动统计信息维护。

工作负荷执行见解

估计版本时间线:2024 年第 3 季度

通过这项新功能,用户可以更深入地了解查询在运行查询之前如何执行查询。 用户获取有关查询执行的关键步骤、过去类似的查询以及可能影响工作负荷的仓库的总体条件的信息。

查询见解更新

估计版本时间线:2024 年第 3 季度

将通过 Query Insights 提供已关闭会话的历史视图。 此外,它还有助于分析 DW 的流量、负载和使用情况。

嵌套 CTE

估计版本时间线:2024 年第 3 季度

通用表表达式(CTE)通过将通常的复杂查询分解为简单的块(如有必要),而不是重写查询,从而提高了复杂查询的可读性和简化性。   使用另一个 CTE 的定义定义定义嵌套 CTE。

笔记本集成

估计版本时间线:2024 年第 3 季度

发布类型:公共预览版

可以在笔记本中使用 T-SQL 语言支持,它将笔记本和 SQL 的强大功能结合在同一体验中 - 启用 Intellisense、自动完成、跨数据库查询、更丰富的可视化效果以及使用笔记本轻松协作和共享的功能。

VARCHAR(MAX)/VARBINARY(MAX) 类型

估计版本时间线:2024 年第 3 季度

用户可以使用数据仓库中的 VARCHAR(MAX)/VARBINARY(MAX)类型定义列,以存储字符串或二进制数据,最大为 1 MB。 在 Lakehouse 的 SQL 终结点中,Delta 表中的字符串类型表示为 VARCHAR(MAX),而不会截断为 8 知识库(KB)。 使用 VARCHAR(MAX)和 VARCHAR(8000)类型的查询之间的性能差异已最小化,使用户能够使用大型类型,而不会受到重大性能损失。

字符串性能改进

估计版本时间线:2024 年第 3 季度

对字符串(VARCHAR(N)的操作在 T-SQL 查询中很常见。 对使用字符串的字符串函数和运算符的性能提升查询的性能,这些查询使用 WHERE 谓词中的 LIKE 谓词、 字符串函数 和比较运算符,以及使用字符串类型的 GROUP BY、ORDER BY、JOIN 等运算符。