了解即将发布的 Azure Databricks 版本中的功能和行为更改。
Genie 数据采样即将正式发布
数据采样使用从所选列中采样的值,将用户提示映射到正确的列级和行级值,从而提高 Genie 的准确性。 正式发布后,默认情况下,所有 Genie 空间都将启用此功能。 有关详细信息,请参阅 使用值采样来提高 Genie 的准确性 。
出站控制平面公共 IP 的更新
Azure Databricks 正在更新 出站控制平面公共 IP 和 Azure 服务标记,以提高安全性和区域可用性。 这些更改是自 2025 年 5 月 20 日开始推出的控制平面更新的一部分。
如果你的组织使用资源防火墙来控制入站访问:
- 如果防火墙规则引用 Azure Databricks 服务标记,则无需执行任何作。
- 如果允许使用特定的控制平面公共 IP,则必须:
请勿在 8 月 4 日之前删除旧 IP,因为它们将一直使用到该日期。
自动加载程序增量目录列表选项的行为更改
注释
自动加载程序 cloudFiles.useIncrementalListing
选项已弃用。 尽管此说明讨论了对选项默认值的更改,以及如何在此更改后继续使用它,但 Databricks 建议不要使用此选项,转而使用 文件事件的文件通知模式。
在即将发布的 Databricks Runtime 版本中,弃用的自动加载程序 cloudFiles.useIncrementalListing
选项的值将默认设置为 false
。 将此值设置为 false
使自动加载程序每次运行时执行完整目录列表。 目前,cloudFiles.useIncrementalListing
选项的默认值为 auto
,指示自动加载程序尽最大努力检测是否可以将增量列表与目录一起使用。
若要继续使用增量列表功能,请将 cloudFiles.useIncrementalListing
选项设置为 auto
。 将此值 auto
设置为时,自动加载程序会尽力尝试每七个增量列表执行一次完整列表,这与此选项在更改之前的行为匹配。
若要了解有关自动加载程序目录列表的详细信息,请参阅 具有目录列表模式的自动加载程序流。
从 Lakeflow 声明性管道中删除数据集定义时的行为更改
即将发布的 Lakeflow 声明性管道将更改从管道中删除具体化视图或流式处理表时的行为。 由于这项更改,下一次管道更新运行时,不会自动删除已移除的具体化视图或流式处理表。 你将可以使用 DROP MATERIALIZED VIEW
命令来删除具体化视图,或使用 DROP TABLE
命令来删除流式处理表。 删除对象后,运行管道更新不会自动恢复该对象。 如果将具有相同定义的具体化视图或流式处理表重新添加到管道,则会创建一个新对象。 但是,可以使用 UNDROP
命令恢复对象。
旧版仪表板的终止支持时间表
- 截至 2025 年 4 月 7 日,对旧版仪表板的官方支持已结束。 只会解决严重的安全问题和服务中断。
- 2025 年 11 月 3 日:Databricks 将开始对过去六个月未访问的旧版仪表板进行存档。 存档的仪表板将不再可访问,存档过程将以滚动的方式进行。 对活跃使用的仪表板的访问将保持不变。
Databricks 将与客户合作,在 2025 年 11 月 3 日之后为活动旧版仪表板制定迁移计划。
为了帮助过渡到 AI/BI 仪表板,可以在用户界面和 API 中使用升级工具。 有关如何在 UI 中使用内置迁移工具的说明,请参阅 将旧版仪表板克隆到 AI/BI 仪表板。 有关使用 REST API 创建和管理仪表板的教程,请参阅使用 Azure Databricks API 管理仪表板。
审核日志中的 sourceIpAddress 字段将不再包含端口号
由于某个 bug,某些授权和身份验证审核日志在 sourceIPAddress
字段中除了包含 IP 之外,还包含端口号(例如 "sourceIPAddress":"10.2.91.100:0"
)。 端口号记录为 0
,不提供任何实际值,并且与 Databricks 审核日志的其余部分不一致。 为了增强审核日志的一致性,Databricks 计划更改这些审核日志事件的 IP 地址格式。 此更改将从 2024 年 8 月初开始逐步推出。
如果审核日志包含 sourceIpAddress
的 0.0.0.0
,Databricks 可能会停止记录该日志。