2018 年 3 月
发布分阶段进行。 Azure Databricks 帐户可能要等到初始发布日期后的一周内才会更新。
命令执行详细信息
2018 年 3 月 27 日 - 4 月 3 日:版本 2.68
在笔记本中运行命令时,现将看到详细的进度信息。
Databricks CLI 支持 --profile
2018 年 3 月 27 日 - 4 月 3 日:版本 2.68
Databricks CLI 0.6.1 支持所有位置中的 --profile
。
请参阅 Databricks CLI (旧版)。
默认为新的高级 SKU 客户启用 ACL
2018 年 3 月 27 日 - 4 月 3 日:版本 2.68
高级 SKU 中的所有新客户现在默认启用访问控制列表 (ACL)。 现有客户必须继续手动启用 ACL。
请参阅《无法再禁用访问控制列表》。
Azure Databricks 现已推出正式版
2018 年 3 月 22 日
我们很高兴地宣布 Azure Databricks 现已正式发布。 在过去的几周里,我们添加了一些功能,以帮助进一步改善 Azure Databricks 体验,包括:
- 虚拟网络 (VNet) 对等互连,使你可以将 HDInsight 上的 Apache Kafka 与 Azure Databricks 结合使用
- Microsoft Power BI 现在包含内置 Spark 连接器
- Azure Synapse Analytics 连接器
- Azure 事件中心(和 IoT 中心)连接器
- Azure 数据工厂 v2(预览版)支持
- 机密管理(预览版)
- 更多 Azure 区域
- 改进的性能和文档
当然 Azure Databricks 会继续提供与 Azure Blob 存储、Azure Data Lake Store 和 Azure Cosmos DB 的轻松集成。
作为对此站点上提供的文档的补充,learn.microsoft.com 提供了介绍性材料、关于 Azure 帐户管理的信息和端到端教程。
新文档站点主题
2018 年 3 月 21 日
我们已更新文档网站的外观。 希望你喜欢!
自动缩放本地存储
2018 年 3 月 13 日 - 20 日:版本 2.67
Azure Databricks 上的所有群集启用时均启用了自动缩放本地存储。 这意味着,每当运行群集辅助角色节点 VM 的磁盘存储空间不足时,Azure Databricks 就会自动向这些 VM 附加其他托管磁盘。
有关详细信息,请参阅启用自动缩放本地存储。
虚拟网络 (VNet) 对等互连
2018 年 3 月 13 日 - 20 日:版本 2.67
添加对虚拟网络 (VNet) 对等互连的支持,这使正在运行 Azure Databricks 资源的虚拟网络可与另一个 Azure 虚拟网络对等互连。
有关详细信息,请参阅将虚拟网络对等互连。
群集事件日志
2018 年 3 月 13 日 - 20 日:版本 2.67
“群集详细信息”页具有一个新的“事件日志”选项卡,该选项卡显示重要的群集生命周期事件。 可以查看 60 天的历史事件,相当于 Azure Databricks 中的其他数据保留时间。
有关详细信息,请参阅计算事件日志。
Databricks CLI:版本 0.6.0
2018 年3 月 13 日:databricks-cli 0.6.0
Databricks CLI 现在支持 Python 3。
有关详细信息,请参阅 Databricks CLI(旧版)。
作业运行管理
2018 年 3 月 13 日 - 20 日:版本 2.67
现可在“作业详细信息”页和“作业运行”页中删除作业运行。
作业运行获取输出终结点已正式发布,返回的最大输出已增加到 5 MB。
现在需要在编辑模式下编辑群集权限
2018 年 3 月 13 日 - 20 日:版本 2.67
以前,无需单击“编辑”即可编辑群集的权限,这与其他群集属性不一致。
此更改的副作用是,在群集挂起时,无法再编辑群集权限。
Databricks ML 模型导出
2018 年 3 月 1 日
本文档现在介绍如何使用 Databricks ML 模型导出,通过它你可以从 Apache Spark 导出模型和完整的 ML 管道。 可将这些导出的模型和管道导入到其他(Spark 和非 Spark)平台,以进行评分和预测。 模型导出面向低延迟、轻型且支持 ML 的应用程序。
注意
此功能需要 Databricks Runtime 4.0+。
有关详细信息,请参阅 MLeap ML 模型导出。