這些功能和 Azure Databricks 平台改善功能於 2021 年 6 月發行。
注意
分階段發行。 您的 Azure Databricks 帳戶可能要到初始發行日期後一週或以上才會更新。
校正:某些區域的新工作區和現有工作區預設會啟用 Repos for Git
2021 年 6 月 30 日
在 2021 年 6 月 2 日的版本資訊中,Databricks 宣佈在某些區域的新工作區中預設會啟用 Repos for Git,但省略了下列重要詳細資料:如果已啟用筆記本 Git 版本設定,則 Repos for Git 也會在現有的工作區中啟用。 原始版本資訊已更新。
特徵存放區(Feature Store)權限的變更
2021 年 6 月 28 日至 7 月 6 日:3.49 版
具有功能數據表 CAN_VIEW_METADATA
許可權的用戶現在可以將其發佈至在線商店。
改善對 MLflow 執行數據表結果的存取
2021 年 6 月 28 日至 7 月 6 日:3.49 版
MLflow 執行資料表的變更 可讓您更快速地存取結果。
- 度量 數據行現在會出現在 參數 資料行之前,讓您更輕鬆地識別最佳操作。
- 開始時間 欄現在顯示的是運行時間的長度,而不是開始時間。 這會減少數據行的寬度,並允許在不水平捲動的情況下顯示更多資訊。 若要顯示開始時間,請將滑鼠停留在數據行中的值上方。
DLT 的更佳成本可見度
2021 年 6 月 28 日至 7 月 6 日:3.49 版
當您建立新的管線或檢視 管線詳細數據 UI 時,您現在會看到 DLT 預設叢集每小時的 DBU。
增強型 DLT 資料品質約束條件
2021 年 6 月 28 日至 7 月 6 日:3.49 版
您現在可以使用 expect_all_or_fail
、expect_all_or_drop
和 expect_all
Python API,在 DLT 數據集上定義多個數據品質條件約束。 將通用期望庫套用至管線中的一或多個資料集時,這些 API 會很有用。 如需詳細資訊,請參閱 使用管線預期來管理數據品質。
更新和取代 IP 位址清單的 API 變更
2021 年 6 月 28 日至 7 月 6 日:3.49 版
Databricks REST API 2.0 中 PATCH
的新 /ip-access-lists/<list-id>
作業可讓您以程式設計方式更新現有 IP 位址清單中的個別值。 如需詳細資訊,請參閱 更新IP存取清單。
Databricks REST API 2.0 中的現有 PUT
作業 /ip-access-lists/<list-id>
可讓您以程式方式取代現有 IP 位址清單的內容,同時保持清單的原始內部識別碼。 如需詳細資訊,請參閱 取代IP存取清單。
Databricks ODBC 驅動程式 2.6.17
2021 年 6 月 22 日
我們已發行 Databricks ODBC 驅動程式 2.6.17 版 (下載)。 此版本新增對 Cloud Fetch 的支援,Cloud Fetch 是透過雲端儲存體並行擷取資料,以更快速地將資料整合到 BI 工具中的機制。 此版本還移除了用戶端與 Databricks Runtime 之間不必要的往返,因此減少了延遲。 請參閱如何使用 BI 工具實現高頻寬連線。
Databricks Runtime 7.5 系列支援結束
2021 年 6 月 16 日
對 Databricks Runtime 7.5、適用於機器學習的 Databricks Runtime 7.5 及適用於基因體學的 Databricks Runtime 7.5 的支援已於 6 月 16 日結束。 請參閱 Databricks 支援生命週期。
針對驅動程序節點和背景工作節點使用不同的集區來優化效能和控制成本
2021 年 6 月 14-21 日:3.48 版
現在,您可以通過將叢集連結至驅動程序節點和計算節點的不同資源池,來優化叢集。 例如,您可以使用驅動程式節點的計算最佳化集區,以及節點的儲存體最佳化集區。 這也有助於您將不同的標籤指派給每個執行個體集區,進而控制成本。 如果您選擇,您可以為驅動程式和背景工作節點使用相同的集區。
如需詳細資訊,請參閱集區設定參考。
模型登錄的全登錄權限
2021 年 6 月 14-21 日:3.48 版
您現在可以為工作區模型登錄中的所有模型設定預設模型許可權。 在此層級設定的許可權會套用至該工作區的 Model Registry 中註冊的所有新和現有模型。 如下詳細資訊,請參閱 MLflow 模型 ACL。
當您使用 SCIM API 刪除使用者時,使用者的主目錄不再受到保護
2021 年 6 月 14-21 日:3.48 版
當您 使用 SCIM API 刪除使用者時,使用者的主目錄已不再受到保護,而工作區管理員可以將其刪除。 此行為與您使用管理主控台刪除使用者時發生的情況一致。
Databricks Runtime 8.3 和 8.3 ML 已正式發行;8.3 Photon 為公開預覽
2021 年 6 月 8 日
Databricks Runtime 8.3 和 8.3 ML 現已正式發行。 8.3 Photon 處於公開預覽狀態。
如需相關資訊,請參閱 Databricks Runtime 8.3 (EoS) 和 Databricks Runtime 8.3 for ML (EoS) 的完整版本資訊。
Python 和 SQL 資料表存取控制 (GA)
2021 年 6 月 8 日
數據表訪問控制可讓您使用 Azure Databricks 檢視型存取控制模型,以程式設計方式授與和撤銷資料的存取權。 資料表存取控制有兩種版本:僅限 SQL 和 Python 和 SQL。 先前只提供僅限 SQL 的數據表訪問控制。 現在 Python 和 SQL 資料表存取控制已正式推出。 請參閱 在叢集上啟用 Hive metastore 資料表訪問控制(傳統)。
工作 UI 和 API 現在會顯示執行中的工作的擁有者
2021 年 6 月 2-7 日:3.47 版
工作 UI 和 API 現在包括將執行工作的使用者,讓您更輕鬆了解、偵錯和稽核工作的權限設定。 如果作業訪問控制被停用,則此唯讀值設定為作業建立者;如果作業訪問控制被啟用,則此唯讀值設定為作業的is_owner
權限。 如需管理工作權限的詳細資訊,請參閱控制對工作的存取。
使用秘密保護敏感性 Spark 組態屬性和環境變數 (公開預覽)
2021 年 6 月 7 日
您可以使用機密來保護敏感的 Spark 組態屬性和環境變數。 系統會從筆記本輸出以及 Spark 驅動程式和執行程式的記錄中刪除擷取的機密信息。 請參閱 管理秘密。
如果您目前在 Spark 設定中使用純文字密碼,Databricks 建議您在 Spark 設定中輪替密碼並使用秘密路徑。
某些區域的新工作區和現有工作區預設啟用 Repos for Git
2021 年 6 月 2 日
此版本資訊已於 2021 年 6 月 30 日更新。
針對已啟用筆記本 Git 版本設定的新工作區和現有工作區,現在在某些區域中,預設會啟用 Repos for Git。 預設 Repos 的啟用將會在未來幾個月內在更多區域部署。 若要了解如何自行啟用或停用 Repos,以及驗證工作區的設定,請參閱 Databricks Git 資料夾的 Git 整合。
重新設計的工作區設定 UI
2021 年 6 月 2-7 日:3.47 版
管理主控台中的新 [工作區設定] 索引標籤會取代 [工作區儲存體]、[存取控制清單] 和 [進階] 索引標籤,以簡化工作區設定。
ListTokens
和 ListAllTokens
資料庫查詢過期權杖更新
2021 年 6 月 2-7 日:3.47 版
資料庫查詢 ListTokens
或 ListAllTokens
不再傳回過期的代幣。 會傳回不定義的令牌(expiryTime
設定為 -1
的令牌)。
現在在授予或撤銷管理員權限時,需要確認。
2021 年 6 月 2-7 日:3.47 版
現在當管理使用者在網站用戶介面中授予或撤銷管理員權限時,會出現確認對話方塊。
網頁 UI 鍵盤快速鍵變更
2021 年 6 月 2-7 日:3.47 版
在筆記本中,開啟鍵盤快捷方式清單的方式已變更。 若要開啟清單,請按兩下 圖示。