Dataiku 是用於資料準備、AutoML 和 MLOps 的端對端 AI 平台。 可以將 Databricks SQL 倉儲和 Azure Databricks 叢集與 Dataiku 整合。
使用 Partner Connect 連線到 Dataiku
注意
Partner Connect 僅支援適用於 Dataiku 的 SQL 倉儲。 若要將叢集連線至 Dataiku,請手動連線至 Dataiku。
若要使用 Partner Connect 將 Azure Databricks 工作區連線至 Dataiku,請執行下列操作:
在側邊欄中,點選
Marketplace。在 Partner Connect 整合 中,按一下 全部檢視。
按一下合作夥伴圖格。
注意
如果 Dataiku 圖標內有核取記號圖示,管理員已使用 Partner Connect 將 Dataiku 連線到您的工作區。 跳到步驟 5。 合作夥伴會使用 Azure Databricks 帳戶的電子郵件地址,提示您登入現有的 Dataiku 帳戶。
從下拉式清單中選取目錄,然後按一下 [下一步]。
注意
如果您的工作區已啟用 Unity Catalog 功能,但合作夥伴不支援 Partner Connect 中的 Unity Catalog,則工作區預設目錄將被使用。 如果您的工作區未啟用 Unity 目錄,則會使用
hive_metastore。從下拉式清單中選取結構描述,然後按一下 [新增]。 您可以重複此步驟以新增多個結構描述。
按一下 [下一步] 。
Partner Connect 會在您的工作區中建立下列資源:
Partner Connect 也會將下列權限授與給
<PARTNER>_USER服務主體:- (Unity Catalog)
USE CATALOG:需要與所選目錄內的物件互動。 - (Unity Catalog)
USE SCHEMA:授與讀取所選結構描述的能力。 - (Unity Catalog)
CREATE SCHEMA:授與在所選目錄內建立結構描述的能力。 - (舊版 Hive 中繼存放區)
USAGE:需要與hive_metastore內的物件和所選結構描述互動。 - (舊版 Hive 中繼存放區)
CREATE:授與在hive_metastore中建立結構描述的能力。 - (舊版 Hive 中繼存放區) READ_METADATA:授與讀取所選架構之元數據的能力。
- (舊版 Hive 中繼存放區) SELECT:授予讀取您選擇的結構描述的權限。
- (Unity Catalog)
按一下 [下一步] 。
[電子郵件] 方塊會顯示 Azure Databricks 帳戶的電子郵件地址。 Dataiku 會使用此電子郵件地址提示您建立新的合作夥伴帳戶,或登入您現有的合作夥伴帳戶。
按一下 [連線到 Dataiku] 或 [登入]。
新的索引標籤會在網頁瀏覽器中開啟,其中顯示 Dataiku 網站。
完成 Dataiku 網站中畫面上的指示,以建立您的試用 Dataiku 帳戶或登入現有的 Dataiku 帳戶。
手動連線至 Dataiku
本節介紹如何在 Azure Databricks 工作區中手動將現有 SQL 倉儲或叢集連線至 Dataiku。
注意
針對 Databricks SQL 倉儲,您可以使用 Partner Connect 連線至 Dataiku,以簡化體驗。
需求
在手動連線到 Dataiku 之前,您需要下列內容:
Azure Databricks 工作區中的叢集或 SQL 倉儲。
叢集或 SQL 倉儲的連線詳細數據,特別是 伺服器主機名、 埠和 HTTP 路徑 值。
Azure Databricks 個人存取令牌 或 Microsoft Entra ID(先前稱為 Azure Active Directory) 令牌。 若要建立個人存取權杖,請遵循為 工作區使用者建立個人存取權杖中的步驟。
連線的步驟
若要手動連線到 Dataiku,請遵循 Dataiku 檔中的 Databricks 。
其他資源
探索下列 Dataiku 資源: