使用 AI/BI Genie 空間
重要
這項功能處於公開預覽狀態。 請參閱在工作區啟用 Genie 空間。
概觀
資料分析師等領域專家,使用資料集、範例查詢和文字指導方針設定 Genie 空間,以協助 Genie 將商務問題轉譯為分析查詢。 設定之後,商務使用者可以提出問題並產生視覺效果,以了解操作資料。 Genie 會隨著你的資料變更和使用者提出新問題持續更新其語意知識。 如需 DatabricksIQ 的其他資訊,請參閱 DatabricksIQ 支援的功能。
AI/BI Genie 會從批注數據表和數據行中選取相關的名稱和描述,以將自然語言問題轉換成對等的 SQL 查詢。 然後,它會以產生的查詢和結果資料表來回應 (可能的話)。 如果 Genie 無法產生解答,它會提出後續問題來釐清,因為它嘗試提供回覆。
範例使用案例
你可以建立不同的 Genie 空間,為各種非技術對象提供服務。 下列案例描述兩個可能的使用案例。
範例 1:將商機狀態視覺化
銷售經理想要按其準銷售案源階段取得未結案和已結案商機的目前狀態。 他們可以使用自然語言與 Genie 空間互動,並自動產生視覺效果。
下列 GIF 顯示此項互動:
範例 2:追蹤物流
物流公司想要使用 Genie 空間,以協助不同部門的商務使用者追蹤營運和財務詳細資料。 他們為其運送設施經理設定一個 Genie 空間以追蹤貨物運送,並為其財務主管設定另一個空間以了解其財務健全狀況。
技術需求和限制
使用 Genie 空格時適用下列需求和限制:
- Unity 目錄:Genie 空間的數據必須註冊至 Unity 目錄
- 計算:您必須使用 Pro 或無伺服器 SQL 倉儲。
- 工作區容量:每個工作區最多可以有 1,000 個 Genie 空間。
所需的權限
建立、編輯及使用 Genie 空間需要下列權限:
- 運算權限:Genie 空間建立者、編輯者和使用者需要對指定為空間預設的 SQL 倉儲具有 CAN USE 存取權。 建立者會在建立空間時選取預設的 SQL 倉儲。 他們可以選取其具有 CAN RUN 權限的任何 SQL 倉儲。
- 資料存取權限:凡是與空間互動的任何使用者,至少需要空間使用之資料的
SELECT
權限。 - Genie 空間權限: 使用者需要 Genie 空間上的 CAN RUN 權限,才能與 Genie 和用於空間的資料互動。 如需 Genie 空間權限和功能的完整對應,請參閱 Genie 空間 ACL。
注意
設定資料和運算存取,需要一般僅限系統管理員享有之較高的權限。 請參閱建立 SQL 倉儲和管理 Unity Catalog 中的權限。
在工作區啟用 Genie 空間
注意
您必須擁有更高的許可權,才能啟用此功能。
Genie 使用 Azure AI 支援的 AI 功能,且這些功能必須在帳戶層級和建立 Genie 空間的工作區中啟用。 如果要啟用 Genie 空間,請確認下列各項設定。
- Azure AI 服務支援的功能必須在帳戶層級啟用。 帳戶管理員可以使用下列步驟啟用此項功能:
- 按下 帳戶主控側邊欄的 [設定]。
- 按下 [功能啟用]索引標籤。
- 開啟 [啟用 Azure AI 服務支援的功能]選項。
Azure AI 服務支援的功能必須先在帳戶層級啟用,才能在工作區層級啟用。
工作區必須啟用 Azure AI 服務支援的功能。 工作區管理員可以使用下列步驟啟用此項功能:
- 登入工作區。
- 按下 Azure Databricks 工作區頂端列中的使用者名稱,然後選取 [設定]。
- 按下 [進階]索引標籤,然後向下捲動至 [其他]區段。
- 開啟 [Azure AI 服務支援的功能]選項。
必須從 [預覽版] 頁面啟用 Genie。 工作區管理員可以啟用此預覽版。 請參閱管理 Azure Databricks 預覽版。
建立新的 Genie 空間
當在工作區中啟用 Genie 空間時,資料分析師可以採取下列步驟,為商務使用者建立特定領域的 Genie 空間體驗:
按下側邊欄的 [Genie]。
在畫面右上角,按下 [新增]。
在 [新增空間]對話方塊中,選擇你的初始設定。 選項的說明如下:
- 標題:工作區瀏覽器會同時顯示標題與其他工作區物件。 選擇有助於終端使用者探索 Genie 空間的標題。
- 描述:使用者開啟 Genie 空間時會看到描述。 使用此文字區域來描述空間的用途。 描述欄位支援 Markdown 格式設定,讓您可以設定文字樣式,並提供實用內容和參考的連結。 如需 Markdown 語法的詳細資訊,請參閱 本指南。
- 預設倉儲:此運算資源支援在 Genie 空間產生的 SQL 陳述式。 終端使用者必須存取此倉儲,才能與空間互動。 Genie 空間可以使用 Pro 或無伺服器 SQL 倉儲。 為獲得最佳效能,Databricks 建議使用無伺服器 SQL 倉儲。
- 資料表:Genie 空間是以一或多個資料表為基礎。 [新增資料表] 按鈕會開啟新的對話方塊,你可以在其中選取想要包括的 Unity Catalog 資料表。
- 問題範例:問題範例為選擇性。 問題範例會出現在聊天中, 供使用者作為可提出的問題類型範例而使用。 你可以在建立期間新增問題範例,或稍後從空間的 [設定] 新增它們。
我應該使用哪些資料?
你可以根據一或多個 Unity Catalog 受控資料表來建立新的 Genie 空間。 AI/BI Genie 會使用連結至 Unity Catalog 物件的中繼資料來產生回覆。 正確標註的資料集搭配你提供的特定指示是為使用者建立正面體驗的關鍵。
Databricks 建議如下:
- 編製分析使用量的資料:將檢視分層以減少資料行數量,並新增特定使用案例資訊,以提升回覆品質。
- 將 Genie 空間的資料表和資料行數量減至最少:只帶入回答指定領域問題所需的資料表和資料行。 不必要的資料表或資料行可能會導致 Genie 提供混淆或不正確的解答,或顯示錯誤訊息。
提供指令
指令有助於引導 Genie 的回覆,讓它能處理指定領域特有的術語、邏輯和概念。 完整的指令對於順暢直覺的 Genie 空間體驗極為重要。 如果要輸入指令,請按下 Genie 空間側邊欄中的 [指令],以開啟指令窗格。 使用此窗格新增一般指令、SQL 查詢範例及 SQL 函式。
一般指示
提供純文字指令,以清楚傳達供 Genie 遵循的商務或回覆喜好設定。 你可以將指令格式化為單一完整備註,或按主題進行分類,使其更有條理。
你可以加入一般指令的資訊範例如下:
- 公司特定的商務資訊:
- 「我們的會計年度從二月份開始」
- 值、別名或一般篩選:
- 「在套用篩選器時,一律轉換成小寫並使用 like 運算子。」
- 「篩選值的狀態使用縮寫。」
- 指定函式以回答問題,並提供傳回值的指令:
- 「針對季度使用
adventureworks.oneb.get_quarter(date)
UDF。get_quarter()
的輸出是季度,且為 1、2、3 或 4。 使用此項目可視需要篩選資料。
- 「針對季度使用
SQL 查詢範例
SQL 查詢範例是準備用於協助訓練 Genie 的 SQL 查詢。 響應問題時,Genie 會以智慧方式選取相關的查詢,以協助產生回應。 當你新增查詢範例時,即可有效地向 Genie 展示如何使用資料以回答問題。 你也可以新增問題範例,讓 Genie 了解你預期查詢範例會回答的問題種類。 如果 Genie 收到相符的問題,則可以直接使用範例查詢來提供答案。 如果它收到類似的問題,則可以使用範例查詢中的線索來協助建構回應中提供的 SQL。 重點在於提供強調組織和資料特有邏輯的範例,範例如下所示:
-- Return our current total open pipeline by region.
-- Opportunities are only considered pipelines if they are tagged as such.
SELECT
a.region__c AS `Region`,
sum(o.amount) AS `Open Pipeline`
FROM
sales.crm.opportunity o
JOIN sales.crm.accounts a ON o.accountid = a.id
WHERE
o.forecastcategory = 'Pipeline' AND
o.stagename NOT ILIKE '%closed%'
GROUP BY ALL;
在 SQL 查詢中新增參數
你可使用參數撰寫查詢範例,並在範例中納入要在執行階段取代之特定值的預留位置。 Genie 可使用參數自使用者問題取得特定輸入,並重複使用查詢範例的結構,以提供已驗證的解答作為受信任的資產。 例如,你可以調整先前的 SQL 查詢,以納入按o.forecastcategory
值篩選的參數,讓查詢解決以不同預測類別標記的商機問題。 如需如何使用參數化查詢產生標記為受信任資產之回覆的詳細資訊,請參閱 在 AI/BI Genie 空間中使用受信任的資產。
下列程式碼片段顯示前一個範例,亦即透過新增 o.forecastcategory
值的參數進行修改。 參數使用與具名參數標記相同的語法。 請參閱具名參數標記。
-- Return our current pipeline at a stage by region.
-- Opportunities are only considered pipelines if they are tagged as such.
SELECT
a.region__c AS `Region`,
sum(o.amount) AS `Open Pipeline`
FROM
sales.crm.opportunity o
JOIN sales.crm.accounts a ON o.accountid = a.id
WHERE
o.forecastcategory = :forecast_category AND
o.stagename NOT ILIKE '%closed%'
GROUP BY ALL;
如果要在查詢新增參數:
將資料指標放在想要在查詢中放置參數的位置。
按下 [新增參數]即可插入新參數。
此會使用預設名稱
parameter
建立新參數。 如果要變更預設名稱,請在查詢編輯器中取代它。 在編輯器中依序輸入冒號及參數名稱 (:parameter_name
) 亦可新增參數。
編輯查詢參數
如果要編輯參數,請執行下列動作:
按下參數名稱旁邊的 。 [參數詳細資料]對話方塊隨即出現,並包括下列組態選項:
關鍵字:代表查詢中參數的關鍵字。 你只能透過直接更新查詢中的文字來變更關鍵字。
顯示名稱:Genie 在聊天體驗中使用的人類可讀取名稱。 當 Genie 使用參數化查詢產生回覆時,回覆會包括顯示名稱和相關聯的值。
類型:支援的類型包括字串、日期、日期和時間以及數值。
- 預設類型為字串。
- 數值資料類型可讓你指定小數或整數。 預設數值類型為小數。
注意
如果實際輸入值不符合選取的參數類型,Genie 會將輸入值視為不正確的類型,進而可能會導致結果不正確。
按下 UI 的另一部分,以關閉對話方塊。
SQL 函式
SQL 函式是儲存在 Unity Catalog 的自訂函式,並由 Genie 用於回答特定問題。 Genie 可以呼叫這些函式並插入任何使用者指定的參數,但無法存取基礎 SQL 內容。 亦即,SQL 函式很適合用於回答包括 Genie 無法存取或編輯的複雜引數或計算之常見特定問題。 如需在 Unity Catalog 註冊函式的指引,請參閱建立 SQL 資料表函式和 Unity Catalog 中的使用者定義函數 (UDF)。
信任的資產
當參數化查詢範例或 SQL 函式的確切文字用於產生回覆時,Genie 會將回覆標記為受信任的資產。 受信任的資產旨在向空間使用者傳達結果正確性的額外一層保證。 請參閱在 AI/BI Genie 空間中使用受信任的資產。
Genie 空間的聊天
Genie 空間互動多半在聊天視窗中進行。
新聊天視窗包括一組精選的問題範例。 這些問題範例有助於使用者了解他們可以詢問 Genie 空間的問題。 使用者輸入問題的文字欄位靠近畫面底部。
回覆會出現在文字欄位上方。 使用者輸入問題之後,它會儲存至左窗格中的聊天記錄對話中。
聊天記錄
每位使用者的聊天記錄對話都會儲存,以便他們參考過去的問答。 使用者也可以重新提交或修改聊天對話的問題。 左窗格的 [新增聊天]按鈕可開始新對話。
每個聊天對話都會保留先前提問的相關內容。 此可讓使用者詢問後續問題,以進一步探索或重新聚焦結果集。
聊天記錄線程會無限期儲存,並維持可存取性,直到刪除線程或 Genie 空間為止。 具有 CAN MANAGE 許可權或更高許可權的使用者可以檢視空間內的所有聊天。
回覆結構
精確的回覆結構會根據問題而有所不同。 回覆通常包括自然語言說明,以及顯示相關結果集的資料表。 所有回覆都包括為回答問題而產生的 SQL 查詢。 按下 [顯示產生的程式碼]即可檢視產生的查詢。
回應下方的一組按鈕可讓您採取各種動作。 您可以向上投票或向下投票以指出回應品質,或要求具有 Genie 空間上 CAN EDIT 許可權或更高許可權的使用者檢閱。 其他選項包括新增回應做為指示、重新產生回應,或檢視用來在答案中產生結果集的 SQL 程式代碼。
一組快速動作磚會在包括表格式資料的回覆之後出現。 你可以使用它們來產生視覺效果。
你也可以在取得查詢結果之後,以文字描述方式來產生視覺效果。
格式化結果
若要在回應內格式化數據表中的數據行,請單擊 數據行標頭中的kebab功能表,然後按兩下 [格式 ] 以檢視可用的選項。 格式化選項取決於數據行的數據類型。
下載結果集
空間使用者可以下載最多 1 GB 的結果數據作為 CSV。 最終檔案下載大小可能會略高於或小於 1GB,因為 1GB 限制會套用於比最終檔案下載更早的步驟。 若要下載結果,請按兩下回應中的下載圖示。
提供回覆意見反應
每個 AI/BI Genie 回覆都包括按讚或倒讚的意見反應按鈕。 Databricks 建議鼓勵使用者透過此機制提供空間的意見反應。
使用者按下 ,即可要求 Genie 空間編輯器檢閱包括查詢結果的回覆。 如果使用者對所產生回覆的品質或正確性有疑問,可以將此類回覆標記為待檢閱,並可選擇新增其註解或問題。
在歷程記錄頁面上,商務使用者可以檢視其標記為待檢閱問題的更新。 當使用者至少有 Genie 空間 CAN MANAGE 權限時,可檢閱特定交流、對要求留言,以及確認或校正回覆。 他們可以在監視頁面存取意見反應及檢閱要求。 然後,你可以使用該意見反應微調回覆及改善空間。 請參閱檢閱歷程記錄和意見反應。
檢閱歷程記錄和意見反應
Genie 空間旨在成為資料團隊和商務使用者累積知識的持續共同作業工具,而非用於一次性部署。 了解商務使用者需要解答的新問題,對於知識組建極為重要。 在歷程記錄頁面上,你可以檢視個別的問題和回覆、使用者提供的按讚或倒讚意見反應,以及標記為待檢閱的問題。 如果要開啟歷程記錄頁面,請按下 Genie 空間側邊欄中的 [歷程記錄]。
歷程記錄頁面會顯示空間中已詢問的所有問答。 你可以按時間、評分、使用者或狀態篩選問題。 Genie 空間編輯器可用於監視空間,以主動了解商務使用者提出的查詢,以及 Genie 空間的回覆方式。
若你識別 Genie 難以回覆的問題,即可使用特定指令更新 Genie 空間,以改善其回覆。 按下問題即可開啟問題和回覆文字。 你也可以從檢視存取完整的聊天對話。
編輯產生的 SQL
你可以在任何回覆中檢閱及編輯產生的 SQL。 Genie 空間作者通常懂得相關領域和資料,能夠識別 Genie 是否產生不正確解答。 通常,手動微調所產生的 SQL 查詢即可修正錯誤。 如果要檢視任何回覆產生的 SQL,按下 [顯示產生的程式碼] 即可檢查查詢。
如果你有 Genie 空間的 CAN EDIT 或更高的權限,編輯產生的 SQL 陳述式即可校正。 請在校正之後執行查詢。 然後,你可以將它儲存為指令,以訓練 Genie 未來如何回答。 如果要儲存已編輯的查詢,請按下 另存新指令。
使用基準評估回覆
基準可讓你擴大 Genie 空間中個別回覆的測試與評估。 不同於指令,基準旨在評估 Genie 空間,而非用於通知。 Genie 不會將基準問題或 SQL 範例用於改善 Genie 的內容。
你可以使用基準執行測試問題的集合,並使用回覆測量 Genie 的正確性。 您可以選擇性地包含可傳回預期結果的 SQL 語句。 當基準檢驗問題執行時,Genie 的回應會與 SQL 語句所提供的結果進行比較,並針對精確度進行評分。 如果未提供 SQL 答案,該問題會標記為待檢閱。
共用 Genie 空間
重要
Genie 空間使用者必須使用自己的認證才能存取資料。 若問題與他們無法存取的資料相關,則會產生空白回覆。
Genie 空間使用者必須有連結至 Genie 空間之倉儲的 CAN USE 權限,以及出現在空間之 Unity Catalog 物件的存取權限。 請參閱我應該使用哪些資料?。
新的 Genie 空間預設會儲存至使用者資料夾。 空間與其他工作區物件一樣,也是從其所在資料夾繼承權限。 你可以使用工作區資料夾結構與其他使用者共用空間。 請參閱使用資料夾整理工作區物件。
你也可以指定按特定權限等級共用空間的使用者或群組:CAN MANAGE、CAN EDIT、CAN RUN 和 CAN VIEW。
如果要與特定使用者或群組共用空間:
- 按下 [共用]。
- 輸入你想要與其共用空間的使用者或群組。 然後按下 [新增]並設定適當的權限等級。
- 使用 [共用] 對話方塊底部的 [複製連結]按鈕,即可取得 Genie 空間的可共用連結。 特殊權限使用者可以按下連結,在新索引標籤開啟 Genie 空間,然後提出問題。
複製 Genie 空間
複製 Genie 空間會建立包括所有設定內容和指令的複本。 如果你已有完善的空間,但想要建立新的空間來進行額外的測試,或重新使用原始空間的內容,複製空間將會非常實用。 複製空間之後,新空間獨立於原始空間,可讓你進行編輯和調整,而不會影響原始空間。
下列元素會複製至新的 Genie 空間:
- 資料表和設定
- 一般指示
- SQL 查詢範例
- SQL 函式
現有的聊天對話和歷程記錄資料不會複製至新的空間。
如果要複製 Genie 空間,請執行下列動作:
- 開啟你想要複製的 Genie 空間。
- 按下空間右上角的 Kebab 功能表。
- 按下 [複製]。
- (選用) 在 [複製] 對話方塊中,為複製的 Genie 空間指定新的名稱和工作區資料夾位置。
- 按下 [複製] 即可建立新的空間。
隱私權與安全性
問:Genie 使用什麼模型?
Genie 使用 Azure OpenAI 模型。
問:哪些數據會傳送至模型?
Genie spaces 會使用元數據和指示來產生自然語言問題的回應。 Genie 無法存取數據列層級的數據。
為了處理回應,Genie 會使用下列專案:
- 使用者提交的自然語言提示
- 數據表名稱和描述
- 數據列標題和描述
- 一般指示
- SQL 查詢範例
- SQL 函式
問:Azure OpenAI 會收集我的數據嗎?
否。 Databricks 已選擇豁免濫用監視和人工審核計劃,根據該計劃,Microsoft不會儲存傳送至 Azure OpenAI 服務的任何提示和完成。 如需詳細資訊,請參閱 Microsoft的檔。
空間準備的最佳做法
- 建置之前,請先建立一組你希望空間使用者能夠回答且定義完善的問題。
- 測試 Genie 空間,以檢查回覆品質。 請嘗試下列方法,以確認模型是否提供預期的回覆:
- 改變提供之問題的措辭。
- 提出其他與資料集相關的問題。
- 新增並精簡 Genie 空間指令,直到問題提供預期的回覆為止。
如需最佳做法的其他指導及疑難排解問題的協助,請參閱策劃有效的 Genie 空間。