此頁面介紹 AI/BI Genie,這是一項 Azure Databricks 功能,可讓商務小組使用自然語言與其數據互動。 其使用專為貴組織術語和數據量身打造的產生 AI,並能夠透過使用者意見反應來監視和精簡其效能。
概觀
資料分析師等領域專家,使用資料集、範例查詢和文字指導方針設定 Genie 空間,以協助 Genie 將商務問題轉譯為分析查詢。 設定之後,商務使用者可以提出問題併產生視覺效果,以瞭解操作數據。 當您的資料變更和使用者提出新問題時,您可以持續更新 Genie 的語意知識。 如需 Databricks AI 支援功能的其他資訊,請參閱 Databricks AI 支援的功能。
AI/BI Genie 會從批注數據表和數據行中選取相關的名稱和描述,以將自然語言問題轉換成對等的 SQL 查詢。 然後,如果可能的話,它會以產生的查詢和結果數據表回應。 如果 Genie 無法產生答案,它可以在提供回應之前提出後續問題來釐清。
範例使用案例
你可以建立不同的 Genie 空間,為各種非技術對象提供服務。 下列案例描述兩個可能的使用案例。
範例 1:將商機狀態視覺化
銷售經理想要了解他們銷售管線中各階段的開放和已關閉商機的目前狀態。 他們可以使用自然語言與 Genie 空間互動,並自動產生視覺效果。
下列 GIF 顯示此項互動:
範例 2:追蹤物流
物流公司想要使用 Genie 空間,以協助不同部門的商務使用者追蹤營運和財務詳細資料。 他們為運輸設施經理建立了一個 Genie 空間,以追蹤出貨,另一個讓財務主管瞭解其財務健康。
我應該使用哪些資料?
Genie 空間是以註冊至 Unity 目錄的數據為基礎,包括管理數據表、外部數據表、外國數據表、檢視表、度量檢視和具象化檢視。 AI/BI Genie 會使用附加至 Unity Catalog 物件的元數據,以及作者策劃的空間層級 知識存放區,來產生回應。 正確標註的資料集搭配你提供的特定指示是為使用者建立正面體驗的關鍵。
檔案上傳
檔案上傳可讓使用者將其本機 CSV 和 Excel 檔案與 Unity 目錄數據混合,以回答問題。 若要啟用檔案上傳,請連絡 Databricks 帳戶小組。 如需詳細資訊,請參閱 上傳檔案。
Genie 的運作方式
Genie 會使用 複合 AI 系統 來解譯商務問題併產生解答。 複合 AI 系統會結合多個互動元件,而不是使用單一大型語言模型來處理 AI 應用程式中的工作。 複合 AI 系統是 AI 應用程式越來越常見的設計模式,因為它們的效能和彈性。 如需詳細資訊,請參閱 從模型轉移到複合 AI 系統。
什麼是 Genie 的知識庫?
Genie 作者可以直接將公司和空間特定的元數據新增至 Genie 空間中的數據資產。 這包括數據表和數據行元數據描述、數據行層級同義字、取樣值和值字典,Genie 在產生答案時會參考這些字典。 詳細的元數據層可協助 Genie 擷取正確的資訊,併產生更精確的結果。
Genie 如何產生回應?
當使用者提交問題時,Genie 會剖析要求、識別相關的數據源,並決定如何回應提示。 作者提供的詳細數據,結合 Unity 目錄元數據,可讓 Genie 推斷商業和技術邏輯。 Genie 會以智慧方式篩選範例 SQL 查詢、數據表和數據行元數據,以及聊天記錄,以選取回應要求的最相關信息。
Genie 會使用下列元件來產生回應:
- Unity 目錄數據表元數據:包含數據表名稱、描述,以及定義的主鍵 (PK) 和外鍵 (FK) 關聯性。 Genie 會使用此數據來剖析要求,並將自然語言提示轉換成 SQL。
- 數據行名稱和描述:Genie 會以智慧方式篩選要包含的相關數據行名稱和描述。
- 知識存放區內容:作者可以在本機編輯 Genie 空間中使用的資產數據表元數據。 這有助於 Genie 產生更精確的回應,而且不會改變現有的 Unity 目錄元數據。 請參閱 設定和管理 AI/BI Genie 空間。
- SQL 查詢範例:Genie 會以智慧方式從 SQL 查詢中選取相關的 SQL 範例。
- SQL 函式:已在空間中新增的所有 SQL 函式。
- 說明:以 一般指示 提供的純文字筆記作為背景內容。
- 提示和回應歷程記錄:目前聊天的提示和回應會包含為上下文。 如有必要,由於設定 令牌限制,因此會排除聊天記錄的最舊部分。
註解
預設不會包含某些數據表詳細數據,例如擁有者和數據表大小。 若要存取這項資訊,請使用可用於所有 Unity Catalog 資料庫的資訊結構中的檢視。 默認檢視可能包含不必要的詳細數據,因此在 頂端建立自定義檢視有助於專注於您需要的特定資訊。 如需資訊架構中可用專案的詳細資訊,請參閱 信息架構。
在許多情況下,Genie 會產生在空間 SQL 倉儲上執行的 SQL 查詢。 產生的查詢一律為唯讀。 重試會自動處理,而 SQL 資料庫會處理並行執行和擴展性。 結果的集合作為回應的一部分呈現出來。
建立 Genie 空間
如果您符合以下條件,您可以建立 Genie 空間:
- Databricks SQL 使用權。
- 至少需要具備在 Pro 或無伺服器 SQL 倉儲上的使用權限。
-
SELECT
至少對一或多個 Unity 目錄資料物件具有特殊許可權。
請參閱 設定和管理 AI/BI Genie 空間。
與 Genie 空間互動
商務團隊是 Genie 空間的終端使用者。 若要使用 Genie 空間,商務用戶必須具備:
- 使用者存取或 Databricks SQL 授權。
- 至少擁有 Genie 空間中指定預設倉儲的 CAN USE 許可權。
- 在空間中使用的所有 Unity Catalog 資料物件上,
SELECT
至少具有許可權。
商務用戶可藉由測試空間並在開發過程中提供回饋來協助優化空間。 若要深入瞭解商務使用者如何開始使用 Genie 空間,請參閱 使用 Genie 空間探索商務數據。
信任的資產
信任的資產會將結果精確度的額外保證層傳達給空間使用者。 當參數化範例查詢或 SQL 函式的確切文字用來產生回應時,Genie 會將回應標示為 信任。 請參閱 在 AI/BI Genie 空間中使用受信任的資產 ,以深入瞭解受信任的資產。 請參閱 在 SQL 查詢中使用參數 ,以深入瞭解如何使用參數化查詢。
使用基準來評估回覆
指標可讓你在 Genie 空間中擴展個別回覆的測試與評估。 不同於指令,基準的目的在於評估,而非提供資訊給你的 Genie 空間。 Genie 不會使用基準檢驗問題或範例 SQL 來改善 Genie 的內容。
使用基準測試,您可以執行一系列的測試問題,並使用回答來測量 Genie 的正確性。 您可以選擇性地包含可傳回預期結果的 SQL 語句。 當基準檢驗問題執行時,Genie 的回應會與 SQL 語句所提供的結果進行比較,並針對精確度進行評分。 如果未提供任何 SQL 答案,問題會標示為檢閱。
隱私權與安全性
問:Genie 使用什麼模型?
Genie 是 Databricks AI 支援的功能。 它會使用複合 AI 系統,結合 AI 模型、擷取、排名和個人化系統的用法,以瞭解貴組織的數據和使用模式。 若要深入瞭解,請參閱 Databricks AI 支援的功能。
問:哪些數據會傳送至模型?
Genie 會在產生回應時,使用你的提示、相關的數據表元數據和值、錯誤,以及輸入的程式代碼或查詢。
為了處理回應,Genie 會使用下列專案:
- 使用者提交的自然語言提示
- 數據表名稱和描述
- 欄位標題、描述和範例值
- 一般指示
- SQL 查詢範例
- SQL 函式
問:Azure OpenAI 是否儲存我的數據?
否。 透過 Databricks 使用 Azure OpenAI 模型時,Microsoft不會在任何層級儲存任何時間的提示或回應,即使是在網路記錄中也一樣。 這包括通常用於濫用監視的數據。 Databricks 已選擇不參與 Azure OpenAI 的濫用監控和人工審查,因此 Microsoft 不會保留或檢查 Genie 傳送的任何資料。 如需詳細資訊,請參閱 Microsoft的檔。
問:Genie 回應儲存在哪裡?
Genie 回應會儲存在 Azure Databricks 控制平面中。
問:Genie 空間是否支持數據列層級篩選?
是,Unity 目錄控制件中授與的許可權可讓使用者存取特定資料物件。 如果數據列篩選或數據行遮罩套用至數據物件,則會控制結果集中傳回的值。 請參閱 行篩選和列遮罩。
問:我的流量如何透過 Geos 路由?
Genie 部署在美國、歐盟、澳大利亞和印度。
流量路由取決於您的區域,以及是否啟用了跨地理位置處理(指定服務的工作區地理位置內強制執行數據處理當前為停用):
- 歐盟:無論跨地理位置處理為何,流量一律會通過歐盟。
- 美國:無論跨地理位置處理為何,流量一律會透過美國路由傳送。
-
印度和澳大利亞:
- 如果已停用跨地理位置處理,則流量保證會保留在您的區域內。
- 如果 已啟用跨地理位置處理:流量一律會透過美國路由傳送。
-
所有其他區域:
- 如果 已停用跨地理位置處理:Genie 將無法運作。
- 如果 已啟用跨地理位置處理:流量會經由美國路由。