共用方式為


使用 Genie Code 進行資料科學

本頁介紹資料科學的精靈代碼。 Genie Code 專為 Databricks 筆記本與 SQL 編輯器設計,代理模式下能探索資料、產生與執行程式碼,並修正錯誤——全部只需一個提示。

什麼是資料科學的 Genie Code?

Genie Code 的代理模式可自動化 Databricks 筆記本與 SQL 編輯器中完整的多步驟資料科學工作流程。

在筆記本中使用資料科學代理程式。

與 Genie Code 聊天模式相比,代理模式功能更豐富:規劃解決方案、擷取相關資產、執行程式碼、利用儲存格輸出提升結果、自動修正錯誤等。

Genie Code 可以規劃並產生可在筆記本執行的程式碼,或在 SQL 編輯器中執行的查詢。 Genie Code 會與你合作,批准其計畫並確認下一步步驟,然後再繼續進行。 經您同意,Genie Code 可以使用工具執行搜尋表格、編輯筆記本、執行儲存格及讀取儲存格輸出等任務。

Genie Code 的存取與操作受使用者權限約束。 它只能存取您有權存取的資料,並執行您有權存取的作業。

需求

要使用 Genie Code 的代理式資料科學功能,您的工作空間需要以下條件:

使用 Genie Code 進行資料科學

要使用 Genie Code 進行資料科學任務:

  1. 從 Databricks 筆記本或 SQL 編輯器,開啟 Genie Code 側邊面板。

  2. 請輸入Genie Code提示。 例如,「從samples.bakehouse分析 @sales_transactions 以找出最暢銷的產品。」

    小提示

    使用 @table_name參照特定表格。 代理程式將使用該資料表和任何相關聯的中繼資料來策劃其回應。 代理程式會遵守使用者的 Unity 目錄許可權,因此它只能存取您有權存取的資料。

  3. 當 Genie Code 產生回應時,它常常會暫停以徵求你的意見:

    • 對於較複雜的任務,Genie Code 可能會制定逐步計畫並提出釐清問題。 回答其釐清問題,幫助它完善計畫。

    • 當 Genie Code 需要執行程式碼時,會先徵求你的同意才能繼續。 允許拒絕 其請求。 你也可以選擇 允許此串(指 Genie Code 的對話串)或 永遠允許

      這很重要

      Genie Code 可以在你的筆記本中生成並執行程式碼。 雖然它有防止危險行為的護欄,但仍然存在風險。 您應該只將其與您信任的程式碼和資料一起使用

    • 隨著 Genie Code 持續運作,您可能會被提示選擇 繼續拒絕。 檢視 Genie Code 現有的作品,然後選擇 「繼續 」讓它繼續下一步,或選擇 拒絕 讓它嘗試其他方法。

    • 要在精靈程式碼運作時停止它,請點擊紅色的停止圖示。

Genie Code 可以建立新的筆記本儲存格(或查詢)、產生文字與程式碼、執行筆記本儲存格,並存取儲存格輸出以解讀結果。

備註

為了讓 Genie Code 繼續運作並採取下一步,你需要停留在目前正在運作的分頁上。

小提示

你可以在代理模式中加入精靈代碼的指示,以便在多數的回應中使用。 例如,如果你有程式碼慣例或偏好函式庫,可以將這些指引加入 Genie Code 的說明中。 你可以創建技能,以擴展 Genie Code 的功能,從而為您的特定領域任務提供專門能力。 更多細節及其他建議,請參閱 提升精靈代碼回應的技巧

使用案例

在代理模式下,Genie Code 擁有擴充功能,例如尋找資料、解讀輸出及執行儲存格動作。

Genie Code 能協助複雜的資料科學任務,包括探索性資料分析、預測與機器學習。 你甚至可以用 Genie Code 從零開始建立新的資料分析筆記本。 為了獲得更好的結果,請透過引用資料表、管線、筆記本、查詢與檔案,為代理@<resource_name>提供上下文。 你也可以點擊 At 圖示。 新增上下文 以手動選擇要提供的上下文。 每個參考資產都會在聊天環境中持續存在。

請嘗試下列提示以開始使用:

  • 資料發現
    • 「哪個資料表包含麵包店交易資料?」
    • “我想查看加利福尼亞州洛杉磯市 2025-01-01 的天氣數據。”
    • 「找到一個包含紐約市計程車資料的表格,並向我顯示前 10 行。」
  • 探索性數據分析
    • 「幫我解析 A 欄中的 JSON 字串。」
    • 從此表格建立資料的視覺化。
    • “解釋這個條形圖。”
    • “描述 @sales_transactions 數據集。 執行一些 EDA 來幫助我了解欄統計並可視化值的分佈。 像數據科學家一樣思考。
    • 分析 @workload_insights 來找出上週依收入排名的 Databricks SQL 工作負載的前五大客戶。 然後繪製這些客戶在過去 6 週內每週的 Databricks SQL 使用量。
  • 預測
    • “使用數據 @incidents 集,對未來 2 週的每日事件數量進行預測。 完成後,給我一個數據表和一個交互式圖表來顯示結果。
    • “使用數據 @website_traffic 集,預測下個月的每日訪客人數。 突出任何季節性模式。
    • “從數據集生成 @inventory 未來 6 個月的產品需求預測,包括置信區間。”
  • 機器學習
    • “進行一些數據準備和特徵工程,為模型訓練準備這個數據集。”
    • @customer_data 數據集上訓練一個分類模型,以便預測客戶流失。 使用準確性和 AUC 指標評估模型。
    • “使用數據集對 @housing_prices 回歸模型進行超參數調整,以改善預測誤差。”
    • “在數據集上 @sales_leads 構建聚類模型,以識別客戶群並提供每個集群特徵的摘要。”
  • 筆記本組織:
    • “創建一個新單元格來總結此筆記本的結果。”
    • 「給這本筆記本起個相關的名字。」

探索性數據分析

使用 Genie Code 對資料集進行探索性資料分析。 例如,試著請它幫你建立一個新的筆記本程式以分析 samples.bakehouse.sales_transactions 資料集。

在一個空的筆記本分頁中,打開 Genie Code 面板並輸入以下提示:「描述資料集, @sales_transactions. 我想做一些EDA,這樣我才能理解欄位統計,並視覺化數值的分布。」

Data Science Agent 會建立 EDA 的筆記簿。

客服專員會建立一個計劃來回答您的提示,並可能提出澄清問題。 經您核准後,它會產生新的筆記本儲存格,其中包含用於探索資料的程式碼,以及解釋其程序和發現結果的文字。