Copilot for Data Science 和 Data Engineering 概觀 (預覽版)
重要
此功能處於預覽。
Copilot for Data Science and Data Engineering 是一款可協助分析和視覺化資料的 AI 助理。 它與 Lakehouse 資料表和檔案、Power BI 資料集以及 pandas/spark/fabric 資料框架搭配使用,直接在筆記本中提供答案和程式碼片段。 使用 Copilot 最有效的方法是將資料新增為資料框架。 您可以在聊天面板中提出問題,AI 會提供回應或程式碼以複製到您的筆記本中。 它了解資料的結構描述和中繼資料,如果資料被載入資料框架中,它也會感知資料框架內的資料。 您可以要求 Copilot 提供資料見解、建立視覺效果程式碼,或提供資料轉換程式碼,而且它會辨識檔案名稱以方便參考。 Copilot 藉由排除複雜的程式碼撰寫來簡化資料分析。
注意
- 您的系統管理員必須先啟用租用戶參數,您才能開始使用 Copilot。 如需詳細資料,請參閱 Copilot 租用戶設定一文。
- 您的 F64 或 P1 容量需要位於此文章 (Fabric 區域可用性) 所列的其中一個區域。
- 如果您的租用戶或容量位於美國或法國以外,在預設下會停用 Copilot,除非您的 Fabric 租用戶管理員在 Fabric 管理員入口網站中啟用傳送至 Azure OpenAI 的資料可以在租用戶的地理國家/地區、合規性邊界或國家雲端執行個體處理的租用戶設定。
- 試用版 SKU 不支援 Microsoft Fabric 中的 Copilot。 僅支援付費 SKU (F64 或更新版本,或 P1 或更新版本)。
- Fabric 中的 Copilot 目前正以公開預覽形式推出,預計將於 2024 年 3 月底提供給所有客戶使用。
- 如需詳細資訊,請參閱 Fabric 和 Power BI 中的 Copilot 概觀一文。
適用於 Fabric 資料科學的 Copilot for Data Science and Data Engineering 簡介
透過 Copilot for Data Science and Data Engineering,您可以與 AI 助理聊天,協助您處理資料分析和視覺化任務。 您可以詢問有關 Lakehouse 資料表、Power BI 資料集或筆記本內的 Pandas/Spark 資料框架的 Copilot 問題。 Copilot 以自然語言或程式碼片段回答。 Copilot 也可以根據工作為您產生資料特定的程式碼。 例如,Copilot for Data Science and Data Engineering 可以為下列項目產生程式碼:
- 圖表建立
- 篩選資料
- 套用轉換
- 機器學習模型
首先選取筆記本功能區中的 Copilot 圖示。 Copilot 聊天面板隨即開啟,新的儲存格會出現在筆記本頂端。 每次 Spark 工作階段載入 Fabric 筆記本時,此儲存格都必須執行。 否則,Copilot 體驗將無法正常運作。 我們正在評估其他機制,以在未來版本中處理此必要的初始化。
執行筆記本頂端的儲存格。 成功執行儲存格之後,您可以使用 Copilot。 每次筆記本中的工作階段關閉時,您都必須重新執行筆記本頂端的儲存格。
若要將 Copilot 效率最大化,請在筆記本中將資料表或資料集載入為資料框架。 如此一來,AI 就可以存取資料並了解其結構和內容。 然後,開始與 AI 聊天。 在筆記本工具列中選取聊天圖示,然後在聊天面板中鍵入您的問題或要求。 例如,您可以詢問:
- 「此資料集中客戶的平均年齡是多少?」
- 「依區域顯示銷售橫條圖」
以及其他。 Copilot 以答案或程式碼回應,您可以將其複製並貼到筆記本上。 Copilot for Data Science and Data Engineering 是一種探索和分析資料的方便的互動方式。
使用 Copilot 時,您也可以叫用筆記本儲存格內的 magic 命令,直接在筆記本中取得輸出。 例如,對於回應的自然語言解答,您可以使用 "%%chat" 命令來詢問問題,例如:
%%chat
What are some machine learning models that may fit this dataset?
或
%%code
Can you generate code for a logistic regression that fits this data?
Copilot for Data Science and Data Engineering 還具有 Lakehouse 中資料表的結構描述和中繼資料感知。 Copilot 可根據您在附加的 Lakehouse 中的資料提供相關資訊。 例如,您可以詢問:
- 「Lakehouse 中有多少個資料表?」
- 「客戶資料表有哪些資料行?」
如果您將 Lakehouse 新增至筆記本,Copilot 會以相關資訊回應。 Copilot 也知道已新增至筆記本所附加的任何 Lakehouse 的檔案名稱。 您可以在聊天中依名稱參考這些檔案。 例如,如果您的 Lakehouse 中具有名為 sales.csv 的檔案,您可以詢問「從 sales.csv 建立資料框架」。 Copilot 會產生程式碼,並在聊天面板中加以顯示。 使用適用於筆記本的 Copilot,您可以輕鬆存取和查詢來自不同來源的資料。 您不需要確切的命令語法即可執行。
提示
- 使用聊天面板頂部的掃帚「清除」您在 Copilot 聊天面板中的對話。 Copilot 保留工作階段期間任何輸入或輸出的知識,但如果您發現目前內容令人分心,這會有所幫助。
- 使用聊天 magic 庫設定有關 Copilot 的設定,包括隱私權設定。 默認共用模式的設計目的是將內容共用 Copilot 的存取權最大化,因此限制提供給 copilot 的資訊可以直接且顯著影響其回應的相關性。
- Copilot 第一次啟動時,會提供一組實用的提示,可協助您開始使用。 這些提示可以協助您開始與 Copilot 的交談。 若要稍後參考提示,您可以使用聊天面板底部的閃爍按鈕。
- 您可以「拖曳」聊天的 copilot 提要欄來展開聊天面板,以更清楚地檢視程序代碼,或讓您在螢幕上檢視輸出的可讀性。
限制
資料科學體驗中的 Copilot 功能目前僅限為筆記本。 這些功能包括 Copilot 聊天窗格、可在程式碼儲存格內使用的 IPython magic 命令,以及您在程式碼儲存格中鍵入時的自動程式碼建議。 Copilot 也可以使用語意連結的整合來讀取 Power BI 語意模型。
Copilot 有兩個主要預期用途:
- 首先,您可以要求 Copilot 檢查和分析筆記本中的資料 (例如,先載入 DataFrame,然後要求 Copilot 提供 DataFrame 內的資料)。
- 其次,您可以要求 Copilot 產生一系列有關資料分析程序的建議,例如哪些預測模型可能相關、執行不同類型資料分析的程式碼以及已完成筆記本的文件。
請記住,使用快速移動或最近發行的庫產生的程式碼可能包含不準確或捏造的內容。