轉換成 CSV 元件

本文描述 Azure Machine Learning 設計工具中的一個元件。

使用此元件,可將資料集轉換成 CSV 格式,然後使用 R 或 Python 指令碼元件進行下載、匯出或共用。

關於 CSV 格式的詳細資訊

CSV 格式 (代表「逗點分隔值」) 是許多外部機器學習工具所使用的檔案格式。 使用開放原始碼語言 (例如 R 或 Python) 時,CSV 是常用的交換格式。

即使您在 Azure Machine Learning 中執行大部分的工作,有時候您可能會發現將資料集轉換為 CSV 以在外部工具中使用,這樣做很方便。 例如:

  • 下載 CSV 檔案,以 Excel 將其開啟,或將其匯入至關聯式資料庫。
  • 將 CSV 檔案儲存至雲端儲存體,並從 Power BI 連線到其中,以建立視覺效果。
  • 使用 CSV 格式來準備要在 R 和 Python 中使用的資料。

當您將資料集轉換成 CSV 時,csv 會儲存在 Azure Machine Learning 工作區中。 您可以使用 Azure 儲存體公用程式,來直接開啟並使用該檔案。 您也可以在設計工具中存取 CSV,方法是選取 [轉換成 CSV] 元件,然後在右面板的 [輸出] 索引標籤下選取長條圖圖示,來檢視輸出。 您可以從 [結果] 資料夾將 CSV 下載至本機目錄。

如何設定轉換成 CSV

  1. 將 [轉換成 CSV] 元件新增至您的管線。 您可以在設計工具的 [資料轉換] 類別中找到此元件。

  2. 將其連線到輸出資料集的任何元件。

  3. 提交管線。

結果

選取 [轉換成 CSV] 右邊面板中的 [輸出] 索引標籤,然後在 [連接埠輸出] 下選取其中一個圖示。

  • 註冊資料集:選取圖示,並將 CSV 檔案儲存回 Azure Machine Learning 工作區作為個別資料集。 在 [我的資料集] 區段下的元件樹狀中,您可以找到資料集作為元件。

  • 檢視輸出:選取眼睛圖示,然後遵循指示來瀏覽 Results_dataset 資料夾,並下載 data.csv 檔案。

後續步驟

請參閱 Azure Machine Learning 可用的元件集