共用方式為


bamboolib

重要

這項功能處於公開預覽狀態

注意

Databricks Runtime 11.3 LTS 和更新版本支援 bamboolib。

bamboolib 是一種使用者介面元件,允許從 Azure Databricks 筆記本內進行無程式代碼數據分析和轉換。 bamboolib 可協助使用者更輕鬆地使用其數據,並加速常見的數據整頓、探索和視覺效果工作。 當使用者使用其數據完成這類工作時,bamboolib 會自動在背景中產生 Python 程式 代碼。 使用者可以與其他人共用此程式碼,他們可以在自己的筆記本中執行此程序代碼,以快速重現這些原始工作。 他們也可以使用 bamboolib 來擴充這些原始工作與額外的數據工作,而不需要知道如何撰寫程序代碼。 那些有程式代碼撰寫經驗的人可以擴充此程序代碼,以建立更複雜的結果。

在幕後,bamboolib 會使用ipywidgets,這是IPython核心互動式HTML 小工具架構。 ipywidgets 會在 IPython 核心執行。

目錄

需求

  • 連結至具有 Databricks Runtime 11.0 或更新版本之 Azure Databricks 叢集的 Azure Databricks Notebook。
  • 文檔 bamboolib 庫必須可供筆記本使用。

快速入門

  1. 建立 Python 筆記本。

  2. 將筆記本附加 至符合 需求的叢集。

  3. 在筆記本的第一個 數據格中,輸入下列程式代碼,然後 執行 數據格。 如果 bamboolib 已安裝在工作區或叢集中,則可以略過此步驟。

    %pip install bamboolib
    
  4. 在筆記本的第二個儲存格中,輸入下列程式代碼,然後執行數據格。

    import bamboolib as bam
    
  5. 在筆記本的第三個數據格中,輸入下列程式代碼,然後執行數據格。

    bam
    

    注意

    或者,您可以 列印現有的 pandas DataFrame 來顯示 bamboolib,以便與該特定 DataFrame 搭配使用。

  6. 繼續執行 重要工作

逐步解說

您可以單獨或 搭配現有的 pandas DataFrame 使用 bamboolib。

單獨使用 bamboolib

在本逐步解說中,您會使用 bamboolib 在筆記本中顯示範例銷售數據集的內容。 然後,您可以實驗 bamboolib 自動為您產生的一些相關筆記本程序代碼。 您可以藉由查詢和排序銷售數據集內容的複本來完成。

  1. 建立 Python 筆記本。

  2. 將筆記本附加 至符合 需求的叢集。

  3. 在筆記本的第一個 數據格中,輸入下列程式代碼,然後 執行 數據格。 如果 bamboolib 已安裝在工作區或叢集中,則可以略過此步驟。

    %pip install bamboolib
    
  4. 在筆記本的第二個儲存格中,輸入下列程式代碼,然後執行數據格。

    import bamboolib as bam
    
  5. 在筆記本的第三個數據格中,輸入下列程式代碼,然後執行數據格。

    bam
    
  6. 按兩下 [ 載入虛擬資料]。

  7. 在 [ 載入虛擬數據 ] 窗格中,針對 [載入測試 bamboolib 的虛擬數據集],選取 [銷售數據集]。

  8. 按一下 [執行]

  9. 顯示item_type「嬰兒食品」的所有數據列

    1. 在 [ 搜尋動作] 清單中,選取 [ 篩選數據列]。
    2. 在 [篩選數據列] 窗格中的 [選擇] 列表中,選取 [選取數據列]。
    3. 在下列清單中,選取 [item_type]。
    4. 在item_type旁的 [選擇] 列表中,選取 [有值]。
    5. [選擇值(s)] 方塊旁 有 value(s),選取 [ 嬰兒食品]。
    6. 按一下 [執行]
  10. 複製此查詢自動產生的 Python 程式代碼:

    1. Cick 資料預覽下方的複製程序代碼
  11. 貼上並修改程式代碼:

    1. 在筆記本的第四個數據格中,貼上您複製的程序代碼。 其看起來應該如下:

      import pandas as pd
      df = pd.read_csv(bam.sales_csv)
      # Step: Keep rows where item_type is one of: Baby Food
      df = df.loc[df['item_type'].isin(['Baby Food'])]
      
    2. 新增至此程式代碼,使其只顯示order_prioC 的數據列,然後執行資料格:

      import pandas as pd
      df = pd.read_csv(bam.sales_csv)
      # Step: Keep rows where item_type is one of: Baby Food
      df = df.loc[df['item_type'].isin(['Baby Food'])]
      
      # Add the following code.
      # Step: Keep rows where order_prio is one of: C
      df = df.loc[df['order_prio'].isin(['C'])]
      df
      

    提示

    除了撰寫此程式代碼之外,您也可以只使用第三個數據格中的 bamboolib,只顯示order_prioC 的數據列,即可執行相同的動作。此步驟是擴充 bamboolib 稍早自動產生的程式代碼範例。

  12. 依區域依遞增順序排序數據列

    1. 在第四個儲存格內的小工具中,於 [ 搜尋動作 ] 清單中,選取 [排序數據列]。
    2. 在 [ 排序數據行] 窗格中,於 [ 選擇數據行 ] 清單中,選取 區域
    3. 在區域旁邊的清單中,選取 [遞增][A-Z]。
    4. 按一下 [執行]

    注意

    這相當於自行撰寫下列程式代碼:

    df = df.sort_values(by=['region'], ascending=[True])
    df
    

    您也可以只使用第三個數據格中的 bamboolib,以遞增順序依 區域 排序數據列。 此步驟示範如何使用 bamboolib 來擴充您撰寫的程式代碼。 當您使用 bamboolib 時,它會自動為您在背景產生額外的程式代碼,以便您進一步擴充已擴充的程式代碼!

  13. 繼續執行 重要工作

搭配現有的 DataFrame 使用 bamboolib

在本逐步解說中,您會使用 bamboolib 在筆記本中顯示 pandas DataFrame 的內容。 此 DataFrame 包含範例銷售數據集的複本。 然後,您可以實驗 bamboolib 自動為您產生的一些相關筆記本程序代碼。 您可以藉由查詢及排序某些 DataFrame 的內容來完成。

  1. 建立 Python 筆記本。

  2. 將筆記本附加 至符合 需求的叢集。

  3. 在筆記本的第一個 數據格中,輸入下列程式代碼,然後 執行 數據格。 如果 bamboolib 已安裝在工作區或叢集中,則可以略過此步驟。

    %pip install bamboolib
    
  4. 在筆記本的第二個儲存格中,輸入下列程式代碼,然後執行數據格。

    import bamboolib as bam
    
  5. 在筆記本的第三個數據格中,輸入下列程式代碼,然後執行數據格。

    import pandas as pd
    
    df = pd.read_csv(bam.sales_csv)
    df
    

    請注意,bamboolib 僅支援 pandas DataFrames。 若要將 PySpark DataFrame 轉換成 pandas DataFrame,請在 PySpark DataFrame 上呼叫 toPandas 。 若要將 Spark DataFrame 上的 Pandas API 轉換成 pandas DataFrame,請在 Spark DataFrame 上的 Pandas API 上呼叫 to_pandas

  6. 按兩下 [ 顯示 bamboolib UI]。

  7. 顯示item_type「嬰兒食品」的所有數據列

    1. 在 [ 搜尋動作] 清單中,選取 [ 篩選數據列]。
    2. 在 [篩選數據列] 窗格中的 [選擇] 列表中,選取 [選取數據列]。
    3. 在下列清單中,選取 [item_type]。
    4. 在item_type旁的 [選擇] 列表中,選取 [有值]。
    5. [選擇值(s)] 方塊旁 有 value(s),選取 [ 嬰兒食品]。
    6. 按一下 [執行]
  8. 複製此查詢自動產生的 Python 程式代碼。 若要這樣做,請按兩下數據預覽下方的 [ 複製程式代碼 ]。

  9. 貼上並修改程式代碼:

    1. 在筆記本的第四個數據格中,貼上您複製的程序代碼。 其看起來應該如下:

      # Step: Keep rows where item_type is one of: Baby Food
      df = df.loc[df['item_type'].isin(['Baby Food'])]
      
    2. 新增至此程式代碼,使其只顯示order_prioC 的數據列,然後執行資料格:

      # Step: Keep rows where item_type is one of: Baby Food
      df = df.loc[df['item_type'].isin(['Baby Food'])]
      
      # Add the following code.
      # Step: Keep rows where order_prio is one of: C
      df = df.loc[df['order_prio'].isin(['C'])]
      df
      

    提示

    除了撰寫此程式代碼之外,您也可以只使用第三個數據格中的 bamboolib,只顯示order_prioC 的數據列,即可執行相同的動作。此步驟是擴充 bamboolib 稍早自動產生的程式代碼範例。

  10. 依區域依遞增順序排序數據列

    a. 在第四個儲存格內的小工具中,按一下 [ 排序數據列]。

    1. 在 [ 排序數據行] 窗格中,於 [ 選擇數據行 ] 清單中,選取 區域
    2. 在區域旁邊的清單中,選取 [遞增][A-Z]。
    3. 按一下 [執行]

    注意

    這相當於自行撰寫下列程式代碼:

    df = df.sort_values(by=['region'], ascending=[True])
    df
    

    您也可以只使用第三個數據格中的 bamboolib,以遞增順序依 區域 排序數據列。 此步驟示範如何使用 bamboolib 來擴充您撰寫的程式代碼。 當您使用 bamboolib 時,它會自動為您在背景產生額外的程式代碼,以便您進一步擴充已擴充的程式代碼!

  11. 繼續執行 重要工作

主要工作

本節內容:

將小工具新增至儲存格

案例:您希望 bamboolib 小工具顯示在單元格中。

  1. 請確定筆記本符合 bamboolib 的需求

  2. 如果尚未在工作區或叢集中安裝 bamboolib,請在筆記本的儲存格中執行下列程式代碼,最好在第一個數據格中執行:

    %pip install bamboolib
    
  3. 在筆記本中執行下列程序代碼,最好是在筆記本的第一個或第二個數據格中:

    import bamboolib as bam
    
  4. 選項 1:在您要顯示小工具的儲存格中,新增下列程式代碼,然後執行資料格:

    bam
    

    小工具會出現在程序代碼下方的儲存格中。

    或:

    選項 2:在包含 pandas DataFrame 參考 的儲存格中,列印 DataFrame。 例如,假設有下列 DataFrame 定義,請執行數據格:

    import pandas as pd
    from datetime import datetime, date
    
    df = pd.DataFrame({
      'a': [ 1, 2, 3 ],
      'b': [ 2., 3., 4. ],
      'c': [ 'string1', 'string2', 'string3' ],
      'd': [ date(2000, 1, 1), date(2000, 2, 1), date(2000, 3, 1) ],
      'e': [ datetime(2000, 1, 1, 12, 0), datetime(2000, 1, 2, 12, 0), datetime(2000, 1, 3, 12, 0) ]
    })
    
    df
    

    小工具會出現在程序代碼下方的儲存格中。

    請注意,bamboolib 僅支援 pandas DataFrames。 若要將 PySpark DataFrame 轉換成 pandas DataFrame,請在 PySpark DataFrame 上呼叫 toPandas 。 若要將 Spark DataFrame 上的 Pandas API 轉換成 pandas DataFrame,請在 Spark DataFrame 上的 Pandas API 上呼叫 to_pandas

清除小工具

案例:您想要清除小工具的內容,然後將新數據讀入現有的小工具。

選項 1:在包含目標小工具的儲存格內執行下列程式代碼:

bam

小工具會清除 Databricks,然後重新顯示 Databricks:從 DBFS 讀取 CSV 檔案、 Databricks:載入資料庫數據表,以及 載入虛擬數據 按鈕。

注意

如果出現錯誤 name 'bam' is not defined ,請在筆記本中執行下列程式代碼(最好是在筆記本的第一個數據格中),然後再試一次:

import bamboolib as bam

選項 2:在包含 pandas DataFrame 參考的儲存格中,再次執行數據格來列印 DataFrame。 小工具會清除,然後顯示新的數據。

數據載入工作

本節內容:

將範例數據集的內容讀入 Widget

案例:您想要將一些範例數據讀入小工具,例如一些假裝的銷售數據,以便測試小工具的功能。

  1. 按兩下 [ 載入虛擬資料]。

    注意

    如果 看不到 [載入虛擬數據 ], 請清除 [選項 1 ] 的小工具,然後再試一次。

  2. 在 [ 載入虛擬數據 ] 窗格中,針對 [載入測試 bamboolib 的虛擬數據集],選取您要載入的數據集名稱。

  3. 針對 Dataframe 名稱,輸入資料表內容之程式設計標識碼的名稱做為 DataFrame,或將 df 保留為預設的程式設計標識碼。

  4. 按一下 [執行]

    小工具會顯示數據集的內容。

提示

您可以切換目前的小工具以顯示不同範例資料集的內容:

  1. 在目前的 Widget 中,按兩下 [ 載入虛擬資料] 索引 標籤。
  2. 請遵循上述步驟,將其他範例數據集的內容讀入 Widget。

將 CSV 檔案的內容讀入 Widget

案例:您想要將 Azure Databricks 工作區內的 CSV 檔案內容讀入小工具。

  1. 按兩下 [Databricks:從 DBFS 讀取 CSV 檔案]。

    注意

    如果 Databricks:無法從 DBFS 讀取 CSV 檔案, 請清除具有選項 1 的小工具,然後再試一次。

  2. 在 [ 從 DBFS 讀取 CSV] 窗格中,流覽至包含目標 CSV 檔案的位置。

  3. 選取目標 CSV 檔案。

  4. 針對 Dataframe 名稱,輸入 CSV 檔案內容之程式設計標識碼的名稱做為 DataFrame,或將 df 保留為預設的程式設計標識碼。

  5. 針對 CSV 值分隔符,輸入分隔 CSV 檔案中值的字元,或將 、 (逗號) 字元保留為預設值分隔符。

  6. 針對 [小數分隔符],輸入 CSV 檔案中分隔小數點的字元,或將 . (dot) 字元保留為預設值分隔符。

  7. 針對 數據列限制:讀取前 N 個數據列 - 保留空白,不限制、輸入要讀取到小工具的數據列數目上限,或保留 100000 作為預設數據列數目,或將此方塊保留空白以指定沒有數據列限制。

  8. 按兩下 [ 開啟 CSV 檔案]。

    小工具會根據您指定的設定,顯示 CSV 檔案的內容。

提示

您可以切換目前的小工具以顯示不同 CSV 檔案的內容:

  1. 在目前的 Widget 中,按兩下 [從 DBFS 讀取 CSV] 索引卷標。
  2. 請遵循上述步驟,將其他 CSV 檔案的內容讀入 Widget。

將資料庫數據表的內容讀入 Widget

案例:您想要將 Azure Databricks 工作區內資料庫數據表的內容讀入小工具。

  1. 按兩下 [Databricks:載入資料庫數據表]。

    注意

    如果 Databricks:載入資料庫資料表 不可見, 請清除具有選項 1 的小工具,然後再試一次。

  2. 在 [ Databricks:載入資料庫數據表 ] 窗格中,針對 [資料庫 - 針對預設資料庫保留空白],輸入目標數據表所在的資料庫名稱,或將此方塊保留空白以指定 預設 資料庫。

  3. 針對 [數據表],輸入目標數據表的名稱。

  4. 針對 數據列限制:讀取前 N 個數據列 - 保留空白,不限制、輸入要讀取到小工具的數據列數目上限,或保留 100000 作為預設數據列數目,或將此方塊保留空白以指定沒有數據列限制。

  5. 針對 Dataframe 名稱,輸入資料表內容之程式設計標識碼的名稱做為 DataFrame,或將 df 保留為預設的程式設計標識碼。

  6. 按一下 [執行]

    小工具會根據您指定的設定,顯示資料表的內容。

提示

您可以切換目前的小工具以顯示不同資料表的內容:

  1. 在目前的 Widget 中,按兩下 [Databricks:載入資料庫資料表 ] 索引標籤。
  2. 請遵循上述步驟,將其他數據表的內容讀入 Widget。

數據動作工作

bamboolib 提供超過 50 個數據動作。 以下是一些較常見的入門數據動作工作。

本節內容:

選取資料行

案例:您想要依名稱、數據類型或符合某些正則表示式,只顯示特定數據表數據行。 例如,在虛擬 Sales 資料集中,您想要只 item_type 顯示 和 sales_channel 資料行,或只顯示資料行名稱中包含字串 _date 的數據行。

  1. 在 [ 資料] 索引標籤的 [搜尋動作 ] 下拉式清單中,執行下列其中一項動作:
    • 輸入 select,然後選取 [ 選取或卸除數據行]。
    • 選取 [選取或卸除數據行]。
  2. 在 [選取或卸除數據行] 窗格的 [選擇] 下拉式清單中,選取 [選取]。
  3. 選取目標數據行名稱或包含準則。
  4. 針對 Dataframe 名稱,輸入資料表內容之程式設計標識碼的名稱做為 DataFrame,或將 df 保留為預設的程式設計標識碼。
  5. 按一下 [執行]

卸除資料行

案例:您想要依名稱、數據類型或符合某些正則表示式來隱藏特定數據表數據行。 例如,在虛擬 銷售數據集中,您想要隱藏 order_prioorder_dateship_date 資料行,或想要隱藏只包含日期時間值的所有數據行。

  1. 在 [ 資料] 索引標籤的 [搜尋動作 ] 下拉式清單中,執行下列其中一項動作:
    • 輸入 drop,然後選取 [ 選取或卸除數據行]。
    • 選取 [選取或卸除數據行]。
  2. 在 [ 選取或卸除數據行 ] 窗格的 [選擇 ] 下拉式清單中,選取 [ 除]。
  3. 選取目標數據行名稱或包含準則。
  4. 針對 Dataframe 名稱,輸入資料表內容之程式設計標識碼的名稱做為 DataFrame,或將 df 保留為預設的程式設計標識碼。
  5. 按一下 [執行]

篩選資料列

案例:您想要根據符合或遺漏的特定數據行值等準則來顯示或隱藏特定數據表數據列。 例如,在虛擬 Sales 資料集中,您想要只顯示資料行值設定為Baby Food的數據列item_type

  1. 在 [ 資料] 索引標籤的 [搜尋動作 ] 下拉式清單中,執行下列其中一項動作:
    • 輸入 篩選,然後選取 [ 篩選數據列]。
    • 選取 [ 篩選數據列]。
  2. 在 [篩選數據列] 窗格中,於上方[選擇] 下拉式清單中,選取 [選取數據列] 或 [卸除數據列]。
  3. 指定第一個篩選準則。
  4. 若要新增另一個篩選準則,請按下 [ 新增條件],然後指定下一個篩選準則。 視需要重複。
  5. 針對 Dataframe 名稱,輸入資料表內容之程式設計標識碼的名稱做為 DataFrame,或將 df 保留為預設的程式設計標識碼。
  6. 按一下 [執行]

排序資料列

案例:您想要根據一或多個數據行內的值來排序數據表數據列。 例如,在虛擬 Sales 資料集中,您想要依 region 資料行的值依從 A 到 Z 的字母順序顯示資料列。

  1. 在 [ 資料] 索引標籤的 [搜尋動作 ] 下拉式清單中,執行下列其中一項動作:
    • 輸入 排序,然後選取 [排序數據列]。
    • 選取 [排序數據列]。
  2. 在 [ 排序數據行] 窗格中,選擇要排序依據的第一個數據行和排序順序。
  3. 若要新增另一個排序準則,請按兩下 [新增數據行],然後指定下一個排序準則。 視需要重複。
  4. 針對 Dataframe 名稱,輸入資料表內容之程式設計標識碼的名稱做為 DataFrame,或將 df 保留為預設的程式設計標識碼。
  5. 按一下 [執行]

群組數據列和數據行工作

本節內容:
依單一聚合函數分組數據列和數據行

案例:您想要藉由計算群組來顯示數據列和數據行結果,而且您想要將自定義名稱指派給這些群組。 例如,在虛擬 Sales 資料集中,您想要依 country 資料行的值來分組數據列,顯示包含相同 country 值的數據列數目,並提供計算計數列表的名稱 country_count

  1. 在 [ 資料] 索引標籤的 [搜尋動作 ] 下拉式清單中,執行下列其中一項動作:
    • 輸入群組,然後選取 [分組依據] 和 [匯總] (使用重新命名)。
    • 選取 [分組依據] 並匯總 [重新命名]。
  2. 在 [ 使用數據行重新命名 分組] 窗格中,選取要分組的數據行、第一個計算,並選擇性地指定計算結果列的名稱。
  3. 若要新增另一個計算,請按兩下 [新增計算],然後指定下一個計算和數據行名稱。 視需要重複。
  4. 指定要儲存結果的位置。
  5. 針對 Dataframe 名稱,輸入資料表內容之程式設計標識碼的名稱做為 DataFrame,或將 df 保留為預設的程式設計標識碼。
  6. 按一下 [執行]
依多個聚合函數分組數據列和數據行

案例:您想要藉由計算群組來顯示數據列和數據行結果。 例如,在虛擬銷售數據集中,您想要依regioncountrysales_channel 資料行的值來分組數據列,其中顯示包含相同 region 和值sales_channel的數據列數目,以及 total_revenue 、、 和 sales_channelcountry 的唯一組合regioncountry

  1. 在 [ 資料] 索引標籤的 [搜尋動作 ] 下拉式清單中,執行下列其中一項動作:
    • 輸入群組,然後選取 [分組依據] 和 [匯總] (預設值)。
    • 選取 [分組依據] 並匯總 [預設值]。
  2. 在 [ 使用數據行重新命名 分組] 窗格中,選取要分組的數據行和第一個計算。
  3. 若要新增另一個計算,請按兩下 [新增計算],然後指定下一個計算。 視需要重複。
  4. 指定要儲存結果的位置。
  5. 針對 Dataframe 名稱,輸入資料表內容之程式設計標識碼的名稱做為 DataFrame,或將 df 保留為預設的程式設計標識碼。
  6. 按一下 [執行]

拿掉遺漏值的數據列

案例:您想要移除任何具有指定數據行之遺漏值的數據列。 例如,在虛擬 銷售數據集中,您想要移除任何遺漏 item_type 值的數據列。

  1. 在 [ 資料] 索引標籤的 [搜尋動作 ] 下拉式清單中,執行下列其中一項動作:
    • 輸入 卸除移除,然後選取 [ 卸除遺漏值]。
    • 選取 [ 卸除遺漏的值]。
  2. 在 [ 卸除遺漏值 ] 窗格中,選取數據行以移除任何具有該數據行遺漏值的數據列。
  3. 針對 Dataframe 名稱,輸入資料表內容之程式設計標識碼的名稱做為 DataFrame,或將 df 保留為預設的程式設計標識碼。
  4. 按一下 [執行]

拿掉重複的數據列

案例:您想要移除具有指定資料行重複值的任何數據列。 例如,在虛擬 銷售數據集中,您想要移除彼此完全重複的任何數據列。

  1. 在 [ 資料] 索引標籤的 [搜尋動作 ] 下拉式清單中,執行下列其中一項動作:
    • 輸入 卸除移除,然後選取 [ 卸除/移除重複專案]。
    • 選取 [ 卸除/移除重複專案]。
  2. 在 [ 移除重複專案 ] 窗格中,選取數據行以移除具有重複值的任何數據列,然後選取是否保留具有重複值的第一個或最後一個數據列。
  3. 針對 Dataframe 名稱,輸入資料表內容之程式設計標識碼的名稱做為 DataFrame,或將 df 保留為預設的程式設計標識碼。
  4. 按一下 [執行]

尋找並取代遺漏的值

案例:您想要將遺漏的值取代為具有指定數據行之任何數據列的取代值。 例如,在虛擬 Sales 資料集中,您想要以值 Unknown Item Type取代資料行中item_type遺漏值的任何數據列。

  1. 在 [ 資料] 索引標籤的 [搜尋動作 ] 下拉式清單中,執行下列其中一項動作:
    • 輸入 尋找取代,然後選取 [ 尋找並取代遺漏值]。
    • 選取 [ 尋找] 並取代遺漏的值
  2. 在 [ 取代遺漏值 ] 窗格中,選取要取代遺漏值的數據行,然後指定取代值。
  3. 按一下 [執行]

建立數據行公式

案例:您想要建立使用唯一公式的數據行。 例如,在虛擬 Sales 資料集中,您想要建立名為 profit_per_unit 的數據行,以顯示將數據行值除 total_profitunits_sold 每個數據列之數據行值的結果。

  1. 在 [ 資料] 索引標籤的 [搜尋動作 ] 下拉式清單中,執行下列其中一項動作:
    • 輸入 公式,然後選取 [ 新增數據行公式]。
    • 選取 [ 新增數據行公式]。
  2. 在 [ 取代遺漏值 ] 窗格中,選取要取代遺漏值的數據行,然後指定取代值。
  3. 按一下 [執行]

數據動作歷程記錄工作

本節內容:

檢視小工具中所採取的動作清單

案例:您想要從最近的變更開始,查看小工具中所做的所有變更清單。

按兩下 [ 歷程記錄]。 動作清單會出現在 [轉換歷程記錄 ] 窗格中。

復原小工具中最近採取的動作

案例:您想要還原小工具中最近所做的變更。

執行下列其中一項動作:

  • 按兩下逆時針箭號圖示。
  • 按兩下 [ 歷程記錄],然後在 [ 轉換歷程記錄 ] 窗格中,按兩下 [ 復原最後一個步驟]。

重做小工具中最近採取的動作

案例:您想要還原小工具中最近所做的還原。

執行下列其中一項動作:

  • 按兩下順時針箭號圖示。
  • 按兩下 [ 歷程記錄],然後在 [ 轉換歷程記錄 ] 窗格中,按兩下 [ 復原最後一個步驟]。

變更小工具中最近採取的動作

案例:您想要變更小工具中的最新變更。

  1. 執行下列其中一項動作:
    • 按兩下鉛筆圖示。
    • 按兩下 [ 歷程記錄],然後在 [轉換歷程記錄 ] 窗格中,按兩下 [ 編輯最後一個步驟]。
  2. 進行所需的變更,然後按兩下 [ 執行]。

取得程序代碼,以程式設計方式重新建立小工具的目前狀態作為 DataFrame

案例:您想要取得以程序設計方式重新建立目前小工具狀態的 Python 程式代碼,以 pandas DataFrame 表示。 您想要在此活頁簿中的不同儲存格中執行此程式碼,或完全在不同的活頁簿中執行此程式碼。

  1. 按兩下 [ 取得程序代碼]。

  2. 在 [ 匯出程序代碼 ] 窗格中,按兩下 [ 複製程式代碼]。 程式代碼會複製到系統的剪貼簿。

  3. 將程式代碼貼到此活頁簿中的不同儲存格或不同的活頁簿中。

  4. 撰寫其他程式代碼以程序設計方式使用此 pandas DataFrame,然後執行數據格。 例如,若要顯示 DataFrame 的內容,假設 DataFrame 是以程式設計方式 df表示:

    # Your pasted code here, followed by...
    df
    

限制

  • 使用 bamboolib 進行數據整頓,限制為大約 1000 萬個數據列。 此限制是以 pandas 和叢集的計算資源為基礎。
  • 針對數據視覺效果使用 bamboolib 限制為大約 10,000 個數據列。 此限制是以繪圖為基礎。

其他資源