常見的資料挑戰和 Power Query 轉換

已完成

需要清除之匯出資料的常見範例,是包含為空或空白資料列之摘要資料的檔案。

空白或空的資料列

當您將此類型的數據集帶入 Power Query 時,這些空白或空白儲存格的值會顯示為 Null。

Excel 工作表的螢幕擷取畫面,顯示 [區域與分區] (Region & District) 資料行,其中含有空白或空的資料列。

如果您將滑鼠停留在數據行標頭下方的狀態列上方,[ 數據行分析 ] 狀態列會顯示與數據行數據相關的資訊。 在下列範例中,數據表包含22個空白值,表示43%的記錄包含 Region 資料行的空白值。 根據小計顯示的位置而定,使用者可以同時向上或向下填滿資料行 (或多個資料行)。

[區域] 資料行上 [資料行分析] 視窗的螢幕擷取畫面,其中顯示 43% 的資料列為 [空白],而 [預覽] 區域顯示 [區域與分區] (Region and District) 的 [空白] 資料列值。

如果在多個數據行上採取此動作,您必須先選取您想要更新的數據行標頭,方法是按 Ctrl 鍵,同時以滑鼠左鍵按下您想要的每個數據行。 選取資料行後,以滑鼠右鍵按一下標頭即可查看資料行功能表編輯選項。 選取 [填滿],然後選擇要向下或向上套用值。 選取 [往下] 選項相當於尋找非空白值,並將其複製到每個空白儲存格,直到找到新的值為止; 選取 [往上] 選項則相反。

Power Query 編輯器 已選取 [區域及區域] 視窗的螢幕快照,並顯示 [填滿/向上填入>區域] 和 [區域空白] 數據列的 [數據行] 功能表選項。

注意

填滿>/向下選項依賴數據的順序。 部分資料庫匯入函式會以非同步方式串流資料,這表示資料的順序可能不一致。

交叉資料表格式設定

具有「交叉資料表」格式的資料表 (例如,區域或產品資料列標頭和日期週期資料行標頭),常見於試算表和報表。 交叉資料表格式會以視覺化方式組織資料,讓大部分人更容易了解和吸收資訊。 雖然此格式對使用者可能很有幫助,但並不適合用於製作資料模型。 Power Query 具有取消資料樞紐的工具,可使資料表從短寬型轉置為狹長型。 狹長型的資料集較適合用來建立資料模型的量值。

取消樞紐功能在 Power Query 函式內引進了一項重要概念,說明如何選取用於執行作業的資料行 (無論是僅位於選取的資料行上,還是位於未選取的資料行上)。 哪一種方法較適合資料集和情況,將交由作者判斷。 匯入資料集之後,請選取具有資料列標頭的資料行。 移至功能區上的 [ 轉換 ] 索引標籤,選取 [取消樞紐數據行] 的下拉式清單,然後選取 [ 取消樞紐其他數據行]。 此流程會產生屬性和值資料行,您可以按兩下資料行標頭來為其重新命名。

從 [取消樞紐數據行] 作業前後的 Screesnshot。

清理和格式化資料

首頁功能表有著 UI 按鈕,其中包含常見的資料清理技術,如下列螢幕擷取畫面所示。

已選取 [首頁] 索引標籤並醒目提示 [移除資料列] 和 [分割資料行] 按鈕的螢幕擷取畫面。

下圖是分割資料行函式的範例,類似於 Excel 中的資料剖析功能。

若要分割資料行,請遵循下列步驟:

  1. 選取您想要分割的資料行。

  2. 選取 [分割資料行] 下拉式清單。

  3. 選取 [依分隔符 > 自定義],然後輸入正斜線 (/) 。

  4. 選取 [確定]。

以反斜線分隔 Excel 資料、[轉換] 索引標籤、[依分隔符號分割資料行] 視窗,以及具有預覽之 [Power Query 編輯器] 視窗的螢幕擷取畫面。

擴充您的資料

Power Query 可讓您新增補充欄位,以進行更深入的分析。 [新增資料行] 功能表包含各種可增強您目前資料集的方式。 當您在 [新增資料行] 功能表上使用按鈕作業時,作業的結果將會新增為 [Power Query 編輯器] 視窗之資料 [預覽] 區域中的新資料行。

[Power Query 編輯器] 視窗的螢幕擷取畫面,其中已選取 [新增資料行] 索引標籤以顯示按鈕。

透過 [Column From Examples] (從範例新增資料行) 功能,您只需為新的資料行提供一個或多個範例值,就可以將新資料行新增至資料模型。 您可以從選取項目建立新的資料行範例,或根據資料表中所有的現有資料行來提供輸入。

選擇此功能的實用原因如下:

  • 用戶易記:您只需要輸入一些結果範例,Power Query 會為您執行其餘工作。

  • 快速:即使您知道如何撰寫轉換,輸入幾個範例的速度比開發及測試文字操作的邏輯更快。

加入條件資料行功能可讓您定義 IF-THEN-ELSE 條件,並利用方便好用的精靈,根據一系列邏輯檢查來顯示指定資料行的值,而不需要管理括弧。

[加入條件資料行] 視窗的螢幕擷取畫面。

透過自訂資料行功能,您可以直接撰寫 M 運算式來建立新的資料行。 此選項對於更複雜的新增內容很有幫助,而不僅限於範例資料行或簡單條件資料行中的文字操作。 透過這項功能,您可以善加利用無法從功能區存取的 M 函式、豐富的智慧,並發揮您的創意。

自訂資料行使用者介面的螢幕擷取畫面。

注意

Power Query 編輯器中的每個按鈕選取項目,都會在 [查詢設定] 窗格中的 [套用步驟] 內建立 M 運算式,以作為步驟。 M 是 Power Query 編輯器的公式語言。 雖然您不需要學習 M 公式語言才能使用 Power Query,但該語言功能強大,且學習該語言十分有益。