データ構造を単純化する
複数のソースから Power BI Desktop にデータをインポートすると、データには定義済みのテーブル名と列名が保持されます。 これらの名前の一部を変更して、一貫した形式にし、操作をしやすくし、ユーザーによりわかりやすくすることができます。 Power BI Desktop の Power Query エディターを使用して、これらの名前を変更し、データ構造を簡素化できます。
モデルの初期データを成形した前のシナリオを続行するには、さらにアクションを実行して、売上データの構造を単純化し、営業チーム用にレポートを作成できるように準備する必要があります。 列の名前は既に変更していますが、ここでクエリ (テーブル) の名前を調べ、さらに改善できるかどうかを確認する必要があります。 また、列の内容を確認し、修正が必要なすべての値を置き換える必要があります。
クエリ名の変更
特殊なクエリ名または役に立たないクエリ名をより分かりやすい、またはユーザーが使い慣れた名前に変更することをお勧めします。 たとえば、製品ファクト テーブルを Power BI Desktop にインポートし、クエリ名が FactProductTable と表示される場合、これを Products などのよりユーザーフレンドリな名前に変更することができます。 同様に、ビューをインポートすると、ビューの名前には vProduct のように接頭辞 v が含まれる場合があります。 この名前は不明確で混乱を招く場合があるため、接頭辞を削除することができます。
この例では、TargetSales クエリの名前を調べ、この名前が役に立たないことがわかりました。それは、クエリに毎年この名前が付けられるためです。 混乱を避けるため、クエリ名に年を追加する必要があります。
Power Query エディターのデータの左側にあるクエリ ペインで、名前を変更するクエリを選択します。 クエリを右クリックして、名前の変更 を選択します。 現在の名前を編集するか、新しい名前を入力してから、Enter キーを押します。
値を置換する
Power Query エディターの値の置換機能を使用すると、選択した列の任意の値を別の値に置き換えることができます。
この例では、Attribute 列の 12 月のスペルが間違っていることがわかります。 このスペル ミスを修正する必要があります。 置換する値 (この場合は Attribute) が含まれている列を選択し、変換 タブで 値の置換 を選択します。
検索する値 ボックスに置換する値の名前を入力し、置換後 ボックスに正しい値の名前を入力して、OK を選択します。 Power Query では、Excel のように 1 つのセルを選択して 1 つの値を変更することはできません。
クエリ設定 ウィンドウで、データの再構築と修正のために実行した手順のリストを確認できます。 必要な手順をすべて完了したら、閉じて適用 を選択して Power Query エディターを閉じ、変更をデータ モデルに適用できます。 しかし、さらにアクションを実行し、データを消去および変換することができます。
null 値を置換する
場合によっては、データ ソースに null 値が含まれていることがあります。 たとえば、販売注文の配送料が 0 と同義の場合、null 値が含まれることがあります。 値が null のままの場合、平均値は正しく計算されません。 解決策の 1 つは、null 値を 0 に変更することです。これにより、配送料の平均がより正確なものになります。 この例では、前に従ったのと同じ手順を使用すれば、null 値を 0 に置き換えるのに役立ちます。
重複部分の削除
Power Query の重複の削除機能を使用して列から重複を削除し、選択した列に一意の名前のみを残すこともできます。
この例では、Category Name 列に各カテゴリの重複が含まれていることに注意してください。 その結果、一意のカテゴリを持つテーブルを作成し、それをセマンティック モデルで使用することになります。 このアクションを実行するには、列を選択し、列のヘッダーを右クリックして、重複の削除オプションを選択します。
重複を削除する前に、テーブルをコピーすることを検討してください。 コピー オプションは、次のスクリーンショットに示されているように、コンテキスト メニューの上部にあります。 重複を削除する前にテーブルをコピーすると、テーブルを比較し、必要に応じて両方のテーブルを使用できるようになります。
テーブル、列、値の名前付けに関するベスト プラクティス
テーブル、列、値の名前付け規則には固定のルールはありません。しかし、組織内で一般的に使用され、全員が同意し、共通の用語と見なす言語と省略形を使用することをお勧めします。
ベスト プラクティスは、テーブル、列、メジャーに説明的なビジネス用語で名前を付け、アンダースコア ("_") をスペースに置き換えることです。 略語、接頭辞、および "番号" や "ID" などの単語は一貫性を持たせてください。組織内で一般的に使用されていない場合、短すぎる略語は混乱を招く可能性があります。
また、テーブル名で使用する可能性のある接頭辞や接尾辞を削除し、代わりにシンプルな形式で名前を付ければ、混乱を避けるのに役立ちます。
値を置き換えるときに、これらの値がレポートにどのように表示されるかを想像してみてください。 値が長すぎると、読みにくくなり、ビジュアルに収めにくくなる場合があります。 値が短すぎると、解釈しにくくなる場合があります。 テキストがビジュアルに収まる限り、値に頭字語を使用しないこともお勧めします。