ダッシュボードの視覚化の種類
この記事では、AI/BI ダッシュボードで使用できる視覚化の種類の概要を説明し、各視覚化の種類の例を作成する方法について説明します。 ダッシュボードを作成する手順については、「ダッシュボードを作成する」を参照してください。
Note
パフォーマンスを最適化するために、グラフはキャンバスに 10,000 行または 10 MB のどちらか小さい方しかレンダリングできません。 それ以外の場合、視覚化は切り詰められる可能性があります。
領域の視覚化
領域の視覚化は、折れ線グラフと横棒グラフの視覚化を組み合わせて、1 つ以上のグループの数値が 2 番目の変数 (通常は時間) の推移中にどのように変化するかを示します。 これらは、時間の経過に伴うセールスじょうごの変化を示すためによく使用されます。
構成値: この領域の視覚化の例では、次の値が設定されました。
- データセット: TPCH の注文
- 視覚化: 領域
- タイトル:
Total price and order year by order priority and clerk
- X 軸:
- フィールド:
o_orderdate
- スケールの種類:
Temporal
- 変換:
Yearly
- 軸のタイトル:
Order year
- フィールド:
- Y 軸:
- フィールド:
o_totalprice
- 軸のタイトル:
Total price
- スケールの種類:
Quantitative
- 変換:
Sum
- フィールド:
- グループ化:
- フィールド:
o_orderpriority
- 凡例のタイトル:
Order priority
- フィールド:
- フィルター処理する
- フィールド:
TPCH orders.o_clerk
- フィールド:
SQL クエリ: この領域の視覚化では、次の SQL クエリを使用して TPCH orders
という名前のデータ セットを生成しました。
SELECT * FROM samples.tpch.orders
横棒グラフ
棒グラフは、円グラフの視覚化と同様に、時間の経過に伴う、またはカテゴリ全体のメトリクスの変化を表したり、比例性を示したりします。
構成値: この横棒グラフの視覚化の例では、次の値が設定されました。
- データセット: TPCH の注文
- 視覚化: バー
- タイトル:
Total price and order month by order priority and clerk
- X 軸:
- フィールド:
o_orderdate
- 変換:
Monthly
- スケールの種類:
Temporal
- 軸のタイトル:
Order month
- フィールド:
- Y 軸:
- フィールド:
o_totalprice
- スケールの種類:
Quantitative
- 変換:
Sum
- 軸のタイトル:
Total price
- フィールド:
- グループ化:
- フィールド:
o_orderpriority
- 凡例のタイトル:
Order priority
- フィールド:
- フィルター処理する
- フィールド:
TPCH orders.o_clerk
- フィールド:
SQL クエリ: 次の SQL クエリで棒グラフの視覚エフェクトに使用される TPCH orders
という名前のデータ セットを生成しました。
SELECT * FROM samples.tpch.orders
ボックス グラフ
ボックス グラフの視覚化では、必要に応じてカテゴリ別にグループ化された数値データの分布の概要が示されます。 ボックス グラフの視覚化を使用すると、カテゴリ間で値の範囲をすばやく比較し、四分位数を通じて値の局所性、分散、傾斜のグループを視覚化できます。 各ボックス内の濃い線は四分位範囲を示しています。 ボックス グラフの視覚化の解釈の詳細については、Wikipedia の「ボックス グラフに関する記事」を参照してください。
構成値: このボックス グラフの視覚化では、次の値が設定されました。
- X 列 (データセット列):
l-returnflag
- Y 列 (データセット列):
l_extendedprice
- X 軸名 (既定値をオーバーライド):
Return flag1
- Y 軸名 (既定値をオーバーライド):
Extended price
SQL クエリ: このボックス グラフの視覚化では、次の SQL クエリを使用してデータ セットを生成しました。
select * from samples.tpch.lineitem
バブル チャート
バブル チャートは散布図であり、各ポイント マーカーのサイズに関連するメトリックが反映されます。 バブル チャートを作成するには、視覚化の種類として [散布図] を選択します。 [サイズ] 設定で、マーカーのサイズで表すメトリックを選択します。
構成値: このバブル チャートの視覚化の例では、次の値が設定されました。
- データセット: NYC タクシー乗車
- 視覚化: 散布図
- タイトル:
Trip distance, fares, and trip duration
- X 軸:
- フィールド:
trip_distance
- スケールの種類:
Quantitative
- 変換:
None
- フィールド:
- Y 軸:
- フィールド:
fare_amount
- スケールの種類:
Quantitative
- 変換:
None
- フィールド:
- Color by (項目別の色):
- フィールド:
pickup_zip
- フィールド:
- サイズ:
- フィールド:
time_spent
- 変換:
None
- フィールド:
複合グラフ
複合グラフは、折れ線グラフと横棒グラフを組み合わせて、時間の経過に伴う変化を比例的に示します。
構成値: この複合グラフの視覚化では、次の値が設定されました。
- データセット: partsupp
- 視覚化: コンボ
- X 軸:
ps_partkey
- スケールの種類:
Quantitative
- スケールの種類:
- Y 軸:
- バー:
ps_availqty
- 集計の種類:
SUM
- ライン:
ps_supplycost
- 集計の種類:
AVG
- バー:
- Y シリーズによる色:
Sum of ps_availqty
Average ps_supplycost
SQL クエリ: この複合グラフの視覚化では、次の SQL クエリを使用してデータ セットを生成しました。
SELECT * FROM samples.tpch.partsupp
2 軸複合グラフ
複合グラフを使用すると、2 つの異なる y 軸を表示できます。 複合グラフ ウィジェットを選択した状態で、グラフ構成パネルの Y 軸設定の kebab メニューをクリックします。 [2 軸を有効にする] オプションをオンにします。
構成値: この複合グラフの場合、[2 軸を有効にする] オプションがオンになっています。 その他の構成は次のように設定されています。
- データセット: 乗車
- 視覚化: コンボ
- X 軸:
tpep_pickup_datetime
- スケールの種類:
Temporal
- 変換:
Weekly
- スケールの種類:
- Y 軸:
- 左 Y 軸 (棒):
trip_distance
- 変換:
AVG
- 変換:
- 右 Y 軸 (折れ線):
fare_amount
- 変換:
AVG
- 変換:
- 左 Y 軸 (棒):
Y 系列による色:
Average trip_distance
Average fare_amount
SQL クエリ: 次の SQL クエリを使用してデータ セットを生成しました。
SELECT * FROM samples.nyctaxi.trips
カウンターの視覚化
カウンターでは、1 つの値が目立つように表示され、ターゲット値と比較するオプションが表示されます。 カウンターを使用するには、[値列] と [ターゲット列] のカウンター視覚エフェクトに表示するデータ行を指定します。
条件付き書式を設定し、[値] 構成の詳細でテキスト スタイルをカスタマイズできます。
構成値: このカウンターの視覚化の例では、次の値が設定されました。
- データセット: TPCH の注文
- 視覚化: カウンター
- タイトル:
Orders: Target amount vs. actual amount by date
- 値:
- フィールド:
avg(o_totalprice)
- 値の行番号: 1
- フィールド:
- ターゲット:
- フィールド:
avg(o_totalprice)
- 値の行番号: 2
- フィールド:
- フィルター処理する
- フィールド:
TPCH orders.o_orderdate
- フィールド:
SQL クエリ: このカウンターの視覚化では、次の SQL クエリを使用して TPCH orders_target
という名前のデータ セットを生成しました。
SELECT o_orderdate, avg(o_totalprice)
FROM samples.tpch.orders
GROUP BY 1
ORDER BY 1
折れ線グラフの視覚化
折れ線グラフの視覚化は、時間の経過に伴う 1 つ以上のメトリックの変化を示します。
構成値: この折れ線グラフの視覚化の例では、次の値が設定されました。
- データセット: TPCH の注文
- 視覚化: 線
- タイトル:
Average price and order year by order priority and clerk
- X 軸:
- フィールド:
o_orderdate
- 変換:
Yearly
- スケールの種類:
Temporal
- 軸のタイトル:
Order year
- フィールド:
- Y 軸:
- フィールド:
o_totalprice
- 変換:
Average
- スケールの種類:
Quantitative
- 軸のタイトル:
Average price
- フィールド:
- グループ化:
- フィールド:
o_orderpriority
- 凡例のタイトル:
Order priority
- フィールド:
- フィルター処理する
- フィールド:
TPCH orders.o_clerk
- フィールド:
SQL クエリ: この横棒グラフの視覚化では、次の SQL クエリを使用して TPCH orders
という名前のデータ セットを生成しました。
SELECT * FROM samples.tpch.orders
ヒートマップ グラフ
ヒートマップ グラフでは、横棒グラフ、積み重ねグラフ、バブル グラフの特徴を組み合わせて、色を使用して数値データを視覚化できます。 ヒートマップの一般的なカラー パレットには、オレンジや赤などの暖色を使用して最高値が示され、青や紫などの寒色を使用して最低値が示されます。
たとえば、次のヒートマップは、各日付のタクシー乗車で最も多く利用される距離を視覚化し、曜日、距離、合計料金に基づいて、結果をグループ化します。
Note
ヒートマップには、最大 64,000 行または 10 MB を表示できます。
構成値: このヒートマップ グラフの視覚化では、次の値が設定されました。
- データセット: TPCH の注文
- 視覚化: ヒートマップ
- X 列 (データセット列):
o_orderpriority
- Y 列 (データセット列):
o_orderstatus
- カラー列:
- データセット列:
o_totalprice
- 集計の種類:
Average
- データセット列:
- X 軸名 (既定値をオーバーライド):
Order priority
- Y 軸名 (既定値をオーバーライド):
Order status
- 配色 (既定値をオーバーライド):
YIGnBu
SQL クエリ: このヒートマップ グラフの視覚化では、次の SQL クエリを使用してデータ セットを生成しました。
SELECT * FROM samples.tpch.orders
ヒストグラム グラフ
ヒストグラムは、データセット内で特定の値が発生する頻度をプロットします。 ヒストグラムは、データセットに少数の範囲の周りにクラスター化された値があるのか、それともより分散している値があるのかを理解するのに役立ちます。ヒストグラムは、個別の棒の数 (ビンとも呼ばれます) を制御する棒グラフとして表示されます。
構成値: このヒストグラム グラフの視覚化では、次の値が設定されました。
- データセット: TPCH の注文
- 視覚化: ヒストグラム
- X 列 (データセット列):
o_totalprice
- ビン数: 20
- X 軸名 (既定値をオーバーライド):
Total price
構成オプション: ヒストグラム グラフの構成オプションについては、「ヒストグラム グラフ構成オプション」を参照してください。
SQL クエリ: このヒストグラム グラフの視覚化では、次の SQL クエリを使用してデータ セットを生成しました。
select * from samples.tpch.orders
円グラフの視覚化
円グラフの視覚化は、メトリック間の比例性を示します。 これは、時系列データを伝えるためのものでは "ありません"。
構成値: この円グラフの視覚化の例では、次の値が設定されました。
- データセット: TPCH の注文
- 視覚化: 円グラフの視覚化
- タイトル:
Total price by order priority and clerk
- 角度:
- フィールド:
o_totalprice
- 変換:
Sum
- 軸のタイトル:
Total price
- フィールド:
- グループ化:
- フィールド:
o_orderpriority
- 凡例のタイトル:
Order priority
- フィールド:
- フィルター処理する
- フィールド:
TPCH orders.o_clerk
- フィールド:
SQL クエリ: この円グラフの視覚化では、次の SQL クエリを使用して TPCH orders
という名前のデータ セットを生成しました。
SELECT * FROM samples.tpch.orders
ピボットの視覚化
ピボットの視覚化では、クエリ結果のレコードが、表形式の表示に集計されます。 これは、SQL の PIVOT
または GROUP BY
ステートメントに似ています。 ピボットの視覚化は、ドラッグ アンド ドロップ フィールドで設定します。
Note
パフォーマンス上の理由で、ピボット テーブルは 100 列 x 100 行のレンダリングのみサポートします。
構成値: このピボットの視覚化の例では、次の値が設定されました。
- データセット: TPCH の行項目
- 視覚化: ピボット
- タイトル:
Line item quantity by return flag and ship mode by supplier
- 行:
- フィールド:
l_returnflag
- フィールド:
- 列:
- フィールド:
l_shipmode
- フィールド:
- Cell (セル)
- データセット:
- フィールド:
l_quantity
- 変換: SUM
- フィルター処理する
- フィールド:
TPCH lineitem.l_supplierkey
- フィールド:
SQL クエリ: このピボットの視覚化では、次の SQL クエリを使用して TPCH lineitem
という名前のデータ セットを生成しました。
SELECT * FROM samples.tpch.lineitem
ポイント マップ
ポイント マップでは、特定のマップ位置に配置されたシンボルとして定量的データが表示されます。 マーカーは緯度と経度の座標を使用して配置されます。これは、このグラフの種類の結果セットの一部として含める必要があります。 次の例では、ニューヨークの自動車の衝突のデータを使用しています。
構成値: このポイント マップの視覚化では、次の値が設定されました。
- データセット: 自動車の衝突
- 視覚化: シンボル マップ
- 座標:
- 緯度:
LATITUDE
- 経度:
LONGITUDE
- 緯度:
- 色/グループ化:
- フィールド:
CONTRIBUTING FACTOR
- フィールド:
Note
Databricks データセットには緯度または経度のデータが含まれていないため、この例ではサンプル SQL クエリは提供されません。
散布図の視覚化
散布図の視覚化は、2 つの数値変数間の関係を示すために一般的に使用されます。 さらに、3 つ目の次元を色でエンコードして、数値変数がグループ間でどのように異なるかを示すことができます。
構成値: この散布図の視覚化の例では、次の値が設定されました。
- データセット: TPCH の行項目
- 視覚化: 散布図
- タイトル:
Total price and quantity by ship mode and supplier
- X 軸:
- フィールド:
l_quantity
- 軸のタイトル:
Quantity
- スケールの種類:
Quantitative
- 変換:
None
- フィールド:
- Y 軸:
- フィールド:
l_extendedprice
- スケールの種類:
Quantitative
- 変換:
None
- 軸のタイトル:
Price
- フィールド:
- グループ化:
- フィールド:
l_shipmode
- 凡例のタイトル:
Ship mode
- フィールド:
- フィルター処理する
- フィールド:
TPCH lineitem.l_supplierkey
- フィールド:
SQL クエリ: この散布図の視覚化では、次の SQL クエリを使用して TPCH lineitem
という名前のデータ セットを生成しました。
SELECT * FROM samples.tpch.lineitem
テーブルの視覚化
テーブルの視覚化では、標準テーブルのデータが表示されますが、データの並べ替え、非表示、書式設定を手動で行えます。
Note
テーブルには、最大 64,000 行または 10 MB を表示できます。
構成値: このテーブルの視覚化の例では、次の値が設定されました。
- データセット: TPCH の行項目
- 視覚化: テーブル
- タイトル:
Line item summary by supplier
- 列:
- 表示行番号: 有効
- フィールド:
l_orderkey
- フィールド:
l_extendedprice
- 表示名:
Number
- 数値書式: $0.00
- 表示名:
- フィールド:
l_discount
- 表示名:
Number
- 数値書式: %0.00
- 表示名:
- フィールド:
l_tax
- 表示名:
Number
- 数値書式: %0.00
- 表示名:
- フィールド:
l_shipdate
- フィールド:
l_shipmode
- フィルター処理する
- フィールド:
TPCH lineitem.l_supplierkey
- フィールド:
SQL クエリ: このテーブルの視覚化では、次の SQL クエリを使用して TPCH lineitem
という名前のデータ セットを生成しました。
SELECT * FROM samples.tpch.lineitem
グラフの数値の書式
ほとんどのグラフの種類では、軸の目盛ラベル、データ ラベル、およびヒントの数値の書式を設定できます。 書式設定スタイルを選択するには、グラフ構成パネルの X 軸または Y 軸の右側にある kebab メニューをクリックします。 次に、[書式] クリックして書式設定オプションを表示します。
次のグラフでは、数値の書式設定を行うことができます。
- 面グラフ
- 横棒
- 複合
- カウンタ
- ヒートマップ
- ヒストグラム
- ライン
- ピボット
- 散布
- テーブル (従来の書式設定)
次の書式設定オプションから選択できます。
- タイプ: なし、通貨 ($)、パーセント (%)
- 省略形: なし、コンパクト表記、科学的表記
- 小数点以下の桁数: 最大、正確、すべて、桁数 オプションで、コンマなどのグループ区切り記号を含めることができます。
Note
書式設定は、さまざまな種類の通貨で使用できます。 型として [通貨] を選択した後、ドロップダウン セレクターを使用して、任意の通貨を選択します。