Azure Databricks には、ノートブックまたは SQL エディターを使用するときに、データから直接グラフや視覚化を作成するための強力な組み込みツールがあります。 このページでは、ノートブックと SQL エディターで視覚化を作成、編集、管理する方法について説明します。 AI/BI ダッシュボードの視覚化については、「 ダッシュボードの視覚化」を参照してください。
ノートブックまたは SQL エディターから作成できる視覚化の種類を表示するには、「 視覚化の種類」を参照してください。
視覚化する結果セットを生成する
このページで使用される結果セットを生成するには、次のコードを使用します。
SQL
SQL エディターで次のクエリを実行します。
USE CATALOG samples;
SELECT
hour(tpep_dropoff_datetime) as dropoff_hour,
COUNT(*) AS num
FROM samples.nyctaxi.trips
WHERE pickup_zip in ['10001', '10002']
GROUP BY 1;
Python(プログラミング言語)
ノートブックの Python セルから次のコードを実行します。
from pyspark.sql.functions import hour, col
pickupzip = '10001' # Example value for pickupzip
df = spark.table("samples.nyctaxi.trips")
result_df = df.filter(col("pickup_zip") == pickupzip) \
.groupBy(hour(col("tpep_dropoff_datetime")).alias("dropoff_hour")) \
.count() \
.withColumnRenamed("count", "num")
display(result_df)
新しい視覚エフェクトを作成する
結果テーブルが表示されるのと同じ UI で視覚化を作成できます。 ノートブックで作業している場合は、DataFrames とテーブルの概要統計と視覚的な分析情報を提供するデータ プロファイルを生成することもできます。 データ プロファイルの詳細については、「データ プロファイルの生成」を参照してください。
視覚エフェクトを作成するには、結果の上 + クリックし、[視覚化] を選択して 視覚化 エディターを開きます。
SQL エディター
ノートパソコン
[視覚化の種類] ドロップダウンで、種類を選択します。 次に、視覚化に表示するデータを選択します。
構成を選択したら、[ 保存] をクリックします。
視覚エフェクトを削除、複製、または編集する
視覚化またはデータ プロファイルを削除、複製、または編集するには、タブ名の右側にある下向き矢印をクリックします。 メニューからダッシュボードを作成することもできます。
注
セルにデータ プロファイルが含まれている場合、または SQL 以外の言語を実行している場合、関連付けられている視覚化とデータ プロファイルはノートブック ダッシュボードにのみ追加できます。 SQL セルの場合は、ドロップダウンに追加の [ダッシュボードに追加] メニュー項目が表示されます。 「ダッシュボードに視覚エフェクトを追加する」を参照してください。
SQL エディター
ノートパソコン
タブの名前を変更するには、名前を直接クリックし、その場所で名前を編集します。
視覚化を編集する
視覚エフェクトを編集するには:
- [視覚化] タブで下向き矢印をクリックします。次に、[
編集] をクリックします。 - グラフのさまざまな部分にアクセスして編集するには、視覚化エディターの のタブを使用します。
視覚エフェクトをフィルター処理する
視覚化にフィルターを適用するには、[ をクリックします。右上隅で、適用するフィルター条件を入力します。
視覚エフェクトに適用されるフィルターは、結果テーブルにも適用されます。 結果テーブルに適用されたフィルターも視覚化に適用されます。
視覚化を複製する
視覚化を複製するには、[視覚化] タブの下向き矢印をクリックします。[ 複製] をクリックします。
視覚化で集計を有効にする
棒グラフ、折れ線グラフ、エリア グラフ、円グラフ、ヒートマップ グラフの場合は、集計列を追加するようにクエリを変更するのではなく、視覚化に集計を直接追加します。 この方法には次のような利点があります:
- 結果テーブルを生成するコードを変更する必要はありません。
- 集計を変更すると、シナリオベースのデータ分析をすばやく実行できます。
- 集計は、テーブルに表示される最初の 64,000 行だけでなく、データセット全体に適用されます。
集計は、次の視覚化で使用できます。
- 線
- 棒グラフ
- 面積
- パイ
- ヒートマップ
- ヒストグラム
集計では、同じグラフに線と棒を表示するなど、複合視覚化はサポートされていません。
視覚化の Y 軸列を集計するには:
新しいグラフを作成するか、既存のグラフを編集して、視覚化エディターを開きます。 メッセージ
This visualization uses an old configuration. New visualizations support aggregating data directly within the editor
が表示された場合、集計を使用する前に視覚化を再作成する必要があります。数値型に対して、Y軸の列の横にあるオプションから次の集計の種類を選択します。
- Sum (既定値)
- 平均
- 数える
- 異なるものをカウント
- マックス
- 分
- 中央値
または、次の文字列型の中から選択します。
- 数える
- 異なるものをカウント
[保存] をクリックします。 視覚化には、集計する行の数が表示されます。
場合によっては、Y 軸の列に集計を使用したくない場合があります。 集計をオフにするには、Kebab メニューの をクリックします。 [Y] 列 の横にある [ 集計を使用] をオフにします。
視覚化の色を編集する
視覚エフェクトの色は、視覚エフェクトの作成時または編集時にカスタマイズできます。
- 視覚化を作成または編集します。
- [色] をクリックします。
- 色を変更するには、四角形をクリックし、次のどちらかの操作を行って新しい色を選択します。
- カラー セレクターで色をクリックする。
- 16 進数値を入力する。
- カラー セレクターの外側の任意の場所をクリックして閉じます。
- 視覚エフェクト エディターで [保存] をクリックして、変更を保存します。
1 つの系列を一時的に非表示または表示する
視覚化で 1 つの系列を非表示にするには、凡例内でその系列をクリックします。 系列をもう一度表示するには、凡例内でそれをもう一度クリックします。
1 つの系列のみを表示するには、凡例内でその系列をダブルクリックします。 他の系列を表示するには、各系列をクリックします。
系列の選択
グラフで分析する特定の系列を選択するには、次のコマンドを使用します。
- 1 つの凡例項目をクリックしてその系列を選択します
- Cmd/Ctrl キーを押しながら凡例項目をクリックして、複数の系列を選択または選択解除する
ヒントの並べ替え
折れ線グラフと非積み上げ横棒グラフのツールヒントを大きさ順に並べ替えると、分析が簡単になります。
ズーム
データ密度の高いグラフの場合、個々のデータ ポイントを拡大すると、詳細を調査したり、外れ値をトリミングしたりするのに役立ちます。 グラフを拡大するには、キャンバスをクリックしてドラッグします。 ズームをクリアするには、キャンバスの上にマウス ポインターを合わせ、視覚化の右上隅にある [ズーム のクリア] ボタンをクリックします。
拡大
視覚エフェクトを PNG ファイルとしてダウンロードする
視覚エフェクトを PNG ファイルとしてダウンロードするには、キャンバスの上にマウス ポインターを置き、右上隅にあるダウンロード アイコンをクリックします。
png ファイルがデバイスにダウンロードされます。
ダッシュボードに視覚エフェクトを追加する
- タブ名の右側にある下向き矢印をクリックします。
- [ダッシュボードに追加] を選択します。 使用可能なダッシュボード ビューの一覧が、メニュー オプションの [新しいダッシュボードに追加] と共に表示されます。
- ダッシュボードを選択するか、[新しいダッシュボードに追加] を選択します。 新しく追加された視覚化を含むダッシュボードが表示されます。
レガシ視覚エフェクト
グラフの視覚化の最新バージョンは、既定でオンになっています。 このセクションの設定では、古いグラフを操作するとき、または最新バージョンがオフになっている場合に発生する可能性があるレガシ視覚化について説明します。
視覚化ツール
視覚化エディターでチャートの右上にカーソルを置くと、Plotlyツールバーが表示され、選択、ズーム、パンなどの操作を実行できます。
ツール バーが表示されない場合、管理者がツールバーの表示を無効にしています。
カスタム カラー パレット
注
既定では、レガシ ダッシュボードでカスタムのカラー パレットを使用する場合、視覚化に選択した色は無視されます。 この設定をオーバーライドするには、「視覚化に別のカラー パレットを使用する」を参照してください。