チュートリアル: ノートブックのデータのクエリと視覚化

このチュートリアルでは、Azure Databricks ノートブックを使用して、SQL、Python、Scala、R を使用して Unity カタログに格納されているサンプルデータに対してクエリを実行し、ノートブックでクエリ結果を視覚化する方法について説明します。

ヒント

Genie Code (エージェントモード) にこれを行うように指示します。

Create a new notebook that queries @samples.nyctaxi.trips and displays a bar chart showing the average fare amount by trip distance, grouped by the pickup zip code.

要件

この記事のタスクを完了するには、次の要件を満たす必要があります。

ワークスペースで Unity Catalog が有効になっている必要があります。 Unity カタログの概要については、「Unity カタログの概要」を参照してください。
既存のコンピューティングリソースを使用するか、新しいコンピューティングリソースを作成するためのアクセス許可が必要です。「コンピューティング」を参照するか、Databricks 管理者に問い合わせてください。

手順 1: 新しいノートブックを作成する

ワークスペースにノートブックを作成するには、サイドバーの [新規] をクリックしてから、[ノートブック] をクリックします。ワークスペースに空のノートブックが開きます。

ノートブックの作成と管理の詳細については、「 Databricks ノートブックの管理」を参照してください。

手順 2: テーブルを照会する

任意の言語を使用して、Unity Catalog の samples.nyctaxi.trips テーブルに対してクエリを実行します。このテーブルは、カタログに含まれるsamplesの 1 つです。

次のコードをコピーして、新しい空のノートブックセルに貼り付けます。このコードは、Unity Catalog の samples.nyctaxi.trips テーブルに対してクエリを実行した結果を表示します。

SQL
```
SELECT * FROM samples.nyctaxi.trips
```
Python
```
display(spark.read.table("samples.nyctaxi.trips"))
```
スカラ (プログラミング言語)
```
display(spark.read.table("samples.nyctaxi.trips"))
```
R
```
library(SparkR)
display(sql("SELECT * FROM samples.nyctaxi.trips"))
```
Shift+Enter キーを押してセルを実行してから、次のセルに移動します。

クエリの結果がノートブックに表示されます。

手順 3: データを表示する

乗車距離別の平均運賃金額を、乗車場所郵便番号でグループ化して表示します。

[テーブル] タブの横にある + をクリックして、[視覚化] をクリックします。

視覚化エディターが表示されます。
[視覚化の種類] ドロップダウンで、[バー] が選ばれていることを確認します。
fare_amount の X 列 を選択します。
trip_distance の Y 列 を選択します。
集計の種類として Average を選択します。
pickup_zip を グループ化の列として選択します。
[保存] をクリックします。

次のステップ

CSV ファイルから Unity カタログにデータを追加し、データを視覚化する方法については、「チュートリアル: ノートブックから CSV データをインポートして視覚化する」を参照してください。
Apache Spark を使用して Databricks にデータを読み込む方法については、「チュートリアル: Apache Spark DataFrames を使用してデータを読み込んで変換する」を参照してください。
Databricks へのデータの取り込みの詳細については、 Lakeflow Connect の Standard コネクタを参照してください。
Databricks を使用したデータへのクエリの実行の詳細については、データのクエリに関する記事を参照してください。
視覚化の詳細については、 Databricks ノートブックと SQL エディターの視覚化に関するページを参照してください。
探索的データ分析 (EDA) 手法の詳細については、「チュートリアル: Databricks ノートブックを使用した EDA 手法」を参照してください。

フィードバック

このページはお役に立ちましたか?

Last updated on 2026-06-24