Share via


ノートブックの出力と結果

ノートブックをクラスターにアタッチして 1 つ以上のセルを実行すると、そのノートブックが状態を持つようになり、出力が表示されます。 このセクションでは、ノートブックの状態と出力を管理する方法について説明します。

ノートブックの状態と出力を消去する

ノートブックの状態と出力をクリアするには、[実行] メニューの下部にある [クリア] オプションのいずれかを選択します。

メニュー オプション 説明
すべてのセル出力をクリアする セルの出力をクリアします。 これは、ノートブックを共有していて、結果を含めたくない場合に役に立ちます。
状態をクリアする 関数と変数の定義、データ、インポートされたライブラリなど、ノートブックの状態をクリアします。
状態と結果をクリアする セル出力とノートブックの状態の両方をクリアします。
状態をクリアしてすべて実行する ノートブックの状態をクリアし、新しい実行を開始します。

結果を表示する

セルが実行されると、テーブル結果として、最大 10,000 行または 2 MB のいずれか少ない方が返されます。

既定では、テキストの結果は最大 50,000 文字を返します。 Databricks Runtime 12.2 LTS 以降では、Spark 構成プロパティ spark.databricks.driver.maxReplOutputLength を設定することで、この制限を増やすことができます。

Python を使用して Python ノートブックで SQL セルの結果をネイティブに調べる

SQL を使用してデータを読み込み、Python を使用して調べることができます。 Databricks Python ノートブックでは、SQL 言語セルのテーブルの結果が Python DataFrame として自動的に使用できるようになります。 詳細については、Python ノートブックにおける SQL セルの結果の調査に関する記事を参照してください。

新しいセル結果テーブル

重要

この機能はパブリック プレビュー段階にあります。

新しいセル結果テーブルのレンダリングを選択できるようになりました。 新しい結果テーブルでは、次のことができます。

  • 表形式の結果の列または他のサブセットを、クリップボードにコピーします。
  • 結果テーブルでテキスト検索を実行します。
  • データの並べ替えとフィルター処理を行います
  • キーボードの方向キーを使って、テーブルのセル間を移動します。
  • ダブルクリックしてから目的のテキストまでドラッグして選択し、列名またはセル値の一部を選択します。

新しい結果テーブルを有効にするには、セルの結果の右上隅にある [New result table] (新しい結果テーブル) をクリックし、トグル セレクターを [オフ] から [オン] に変更します。

新しい結果表示セレクター

機能がオンになっている場合、列または行のヘッダーをクリックすると列または行の全体を選択でき、テーブルの左上のセルをクリックするとテーブル全体を選択できます。 四角形のセル セットの対角線になるようにカーソルをドラッグして、それらを選択できます。

選んだデータをクリップボードにコピーするには、Cmd + c キー (MacOS) または Ctrl + c キー (Windows) を押すか、右クリックしてドロップダウン メニューから [コピー] を選びます。

結果テーブルでテキストを検索するには、[検索] ボックスにテキストを入力します。 一致するセルが強調表示されます。

選択に関する情報が表示されるサイド パネルを開くには、右上隅の [検索] ボックスの横にあるパネル アイコン パネル アイコン をクリックします。

パネル アイコンの場所

列ヘッダーは、列のデータ型を示します。 たとえば、整数型列のインジケーター は整数データ型を示します。 インジケーターをマウスでポイントすると、データ型が表示されます。

結果の並べ替えとフィルター処理を行う

新しいセル結果テーブルのレンダリングを使用すると、結果の並べ替えとフィルター処理を行うことができます。

列内の値でテーブルを並べ替えるには、列名の上にカーソルを置きます。 列名を含むセルの右側にアイコンが表示されます。 矢印をクリックして列を並べ替えます。 連続してクリックすると、昇順、降順、または並べ替えなしで並べ替えが切り替わります。

列を並べ替える方法

複数の列で並べ替えるには、Shift キーを押しながら、列の並べ替え矢印をクリックします。

フィルターを作成するには、セル結果の右上にある フィルター アイコン をクリックします。 表示されるダイアログで、フィルターを適用する列と、適用するフィルター規則と値を選択します。 次に例を示します。

フィルターの例

フィルターをもう 1 つ追加するには、[フィルターの追加] ボタン をクリックします。

フィルターを一時的に有効または無効にするには、ダイアログの [有効/無効] ボタンを切り替えます。 フィルターを削除するには、フィルター名の横にある X フィルターを削除する X をクリックします。

特定の値でフィルター処理するには、その値を含むセルを右クリックし、ドロップダウン メニューから [この値でフィルター処理する] を選択します。

特定の値

列名のケバブ メニューからフィルターを作成することもできます。

フィルターのケバブ メニュー

フィルターは、結果テーブルに表示される結果にのみ適用されます。 返されるデータが切り捨てられている (たとえば、クエリから 64,000 行を超える行が返される) 場合、フィルターは返された行にのみ適用されます。

結果のダウンロード

既定では、結果のダウンロードが有効化されています。 この設定を切り替えるには、「ノートブックから結果をダウンロードする機能を管理する」を参照してください。

表形式の出力が含まれているセル結果をローカル コンピューターにダウンロードできます。 タブ タイトルの横にある下向き矢印をクリックします。 メニュー オプションは、結果の行数と Databricks ランタイム バージョンによって異なります。 ダウンロードした結果は、ローカル コンピューターに export.csv  と名付けられた CSV ファイルとして保存されます。

セル結果をダウンロードする

セルごとに複数の出力を表示する

Python ノートブックと、Python 以外のノートブックの %python セルでは、セルごとに複数の出力がサポートされます。 たとえば、次のコードの出力には、プロットとテーブルの両方が含まれます。

import pandas as pd
from sklearn.datasets import load_iris

data = load_iris()
iris = pd.DataFrame(data=data.data, columns=data.feature_names)
ax = iris.plot()
print("plot")
display(ax)
print("data")
display(iris)

Databricks Git フォルダーでノートブックの出力をコミットする

.ipynb ノートブック出力のコミットの詳細については、「.ipynb ノートブック出力のコミットを許可する」を参照してください。

  • ノートブックは .ipynb ファイルである必要があります
  • ワークスペース管理者の設定では、ノートブックの出力をコミットできる必要があります。