サーバーレスコンピューティングの制限事項

この記事では、ノートブックとジョブのサーバーレスコンピューティングの現在の制限事項について説明します。最も重要な考慮事項の概要から始まり、制限事項の包括的なリファレンスリストを提供します。

言語と API のサポート

R はサポートされていません。
Spark Connect API のみがサポートされています。 Spark RDD API はサポートされていません。
Spark Connect は、サーバーレスコンピューティングで使用され、分析と名前解決を実行時間に延期します。これは、コードの動作を変更する可能性があります。 Spark Connect と Spark クラシックの比較を参照してください。
SQL を記述するときの既定値は ANSI SQL です。 spark.sql.ansi.enabled を false に設定して、ANSI モードをオプトアウトします。
spark.createDataFrameを使用してローカルデータから DataFrame を作成する場合、行サイズは 128 MB を超えることはできません。

データアクセスとストレージ

Unity カタログを使用して外部データソースに接続する必要があります。外部の場所を使用して、クラウドストレージにアクセスします。
DBFS へのアクセスは制限されています。代わりに、Unity カタログボリュームまたはワークスペースファイルを使用してください。
Maven 座標はサポートされていません。
グローバル一時ビューはサポートされていません。セッション間データの受け渡しが必要な場合、Databricks ではセッション一時ビューを使用するか、テーブルを作成することをお勧めします。

ユーザー定義関数 (UDF)

ユーザー定義関数 (UDF) はインターネットにアクセスできません。このため、CREATE FUNCTION (External) コマンドはサポートされていません。 Databricks では、CREATE FUNCTION (SQL および Python) を使用して UDF を作成することをお勧めします。
UDF、 map、 mapPartitionsなどのユーザー定義のカスタムコードは、メモリ使用量が 1 GB を超えることはできません。
Scala UDF は、上位の関数内では使用できません。

UI とログ記録

Spark UI は使用できません。代わりに、クエリプロファイルを使用して、Spark クエリに関する情報を表示します。「クエリプロファイル」を参照してください。
Spark ログは使用できません。ユーザーは、クライアント側のアプリケーションログにのみアクセスできます。

ネットワークとワークスペースへのアクセス

ワークスペース間アクセスは、ワークスペースが同じリージョンにあり、宛先ワークスペースに IP ACL またはフロントエンド PrivateLink が構成されていない場合にのみ許可されます。
Databricks Container Services はサポートされていません。

ストリーミングの制限事項

既定または時間ベースのトリガー間隔はサポートされません。サポートされるのは Trigger.AvailableNow のみです。「構造化ストリーミングのトリガー間隔を構成する」を参照してください。
標準アクセスモードでのストリーミングに関するすべての制限も適用されます。「ストリーミングの制限事項」を参照してください。

Notebooks の制限事項

Scala と R はノートブックではサポートされていません。
JAR ライブラリはノートブックではサポートされていません。対処方法については、「サーバーレスコンピューティングのベストプラクティス」を参照してください。ジョブ内の JAR タスクがサポートされています。「ジョブの JAR タスク」を参照してください。
Notebook スコープのライブラリは、開発セッション間ではキャッシュされません。
ユーザー間でノートブックを共有するときの TEMP テーブルとビューの共有はサポートされていません。
Notebooks 内の DataFrame のオートコンプリートと変数エクスプローラーはサポートされていません。
既定では、新しいノートブックは .ipynb 形式で保存されます。ノートブックがソース形式で保存されている場合、サーバーレスメタデータが正しくキャプチャされず、一部の機能が期待どおりに機能しない可能性があります。
ノートブックタグはサポートされていません。サーバーレス予算ポリシーを使用して、サーバーレスの使用状況にタグを付けます。

ジョブの制限事項

タスクログは、タスクの実行ごとに分離されません。ログには、複数のタスクからの出力が含まれます。
タスクライブラリは、ノートブックタスクではサポートされていません。代わりにノートブックスコープのライブラリを使用してください。「ノートブックスコープの Python ライブラリ」を参照してください。
既定では、サーバーレスジョブにはクエリ実行タイムアウトはありません。 spark.databricks.execution.timeout プロパティを使用して、ジョブクエリの実行タイムアウトを設定できます。詳細については、「サーバーレスノートブックとジョブの Spark プロパティを構成する」を参照してください。

コンピューティング固有の制限事項

次のコンピューティング固有の機能はサポートされていません。

コンピューティングポリシー
コンピューティングスコープの init スクリプト
カスタムデータソースや Spark 拡張機能を含む、コンピューティングスコープのライブラリ。代わりにノートブックスコープのライブラリを使用してください。
インスタンスプール
コンピューティングイベントログ
ほとんどの Apache Spark コンピューティング構成。サポートされている構成の一覧については、「サーバーレスノートブックとジョブの Spark プロパティの構成」を参照してください。
環境変数。代わりに、Databricks では、ウィジェットを使用してジョブとタスクのパラメーターを作成することをお勧めします。

キャッシュの制限事項

メタデータは、サーバーレスコンピューティングセッションにキャッシュされます。このため、カタログを切り替えるときにセッションコンテキストが完全にリセットされないことがあります。セッションコンテキストをクリアするには、サーバーレスコンピューティングリソースをリセットするか、新しいセッションを開始します。
データフレーム API と SQL キャッシュ API は、サーバーレスコンピューティングではサポートされていません。これらの API または SQL コマンドのいずれかを使用すると、例外が発生します。

Hive の制限事項

Hive SerDe テーブルはサポートされていません。また、Hive SerDe テーブルにデータを読み込む対応する LOAD DATA コマンドはサポートされていません。このコマンドを使用すると、例外が発生します。

データソースのサポートは、AVRO、BINARYFILE、CSV、DELTA、JSON、KAFKA、ORC、PARQUET、ORC、TEXT、XML に限定されます。
Hive 変数 (たとえば、${env:var}、${configName}、${system:var}、spark.sql.variable)、または ${var} 構文を使用した config 変数の参照はサポートされていません。 Hive 変数を使用すると、例外が発生します。

代わりに、 DECLARE VARIABLE、 SET VARIABLE、 SQL セッション変数の参照とパラメーターマーカー ('?'、または ':var') を使用して、セッションの状態を宣言、変更、および参照します。 IDENTIFIER 句を使用して、多くの場合、オブジェクト名をパラメーター化することもできます。

サポートされるデータソース

サーバーレスコンピューティングでは、DML 操作 (書き込み、更新、削除) に対して次のデータソースがサポートされます。

CSV
JSON
AVRO
DELTA
KAFKA
PARQUET
ORC
TEXT
UNITY_CATALOG
BINARYFILE
XML
SIMPLESCAN
ICEBERG

サーバーレスコンピューティングでは、読み取り操作用に次のデータソースがサポートされています。

CSV
JSON
AVRO
DELTA
KAFKA
PARQUET
ORC
TEXT
UNITY_CATALOG
BINARYFILE
XML
SIMPLESCAN
ICEBERG
MYSQL
POSTGRESQL
SQLSERVER
REDSHIFT
SNOWFLAKE
SQLDW (Azure Synapse)
DATABRICKS
BIGQUERY
ORACLE
SALESFORCE
SALESFORCE_DATA_CLOUD
TERADATA
WORKDAY_RAAS
MONGODB

フィードバック

このページはお役に立ちましたか?

Last updated on 2025-12-12