Databricks Runtime のメンテナンス更新プログラム (アーカイブ済み)

このアーカイブ済みのページには、サポートが終了している Databricks Runtime リリースに対して発行されたメンテナンス更新プログラムが掲載されています。既存のクラスターにメンテナンス更新プログラムを追加するには、クラスターを再起動します。

Important

このドキュメントは廃止され、更新されない可能性があります。このコンテンツで言及されている製品、サービス、テクノロジのサポートは終了しました。「Databricks Runtime リリースノートのバージョンと互換性」を参照してください。

Databricks Runtime リリース

リリース別のメンテナンス更新プログラム:

Databricks Runtime 17.2
Databricks Runtime 17.1
Databricks Runtime 17.0
Databricks Runtime 16.3
Databricks Runtime 16.2
Databricks Runtime 16.1
Databricks Runtime 16.0
Databricks Runtime 15.3
Databricks Runtime 15.2
Databricks Runtime 15.1
Databricks Runtime 15.0
Databricks Runtime 14.2
Databricks Runtime 14.1
Databricks Runtime 14.0
Databricks Runtime 13.1
Databricks Runtime 12.2 LTS
Databricks Runtime 11.3 LTS
Databricks Runtime 10.4 LTS
Databricks Runtime 13.0
Databricks Runtime 12.1
Databricks Runtime 12.0
Databricks Runtime 11.2
Databricks Runtime 11.1
Databricks Runtime 11.0
Databricks Runtime 10.5

サポートされている Databricks Runtime バージョンのメンテナンス更新プログラムについては、「Databricks Runtime メンテナンス更新プログラム」を参照してください。

Databricks Runtime 17.2

Databricks Runtime 17.2 (EoS) を参照してください。

2026 年 3 月 10 日
- [SPARK-55701]ES-1694761[SS] CompactibleFileStreamLog.allFiles 内の競合状態を修正する
- [SPARK-55493] [SS] StateDataSource のストリーミングチェックポイント状態ディレクトリに mkdirs を使用しない
- オペレーティングシステムのセキュリティを更新。

2026 年 2 月 26 日
- オペレーティングシステムのセキュリティを更新。
2026 年 2 月 19 日
- Excel ファイルのスキーマを推論すると、文字列セルが Spark StringType として推論されるようになりました。これにより、Excelで設定されたセルの種類が考慮されます。以前は、数値を含む文字列は、 Long や Decimalなどのより狭い型に自動キャストされていました。
- [SPARK-55243][CONNECT] Scala Connect クライアントの -bin サフィックスを使用してバイナリヘッダーを設定できるようにする
- [SCALA][SPARK-54887]](https://issues.apache.org/jira/browse/SPARK-54887)[CONNECT] Spark Connect クライアントで SQL 状態を常に設定する
- [SPARK-54887][CONNECT] 省略可能な sqlstate を sparkthrowables に追加する
- [SPARK-55282][PYTHON][CONNECT] ドライバー側でworker_utilを使用しないようにする
- オペレーティングシステムのセキュリティを更新。

2026 年 1 月 27 日
- [SPARK-55015][SS][SQL] PrefixKeyScanStateEncoder で decodeRemainingKey numFields 計算を修正する
- [SPARK-54768][SS]Python返されたデータが構成済みのスキーマと一致しない場合、ストリームデータソースはエラーを分類する必要があります
- オペレーティングシステムのセキュリティを更新。

2026 年 1 月 9 日
- [SPARK-54711][PYTHON] デーモン作成ワーカー接続のタイムアウトを追加する
- オペレーティングシステムのセキュリティを更新。

2025 年 12 月 9 日
- パーティション分割された Delta テーブルでは、今後、データ Parquet ファイルにパーティション列が格納されます。これにより、Iceberg テーブルと UniForm テーブルの処理方法との相乗効果が向上し、外部のデルタ以外のリーダーとの互換性が向上します。
- [SPARK-54427][SQL] ColumnarRow がバリアント型の copy を呼び出すことを許可する
- [SPARK-54180][SQL] BinaryFileFormat の toString をオーバーライドする
- [SPARK-50906][SQL] 並べ替え済みの構造体フィールドの Avro null 許容チェックを修正
- オペレーティングシステムのセキュリティを更新。

2025 年 11 月 18 日
- [SPARK-54078][SS] StateStoreSuite SPARK-40492: maintenance before unload のための新しいテストと古いテストからインフラストラクチャを削除する
- [SPARK-54047][PYTHON] kill-on-idle-timeout 時に差分エラーを使用する
- [SPARK-54099][SQL] XML バリアントパーサーは、10 進数の解析エラーで文字列にフォールバックする必要がある
- [SPARK-54015][PYTHON] Py4J の要件が緩くなる py4j>=0.10.9.7,<0.10.9.10
- [SPARK-52515]Apache DataSketches を使用したApprox_top_k
- オペレーティングシステムのセキュリティを更新。

2025 年 11 月 4 日
- [SPARK-53973][Avro] AvroOptionsのブール型キャスト失敗におけるエラーを分類する
- [SPARK-53972][SS] クラシック pyspark でのストリーミングクエリの recentProgress 回帰を修正する
- [SPARK-53908][CONNECT] プランキャッシュを使用した Spark Connect での監視を修正する
- オペレーティングシステムのセキュリティを更新。

2025 年 10 月 21 日
- オペレーティングシステムのセキュリティを更新。

2025 年 10 月 8 日
- [SPARK-53555] 修正: SparkML-connect で SparkML (レガシモード) 保存済みモデルを読み込めない
- [SPARK-53598][SQL] 大きなテーブルプロパティを読み取る前に numParts の存在を確認する
- [SPARK-53625][SS] プロジェクションを通じてメタデータ列を伝達し、ApplyCharTypePadding 非互換性に対処する
- [SPARK-53568][CONNECT][PYTHON] Spark Connect Python クライアントエラー処理ロジックのいくつかの小さなバグを修正
- [SPARK-53574] 入れ子になったプランの解決中に AnalysisContext がワイプされる問題を修正しました
- [SPARK-53623][SQL] 大きなテーブルのプロパティの読み取りが向上しています...
- [SPARK-53729][PYTHON][CONNECT] のシリアル化を修正 pyspark.sql.connect.window.WindowSpec
- [SPARK-53549][SS] リスト状態要求プロセスが完了したら、常に矢印アロケーターを閉じます
- オペレーティングシステムのセキュリティを更新。

2025 年 9 月 10 日
- 自動ローダーが無期限にハングする可能性がある問題を修正しました。
- [SPARK-53362] [ML] [CONNECT] IDFModel ローカルローダーのバグを修正する
- [SPARK-53382][SQL] 再帰の形式が正しくない rCTE バグを修正
- [SPARK-53345] のバックポートの不安定なテスト修正
- [SPARK-49872][CORE] jackson JSON 文字列の長さの制限を削除する
- [SPARK-53423] [SQL] すべてのシングルパスリゾルバー関連タグを ResolverTag に移動する
- [SPARK-53431][PYTHON] DataFrame API の名前付きテーブル引数を使用Python UDTF を修正
- [SPARK-53336] [ML] [CONNECT] MLCache.totalMLCacheSizeBytesが呼び出されたときにMLCache.clear()をリセットする
- [SPARK-53394][CORE] UninterruptibleLock.isInterruptible は重複した割り込みを回避する必要がある
- [SPARK-53470][SQL] ExtractValue 式は常に型チェックを実行する必要がある
- [SPARK-53389] ANSI 下の Spark での Pandas API の改善のチェリーピック
- オペレーティングシステムのセキュリティを更新。

Databricks Runtime 17.1

Databricks Runtime 17.1 (EoS) を参照してください。

2026 年 1 月 27 日
- [SPARK-55015][SS][SQL] PrefixKeyScanStateEncoder で decodeRemainingKey numFields 計算を修正する
- [SPARK-54768][SS]Python返されたデータが構成済みのスキーマと一致しない場合、ストリームデータソースはエラーを分類する必要があります
- オペレーティングシステムのセキュリティを更新。

2026 年 1 月 9 日
- [SPARK-54711][PYTHON] デーモン作成ワーカー接続のタイムアウトを追加する
- オペレーティングシステムのセキュリティを更新。

2025 年 12 月 9 日
- パーティション分割された Delta テーブルでは、今後、データ Parquet ファイルにパーティション列が格納されます。これにより、Iceberg テーブルと UniForm テーブルの処理方法との相乗効果が向上し、外部のデルタ以外のリーダーとの互換性が向上します。
- [SPARK-54180][SQL] BinaryFileFormat の toString をオーバーライドする
- [SPARK-50906][SQL] 並べ替え済みの構造体フィールドの Avro null 許容チェックを修正
- [SPARK-54427][SQL] ColumnarRow がバリアント型の copy を呼び出すことを許可する
- オペレーティングシステムのセキュリティを更新。

2025 年 11 月 18 日
- [SPARK-54015][PYTHON] Py4J の要件が緩くなる py4j>=0.10.9.7,<0.10.9.10
- [SPARK-52515]Apache DataSketches を使用したApprox_top_k
- [SPARK-54047][PYTHON] kill-on-idle-timeout 時に差分エラーを使用する
- [SPARK-54078][SS] StateStoreSuite SPARK-40492: maintenance before unload のための新しいテストと古いテストからインフラストラクチャを削除する
- [SPARK-54099][SQL] XML バリアントパーサーは、10 進数の解析エラーで文字列にフォールバックする必要がある
- オペレーティングシステムのセキュリティを更新。

2025 年 11 月 4 日
- [SPARK-53972][SS] クラシック pyspark でのストリーミングクエリの recentProgress 回帰を修正する
- [SPARK-53908][CONNECT] プランキャッシュを使用した Spark Connect での監視を修正する
- [SPARK-53973][Avro] AvroOptionsのブール型キャスト失敗におけるエラーを分類する
- オペレーティングシステムのセキュリティを更新。

2025 年 10 月 21 日
- オペレーティングシステムのセキュリティを更新。

2025 年 10 月 7 日
- [SPARK-53574] 入れ子になったプランの解決中に AnalysisContext がワイプされる問題を修正しました
- [SPARK-53549][SS] リスト状態要求プロセスが完了したら、常に矢印アロケーターを閉じます
- [SPARK-53568][CONNECT][PYTHON] Spark Connect Python クライアントエラー処理ロジックのいくつかの小さなバグを修正
- [SPARK-53625][SS] プロジェクションを通じてメタデータ列を伝達し、ApplyCharTypePadding 非互換性に対処する
- [SPARK-53598][SQL] 大きなテーブルプロパティを読み取る前に numParts の存在を確認する
- [SPARK-53623][SQL] 大きなテーブルのプロパティの読み取りが向上しています...
- [SPARK-53555] 修正: SparkML-connect で SparkML (レガシモード) 保存済みモデルを読み込めない
- [SPARK-53729][PYTHON][CONNECT] のシリアル化を修正 pyspark.sql.connect.window.WindowSpec
- オペレーティングシステムのセキュリティを更新。

2025 年 9 月 16 日
- オペレーティングシステムのセキュリティを更新。

2025 年 9 月 9 日
- 自動ローダーが無期限にハングする可能性がある問題を修正しました。
- [SPARK-53362] [ML] [CONNECT] IDFModel ローカルローダーのバグを修正する
- [SPARK-53394][CORE] UninterruptibleLock.isInterruptible は重複した割り込みを回避する必要がある
- [SPARK-53382][SQL] 再帰の形式が正しくない rCTE バグを修正
- [SPARK-53431][PYTHON] DataFrame API の名前付きテーブル引数を使用Python UDTF を修正
- [SPARK-53336] [ML] [CONNECT] MLCache.totalMLCacheSizeBytesが呼び出されたときにMLCache.clear()をリセットする
- [SPARK-49872][CORE] jackson JSON 文字列の長さの制限を削除する
- オペレーティングシステムのセキュリティを更新。

2025 年 8 月 25 日
- Java ライブラリの更新:
  - io.delta.delta-sharing-client_2.13 を 1.3.3 から 1.3.5 にアップグレード
- [SPARK-52482][SQL][CORE] 特定の破損した zstd ファイルを読み取るための例外処理を改善する
- [SPARK-53192][CONNECT] Spark Connect プランキャッシュにデータソースを常にキャッシュする
- オペレーティングシステムのセキュリティを更新。

2025 年 8 月 14 日
- [SPARK-52833][SQL] 修正 VariantBuilder.appendFloat
- [SPARK-52961][PYTHON] 横結合の 0-arg eval で Arrow 最適化 Python UDTF を修正
- [SPARK-51505][SQL] AQEShuffleReadExec で常に空のパーティション番号メトリックを表示する
- [SPARK-52753][SQL] parseDataType バイナリと以前のバージョンとの互換性を確保する
- [SPARK-52842][SQL] シングルパスアナライザーの新機能とバグ修正
- [SPARK-52960][SQL] LogicalQueryStage toString にサブツリー文字列を表示する
- [SPARK-53054][CONNECT] 接続を修正します。DataFrameReader の既定の形式の動作
- オペレーティングシステムのセキュリティを更新。

Databricks Runtime 17.0

Databricks Runtime 17.0 (EoS) を参照してください。

2025 年 12 月 9 日
- パーティション分割された Delta テーブルでは、今後、データ Parquet ファイルにパーティション列が格納されます。これにより、Iceberg テーブルと UniForm テーブルの処理方法との相乗効果が向上し、外部のデルタ以外のリーダーとの互換性が向上します。
- Snowflake コネクタと Snowflake Lakehouse フェデレーションの両方で、TIMESTAMP_NTZ (タイムゾーンなしのタイムスタンプ) リテラルは Snowflake に転送されなくなりました。この変更により、互換性のないタイムスタンプ処理によって発生するクエリエラーが回避され、影響を受けるクエリの信頼性が向上します。
- [SPARK-54427][SQL] ColumnarRow がバリアント型の copy を呼び出すことを許可する
- [SPARK-54180][SQL] BinaryFileFormat の toString をオーバーライドする
- オペレーティングシステムのセキュリティを更新。

2025 年 11 月 18 日
- [SPARK-54099][SQL] XML バリアントパーサーは、10 進数の解析エラーで文字列にフォールバックする必要がある
- [SPARK-54015][PYTHON] Py4J の要件が緩くなる py4j>=0.10.9.7,<0.10.9.10
- [SPARK-54078][SS] StateStoreSuite SPARK-40492: maintenance before unload のための新しいテストと古いテストからインフラストラクチャを削除する
- [SPARK-54047][PYTHON] kill-on-idle-timeout 時に差分エラーを使用する
- オペレーティングシステムのセキュリティを更新。

2025 年 11 月 4 日
- [SPARK-53908][CONNECT] プランキャッシュを使用した Spark Connect での監視を修正する
- [SPARK-53972][SS] クラシック pyspark でのストリーミングクエリの recentProgress 回帰を修正する
- オペレーティングシステムのセキュリティを更新。

2025 年 10 月 21 日
- オペレーティングシステムのセキュリティを更新。

2025 年 10 月 7 日
- [SPARK-53598][SQL] 大きなテーブルプロパティを読み取る前に numParts の存在を確認する
- [SPARK-53568][CONNECT][PYTHON] Spark Connect Python クライアントエラー処理ロジックのいくつかの小さなバグを修正
- [SPARK-53574] 入れ子になったプランの解決中に AnalysisContext がワイプされる問題を修正しました
- [SPARK-53549][SS] リスト状態要求プロセスが完了したら、常に矢印アロケーターを閉じます
- [SPARK-53623][SQL] 大きなテーブルのプロパティの読み取りが向上しています...
- [SPARK-53729][PYTHON][CONNECT] のシリアル化を修正 pyspark.sql.connect.window.WindowSpec
- オペレーティングシステムのセキュリティを更新。

2025 年 9 月 16 日
- オペレーティングシステムのセキュリティを更新。

2025 年 9 月 9 日
- 自動ローダーが無期限にハングする可能性がある問題を修正しました。
- [SPARK-53394][CORE] UninterruptibleLock.isInterruptible は重複した割り込みを回避する必要がある
- [SPARK-53336] [ML] [CONNECT] MLCache.totalMLCacheSizeBytesが呼び出されたときにMLCache.clear()をリセットする
- [SPARK-49872][CORE] jackson JSON 文字列の長さの制限を削除する
- [SPARK-53431][PYTHON] DataFrame API の名前付きテーブル引数を使用Python UDTF を修正
- [SPARK-53382][SQL] 再帰の形式が正しくない rCTE バグを修正
- オペレーティングシステムのセキュリティを更新。

2025 年 8 月 26 日
- Java ライブラリの更新:
  - io.delta.delta-sharing-client_2.13 を 1.3.3 から 1.3.5 にアップグレード
- [SPARK-52482][SQL][CORE] 特定の破損した zstd ファイルを読み取るための例外処理を改善する
- [SPARK-53192][CONNECT] Spark Connect プランキャッシュにデータソースを常にキャッシュする
- オペレーティングシステムのセキュリティを更新。

2025 年 8 月 14 日
- [SPARK-51505][SQL] AQEShuffleReadExec で常に空のパーティション番号メトリックを表示する
- [SPARK-53054][CONNECT] 接続を修正します。DataFrameReader の既定の形式の動作
- [SPARK-52961][PYTHON] 横結合の 0-arg eval で Arrow 最適化 Python UDTF を修正
- [SPARK-52833][SQL] 修正 VariantBuilder.appendFloat
- オペレーティングシステムのセキュリティを更新。

2025 年 7 月 29 日
- [SPARK-51889][PYTHON][SS] Python TWS の MapState clear() のバグを修正しました
- [SPARK-52753][SQL] parseDataType バイナリと以前のバージョンとの互換性を確保する
- [SPARK-49428][SQL] Connect Scala クライアントをコネクタから SQL に移動する
- オペレーティングシステムのセキュリティを更新。

2025 年 7 月 15 日
- Spark Structured Streaming を使用して Pulsar からデータをストリーミングするときの非決定的なデータ損失の問題を修正しました。
- [SPARK-52430][SQL] rCTEs での Union の null 許容のバグを解決する
- [SPARK-52503][SQL][CONNECT] 入力列が存在しない場合の drop を修正
- [SPARK-52579][PYTHON] Python ワーカーの定期的なトレースバックダンプを設定する
- [SPARK-52450] スキーマディープコピーのパフォーマンスを向上させる
- [SPARK-52599][PYTHON] ドライバーサイドワーカーでの定期的なトレースバックダンプのサポート
- [SPARK-52553][SS] v1 変更ログを読み取るときに NumberFormatException を修正する
- オペレーティングシステムのセキュリティを更新。

2025 年 5 月 28 日
- Python ライブラリの更新:
  - google-auth 2.40.0 から 2.40.1 への変更
  - 2.22.0 から 3.0.0 までの mlflow-skinny
  - opentelemetry-api を 1.32.1 から 1.33.0 にアップグレード
  - opentelemetry-sdk (1.32.1 から 1.33.0)
  - opentelemetry-semantic-conventionsのバージョンが0.53b1から0.54b0に更新されました
- Java ライブラリの更新:
  - io.delta.delta-sharing-client_2.13 のバージョンを 1.3.0 から 1.3.3 に更新
- ファイルデータソースリーダー (json、csv、xml、およびテキスト) の ZStandard 解凍対応
- cloud_files_state TVF 関数を使用してパイプライン間のストリーミングテーブルのファイルレベルの状態を読み取ることができないという制限を修正しました
- 一時ビューのクエリに関する Unity カタログ承認の問題を修正しました。
- 17.0.1 でフラグを切り替え、17.0.0 のすべてのワークスペースにSAFEフラグを展開しました。
- 署名済み URL を使用するクエリに Spark Parquet I/O キャッシュを使用するためのデルタシェアリングのサポート (バージョン 17.0.1 以降で利用可能)。
- ファイルデータソースリーダー (json、csv、xml、およびテキスト) の ZStandard 解凍対応
- Teradata コネクタは、既定で TMODE=ANSI をドライバーに渡すようになりました。これは、Lakehouse フェデレーションを通じて行われるすべての文字列比較が大文字と小文字の区別を伴うことを意味します。
- [SPARK-51921][SS][PYTHON] transformWithState で TTL 期間に長い型をミリ秒単位で使用する
- [SPARK-52259][ML][CONNECT] Param クラスのバイナリ互換性を修正する
- [SPARK-52195][PYTHON][SS] Python TWS の初期状態の列の削除に関する問題を修正
- [SPARK-52057] [ML] [CONNECT] クライアントへのツリーサイズ制限の警告メッセージの収集
- [SPARK-52051] [ML] [CONNECT] メモリ制御が有効になっているときにモデルの概要を有効にする
- [SPARK-51606][CONNECT] Spark Connect サーバーを停止するときにSPARK_IDENT_STRINGを追加する
- [15.4-16.4][spark-52521]](https://issues.apache.org/jira/browse/SPARK-52521)[SQL] Right#replacement は SQLConf に動的にアクセスできません
- [SPARK-52232][SQL] 非決定論的クエリを修正して、すべてのステップで異なる結果を生成する
- [SPARK-52013] [CONNECT] [ML] 削除 SparkConnectClient.ml_caches
- [SPARK-52353][SQL] UnionLoop の以前のイテレーションを参照する LogicalRDD の間違った制約のバグを修正しました
- [SPARK-52130] [ML] [CONNECT] エラーメッセージを絞り込み、内部 Spark 構成を非表示にする
- [SPARK-52470][ML][CONNECT] モデルサマリーのオフロードをサポート
- [SPARK-51935][SQL] 解釈された df.collect() 内の反復子の遅延動作を修正する
- [SPARK-52482][SQL][CORE] ZStandard によるファイルデータソースリーダーのサポート
- [SPARK-52159][SQL] jdbc 言語のテーブル存在チェックを適切に処理する
- [SPARK-52010] 内部クラスの API ドキュメントを生成しない
- [SPARK-52049] XML 属性を Variant として解析できないバグを修正しました
- [SPARK-52312][SQL] DataFrame のキャッシュ時に V2WriteCommand を無視する
- [SPARK-52229][ML][CONNECT] モデルサイズの推定を改善する
- [SPARK-50815][PYTHON] バリアントローカルデータを矢印変換に修正
- [SPARK-52040][PYTHON][SQL][CONNECT] ResolveLateralColumnAliasReference はプラン ID を保持する必要があります
- [SPARK-51981][SS] queryStartedEvent に JobTag を追加する
- [FIX REVERT][spark-52100]](https://issues.apache.org/jira/browse/SPARK-52100)[SQL] 構文での再帰レベルの制限のオーバーライドを有効にする
- [SPARK-52101][SQL] RCTEs のインライン強制を無効にする
- [SPARK-52099][SQL] LIMIT 演算子を追加して再帰行の制限をオーバーライドできるようにします
- オペレーティングシステムのセキュリティを更新。

Databricks Runtime 16.3（データブリックスランタイム 16.3）

Databricks Runtime 16.3 (EoS) を参照してください。

2025 年 9 月 16 日
- Snowflake コネクタは、INFORMATION_SCHEMA コマンドの代わりにSHOW SCHEMAS テーブルを使用してスキーマを一覧表示するようになりました。この変更により、前のアプローチの 10,000 スキーマの制限が削除され、多数のスキーマを持つデータベースのサポートが向上します。
- オペレーティングシステムのセキュリティを更新。

2025 年 9 月 9 日
- 自動ローダーが無期限にハングする可能性がある問題を修正しました。
- 自動ローダーでジョブが失敗する可能性がある一時的なエラーを修正しました。
- [SPARK-51821][CORE] デッドロックの可能性を回避するために、無停電ロックを保持せずに interrupt() を呼び出す
- [SPARK-49872][CORE] jackson JSON 文字列の長さの制限を削除する
- オペレーティングシステムのセキュリティを更新。

2025 年 8 月 26 日
- [SPARK-52482][SQL][CORE] 特定の破損した zstd ファイルを読み取るための例外処理を改善する
- [SPARK-53192][CONNECT] Spark Connect プランキャッシュにデータソースを常にキャッシュする
- オペレーティングシステムのセキュリティを更新。

2025 年 8 月 14 日
- [SPARK-51011][CORE] 強制終了時にタスクが中断されるかどうかを示すログを追加する
- オペレーティングシステムのセキュリティを更新。

2025 年 7 月 29 日
- オペレーティングシステムのセキュリティを更新。

2025 年 7 月 15 日
- Spark Structured Streaming を使用して Pulsar からデータをストリーミングするときの非決定的なデータ損失の問題を修正しました。
- [SPARK-52553][SS] v1 変更ログを読み取るときに NumberFormatException を修正する
- オペレーティングシステムのセキュリティを更新。

2025 年 7 月 1 日
- ファイルデータソースリーダー (json、csv、xml、およびテキスト) の ZStandard 解凍対応
- [SPARK-52482][SQL][CORE] ZStandard によるファイルデータソースリーダーのサポート
- [SPARK-52312][SQL] DataFrame のキャッシュ時に V2WriteCommand を無視する
- [15.4-16.4][spark-52521]](https://issues.apache.org/jira/browse/SPARK-52521)[SQL] Right#replacement は SQLConf に動的にアクセスできません
- オペレーティングシステムのセキュリティを更新。

2025 年 6 月 17 日
- cloud_files_stateテーブル値関数 (TVF) を使用して、パイプライン間でストリーミングテーブルのファイルレベルの状態を読み取ることができないという制限を修正しました。
- [SPARK-52040][PYTHON][SQL][CONNECT] ResolveLateralColumnAliasReference はプラン ID を保持する必要があります
- オペレーティングシステムのセキュリティを更新。

2025 年 6 月 3 日
- Python ライブラリの更新:
  - 41.0.7、41.0.7、42.0.5 から 42.0.5 への暗号化
  - パッケージを 24.0、24.1 から 24.1 へ変更
  - platformdirs を 3.10.0、4.2.2 から 3.10.0 へ変更
  - pyparsing バージョン 3.0.9、3.1.1 から 3.0.9 に変更
  - autocommand 2.2.2 を追加しました
  - backports.tarfile 1.2.0 を追加しました
  - importlib_resources 6.4.0 を追加しました
  - Inflect 7.3.1 を追加しました
  - jaraco.context 5.3.0 を追加しました
  - jaraco.functools 4.0.1 を追加しました
  - jaraco.text 3.12.1 を追加しました
  - more-itertools 10.3.0 を追加しました
  - pip 24.2 を追加しました
  - setuptools 74.0.0 を追加しました
  - tomli 2.0.1 を追加しました
  - typeguard 4.3.0 を追加しました
  - wcwidth 0.2.5 を追加しました
  - ホイール 0.43.0 を追加しました
  - ディストリビューション 1.9.0 を削除しました
  - distro-info 1.7+build1 を削除しました
  - python-apt 2.7.7+ubuntu4 を削除しました
- [SPARK-52195][PYTHON][SS] Python TWS の初期状態の列の削除に関する問題を修正
- [SPARK-52159][SQL] jdbc 言語のテーブル存在チェックを適切に処理する
- オペレーティングシステムのセキュリティを更新。

2025 年 5 月 20 日
- Java ライブラリの更新:
  - io.delta.delta-sharing-client_2.12 のバージョンを 1.2.6 から 1.2.7 に更新
  - org.apache.avro.avro 1.11.3 から 1.11.4
  - org.apache.avro.avro-ipc (1.11.3 から 1.11.4 へ)
  - org.apache.avro.avro-mapred 1.11.3 から 1.11.4
- ストリーミング複製セッションは、共有クラスター/サーバーレスの foreachBatch ユーザー関数内で使用されます。これは、クラシック (割り当てられたクラスター) での動作に合わせて調整されます。
- ストリーミング複製セッションは、共有クラスター/サーバーレスの foreachBatch ユーザー関数内で使用されます。これは、クラシック (割り当てられたクラスター) での動作に合わせて調整されます。
- この変更の前は、photon を無効にして、 variant_get 式のパスの先頭の空白とタブが無視されていました。たとえば、 select variant_get(parse_json('{"key": "value"}'), '$['key']') は、 "key"の値を抽出するのに有効ではありません。ただし、ユーザーは、このようなキーを今すぐ抽出できるようになります。
- [SPARK-51921][SS][PYTHON] transformWithState で TTL 期間に長い型をミリ秒単位で使用する
- [SPARK-51935][SQL] 解釈された df.collect() 内の反復子の遅延動作を修正する
- オペレーティングシステムのセキュリティを更新。

2025 年 4 月 22 日
- デルタスキーマ追跡では、他の非加法スキーマ変更例外と一貫性を保つために、スキーマの進化エラーはDELTA_STREAMING_CANNOT_CONTINUE_PROCESSING_POST_SCHEMA_EVOLUTIONではなくDELTA_STREAMING_CANNOT_CONTINUE_PROCESSING_TYPE_WIDENINGで確認されます。
- [SPARK-51589][SQL] | で集計関数のチェックに失敗する小さなバグを修正>SELECT
- [SPARK-51645][SQL] CREATE OR REPLACE TABLE ...DEFAULT COLLATION ... クエリを修正
- "[SPARK-47895][SQL] エイリアスによるグループ化は冪等であるべき" を15.4、16.0、16.1、16.2、および16.3で元に戻す。
- [SPARK-51717][SS][RocksDB] 新しいクエリ用に作成された 2 つ目のスナップショットで発生する可能性がある SST の不一致の破損を修正する

2025 年 3 月 26 日
- [SPARK-51624][SQL] GetStructField メタデータを CreateNamedStruct.dataType に伝達する
- [SPARK-51505][SQL] AQE 結合の空のパーティション数メトリクスをログする
- [SPARK-47895][SQL] エイリアスによるグループ化はべき等である必要がある
- オペレーティングシステムのセキュリティを更新。

Databricks Runtime 16.2

Databricks Runtime 16.2 (EoS) を参照してください。

2025 年 8 月 14 日
- [SPARK-51011][CORE] 強制終了時にタスクが中断されるかどうかを示すログを追加する
- オペレーティングシステムのセキュリティを更新。

2025 年 7 月 29 日
- オペレーティングシステムのセキュリティを更新。

2025 年 7 月 15 日
- Spark Structured Streaming を使用して Pulsar からデータをストリーミングするときの非決定的なデータ損失の問題を修正しました。
- [SPARK-52553][SS] v1 変更ログを読み取るときに NumberFormatException を修正する
- オペレーティングシステムのセキュリティを更新。

2025 年 7 月 1 日
- ファイルデータソースリーダー (json、csv、xml、およびテキスト) の ZStandard 解凍対応
- ファイルデータソースリーダー (json、csv、xml、およびテキスト) の ZStandard 解凍対応
- [15.4-16.4][spark-52521]](https://issues.apache.org/jira/browse/SPARK-52521)[SQL] Right#replacement は SQLConf に動的にアクセスできません
- [SPARK-52312][SQL] DataFrame のキャッシュ時に V2WriteCommand を無視する
- [SPARK-52482][SQL][CORE] ZStandard によるファイルデータソースリーダーのサポート
- オペレーティングシステムのセキュリティを更新。

2025 年 6 月 17 日
- cloud_files_stateテーブル値関数 (TVF) を使用して、パイプライン間でストリーミングテーブルのファイルレベルの状態を読み取ることができないという制限を修正しました。
- [SPARK-52040][PYTHON][SQL][CONNECT] ResolveLateralColumnAliasReference はプラン ID を保持する必要があります
- オペレーティングシステムのセキュリティを更新。

2025 年 6 月 3 日
- Python ライブラリの更新:
  - 41.0.7、41.0.7、42.0.5 から 42.0.5 への暗号化
  - パッケージを 24.0、24.1 から 24.1 へ変更
  - platformdirs を 3.10.0、4.2.2 から 3.10.0 へ変更
  - pyparsing バージョン 3.0.9、3.1.1 から 3.0.9 に変更
  - autocommand 2.2.2 を追加しました
  - backports.tarfile 1.2.0 を追加しました
  - importlib_resources 6.4.0 を追加しました
  - Inflect 7.3.1 を追加しました
  - jaraco.context 5.3.0 を追加しました
  - jaraco.functools 4.0.1 を追加しました
  - jaraco.text 3.12.1 を追加しました
  - more-itertools 10.3.0 を追加しました
  - pip 24.2 を追加しました
  - setuptools 74.0.0 を追加しました
  - tomli 2.0.1 を追加しました
  - typeguard 4.3.0 を追加しました
  - wcwidth 0.2.5 を追加しました
  - ホイール 0.43.0 を追加しました
  - ディストリビューション 1.9.0 を削除しました
  - distro-info 1.7+build1 を削除しました
  - python-apt 2.7.7+ubuntu4 を削除しました
- [SPARK-52159][SQL] jdbc 言語のテーブル存在チェックを適切に処理する
- [SPARK-52195][PYTHON][SS] Python TWS の初期状態の列の削除に関する問題を修正
- オペレーティングシステムのセキュリティを更新。

2025 年 5 月 20 日
- Java ライブラリの更新:
  - io.delta.delta-sharing-client_2.12 のバージョンを 1.2.6 から 1.2.7 に更新
  - org.apache.avro.avro 1.11.3 から 1.11.4
  - org.apache.avro.avro-ipc (1.11.3 から 1.11.4 へ)
  - org.apache.avro.avro-mapred 1.11.3 から 1.11.4
- ストリーミング複製セッションは、共有クラスター/サーバーレスの foreachBatch ユーザー関数内で使用されます。これは、クラシック (割り当てられたクラスター) での動作に合わせて調整されます。
- ストリーミング複製セッションは、共有クラスター/サーバーレスの foreachBatch ユーザー関数内で使用されます。これは、クラシック (割り当てられたクラスター) での動作に合わせて調整されます。
- この変更の前は、photon を無効にして、 variant_get 式のパスの先頭の空白とタブが無視されていました。たとえば、 select variant_get(parse_json('{"key": "value"}'), '$[' key']') は、 "key"の値を抽出するのに有効ではありません。ただし、ユーザーは、このようなキーを今すぐ抽出できるようになります。
- [SPARK-51935][SQL] 解釈された df.collect() 内の反復子の遅延動作を修正する
- [SPARK-51921][SS][PYTHON] transformWithState で TTL 期間に長い型をミリ秒単位で使用する
- オペレーティングシステムのセキュリティを更新。

2025 年 4 月 22 日
- [SPARK-51717][SS][RocksDB] 新しいクエリ用に作成された 2 つ目のスナップショットで発生する可能性がある SST の不一致の破損を修正する
- "[SPARK-47895][SQL] エイリアスによるグループ化は冪等であるべき" を15.4、16.0、16.1、16.2、および16.3で元に戻す。
- オペレーティングシステムのセキュリティを更新。

2025 年 4 月 9 日
- Java ライブラリの更新:
  - io.starburst.openjson.openjson 1.8-e.12 を削除しました
  - io.starburst.openx.data.json-serde 1.3.9-e.12 を削除
  - io.starburst.openx.data.json-serde-generic-shim 1.3.9-e.12 を削除しました。
- [SPARK-47895][SQL] エイリアスによるグループ化はべき等である必要がある
- [SPARK-51505][SQL] AQE 結合の空のパーティション数メトリクスをログする
- [SPARK-51624][SQL] GetStructField メタデータを CreateNamedStruct.dataType に伝達する
- [SPARK-51589][SQL] | で集計関数のチェックに失敗する小さなバグを修正>SELECT
- オペレーティングシステムのセキュリティを更新。
2025 年 3 月 11 日
- Databricks Runtime 14.3 LTS 以降には、 SparkListenerApplicationEnd クラスをインスタンス化し、Apache Spark に対してコンパイルされたコードとのバイナリ非互換性の原因となった問題の修正プログラムが含まれています。この非互換性は、SPARK-46399 を Apache Spark にマージした結果です。このマージには、SparkListenerApplicationEnd コンストラクターに既定の引数を追加する変更が含まれていました。バイナリ互換性を復元するために、この修正により、SparkListenerApplicationEnd クラスに 1 つの引数コンストラクターが追加されます。
- 元に戻す "[SPARK-48273][SQL] PlanWithUnresolvedIdentifier の遅延書き換えを修正"
- [SPARK-50985][SS] KafkaTokenProvider で不足しているサーバーのエラーをアサートとスローするのではではなく、Kafka タイムスタンプオフセットの不一致エラーを分類する
- [SPARK-51065][SQL] TransformWithState に Avro エンコードを使用する場合の null 非許容スキーマの禁止
- [SPARK-51237][SS] 必要に応じて新しい transformWithState ヘルパー API の API の詳細を追加する
- [SPARK-51222][SQL] ReplaceCurrentLike を最適化する
- [SPARK-51351][SS] TWS の Python ワーカーで出力を具体化しないようにする
- [SPARK-51084][SQL] negativeScaleNotAllowedError に適切なエラークラスを割り当てる
- [SPARK-51249][SS] 正しいバージョンバイト数を使用するための NoPrefixKeyStateEncoder および Avro エンコードの修正
- オペレーティングシステムのセキュリティを更新。
2025 年 2 月 5 日
- このリリースには、復旧された XML データ列をシリアル化するときの特定のデータ型の変換に影響する問題の修正が含まれています。影響を受けるデータ型は、日付、NTZ 以外のタイムスタンプ、および prefersDecimal が有効な場合の 10 進数です。救助されたデータ列の詳細については、「救助されたデータ列とは」を参照してください。.
- [SPARK-50770][SS] transformWithState 演算子 API に対するパッケージスコープを削除する
- オペレーティングシステムのセキュリティを更新。

Databricks Runtime 16.1

Databricks Runtime 16.1 (EoS) を参照してください。

2025 年 8 月 12 日
- オペレーティングシステムのセキュリティを更新。

2025 年 7 月 29 日
- オペレーティングシステムのセキュリティを更新。
2025 年 7 月 15 日
- オペレーティングシステムのセキュリティを更新。
2025 年 7 月 1 日
- ファイルデータソースリーダー (json、csv、xml、およびテキスト) の ZStandard 解凍対応
- [SPARK-52482][SQL][CORE] ZStandard によるファイルデータソースリーダーのサポート
- [15.4-16.4][spark-52521]](https://issues.apache.org/jira/browse/SPARK-52521)[SQL] Right#replacement は SQLConf に動的にアクセスできません
- [SPARK-52312][SQL] DataFrame のキャッシュ時に V2WriteCommand を無視する
- オペレーティングシステムのセキュリティを更新。
2025 年 6 月 17 日
- cloud_files_stateテーブル値関数 (TVF) を使用して、パイプライン間でストリーミングテーブルのファイルレベルの状態を読み取ることができないという制限を修正しました。
- [SPARK-52040][PYTHON][SQL][CONNECT] ResolveLateralColumnAliasReference はプラン ID を保持する必要があります
- オペレーティングシステムのセキュリティを更新。

2025 年 6 月 3 日
- Python ライブラリの更新:
  - 41.0.7、41.0.7、42.0.5 から 42.0.5 への暗号化
  - パッケージを 24.0、24.1 から 24.1 へ変更
  - platformdirs を 3.10.0、4.2.2 から 3.10.0 へ変更
  - pyparsing バージョン 3.0.9、3.1.1 から 3.0.9 に変更
  - autocommand 2.2.2 を追加しました
  - backports.tarfile 1.2.0 を追加しました
  - importlib_resources 6.4.0 を追加しました
  - Inflect 7.3.1 を追加しました
  - jaraco.context 5.3.0 を追加しました
  - jaraco.functools 4.0.1 を追加しました
  - jaraco.text 3.12.1 を追加しました
  - more-itertools 10.3.0 を追加しました
  - pip 24.2 を追加しました
  - setuptools 74.0.0 を追加しました
  - tomli 2.0.1 を追加しました
  - typeguard 4.3.0 を追加しました
  - wcwidth 0.2.5 を追加しました
  - ホイール 0.43.0 を追加しました
  - ディストリビューション 1.9.0 を削除しました
  - distro-info 1.7+build1 を削除しました
  - python-apt 2.7.7+ubuntu4 を削除しました
- Java ライブラリの更新:
  - com.github.fommil.netlib.native_ref-java を 1.1、1.1 ネイティブから 1.1、1.1 へ更新
  - com.github.fommil.netlib.native_system-java を 1.1、1.1 ネイティブから 1.1、1.1 へ更新
  - com.github.fommil.netlib.netlib-native_ref-linux-x86_64 のバージョンを 1.1-natives から 1.1 に変更
  - com.github.fommil.netlib.netlib-native_system-linux-x86_64 を 1.1 ネイティブから 1.1 へ更新
  - io.netty.netty-tcnative-boringssl-static 2.0.61.Final-db-r16, 2.0.61.Final-db-r16-linux-aarch_64, 2.0.61.Final-db-r16-linux-x86_64, 2.0.61.Final-db-r16-osx-aarch_64, 2.0.61.Final-db-r16-osx-x86_64, 2.0.61.Final-db-r16-windows-x86_64 から 2.0.61.Final-db-r16, 2.0.61.Final-db-r16, 2.0.61.Final-db-r16, 2.0.61.Final-db-r16, 2.0.61.Final-db-r16, 2.0.61.Final-db-r16
  - io.netty.netty-transport-native-epoll を 4.1.108.Final、4.1.108.Final-linux-aarch_64、4.1.108.Final-linux-riscv64、4.1.108.Final-linux-x86_64 からそれぞれ 4.1.108.Final、4.1.108.Final、4.1.108.Final、4.1.108.Final へ
  - io.netty.netty-transport-native-kqueue from 4.1.108.Final-osx-aarch_64, 4.1.108.Final-osx-x86_64 から 4.1.108.Final, 4.1.108.Final
  - org.apache.orc.orc-core を 1.9.2-shaded-protobuf から 1.9.2 に変更
  - org.apache.orc.orc-mapreduce を 1.9.2-shaded-protobuf から 1.9.2 に変更
  - software.amazon.cryptools.AmazonCorrettoCryptoProvider を 2.4.1-linux-x86_64 から 2.4.1 に
- [SPARK-52159][SQL] jdbc 言語のテーブル存在チェックを適切に処理する
- オペレーティングシステムのセキュリティを更新。

2025 年 5 月 20 日
- Java ライブラリの更新:
  - io.delta.delta-sharing-client_2.12 を 1.2.5 から 1.2.7 に変更
  - org.apache.avro.avro 1.11.3 から 1.11.4
  - org.apache.avro.avro-ipc (1.11.3 から 1.11.4 へ)
  - org.apache.avro.avro-mapred 1.11.3 から 1.11.4
- ストリーミング複製セッションは、共有クラスター/サーバーレスの foreachBatch ユーザー関数内で使用されます。これは、クラシック (割り当てられたクラスター) での動作に合わせて調整されます。
- この変更の前は、photon を無効にして、 variant_get 式のパスの先頭の空白とタブが無視されていました。たとえば、 select variant_get(parse_json('{"key": "value"}'), '$['key']') は、 "key"の値を抽出するのに有効ではありません。ただし、ユーザーは、このようなキーを今すぐ抽出できるようになります。
- [SPARK-51935][SQL] 解釈された df.collect() 内の反復子の遅延動作を修正する
- オペレーティングシステムのセキュリティを更新。

2025 年 4 月 22 日
- "[SPARK-47895][SQL] エイリアスによるグループ化は冪等であるべき" を15.4、16.0、16.1、16.2、および16.3で元に戻す。
- [SPARK-50682][SQL] 内部エイリアスを正規化する必要がある
- [SPARK-51717][SS][RocksDB] 新しいクエリ用に作成された 2 つ目のスナップショットで発生する可能性がある SST の不一致の破損を修正する
- オペレーティングシステムのセキュリティを更新。

2025 年 4 月 9 日
- Java ライブラリの更新:
  - io.starburst.openjson.openjson 1.8-e.12 を削除しました
  - io.starburst.openx.data.json-serde 1.3.9-e.12 を削除
  - io.starburst.openx.data.json-serde-generic-shim 1.3.9-e.12 を削除しました。
- [SPARK-51505][SQL] AQE 結合の空のパーティション数メトリクスをログする
- [SPARK-51624][SQL] GetStructField メタデータを CreateNamedStruct.dataType に伝達する
- [SPARK-47895][SQL] エイリアスによるグループ化はべき等である必要がある
- オペレーティングシステムのセキュリティを更新。

2025 年 3 月 11 日
- Databricks Runtime 14.3 LTS 以降には、 SparkListenerApplicationEnd クラスをインスタンス化し、Apache Spark に対してコンパイルされたコードとのバイナリ非互換性の原因となった問題の修正プログラムが含まれています。この非互換性は、SPARK-46399 を Apache Spark にマージした結果です。このマージには、SparkListenerApplicationEnd コンストラクターに既定の引数を追加する変更が含まれていました。バイナリ互換性を復元するために、この修正により、SparkListenerApplicationEnd クラスに 1 つの引数コンストラクターが追加されます。
- [SPARK-51084][SQL] negativeScaleNotAllowedError に適切なエラークラスを割り当てる
- 元に戻す [SPARK-48273][SQL] PlanWithUnresolvedIdentifier の遅延書き換えを修正
- [SPARK-51222][SQL] ReplaceCurrentLike を最適化する
- [SPARK-50985][SS] KafkaTokenProvider で不足しているサーバーのエラーをアサートとスローするのではではなく、Kafka タイムスタンプオフセットの不一致エラーを分類する
- [SPARK-50791][SQL] State Store エラー処理での NPE の修正
- オペレーティングシステムのセキュリティを更新。

2025 年 2 月 11 日
- このリリースには、復旧された XML データ列をシリアル化するときの特定のデータ型の変換に影響する問題の修正が含まれています。影響を受けるデータ型は、日付、NTZ 以外のタイムスタンプ、および prefersDecimal が有効な場合の 10 進数です。救助されたデータ列の詳細については、「救助されたデータ列とは」を参照してください。.
- [SPARK-50492][SS] dropDuplicatesWithinWatermark の後にイベント時間列が削除されたときに java.util.NoSuchElementException を修正する
- オペレーティングシステムのセキュリティを更新。

2024 年 11 月 27 日
- このリリースには、バックグラウンドの自動圧縮に関連する特定のエッジケースで Delta テーブルの主キーが削除される可能性がある問題の修正プログラムが含まれています。
- このリリースには、復旧された XML データ列をシリアル化するときの特定のデータ型の変換に影響する問題の修正が含まれています。影響を受けるデータ型は、日付、NTZ 以外のタイムスタンプ、および prefersDecimal が有効な場合の 10 進数です。救助されたデータ列の詳細については、「救助されたデータ列とは」を参照してください。.
- このリリースでは、Databricks コンピューティングノードの SSD によって使用されるキャッシュサイズは、SSD の初期サイズに動的に拡張され、必要に応じて spark.databricks.io.cache.maxDiskUsage の制限まで縮小されます。 Azure Databricksを参照してください。
- [SPARK-50338][CORE] LazyTry の例外メッセージを簡潔にする
- オペレーティングシステムのセキュリティを更新。

Databricks Runtime 16.0（データエンジニアリング向けの統合プラットフォーム）

Databricks Runtime 16.0 (EoS) を参照してください。

2025 年 4 月 22 日
- "[SPARK-47895][SQL] エイリアスによるグループ化は冪等であるべき" を15.4、16.0、16.1、16.2、および16.3で元に戻す。
- オペレーティングシステムのセキュリティを更新。

2025 年 4 月 9 日
- Java ライブラリの更新:
  - io.starburst.openjson.openjson 1.8-e.12 を削除しました
  - io.starburst.openx.data.json-serde 1.3.9-e.12 を削除
  - io.starburst.openx.data.json-serde-generic-shim 1.3.9-e.12 を削除しました。
- [SPARK-47895][SQL] エイリアスによるグループ化はべき等である必要がある
- [SPARK-51624][SQL] GetStructField メタデータを CreateNamedStruct.dataType に伝達する
- オペレーティングシステムのセキュリティを更新。

2025 年 3 月 11 日
- Databricks Runtime 14.3 以降には、SparkListenerApplicationEnd クラスをインスタンス化し、Apache Spark に対してコンパイルされたコードとのバイナリ非互換性の原因となった問題の修正プログラムが含まれています。この非互換性は、SPARK-46399 を Apache Spark にマージした結果です。このマージには、SparkListenerApplicationEnd コンストラクターに既定の引数を追加する変更が含まれていました。バイナリ互換性を復元するために、この修正により、SparkListenerApplicationEnd クラスに 1 つの引数コンストラクターが追加されます。
- [SPARK-51084][SQL] negativeScaleNotAllowedError に適切なエラークラスを割り当てる
- [SPARK-51222][SQL] ReplaceCurrentLike を最適化する
- [SPARK-50985][SS] KafkaTokenProvider で不足しているサーバーのエラーをアサートとスローするのではではなく、Kafka タイムスタンプオフセットの不一致エラーを分類する
- [SPARK-50791][SQL] State Store エラー処理での NPE の修正
- オペレーティングシステムのセキュリティを更新。

2025 年 2 月 11 日
- このリリースには、復旧された XML データ列をシリアル化するときの特定のデータ型の変換に影響する問題の修正が含まれています。影響を受けるデータ型は、日付、NTZ 以外のタイムスタンプ、および prefersDecimal が有効な場合の 10 進数です。救助されたデータ列の詳細については、「救助されたデータ列とは」を参照してください。.
- [SPARK-50705][SQL] QueryPlan ロックフリーにする
- [SPARK-50492][SS] dropDuplicatesWithinWatermark の後にイベント時間列が削除されたときに java.util.NoSuchElementException を修正する
- オペレーティングシステムのセキュリティを更新。

2024 年 12 月 4 日
- USE CATALOG ステートメントで IDENTIFIER 句がサポートされるようになりました。このサポートにより、文字列変数またはパラメーターマーカーに基づいて現在のカタログをパラメーター化できます。
- このリリースには、バックグラウンドの自動圧縮に関連する特定のエッジケースで Delta テーブルの主キーが削除される可能性がある問題の修正プログラムが含まれています。
- このリリースでは、Databricks コンピューティングノードの SSD によって使用されるキャッシュサイズは、SSD の初期サイズに動的に拡張され、必要に応じて spark.databricks.io.cache.maxDiskUsage の制限まで縮小されます。 Azure Databricksを参照してください。
- [SPARK-50322][SQL] サブクエリのパラメーター化された識別子を修正する
- [SPARK-50034][CORE] SparkUncaughtExceptionHandler で致命的なエラーをキャッチされない例外として誤って報告する問題を修正
- [SPARK-47435][SQL] MySQL UNSIGNED TINYINT のオーバーフローの問題を修正
- [SPARK-49757][SQL] IDENTIFIERSET ステートメントでの CATALOG 式のサポート
- [SPARK-50426][PYTHON] 組み込みデータソースまたはJava データソースを使用する場合、静的なPython データソース参照を回避する
- [SPARK-50338][CORE] LazyTry の例外メッセージを簡潔にする
- オペレーティングシステムのセキュリティを更新。
2024 年 12 月 10 日
- (破壊的変更)Databricks Runtime 15.4 以降では、Photon での正規表現処理が Apache Spark 正規表現処理の動作に合わせて更新されます。以前は、split() や regexp_extract()など、Photon によって実行される正規表現関数では、Spark パーサーによって拒否された正規表現がいくつか受け入れられていた。 Apache Spark との一貫性を維持するために、Spark が無効と見なす正規表現に対して Photon クエリが失敗するようになりました。この変更により、Spark コードに無効な正規表現が含まれている場合、エラーが発生する可能性があります。たとえば、一致しない中かっこを含む式 split(str_col, '{') は、以前は Photon によって受け入れられていましたが、現在は失敗します。この式を修正するには、ブレース文字 split(str_col, '\\{')をエスケープすることができます。また、ASCII 以外の文字の正規表現の一致によっては、Photon と Spark の動作も異なりました。これは、Photon が Apache Spark の動作と一致するようにも更新されます。
- このリリースでは、テキスト入力の vector_search を使用して query_text 関数に対してクエリを実行したり、入力を埋め込む query_vector を実行したりできるようになりました。
- Spark 構成プロパティ spark.databricks.execution.timeoutを使用して、Spark Connect クエリのタイムアウトを設定できるようになりました。サーバーレスコンピューティングで実行されているノートブックの場合、既定値は 9000 (秒) です。標準アクセスモードでサーバーレスコンピューティングとコンピューティングで実行されているジョブは、この構成プロパティが設定されていない限りタイムアウトになりません。指定したタイムアウトより長く実行すると、QUERY_EXECUTION_TIMEOUT_EXCEEDED エラーが発生します。
- [SPARK-49843][SQL] char/varchar 列の変更コメントを修正する
- [SPARK-49924][SQL] containsNull 置換後に ArrayCompact を保持する
- [SPARK-49782][SQL]ResolveDataFrameDropColumns ルールは、子出力で UnresolvedAttribute を解決します
- [SPARK-48780][SQL] 関数とプロシージャを扱うために NamedParametersSupport のエラーを汎用的にする
- [SPARK-49876][CONNECT] Spark Connect Service からグローバルロックを取り除く
- [SPARK-49905] ステートフル演算子に専用の ShuffleOrigin を使用して、AQE からシャッフルが変更されないようにする
- [SPARK-49615] バグ修正: ML 列スキーマの検証を spark config spark.sql.caseSensitive に準拠させる
- [SPARK-48782][SQL] カタログでプロシージャを実行するためのサポートを追加する
- [SPARK-49863][SQL]NormalizeFloatingNumbers を修正して、入れ子になった構造体の null 値の許容を維持する
- [SPARK-49829] ストリーム間結合で状態ストアに入力を追加する際の最適化を修正する（正確性の向上）
- 元に戻す "[SPARK-49002][SQL] WAREHOUSE/SCHEMA/TABLE/PARTITION/DIRECTORY の無効な場所を一貫して処理する"
- [SPARK-50028][CONNECT] Spark Connect サーバーリスナーのグローバルロックをきめ細かいロックに置き換える
- [SPARK-49615] [ML] すべての ML 機能トランスフォーマーデータセットスキーマ検証を "spark.sql.caseSensitive" 構成に準拠させます。
- [SPARK-50124][SQL] LIMIT/OFFSET はデータの順序を保持する必要があります
- オペレーティングシステムのセキュリティを更新。

Databricks Runtime 15.3

「Databricks Runtime 15.3 (EoS)」を参照してください。

2024 年 11 月 26 日
- このリリースでは、テキスト入力の vector_search を使用して query_text 関数に対してクエリを実行したり、入力を埋め込む query_vector を実行したりできるようになりました。
- オペレーティングシステムのセキュリティを更新。
2024 年 11 月 5 日
- [SPARK-49905] ステートフル演算子に専用の ShuffleOrigin を使用して、AQE からシャッフルが変更されないようにする
- [SPARK-49867][SQL]GetColumnByOrdinal を呼び出すときにインデックスが範囲外の場合のエラーメッセージを改善する
- [SPARK-48843][15.3,15.2] BindParameters で無限ループを回避する
- [SPARK-49829] ストリーム間結合で状態ストアに入力を追加する際の最適化を修正する（正確性の向上）
- [SPARK-49863][SQL]NormalizeFloatingNumbers を修正して、入れ子になった構造体の null 値の許容を維持する
- [SPARK-49782][SQL]ResolveDataFrameDropColumns ルールは、子出力で UnresolvedAttribute を解決します
- [SPARK-46632][SQL]同等の三項式に異なる子がある場合の部分式の削除を修正する
- オペレーティングシステムのセキュリティを更新。
2024 年 10 月 22 日
- [SPARK-49905] ステートフル演算子に専用の ShuffleOrigin を使用して、AQE からシャッフルが変更されないようにする
- [SPARK-49867][SQL]GetColumnByOrdinal を呼び出すときにインデックスが範囲外の場合のエラーメッセージを改善する
- [SPARK-48843][15.3,15.2] BindParameters で無限ループを回避する
- [SPARK-49829] ストリーム間結合で状態ストアに入力を追加する際の最適化を修正する（正確性の向上）
- [SPARK-49863][SQL]NormalizeFloatingNumbers を修正して、入れ子になった構造体の null 値の許容を維持する
- [SPARK-49782][SQL]ResolveDataFrameDropColumns ルールは、子出力で UnresolvedAttribute を解決します
- [SPARK-46632][SQL]同等の三項式に異なる子がある場合の部分式の削除を修正する
- オペレーティングシステムのセキュリティを更新。
2024 年 10 月 10 日
- [SPARK-49688][CONNECT] 割り込みと実行プランの間のデータ競合を修正する
- [SPARK-49743][SQL]GetArrayStructFields を排除するときに OptimizeCsvJsonExpr でスキーマフィールドを変更しないでください
- [BACKPORT] [SPARK-49474][SS] FlatMapGroupsWithState ユーザー関数のエラークラスを分類するエラー
- オペレーティングシステムのセキュリティを更新。
2024 年 9 月 25 日
- [SPARK-49492][CONNECT]非アクティブな ExecutionHolder に対して再アタッチが試行されました
- [SPARK-49628][SQL]ConstantFolding では、評価前にステートフル式をコピーする必要があります
- [SPARK-49000][SQL]RewriteDistinctAggregates を展開して、t が空のテーブルである "select count(distinct 1) from t" を修正しました
- [SPARK-49458][CONNECT][PYTHON]ReattachExecute を使用してサーバー側のセッション ID を指定する
- [SPARK-48719][SQL] 最初のパラメーターが null の場合の RegrSlope & RegrIntercept の計算バグを修正する
- オペレーティングシステムのセキュリティを更新。
2024 年 9 月 17 日
- [SPARK-49336][CONNECT] protobuf メッセージを切り捨てる場合の入れ子レベルを制限する
- [SPARK-49526][CONNECT][15.3.5] ArtifactManager でのWindowsスタイルのパスのサポート
- [SPARK-49366][CONNECT]データフレーム列解決で共用体ノードをリーフとして扱う
- [SPARK-43242][CORE] シャッフルの破損診断中に「予期しないタイプの BlockId」をスローする問題を修正する
- [SPARK-49409][CONNECT]CONNECT_SESSION_PLAN_CACHE_SIZEの既定値を調整する
- オペレーティングシステムのセキュリティを更新。
2024 年 8 月 29 日
- [SPARK-49263][CONNECT] Spark Connect Python クライアント: ブール値データフレームリーダーのオプションを一貫して処理する
- [SPARK-49056][SQL] ErrorClassesJsonReader は null を正しく処理できません
- [SPARK-48862][PYTHON][CONNECT] INFO レベルが有効化されていないときに _proto_to_string の呼び出しは避けてください
- [SPARK-49146][SS] 追加モードのストリーミングクエリでウォーターマークが見つからない問題に関連するアサーションエラーをエラーフレームワークに移動する
2024 年 8 月 14 日
- [SPARK-48941][SPARK-48970] バックポート ML ライター/リーダーの修正
- [SPARK-48706][PYTHON] Python UDF が高階関数で内部エラーをスローしないようにする
- [SPARK-48954] try_mod() は try_remainder() を置き換える
- [SPARK-48597][SQL] 論理プランのテキスト表現に isStreaming プロパティのマーカーを導入する
- [SPARK-49065][SQL] レガシフォーマッタ/パーサーのリベースは、JVM 以外のデフォルトタイムゾーンをサポートする必要があります
- [SPARK-49047][PYTHON][CONNECT] ログ記録用にメッセージを切り詰める
- [SPARK-48740][SQL] 不足しているウィンドウ仕様のエラーを早期に把握
2024 年 8 月 1 日
- [破壊的変更]Databricks Runtime 15.3 以降では、Pythonユーザー定義関数 (UDF)、ユーザー定義集計関数 (UDAF)、または VARIANT 型を引数または戻り値として使用するユーザー定義テーブル関数 (UDTF) を呼び出すと、例外がスローされます。この変更は、これらの関数のいずれかが返す無効な値が原因で発生する可能性のある問題を防ぐために行われます。 VARIANT タイプの詳細については、「VARIANT を使用して半構造化データの保存」を参照してください。
- ノートブックとジョブのサーバーレスコンピューティングでは、ANSI SQL モードが既定で有効になっています。「サポートされている Spark 構成パラメーター」を参照してください。
- SHOW CREATE TABLE ステートメントからの出力には、具体化されたビューまたはストリーミングテーブルで定義されている行フィルターまたは列マスクが含まれるようになりました。「SHOW CREATE TABLE」を参照してください。行フィルターと列マスクの詳細については、「行フィルターと列マスク」を参照してください。
- 共有アクセスモードで構成されたコンピューティングでは、Kafka バッチの読み取りと書き込みには、構造化ストリームに関して文書化されている制限事項と同じものが実施されるようになりました。ストリーミングの制限事項を参照してください。
- [SPARK-46957][CORE] デコミッション移行済みシャッフルファイルはエグゼキューターからクリーンアップできる必要がある
- [SPARK-48648][PYTHON][CONNECT] SparkConnectClient.tags を適切に threadlocal にする
- [SPARK-48896][SPARK-48909][SPARK-48883] バックポート Spark ML ライターの修正
- [SPARK-48713][SQL] baseObject がバイト配列のときに UnsafeRow.pointTo にインデックスの範囲チェックを追加
- [SPARK-48834][SQL] クエリのコンパイル中に Python スカラー UDF、UDF、UDAF へのバリアント入力/出力を無効にする
- [SPARK-48934][SS] Python datetime 型が applyInPandasWithState でタイムアウトを設定するために正しく変換されませんでした
- [SPARK-48705][PYTHON] pyspark を使用して起動されるときに worker_main を明示的に使用する
- [SPARK-48544][SQL] 空の TreeNode BitSets のメモリ負荷を軽減する
- [SPARK-48889][SS] 終了する前に testStream で状態ストアをアンロードする
- [SPARK-49054][SQL] 列の既定値は、current_* 関数をサポートする必要があります
- [SPARK-48653][PYTHON] 無効な Python データソースエラークラス参照の修正
- [SPARK-48463] StringIndexer で入れ子になった入力列をサポートさせる
- [SPARK-48810][CONNECT] Session stop() API はべき等である必要があり、セッションがすでにサーバーによって閉じられている場合でもエラーを発生させてはならない。
- [SPARK-48873][SQL] JSON パーサーで UnsafeRow を使用。
- オペレーティングシステムのセキュリティを更新。
2024 年 7 月 11 日
- (動作変更) Delta テーブルソースに対してキャッシュされた DataFrame は、ソーステーブルが上書きされたら無効化されるようになりました。この変更は、Delta テーブルに対するすべての状態変更により、キャッシュされた結果が無効になったことを指します。 .checkpoint() を使用して DataFrame の有効期間全体にわたってテーブルの状態を永続化します。
- Snowflake JDBC ドライバーでは、バージョン 3.16.1 に更新されました。
- このリリースには、Databricks コンテナーサービスで実行中に [Spark UI] の [環境] タブが正しく表示されない問題の修正が含まれています。
- データの読み取り時に無効なパーティションを無視するには、Parquet、ORC、CSV、JSON などのファイルベースのデータソースで ignoreInvalidPartitionPaths データソースオプションを true に設定できます。例: spark.read.format(“parquet”).option(“ignoreInvalidPartitionPaths”, “true”).load(…)` SQL 構成 spark.sql.files.ignoreInvalidPartitionPaths を使用することもできます。ただし、データソースオプションは SQL 構成よりも優先されます。この設定の既定は false です。
- [SPARK-48100][SQL] スキーマで選択されていない入れ子構造フィールドのスキップに関する問題を修正する
- [SPARK-47463][SQL] V2Predicate を使用して戻り値がブール型の式をラップ
- [SPARK-48292][CORE] 取り消し: [SPARK-39195][SQL] Spark OutputCommitCoordinator はコミットされたファイルとタスクの状態が整合していない場合にステージを中止する必要がある
- [SPARK-48475][PYTHON] PySpark で _get_jvm_function in を最適化する
- [SPARK-48286] 既定の式が存在する列の分析を修正します - ユーザー向けエラーを追加
- [SPARK-48481][SQL][SS] OptimizeOneRowPlan をストリーミング Dataset に適用しない
- “[SPARK-47406][SQL] MYSQLDialect の TIMESTAMP と DATETIME を処理する“ を取り消す
- [SPARK-48383][SS] Kafka の startOffset オプションでパーティションのミスマッチに対してより良いエラーをスローする
- [SPARK-48503][14.3-15.3][SQL] 誤って許可された同等ではない列の group-by を持つ、無効なスカラーサブクエリを修正
- [SPARK-48445][SQL] コストが高い子要素を含む UDF をインライン化しない
- [SPARK-48252][SQL] 必要なときに CommonExpressionRef を更新する
- [SPARK-48273][master][SQL] PlanWithUnresolvedIdentifier の遅延書き換えを修正
- [SPARK-48566][PYTHON] UDTF analyze() が select と partitionColumns の両方を使用するときにパーティションインデックスが正しくないというバグを修正
- [SPARK-48556][SQL] UNSUPPORTED_GROUPING_EXPRESSIONを指す正しくないエラーメッセージを修正する
- オペレーティングシステムのセキュリティを更新。

Databricks Runtime 15.2

Databricks Runtime 15.2 (EoS)を参照してください。

2024 年 11 月 26 日
- オペレーティングシステムのセキュリティを更新。
2024 年 11 月 5 日
- [SPARK-49905] ステートフル演算子に専用の ShuffleOrigin を使用して、AQE からシャッフルが変更されないようにする
- [SPARK-48843][15.3,15.2] BindParameters で無限ループを回避する
- [SPARK-49829] ストリーム間結合で状態ストアに入力を追加する際の最適化を修正する（正確性の向上）
- [SPARK-49863][SQL]NormalizeFloatingNumbers を修正して、入れ子になった構造体の null 値の許容を維持する
- [SPARK-49782][SQL]ResolveDataFrameDropColumns ルールは、子出力で UnresolvedAttribute を解決します
- [SPARK-46632][SQL]同等の三項式に異なる子がある場合の部分式の削除を修正する
- オペレーティングシステムのセキュリティを更新。
2024 年 10 月 22 日
- [SPARK-49905] ステートフル演算子に専用の ShuffleOrigin を使用して、AQE からシャッフルが変更されないようにする
- [SPARK-48843][15.3,15.2] BindParameters で無限ループを回避する
- [SPARK-49829] ストリーム間結合で状態ストアに入力を追加する際の最適化を修正する（正確性の向上）
- [SPARK-49863][SQL]NormalizeFloatingNumbers を修正して、入れ子になった構造体の null 値の許容を維持する
- [SPARK-49782][SQL]ResolveDataFrameDropColumns ルールは、子出力で UnresolvedAttribute を解決します
- [SPARK-46632][SQL]同等の三項式に異なる子がある場合の部分式の削除を修正する
- オペレーティングシステムのセキュリティを更新。
2024 年 10 月 10 日
- [BACKPORT] [SPARK-49474][SS] FlatMapGroupsWithState ユーザー関数のエラークラスを分類するエラー
- [SPARK-49743][SQL]GetArrayStructFields を排除するときに OptimizeCsvJsonExpr でスキーマフィールドを変更しないでください
- [SPARK-49688][CONNECT] 割り込みと実行プランの間のデータ競合を修正する
- オペレーティングシステムのセキュリティを更新。
2024 年 9 月 25 日
- [SPARK-49000][SQL]RewriteDistinctAggregates を展開して、t が空のテーブルである "select count(distinct 1) from t" を修正しました
- [SPARK-48719][SQL]最初のパラメーターが null の場合の RegrSlope と RegrIntercept の計算バグを修正しました
- [SPARK-49458][CONNECT][PYTHON]ReattachExecute を使用してサーバー側のセッション ID を指定する
- [SPARK-49628][SQL]ConstantFolding では、評価前にステートフル式をコピーする必要があります
- [SPARK-49492][CONNECT]非アクティブな ExecutionHolder に対して再アタッチが試行されました
- オペレーティングシステムのセキュリティを更新。
2024 年 9 月 17 日
- [SPARK-49336][CONNECT] protobuf メッセージを切り捨てる場合の入れ子レベルを制限する
- [SPARK-49526][CONNECT] ArtifactManager でのWindowsスタイルのパスのサポート
- [SPARK-49366][CONNECT]データフレーム列解決で共用体ノードをリーフとして扱う
- [SPARK-43242][CORE] シャッフルの破損診断中に「予期しないタイプの BlockId」をスローする問題を修正する
- [SPARK-49409][CONNECT]CONNECT_SESSION_PLAN_CACHE_SIZEの既定値を調整する
- オペレーティングシステムのセキュリティを更新。
2024 年 8 月 29 日
- [SPARK-49056][SQL] ErrorClassesJsonReader は null を正しく処理できません
- [SPARK-48597][SQL] 論理プランのテキスト表現に isStreaming プロパティのマーカーを導入する
- [SPARK-48862][PYTHON][CONNECT] INFO レベルが有効化されていないときに _proto_to_string の呼び出しは避けてください
- [SPARK-49263][CONNECT] Spark Connect Python クライアント: ブール値データフレームリーダーのオプションを一貫して処理する
- [SPARK-49146][SS] 追加モードのストリーミングクエリでウォーターマークが見つからない問題に関連するアサーションエラーをエラーフレームワークに移動する
2024 年 8 月 14 日
- [SPARK-48941][SPARK-48970] バックポート ML ライター/リーダーの修正
- [SPARK-48050][SS] クエリの開始時に論理プランをログに記録する
- [SPARK-48706][PYTHON] Python UDF が高階関数で内部エラーをスローしないようにする
- [SPARK-48740][SQL] 不足しているウィンドウ仕様のエラーを早期に把握
- [SPARK-49065][SQL] レガシフォーマッタ/パーサーのリベースは、JVM 以外のデフォルトタイムゾーンをサポートする必要があります
- [SPARK-49047][PYTHON][CONNECT] ログ記録用にメッセージを切り詰める
2024 年 8 月 1 日
- ノートブックとジョブのサーバーレスコンピューティングでは、ANSI SQL モードが既定で有効になっています。「サポートされている Spark 構成パラメーター」を参照してください。
- 共有アクセスモードで構成されたコンピューティングでは、Kafka バッチの読み取りと書き込みには、構造化ストリームに関して文書化されている制限事項と同じものが実施されるようになりました。ストリーミングの制限事項を参照してください。
- SHOW CREATE TABLE ステートメントからの出力には、具体化されたビューまたはストリーミングテーブルで定義されている行フィルターまたは列マスクが含まれるようになりました。「SHOW CREATE TABLE」を参照してください。行フィルターと列マスクの詳細については、「行フィルターと列マスク」を参照してください。
- 共有アクセスモードで構成されたコンピューティングでは、Kafka バッチの読み取りと書き込みには、構造化ストリームに関して文書化されている制限事項と同じものが実施されるようになりました。ストリーミングの制限事項を参照してください。
- SHOW CREATE TABLE ステートメントからの出力には、具体化されたビューまたはストリーミングテーブルで定義されている行フィルターまたは列マスクが含まれるようになりました。「SHOW CREATE TABLE」を参照してください。行フィルターと列マスクの詳細については、「行フィルターと列マスク」を参照してください。
- [SPARK-48705][PYTHON] pyspark を使用して起動されるときに worker_main を明示的に使用する
- [SPARK-48047][SQL] 空の TreeNode タグのメモリ負荷を軽減する
- [SPARK-48810][CONNECT] Session stop() API はべき等である必要があり、セッションがすでにサーバーによって閉じられている場合でもエラーを発生させてはならない。
- [SPARK-48873][SQL] JSON パーサーで UnsafeRow を使用。
- [SPARK-46957][CORE] デコミッション移行済みシャッフルファイルはエグゼキューターからクリーンアップできる必要がある
- [SPARK-48889][SS] 終了する前に testStream で状態ストアをアンロードする
- [SPARK-48713][SQL] baseObject がバイト配列のときに UnsafeRow.pointTo にインデックスの範囲チェックを追加
- [SPARK-48896][SPARK-48909][SPARK-48883] バックポート Spark ML ライターの修正
- [SPARK-48544][SQL] 空の TreeNode BitSets のメモリ負荷を軽減する
- [SPARK-48934][SS] Python datetime 型が applyInPandasWithState でタイムアウトを設定するために正しく変換されませんでした
- [SPARK-48463] StringIndexer で入れ子になった入力列をサポートさせる
- オペレーティングシステムのセキュリティを更新。
2024 年 7 月 11 日
- (動作変更) Delta テーブルソースに対してキャッシュされた DataFrame は、ソーステーブルが上書きされたら無効化されるようになりました。この変更は、Delta テーブルに対するすべての状態変更により、キャッシュされた結果が無効になったことを指します。 .checkpoint() を使用して DataFrame の有効期間全体にわたってテーブルの状態を永続化します。
- Snowflake JDBC ドライバーでは、バージョン 3.16.1 に更新されました。
- このリリースには、Databricks コンテナーサービスで実行中に [Spark UI] の [環境] タブが正しく表示されない問題の修正が含まれています。
- サーバーレスノートブックとジョブでは、ANSI SQL モードが既定で有効になり、短い名前がサポートされます
- データの読み取り時に無効なパーティションを無視するには、Parquet、ORC、CSV、JSON などのファイルベースのデータソースで ignoreInvalidPartitionPaths データソースオプションを true に設定できます。例: spark.read.format(“parquet”).option(“ignoreInvalidPartitionPaths”, “true”).load(…)` SQL 構成 spark.sql.files.ignoreInvalidPartitionPaths を使用することもできます。ただし、データソースオプションは SQL 構成よりも優先されます。この設定の既定は false です。
- [SPARK-48273][SQL] PlanWithUnresolvedIdentifier の遅延書き換えを修正する
- [SPARK-48292][CORE] 取り消し: [SPARK-39195][SQL] Spark OutputCommitCoordinator はコミットされたファイルとタスクの状態が整合していない場合にステージを中止する必要がある
- [SPARK-48100][SQL] スキーマで選択されていない入れ子構造フィールドのスキップに関する問題を修正する
- [SPARK-48286] 既定の式が存在する列の分析を修正します - ユーザー向けエラーを追加
- [SPARK-48294][SQL] nestedTypeMissingElementTypeError で小文字を処理する
- [SPARK-48556][SQL] UNSUPPORTED_GROUPING_EXPRESSIONを指す正しくないエラーメッセージを修正する
- [SPARK-48648][PYTHON][CONNECT] SparkConnectClient.tags を適切に threadlocal にする
- [SPARK-48503][SQL] 等価でない列に対して group-by がある場合に誤って許可されていた無効なスカラーサブクエリを修正する
- [SPARK-48252][SQL] 必要なときに CommonExpressionRef を更新する
- [SPARK-48475][PYTHON] PySpark で _get_jvm_function in を最適化する
- [SPARK-48566][PYTHON] UDTF analyze() が select と partitionColumns の両方を使用するときにパーティションインデックスが正しくないというバグを修正
- [SPARK-48481][SQL][SS] OptimizeOneRowPlan をストリーミング Dataset に適用しない
- [SPARK-47463][SQL] V2Predicate を使用して戻り値がブール型の式をラップ
- [SPARK-48383][SS] Kafka の startOffset オプションでパーティションのミスマッチに対してより良いエラーをスローする
- [SPARK-48445][SQL] コストが高い子要素を含む UDF をインライン化しない
- オペレーティングシステムのセキュリティを更新。
2024 年 6 月 17 日
- applyInPandasWithState() は共有クラスターで使用できます。
- Photon TopK を使用したランクウィンドウの最適化で、構造体を含むパーティションが正しく処理されないバグを修正しました。
- 10 進数を含む入力で予期しない例外が発生する try_divide() 関数のバグを修正しました。
- [SPARK-48197][SQL] 無効なラムダ関数のアサートエラーを回避する
- [SPARK-48276][PYTHON][CONNECT] __repr__ の足りない SQLExpression メソッドを追加する
- [SPARK-48014][SQL] EvaluatePython の makeFromJava エラーをユーザー側エラーに変更
- [SPARK-48016][SQL] 10 進数を使用する場合 try_divide 関数のバグを修正する
- [SPARK-47986][CONNECT][PYTHON] 既定のセッションがサーバーによって閉じられたときに新しいセッションを作成できない
- [SPARK-48173][SQL] CheckAnalysis にクエリプラン全体が表示される
- [SPARK-48056][CONNECT][PYTHON] SESSION_NOT_FOUND エラーが発生しても部分的な応答が受信されなかった場合にプランを再実行する
- [SPARK-48172][SQL] JDBCDialects バックポートのエスケープの問題を 15.2 に修正
- [SPARK-48105][SS] 状態ストアのアンロードとスナップショット処理の間の競合状態を修正する
- [SPARK-48288] コネクタのキャスト式におけるソースデータ型を追加する
- [SPARK-48310][PYTHON][CONNECT] キャッシュされたプロパティはコピーを返す必要がある
- [SPARK-48277] ErrorClassesJsonReader.getErrorMessage のエラーメッセージを改善する
- [SPARK-47986][CONNECT][PYTHON] 既定のセッションがサーバーによって閉じられたときに新しいセッションを作成できない
- “[SPARK-47406][SQL] MYSQLDialect の TIMESTAMP と DATETIME を処理する“ を取り消す
- [SPARK-47994][SQL] SQLServer で CASE WHEN 列フィルターがプッシュダウンされるバグを修正する
- [SPARK-47764][CORE][SQL] ShuffleCleanupMode に基づくシャッフル依存関係をクリーンアップする
- [SPARK-47921][CONNECT] ExecuteHolder での ExecuteJobTag の作成を修正する
- [SPARK-48010][SQL] resolveExpression で conf.resolver を繰り返し呼び出さないようにする
- [SPARK-48146][SQL] With 式子アサーションの集計関数を修正する
- [SPARK-48180][SQL] TABLE 引数を使用した UDTF 呼び出しで、複数の PARTITION/ORDER BY 式で周りのかっこが消えるエラーを改善する
- オペレーティングシステムのセキュリティを更新。

Databricks Runtime 15.1

「Databricks Runtime 15.1 (EoS)」を参照してください。

2024 年 10 月 22 日
- [SPARK-49863][SQL]NormalizeFloatingNumbers を修正して、入れ子になった構造体の null 値の許容を維持する
- [SPARK-46632][SQL]同等の三項式に異なる子がある場合の部分式の削除を修正する
- [SPARK-49782][SQL]ResolveDataFrameDropColumns ルールは、子出力で UnresolvedAttribute を解決します
- [SPARK-49905] ステートフル演算子に専用の ShuffleOrigin を使用して、AQE からシャッフルが変更されないようにする
- [SPARK-49829] ストリーム間結合で状態ストアに入力を追加する際の最適化を修正する（正確性の向上）
- オペレーティングシステムのセキュリティを更新。
2024 年 10 月 10 日
- [SPARK-49688][CONNECT] 割り込みと実行プランの間のデータ競合を修正する
- [SPARK-49743][SQL]GetArrayStructFields を排除するときに OptimizeCsvJsonExpr でスキーマフィールドを変更しないでください
- [BACKPORT] [SPARK-49474][SS] FlatMapGroupsWithState ユーザー関数のエラークラスを分類するエラー
- オペレーティングシステムのセキュリティを更新。
2024 年 9 月 25 日
- [SPARK-49628][SQL]ConstantFolding では、評価前にステートフル式をコピーする必要があります
- [SPARK-48719][SQL]最初のパラメーターが null の場合の RegrSlope と RegrIntercept の計算バグを修正しました
- [SPARK-49492][CONNECT]非アクティブな ExecutionHolder に対して再アタッチが試行されました
- [SPARK-49000][SQL]RewriteDistinctAggregates を展開して、t が空のテーブルである "select count(distinct 1) from t" を修正しました
- [SPARK-49458][CONNECT][PYTHON]ReattachExecute を使用してサーバー側のセッション ID を指定する
- オペレーティングシステムのセキュリティを更新。
2024 年 9 月 17 日
- [SPARK-49336][CONNECT] protobuf メッセージを切り捨てる場合の入れ子レベルを制限する
- [SPARK-49526][CONNECT] ArtifactManager でのWindowsスタイルのパスのサポート
- [SPARK-49409][CONNECT]CONNECT_SESSION_PLAN_CACHE_SIZEの既定値を調整する
- [SPARK-43242][CORE] シャッフルの破損診断中に「予期しないタイプの BlockId」をスローする問題を修正する
- [SPARK-49366][CONNECT]データフレーム列解決で共用体ノードをリーフとして扱う
2024 年 8 月 29 日
- [SPARK-49263][CONNECT] Spark Connect Python クライアント: ブール値データフレームリーダーのオプションを一貫して処理する
- [SPARK-49056][SQL] ErrorClassesJsonReader は null を正しく処理できません
- [SPARK-48862][PYTHON][CONNECT] INFO レベルが有効化されていないときに _proto_to_string の呼び出しは避けてください
- [SPARK-49146][SS] 追加モードのストリーミングクエリでウォーターマークが見つからない問題に関連するアサーションエラーをエラーフレームワークに移動する
2024 年 8 月 14 日
- [SPARK-48941][SPARK-48970] バックポート ML ライター/リーダーの修正
- [SPARK-48050][SS] クエリの開始時に論理プランをログに記録する
- [SPARK-48706][PYTHON] Python UDF が高階関数で内部エラーをスローしないようにする
- [SPARK-48597][SQL] 論理プランのテキスト表現に isStreaming プロパティのマーカーを導入する
- [SPARK-49065][SQL] レガシフォーマッタ/パーサーのリベースは、JVM 以外のデフォルトタイムゾーンをサポートする必要があります
- [SPARK-49047][PYTHON][CONNECT] ログ記録用にメッセージを切り詰める
- [SPARK-48740][SQL] 不足しているウィンドウ仕様のエラーを早期に把握
2024 年 8 月 1 日
- ノートブックとジョブのサーバーレスコンピューティングでは、ANSI SQL モードが既定で有効になっています。「サポートされている Spark 構成パラメーター」を参照してください。
- 共有アクセスモードで構成されたコンピューティングでは、Kafka バッチの読み取りと書き込みには、構造化ストリームに関して文書化されている制限事項と同じものが実施されるようになりました。ストリーミングの制限事項を参照してください。
- SHOW CREATE TABLE ステートメントからの出力には、具体化されたビューまたはストリーミングテーブルで定義されている行フィルターまたは列マスクが含まれるようになりました。「SHOW CREATE TABLE」を参照してください。行フィルターと列マスクの詳細については、「行フィルターと列マスク」を参照してください。
- 共有アクセスモードで構成されたコンピューティングでは、Kafka バッチの読み取りと書き込みには、構造化ストリームに関して文書化されている制限事項と同じものが実施されるようになりました。ストリーミングの制限事項を参照してください。
- SHOW CREATE TABLE ステートメントからの出力には、具体化されたビューまたはストリーミングテーブルで定義されている行フィルターまたは列マスクが含まれるようになりました。「SHOW CREATE TABLE」を参照してください。行フィルターと列マスクの詳細については、「行フィルターと列マスク」を参照してください。
- [SPARK-48544][SQL] 空の TreeNode BitSets のメモリ負荷を軽減する
- [SPARK-46957][CORE] デコミッション移行済みシャッフルファイルはエグゼキューターからクリーンアップできる必要がある
- [SPARK-47202] [PYTHON] tzinfo で datetimes を壊す入力ミスを修正する
- [SPARK-48713][SQL] baseObject がバイト配列のときに UnsafeRow.pointTo にインデックスの範囲チェックを追加
- [SPARK-48896][SPARK-48909][SPARK-48883] バックポート Spark ML ライターの修正
- [SPARK-48810][CONNECT] Session stop() API はべき等である必要があり、セッションがすでにサーバーによって閉じられている場合でもエラーを発生させてはならない。
- [SPARK-48873][SQL] JSON パーサーで UnsafeRow を使用。
- [SPARK-48934][SS] Python datetime 型が applyInPandasWithState でタイムアウトを設定するために正しく変換されませんでした
- [SPARK-48705][PYTHON] pyspark を使用して起動されるときに worker_main を明示的に使用する
- [SPARK-48889][SS] 終了する前に testStream で状態ストアをアンロードする
- [SPARK-48047][SQL] 空の TreeNode タグのメモリ負荷を軽減する
- [SPARK-48463] StringIndexer で入れ子になった入力列をサポートさせる
- オペレーティングシステムのセキュリティを更新。
2024 年 7 月 11 日
- (動作変更) Delta テーブルソースに対してキャッシュされた DataFrame は、ソーステーブルが上書きされたら無効化されるようになりました。この変更は、Delta テーブルに対するすべての状態変更により、キャッシュされた結果が無効になったことを指します。 .checkpoint() を使用して DataFrame の有効期間全体にわたってテーブルの状態を永続化します。
- Snowflake JDBC ドライバーでは、バージョン 3.16.1 に更新されました。
- このリリースには、Databricks コンテナーサービスで実行中に [Spark UI] の [環境] タブが正しく表示されない問題の修正が含まれています。
- ノートブックとジョブのサーバーレスコンピューティングでは、ANSI SQL モードが既定で有効になっています。「サポートされている Spark 構成パラメーター」を参照してください。
- データの読み取り時に無効なパーティションを無視するには、Parquet、ORC、CSV、JSON などのファイルベースのデータソースで ignoreInvalidPartitionPaths データソースオプションを true に設定できます。例: spark.read.format(“parquet”).option(“ignoreInvalidPartitionPaths”, “true”).load(…)` SQL 構成 spark.sql.files.ignoreInvalidPartitionPaths を使用することもできます。ただし、データソースオプションは SQL 構成よりも優先されます。この設定の既定は false です。
- [SPARK-48383][SS] Kafka の startOffset オプションでパーティションのミスマッチに対してより良いエラーをスローする
- [SPARK-48481][SQL][SS] OptimizeOneRowPlan をストリーミング Dataset に適用しない
- [SPARK-48100][SQL] スキーマで選択されていない入れ子構造フィールドのスキップに関する問題を修正する
- [SPARK-47463][SQL] V2Predicate を使用して戻り値がブール型の式をラップ
- [SPARK-48445][SQL] コストが高い子要素を含む UDF をインライン化しない
- [SPARK-48292][CORE] 取り消し: [SPARK-39195][SQL] Spark OutputCommitCoordinator はコミットされたファイルとタスクの状態が整合していない場合にステージを中止する必要がある
- [SPARK-48566][PYTHON] UDTF analyze() が select と partitionColumns の両方を使用するときにパーティションインデックスが正しくないというバグを修正
- [SPARK-48648][PYTHON][CONNECT] SparkConnectClient.tags を適切に threadlocal にする
- [SPARK-48503][SQL] 等価でない列に対して group-by がある場合に誤って許可されていた無効なスカラーサブクエリを修正する
- [SPARK-48252][SQL] 必要なときに CommonExpressionRef を更新する
- [SPARK-48475][PYTHON] PySpark で _get_jvm_function in を最適化する
- [SPARK-48294][SQL] nestedTypeMissingElementTypeError で小文字を処理する
- [SPARK-48286] 既定の式が存在する列の分析を修正します - ユーザー向けエラーを追加
- [SPARK-47309][SQL] XML: 値タグのスキーマ推論テストを追加
- [SPARK-47309][SQL][XML] スキーマ推論の単体テストを追加
- [SPARK-48273][SQL] PlanWithUnresolvedIdentifier の遅延書き換えを修正する
- オペレーティングシステムのセキュリティを更新。
2024 年 6 月 17 日
- applyInPandasWithState() は共有クラスターで使用できます。
- Photon TopK を使用したランクウィンドウの最適化で、構造体を含むパーティションが正しく処理されないバグを修正しました。
- [SPARK-48310][PYTHON][CONNECT] キャッシュされたプロパティはコピーを返す必要がある
- [SPARK-48276][PYTHON][CONNECT] __repr__ の足りない SQLExpression メソッドを追加する
- [SPARK-48277] ErrorClassesJsonReader.getErrorMessage のエラーメッセージを改善する
- [SPARK-47764][CORE][SQL] ShuffleCleanupMode に基づくシャッフル依存関係をクリーンアップする
- オペレーティングシステムのセキュリティを更新。
2024 年 5 月 21 日
- 10 進数を含む入力で予期しない例外が発生する try_divide() 関数のバグを修正しました。
- [SPARK-48173][SQL] CheckAnalysis にクエリプラン全体が表示される
- [SPARK-48016][SQL] 10 進数を使用する場合 try_divide 関数のバグを修正する
- [SPARK-48105][SS] 状態ストアのアンロードとスナップショット処理の間の競合状態を修正する
- [SPARK-48197][SQL] 無効なラムダ関数のアサートエラーを回避する
- [SPARK-48180][SQL] TABLE 引数を使用した UDTF 呼び出しで、複数の PARTITION/ORDER BY 式で周りのかっこが消えるエラーを改善する
- [SPARK-48014][SQL] EvaluatePython の makeFromJava エラーをユーザー側エラーに変更
- [SPARK-48056][CONNECT][PYTHON] SESSION_NOT_FOUND エラーが発生しても部分的な応答が受信されなかった場合にプランを再実行する
- [SPARK-48146][SQL] With 式子アサーションの集計関数を修正する
- [SPARK-47994][SQL] SQLServer で CASE WHEN 列フィルターがプッシュダウンされるバグを修正する
- オペレーティングシステムのセキュリティを更新。
2024 年 5 月 9 日
- [SPARK-47543][CONNECT][PYTHON] Pandas DataFrame から dict を MapType として推論して DataFrame を作成できるようにする
- [SPARK-47739][SQL] 論理 avro 型を登録する
- [SPARK-48044][PYTHON][CONNECT] DataFrame.isStreaming をキャッシュする
- [SPARK-47855][CONNECT] サポート対象外リストに spark.sql.execution.arrow.pyspark.fallback.enabled を追加
- [SPARK-48010][SQL] resolveExpression で conf.resolver を繰り返し呼び出さないようにする
- [SPARK-47941] [SS] [Connect] PySpark の ForeachBatch worker 初期化エラーについてユーザーに伝える
- [SPARK-47819][CONNECT][Cherry-pick-15.0] 実行のクリーンアップに非同期コールバックを使用
- [SPARK-47956][SQL] 未解決の LCA リファレンスのサニティチェックを実行する
- [SPARK-47839][SQL] RewriteWithExpression における集計のバグを修正する
- [SPARK-48018][SS] KafkaException.couldNotReadOffsetRange をスローするときにパラメーター不足のエラーを引き起こす、null groupId を修正する
- [SPARK-47371][SQL] XML: CDATA で見つかった行タグを無視する
- [SPARK-47907][SQL] 構成の下にバングを配置
- [SPARK-47895][SQL] グループ分け、をすべてべき等にする
- [SPARK-47973][CORE] SparkContext.stop() と SparkContext.assertNotStopped() 内で呼び出し元をログに記録する
- [SPARK-47986][CONNECT][PYTHON] 既定のセッションがサーバーによって閉じられたときに新しいセッションを作成できない
- オペレーティングシステムのセキュリティを更新。

Databricks Runtime 15.0

「Databricks Runtime 15.0 (EoS)」を参照してください。

2024 年 5 月 30 日
- (動作変更) dbutils.widgets.getAll()ためにがサポートされるようになりました。
2024 年 4 月 25 日
- [SPARK-47786]SELECT DISTINCT () を SELECT DISTINCT struct() にすることはできない (前の動作に戻します)
- [SPARK-47802][SQL] () の意味を struct() から * の意味に戻す
- [SPARK-47509][SQL] ラムダ関数と上位関数のサブクエリ式をブロックします
- [SPARK-47722] RocksDB のバックグラウンド処理が終了するまで待ってからクローズ
- [SPARK-47081][CONNECT][FOLLOW] Progress Handler の使いやすさを向上
- [SPARK-47694][CONNECT] クライアント側で最大メッセージサイズを構成できるようにする
- [SPARK-47669][SQL][CONNECT][PYTHON] Column.try_cast を追加
- [SPARK-47664][PYTHON][CONNECT][Cherry-pick-15.0] キャッシュされたスキーマで列名を検証
- [SPARK-47818][CONNECT][Cherry-pick-15.0] SparkConnectPlanner にプランキャッシュを導入して、分析要求のパフォーマンスを向上
- [SPARK-47704][SQL] spark.sql.json.enablePartialResults が有効になっている場合に、JSON の解析が "java.lang.ClassCastException" で失敗する
- [SPARK-47755][CONNECT] 個別の値の数が多すぎる場合、ピボットは失敗する必要がある
- [SPARK-47713][SQL][CONNECT] 自己結合エラーを修正する
- [SPARK-47812][CONNECT] ForEachBatch ワーカーの SparkSession のシリアル化をサポートする
- [SPARK-47828][CONNECT][PYTHON] 無効なプランで DataFrameWriterV2.overwrite が失敗する
- [SPARK-47862][PYTHON][CONNECT] proto ファイルの生成を修正する
- [SPARK-47800][SQL] 識別子からテーブル識別子への変換のための新しいメソッドを作成
- オペレーティングシステムのセキュリティを更新。
2024 年 4 月 3 日
- (動作変更) さまざまなコンピューティングの種類で一貫した動作を確保するために、共有クラスター上の PySpark UDF は、非分離クラスターと割り当てられたクラスター上の UDF の動作と一致するようになりました。この更新プログラムには、既存のコードを中断する可能性がある次の変更が含まれています。
  - 戻り値の型が string である UDF は、非 string 値を string 値に暗黙的には変換しなくなりました。以前は、戻り値の型が str である UDF は、戻り値の実際のデータ型に関係なく、戻り値を str() 関数でラップしていました。
  - 戻り値の型が timestamp である UDF は、timestamp を持つ timezone への変換を暗黙的には適用しなくなりました。
  - Spark クラスター構成 spark.databricks.sql.externalUDF.* は、共有クラスター上の PySpark UDF には適用されなくなりました。
  - Spark クラスター構成 spark.databricks.safespark.externalUDF.plan.limit は、PySpark UDF には影響を与えなくなり、クエリあたり 5 個の UDF という PySpark UDF でのパブリックプレビュー制限が削除されました。
  - Spark クラスター構成 spark.databricks.safespark.sandbox.size.default.mib は、共有クラスター上の PySpark UDF には適用されなくなりました。代わりに、システム上の使用可能なメモリが使用されます。 PySpark UDF のメモリを制限するには、最小値を spark.databricks.pyspark.udf.isolation.memoryLimit にして 100m を使用します。
- TimestampNTZ データ型は、リキッドクラスタリングを使用するクラスタリング列としてサポートされるようになりました。表に液体クラスタリングを使用するを参照してください。
- [SPARK-47218][SQL] XML: XML トークナイザーのコメントされた行タグを無視する
- [SPARK-46990][SQL] イベントハブによって出力される空の Avro ファイルが読み込まれる問題を修正します
- [SPARK-47033][SQL] USING がセッション変数名を認識しない EXECUTE IMMEDIATE 修正
- [SPARK-47368][SQL] ParquetRowConverter の inferTimestampNTZ 構成チェックを削除します
- [SPARK-47561][SQL] エイリアスに関するアナライザールールの順序の問題を修正
- [SPARK-47638][PS][CONNECT] PS での列名の検証をスキップします
- [SPARK-46906][BACKPORT][SS] ストリーミングのステートフル演算子の変更のチェックを追加
- [SPARK-47569][SQL] バリアントの比較を禁止する
- [SPARK-47241][SQL] ExtractGenerator のルールの順序の問題を修正します
- [SPARK-47218] [SQL] XML: DROPMALFORMED モードで SchemaOfXml が失敗するように変更
- [SPARK-47300][SQL] quoteIfNeeded は数字で始まる識別子を引用符で囲む必要があります
- [SPARK-47009][SQL][Collation] 照合順序のテーブル作成のサポートを有効にする
- [SPARK-47322][PYTHON][CONNECT] withColumnsRenamed 列名の重複処理を withColumnRenamed と整合させる
- [SPARK-47544][PYTHON] SparkSession ビルダーメソッドと Visual Studio Code の Intellisense に互換性がない
- [SPARK-47511][SQL] ID を再割り当てすることで式で正規化します
- [SPARK-47385] オプション入力を使用してタプルエンコーダーを修正します
- [SPARK-47200][SS] Foreach バッチシンクのユーザー関数エラーに対するエラークラス
- [SPARK-47135][SS] Kafka データ損失例外のエラークラスを実装します
- [SPARK-38708][SQL] Hive メタストアクライアントを Hive 3.1 用の 3.1.3 にアップグレードします
- [SPARK-47305][SQL] プランにバッチとストリーミングの両方がある場合に LocalRelation の isStreaming フラグに正しくタグを付けるために PruneFilters を修正します
- [SPARK-47380][CONNECT] SparkSession が同じであることをサーバー側で確認
- オペレーティングシステムのセキュリティを更新。

Databricks Runtime（データブリックスランタイム）14.2

「Databricks Runtime 14.2 (EoS)」を参照してください。

2024 年 10 月 22 日
- [SPARK-49782][SQL]ResolveDataFrameDropColumns ルールは、子出力で UnresolvedAttribute を解決します
- [SPARK-49905] ステートフル演算子に専用の ShuffleOrigin を使用して、AQE からシャッフルが変更されないようにする
- オペレーティングシステムのセキュリティを更新。
2024 年 10 月 10 日
- [SPARK-49743][SQL]GetArrayStructFields を排除するときに OptimizeCsvJsonExpr でスキーマフィールドを変更しないでください
- [BACKPORT] [SPARK-49474][SS] FlatMapGroupsWithState ユーザー関数のエラークラスを分類するエラー
2024 年 9 月 25 日
- [SPARK-48719][SQL]'RegrS... の計算バグを修正しました。
- [SPARK-49628][SQL]ConstantFolding では、評価前にステートフル式をコピーする必要があります
- [SPARK-49000][SQL]RewriteDistinctAggregates を展開して、t が空のテーブルである "select count(distinct 1) from t" を修正しました
- [SPARK-43242][CORE] シャッフルの破損診断中に「予期しないタイプの BlockId」をスローする問題を修正する
- [SPARK-46601] [CORE]handleStatusMessage のログエラーを修正する
- オペレーティングシステムのセキュリティを更新。
2024 年 9 月 17 日
- [SPARK-49526][CONNECT] ArtifactManager でのWindowsスタイルのパスのサポート
2024 年 8 月 29 日
- [SPARK-49263][CONNECT] Spark Connect Python クライアント: ブール値データフレームリーダーのオプションを一貫して処理する
- [SPARK-49146][SS] 追加モードのストリーミングクエリでウォーターマークが見つからない問題に関連するアサーションエラーをエラーフレームワークに移動する
- [SPARK-49056][SQL] ErrorClassesJsonReader は null を正しく処理できません
2024 年 8 月 14 日
- [SPARK-48050][SS] クエリの開始時に論理プランをログに記録する
- [SPARK-48597][SQL] 論理プランのテキスト表現に isStreaming プロパティのマーカーを導入する
- [SPARK-49065][SQL] レガシフォーマッタ/パーサーのリベースは、JVM 以外のデフォルトタイムゾーンをサポートする必要があります
- [SPARK-48706][PYTHON] Python UDF が高階関数で内部エラーをスローしないようにする
2024 年 8 月 1 日
- このリリースには、Spark Java インターフェイスの ColumnVector クラスと ColumnarArray クラスのバグ修正が含まれています。この修正プログラムの前には、これらのクラスのいずれかのインスタンスに ArrayIndexOutOfBoundsException 値が含まれていると、null がスローされるか、正しくないデータが返される可能性がありました。
- SHOW CREATE TABLE ステートメントからの出力には、具体化されたビューまたはストリーミングテーブルで定義されている行フィルターまたは列マスクが含まれるようになりました。「SHOW CREATE TABLE」を参照してください。行フィルターと列マスクの詳細については、「行フィルターと列マスク」を参照してください。
- [SPARK-47202] [PYTHON] tzinfo で datetimes を壊す入力ミスを修正する
- [SPARK-48705][PYTHON] pyspark を使用して起動されるときに worker_main を明示的に使用する
- オペレーティングシステムのセキュリティを更新。
2024 年 7 月 11 日
- (動作変更) Delta テーブルソースに対してキャッシュされた DataFrame は、ソーステーブルが上書きされたら無効化されるようになりました。この変更は、Delta テーブルに対するすべての状態変更により、キャッシュされた結果が無効になったことを指します。 .checkpoint() を使用して DataFrame の有効期間全体にわたってテーブルの状態を永続化します。
- Snowflake JDBC ドライバーが、バージョン 3.16.1 に更新されました
- このリリースには、Databricks コンテナーサービスで実行中に [Spark UI] の [環境] タブが正しく表示されない問題の修正が含まれています。
- [SPARK-48292][CORE] 取り消し: [SPARK-39195][SQL] Spark OutputCommitCoordinator はコミットされたファイルとタスクの状態が整合していない場合にステージを中止する必要がある
- [SPARK-48273][SQL] PlanWithUnresolvedIdentifier の遅延書き換えを修正する
- [SPARK-48503][SQL] 等価でない列に対して group-by がある場合に誤って許可されていた無効なスカラーサブクエリを修正する
- [SPARK-48481][SQL][SS] OptimizeOneRowPlan をストリーミング Dataset に適用しない
- [SPARK-48475][PYTHON] PySpark で _get_jvm_function in を最適化する
- [SPARK-48100][SQL] スキーマで選択されていない入れ子構造フィールドのスキップに関する問題を修正する
- [SPARK-48445][SQL] コストが高い子要素を含む UDF をインライン化しない
- [SPARK-48383][SS] Kafka の startOffset オプションでパーティションのミスマッチに対してより良いエラーをスローする
- オペレーティングシステムのセキュリティを更新。
2024 年 6 月 17 日
- Photon TopK を使用したランクウィンドウの最適化で、構造体を含むパーティションが正しく処理されないバグを修正しました。
- [SPARK-48276][PYTHON][CONNECT] __repr__ の足りない SQLExpression メソッドを追加する
- [SPARK-48277] ErrorClassesJsonReader.getErrorMessage のエラーメッセージを改善する
- オペレーティングシステムのセキュリティを更新。
2024 年 5 月 21 日
- (動作変更) dbutils.widgets.getAll()ためにがサポートされるようになりました。
- [SPARK-48173][SQL] CheckAnalysis にクエリプラン全体が表示される
- [SPARK-48197][SQL] 無効なラムダ関数のアサートエラーを回避する
- [SPARK-47994][SQL] SQLServer で CASE WHEN 列フィルターがプッシュダウンされるバグを修正する
- [SPARK-48105][SS] 状態ストアのアンロードとスナップショット処理の間の競合状態を修正する
- オペレーティングシステムのセキュリティを更新。
2024 年 5 月 9 日
- [SPARK-48044][PYTHON][CONNECT] DataFrame.isStreaming をキャッシュする
- [SPARK-47956][SQL] 未解決の LCA リファレンスのサニティチェックを実行する
- [SPARK-47371][SQL] XML: CDATA で見つかった行タグを無視する
- [SPARK-47812][CONNECT] ForEachBatch ワーカーの SparkSession のシリアル化をサポートする
- [SPARK-47895][SQL] グループ分け、をすべてべき等にする
- [SPARK-47973][CORE] SparkContext.stop() と SparkContext.assertNotStopped() 内で呼び出し元をログに記録する
- オペレーティングシステムのセキュリティを更新。
2024 年 4 月 25 日
- [SPARK-47704][SQL] spark.sql.json.enablePartialResults が有効になっている場合に、JSON の解析が "java.lang.ClassCastException" で失敗する
- [SPARK-47828][CONNECT][PYTHON] 無効なプランで DataFrameWriterV2.overwrite が失敗する
- オペレーティングシステムのセキュリティを更新。
2024 年 4 月 11 日
- [SPARK-47309][SQL][XML] スキーマ推論の単体テストを追加
- [SPARK-46990][SQL] イベントハブによって出力される空の Avro ファイルが読み込まれる問題を修正します
- [SPARK-47638][PS][CONNECT] PS での列名の検証をスキップします
- [SPARK-47509][SQL] ラムダ関数と上位関数のサブクエリ式をブロックします
- [SPARK-38708][SQL] Hive メタストアクライアントを Hive 3.1 用の 3.1.3 にアップグレードします
- オペレーティングシステムのセキュリティを更新。
2024 年 4 月 1 日
- [SPARK-47322][PYTHON][CONNECT] withColumnsRenamed 列名の重複処理を withColumnRenamed と整合させる
- [SPARK-47385] オプション入力を使用してタプルエンコーダーを修正します
- [SPARK-47070] サブクエリの書き換え後の無効な集計を修正する
- [SPARK-47218] [SQL] XML: DROPMALFORMED モードで SchemaOfXml が失敗するように変更
- [SPARK-47305][SQL] プランにバッチとストリーミングの両方がある場合に LocalRelation の isStreaming フラグに正しくタグを付けるために PruneFilters を修正します
- [SPARK-47218][SQL] XML: XML トークナイザーのコメントされた行タグを無視する
- "[SPARK-46861][CORE] DAGScheduler でのデッドロックを回避する" を取り消す
- [SPARK-47300][SQL] quoteIfNeeded は数字で始まる識別子を引用符で囲む必要があります
- [SPARK-47368][SQL] ParquetRowConverter の inferTimestampNTZ 構成チェックを削除します
- オペレーティングシステムのセキュリティを更新。
2024 年 3 月 14 日
- [SPARK-47035][SS][CONNECT] クライアント側リスナーのプロトコル
- [SPARK-47121][CORE] StandaloneSchedulerBackend のシャットダウン時に RejectedExecutionExceptions を回避する
- [SPARK-47145][SQL] V2 戦略の行データソーススキャン exec にテーブル識別子を渡します。
- [SPARK-47176][SQL] ResolveAllExpressionsUpWithPruning ヘルパー関数がある
- [SPARK-47167][SQL] JDBC 匿名関係の具象クラスを追加する
- [SPARK-47129][CONNECT][SQL] ResolveRelations キャッシュ接続プランを適切に作成する
- [SPARK-47044][SQL] JDBC 外部データソースに対して実行されたクエリを追加して出力を説明する
- オペレーティングシステムのセキュリティを更新。
2024 年 2 月 29 日
- MERGE コマンドでローカルコレクションをソースとして使用すると、操作メトリック numSourceRows が正しい行数の 2 倍になる問題を修正しました。
- 定義された場所でスキーマを作成するには、ユーザーが ANY FILE に対する SELECT および MODIFY 権限を持っている必要があります。
- 自動ローダー、 read_files、 COPY INTO、Lakeflow Spark 宣言パイプライン、Databricks SQL を使用して XML ファイルを取り込むようになりました。 XML ファイルのサポートでは、スキーマの推論と進化、型の不一致によるデータの復旧、XSD を使用した XML の検証、from_xml、schema_of_xml、to_xml などの SQL 式のサポートを自動的に行うことができます。詳細については、「XML ファイルサポート」を参照してください。以前に外部 spark-xml パッケージを使用していた場合は、こちらから移行ガイダンスを参照してください。
- [SPARK-46954][SQL] XML: InputStreamReader を BufferedReader でラップ
- [SPARK-46630][SQL] XML: 書き込み時に XML 要素名を検証
- [SPARK-46248][SQL] XML: ignoreCorruptFiles および ignoreMissingFiles オプションをサポート
- [SPARK-46954][SQL] XML: スキーマインデックスの検索を最適化
- [SPARK-47059][SQL] ALTER COLUMN v1 コマンドのエラーコンテキストをアタッチする
- [SPARK-46993][SQL] セッション変数の定数の畳み込みを修正する
2024 年 2 月 8 日
- Unity カタログの具体化されたビューに対する変更データフィード (CDF) クエリはサポートされていません。また、Unity カタログの具体化されたビューで CDF クエリを実行しようとするとエラーが返されます。 Unity カタログストリーミングテーブルは、Databricks Runtime 14.1 以降の AUTO 以外の CDC テーブルに対する CDF クエリをサポートします。 Databricks Runtime 14.0 以前の Unity カタログのストリーミングテーブルでは、CDF クエリはサポートされていません。
- [SPARK-46930] Avro で Union 型フィールドのカスタムプレフィックスをサポートする機能を追加します。
- [SPARK-46822] jdbc で jdbc 型を Catalyst 型にキャストする場合は、spark.sql.legacy.charVarcharAsString に従います。
- [SPARK-46952] XML: 破損したレコードのサイズを制限します。
- [SPARK-46644] isZero を使用するように SQLMetric の add と merge を変更します。
- [SPARK-46861] DAGScheduler でのデッドロックを回避します。
- [SPARK-46794] LogicalRDD 制約からサブクエリを削除します。
- [SPARK-46941] SizeBasedWindowFunction が含まれている場合、top-k 計算用のウィンドウグループ制限ノードを挿入できません。
- [SPARK-46933] JDBCRDD を使用するコネクタにクエリ実行時間メトリックを追加します。
- オペレーティングシステムのセキュリティを更新。
2024 年 1 月 31 日
- [SPARK-46382] XML: ignoreSurroundingSpacesのドキュメントを更新。
- [SPARK-46382] XML: 要素間に点在する値をキャプチャ。
- [SPARK-46763] 重複する属性での ReplaceDeduplicateWithAggregate のアサーションエラーを修正します。
- “[SPARK-46769] タイムスタンプ関連のスキーマ推論を調整します“ を元に戻します。
- [SPARK-46677]dataframe["*"] の解像度を修正します。
- [SPARK-46382] XML: ignoreSurroundingSpaces の既定値を true にする。
- [SPARK-46633] 長さゼロのブロックを処理するように Avro リーダーを修正。
- [SPARK-45964] Catalyst パッケージの下の XML および JSON パッケージのプライベート SQL アクセサーを削除。
- [SPARK-46581] AccumulatorV2 の isZero に関するコメントを更新。
- [SPARK-45912] XSDToSchema API の機能強化: クラウドストレージアクセシビリティの HDFS API に変更。
- [SPARK-45182] チェックサムで確定された親の不確定ステージを再試行した後で、古いステージからのタスクの完了を無視します。
- [SPARK-46660] ReattachExecute 要求が SessionHolder の有効性を更新。
- [SPARK-46610] テーブル作成時、オプションでキーに対する値がない場合に例外をスローするようにします。
- [SPARK-46383]TaskInfo.accumulables() の有効期間を短縮してドライバーヒープの使用量を削減します。
- [SPARK-46769] タイムスタンプ関連のスキーマ推論を調整。
- [SPARK-46684] 引数を正しく渡すように CoGroup.applyInPandas/Arrow を修正。
- [SPARK-46676] dropDuplicatesWithinWatermark はプランの正規化でエラーになってはなりません。
- [SPARK-45962]treatEmptyValuesAsNulls を削除して、XML の代わりに nullValue オプションを使用。
- [SPARK-46541] 自己結合におけるあいまいな列参照を修正。
- [SPARK-46599] XML: 互換性チェックに TypeCoercion.findTightestCommonType を使用。
- オペレーティングシステムのセキュリティを更新。
2024 年 1 月 17 日
- ブロードキャスト結合の一部であるシャッフル中にメモリ不足エラーが発生した場合に、shuffle フラグを追加するように、Photon クエリによって返される Explain プランの causedBroadcastJoinBuildOOM=true ノードが更新されます。
- TLSv1.3 経由で通信するときの待機時間の増加を回避するために、このメンテナンスリリースには JDK バグ JDK-8293562 を修正するための JDK 8 インストールへのパッチが含まれています。
- [SPARK-46261]DataFrame.withColumnsRenamed では、dict/map の順序を維持する必要がある。
- [SPARK-46538]ALSModel.transform におけるあいまいな列参照の問題を修正します。
- [SPARK-46145] spark.catalog.listTables は、テーブルまたはビューが見つからないときに例外をスローしません。
- [SPARK-46484]resolveOperators ヘルパー関数でプラン ID が保持されるようにする。
- [SPARK-46394]spark.sql.legacy.keepCommandOutputSchema が true に設定されている場合に、特殊文字を持つスキーマでの spark.catalog.listDatabases() の問題を修正します。
- [SPARK-46609] PartitioningPreservingUnaryExecNode での指数関数的な爆発を回避します。
- [SPARK-46446] 相関 OFFSET を持つサブクエリを無効にして、正確性のバグを修正します。
- [SPARK-46152] XML: XML スキーマ推論で DecimalType のサポートを追加。
- [SPARK-46602] ビュー/テーブルが存在しない場合に、ビューの作成時に allowExisting を伝達します。
- [SPARK-45814] メモリリークを回避するため、ArrowConverters.createEmptyArrowBatch で close() を呼び出す。
- [SPARK-46058] privateKeyPassword に別のフラグを追加します。
- [SPARK-46132] RPC SSL の JKS キーのキーパスワードをサポートします。
- [SPARK-46600] SqlConf と SqlApiConf の間の共有コードを SqlApiConfHelper に移動します。
- [SPARK-46478] SPARK-43049 を元に戻して、文字列に oracle varchar(255) を使用します。
- [SPARK-46417] hive.getTable を呼び出し、throwException が false の場合は失敗しません。
- [SPARK-46153] XML: TimestampNTZType のサポートを追加。
- [SPARK-46056][BACKPORT] Parquet のベクトル化された読み取り NPE を byteArrayDecimalType の既定値で修正。
- [SPARK-46466] ベクトル化された Parquet リーダーは、timestamp ntz のリベースを行わない。
- [SPARK-46260]DataFrame.withColumnsRenamed は dict の順序を考慮する必要がある。
- [SPARK-46036] raise_error 関数から error-class を削除。
- [SPARK-46294] init とゼロ値のセマンティクスをクリーンアップ。
- [SPARK-46173] 日付解析中の trimAll 呼び出しをスキップします。
- [SPARK-46250] test_parity_listener をフレーク解除します。
- [SPARK-46587] XML: XSD の大きな整数変換を修正。
- [SPARK-46396] タイムスタンプ推論では例外を発生させてはならない。
- [SPARK-46241] 無限再帰に陥らないように、エラー処理ルーチンを修正します。
- [SPARK-46355] XML: 読み取り完了時に InputStreamReader を閉じる。
- [SPARK-46370] 列の既定値を変更した後にテーブルからクエリを実行するときのバグを修正します。
- [SPARK-46265] AddArtifact RPC のアサーションにより、接続クライアントは以前のクラスターと互換性がなくなる。
- [SPARK-46308] 再帰エラー処理を禁止する。
- [SPARK-46337]CTESubstitution で PLAN_ID_TAG を維持するようにする。
2023 年 12 月 14 日
- [SPARK-46141] spark.sql.legacy.ctePrecedencePolicy の既定値を CORRECTED に変更。
- [SPARK-45730] ReloadingX509TrustManagerSuite の不安定さを軽減。
- [SPARK-45852] ログ記録中の再帰エラーを適切に処理。
- [SPARK-45808] SQL 例外のエラー処理を改善。
- [SPARK-45920] 序数によるグループはべき等である必要があります。
- “[SPARK-45649]OffsetWindowFunctionFrame の準備フレームワークを統合“ を元に戻します。
- [SPARK-45733] 複数の再試行ポリシーをサポート。
- [SPARK-45509] Spark Connect の df 列参照動作を修正。
- [SPARK-45655] CollectMetrics の AggregateFunctions 内で非決定論的な式を許可します。
- [SPARK-45905] 10 進型の間で最も一般的でない型では、整数桁が最初に保持される必要がある。
- [SPARK-45136] Ammonite のサポートで ClosureCleaner を強化。
- [SPARK-46255] 複合型 -> 文字列変換をサポート。
- [SPARK-45859] ml.functions で UDF オブジェクトを遅延させる。
- [SPARK-46028]Column.__getitem__ が入力列を受け入れるようにする。
- [SPARK-45798] サーバー側のセッション ID をアサートする。
- [SPARK-45892] オプティマイザープランの検証をリファクタリングして、validateSchemaOutput と validateExprIdUniqueness を分離します。
- [SPARK-45844] XML の大文字と小文字の区別を実装。
- [SPARK-45770]DataFrameDropColumns にプラン Dataframe.drop を導入。
- [SPARK-44790] XML: Python、connect、SQL の to_xml 実装とバインディング。
- [SPARK-45851] scala クライアントで複数のポリシーをサポート。
- オペレーティングシステムのセキュリティを更新。
2023 年 11 月 29 日
- PyArrow RCE の脆弱性を修復するために、新しいパッケージ pyarrow-hotfix をインストールしました。
- JDBC または ODBC クライアントからの getColumns 操作でエスケープされたアンダースコアがワイルドカードとして誤って解釈される問題を修正しました。
- [SPARK-45730]ReloadingX509TrustManagerSuite の時間制約を改善しました。
- [SPARK-45852] Spark Connect のPython クライアントは、テキスト変換中に再帰エラーをキャッチするようになりました。
- [SPARK-45808] SQL 例外のエラー処理を改善。
- [SPARK-45920]GROUP BY 序数は序数を置き換えない。
- [SPARK-45649] を取り消します
- [SPARK-45733] 複数の再試行ポリシーのサポートを追加。
- [SPARK-45509] Spark Connect の df 列参照の動作を修正。
- [SPARK-45655]AggregateFunctions の CollectMetrics 内で非決定論的な式を許可。
- [SPARK-45905] 10 進型の間で最も一般的でない型では、整数桁が最初に保持される。
- [SPARK-45136] Ammonite のサポートで ClosureCleaner を強化。
- [SPARK-45859]ml.functions の UDF オブジェクトを遅延させました。
- [SPARK-46028]Column.__getitem__ が入力列を受け入れる。
- [SPARK-45798] サーバー側のセッション ID をアサートする。
- [SPARK-45892] オプティマイザープランの検証をリファクタリングして、validateSchemaOutput と validateExprIdUniqueness を分離します。
- [SPARK-45844] XML の大文字と小文字の区別を実装。
- [SPARK-45770]DataFrameDropColumns の Dataframe.drop を使用して列解決を修正。
- [SPARK-44790] Python、Spark Connect、SQL の実装とバインドto_xml を追加しました。
- [SPARK-45851] Scala クライアントで複数のポリシーのサポートを追加。
- オペレーティングシステムのセキュリティを更新。

Databricks Runtime 14.1

Databricks Runtime 14.1 (EoS) を参照してください。

2024 年 12 月 10 日
- オペレーティングシステムのセキュリティを更新。
2024 年 11 月 26 日
- オペレーティングシステムのセキュリティを更新。
2024 年 11 月 5 日
- [SPARK-49782][SQL]ResolveDataFrameDropColumns ルールは、子出力で UnresolvedAttribute を解決します
- [SPARK-49905] ステートフル演算子に専用の ShuffleOrigin を使用して、AQE からシャッフルが変更されないようにする
2024 年 10 月 22 日
- [SPARK-49782][SQL]ResolveDataFrameDropColumns ルールは、子出力で UnresolvedAttribute を解決します
- [SPARK-49905] ステートフル演算子に専用の ShuffleOrigin を使用して、AQE からシャッフルが変更されないようにする
2024 年 10 月 10 日
- [BACKPORT] [SPARK-49474][SS] FlatMapGroupsWithState ユーザー関数のエラークラスを分類するエラー
- [SPARK-49743][SQL]GetArrayStructFields を排除するときに OptimizeCsvJsonExpr でスキーマフィールドを変更しないでください
- オペレーティングシステムのセキュリティを更新。
2024 年 9 月 25 日
- [SPARK-49628][SQL]ConstantFolding では、評価前にステートフル式をコピーする必要があります
- [SPARK-43242][CORE] シャッフルの破損診断中に「予期しないタイプの BlockId」をスローする問題を修正する
- [SPARK-48719][SQL]'RegrS... の計算バグを修正しました。
- [SPARK-49000][SQL]RewriteDistinctAggregates を展開して、t が空のテーブルである "select count(distinct 1) from t" を修正しました
- [SPARK-46601] [CORE]handleStatusMessage のログエラーを修正する
- オペレーティングシステムのセキュリティを更新。
2024 年 9 月 17 日
- [SPARK-49526][CONNECT] ArtifactManager でのWindowsスタイルのパスのサポート
- オペレーティングシステムのセキュリティを更新。
2024 年 8 月 29 日
- [SPARK-49263][CONNECT] Spark Connect Python クライアント: ブール値データフレームリーダーのオプションを一貫して処理する
- [SPARK-49056][SQL] ErrorClassesJsonReader は null を正しく処理できません
2024 年 8 月 14 日
- [SPARK-48706][PYTHON] Python UDF が高階関数で内部エラーをスローしないようにする
- [SPARK-48597][SQL] 論理プランのテキスト表現に isStreaming プロパティのマーカーを導入する
- [SPARK-49065][SQL] レガシフォーマッタ/パーサーのリベースは、JVM 以外のデフォルトタイムゾーンをサポートする必要があります
- [SPARK-48050][SS] クエリの開始時に論理プランをログに記録する
2024 年 8 月 1 日
- このリリースには、Spark Java インターフェイスの ColumnVector クラスと ColumnarArray クラスのバグ修正が含まれています。この修正プログラムの前には、これらのクラスのいずれかのインスタンスに ArrayIndexOutOfBoundsException 値が含まれていると、null がスローされるか、正しくないデータが返される可能性がありました。
- SHOW CREATE TABLE ステートメントからの出力には、具体化されたビューまたはストリーミングテーブルで定義されている行フィルターまたは列マスクが含まれるようになりました。「SHOW CREATE TABLE」を参照してください。行フィルターと列マスクの詳細については、「行フィルターと列マスク」を参照してください。
- [SPARK-48705][PYTHON] pyspark を使用して起動されるときに worker_main を明示的に使用する
- [SPARK-47202] [PYTHON] tzinfo で datetimes を壊す入力ミスを修正する
- オペレーティングシステムのセキュリティを更新。
2024 年 7 月 11 日
- (動作変更) Delta テーブルソースに対してキャッシュされた DataFrame は、ソーステーブルが上書きされたら無効化されるようになりました。この変更は、Delta テーブルに対するすべての状態変更により、キャッシュされた結果が無効になったことを指します。 .checkpoint() を使用して DataFrame の有効期間全体にわたってテーブルの状態を永続化します。
- このリリースには、Databricks コンテナーサービスで実行中に [Spark UI] の [環境] タブが正しく表示されない問題の修正が含まれています。
- [SPARK-48475][PYTHON] PySpark で _get_jvm_function in を最適化する
- [SPARK-48445][SQL] コストが高い子要素を含む UDF をインライン化しない
- [SPARK-48481][SQL][SS] OptimizeOneRowPlan をストリーミング Dataset に適用しない
- [SPARK-48292][CORE] 取り消し: [SPARK-39195][SQL] Spark OutputCommitCoordinator はコミットされたファイルとタスクの状態が整合していない場合にステージを中止する必要がある
- [SPARK-48503][SQL] 等価でない列に対して group-by がある場合に誤って許可されていた無効なスカラーサブクエリを修正する
- [SPARK-48273][SQL] PlanWithUnresolvedIdentifier の遅延書き換えを修正する
- [SPARK-48100][SQL] スキーマで選択されていない入れ子構造フィールドのスキップに関する問題を修正する
- [SPARK-48383][SS] Kafka の startOffset オプションでパーティションのミスマッチに対してより良いエラーをスローする
- オペレーティングシステムのセキュリティを更新。
2024 年 6 月 17 日
- Photon TopK を使用したランクウィンドウの最適化で、構造体を含むパーティションが正しく処理されないバグを修正しました。
- [SPARK-48276][PYTHON][CONNECT] __repr__ の足りない SQLExpression メソッドを追加する
- [SPARK-48277] ErrorClassesJsonReader.getErrorMessage のエラーメッセージを改善する
- オペレーティングシステムのセキュリティを更新。
2024 年 5 月 21 日
- (動作変更) dbutils.widgets.getAll()ためにがサポートされるようになりました。
- [SPARK-47994][SQL] SQLServer で CASE WHEN 列フィルターがプッシュダウンされるバグを修正する
- [SPARK-48105][SS] 状態ストアのアンロードとスナップショット処理の間の競合状態を修正する
- [SPARK-48173][SQL] CheckAnalysis にクエリプラン全体が表示される
- オペレーティングシステムのセキュリティを更新。
2024 年 5 月 9 日
- [SPARK-47371][SQL] XML: CDATA で見つかった行タグを無視する
- [SPARK-47895][SQL] グループ分け、をすべてべき等にする
- [SPARK-47956][SQL] 未解決の LCA リファレンスのサニティチェックを実行する
- [SPARK-48044][PYTHON][CONNECT] DataFrame.isStreaming をキャッシュする
- [SPARK-47973][CORE] SparkContext.stop() と SparkContext.assertNotStopped() 内で呼び出し元をログに記録する
- オペレーティングシステムのセキュリティを更新。
2024 年 4 月 25 日
- [SPARK-47704][SQL] spark.sql.json.enablePartialResults が有効になっている場合に、JSON の解析が "java.lang.ClassCastException" で失敗する
- [SPARK-47828][CONNECT][PYTHON] 無効なプランで DataFrameWriterV2.overwrite が失敗する
- オペレーティングシステムのセキュリティを更新。
2024 年 4 月 11 日
- [SPARK-47638][PS][CONNECT] PS での列名の検証をスキップします
- [SPARK-38708][SQL] Hive メタストアクライアントを Hive 3.1 用の 3.1.3 にアップグレードします
- [SPARK-47309][SQL][XML] スキーマ推論の単体テストを追加
- [SPARK-47509][SQL] ラムダ関数と上位関数のサブクエリ式をブロックします
- [SPARK-46990][SQL] イベントハブによって出力される空の Avro ファイルが読み込まれる問題を修正します
- オペレーティングシステムのセキュリティを更新。
2024 年 4 月 1 日
- [SPARK-47305][SQL] プランにバッチとストリーミングの両方がある場合に LocalRelation の isStreaming フラグに正しくタグを付けるために PruneFilters を修正します
- [SPARK-47218][SQL] XML: XML トークナイザーのコメントされた行タグを無視する
- [SPARK-47300][SQL] quoteIfNeeded は数字で始まる識別子を引用符で囲む必要があります
- [SPARK-47368][SQL] ParquetRowConverter の inferTimestampNTZ 構成チェックを削除します
- [SPARK-47070] サブクエリの書き換え後の無効な集計を修正する
- [SPARK-47322][PYTHON][CONNECT] withColumnsRenamed 列名の重複処理を withColumnRenamed と整合させる
- [SPARK-47300] DecomposerSuite の修正
- [SPARK-47218] [SQL] XML: DROPMALFORMED モードで SchemaOfXml が失敗するように変更
- [SPARK-47385] オプション入力を使用してタプルエンコーダーを修正します
- オペレーティングシステムのセキュリティを更新。
2024 年 3 月 14 日
- [SPARK-47176][SQL] ResolveAllExpressionsUpWithPruning ヘルパー関数がある
- [SPARK-47145][SQL] V2 戦略の行データソーススキャン exec にテーブル識別子を渡します。
- [SPARK-47167][SQL] JDBC 匿名関係の具象クラスを追加する
- [SPARK-47129][CONNECT][SQL] ResolveRelations キャッシュ接続プランを適切に作成する
- "[SPARK-46861][CORE] DAGScheduler でのデッドロックを回避する" を取り消す
- [SPARK-47044][SQL] JDBC 外部データソースに対して実行されたクエリを追加して出力を説明する
- オペレーティングシステムのセキュリティを更新。
2024 年 2 月 29 日
- MERGE コマンドでローカルコレクションをソースとして使用すると、操作メトリック numSourceRows が正しい行数の 2 倍になる問題を修正しました。
- 定義された場所でスキーマを作成するには、ユーザーが ANY FILE に対する SELECT および MODIFY 権限を持っている必要があります。
- 自動ローダー、 read_files、 COPY INTO、Lakeflow Spark 宣言パイプライン、Databricks SQL を使用して XML ファイルを取り込むようになりました。 XML ファイルのサポートでは、スキーマの推論と進化、型の不一致によるデータの復旧、XSD を使用した XML の検証、from_xml、schema_of_xml、to_xml などの SQL 式のサポートを自動的に行うことができます。詳細については、「XML ファイルサポート」を参照してください。以前に外部 spark-xml パッケージを使用していた場合は、こちらから移行ガイダンスを参照してください。
- [SPARK-46248][SQL] XML: ignoreCorruptFiles および ignoreMissingFiles オプションをサポート
- [SPARK-47059][SQL] ALTER COLUMN v1 コマンドのエラーコンテキストをアタッチする
- [SPARK-46954][SQL] XML: InputStreamReader を BufferedReader でラップ
- [SPARK-46954][SQL] XML: スキーマインデックスの検索を最適化
- [SPARK-46630][SQL] XML: 書き込み時に XML 要素名を検証
- オペレーティングシステムのセキュリティを更新。
2024 年 2 月 8 日
- Unity カタログの具体化されたビューに対する変更データフィード (CDF) クエリはサポートされていません。また、Unity カタログの具体化されたビューで CDF クエリを実行しようとするとエラーが返されます。 Unity カタログストリーミングテーブルは、Databricks Runtime 14.1 以降の AUTO 以外の CDC テーブルに対する CDF クエリをサポートします。 Databricks Runtime 14.0 以前の Unity カタログのストリーミングテーブルでは、CDF クエリはサポートされていません。
- [SPARK-46952] XML: 破損したレコードのサイズを制限します。
- [SPARK-45182] チェックサムで確定された親の不確定ステージを再試行した後で、古いステージからのタスクの完了を無視します。
- [SPARK-46794] LogicalRDD 制約からサブクエリを削除します。
- [SPARK-46933] JDBCRDD を使用するコネクタにクエリ実行時間メトリックを追加します。
- [SPARK-46861] DAGScheduler でのデッドロックを回避します。
- [SPARK-45582] 出力モードストリーミング集計内でコミットを呼び出した後にストアインスタンスが使用されないようにします。
- [SPARK-46930] Avro で Union 型フィールドのカスタムプレフィックスをサポートする機能を追加します。
- [SPARK-46941] SizeBasedWindowFunction が含まれている場合、top-k 計算用のウィンドウグループ制限ノードを挿入できません。
- [SPARK-46396] タイムスタンプ推論では例外を発生させてはならない。
- [SPARK-46822] jdbc で jdbc 型を Catalyst 型にキャストする場合は、spark.sql.legacy.charVarcharAsString に従います。
- [SPARK-45957] 非実行可能コマンドで実行プランが生成されないようにする。
- オペレーティングシステムのセキュリティを更新。
2024 年 1 月 31 日
- [SPARK-46684] 引数を正しく渡すように CoGroup.applyInPandas/Arrow を修正。
- [SPARK-46763] 重複する属性での ReplaceDeduplicateWithAggregate のアサーションエラーを修正します。
- [SPARK-45498] フォローアップ: 古いステージ試行からのタスクの完了を無視。
- [SPARK-46382] XML: ignoreSurroundingSpacesのドキュメントを更新。
- [SPARK-46383]TaskInfo.accumulables() の有効期間を短縮してドライバーヒープの使用量を削減します。
- [SPARK-46382] XML: ignoreSurroundingSpaces の既定値を true にする。
- [SPARK-46677]dataframe["*"] の解像度を修正します。
- [SPARK-46676] dropDuplicatesWithinWatermark はプランの正規化でエラーになってはなりません。
- [SPARK-46633] 長さゼロのブロックを処理するように Avro リーダーを修正。
- [SPARK-45912] XSDToSchema API の機能強化: クラウドストレージアクセシビリティの HDFS API に変更。
- [SPARK-46599] XML: 互換性チェックに TypeCoercion.findTightestCommonType を使用。
- [SPARK-46382] XML: 要素間に点在する値をキャプチャ。
- [SPARK-46769] タイムスタンプ関連のスキーマ推論を調整。
- [SPARK-46610] テーブル作成時、オプションでキーに対する値がない場合に例外をスローするようにします。
- [SPARK-45964] Catalyst パッケージの下の XML および JSON パッケージのプライベート SQL アクセサーを削除。
- “[SPARK-46769] タイムスタンプ関連のスキーマ推論を調整します“ を元に戻します。
- [SPARK-45962]treatEmptyValuesAsNulls を削除して、XML の代わりに nullValue オプションを使用。
- [SPARK-46541] 自己結合におけるあいまいな列参照を修正。
- オペレーティングシステムのセキュリティを更新。
2024 年 1 月 17 日
- ブロードキャスト結合の一部であるシャッフル中にメモリ不足エラーが発生した場合に、shuffle フラグを追加するように、Photon クエリによって返される Explain プランの causedBroadcastJoinBuildOOM=true ノードが更新されます。
- TLSv1.3 経由で通信するときの待機時間の増加を回避するために、このメンテナンスリリースには JDK バグ JDK-8293562 を修正するための JDK 8 インストールへのパッチが含まれています。
- [SPARK-46538]ALSModel.transform におけるあいまいな列参照の問題を修正します。
- [SPARK-46417] hive.getTable を呼び出し、throwException が false の場合は失敗しません。
- [SPARK-46484]resolveOperators ヘルパー関数でプラン ID が保持されるようにする。
- [SPARK-46153] XML: TimestampNTZType のサポートを追加。
- [SPARK-46152] XML: XML スキーマ推論で DecimalType のサポートを追加。
- [SPARK-46145] spark.catalog.listTables は、テーブルまたはビューが見つからないときに例外をスローしません。
- [SPARK-46478] SPARK-43049 を元に戻して、文字列に oracle varchar(255) を使用します。
- [SPARK-46394]spark.sql.legacy.keepCommandOutputSchema が true に設定されている場合に、特殊文字を持つスキーマでの spark.catalog.listDatabases() の問題を修正します。
- [SPARK-46337]CTESubstitution で PLAN_ID_TAG を維持するようにする。
- [SPARK-46466] ベクトル化された Parquet リーダーは、timestamp ntz のリベースを行わない。
- [SPARK-46587] XML: XSD の大きな整数変換を修正。
- [SPARK-45814] メモリリークを回避するため、ArrowConverters.createEmptyArrowBatch で close() を呼び出す。
- [SPARK-46132] RPC SSL の JKS キーのキーパスワードをサポートします。
- [SPARK-46602] ビュー/テーブルが存在しない場合に、ビューの作成時に allowExisting を伝達します。
- [SPARK-46173] 日付解析中の trimAll 呼び出しをスキップします。
- [SPARK-46355] XML: 読み取り完了時に InputStreamReader を閉じる。
- [SPARK-46600] SqlConf と SqlApiConf の間の共有コードを SqlApiConfHelper に移動します。
- [SPARK-46261]DataFrame.withColumnsRenamed では、dict/map の順序を維持する必要がある。
- [SPARK-46056] Parquet のベクトル化された読み取り NPE を byteArrayDecimalType の既定値で修正します。
- [SPARK-46260]DataFrame.withColumnsRenamed は dict の順序を考慮する必要がある。
- [SPARK-46250] test_parity_listener をフレーク解除します。
- [SPARK-46370] 列の既定値を変更した後にテーブルからクエリを実行するときのバグを修正します。
- [SPARK-46609] PartitioningPreservingUnaryExecNode での指数関数的な爆発を回避します。
- [SPARK-46058] privateKeyPassword に別のフラグを追加します。
2023 年 12 月 14 日
- JDBC または ODBC クライアントからの getColumns 操作でエスケープされたアンダースコアが誤って処理され、ワイルドカードとして解釈される問題を修正しました。
- [SPARK-45509] Spark Connect の df 列参照動作を修正。
- [SPARK-45844] XML の大文字と小文字の区別を実装。
- [SPARK-46141] spark.sql.legacy.ctePrecedencePolicy の既定値を CORRECTED に変更。
- [SPARK-46028]Column.__getitem__ が入力列を受け入れるようにする。
- [SPARK-46255] 複合型 -> 文字列変換をサポート。
- [SPARK-45655] CollectMetrics の AggregateFunctions 内で非決定論的な式を許可します。
- [SPARK-45433] timestamp が、指定された timestampFormat と一致しない場合の CSV/JSON スキーマ推論を修正します。
- [SPARK-45316] 新しいパラメーター ignoreCorruptFiles/ignoreMissingFiles を HadoopRDD と NewHadoopRDD に追加。
- [SPARK-45852] ログ記録中の再帰エラーを適切に処理。
- [SPARK-45920] 序数によるグループはべき等である必要があります。
- オペレーティングシステムのセキュリティを更新。
2023 年 11 月 29 日
- PyArrow RCE の脆弱性を修復するために、新しいパッケージ pyarrow-hotfix をインストールしました。
- JDBC または ODBC クライアントからの getColumns 操作でエスケープされたアンダースコアがワイルドカードとして誤って解釈される問題を修正しました。
- 自動ローダーまたはストリーミングテーブルを使用して CSV データを取り込む場合、大きな CSV ファイルは分割可能になり、スキーマの推論とデータ処理の両方で並列に処理できます。
- [SPARK-45892] オプティマイザープランの検証をリファクタリングして、validateSchemaOutput と validateExprIdUniqueness を分離します。
- [SPARK-45620] Python の UDF に関連する API が camelCase を使用するようになりました。
- [SPARK-44790] Python、Spark Connect、SQL の実装とバインドto_xml を追加しました。
- [SPARK-45770]DataFrameDropColumns の Dataframe.drop を使用して列解決を修正。
- [SPARK-45859]ml.functions の UDF オブジェクトを遅延させました。
- [SPARK-45730]ReloadingX509TrustManagerSuite の時間制約を改善しました。
- [SPARK-44784] SBT テストを密閉。
- オペレーティングシステムのセキュリティを更新。
2023 年 11 月 10 日
- [SPARK-45545]SparkTransportConf は作成時に SSLOptions を継承します。
- [SPARK-45250] 動的割り当てが無効になっている場合の、Yarn クラスターのステージレベルのタスクリソースプロファイルのサポートを追加。
- [SPARK-44753] PySpark SQL の XML DataFrame リーダーとライターを追加。
- [SPARK-45396]PySpark.ml.connect モジュールのドキュメントエントリを追加。
- [SPARK-45584]TakeOrderedAndProjectExec のサブクエリの実行エラーを修正しました。
- [SPARK-45541] SSLFactory を追加。
- [SPARK-45577] 名前付き引数からフォール度された値を渡すために UserDefinedPythonTableFunctionAnalyzeRunner を修正。
- [SPARK-45562] 'rowTag' を必須オプションにしました。
- [SPARK-45427] RPC SSL 設定を SSLOptions と SparkTransportConf に追加しました。
- [SPARK-43380] Avro 読み取りの速度低下を修正。
- [SPARK-45430]FramelessOffsetWindowFunction は、IGNORE NULLS と offset > rowCount の場合に失敗しなくなりました。
- [SPARK-45429] SSL RPC 通信用のヘルパークラスを追加しました。
- [SPARK-45386] 誤って StorageLevel.NONE から 0 が返される問題を修正。
- [SPARK-44219] 最適化書き換えに関する規則ごとの検証チェックを追加。
- [SPARK-45543] 他のウィンドウ関数にランクに似た関数と同じウィンドウフレームがない場合に、 InferWindowGroupLimit によって問題が発生する問題を修正しました。
- オペレーティングシステムのセキュリティを更新。
2023 年 9 月 27 日
- [SPARK-44823]black を 23.9.1 に更新し、誤ったチェックを修正。
- [SPARK-45339] PySpark で、再試行したエラーがログに記録されるようになる。
- “[SPARK-42946] 変数置換で入れ子になった機密データを編集“ を元に戻します。
- [SPARK-44551] OSS と同期するようにコメントを編集しました。
- [SPARK-45360] Spark セッションビルダーでは、SPARK_REMOTE からの初期化がサポートされる。
- [SPARK-45279]plan_id をすべての論理プランにアタッチ。
- [SPARK-45425]TINYINT を ShortType の MsSqlServerDialect にマッピング。
- [SPARK-45419]rocksdb sst ファイル ID の再利用を回避するためにより大きいバージョンのファイルバージョンマップエントリを削除。
- [SPARK-45488]rowTag 要素の値に対するサポートを追加。
- [SPARK-42205]Accumulables イベントログの Task/Stage 開始イベントの JsonProtocol のログ記録を削除。
- [SPARK-45426]ReloadingX509TrustManager のサポートを追加しました。
- [SPARK-45256]DurationWriter は、初期容量より多い値を書き込むと失敗押します。
- [SPARK-43380] パフォーマンス低下を引き起こすことなく、Avro データ型変換の問題を修正。
- [SPARK-45182] ステージ出力が不確定のときにすべてのステージタスクを再試行できるように、シャッフルマップステージのロールバックのサポートを追加。
- [SPARK-45399]newOption を使用する XML オプションを追加。
- オペレーティングシステムのセキュリティを更新。

Databricks Runtime 14.0 (データブリックスランタイム 14.0)

「Databricks Runtime 14.0 (EoS)」を参照してください。

2024 年 2 月 8 日
- [SPARK-46396] タイムスタンプ推論では例外を発生させてはならない。
- [SPARK-46794] LogicalRDD 制約からサブクエリを削除します。
- [SPARK-45182] チェックサムで確定された親の不確定ステージを再試行した後で、古いステージからのタスクの完了を無視します。
- [SPARK-46933] JDBCRDD を使用するコネクタにクエリ実行時間メトリックを追加します。
- [SPARK-45957] 非実行可能コマンドで実行プランが生成されないようにする。
- [SPARK-46861] DAGScheduler でのデッドロックを回避します。
- [SPARK-46930] Avro で Union 型フィールドのカスタムプレフィックスをサポートする機能を追加します。
- [SPARK-46941] SizeBasedWindowFunction が含まれている場合、top-k 計算用のウィンドウグループ制限ノードを挿入できません。
- [SPARK-45582] 出力モードストリーミング集計内でコミットを呼び出した後にストアインスタンスが使用されないようにします。
- オペレーティングシステムのセキュリティを更新。
2024 年 1 月 31 日
- [SPARK-46541] 自己結合におけるあいまいな列参照を修正。
- [SPARK-46676] dropDuplicatesWithinWatermark はプランの正規化でエラーになってはなりません。
- [SPARK-46769] タイムスタンプ関連のスキーマ推論を調整。
- [SPARK-45498] フォローアップ: 古いステージ試行からのタスクの完了を無視。
- “[SPARK-46769] タイムスタンプ関連のスキーマ推論を調整します“ を元に戻します。
- [SPARK-46383]TaskInfo.accumulables() の有効期間を短縮してドライバーヒープの使用量を削減します。
- [SPARK-46633] 長さゼロのブロックを処理するように Avro リーダーを修正。
- [SPARK-46677]dataframe["*"] の解像度を修正します。
- [SPARK-46684] 引数を正しく渡すように CoGroup.applyInPandas/Arrow を修正。
- [SPARK-46763] 重複する属性での ReplaceDeduplicateWithAggregate のアサーションエラーを修正します。
- [SPARK-46610] テーブル作成時、オプションでキーに対する値がない場合に例外をスローするようにします。
- オペレーティングシステムのセキュリティを更新。
2024 年 1 月 17 日
- ブロードキャスト結合の一部であるシャッフル中にメモリ不足エラーが発生した場合に、shuffle フラグを追加するように、Photon クエリによって返される Explain プランの causedBroadcastJoinBuildOOM=true ノードが更新されます。
- TLSv1.3 経由で通信するときの待機時間の増加を回避するために、このメンテナンスリリースには JDK バグ JDK-8293562 を修正するための JDK 8 インストールへのパッチが含まれています。
- [SPARK-46394]spark.sql.legacy.keepCommandOutputSchema が true に設定されている場合に、特殊文字を持つスキーマでの spark.catalog.listDatabases() の問題を修正します。
- [SPARK-46250] test_parity_listener をフレーク解除します。
- [SPARK-45814] メモリリークを回避するため、ArrowConverters.createEmptyArrowBatch で close() を呼び出す。
- [SPARK-46173] 日付解析中の trimAll 呼び出しをスキップします。
- [SPARK-46484]resolveOperators ヘルパー関数でプラン ID が保持されるようにする。
- [SPARK-46466] ベクトル化された Parquet リーダーは、timestamp ntz のリベースを行わない。
- [SPARK-46056] Parquet のベクトル化された読み取り NPE を byteArrayDecimalType の既定値で修正します。
- [SPARK-46058] privateKeyPassword に別のフラグを追加します。
- [SPARK-46478] SPARK-43049 を元に戻して、文字列に oracle varchar(255) を使用します。
- [SPARK-46132] RPC SSL の JKS キーのキーパスワードをサポートします。
- [SPARK-46417] hive.getTable を呼び出し、throwException が false の場合は失敗しません。
- [SPARK-46261]DataFrame.withColumnsRenamed では、dict/map の順序を維持する必要がある。
- [SPARK-46370] 列の既定値を変更した後にテーブルからクエリを実行するときのバグを修正します。
- [SPARK-46609] PartitioningPreservingUnaryExecNode での指数関数的な爆発を回避します。
- [SPARK-46600] SqlConf と SqlApiConf の間の共有コードを SqlApiConfHelper に移動します。
- [SPARK-46538]ALSModel.transform におけるあいまいな列参照の問題を修正します。
- [SPARK-46337]CTESubstitution で PLAN_ID_TAG を維持するようにする。
- [SPARK-46602] ビュー/テーブルが存在しない場合に、ビューの作成時に allowExisting を伝達します。
- [SPARK-46260]DataFrame.withColumnsRenamed は dict の順序を考慮する必要がある。
- [SPARK-46145] spark.catalog.listTables は、テーブルまたはビューが見つからないときに例外をスローしません。
2023 年 12 月 14 日
- JDBC または ODBC クライアントからの getColumns 操作でエスケープされたアンダースコアが誤って処理され、ワイルドカードとして解釈される問題を修正しました。
- [SPARK-46255] 複合型 -> 文字列変換をサポート。
- [SPARK-46028]Column.__getitem__ が入力列を受け入れるようにする。
- [SPARK-45920] 序数によるグループはべき等である必要があります。
- [SPARK-45433] timestamp が、指定された timestampFormat と一致しない場合の CSV/JSON スキーマ推論を修正します。
- [SPARK-45509] Spark Connect の df 列参照動作を修正。
- オペレーティングシステムのセキュリティを更新。
2023 年 11 月 29 日
- PyArrow RCE の脆弱性を修復するために、新しいパッケージ pyarrow-hotfix をインストールしました。
- JDBC または ODBC クライアントからの getColumns 操作でエスケープされたアンダースコアがワイルドカードとして誤って解釈される問題を修正しました。
- 自動ローダーまたはストリーミングテーブルを使用して CSV データを取り込む場合、大きな CSV ファイルは分割可能になり、スキーマの推論とデータ処理の両方で並列に処理できます。
- spark-snowflake コネクタは 2.12.0 にアップグレードされます。
- [SPARK-45859]ml.functions の UDF オブジェクトを遅延させました。
- [SPARK-45592] を取り消します。
- [SPARK-45892] オプティマイザープランの検証をリファクタリングして、validateSchemaOutput と validateExprIdUniqueness を分離します。
- [SPARK-45592] AQE と InMemoryTableScanExec の正確性の問題を修正。
- [SPARK-45620] Python の UDF に関連する API が camelCase を使用するようになりました。
- [SPARK-44784] SBT テストを密閉。
- [SPARK-45770]DataFrameDropColumns の Dataframe.drop を使用して列解決を修正。
- [SPARK-45544] SSL サポートを TransportContext に統合しました。
- [SPARK-45730]ReloadingX509TrustManagerSuite の時間制約を改善しました。
- オペレーティングシステムのセキュリティを更新。
2023 年 11 月 10 日
- Unity カタログストリーミングテーブルと具体化されたビューに対するデータフィードクエリを変更し、エラーメッセージを表示しました。
- [SPARK-45545]SparkTransportConf は作成時に SSLOptions を継承します。
- [SPARK-45584]TakeOrderedAndProjectExec のサブクエリの実行エラーを修正しました。
- [SPARK-45427] RPC SSL 設定を SSLOptions と SparkTransportConf に追加しました。
- [SPARK-45541]SSLFactory を追加しました。
- [SPARK-45430]FramelessOffsetWindowFunction は、IGNORE NULLS と offset > rowCount の場合に失敗しなくなりました。
- [SPARK-45429] SSL RPC 通信用のヘルパークラスを追加しました。
- [SPARK-44219] 最適化の書き換えに関する規則ごとの検証を追加しました。
- [SPARK-45543] 他のウィンドウ関数がランクに似た関数と同じウィンドウフレームを持っていない場合に、 InferWindowGroupLimit がエラーを生成する問題を修正しました。
- オペレーティングシステムのセキュリティを更新。
2023 年 10 月 23 日
- [SPARK-45426]ReloadingX509TrustManager のサポートを追加しました。
- [SPARK-45396]PySpark.ml.connect モジュールのドキュメントエントリを追加し、Evaluator の __all__ に ml.connect を追加。
- [SPARK-45256] 初期容量よりも多い値を書き込むと DurationWriter が失敗する問題を修正しました。
- [SPARK-45279]plan_id をすべての論理プランにアタッチ。
- [SPARK-45250] 動的割り当てが無効になっている場合の、Yarn クラスターのステージレベルのタスクリソースプロファイルのサポートを追加。
- [SPARK-45182] ステージ出力が不確定のときにすべてのステージタスクを再試行できるように、シャッフルマップステージのロールバックのサポートを追加。
- [SPARK-45419] より新しいバージョンのファイルバージョンマップエントリを削除して、異なる rocksdb sst インスタンスで rocksdb ファイルが再利用されないようにします。
- [SPARK-45386] 誤って StorageLevel.NONE から 0 が返される問題を修正。
- オペレーティングシステムのセキュリティを更新。
2023 年 10 月 13 日
- Snowflake-jdbc 依存関係が 3.13.29 から 3.13.33 にアップグレードされました。
- array_insert 関数では、負のインデックスは以前は 0 ベースでしたが、現在は、正と負のインデックスは 1 ベースです。インデックス 1 の入力配列の最後に新しい要素を挿入するようになりました。以前の動作を復元するには、spark.sql.legacy.negativeIndexInArrayInsert を true に設定します。
- 自動ローダーを使用した CSV スキーマ推論で ignoreCorruptFiles が有効になっている場合、Azure Databricksは破損したファイルを無視しなくなりました。
- [SPARK-45227]CoarseGrainedExecutorBackend に関する軽微なスレッド安全性の問題を修正。
- [SPARK-44658]ShuffleStatus.getMapStatus は、None ではなく、Some(null) を返す必要があります。
- [SPARK-44910]Encoders.bean では、ジェネリック型引数を持つスーパークラスはサポートされません。
- [SPARK-45346] Parquet スキーマ推論で、スキーマをマージする際に、大文字と小文字が区別されるフラグがラグが考慮される。
- [SPARK-42946] をリバートします。
- [SPARK-42205] タスクまたはステージ開始イベントの Accumulables ログを削除するように、JSON プロトコルを更新しました。
- [SPARK-45360] Spark セッションビルダーでは、SPARK_REMOTE からの初期化がサポートされる。
- [SPARK-45316] 新しいパラメーター ignoreCorruptFiles/ignoreMissingFiles を HadoopRDD と NewHadoopRDD に追加。
- [SPARK-44909] torch ディストリビューターログストリーミングサーバーを使用できないときに、その実行をスキップ。
- [SPARK-45084]StateOperatorProgress では、正確なシャッフルパーティション番号が使用されるようになりました。
- [SPARK-45371] Spark Connect Scala クライアントのシェーディング問題を修正。
- [SPARK-45178] ラッパーを使用するのではなく、サポートされていないソースを使って Trigger.AvailableNow の単一バッチを実行するようにフォールバックします。
- [SPARK-44840] 負のインデックスを array_insert() 1 ベースにする。
- [SPARK-44551] OSS と同期するようにコメントを編集しました。
- [SPARK-45078] 要素型が派生コンポーネント型と等しくない場合、ArrayInsert 関数では明示的なキャストが行われるようになる。
- [SPARK-45339] PySpark で再試行エラーがログに記録されるようになる。
- [SPARK-45057]keepReadLock が False の場合、読み取りロックを取得しない。
- [SPARK-44908] クロス検証コントロールの foldCol パラメーター機能を修正。
- オペレーティングシステムのセキュリティを更新。

Databricks Runtime 13.1

「Databricks Runtime 13.1 (EoS)」を参照してください。

2023 年 11 月 29 日
- JDBC または ODBC クライアントからの getColumns 操作でエスケープされたアンダースコアがワイルドカードとして誤って解釈される問題を修正しました。
- [SPARK-44846]RemoveRedundantAggregates の後の複雑なグループ化式を削除しました。
- [SPARK-43802] unhex 式と unbase64 式の codegen が失敗する問題を修正。
- [SPARK-43718]USING 結合でのキーの NULL 値の許容を修正しました。
- オペレーティングシステムのセキュリティを更新。
2023 年 11 月 14 日
- Delta Lake ストリーミングクエリのパーティションフィルターは、使用率を向上させるためにレート制限の前にプッシュダウンされます。
- Unity カタログストリーミングテーブルと具体化されたビューに対するデータフィードクエリを変更し、エラーメッセージを表示しました。
- [SPARK-45584]TakeOrderedAndProjectExec のサブクエリの実行エラーを修正しました。
- [SPARK-45430]FramelessOffsetWindowFunction は、IGNORE NULLS と offset > rowCount の場合に失敗しなくなりました。
- [SPARK-45543] 他のウィンドウ関数にランクに似た関数と同じウィンドウフレームがない場合に、 InferWindowGroupLimit によって問題が発生する問題を修正しました。
- オペレーティングシステムのセキュリティを更新。
2023 年 10 月 24 日
- [SPARK-43799] Pyspark Protobuf API に記述子バイナリオプションを追加しました。
- [SPARK-42946] をリバートします。
- [SPARK-45346] Parquet スキーマ推論では、スキーマをマージする際に、大文字と小文字を区別するフラグが考慮されるようになりました。
- オペレーティングシステムのセキュリティを更新。
2023 年 10 月 13 日
- Snowflake-jdbc 依存関係が 3.13.29 から 3.13.33 にアップグレードされました。
- 自動ローダーを使用した CSV スキーマ推論中に ignoreCorruptFiles が有効になっている場合、破損したファイルが無視されなくなりました。
- [SPARK-44658]ShuffleStatus.getMapStatus は、None ではなく Some(null) を返します。
- [SPARK-45178] ラッパーを使用するのではなく、サポートされていないソースを使って Trigger.AvailableNow の単一バッチを実行するようにフォールバックします。
- [SPARK-42205] タスクまたはステージ開始イベントの Accumulables ログを削除するように、JSON プロトコルを更新しました。
- オペレーティングシステムのセキュリティを更新。
2023 年 9 月 12 日
- [SPARK-44718]ColumnVector メモリモード構成の既定値を OffHeapMemoryMode 構成値に一致させます。
- SPARK-44878 キャッシュ完了時に挿入例外が発生しないように、RocksDB 書き込みマネージャーの厳密な制限を無効にする。
- その他の修正。
2023 年 8 月 30 日
- [SPARK-44871] 'percentile_disc 動作を修正。
- [SPARK-44714] クエリに関する LCA 解決の制限を緩和します。
- [SPARK-44245]PySpark.sql.dataframe sample() ドキュメントテストは説明のみになった。
- [SPARK-44818]taskThread の初期化前に発行された保留中のタスク割り込みの競合を修正しました。
- オペレーティングシステムのセキュリティを更新。
2023 年 8 月 15 日
- [SPARK-44485]TreeNode.generateTreeString を最適化しました。
- [SPARK-44643] 行が空の場合の Row.__repr__ を修正。
- [SPARK-44504] メンテナンスタスクで、停止エラー時に読み込まれたプロバイダーがクリーンアップされるようになった。
- [SPARK-44479] 空の構造体型からの protobuf 変換を修正。
- [SPARK-44464] 最初の列値として applyInPandasWithStatePythonRunner を持つ出力行に対する Null を修正しました。
- その他の修正。
2023 年 7 月 27 日
- 他の外部またはマネージドストレージの場所と競合するストレージの場所のパスを呼び出すと、dbutils.fs.ls() が INVALID_PARAMETER_VALUE.LOCATION_OVERLAP を返す問題を修正しました。
- [SPARK-44199]CacheManager は、fileIndex を不必要に更新しなくなりました。
- [SPARK-44448]DenseRankLimitIterator と InferWindowGroupLimit からの誤ったバグ結果を修正。
- オペレーティングシステムのセキュリティを更新。
2023 年 7 月 24 日
- [SPARK-42323]を戻します。
- [SPARK-41848]TaskResourceProfile でのタスクオーバースケジュールの問題を修正。
- [SPARK-44136]StateManager のドライバーではなく Executor で FlatMapGroupsWithStateExec が具体化される問題を修正しました。
- [SPARK-44337]Any.getDefaultInstance に設定されたフィールドで解析エラーが発生する問題を修正しました。
- オペレーティングシステムのセキュリティを更新。
2023 年 6 月 27 日
- オペレーティングシステムのセキュリティを更新。
2023 年 6 月 15 日
- approx_count_distinct が Photon に対応しました。
- failOnUnknownFields モードの JSPN パーサーは、DROPMALFORMED モードでレコードを削除し、FAILFAST モードで直接失敗します。
- snowflake-jdbc ライブラリはセキュリティの問題に対処するために 3.13.29 にアップグレードされます。
- PubSubRecord 属性フィールドは、より明確なシリアル化と逆シリアル化のために、Scala マップからの文字列の代わりに JSON として格納されます。
- EXPLAIN EXTENDED コマンドにより、クエリの結果キャッシュの適格性が返されるようになります。
- SHALLOW CLONE Apache Iceberg と Parquet を使用して、増分更新のパフォーマンスを向上させます。
- [SPARK-43032] Python SQM のバグ修正。
- [SPARK-43404] ID の不一致エラーを回避するために、同じバージョンの RocksDB 状態ストアの sst ファイルの再利用をスキップします。
- [SPARK-43340] イベントログにスタックトレースフィールドが見つからない問題を処理。
- [SPARK-43527] PySpark の catalog.listCatalogs を修正しました。
- [SPARK-43541] 式と不足している列の解決時にすべてのProject タグを伝達します。
- [SPARK-43300]NonFateSharingCache Guava Cache のラッパー。
- [SPARK-43378]deserializeFromChunkedBuffer 内のストリームオブジェクトを適切に閉じます。
- [SPARK-42852]NamedLambdaVariable の EquivalentExpressions 関連変更を元に戻す。
- [SPARK-43779]ParseToDate により、メインスレッドに EvalMode が読み込まれるようになりました。
- [SPARK-43413]IN サブクエリの ListQuery null 許容を修正。
- [SPARK-43889] エラーが発生しやすい列名をフィルター処理するするために __dir__() の列名のチェックを追加。
- [SPARK-43043]MapOutputTracker.updateMapOutput のパフォーマンスを改善。
- [SPARK-43522] 配列のインデックスを含む構造体列名の作成の問題を修正しました。
- [SPARK-43457] OS、Python、Spark のバージョンを持つ Augument ユーザーエージェント。
- [SPARK-43286] ランダムな IV を生成するように aes_encrypt の CBC モードを更新しました。
- [SPARK-42851]EquivalentExpressions.addExpr() で supportedExpression() を保護。
- [SPARK-43183] を元に戻します。
- オペレーティングシステムのセキュリティを更新。

Databricks Runtime 12.2 LTS

Databricks Runtime 12.2 LTS (EoS) を参照してください。

2026 年 2 月 26 日
- オペレーティングシステムのセキュリティを更新。
2026 年 2 月 19 日
- オペレーティングシステムのセキュリティを更新。

2026 年 1 月 27 日
- オペレーティングシステムのセキュリティを更新。

2026 年 1 月 9 日
- オペレーティングシステムのセキュリティを更新。

2025 年 12 月 9 日
- オペレーティングシステムのセキュリティを更新。

2025 年 11 月 18 日
- オペレーティングシステムのセキュリティを更新。

2025 年 11 月 4 日
- 更新された R ライブラリ:
  - 10.0.0 から 21.0.0 への矢印
- オペレーティングシステムのセキュリティを更新。

2025 年 10 月 21 日
- Pythonを 2.7.18 から 2.7.18.1 に更新しました
- オペレーティングシステムのセキュリティを更新。

2025 年 10 月 7 日
- オペレーティングシステムのセキュリティを更新。

2025 年 9 月 24 日
- オペレーティングシステムのセキュリティを更新。

2025 年 9 月 9 日
- オペレーティングシステムのセキュリティを更新。

2025 年 8 月 26 日
- オペレーティングシステムのセキュリティを更新。

2025 年 8 月 14 日
- オペレーティングシステムのセキュリティを更新。

2025 年 7 月 29 日
- オペレーティングシステムのセキュリティを更新。

2025 年 7 月 15 日
- オペレーティングシステムのセキュリティを更新。

2025 年 7 月 1 日
- オペレーティングシステムのセキュリティを更新。

2025 年 6 月 17 日
- オペレーティングシステムのセキュリティを更新。

2025 年 6 月 3 日
- Python ライブラリの更新:
  - certifi を 2019.11.28、2021.10.8 から 2021.10.8 へ更新
  - chardet を 3.0.4、4.0.0 から 4.0.0 へ更新
  - idna のバージョンが 2.8、および 3.3 から 3.3 に移行
  - 2.22.0、2.27.1 から 2.27.1 までのリクエスト
  - six を 1.14.0、1.16.0 から 1.16.0 へ更新
  - urllib3 を 1.25.8、1.26.9 から 1.26.9 へ更新
  - pip 21.2.4 を追加しました
  - setuptools 61.2.0 を追加しました
  - tomli 1.2.2 を追加しました
  - wcwidth 0.2.5 を追加しました
  - ホイール 0.37.0 を追加しました
  - ディストリビューション 1.4.0 を削除しました
  - distro-info 0.23+ubuntu1.1 を削除しました
  - python-apt 2.0.1+ubuntu0.20.4.1 を削除しました
- Java ライブラリの更新:
  - software.amazon.cryptools.AmazonCorrettoCryptoProvider を 1.6.1-linux-x86_64 から 1.6.1 に更新
- オペレーティングシステムのセキュリティを更新。

2025 年 5 月 20 日
- [SPARK-42655][SQL] あいまいな列参照エラーが正しくありません
- オペレーティングシステムのセキュリティを更新。

2025 年 4 月 22 日
- [動作の変更]バキューム操作では、他の操作と同様にライタープロトコルチェックが実行されるようになり、互換性のない古い Databricks Runtime バージョンから実行すると、新しい機能を持つテーブルで予期しないクリーンアップが防止されるようになりました。
- オペレーティングシステムのセキュリティを更新。

2025 年 4 月 9 日
- オペレーティングシステムのセキュリティを更新。

2025 年 3 月 11 日
- オペレーティングシステムのセキュリティを更新。
2024 年 12 月 10 日
- オペレーティングシステムのセキュリティを更新。
2024 年 11 月 26 日
- 各種のバグ修正。
2024 年 10 月 10 日
- [SPARK-49743][SQL]GetArrayStructFields を排除するときに OptimizeCsvJsonExpr でスキーマフィールドを変更しないでください
2024 年 9 月 25 日
- [SPARK-49000][SQL] RewriteDistinctAggregates を展開して t が空のテーブルである "select count(distinct 1) from t" を修正
- [SPARK-46601] [CORE]handleStatusMessage のログエラーを修正する
- 各種のバグ修正。
2024 年 9 月 17 日
- オペレーティングシステムのセキュリティを更新。
2024 年 8 月 29 日
- 各種のバグ修正。
2024 年 8 月 14 日
- [SPARK-48941][SPARK-48970] バックポート ML ライター/リーダーの修正
- [SPARK-49065][SQL] レガシフォーマッタ/パーサーのリベースは、JVM 以外のデフォルトタイムゾーンをサポートする必要があります
- [SPARK-49056][SQL] ErrorClassesJsonReader は null を正しく処理できません
- [SPARK-48597][SQL] 論理プランのテキスト表現に isStreaming プロパティのマーカーを導入する
- [SPARK-48463][ML] 入れ子になった入力列をサポートする StringIndexer を作成する
- オペレーティングシステムのセキュリティを更新。
2024 年 8 月 1 日
- [SPARK-48896][SPARK-48909][SPARK-48883] バックポート Spark ML ライターの修正
2024 年 8 月 1 日
- 必要なセキュリティパッチを適用するために、Databricks Runtime 12.2 LTS のPython バージョンが 3.9.5 から 3.9.19 にアップグレードされます。
2024 年 7 月 11 日
- (動作変更) Delta テーブルソースに対してキャッシュされた DataFrame は、ソーステーブルが上書きされたら無効化されるようになりました。この変更は、Delta テーブルに対するすべての状態変更により、キャッシュされた結果が無効になったことを指します。 .checkpoint() を使用して DataFrame の有効期間全体にわたってテーブルの状態を永続化します。
- [SPARK-48481][SQL][SS] OptimizeOneRowPlan をストリーミング Dataset に適用しない
- [SPARK-47070] サブクエリの書き換え後の無効な集計を修正する
- [SPARK-42741][SQL] リテラルが null の場合、バイナリ比較でキャストのラップを解除しない
- [SPARK-48445][SQL] コストが高い子要素を含む UDF をインライン化しない
- [SPARK-48503][SQL] 等価でない列に対して group-by がある場合に誤って許可されていた無効なスカラーサブクエリを修正する
- [SPARK-48383][SS] Kafka の startOffset オプションでパーティションのミスマッチに対してより良いエラーをスローする
- オペレーティングシステムのセキュリティを更新。
2024 年 6 月 17 日
- [SPARK-48277] ErrorClassesJsonReader.getErrorMessage のエラーメッセージを改善する
- 各種のバグ修正。
2024 年 5 月 21 日
- [SPARK-48105][SS] 状態ストアのアンロードとスナップショット処理の間の競合状態を修正する
- オペレーティングシステムのセキュリティを更新。
2024 年 5 月 9 日
- [SPARK-44251][SQL] 完全外部 USING 結合の結合キーに null 許容を正しく設定する
- [SPARK-47973][CORE] SparkContext.stop() と SparkContext.assertNotStopped() 内で呼び出し元をログに記録する
- [SPARK-47956][SQL] 未解決の LCA リファレンスのサニティチェックを実行する
- [SPARK-48018][SS] KafkaException.couldNotReadOffsetRange をスローするときにパラメーター不足のエラーを引き起こす、null groupId を修正する
- オペレーティングシステムのセキュリティを更新。
2024 年 4 月 25 日
- オペレーティングシステムのセキュリティを更新。
2024 年 4 月 11 日
- オペレーティングシステムのセキュリティを更新。
2024 年 4 月 1 日
- [SPARK-47305][SQL] プランにバッチとストリーミングの両方がある場合に LocalRelation の isStreaming フラグに正しくタグを付けるために PruneFilters を修正します
- [SPARK-44252][SS] 新しいエラークラスを定義し、DFS からの状態の読み込みが失敗した場合に適用する
- [SPARK-47135][SS] Kafka データ損失例外のエラークラスを実装します
- [SPARK-47200][SS] Foreach バッチシンクのユーザー関数エラーに対するエラークラス
- オペレーティングシステムのセキュリティを更新。
2024 年 3 月 14 日
- [SPARK-47176][SQL] ResolveAllExpressionsUpWithPruning ヘルパー関数がある
- "[SPARK-46861][CORE] DAGScheduler でデッドロックを回避する" を元に戻す
- [SPARK-47125][SQL] Univocity が解析をトリガーしない場合は null を返す
- [SPARK-47167][SQL] JDBC 匿名関係の具象クラスを追加する
- オペレーティングシステムのセキュリティを更新。
2024 年 2 月 29 日
- MERGE コマンドでローカルコレクションをソースとして使用すると、操作メトリック numSourceRows が正しい行数の 2 倍になる問題を修正しました。
- 定義された場所でスキーマを作成するには、ユーザーが ANY FILE に対する SELECT および MODIFY 権限を持っている必要があります。
- [SPARK-45582][SS] 出力モードストリーミング集計内でコミットを呼び出した後にストアインスタンスが使用されないようにする
- オペレーティングシステムのセキュリティを更新。
2024 年 2 月 13 日
- [SPARK-46861] DAGScheduler でのデッドロックを回避します。
- [SPARK-46794] LogicalRDD 制約からサブクエリを削除します。
- オペレーティングシステムのセキュリティを更新。
2024 年 1 月 31 日
- [SPARK-46763] 重複する属性での ReplaceDeduplicateWithAggregate のアサーションエラーを修正します。
- オペレーティングシステムのセキュリティを更新。
2023 年 12 月 25 日
- TLSv1.3 経由で通信するときの待機時間の増加を回避するために、このメンテナンスリリースには JDK バグ JDK-8293562 を修正するための JDK 8 インストールへのパッチが含まれています。
- [SPARK-39440] イベントタイムラインを無効にする構成を追加します。
- [SPARK-46132] RPC SSL の JKS キーのキーパスワードをサポートします。
- [SPARK-46394]spark.sql.legacy.keepCommandOutputSchema が true に設定されている場合に、特殊文字を持つスキーマでの spark.catalog.listDatabases() の問題を修正します。
- [SPARK-46417] hive.getTable を呼び出し、throwException が false の場合は失敗しません。
- [SPARK-43067] Kafka コネクタのエラークラスリソースファイルの場所を修正します。
- [SPARK-46249] バックグラウンド操作との競合を防ぐために、RocksDB メトリックを取得するためのインスタンスロックが必要です。
- [SPARK-46602] ビュー/テーブルが存在しない場合に、ビューの作成時に allowExisting を伝達します。
- [SPARK-46058] privateKeyPassword に別のフラグを追加します。
- [SPARK-46145] spark.catalog.listTables は、テーブルまたはビューが見つからないときに例外をスローしません。
- [SPARK-46538]ALSModel.transform におけるあいまいな列参照の問題を修正します。
- [SPARK-42852] EquivalentExpressions からの NamedLambdaVariable 関連の変更を元に戻します。
2023 年 12 月 14 日
- JDBC または ODBC クライアントからの getColumns 操作でエスケープされたアンダースコアが誤って処理され、ワイルドカードとして解釈される問題を修正しました。
- [SPARK-44582] SMJ がクリーンアップされた場合に、SMJ の反復子をスキップします。
- [SPARK-45920] 序数によるグループはべき等である必要があります。
- [SPARK-45655] CollectMetrics の AggregateFunctions 内で非決定論的な式を許可します。
- オペレーティングシステムのセキュリティを更新。
2023 年 11 月 29 日
- PyArrow RCE の脆弱性を修復するために、新しいパッケージ pyarrow-hotfix をインストールしました。
- JDBC または ODBC クライアントからの getColumns 操作でエスケープされたアンダースコアがワイルドカードとして誤って解釈される問題を修正しました。
- [SPARK-42205]Stage と Task の開始イベントの蓄積されたログ記録を削除しました。
- [SPARK-44846]RemoveRedundantAggregates の後の複雑なグループ化式を削除しました。
- [SPARK-43718]USING 結合でのキーの NULL 値の許容を修正しました。
- [SPARK-45544] SSL サポートを TransportContext に統合しました。
- [SPARK-43973] 構造化ストリーミング UI で、失敗したクエリが正しく表示されるようになりました。
- [SPARK-45730]ReloadingX509TrustManagerSuite の時間制約を改善しました。
- [SPARK-45859]ml.functions の UDF オブジェクトを遅延させました。
- オペレーティングシステムのセキュリティを更新。
2023 年 11 月 14 日
- Delta Lake ストリーミングクエリのパーティションフィルターは、使用率を向上させるためにレート制限の前にプッシュダウンされます。
- [SPARK-45545]SparkTransportConf は作成時に SSLOptions を継承します。
- [SPARK-45427] RPC SSL 設定を SSLOptions と SparkTransportConf に追加しました。
- [SPARK-45584]TakeOrderedAndProjectExec のサブクエリの実行エラーを修正しました。
- [SPARK-45541]SSLFactory を追加しました。
- [SPARK-45430]FramelessOffsetWindowFunction は、IGNORE NULLS と offset > rowCount の場合に失敗しなくなりました。
- [SPARK-45429] SSL RPC 通信用のヘルパークラスを追加しました。
- オペレーティングシステムのセキュリティを更新。
2023 年 10 月 24 日
- [SPARK-45426]ReloadingX509TrustManager のサポートを追加しました。
- その他の修正。
2023 年 10 月 13 日
- Snowflake-jdbc 依存関係が 3.13.29 から 3.13.33 にアップグレードされました。
- [SPARK-42553] interval の後に少なくとも 1 つの時間単位を確保します。
- [SPARK-45346] Parquet スキーマ推論は、スキーマをマージする際に、ケースセンシティブフラグに対応しています。
- [SPARK-45178] ラッパーを使用するのではなく、サポートされていないソースを使って Trigger.AvailableNow の単一バッチを実行するようにフォールバックします。
- [SPARK-45084] 正確で適切なシャッフルパーティション番号を使用するStateOperatorProgress。
2023 年 9 月 12 日
- [SPARK-44873] Hive クライアントで入れ子になった列を含む alter view のサポートを追加しました。
- [SPARK-44718]ColumnVector メモリモード構成の既定値を OffHeapMemoryMode 構成値に一致させます。
- [SPARK-43799] Pyspark Protobuf API に記述子バイナリオプションを追加しました。
- その他の修正。
2023 年 8 月 30 日
- [SPARK-44485]TreeNode.generateTreeString を最適化しました。
- [SPARK-44818]taskThread の初期化前に発行された保留中のタスク割り込みの競合を修正しました。
- [SPARK-44871][11.3-13.0] percentile_disc の動作を修正しました。
- [SPARK-44714] クエリに関する LCA 解決の制限を緩和しました。
- オペレーティングシステムのセキュリティを更新。
2023 年 8 月 15 日
- [SPARK-44504] メンテナンスタスクで、停止エラー時に読み込まれたプロバイダーがクリーンアップされます。
- [SPARK-44464] 最初の列値として applyInPandasWithStatePythonRunner を持つ出力行に対する Null を修正しました。
- オペレーティングシステムのセキュリティを更新。
2023 年 7 月 29 日
- 他の外部またはマネージドストレージの場所と競合するストレージの場所のパスを呼び出すと、dbutils.fs.ls() が INVALID_PARAMETER_VALUE.LOCATION_OVERLAP を返す問題を修正しました。
- [SPARK-44199]CacheManager は、fileIndex を不必要に更新しなくなりました。
- オペレーティングシステムのセキュリティを更新。
2023 年 7 月 24 日
- [SPARK-44337]Any.getDefaultInstance に設定されたフィールドで解析エラーが発生する問題を修正しました。
- [SPARK-44136]StateManager のドライバーではなく Executor で FlatMapGroupsWithStateExec が具体化される問題を修正しました。
- オペレーティングシステムのセキュリティを更新。
2023 年 6 月 23 日
- オペレーティングシステムのセキュリティを更新。
2023 年 6 月 15 日
- approx_count_distinct が Photon に対応しました。
- snowflake-jdbc ライブラリはセキュリティの問題に対処するために 3.13.29 にアップグレードされます。
- [SPARK-43779]ParseToDate により、メインスレッドに EvalMode が読み込まれるようになりました。
- [SPARK-43156][SPARK-43098]decorrelateInnerQuery を無効にしてスカラーサブクエリ数のエラーテストを拡張しました。
- オペレーティングシステムのセキュリティを更新。
2023 年 6 月 2 日
- failOnUnknownFields モードの JSON パーサーは、DROPMALFORMED モードでレコードを削除し、FAILFAST モードで直接失敗します。
- SHALLOW CLONE Iceberg と Parquet を使用して増分更新のパフォーマンスを向上させます。
- 指定されたスキーマに推論されたパーティションが含まれていなかったため、異なるソースファイル形式に一貫性がなかった自動ローダーの問題を修正しました。この問題により、推論されたパーティションスキーマに列がないファイルの読み取り時に予期しない失敗が発生していた可能性があります。
- [SPARK-43404] ID の不一致エラーを回避するために、同じバージョンの RocksDB 状態ストアの sst ファイルの再利用をスキップします。
- [SPARK-43413][11.3-13.0] IN サブクエリの ListQuery NULL 値の許容を修正しました。
- [SPARK-43522] 配列のインデックスを含む構造体列名の作成の問題を修正しました。
- [SPARK-43541] 式と不足している列の解決時にすべてのProject タグを伝達します。
- [SPARK-43527] PySpark の catalog.listCatalogs を修正しました。
- [SPARK-43123] 内部フィールドメタデータがカタログにリークしなくなりました。
- [SPARK-43340] イベントログにスタックトレースフィールドが見つからない問題を修正しました。
- [SPARK-42444]DataFrame.drop で、重複する列が正しく処理されるようになりました。
- [SPARK-42937]PlanSubqueries で InSubqueryExec#shouldBroadcast が true に設定されるようになりました。
- [SPARK-43286] ランダムな IV を生成するように aes_encrypt の CBC モードを更新しました。
- [SPARK-43378]deserializeFromChunkedBuffer 内のストリームオブジェクトを適切に閉じます。
2023年5月17日
- バッチサイズを動的に調整することで、非常に構造化されたファイルをスキャンするときに、Parquet スキャンが OOM に対して堅牢になりました。バッチサイズを大幅に小さくするためにファイルメタデータが分析され、最終的なセーフティネットとしてタスクの再試行時に再度低下します。
- Avro ファイルが、failOnUnknownFields オプションだけを使用するか、failOnNewColumns スキーマ展開モードで自動ローダーを使用して読み取られた場合、異なるデータ型の列は、ファイルを読み取ることができないというエラーがスローされる代わりに、null として読み取られます。これらの読み取りは失敗し、ユーザーは rescuedDataColumn オプションを使用することが推奨されます。
- 自動ローダーで次の処理を行うようになりました。
- - Integer、Short、Byte のデータ型のいずれかが指定されている場合は、型が正しく読み取られ、復旧されなくなりましたが、Avro ファイルでは他の 2 つの型のいずれかが提案されます。
- - 日付型またはタイムスタンプ型として interval 型を読み取らないようにし、破損した日付を取得しないようにします。
- - 精度が低い Decimal 型を読み取らないようにします。
- [SPARK-43172] Spark Connect クライアントからホストとトークンを公開します。
- [SPARK-43293]__qualified_access_only は通常の列では無視されます。
- [SPARK-43098] スカラーサブクエリが句でグループ化されている場合の正確性の COUNT バグを修正しました。
- [SPARK-43085] マルチパートテーブル名の列をDEFAULTに割り当てるサポート。
- [SPARK-43190]ListQuery.childOutput がセカンダリ出力と一致するようになりました。
- [SPARK-43192] ユーザーエージェントの文字セット検証を削除しました。
- オペレーティングシステムのセキュリティを更新。
2023 年 4 月 25 日
- Parquet ファイルが、failOnUnknownFields オプションだけを使用するか、failOnNewColumns スキーマ展開モードで自動ローダーを使用して読み取られた場合、異なるデータ型の列は、ファイルを読み取ることができないというエラーがスローされる代わりに、null として読み取られます。これらの読み取りは失敗し、ユーザーは rescuedDataColumn オプションを使用することが推奨されます。
- Integer、Short、Byte のデータ型のいずれかが指定されている場合、自動ローダーで型が正しく読み取られるようになり、今後レスキューは発生しません。 Parquet ファイルでは、他の 2 つの型のいずれかが提案されます。復旧されたデータ列が以前に有効になっていた場合、データ型の不一致により、列は読み取り可能であっても保存されます。
- [SPARK-43009]sql() 定数でパラメーター化された Any
- [SPARK-42406] フィールドを削除して Protobuf 再帰フィールドを終了する。
- [SPARK-43038]aes_encrypt()/aes_decrypt() によって CBC モードをサポートする
- [SPARK-42971] ワーカーで workdir イベントが処理されるときに appDirs が null の場合、WorkDirCleanup の出力に変更する
- [SPARK-43018] タイムスタンプリテラルを含む INSERT コマンドのバグを修正
- オペレーティングシステムのセキュリティを更新。
2023 年 4 月 11 日
- SYNC コマンドの従来のデータソース形式をサポートします。
- リポジトリの外部にあるノートブックの %autoreload 動作の問題を修正しました。
- 入れ子になった JSON オブジェクトのスキーマで新しい列が検出されると、自動ローダースキーマの展開が無限の失敗ループに入る可能性がある問題を修正しました。
- [SPARK-42928]resolvePersistentFunction を同期させました。
- [SPARK-42936] 句をその子集計で直接解決できる場合の LCan 問題を修正しました。.
- [SPARK-42967] ステージが取り消された後にタスクが開始されたときの SparkListenerTaskStart.stageAttemptId を修正しました。
- オペレーティングシステムのセキュリティを更新。
2023 年 3 月 29 日
- Databricks SQL では、テーブルの作成時またはその後のいずれかで、Delta Lake テーブルの列の既定値を指定することがサポートされるようになりました。後続の INSERT、 UPDATE、 DELETE、および MERGE コマンドは、明示的な DEFAULT キーワードを使用して、任意の列の既定値を参照できます。さらに、INSERT 割り当てに、ターゲットテーブルよりも少ない列のリストがある場合、残りの列について、対応する列の既定値が置き換えられます (または、既定値が指定されていない場合は NULL)。
  
  例えば次が挙げられます。
```
CREATE TABLE t (first INT, second DATE DEFAULT CURRENT_DATE());
INSERT INTO t VALUES (0, DEFAULT);
INSERT INTO t VALUES (1, DEFAULT);
SELECT first, second FROM t;
\> 0, 2023-03-28
1, 2023-03-28z
```
- 自動ローダーでは、高速で実行される自動ローダーストリームに対してチェックポイントを定期的にクリーンアップできることを確認するために、Trigger.AvailableNow ストリーム用に少なくとも 1 つの同期 RocksDB ログクリーンを開始するようになりました。これにより、一部のストリームがシャットダウンされるまでに時間がかかる場合がありますが、ストレージコストが節約され、今後の実行で自動ローダーのエクスペリエンスが向上します。
- Delta テーブルを変更して、DeltaTable.addFeatureSupport(feature_name) を使用してテーブル機能のサポートを追加できるようになりました。
- [SPARK-42794] 構造化ストリーミングの RocksDB 状態ストアを取得するための lockAcquireTimeoutMs を 2 分に増やす
- [SPARK-42521] ターゲットテーブルよりも少ない列のユーザー指定リストを使用して、INSERT に NULL 値を追加する
- [SPARK-42702][SPARK-42623] サブクエリと CTE でパラメーター化されたクエリをサポート
- [SPARK-42668] HDFSStateStoreProvider 停止で圧縮ストリームを閉じようとしているときに例外をキャッチする
- [SPARK-42403] JsonProtocol で null JSON 文字列を処理する必要がある
2023 年 3 月 8 日
- "構成の初期化エラー" というエラーメッセージが改善され、顧客に多くのコンテキストが提供されます。
- table プロパティを使用して Delta テーブルに機能を追加するための用語の変更があります。推奨される構文は、'delta.feature.featureName'='supported' ではなく 'delta.feature.featureName'='enabled' になりました。下位互換性のために、'delta.feature.featureName'='enabled' を使用しても引き続き動作し、今後も引き続き動作します。
- このリリース以降では、既定のリーダーとライターのバージョンおよび既定でサポートされているテーブル機能を含む、プロトコル関連の Spark 構成を無視するために、追加のテーブルプロパティ delta.ignoreProtocolDefaults でテーブルを作成または置換できます。
- [SPARK-42070] Mask 関数の引数の既定値を -1 から NULL に変更する
- [SPARK-41793] 重要な 10 進数における範囲句で定義されたウィンドウフレームの結果が正しくない
- [SPARK-42484] UnsafeRowUtils のエラーメッセージを改善
- [SPARK-42516] ビューの作成時にセッションタイムゾーン構成を常にキャプチャする
- [SPARK-42635] TimestampAdd 式を修正します。
- [SPARK-42622] 値の置換を無効にしました
- [SPARK-42534] DB2Dialect Limit 句を修正する
- [SPARK-42121] 組み込みのテーブル値関数 posexplode、posexplode_outer、json_tuple、stack を追加する
- [SPARK-42045] ANSI SQL モード: Round/Bround は、tiny/small/significant の整数オーバーフローでエラーを返す必要がある
- オペレーティングシステムのセキュリティを更新。

Databricks Runtime 11.3 LTS

Databricks Runtime 11.3 LTS (EoS) を参照してください。

2025 年 11 月 4 日
- オペレーティングシステムのセキュリティを更新。

2025 年 10 月 21 日
- Pythonを 2.7.18 から 2.7.18.1 に更新しました
- オペレーティングシステムのセキュリティを更新。

2025 年 10 月 7 日
- オペレーティングシステムのセキュリティを更新。

2025 年 9 月 24 日
- オペレーティングシステムのセキュリティを更新。

2025 年 9 月 9 日
- オペレーティングシステムのセキュリティを更新。

2025 年 8 月 26 日
- オペレーティングシステムのセキュリティを更新。

2025 年 8 月 14 日
- オペレーティングシステムのセキュリティを更新。

2025 年 7 月 29 日
- オペレーティングシステムのセキュリティを更新。

2025 年 7 月 15 日
- オペレーティングシステムのセキュリティを更新。

2025 年 7 月 1 日
- オペレーティングシステムのセキュリティを更新。

2025 年 6 月 17 日
- オペレーティングシステムのセキュリティを更新。

2025 年 6 月 3 日
- Python ライブラリの更新:
  - certifi を 2019.11.28、2021.10.8 から 2021.10.8 へ更新
  - chardet を 3.0.4、4.0.0 から 4.0.0 へ更新
  - idnaのバージョンが2.8および3.2から3.2に更新されました。
  - requests を 2.22.0、2.26.0 から 2.26.0 へ更新
  - six を 1.14.0、1.16.0 から 1.16.0 へ更新
  - urllib3 を 1.25.8、1.26.7 から 1.26.7 へ更新
  - pip 21.2.4 を追加しました
  - setuptools 58.0.4 を追加しました
  - tomli 2.0.1 を追加しました
  - wcwidth 0.2.5 を追加しました
  - ホイール 0.37.0 を追加しました
  - ディストリビューション 1.4.0 を削除しました
  - distro-info 0.23+ubuntu1.1 を削除しました
  - python-apt 2.0.1+ubuntu0.20.4.1 を削除しました
- オペレーティングシステムのセキュリティを更新。

2025 年 5 月 20 日
- [SPARK-42655][SQL] あいまいな列参照エラーが正しくありません
- オペレーティングシステムのセキュリティを更新。

2025 年 4 月 22 日
- [動作の変更]バキューム操作では、他の操作と同様にライタープロトコルチェックが実行されるようになり、互換性のない古い Databricks Runtime バージョンから実行すると、新しい機能を持つテーブルで予期しないクリーンアップが防止されるようになりました。
- オペレーティングシステムのセキュリティを更新。

2025 年 4 月 9 日
- オペレーティングシステムのセキュリティを更新。

2025 年 3 月 5 日
- オペレーティングシステムのセキュリティを更新。

2025 年 2 月 11 日
- このリリースには、増分 CLONE がソーステーブルからターゲットテーブルに既にコピーされているファイルを再コピーする可能性があるエッジケースの修正が含まれています。「 Azure Databricksを参照してください。

2024 年 12 月 10 日
- オペレーティングシステムのセキュリティを更新。
2024 年 11 月 26 日
- 各種のバグ修正。
2024 年 10 月 10 日
- 各種のバグ修正。
2024 年 9 月 25 日
- [SPARK-46601] [CORE]handleStatusMessage のログエラーを修正する
- [SPARK-49000][SQL] RewriteDistinctAggregates を展開して t が空のテーブルである "select count(distinct 1) from t" を修正
- 各種のバグ修正。
2024 年 9 月 17 日
- オペレーティングシステムのセキュリティを更新。
2024 年 8 月 14 日
- [SPARK-48941][SPARK-48970] バックポート ML ライター/リーダーの修正
- [SPARK-49065][SQL] レガシフォーマッタ/パーサーのリベースは、JVM 以外のデフォルトタイムゾーンをサポートする必要があります
- [SPARK-48597][SQL] 論理プランのテキスト表現に isStreaming プロパティのマーカーを導入する
- [SPARK-48463][ML] 入れ子になった入力列をサポートする StringIndexer を作成する
- オペレーティングシステムのセキュリティを更新。
2024 年 8 月 1 日
- [SPARK-48896][SPARK-48909][SPARK-48883] バックポート Spark ML ライターの修正
2024 年 8 月 1 日
- 必要なセキュリティパッチを適用するために、Databricks Runtime 11.3 LTS のPython バージョンが 3.9.5 から 3.9.19 にアップグレードされます。
2024 年 7 月 11 日
- [SPARK-48383][SS] Kafka の startOffset オプションでパーティションのミスマッチに対してより良いエラーをスローする
- [SPARK-47070] サブクエリの書き換え後の無効な集計を修正する
- オペレーティングシステムのセキュリティを更新。
2024 年 6 月 17 日
- オペレーティングシステムのセキュリティを更新。
2024 年 5 月 21 日
- [SPARK-48105][SS] 状態ストアのアンロードとスナップショット処理の間の競合状態を修正する
- オペレーティングシステムのセキュリティを更新。
2024 年 5 月 9 日
- [SPARK-48018][SS] KafkaException.couldNotReadOffsetRange をスローするときにパラメーター不足のエラーを引き起こす、null groupId を修正する
- [SPARK-47973][CORE] SparkContext.stop() と SparkContext.assertNotStopped() 内で呼び出し元をログに記録する
- [SPARK-44251][SQL] 完全外部 USING 結合の結合キーに null 許容を正しく設定する
- オペレーティングシステムのセキュリティを更新。
2024 年 4 月 25 日
- オペレーティングシステムのセキュリティを更新。
2024 年 4 月 11 日
- オペレーティングシステムのセキュリティを更新。
2024 年 4 月 1 日
- [SPARK-44252][SS] 新しいエラークラスを定義し、DFS からの状態の読み込みが失敗した場合に適用する
- [SPARK-47135][SS] Kafka データ損失例外のエラークラスを実装します
- "[SPARK-46861][CORE] DAGScheduler でデッドロックを回避する" を元に戻す
- [SPARK-47200][SS] Foreach バッチシンクのユーザー関数エラーに対するエラークラス
- オペレーティングシステムのセキュリティを更新。
2024 年 3 月 14 日
- [SPARK-47167][SQL] JDBC 匿名関係の具象クラスを追加する
- [SPARK-47125][SQL] Univocity が解析をトリガーしない場合は null を返す
- オペレーティングシステムのセキュリティを更新。
2024 年 2 月 29 日
- MERGE コマンドでローカルコレクションをソースとして使用すると、操作メトリック numSourceRows が正しい行数の 2 倍になる問題を修正しました。
- [SPARK-45582][SS] 出力モードストリーミング集計内でコミットを呼び出した後にストアインスタンスが使用されないようにする
2024 年 2 月 13 日
- [SPARK-46794] LogicalRDD 制約からサブクエリを削除します。
- [SPARK-46861] DAGScheduler でのデッドロックを回避します。
- オペレーティングシステムのセキュリティを更新。
2024 年 1 月 31 日
- オペレーティングシステムのセキュリティを更新。
2023 年 12 月 25 日
- TLSv1.3 経由で通信するときの待機時間の増加を回避するために、このメンテナンスリリースには JDK バグ JDK-8293562 を修正するための JDK 8 インストールへのパッチが含まれています。
- [SPARK-46058] privateKeyPassword に別のフラグを追加します。
- [SPARK-46602] ビュー/テーブルが存在しない場合に、ビューの作成時に allowExisting を伝達します。
- [SPARK-46394]spark.sql.legacy.keepCommandOutputSchema が true に設定されている場合に、特殊文字を持つスキーマでの spark.catalog.listDatabases() の問題を修正します。
- [SPARK-46538]ALSModel.transform におけるあいまいな列参照の問題を修正します。
- [SPARK-39440] イベントタイムラインを無効にする構成を追加します。
- [SPARK-46249] バックグラウンド操作との競合を防ぐために、RocksDB メトリックを取得するためのインスタンスロックが必要です。
- [SPARK-46132] RPC SSL の JKS キーのキーパスワードをサポートします。
2023 年 12 月 14 日
- JDBC または ODBC クライアントからの getColumns 操作でエスケープされたアンダースコアが誤って処理され、ワイルドカードとして解釈される問題を修正しました。
- オペレーティングシステムのセキュリティを更新。
2023 年 11 月 29 日
- JDBC または ODBC クライアントからの getColumns 操作でエスケープされたアンダースコアがワイルドカードとして誤って解釈される問題を修正しました。
- [SPARK-43973] 構造化ストリーミング UI で、失敗したクエリが正しく表示されるようになりました。
- [SPARK-45730]ReloadingX509TrustManagerSuite の時間制約を改善しました。
- [SPARK-45544] SSL サポートを TransportContext に統合しました。
- [SPARK-45859]ml.functions の UDF オブジェクトを遅延させました。
- [SPARK-43718]USING 結合でのキーの NULL 値の許容を修正しました。
- [SPARK-44846]RemoveRedundantAggregates の後の複雑なグループ化式を削除しました。
- オペレーティングシステムのセキュリティを更新。

2023 年 11 月 14 日
- Delta Lake ストリーミングクエリのパーティションフィルターは、使用率を向上させるためにレート制限の前にプッシュダウンされます。
- [SPARK-42205] ステージおよびタスクの開始イベントの蓄積されたログ記録を削除しました。
- [SPARK-45545]SparkTransportConf は作成時に SSLOptions を継承します。
- [SPARK-33861] を元に戻します。
- [SPARK-45541]SSLFactory を追加しました。
- [SPARK-45429] SSL RPC 通信用のヘルパークラスを追加しました。
- [SPARK-45584]TakeOrderedAndProjectExec のサブクエリの実行エラーを修正しました。
- [SPARK-45430]FramelessOffsetWindowFunction は、IGNORE NULLS と offset > rowCount の場合に失敗しなくなりました。
- [SPARK-45427] RPC SSL 設定を SSLOptions と SparkTransportConf に追加しました。
- オペレーティングシステムのセキュリティを更新。
2023 年 10 月 24 日
- [SPARK-45426]ReloadingX509TrustManager のサポートを追加しました。
- その他の修正。
2023 年 10 月 13 日
- Snowflake-jdbc 依存関係が 3.13.29 から 3.13.33 にアップグレードされました。
- [SPARK-45178] ラッパーを使用するのではなく、サポートされていないソースを使って Trigger.AvailableNow の単一バッチを実行するようにフォールバックします。
- [SPARK-45084] 正確で適切なシャッフルパーティション番号を使用するStateOperatorProgress。
- [SPARK-45346] Parquet スキーマ推論では、スキーマをマージする際に、大文字と小文字を区別するフラグが考慮されるようになりました。
- オペレーティングシステムのセキュリティを更新。
2023 年 9 月 10 日
- その他の修正。
2023 年 8 月 30 日
- [SPARK-44818]taskThread の初期化前に発行された保留中のタスク割り込みの競合を修正しました。
- [SPARK-44871][11.3-13.0] percentile_disc の動作を修正しました。
- オペレーティングシステムのセキュリティを更新。
2023 年 8 月 15 日
- [SPARK-44485]TreeNode.generateTreeString を最適化しました。
- [SPARK-44504] メンテナンスタスクで、停止エラー時に読み込まれたプロバイダーがクリーンアップされます。
- [SPARK-44464] 最初の列値として applyInPandasWithStatePythonRunner を持つ出力行に対する Null を修正しました。
- オペレーティングシステムのセキュリティを更新。
2023 年 7 月 27 日
- 他の外部またはマネージドストレージの場所と競合するストレージの場所のパスを呼び出すと、dbutils.fs.ls() が INVALID_PARAMETER_VALUE.LOCATION_OVERLAP を返す問題を修正しました。
- [SPARK-44199]CacheManager は、fileIndex を不必要に更新しなくなりました。
- オペレーティングシステムのセキュリティを更新。
2023 年 7 月 24 日
- [SPARK-44136] FlatMapGroupsWithStateExec のドライバーではなく Executor で StateManager が具体化される可能性がある問題を修正しました。
- オペレーティングシステムのセキュリティを更新。
2023 年 6 月 23 日
- オペレーティングシステムのセキュリティを更新。
2023 年 6 月 15 日
- approx_count_distinct が Photon に対応しました。
- snowflake-jdbc ライブラリはセキュリティの問題に対処するために 3.13.29 にアップグレードされます。
- [SPARK-43779]ParseToDate により、メインスレッドに EvalMode が読み込まれるようになりました。
- [SPARK-40862] RewriteCorrelatedScalarSubquery で集計されていないサブクエリをサポートする
- [SPARK-43156][SPARK-43098]decorrelateInnerQuery を無効にしてスカラーサブクエリ数のバグテストを拡張しました。
- [SPARK-43098] スカラーサブクエリに group by 句がある場合の COUNT の正確性のバグを修正する
- オペレーティングシステムのセキュリティを更新。
2023 年 6 月 2 日
- failOnUnknownFields モードの JSON パーサーは、DROPMALFORMED モードでレコードを削除し、FAILFAST モードで直接失敗します。
- SHALLOW CLONE Iceberg と Parquet を使用して増分更新のパフォーマンスを向上させます。
- 指定されたスキーマに推論されたパーティションが含まれていなかったため、異なるソースファイル形式に一貫性がなかった自動ローダーの問題を修正しました。この問題により、推論されたパーティションスキーマに列がないファイルの読み取り時に予期しない失敗が発生していた可能性があります。
- [SPARK-43404] ID の不一致エラーを回避するために、同じバージョンの RocksDB 状態ストアの sst ファイルの再利用をスキップします。
- [SPARK-43527] PySpark の catalog.listCatalogs を修正しました。
- [SPARK-43413][11.3-13.0] IN サブクエリの ListQuery NULL 値の許容を修正しました。
- [SPARK-43340] イベントログにスタックトレースフィールドが見つからない問題を修正しました。

Databricks Runtime 10.4 LTS (データブリックスランタイム 10.4 LTS)

Databricks Runtime 10.4 LTS (EoS) を参照してください。

2025 年 8 月 12 日
- オペレーティングシステムのセキュリティを更新。

2025 年 7 月 15 日
- オペレーティングシステムのセキュリティを更新。

2025 年 7 月 1 日
- オペレーティングシステムのセキュリティを更新。
2025 年 6 月 17 日
- オペレーティングシステムのセキュリティを更新。

2025 年 6 月 3 日
- Python ライブラリの更新:
  - 2019年11月28日から2020年12月5日までのcertifi
  - chardet を 3.0.4、4.0.0 から 4.0.0 へ更新
  - idna 2.8 から 2.10 への変更
  - 2.22.0、2.25.1から2.25.1への移行リクエスト
  - 1.14.0、1.15.0 から 1.15.0 までの 6 個
  - urllib3 1.25.8 および 1.25.11 から 1.25.11 への更新
  - pip 21.0.1 を追加しました
  - setuptools 52.0.0 を追加しました
  - wcwidth 0.2.5 を追加しました
  - ホイール 0.36.2 を追加しました
  - ディストリビューション 1.4.0 を削除しました
  - distro-info 0.23+ubuntu1.1 を削除しました
  - python-apt 2.0.1+ubuntu0.20.4.1 を削除しました
- オペレーティングシステムのセキュリティを更新。

2025 年 5 月 20 日
- オペレーティングシステムのセキュリティを更新。

2025 年 4 月 22 日
- オペレーティングシステムのセキュリティを更新。

2025 年 4 月 9 日
- オペレーティングシステムのセキュリティを更新。

2025 年 3 月 11 日
- オペレーティングシステムのセキュリティを更新。

2025 年 2 月 11 日
- このリリースには、増分 CLONE がソーステーブルからターゲットテーブルに既にコピーされているファイルを再コピーする可能性があるエッジケースの修正が含まれています。「 Azure Databricksを参照してください。
- オペレーティングシステムのセキュリティを更新。

2024 年 12 月 10 日
- オペレーティングシステムのセキュリティを更新。
2024 年 11 月 26 日
- オペレーティングシステムのセキュリティを更新。
2024 年 11 月 5 日
- オペレーティングシステムのセキュリティを更新。
2024 年 10 月 22 日
- オペレーティングシステムのセキュリティを更新。
2024 年 10 月 10 日
- オペレーティングシステムのセキュリティを更新。
2024 年 9 月 25 日
- [SPARK-46601] [CORE]handleStatusMessage のログエラーを修正する
- [SPARK-49000][SQL]RewriteDistinctAggregates を展開して、t が空のテーブルである "select count(distinct 1) from t" を修正しました
- オペレーティングシステムのセキュリティを更新。
2024 年 9 月 17 日
- オペレーティングシステムのセキュリティを更新。
2024 年 8 月 29 日
- [SPARK-49065][SQL] レガシフォーマッタ/パーサーのリベースは、JVM 以外のデフォルトタイムゾーンをサポートする必要があります
2024 年 8 月 14 日
- [SPARK-48597][SQL] 論理プランのテキスト表現に isStreaming プロパティのマーカーを導入する
- [SPARK-48941][SPARK-48970] バックポート ML ライター/リーダーの修正
- [SPARK-48463][ML] 入れ子になった入力列をサポートする StringIndexer を作成する
2024 年 8 月 1 日
- [SPARK-48896][SPARK-48909][SPARK-48883] バックポート Spark ML ライターの修正
- オペレーティングシステムのセキュリティを更新。
2024 年 7 月 11 日
- [SPARK-48383][SS] Kafka の startOffset オプションでパーティションのミスマッチに対してより良いエラーをスローする
- オペレーティングシステムのセキュリティを更新。
2024 年 6 月 17 日
- オペレーティングシステムのセキュリティを更新。
2024 年 5 月 21 日
- [SPARK-48105][SS] 状態ストアのアンロードとスナップショット処理の間の競合状態を修正する
- オペレーティングシステムのセキュリティを更新。
2024 年 5 月 9 日
- [SPARK-48018][SS] KafkaException.couldNotReadOffsetRange をスローするときにパラメーター不足のエラーを引き起こす、null groupId を修正する
- [SPARK-47973][CORE] SparkContext.stop() と SparkContext.assertNotStopped() 内で呼び出し元をログに記録する
- [SPARK-44251][SQL] 完全外部 USING 結合の結合キーに null 許容を正しく設定する
- オペレーティングシステムのセキュリティを更新。
2024 年 4 月 25 日
- オペレーティングシステムのセキュリティを更新。
2024 年 4 月 11 日
- オペレーティングシステムのセキュリティを更新。
2024 年 4 月 1 日
- [SPARK-47135][SS] Kafka データ損失例外のエラークラスを実装します
- [SPARK-44252][SS] 新しいエラークラスを定義し、DFS からの状態の読み込みが失敗した場合に適用する
- [SPARK-47200][SS] Foreach バッチシンクのユーザー関数エラーに対するエラークラス
- "[SPARK-46861][CORE] DAGScheduler でのデッドロックを回避する" を取り消す
- オペレーティングシステムのセキュリティを更新。
2024 年 3 月 14 日
- [SPARK-47125][SQL] Univocity が解析をトリガーしない場合は null を返す
- オペレーティングシステムのセキュリティを更新。
2024 年 2 月 29 日
- MERGE コマンドでローカルコレクションをソースとして使用すると、操作メトリック numSourceRows が正しい行数の 2 倍になる問題を修正しました。
- [SPARK-45582][SS] 出力モードストリーミング集計内でコミットを呼び出した後にストアインスタンスが使用されないようにする
- オペレーティングシステムのセキュリティを更新。
2024 年 2 月 13 日
- [SPARK-46861] DAGScheduler でのデッドロックを回避します。
- オペレーティングシステムのセキュリティを更新。
2024 年 1 月 31 日
- オペレーティングシステムのセキュリティを更新。
2023 年 12 月 25 日
- TLSv1.3 経由で通信するときの待機時間の増加を回避するために、このメンテナンスリリースには JDK バグ JDK-8293562 を修正するための JDK 8 インストールへのパッチが含まれています。
- [SPARK-46058] privateKeyPassword に別のフラグを追加します。
- [SPARK-46538]ALSModel.transform におけるあいまいな列参照の問題を修正します。
- [SPARK-39440] イベントタイムラインを無効にする構成を追加します。
- [SPARK-46132] RPC SSL の JKS キーのキーパスワードをサポートします。
2023 年 12 月 14 日
- オペレーティングシステムのセキュリティを更新。
2023 年 11 月 29 日
- [SPARK-45544] SSL サポートを TransportContext に統合しました。
- [SPARK-45859]ml.functions の UDF オブジェクトを遅延させました。
- [SPARK-43718]USING 結合でのキーの NULL 値の許容を修正しました。
- [SPARK-45730]ReloadingX509TrustManagerSuite の時間制約を改善しました。
- [SPARK-42205] ステージおよびタスクの開始イベントの蓄積されたログ記録を削除しました。
- [SPARK-44846]RemoveRedundantAggregates の後の複雑なグループ化式を削除しました。
- オペレーティングシステムのセキュリティを更新。
2023 年 11 月 14 日
- [SPARK-45541]SSLFactory を追加しました。
- [SPARK-45545]SparkTransportConf は作成時に SSLOptions を継承します。
- [SPARK-45427] RPC SSL 設定を SSLOptions と SparkTransportConf に追加しました。
- [SPARK-45429] SSL RPC 通信用のヘルパークラスを追加しました。
- [SPARK-45584]TakeOrderedAndProjectExec のサブクエリの実行エラーを修正しました。
- [SPARK-33861] を元に戻します。
- オペレーティングシステムのセキュリティを更新。
2023 年 10 月 24 日
- [SPARK-45426]ReloadingX509TrustManager のサポートを追加しました。
- オペレーティングシステムのセキュリティを更新。
2023 年 10 月 13 日
- [SPARK-45084] 正確で適切なシャッフルパーティション番号を使用するStateOperatorProgress。
- [SPARK-45178] ラッパーを使用するのではなく、サポートされていないソースを使って Trigger.AvailableNow の単一バッチを実行するようにフォールバックします。
- オペレーティングシステムのセキュリティを更新。
2023 年 9 月 10 日
- その他の修正。
2023 年 8 月 30 日
- [SPARK-44818]taskThread の初期化前に発行された保留中のタスク割り込みの競合を修正しました。
- オペレーティングシステムのセキュリティを更新。
2023 年 8 月 15 日
- [SPARK-44504] メンテナンスタスクで、停止エラー時に読み込まれたプロバイダーがクリーンアップされます。
- [SPARK-43973] 構造化ストリーミング UI で、失敗したクエリが正しく表示されるようになった。
- オペレーティングシステムのセキュリティを更新。
2023 年 6 月 23 日
- オペレーティングシステムのセキュリティを更新。
2023 年 6 月 15 日
- snowflake-jdbc ライブラリはセキュリティの問題に対処するために 3.13.29 にアップグレードされます。
- [SPARK-43098] スカラーサブクエリに group by 句がある場合の COUNT の正確性のバグを修正する
- [SPARK-40862] RewriteCorrelatedScalarSubquery で集計されていないサブクエリをサポートする
- [SPARK-43156][SPARK-43098]decorrelateInnerQuery が無効な状態でスカラーサブクエリカウントテストを拡張。
- オペレーティングシステムのセキュリティを更新。
2023 年 6 月 2 日
- failOnUnknownFields モードの JSON パーサーは、DROPMALFORMED モードでレコードを削除し、FAILFAST モードで直接失敗します。
- UnknownFieldException を防ぐために JSON で復旧されたデータ解析の問題を修正しました。
- 指定されたスキーマに推論されたパーティションが含まれていなかったため、異なるソースファイル形式に一貫性がなかった自動ローダーの問題を修正しました。この問題により、推論されたパーティションスキーマに列がないファイルの読み取り時に予期しない失敗が発生していた可能性があります。
- [SPARK-43404] ID の不一致エラーを回避するために、同じバージョンの RocksDB 状態ストアの sst ファイルの再利用をスキップします。
- [SPARK-43413]IN サブクエリの ListQuery NULL 値の許容を修正しました。
- オペレーティングシステムのセキュリティを更新。
2023年5月17日
- バッチサイズを動的に調整することで、非常に構造化されたファイルをスキャンするときに、Parquet スキャンが OOM に対して堅牢になりました。バッチサイズを大幅に小さくするためにファイルメタデータが分析され、最終的なセーフティネットとしてタスクの再試行時に再度低下します。
- [SPARK-41520]AND_OR ツリーパターンを、個別の AND と OR に分割。
- [SPARK-43190]ListQuery.childOutput がセカンダリ出力と一致するようになりました。
- オペレーティングシステムのセキュリティを更新。
2023 年 4 月 25 日
- [SPARK-42928]resolvePersistentFunction を同期。
- オペレーティングシステムのセキュリティを更新。
2023 年 4 月 11 日
- 入れ子になった JSON オブジェクトのスキーマで新しい列が検出されると、自動ローダースキーマの展開が無限の失敗ループに入る可能性がある問題を修正しました。
- [SPARK-42937]PlanSubqueries で InSubqueryExec#shouldBroadcast が true に設定されるようになりました。
- [SPARK-42967] ステージが取り消された後にタスクが開始されたときの SparkListenerTaskStart.stageAttemptId を修正します。
2023 年 3 月 29 日
- [SPARK-42668] HDFSStateStoreProvider 停止で圧縮ストリームを閉じようとしているときに例外をキャッチする
- [SPARK-42635] ... を修正
- オペレーティングシステムのセキュリティを更新。
2023 年 3 月 14 日
- [SPARK-41162] 集計を使用した自己結合の反結合および半結合を修正
- [SPARK-33206] 小さいインデックスファイルのシャッフルインデックスキャッシュの重みの計算を修正
- [SPARK-42484]UnsafeRowUtils エラーメッセージを改善
- その他の修正。
2023 年 2 月 28 日
- yyyy-MM-dd date_format の生成列をサポート。この変更により、生成された列の date_format としての yyyy-MM-dd のパーティション排除がサポートされます。
- ユーザーは Databricks Runtime 9.1 LTS 以降を使用して、Reader バージョン 3 と Writer バージョン 7 を必要とする特定の Delta テーブルの読み取りと書き込みができるようになりました。成功するには、テーブルのプロトコルに記載されているテーブル機能が、Databricks Runtime の現在のバージョンでサポートされている必要があります。
- yyyy-MM-dd date_format の生成列をサポート。この変更により、生成された列の date_format としての yyyy-MM-dd のパーティション排除がサポートされます。
- オペレーティングシステムのセキュリティを更新。
2023 年 2 月 16 日
- [SPARK-30220] フィルターノードの外部にある Exists/In サブクエリの使用を有効にする
- オペレーティングシステムのセキュリティを更新。
2023 年 1 月 31 日
- JDBC テーブルのテーブルの種類が既定では EXTERNAL になりました。
2023 年 1 月 18 日
- Azure Synapse コネクタは、列名に空白やセミコロンなどの有効な文字が含まれていない場合に、よりわかりやすいエラーメッセージを返します。このような場合は、次のメッセージが返されます: Azure Synapse Analytics failed to run the JDBC query produced by the connector. Check column names do not include not valid characters such as ';' or white space。
- [SPARK-38277] RocksDB ステートストアのコミット後に書き込みバッチをクリアする
- [SPARK-41199] DSv1 ストリーミングソースと DSv2 ストリーミングソースが共同使用されている場合のメトリックの問題を修正
- [SPARK-41198] CTE と DSv1 ストリーミングソースを持つストリーミングクエリのメトリックを修正
- [SPARK-41339] 単にクリアするのではなく、RocksDB 書き込みバッチを閉じて再作成
- [SPARK-41732] SessionWindowing のルールにツリーパターンベースの排除を適用
- オペレーティングシステムのセキュリティを更新。
2022 年 11 月 29 日
- ユーザーは、Redshift コネクタを使用してデータを書き込むときに、先頭と末尾の空白の動作を構成できます。空白の処理を制御するために、次のオプションが追加されました。
  - csvignoreleadingwhitespace: true に設定すると、tempformat が CSV または CSV GZIP に設定されている場合、書き込み中に先頭の空白が値から削除されます。空白は、構成がfalse に設定されている場合に保持されます。既定値は true です。
  - csvignoretrailingwhitespace: true に設定すると、tempformat が CSV または CSV GZIP に設定されている場合、書き込み中に末尾の空白が値から削除されます。空白は、構成がfalse に設定されている場合に保持されます。既定値は true です。
- すべての列が文字列として残され (cloudFiles.inferColumnTypes が設定されていないか、false に設定されている)、JSON に入れ子になったオブジェクトが含まれている場合の、自動ローダーでの JSON 解析の問題を修正しました。
- オペレーティングシステムのセキュリティを更新。
2022 年 11 月 15 日
- Apache commons-text を 1.10.0 にアップグレードしました。
- [SPARK-40646] 構造体、マップ、配列の JSON 解析は修正されているため、レコードの一部がスキーマと一致しない場合でも、残りのレコードは null 値を返す代わりに正しく解析できます。改善された動作をオプトインするには、spark.sql.json.enablePartialResults を true に設定します。フラグは、元の動作を保持するために既定で無効になっています。
- [SPARK-40292] 入れ子になった構造体から配列が参照されている場合の arrays_zip 関数の列名を修正
- オペレーティングシステムのセキュリティを更新。
2022 年 11 月 1 日
- Delta テーブルに _change_type という名前のユーザー定義列があるが、そのテーブルで変更データフィードが無効になっている場合、その列のデータが MERGE の実行時に NULL 値で誤って入力される問題を修正しました。
- allowOverwrites が有効になっている場合に、同じマイクロバッチでファイルを複製できる自動ローダーの問題を修正しました
- [SPARK-40697] 外部データファイルをカバーする読み取り側の char パディングを追加
- [SPARK-40596] ExecutorDecommission に ExecutorDecommissionInfo のメッセージを設定する
- オペレーティングシステムのセキュリティを更新。
2022 年 10 月 18 日
- オペレーティングシステムのセキュリティを更新。
2022 年 10 月 5 日
- [SPARK-40468]_corrupt_record が選択されている場合に、CSV の列の排除を修正。
- オペレーティングシステムのセキュリティを更新。
2022 年 9 月 22 日
- ユーザーは spark.conf.set(spark.databricks.io.listKeysWithPrefix.azure.enabled, true) を設定して、ADLS の自動ローダーの組み込みリストを再度有効にすることができます。組み込みリストは、以前はパフォーマンスの問題のために無効にされていましたが、顧客のストレージコストの増加につながっている可能性があります。
- [SPARK-40315] ArrayBasedMapData のリテラルに hashCode() を追加する
- [SPARK-40213] ラテン 1 文字の ASCII 値変換をサポート
- [SPARK-40380] プランにシリアル化不可能なリテラルが埋め込まれるのを避けるために InvokeLike の定数フォールディングを修正
- [SPARK-38404] 入れ子になった CTE が外部 CTE を参照する場合の CTE 解決を向上
- [SPARK-40089] 一部の Decimal 型の並べ替えを修正する
- [SPARK-39887] RemoveRedundantAliases は、プロジェクションノードの出力を一意にするエイリアスを保持する必要がある
2022 年 9 月 6 日
- [SPARK-40235] Executor.updateDependencies() で同期ではなく割り込み可能なロックを使用する
- [SPARK-40218] GROUPING SETS がグループ化列を保持するようにする
- [SPARK-39976] ArrayIntersect で左側の式に含まれる null を正しく処理するようにする
- [SPARK-40053] Pythonランタイム環境を必要とする動的キャンセルケースにPythonを追加assume
- [SPARK-35542] 修正: パラメーター splitsArray、inputCols、outputCols を指定して複数の列に対して作成された Bucketizer を保存後に読み込めない
- [SPARK-40079] 空の入力ケースに対する Imputer inputCols 検証を追加
2022 年 8 月 24 日
- [SPARK-39983] ドライバーに非直列化ブロードキャスト関係をキャッシュしない
- [SPARK-39775] Avro スキーマの解析時に既定値の検証を無効にする
- [SPARK-39962] グループ属性が空の場合にプロジェクションを適用する
- [SPARK-37643] charVarcharAsString が true の場合、char データ型述語クエリでは rpadding ルールをスキップする必要がある
- オペレーティングシステムのセキュリティを更新。
2022 年 8 月 9 日
- [SPARK-39847] 呼び出し元スレッドが中断された場合の RocksDBLoader.loadLibrary() の競合状態を修正
- [SPARK-39731] 修正されたタイムパーサーポリシーを使用して “yyyyMMdd“ 形式で日付を解析するときの CSV および JSON データソースの問題を修正
- オペレーティングシステムのセキュリティを更新。
2022 年 7 月 27 日
- [SPARK-39625] Dataset.as(StructType) を追加
- [SPARK-39689] CSV データソースで 2 文字 lineSep をサポート
- [SPARK-39104] InMemoryRelation#isCachedColumnBuffersLoaded セーフである必要がある
- [SPARK-39570] インラインテーブルで、別名が設定された式を許可する必要がある
- [SPARK-39702] 共有 byteRawChannel を使用して TransportCipher$EncryptedMessage のメモリオーバーヘッドを削減
- [SPARK-39575] AvroDeserializer で ByteBuffer#get の後に ByteBuffer#rewind を追加
- [SPARK-39476] Long から Float か Double、または Integer から Float へのキャスト時に、アンラップキャストの最適化を無効化
- [SPARK-38868] 外部結合を最適化するときにフィルター述語から例外を伝達しない
- オペレーティングシステムのセキュリティを更新。
2022 年 7 月 20 日
- ソースが決定論的でない場合は、Delta MERGE 操作の結果を一貫性のあるものにします。
- [SPARK-39355] 単一列で引用符を使用して UnresolvedAttribute を構築
- [SPARK-39548] ウィンドウ句クエリを使用した CreateView コマンドで、誤ったウィンドウ定義がみつからない問題
- [SPARK-39419] 比較子が null を返したときに例外をスローするように ArraySort を修正
- Azureのディレクトリ一覧に対する自動ローダーによる組み込みのクラウド API の使用を無効にしました。
- オペレーティングシステムのセキュリティを更新。
2022 年 7 月 5 日
- [SPARK-39376] NATURAL/USING からのサブクエリエイリアスのスター展開で重複する列を表示しないJOIN
- オペレーティングシステムのセキュリティを更新。
2022 年 6 月 15 日
- [SPARK-39283] TaskMemoryManager と UnsafeExternalSorter.SpillableIterator の間のデッドロックを修正
- [SPARK-39285] ファイルの読み取り時に Spark でフィールド名を確認しない
- [SPARK-34096] オフセットウィンドウでの nth_value ignore nulls のパフォーマンスを向上
- [SPARK-36718] CollapseProject で isExtractOnly チェックを修正
2022 年 6 月 2 日
- [SPARK-39093] 年月の間隔または日時の間隔を整数で除算するときの codegen コンパイルエラーを回避
- [SPARK-38990] バインドされた参照として date_trunc/trunc 形式を評価するときの NullPointerException を回避
- オペレーティングシステムのセキュリティを更新。
2022 年 5 月 18 日
- 自動ローダーで組み込みメモリリークが発生する可能性がある問題を修正しました。
- [SPARK-38918] 入れ子になった列の排除で、現在のリレーションシップに属していない属性を除外する必要がある
- [SPARK-37593] G1GC および ON_HEAP が使用される場合、LONG_ARRAY_OFFSET 別の既定ページサイズを縮小
- [SPARK-39084]df.rdd.isEmpty() が修正され、TaskContext を使用してタスクの完了時に反復子を停止
- [SPARK-32268] injectBloomFilter に ColumnPruning を追加
- [SPARK-38974] リスト関数で指定されたデータベース名を使用して、登録されている関数をフィルター処理
- [SPARK-38931] 第 1 チェックポイントのキー数が不明な RocksDBFileManager のルート dfs ディレクトリを作成
- オペレーティングシステムのセキュリティを更新。
2022 年 4 月 19 日
- AWS SDK Javaバージョン 1.11.655 から 1.12.1899 にアップグレードされました。
- ノートブックスコープのライブラリがバッチストリーミングジョブで動作しない問題を修正しました。
- [SPARK-38616] Catalyst TreeNode で SQL クエリテキストを追跡
- オペレーティングシステムのセキュリティを更新。
2022 年 4 月 6 日
- このリリースでは、次の Spark SQL 関数を使用できるようになりました。
  - timestampadd() および dateadd(): タイムスタンプ式に、指定した単位の期間を追加します。
  - timestampdiff() および datediff(): 指定した単位で 2 つの異なるタイムスタンプ式間の時間差を計算します。
- Parquet-MR が 1.12.2 にアップグレードされました
- Parquet ファイルの包括的なスキーマのサポートを改善
- [SPARK-38631] Utils.unpack での展開解除にJavaベースの実装を採用しています
- [SPARK-38509][SPARK-38481] 3 つの timestmapadd/diff 変更をチェリーピック。
- [SPARK-38523] CSV の破損したレコード列への参照を修正
- [SPARK-38237] 完全なクラスターリングキーを要求できるように ClusteredDistribution を許可
- [SPARK-38437] データソースからの datetime の厳密ではないシリアル化
- [SPARK-38180] 相関等価述語で安全なアップキャスト式を許可する
- [SPARK-38155] サポートされていない述語を持つ lateral サブクエリの個別の集計を禁止する
- オペレーティングシステムのセキュリティを更新。

Databricks Runtime 13.0

「Databricks Runtime 13.0 (EoS)」を参照してください。

2023 年 10 月 13 日
- Snowflake-jdbc 依存関係が 3.13.29 から 3.13.33 にアップグレードされました。
- [SPARK-42553][SQL] 間隔の後に少なくとも 1 つの時間単位を確保。
- [SPARK-45178] ラッパーを使用するのではなく、サポートされていないソースを使って Trigger.AvailableNow の単一バッチを実行するようにフォールバック。
- [SPARK-44658][CORE] ShuffleStatus.getMapStatus は、None ではなく Some(null) を返す。
- [SPARK-42205][CORE] JsonProtocol のタスク/ステージ開始イベントの Accumulables のログを削除。
- オペレーティングシステムのセキュリティを更新。
2023 年 9 月 12 日
- [SPARK-44485][SQL] TreeNode.generateTreeString を最適化。
- [SPARK-44718][SQL] ColumnVector メモリリード構成の既定値を OffHeapMemoryMode 構成値に一致させる。
- 各種のバグ修正。
2023 年 8 月 30 日
- [SPARK-44818][Backport] taskThread の初期化前に発行された保留タスク割り込みの競合を修正。
- [SPARK-44714] クエリに関する LCA 解決の制限を緩和します。
- [SPARK-44245][PYTHON] pyspark.sql.dataframe sample() doctests は説明のみになりました。
- [SPARK-44871][11.3-13.0][SQL] percentile_disc の動作を修正。
- オペレーティングシステムのセキュリティを更新。
2023 年 8 月 15 日
- [SPARK-44643][SQL][PYTHON] 行が空の場合の Row.__repr__ を修正。
- [SPARK-44504][Backport] メンテナンスタスクで、停止エラー時に読み込まれたプロバイダーをクリーンアップ。
- [SPARK-44479][CONNECT][PYTHON] 空の構造体型からの protobuf の変換を修正。
- [SPARK-44464][SS] 最初の列値として applyInPandasWithStatePythonRunner を持つ出力行に対する Null を修正。
- 各種のバグ修正。
2023 年 7 月 29 日
- 他の外部またはマネージドストレージの場所と競合するストレージの場所のパスを呼び出すと、dbutils.fs.ls() が INVALID_PARAMETER_VALUE.LOCATION_OVERLAP を返すバグを修正しました。
- [SPARK-44199]CacheManager は、fileIndex を不必要に更新しなくなりました。
- オペレーティングシステムのセキュリティを更新。
2023 年 7 月 24 日
- [SPARK-44337][PROTOBUF] Any.getDefaultInstance に設定された任意のフィールドで解析エラーが発生する問題を修正。
- [SPARK-44136] [SS] StateManager が FlatMapGroupsWithStateExec のドライバーではなく、Executor で具体化される問題を修正。
- “[SPARK-42323][SQL] _LEGACY_ERROR_TEMP_2332 に名前を割り当てる“ を元に戻します。
- オペレーティングシステムのセキュリティを更新。
2023 年 6 月 23 日
- オペレーティングシステムのセキュリティを更新。
2023 年 6 月 15 日
- approx_count_distinct が Photon に対応しました。
- snowflake-jdbc ライブラリはセキュリティの問題に対処するために 3.13.29 にアップグレードされます。
- [SPARK-43156][SPARK-43098][SQL] decorrelateInnerQuery が無効な状態で、スカラーサブクエリカウントバグテストを拡張。
- [SPARK-43779][SQL] ParseToDate が、メインスレッドの EvalMode を読み込むようになった。
- [SPARK-42937][SQL] PlanSubqueries は InSubqueryExec#shouldBroadcast を true に設定する必要があります。
- オペレーティングシステムのセキュリティを更新。
2023 年 6 月 2 日
- failOnUnknownFields モードの JSON パーサーは、DROPMALFORMED モードでレコードを削除し、FAILFAST モードで直接失敗します。
- SHALLOW CLONE Iceberg と Parquet を使用して増分更新のパフォーマンスを向上させます。
- 指定されたスキーマに推論されたパーティションが含まれていなかったため、異なるソースファイル形式に一貫性がなかった自動ローダーの問題を修正しました。この問題により、推論されたパーティションスキーマに列がないファイルの読み取り時に予期しない失敗が発生していた可能性があります。
- [SPARK-43404][Backport] ID の不一致エラーを回避するために、同じバージョンの RocksDB 状態ストアの sst ファイルの再利用をスキップ。
- [SPARK-43340][CORE] イベントログにスタックトレースフィールドが見つからない問題を修正。
- [SPARK-43300][CORE] NonFateSharingCache Guava Cache のラッパー。
- [SPARK-43378][CORE] deserializeFromChunkedBuffer 内のストリームオブジェクトを適切に閉じる。
- [SPARK-16484][SQL] DataSketches を表す 8 ビットレジスタを使用。
- [SPARK-43522][SQL] 配列のインデックスを含む構造体列名の作成の問題を修正。
- [SPARK-43413][11.3-13.0][SQL] IN サブクエリの ListQuery NULL 値の許容を修正。
- [SPARK-43043][CORE] MapOutputTracker.updateMapOutput パフォーマンスを改善。
- [SPARK-16484][SQL] DataSketches HllSketch のサポートのサポートを追加。
- [SPARK-43123][SQL] 内部フィールドメタデータがカタログにリークしなくなった。
- [SPARK-42851][SQL] EquivalentExpressions.addExpr() で supportedExpression() を保護。
- [SPARK-43336][SQL] Timestamp と TimestampNTZ の間のキャストにはタイムゾーンが必要。
- [SPARK-43286][SQL] ランダムな IV を生成するように aes_encrypt の CBC モードを更新。
- [SPARK-42852][SQL] NamedLambdaVariable の EquivalentExpressions 関連変更を元に戻した。
- [SPARK-43541][SQL] 式と不足している列の解決時にすべてのProject タグを伝達します。.
- [SPARK-43527][PYTHON] PySpark の catalog.listCatalogs の問題を修正。
- オペレーティングシステムのセキュリティを更新。
2023 年 5 月 31 日
- Unity Catalog に登録されている Delta テーブルの既定の最適化された書き込みサポートは、パーティションテーブルの CTAS ステートメントと INSERT 操作を含むように拡張されました。この動作は、SQL ウェアハウスの既定値に合わせて調整されます。「最適化された書き込み」を参照してください。
2023 年 5 月 17 日
- _metadata.file_path と _metadata.file_name が、正しく書式設定されていない文字列を返す不具合を修正しました。たとえば、スペースを含むパスが s3://test-bucket/some%20directory/some%20data.csv ではなく s3://test-bucket/some directory/some data.csv として表されるようになりました。
- バッチサイズを動的に調整することで、非常に構造化されたファイルをスキャンするときに、Parquet スキャンが OOM に対して堅牢になりました。バッチサイズを大幅に小さくするためにファイルメタデータが分析され、最終的なセーフティネットとしてタスクの再試行時に再度低下します。
- - Avro ファイルが、failOnUnknownFields オプションだけを使用するか、failOnNewColumns スキーマ展開モードで自動ローダーを使用して読み取られた場合、異なるデータ型の列は、ファイルを読み取ることができないというエラーがスローされる代わりに、null として読み取られます。これらの読み取りは失敗し、ユーザーは rescuedDataColumn オプションを使用することが推奨されます。
- 自動ローダーで次の処理を行うようになりました。
- - Integer、Short、Byte のデータ型のいずれかが指定されている場合は、型が正しく読み取られ、復旧されなくなりましたが、Avro ファイルでは他の 2 つの型のいずれかが提案されます。
- - date 型または time stamp 型として interval 型を読み取らないようにし、破損した日付を取得しないようにします。
- - 精度が低い Decimal 型を読み取らないようにします。
- [SPARK-43172] [CONNECT] Spark Connect クライアントからホストとトークンを公開。
- [SPARK-43293][SQL] __qualified_access_only は通常の列では無視されます。
- [SPARK-43098][SQL] スカラーサブクエリが句でグループ化されている場合の正確性の COUNT バグを修正。
- [SPARK-43085][SQL] マルチパートテーブル名の列の DEFAULT 割り当てのサポート。
- [SPARK-43190][SQL] ListQuery.childOutput がセカンダリ出力と一致するようになりました。
- [SPARK-43192] [CONNECT] ユーザーエージェントの文字セット検証を削除。
2023 年 4 月 25 日
- Delta テーブルを変更して、DeltaTable.addFeatureSupport(feature_name) を使用して Delta テーブル機能のサポートを追加できます。
- SYNC コマンドの従来のデータソース形式がサポートされるようになりました。
- Python ノートブックで他のコマンドを実行する前に Python フォーマッタを使用すると、ノートブックパスが sys.path. から見つからない可能性があるバグを修正しました
- Azure Databricksでは、Delta テーブルの列の既定値の指定がサポートされるようになりました。 INSERT、 UPDATE、 DELETE、および MERGE コマンドは、明示的な DEFAULT キーワードを使用して列の既定値を参照できます。 INSERT コマンドで、明示的な列のリストがターゲットテーブルよりも少ない場合、残りの列について、対応する列の既定値が置き換えられます (または、既定値が指定されていない場合は NULL)。

一部のユーザーについて、/Workspace のファイルにアクセスするために Web ターミナルを使用できなかったバグを修正しました。
- Parquet ファイルが、failOnUnknownFields オプションだけを使用するか、failOnNewColumns スキーマ展開モードで自動ローダーを使用して読み取られた場合、異なるデータ型の列は、ファイルを読み取ることができないというエラーがスローされる代わりに、null として読み取られます。これらの読み取りは失敗し、ユーザーは rescuedDataColumn オプションを使用することが推奨されます。
- Integer、Short、Byte のデータ型のいずれかが指定されている場合、自動ローダーで型が正しく読み取られるようになり、復旧されなくなりました。 Parquet ファイルでは、他の 2 つの型のいずれかが提案されます。復旧されたデータ列が以前に有効になっていた場合、データ型の不一致により、列は読み取り可能であっても復旧されます。
- 入れ子になった JSON オブジェクトのスキーマで新しい列が検出されると、自動ローダースキーマの展開が無限の失敗ループに入る可能性があるバグを修正しました。
- [SPARK-42794][SS] 構造化ストリーミングの RocksDB 状態ストアを取得するための lockAcquireTimeoutMs を 2 分に増やす。
- [SPARK-39221][SQL] Thrift サーバージョブ/ステージタブの機密情報を正しく編集。
- [SPARK-42971][CORE] ワーカーが workdir イベントを処理する際に、appDirs が Null の場合に、出力 WorkDirCleanup を変更。
- [SPARK-42936][SQL] having 句をその子集計で直接解決できる場合の LCA バグを修正。
- [SPARK-43018][SQL] タイムスタンプリテラルを含む INSERT コマンドのバグを修正。
- “[SPARK-42754][SQL] [UI] 入れ子になった SQL 実行での下位互換性の問題を修正“ を元に戻します。
- “[SPARK-41498] Union を介してメタデータを伝達“ を元に戻します。
- [SPARK-43038][SQL] aes_encrypt()/aes_decrypt() による CBC モードをサポート。
- [SPARK-42928][SQL] resolvePersistentFunction を同期。
- [SPARK-42521][SQL] ターゲットテーブルよりも少ない列のユーザー指定リストを使用して、NULL に INSERT 値を追加。
- [SPARK-41391][SQL] groupBy.agg(count_distinct) の出力列名が正しくない。
- [SPARK-42548][SQL] 属性の書き換えをスキップするために ReferenceAllColumns を追加。
- [SPARK-42423][SQL] メタデータ列ファイルのブロックの開始と長さを追加。
- [SPARK-42796][SQL] TimestampNTZ での CachedBatch 列へのアクセスをサポート。
- [SPARK-42266][PYTHON] IPython を使用するときに shell.py 実行の親ディレクトリを削除。
- [SPARK-43011][SQL] array_insert は 0 インデックスで失敗する。
- [SPARK-41874][CONNECT][PYTHON] Spark Connect で SameSemantics をサポート。
- [SPARK-42702][SPARK-42623][SQL] サブクエリと CTE でパラメーター化されたクエリをサポート。
- [SPARK-42967][CORE] ステージのキャンセル後にタスクが開始されたときの SparkListenerTaskStart.stageAttemptId を修正。
- オペレーティングシステムのセキュリティを更新。

Databricks Runtime 12.1

「Databricks Runtime 12.1 (EoS)」を参照してください。

2023 年 6 月 23 日
- オペレーティングシステムのセキュリティを更新。
2023 年 6 月 15 日
- approx_count_distinct が Photon に対応しました。
- snowflake-jdbc ライブラリはセキュリティの問題に対処するために 3.13.29 にアップグレードされます。
- [SPARK-43779][SQL] ParseToDate が、メインスレッドの EvalMode を読み込むようになった。
- [SPARK-43156][SPARK-43098][SQL] decorrelateInnerQuery が無効な状態で、スカラーサブクエリカウントバグテストを拡張。
- オペレーティングシステムのセキュリティを更新。
2023 年 6 月 2 日
- failOnUnknownFields モードの JSON パーサーは、DROPMALFORMED モードでレコードを削除し、FAILFAST モードで直接失敗します。
- SHALLOW CLONE Iceberg と Parquet を使用して増分更新のパフォーマンスを向上させます。
- 指定されたスキーマに推論されたパーティションが含まれていなかったため、異なるソースファイル形式に一貫性がなかった自動ローダーの問題を修正しました。この問題により、推論されたパーティションスキーマに列がないファイルの読み取り時に予期しない失敗が発生していた可能性があります。
- [SPARK-43404][Backport] ID の不一致エラーを回避するために、同じバージョンの RocksDB 状態ストアの sst ファイルの再利用をスキップ。
- [SPARK-43413][11.3-13.0][SQL] IN サブクエリの ListQuery NULL 値の許容を修正。
- [SPARK-43522][SQL] 配列のインデックスを含む構造体列名の作成の問題を修正。
- [SPARK-42444][PYTHON] DataFrame.drop が重複した列を適切に処理するようになった。
- [SPARK-43541][SQL] 式と不足している列の解決時にすべてのProject タグを伝達します。.
- [SPARK-43340][CORE] イベントログにスタックトレースフィールドが見つからない問題を修正。
- [SPARK-42937][SQL] PlanSubqueries が InSubqueryExec#shouldBroadcast を True に設定するようになった。
- [SPARK-43527][PYTHON] PySpark の catalog.listCatalogs の問題を修正。
- [SPARK-43378][CORE] deserializeFromChunkedBuffer 内のストリームオブジェクトを適切に閉じる。
2023年5月17日
- バッチサイズを動的に調整することで、非常に構造化されたファイルをスキャンするときに、Parquet スキャンが OOM に対して堅牢になりました。バッチサイズを大幅に小さくするためにファイルメタデータが分析され、最終的なセーフティネットとしてタスクの再試行時に再度低下します。
- Avro ファイルが、failOnUnknownFields オプションだけを使用するか、failOnNewColumns スキーマ展開モードで自動ローダーを使用して読み取られた場合、異なるデータ型の列は、ファイルを読み取ることができないというエラーがスローされる代わりに、null として読み取られます。これらの読み取りは失敗し、ユーザーは rescuedDataColumn オプションを使用することが推奨されます。
- 自動ローダーで次の処理を行うようになりました。
- - Integer、Short、Byte のデータ型のいずれかが指定されている場合は、型が正しく読み取られ、復旧されなくなりましたが、Avro ファイルでは他の 2 つの型のいずれかが提案されます。
- - date 型または time stamp 型として interval 型を読み取らないようにし、破損した日付を取得しないようにします。
- - 精度が低い Decimal 型を読み取らないようにします。
- [SPARK-43098][SQL] スカラーサブクエリが句でグループ化されている場合の正確性の COUNT バグを修正。
- [SPARK-43190][SQL] ListQuery.childOutput がセカンダリ出力と一致するようになりました。
- オペレーティングシステムのセキュリティを更新。
2023 年 4 月 25 日
- Parquet ファイルが、failOnUnknownFields オプションだけを使用するか、failOnNewColumns スキーマ展開モードで自動ローダーを使用して読み取られた場合、異なるデータ型の列は、ファイルを読み取ることができないというエラーがスローされる代わりに、null として読み取られます。これらの読み取りは失敗し、ユーザーは rescuedDataColumn オプションを使用することが推奨されます。
- Integer、Short、Byte のデータ型のいずれかが指定されている場合、自動ローダーで型が正しく読み取られるようになり、復旧されなくなりました。 Parquet ファイルでは、他の 2 つの型のいずれかが提案されます。復旧されたデータ列が以前に有効になっていた場合、データ型の不一致により、列は読み取り可能であっても復旧されます。
- [SPARK-43009][SQL] sql() 定数で Any をパラメーター化。
- [SPARK-42971][CORE] ワーカーが workdir イベントを処理する際に、appDirs が Null の場合に、出力 WorkDirCleanup を変更。
- オペレーティングシステムのセキュリティを更新。
2023 年 4 月 11 日
- SYNC コマンドの従来のデータソース形式をサポートします。
- リポジトリの外部にある Notebooks の %autoreload 動作のバグを修正しました。
- 入れ子になった JSON オブジェクトのスキーマで新しい列が検出されると、自動ローダースキーマの展開が無限の失敗ループに入る可能性があるバグを修正しました。
- [SPARK-42928][SQL] resolvePersistentFunction を同期。
- [SPARK-42967][CORE] ステージのキャンセル後にタスクが開始されたときの SparkListenerTaskStart.stageAttemptId を修正。
- オペレーティングシステムのセキュリティを更新。
2023 年 3 月 29 日
- 自動ローダーでは、高速で実行される自動ローダーストリームに対してチェックポイントを定期的にクリーンアップできることを確認するために、Trigger.AvailableNow ストリーム用に少なくとも 1 つの同期 RocksDB ログクリーンを開始するようになりました。これにより、一部のストリームがシャットダウンされるまでに時間がかかる場合がありますが、ストレージコストが節約され、今後の実行で自動ローダーのエクスペリエンスが向上します。
- Delta テーブルを変更して、DeltaTable.addFeatureSupport(feature_name) を使用してテーブル機能のサポートを追加できるようになりました。
- [SPARK-42702][SPARK-42623][SQL] サブクエリと CTE でパラメーター化されたクエリをサポート。
- [SPARK-41162][SQL] 集計を使用した自己結合の反結合および半結合を修正
- [SPARK-42403][CORE] JsonProtocol で null JSON 文字列を処理する必要がある
- [SPARK-42668][SS] HDFSStateStoreProvider 中断で圧縮ストリームを閉じようとしているときに例外をキャッチ
- [SPARK-42794][SS] 構造化ストリーミングの RocksDB 状態ストアを取得するために lockAcquireTimeoutMs を 2 分に増やす
2023 年 3 月 14 日
- table プロパティを使用して Delta テーブルに機能を追加するための用語の変更があります。推奨される構文は、'delta.feature.featureName'='supported' ではなく 'delta.feature.featureName'='enabled' になりました。下位互換性のために、'delta.feature.featureName'='enabled' を使用しても引き続き動作し、今後も引き続き動作します。
- [SPARK-42622][CORE] 値の置換を無効にする
- [SPARK-42534][SQL] DB2Dialect Limit 句を修正
- [SPARK-42635][SQL] TimestampAdd 式を修正。
- [SPARK-42516][SQL] ビューの作成時にセッションタイムゾーン構成を常にキャプチャする
- [SPARK-42484][SQL] UnsafeRowUtils のエラーメッセージを改善
- [SPARK-41793][SQL] 大規模な10 進数の範囲句で定義されたウィンドウフレームの結果が正しくない
- オペレーティングシステムのセキュリティを更新。
2023 年 2 月 24 日
- クエリフェデレーション (PostgreSQL、MySQL、Synapse、Snowflake、Redshift、SQL Server) でサポートされているデータソースに接続するために、統合された一連のオプション (host、port、database、user、password) を使用できるようになりました。 port は省略可能であり、指定されていない場合は各データソースの既定のポート番号を使用します。
PostgreSQL 接続構成の例
```
CREATE TABLE postgresql_table
USING postgresql
OPTIONS (
  dbtable '<table-name>',
  host '<host-name>',
  database '<database-name>',
  user '<user>',
  password secret('scope', 'key')
);
```
Snowflake 接続構成の例
```
CREATE TABLE snowflake_table
USING snowflake
OPTIONS (
  dbtable '<table-name>',
  host '<host-name>',
  port '<port-number>',
  database '<database-name>',
  user secret('snowflake_creds', 'my_username'),
  password secret('snowflake_creds', 'my_password'),
  schema '<schema-name>',
  sfWarehouse '<warehouse-name>'
);
```
- [SPARK-41989][PYTHON] pyspark.pandas からのログ記録の構成を中断しないようにする
- [SPARK-42346][SQL] サブクエリのマージ後に個別の集計を書き換える
- [SPARK-41990][SQL] V1 から V2 へのフィルター変換で FieldReference.column ではなく apply を使用する
- “[SPARK-41848][CORE] TaskResourceProfile でスケジュール超過のタスクを修正“ を元に戻す
- [SPARK-42162] 可換式の大きなツリーを正規化するためのメモリ最適化として MultiCommutativeOp 式を導入する
- オペレーティングシステムのセキュリティを更新。
2023 年 2 月 16 日
- SYNC コマンドでは、再作成された Hive メタストアテーブルの同期がサポートされます。 HMS テーブルが以前に Unity Catalog に同期された後に削除されて再作成された場合、その後の再同期は、状態コード　TABLE_ALREADY_EXISTS をスローする代わりに機能します。
- [SPARK-41219][SQL] IntegralDivide は 10 進数 (1、0) を使用して 0 を表す
- [SPARK-36173][CORE] TaskContext での CPU 番号の取得をサポート
- [SPARK-41848][CORE] TaskResourceProfile でスケジュール超過のタスクを修正
- [SPARK-42286][SQL] CAST を使用した複雑な expr の以前の codegen コードパスにフォールバック
2023 年 1 月 31 日
- 定義された場所でスキーマを作成するには、ユーザーが ANY FILE に対する SELECT および MODIFY 権限を持っている必要があります。
- [SPARK-41581][SQL] 名前を _LEGACY_ERROR_TEMP_1230 に割り当てる
- [SPARK-41996][SQL][SS] Kafka テストを修正して、失われたパーティションを検証し、低速の Kafka 操作を考慮するようにする
- [SPARK-41580][SQL] 名前を _LEGACY_ERROR_TEMP_2137 に割り当てる
- [SPARK-41666][PYTHON] sql() によるパラメーター化された SQL をサポート
- [SPARK-41579][SQL] 名前を _LEGACY_ERROR_TEMP_1249 に割り当てる
- [SPARK-41573][SQL] 名前を _LEGACY_ERROR_TEMP_2136 に割り当てる
- [SPARK-41574][SQL] 名前を _LEGACY_ERROR_TEMP_2009 に割り当てる
- [SPARK-41049][Followup] ConvertToLocalRelation のコード同期の不具合を修正
- [SPARK-41576][SQL] 名前を _LEGACY_ERROR_TEMP_2051 に割り当てる
- [SPARK-41572][SQL] 名前を _LEGACY_ERROR_TEMP_2149 に割り当てる
- [SPARK-41575][SQL] 名前を _LEGACY_ERROR_TEMP_2054 に割り当てる
- オペレーティングシステムのセキュリティを更新。

Databricks Runtime 12.0

「Databricks Runtime 12.0 (EoS)」を参照してください。

2023 年 6 月 15 日
- approx_count_distinct が Photon に対応しました。
- snowflake-jdbc ライブラリはセキュリティの問題に対処するために 3.13.29 にアップグレードされます。
- [SPARK-43156][SPARK-43098][SQL] decorrelateInnerQuery が無効な状態で、スカラーサブクエリカウントバグテストを拡張。
- [SPARK-43779][SQL] ParseToDate が、メインスレッドの EvalMode を読み込むようになった。
- オペレーティングシステムのセキュリティを更新。
2023 年 6 月 2 日
- failOnUnknownFields モードの JSON パーサーは、DROPMALFORMED モードでレコードを削除し、FAILFAST モードで直接失敗します。
- SHALLOW CLONE Iceberg と Parquet を使用して増分更新のパフォーマンスを向上させます。
- 指定されたスキーマに推論されたパーティションが含まれていなかったため、異なるソースファイル形式に一貫性がなかった自動ローダーの問題を修正しました。この問題により、推論されたパーティションスキーマに列がないファイルの読み取り時に予期しない失敗が発生していた可能性があります。
- [SPARK-42444][PYTHON] DataFrame.drop が重複した列を適切に処理するようになった。
- [SPARK-43404][Backport] ID の不一致エラーを回避するために、同じバージョンの RocksDB 状態ストアの sst ファイルの再利用をスキップ。
- [SPARK-43413][11.3-13.0][SQL] IN サブクエリの ListQuery NULL 値の許容を修正。
- [SPARK-43527][PYTHON] PySpark の catalog.listCatalogs の問題を修正。
- [SPARK-43522][SQL] 配列のインデックスを含む構造体列名の作成の問題を修正。
- [SPARK-43541][SQL] 式と不足している列の解決時にすべてのProject タグを伝達します。.
- [SPARK-43340][CORE] イベントログにスタックトレースフィールドが見つからない問題を修正。
- [SPARK-42937][SQL] PlanSubqueries は InSubqueryExec#shouldBroadcast を true に設定する。
2023年5月17日
- バッチサイズを動的に調整することで、非常に構造化されたファイルをスキャンするときに、Parquet スキャンが OOM に対して堅牢になりました。バッチサイズを大幅に小さくするためにファイルメタデータが分析され、最終的なセーフティネットとしてタスクの再試行時に再度低下します。
- Avro ファイルが、failOnUnknownFields オプションだけを使用するか、failOnNewColumns スキーマ展開モードで自動ローダーを使用して読み取られた場合、異なるデータ型の列は、ファイルを読み取ることができないというエラーがスローされる代わりに、null として読み取られます。これらの読み取りは失敗し、ユーザーは rescuedDataColumn オプションを使用することが推奨されます。
- 自動ローダーで次の処理を行うようになりました。
- - Integer、Short、Byte のデータ型のいずれかが指定されている場合は、型が正しく読み取られ、復旧されなくなりましたが、Avro ファイルでは他の 2 つの型のいずれかが提案されます。
- - date 型または time stamp 型として interval 型を読み取らないようにし、破損した日付を取得しないようにします。
- - 精度が低い Decimal 型を読み取らないようにします。
- [SPARK-43172] [CONNECT] Spark Connect クライアントからホストとトークンを公開。
- [SPARK-41520][SQL] AND_OR ツリーパターンを、個別の AND と OR に分割。
- [SPARK-43098][SQL] スカラーサブクエリが句でグループ化されている場合の正確性の COUNT バグを修正。
- [SPARK-43190][SQL] ListQuery.childOutput がセカンダリ出力と一致するようになりました。
- オペレーティングシステムのセキュリティを更新。
2023 年 4 月 25 日
- Parquet ファイルが、failOnUnknownFields オプションだけを使用するか、failOnNewColumns スキーマ展開モードで自動ローダーを使用して読み取られた場合、異なるデータ型の列は、ファイルを読み取ることができないというエラーがスローされる代わりに、null として読み取られます。これらの読み取りは失敗し、ユーザーは rescuedDataColumn オプションを使用することが推奨されます。
- Integer、Short、Byte のデータ型のいずれかが指定されている場合、自動ローダーで型が正しく読み取られるようになり、復旧されなくなりました。 Parquet ファイルでは、他の 2 つの型のいずれかが提案されます。復旧されたデータ列が以前に有効になっていた場合、データ型の不一致により、列は読み取り可能であっても復旧されます。
- [SPARK-42971][CORE] ワーカーが workdir イベントを処理する際に、appDirs が Null の場合に、出力 WorkDirCleanup を変更
- オペレーティングシステムのセキュリティを更新。
2023 年 4 月 11 日
- SYNC コマンドの従来のデータソース形式をサポートします。
- リポジトリの外部にある Notebooks の %autoreload 動作のバグを修正しました。
- 入れ子になった JSON オブジェクトのスキーマで新しい列が検出されると、自動ローダースキーマの展開が無限の失敗ループに入る可能性があるバグを修正しました。
- [SPARK-42928][SQL] resolvePersistentFunction を同期。
- [SPARK-42967][CORE] ステージのキャンセル後にタスクが開始されたときの SparkListenerTaskStart.stageAttemptId を修正。
- オペレーティングシステムのセキュリティを更新。
2023 年 3 月 29 日
- [SPARK-42794][SS] 構造化ストリーミングの RocksDB 状態ストアを取得するために lockAcquireTimeoutMs を 2 分に増やす
- [SPARK-41162][SQL] 集計を使用した自己結合の反結合および半結合を修正
- [SPARK-42403][CORE] JsonProtocol で null JSON 文字列を処理する必要がある
- [SPARK-42668][SS] HDFSStateStoreProvider 中断で圧縮ストリームを閉じようとしているときに例外をキャッチ
- 各種のバグ修正。
2023 年 3 月 14 日
- [SPARK-42534][SQL] DB2Dialect Limit 句を修正
- [SPARK-42622][CORE] 値の置換を無効にする
- [SPARK-41793][SQL] 大規模な10 進数の範囲句で定義されたウィンドウフレームの結果が正しくない
- [SPARK-42484][SQL] UnsafeRowUtils のエラーメッセージを改善
- [SPARK-42635][SQL] TimestampAdd 式を修正。
- [SPARK-42516][SQL] ビューの作成時にセッションタイムゾーン構成を常にキャプチャする
- オペレーティングシステムのセキュリティを更新。
2023 年 2 月 24 日
- クエリフェデレーションの標準化された接続オプション
  
  クエリフェデレーション (PostgreSQL、MySQL、Synapse、Snowflake、Redshift、SQL Server) でサポートされているデータソースに接続するために、統合された一連のオプション (host、port、database、user、password) を使用できるようになりました。 port は省略可能であり、指定されていない場合は各データソースの既定のポート番号を使用します。
  
  PostgreSQL 接続構成の例
```
CREATE TABLE postgresql_table
USING postgresql
OPTIONS (
  dbtable '<table-name>',
  host '<host-name>',
  database '<database-name>',
  user '<user>',
  password secret('scope', 'key')
);
```
  Snowflake 接続構成の例
```
CREATE TABLE snowflake_table
USING snowflake
OPTIONS (
  dbtable '<table-name>',
  host '<host-name>',
  port '<port-number>',
  database '<database-name>',
  user secret('snowflake_creds', 'my_username'),
  password secret('snowflake_creds', 'my_password'),
  schema '<schema-name>',
  sfWarehouse '<warehouse-name>'
);
```
- “[SPARK-41848][CORE] TaskResourceProfile でスケジュール超過のタスクを修正“ を元に戻す
- [SPARK-42162] 可換式の大きなツリーを正規化するためのメモリ最適化として MultiCommutativeOp 式を導入する
- [SPARK-41990][SQL] V1 から V2 へのフィルター変換で FieldReference.column ではなく apply を使用する
- [SPARK-42346][SQL] サブクエリのマージ後に個別の集計を書き換える
- オペレーティングシステムのセキュリティを更新。
2023 年 2 月 16 日
- ユーザーは Databricks Runtime 9.1 以降を使用して、Reader バージョン 3 と Writer バージョン 7 を必要とする特定の Delta テーブルの読み取りと書き込みができるようになりました。成功するには、テーブルのプロトコルに記載されているテーブル機能が、Databricks Runtime の現在のバージョンでサポートされている必要があります。
- SYNC コマンドでは、再作成された Hive メタストアテーブルの同期がサポートされます。 HMS テーブルが以前に Unity Catalog に同期された後に削除されて再作成された場合、その後の再同期は、状態コード　TABLE_ALREADY_EXISTS をスローする代わりに機能します。
- [SPARK-36173][CORE] TaskContext での CPU 番号の取得をサポート
- [SPARK-42286][SQL] CAST を使用した複雑な expr の以前の codegen コードパスにフォールバック
- [SPARK-41848][CORE] TaskResourceProfile でスケジュール超過のタスクを修正
- [SPARK-41219][SQL] IntegralDivide は 10 進数 (1、0) を使用して 0 を表す
2023 年 1 月 25 日
- [SPARK-41660][SQL] メタデータ列が使用されている場合にのみ反映
- [SPARK-41379][SS][PYTHON] PySpark の foreachBatch シンクのユーザー関数で DataFrame に複製された Spark セッションを提供
- [SPARK-41669][SQL] canCollapseExpressions の早期排除
- オペレーティングシステムのセキュリティを更新。
2023 年 1 月 18 日
- REFRESH FUNCTION SQL コマンドで SQL 関数と SQL Table 関数がサポートされるようになりました。たとえば、このコマンドを使用して、別の SQL セッションで更新された永続的な SQL 関数を更新できます。
- Java Database Connectivity (JDBC) データソース v1 では、クエリのパフォーマンスを向上させるために、LIMIT 句のプッシュダウンがサポートされるようになりました。この機能は既定で有効になっていて、spark.databricks.optimizer.jdbcDSv1LimitPushdown.enabled を false に設定することで無効にできます。
- レガシテーブル ACL クラスターで、JVM クラスを参照する関数を作成するには、MODIFY_CLASSPATH 特権が必要になりました。
- Java Database Connectivity (JDBC) データソース v1 では、クエリのパフォーマンスを向上させるために、LIMIT 句のプッシュダウンがサポートされるようになりました。この機能は既定で有効になっていて、spark.databricks.optimizer.jdbcDSv1LimitPushdown.enabled を false に設定することで無効にできます。
- Azure Synapseコネクタは、列名に空白やセミコロンなどの無効な文字が含まれている場合に、よりわかりやすいエラーメッセージを返すようになりました。このような場合は、次のメッセージが返されます: Azure Synapse Analytics failed to execute the JDBC query produced by the connector. Make sure column names do not include any invalid characters such as ';' or whitespace。
- Spark 構造化ストリーミングが、差分共有テーブルの形式 ("deltasharing") をソースとして使用できるようになりました。
- [SPARK-38277][SS] RocksDB ステートストアのコミット後に書き込みバッチをクリアする
- [SPARK-41733][SQL][SS] ResolveWindowTime のルールにツリーパターンベースの排除を適用
- [SPARK-39591][SS] 非同期進行状況の追跡
- [SPARK-41339][SQL] 単にクリアするのではなく、RocksDB 書き込みバッチを閉じて再作成
- [SPARK-41198][SS] CTE と DSv1 ストリーミングソースを持つストリーミングクエリのメトリックを修正
- [SPARK-41539][SQL] LogicalRDD の論理プランの出力に対する統計と制約を再マッピング
- [SPARK-41732][SQL][SS] SessionWindowing のルールにツリーパターンベースの排除を適用
- [SPARK-41862][SQL] Orc リーダーの既定値に関連する正確性のバグを修正
- [SPARK-41199][SS] DSv1 ストリーミングソースと DSv2 ストリーミングソースが共同使用されている場合のメトリックの問題を修正
- [SPARK-41261][PYTHON][SS] グループ化キーの列が最も古い順序で配置されない場合の applyInPandasWithState の問題を修正
- オペレーティングシステムのセキュリティを更新。
2023年5月17日
- バッチサイズを動的に調整することで、非常に構造化されたファイルをスキャンするときに、Parquet スキャンが OOM に対して堅牢になりました。バッチサイズを大幅に小さくするためにファイルメタデータが分析され、最終的なセーフティネットとしてタスクの再試行時に再度低下します。
- クラスターの初期化中にメタストアへの接続に失敗した後、Azure Databricks ジョブが保持される原因となった回帰を修正しました。
- [SPARK-41520][SQL] AND_OR ツリーパターンを、個別の AND と OR に分割。
- [SPARK-43190][SQL] ListQuery.childOutput がセカンダリ出力と一致するようになりました。
- オペレーティングシステムのセキュリティを更新。
2023 年 4 月 25 日
- Parquet ファイルが、failOnUnknownFields オプションだけを使用するか、failOnNewColumns スキーマ展開モードで自動ローダーを使用して読み取られた場合、異なるデータ型の列は、ファイルを読み取ることができないというエラーがスローされる代わりに、null として読み取られます。これらの読み取りは失敗し、ユーザーは rescuedDataColumn オプションを使用することが推奨されます。
- Integer、Short、Byte のデータ型のいずれかが指定されている場合、自動ローダーで型が正しく読み取られるようになり、復旧されなくなりました。 Parquet ファイルでは、他の 2 つの型のいずれかが提案されます。復旧されたデータ列が以前に有効になっていた場合、データ型の不一致により、列は読み取り可能であっても復旧されます。
- [SPARK-42937][SQL] PlanSubqueries が InSubqueryExec#shouldBroadcast を True に設定するようになった。
- オペレーティングシステムのセキュリティを更新。
2023 年 4 月 11 日
- SYNC コマンドの従来のデータソース形式をサポートします。
- リポジトリの外部にある Notebooks の %autoreload 動作のバグを修正しました。
- 入れ子になった JSON オブジェクトのスキーマで新しい列が検出されると、自動ローダースキーマの展開が無限の失敗ループに入る可能性があるバグを修正しました。
- [SPARK-42928][SQL] resolvePersistentFunction を同期。
- [SPARK-42967][CORE] ステージのキャンセル後にタスクが開始されたときの SparkListenerTaskStart.stageAttemptId を修正。
2023 年 3 月 29 日
- [SPARK-42794][SS] 構造化ストリーミングの RocksDB 状態ストアを取得するために lockAcquireTimeoutMs を 2 分に増やす
- [SPARK-42403][CORE] JsonProtocol で null JSON 文字列を処理する必要がある
- [SPARK-42668][SS] HDFSStateStoreProvider 中断で圧縮ストリームを閉じようとしているときに例外をキャッチ
- オペレーティングシステムのセキュリティを更新。
2023 年 3 月 14 日
- [SPARK-42635][SQL] TimestampAdd 式を修正。
- [SPARK-41793][SQL] 大規模な10 進数の範囲句で定義されたウィンドウフレームの結果が正しくない
- [SPARK-42484][SQL] UnsafeRowUtils のエラーメッセージを改善
- [SPARK-42534][SQL] DB2Dialect Limit 句を修正
- [SPARK-41162][SQL] 集計を使用した自己結合の反結合および半結合を修正
- [SPARK-42516][SQL] ビューの作成時にセッションタイムゾーン構成を常にキャプチャする
- 各種のバグ修正。
2023 年 2 月 28 日
- クエリフェデレーションの標準化された接続オプション
  
  クエリフェデレーション (PostgreSQL、MySQL、Synapse、Snowflake、Redshift、SQL Server) でサポートされているデータソースに接続するために、統合された一連のオプション (host、port、database、user、password) を使用できるようになりました。 port は省略可能であり、指定されていない場合は各データソースの既定のポート番号を使用します。
  
  PostgreSQL 接続構成の例
```
CREATE TABLE postgresql_table
USING postgresql
OPTIONS (
  dbtable '<table-name>',
  host '<host-name>',
  database '<database-name>',
  user '<user>',
  password secret('scope', 'key')
);
```
  Snowflake 接続構成の例
```
CREATE TABLE snowflake_table
USING snowflake
OPTIONS (
  dbtable '<table-name>',
  host '<host-name>',
  port '<port-number>',
  database '<database-name>',
  user secret('snowflake_creds', 'my_username'),
  password secret('snowflake_creds', 'my_password'),
  schema '<schema-name>',
  sfWarehouse '<warehouse-name>'
);
```
- [SPARK-42286][SQL] CAST を使用した複雑な expr の以前の codegen コードパスにフォールバック
- [SPARK-41989][PYTHON] pyspark.pandas からのログ記録の構成を中断しないようにする
- [SPARK-42346][SQL] サブクエリのマージ後に個別の集計を書き換える
- [SPARK-41360][CORE] Executor が失われた場合に BlockManager の再登録を回避
- [SPARK-42162] 可換式の大きなツリーを正規化するためのメモリ最適化として MultiCommutativeOp 式を導入する
- [SPARK-41990][SQL] V1 から V2 へのフィルター変換で FieldReference.column ではなく apply を使用する
- オペレーティングシステムのセキュリティを更新。
2023 年 2 月 16 日
- ユーザーは Databricks Runtime 9.1 以降を使用して、Reader バージョン 3 と Writer バージョン 7 を必要とする特定の Delta テーブルの読み取りと書き込みができるようになりました。成功するには、テーブルのプロトコルに記載されているテーブル機能が、Databricks Runtime の現在のバージョンでサポートされている必要があります。
- SYNC コマンドでは、再作成された Hive メタストアテーブルの同期がサポートされます。 HMS テーブルが以前に Unity Catalog に同期された後に削除されて再作成された場合、その後の再同期は、状態コード　TABLE_ALREADY_EXISTS をスローする代わりに機能します。
- [SPARK-41219][SQL] IntegralDivide は 10 進数 (1、0) を使用して 0 を表す
- [SPARK-40382][SQL] RewriteDistinctAggregates で意味的に等価な子によって個別の集計式をグループ化
- オペレーティングシステムのセキュリティを更新。
2023 年 1 月 25 日
- [SPARK-41379][SS][PYTHON] PySpark の foreachBatch シンクのユーザー関数で DataFrame に複製された Spark セッションを提供
- [SPARK-41660][SQL] メタデータ列が使用されている場合にのみ反映
- [SPARK-41669][SQL] canCollapseExpressions の早期排除
- 各種のバグ修正。
2023 年 1 月 18 日
- REFRESH FUNCTION SQL コマンドで SQL 関数と SQL Table 関数がサポートされるようになりました。たとえば、このコマンドを使用して、別の SQL セッションで更新された永続的な SQL 関数を更新できます。
- Java Database Connectivity (JDBC) データソース v1 では、クエリのパフォーマンスを向上させるために、LIMIT 句のプッシュダウンがサポートされるようになりました。この機能は既定で有効になっていて、spark.databricks.optimizer.jdbcDSv1LimitPushdown.enabled を false に設定することで無効にできます。
- Java Database Connectivity (JDBC) データソース v1 では、クエリのパフォーマンスを向上させるために、LIMIT 句のプッシュダウンがサポートされるようになりました。この機能は既定で有効になっていて、spark.databricks.optimizer.jdbcDSv1LimitPushdown.enabled を false に設定することで無効にできます。
- Azure Synapseコネクタは、列名に空白やセミコロンなどの無効な文字が含まれている場合に、よりわかりやすいエラーメッセージを返すようになりました。このような場合は、次のメッセージが返されます: Azure Synapse Analytics failed to execute the JDBC query produced by the connector. Make sure column names do not include any invalid characters such as ';' or whitespace。
- [SPARK-41198][SS] CTE と DSv1 ストリーミングソースを持つストリーミングクエリのメトリックを修正
- [SPARK-41862][SQL] Orc リーダーの既定値に関連する正確性のバグを修正
- [SPARK-41539][SQL] LogicalRDD の論理プランの出力に対する統計と制約を再マッピング
- [SPARK-39591][SS] 非同期進行状況の追跡
- [SPARK-41199][SS] DSv1 ストリーミングソースと DSv2 ストリーミングソースが共同使用されている場合のメトリックの問題を修正
- [SPARK-41261][PYTHON][SS] グループ化キーの列が最も古い順序で配置されない場合の applyInPandasWithState の問題を修正
- [SPARK-41339][SQL] 単にクリアするのではなく、RocksDB 書き込みバッチを閉じて再作成
- [SPARK-41732][SQL][SS] SessionWindowing のルールにツリーパターンベースの排除を適用
- [SPARK-38277][SS] RocksDB ステートストアのコミット後に書き込みバッチをクリアする
- オペレーティングシステムのセキュリティを更新。
2022 年 11 月 29 日
- ユーザーは、Redshift コネクタを使用してデータを書き込むときに、先頭と末尾の空白の動作を構成できます。空白の処理をコントロールするために、次のオプションが追加されました:
  - csvignoreleadingwhitespace に設定されると、true、tempformat が、 CSV または CSV GZIP に設定されると、書き込み中に先頭の空白文字が値から削除されます。空白は、構成がfalse に設定されている場合に保持されます。既定値は true です。
  - csvignoretrailingwhitespaceに設定されると、true、tempformat がCSV または CSV GZIP に設定されると、書き込み中に末尾のの空白文字が値から削除されます。空白は、構成がfalse に設定されている場合に保持されます。既定値は true です。
- すべての列が文字列 (cloudFiles.inferColumnTypes はfalseに設定または設定されていない) として残され、JSON に入れ子になったオブジェクトが含まれている場合、自動ローダーでの JSON 解析のバグを修正しました。
- snowflake-jdbc依存関係をバージョン 3.13.22 にアップグレードします。
- JDBC テーブルのテーブルの種類が既定では EXTERNAL になりました。
- [SPARK-40906][SQL]Mode Mapに挿入する前にキーをコピーする必要がある
- オペレーティングシステムのセキュリティを更新。
2022 年 11 月 15 日
- テーブル ACL と UC 共有クラスターで、Python の Dataset.toJSON メソッドが許可されるようになりました。
- [SPARK-40646] 構造体、マップ、配列の JSON 解析は修正されているため、レコードの一部がスキーマと一致しない場合でも、残りのレコードは null 値を返す代わりに正しく解析できます。改善された動作をオプトインするには、spark.sql.json.enablePartialResults を true に設定します。フラグは、元の動作を保持するために既定で無効になっています
- [SPARK-40903][SQL] データ型が変更された場合に正規化のために decimal Add の並べ替えを回避
- [SPARK-40618][SQL] 参照追跡を使用して入れ子になったサブクエリを含む MergeScalarSubqueries ルールのバグを修正
- [SPARK-40697][SQL] 外部データファイルをカバーする読み取り側の char パディングを追加
- オペレーティングシステムのセキュリティを更新。
2022 年 11 月 1 日
- Unity Catalog の構造化ストリーミングで、一時的なアクセストークンの更新がサポートされるようになりました。 Unity Catalog のすべての目的またはジョブクラスターで実行されているストリーミングワークロードは、最初のトークンの有効期限が切れた後に失敗しなくなりました。
- Delta テーブルに _change_typeという名前のユーザー定義列があるが、そのテーブルで 変更データフィード が無効になっている場合、その列のデータがMERGE の実行時に NULL 値で誤って入力される問題を修正しました。
- MERGE を実行して条件でソースから 99 列を使用すると、 java.lang.ClassCastException: org.apache.spark.sql.vectorized.ColumnarBatch cannot be cast to org.apache.spark.sql.catalyst.InternalRowが発生する可能性がある問題を修正しました。
- allowOverwrites が有効になっている場合に、同じマイクロバッチでファイルを複製できる自動ローダーの問題を修正しました。
- Apache commons-text を 1.10.0 にアップグレードしました。
- [SPARK-38881][DSTREAMS][KINESIS][PYSPARK] CloudWatch MetricsLevel Config のサポートを追加
- [SPARK-40596][CORE] ExecutorDecommission に ExecutorDecommissionInfo のメッセージを設定
- [SPARK-40670][SS][PYTHON] 入力スキーマに [null 非許容] 列がある場合の applyInPandasWithState の NPE を修正
- オペレーティングシステムのセキュリティを更新。

Databricks Runtime 11.2

「Databricks Runtime 11.2 (EoS)」を参照してください。

2023 年 2 月 28 日
- [SPARK-42286][SQL] CAST を使用した複雑な expr の以前の codegen コードパスにフォールバック
- [SPARK-42346][SQL] サブクエリのマージ後に個別の集計を書き換える
- オペレーティングシステムのセキュリティを更新。
2023 年 2 月 16 日
- ユーザーは Databricks Runtime 9.1 以降を使用して、Reader バージョン 3 と Writer バージョン 7 を必要とする特定の Delta テーブルの読み取りと書き込みができるようになりました。成功するには、テーブルのプロトコルに記載されているテーブル機能が、Databricks Runtime の現在のバージョンでサポートされている必要があります。
- SYNC コマンドでは、再作成された Hive メタストアテーブルの同期がサポートされます。 HMS テーブルが以前に Unity Catalog に同期された後に削除されて再作成された場合、その後の再同期は、状態コード　TABLE_ALREADY_EXISTS をスローする代わりに機能します。
- [SPARK-41219][SQL] IntegralDivide は 10 進数 (1、0) を使用して 0 を表す
- オペレーティングシステムのセキュリティを更新。
2023 年 1 月 31 日
- JDBC テーブルのテーブルの種類が既定では EXTERNAL になりました。
- [SPARK-41379][SS][PYTHON] PySpark の foreachBatch シンクのユーザー関数で DataFrame に複製された Spark セッションを提供
2023 年 1 月 18 日
- Azure Synapseコネクタは、列名に空白やセミコロンなどの無効な文字が含まれている場合に、よりわかりやすいエラーメッセージを返すようになりました。このような場合は、次のメッセージが返されます: Azure Synapse Analytics failed to execute the JDBC query produced by the connector. Make sure column names do not include any invalid characters such as ';' or whitespace。
- [SPARK-41198][SS] CTE と DSv1 ストリーミングソースを持つストリーミングクエリのメトリックを修正
- [SPARK-41862][SQL] Orc リーダーの既定値に関連する正確性のバグを修正
- [SPARK-41539][SQL] LogicalRDD の論理プランの出力に対する統計と制約を再マッピング
- [SPARK-41199][SS] DSv1 ストリーミングソースと DSv2 ストリーミングソースが共同使用されている場合のメトリックの問題を修正
- [SPARK-41339][SQL] 単にクリアするのではなく、RocksDB 書き込みバッチを閉じて再作成
- [SPARK-41732][SQL][SS] SessionWindowing のルールにツリーパターンベースの排除を適用
- [SPARK-38277][SS] RocksDB ステートストアのコミット後に書き込みバッチをクリアする
- オペレーティングシステムのセキュリティを更新。
2022 年 11 月 29 日
- ユーザーは、Redshift コネクタを使用してデータを書き込むときに、先頭と末尾の空白の動作を構成できます。空白の処理をコントロールするために、次のオプションが追加されました:
  - csvignoreleadingwhitespace に設定されると、true、tempformat が、 CSV または CSV GZIP に設定されると、書き込み中に先頭の空白文字が値から削除されます。空白は、構成がfalse に設定されている場合に保持されます。既定値は true です。
  - csvignoretrailingwhitespaceに設定されると、true、tempformat がCSV または CSV GZIP に設定されると、書き込み中に末尾のの空白文字が値から削除されます。空白は、構成がfalse に設定されている場合に保持されます。既定値は true です。
- すべての列が文字列 (cloudFiles.inferColumnTypes はfalseに設定または設定されていない) として残され、JSON に入れ子になったオブジェクトが含まれている場合、自動ローダーでの JSON 解析のバグを修正しました。
- [SPARK-40906][SQL]Mode Mapに挿入する前にキーをコピーする必要がある
- オペレーティングシステムのセキュリティを更新。
2022 年 11 月 15 日
- [SPARK-40646] 構造体、マップ、配列の JSON 解析は修正されているため、レコードの一部がスキーマと一致しない場合でも、残りのレコードは null 値を返す代わりに正しく解析できます。改善された動作をオプトインするには、spark.sql.json.enablePartialResults を true に設定します。フラグは、元の動作を保持するために既定で無効になっています
- [SPARK-40618][SQL] 参照追跡を使用して入れ子になったサブクエリを含む MergeScalarSubqueries ルールのバグを修正
- [SPARK-40697][SQL] 外部データファイルをカバーする読み取り側の char パディングを追加
- オペレーティングシステムのセキュリティを更新。
2022 年 11 月 1 日
- Apache commons-text を 1.10.0 にアップグレードしました。
- Delta テーブルに _change_typeという名前のユーザー定義列があるが、そのテーブルで 変更データフィード が無効になっている場合、その列のデータがMERGE の実行時に NULL 値で誤って入力される問題を修正しました。
- MERGE を実行して条件でソースから 99 列を使用すると、 java.lang.ClassCastException: org.apache.spark.sql.vectorized.ColumnarBatch cannot be cast to org.apache.spark.sql.catalyst.InternalRowが発生する可能性がある問題を修正しました。
- allowOverwrites が有効になっている場合に、同じマイクロバッチでファイルを複製できる自動ローダーの問題を修正しました
- [SPARK-40596][CORE] ExecutorDecommission に ExecutorDecommissionInfo のメッセージを設定
- オペレーティングシステムのセキュリティを更新。
2022 年 10 月 19 日
- Unity カタログが有効なクラスター/ウェアハウスで一時的な資格情報を使用した COPY INTO の使用に関する問題を修正しました。
- [SPARK-40213][SQL] ラテン 1 文字の ASCII 値変換をサポート
- オペレーティングシステムのセキュリティを更新。
2022 年 10 月 5 日
- ユーザーは spark.conf.set("spark.databricks.io.listKeysWithPrefix.azure.enabled", "true") を設定して、ADLS の自動ローダーのネイティブ登録情報を再び有効にすることができます。ネイティブリストは、以前はパフォーマンスの問題のために無効にされていましたが、顧客のストレージコストの増加につながっている可能性があります。この変更は、以前のメンテナンス更新プログラムで Databricks Runtime 10.4 および 9.1 にロールアウトされました。
- [SPARK-40315][SQL] URL エンコード/デコードを組み込み関数としてサポートし、URL 関連の関数を整理
- [SPARK-40156][SQL]url_decode() エラークラスを返す必要がある
- [SPARK-40169] データスキーマへの参照がない Parquet フィルターをプッシュダウンしない
- [SPARK-40460][SS] _metadata 選択時のストリーミングメトリックを修正
- [SPARK-40468][SQL] _corrupt_record が選択されている場合の CSV での列の削除を修正
- [SPARK-40055][SQL] listCatalogs は、spark_catalog 実装が defaultSessionCatalog の場合でもspark_catalog を返す必要があります
- オペレーティングシステムのセキュリティを更新。
2022 年 9 月 22 日
- [SPARK-40315][SQL] ArrayBasedMapData のリテラルに hashCode() を追加
- [SPARK-40389][SQL] キャストがオーバーフローする可能性がある場合、Decimals を整数型としてアップキャストできません
- [SPARK-40380][SQL] プランにシリアル化不可能なリテラルが埋め込まれるのを避けるために InvokeLike の定数フォールディングを修正
- [SPARK-40066][SQL][FOLLOW-UP] dataType を取得する前に ElementAt が解決されているかどうかを確認
- [SPARK-40109][SQL] 新しい SQL 関数: get()
- [SPARK-40066][SQL] ANSI モード: マップ列への無効なアクセスで常に null を返す
- [SPARK-40089][SQL] 一部の Decimal 型の並べ替えを修正
- [SPARK-39887][SQL] RemoveRedundantAliases は、プロジェクションノードの出力を一意にするエイリアスを保持する必要がある
- [SPARK-40152][SQL] split_part codegen コンパイルの問題を修正
- [SPARK-40235][CORE] Executor.updateDependencies() で同期ではなく割り込み可能なロックを使用
- [SPARK-40212][SQL] SparkSQL castPartValue が byte、short、または float を適切に処理しない
- [SPARK-40218][SQL] GROUPING SETS がグループ化列を保持する必要がある
- [SPARK-35542][ML] 修正: パラメーターを持つ複数の列に対して作成された Bucketizer
- [SPARK-40079] 空の入力ケースに対する Imputer inputCols 検証を追加
- [SPARK-39912]SPARK-39828[SQL] CatalogImpl を改善

Databricks Runtime 11.1

「Databricks Runtime 11.1 (EoS)」を参照してください。

2023 年 1 月 31 日
- [SPARK-41379][SS][PYTHON] PySpark の foreachBatch シンクのユーザー関数で DataFrame に複製された Spark セッションを提供
- 各種のバグ修正。
2023 年 1 月 18 日
- Azure Synapseコネクタは、列名に空白やセミコロンなどの無効な文字が含まれている場合に、よりわかりやすいエラーメッセージを返すようになりました。このような場合は、次のメッセージが返されます: Azure Synapse Analytics failed to execute the JDBC query produced by the connector. Make sure column names do not include any invalid characters such as ';' or whitespace。
- [SPARK-41198][SS] CTE と DSv1 ストリーミングソースを持つストリーミングクエリのメトリックを修正
- [SPARK-41862][SQL] Orc リーダーの既定値に関連する正確性のバグを修正
- [SPARK-41199][SS] DSv1 ストリーミングソースと DSv2 ストリーミングソースが共同使用されている場合のメトリックの問題を修正
- [SPARK-41339][SQL] 単にクリアするのではなく、RocksDB 書き込みバッチを閉じて再作成
- [SPARK-41732][SQL][SS] SessionWindowing のルールにツリーパターンベースの排除を適用
- [SPARK-38277][SS] RocksDB ステートストアのコミット後に書き込みバッチをクリアする
- オペレーティングシステムのセキュリティを更新。
2022 年 11 月 29 日
- ユーザーは、Redshift コネクタを使用してデータを書き込むときに、先頭と末尾の空白の動作を構成できます。空白の処理をコントロールするために、次のオプションが追加されました:
  - csvignoreleadingwhitespace に設定されると、true、tempformat が、 CSV または CSV GZIP に設定されると、書き込み中に先頭の空白文字が値から削除されます。空白は、構成がfalse に設定されている場合に保持されます。既定値は true です。
  - csvignoretrailingwhitespaceに設定されると、true、tempformat がCSV または CSV GZIP に設定されると、書き込み中に末尾のの空白文字が値から削除されます。空白は、構成がfalse に設定されている場合に保持されます。既定値は true です。
- すべての列が文字列 (cloudFiles.inferColumnTypes はfalseに設定または設定されていない) として残され、JSON に入れ子になったオブジェクトが含まれている場合、自動ローダーでの JSON 解析のバグを修正しました。
- [SPARK-39650] [SS] 下位互換性のあるストリーミング重複除去に含まれる不適切な値スキーマを修正
- オペレーティングシステムのセキュリティを更新。
2022 年 11 月 15 日
- [SPARK-40646] 構造体、マップ、配列の JSON 解析は修正されているため、レコードの一部がスキーマと一致しない場合でも、残りのレコードは null 値を返す代わりに正しく解析。改善された動作をオプトインするには、spark.sql.json.enablePartialResults を true に設定。フラグは、元の動作を保持するために既定で無効になっています
- オペレーティングシステムのセキュリティを更新。
2022 年 11 月 1 日
- Apache commons-text を 1.10.0 にアップグレードしました。
- Delta テーブルに _change_typeという名前のユーザー定義列があるが、そのテーブルで 変更データフィード が無効になっている場合、その列のデータがMERGE の実行時に NULL 値で誤って入力される問題を修正しました。
- MERGE を実行して条件でソースから 99 列を使用すると、 java.lang.ClassCastException: org.apache.spark.sql.vectorized.ColumnarBatch cannot be cast to org.apache.spark.sql.catalyst.InternalRowが発生する可能性がある問題を修正しました。
- allowOverwrites が有効になっている場合に、同じマイクロバッチでファイルを複製できる自動ローダーの問題を修正しました
- [SPARK-40697][SQL] 外部データファイルをカバーする読み取り側の char パディングを追加
- [SPARK-40596][CORE] ExecutorDecommission に ExecutorDecommissionInfo のメッセージを設定
- オペレーティングシステムのセキュリティを更新。
2022 年 10 月 18 日
- Unity カタログが有効なクラスター/ウェアハウスで一時的な資格情報を使用した COPY INTO の使用に関する問題を修正しました。
- [SPARK-40213][SQL] ラテン 1 文字の ASCII 値変換をサポート
- オペレーティングシステムのセキュリティを更新。
2022 年 10 月 5 日
- ユーザーは spark.conf.set("spark.databricks.io.listKeysWithPrefix.azure.enabled", "true") を設定して、ADLS の自動ローダーのネイティブ登録情報を再び有効にすることができます。ネイティブリストは、以前はパフォーマンスの問題のために無効にされていましたが、顧客のストレージコストの増加につながっている可能性があります。この変更は、以前のメンテナンス更新プログラムで Databricks Runtime 10.4 および 9.1 にロールアウトされました。
- [SPARK-40169] データスキーマへの参照がない Parquet フィルターをプッシュダウンしない
- [SPARK-40460][SS] _metadata 選択時のストリーミングメトリックを修正
- [SPARK-40468][SQL] _corrupt_record が選択されている場合の CSV での列の削除を修正
- [SPARK-40055][SQL] listCatalogs は、spark_catalog 実装が defaultSessionCatalog の場合でもspark_catalog を返す必要があります
- オペレーティングシステムのセキュリティを更新。
2022 年 9 月 22 日
- [SPARK-40315][SQL] ArrayBasedMapData のリテラルに hashCode() を追加
- [SPARK-40380][SQL] プランにシリアル化不可能なリテラルが埋め込まれるのを避けるために InvokeLike の定数フォールディングを修正
- [SPARK-40089][SQL] 一部の Decimal 型の並べ替えを修正
- [SPARK-39887][SQL] RemoveRedundantAliases は、プロジェクションノードの出力を一意にするエイリアスを保持する必要がある
- [SPARK-40152][SQL] split_part codegen コンパイルの問題を修正
2022 年 9 月 6 日
- テーブルアクセス制御 (テーブル ACL) のアクセス許可モデルが更新され、 ALTER TABLEを使用してテーブルのスキーマまたはテーブルのプロパティを変更するために MODIFY 権限のみが必要になります。以前は、これらの操作では、ユーザーがテーブルを所有している必要がありました。テーブルに対するアクセス許可の付与、所有者の変更、場所の変更、名前の変更には、引き続き所有権が必要です。この変更により、テーブル ACL のアクセス許可モデルの Unity Catalog との整合性が向上します。
- [SPARK-40235][CORE] Executor.updateDependencies() で同期ではなく割り込み可能なロックを使用
- [SPARK-40212][SQL] SparkSQL castPartValue が byte、short、または float を適切に処理しない
- [SPARK-40218][SQL] GROUPING SETS がグループ化列を保持する必要がある
- [SPARK-39976][SQL] ArrayIntersect で左側の式に含まれる null を正しく処理する
- [SPARK-40053][CORE][SQL][TESTS] ランタイム環境を必要とする動的キャンセルケースに assume を追加Python
- [SPARK-35542][CORE][ML] 修正: パラメーター splitsArray、inputCols、および outputCols を指定して複数の列に対して作成された Bucketizer を保存後に読み込めない
- [SPARK-40079][CORE] 空の入力ケースに対する Imputer inputCols 検証を追加
2022 年 8 月 24 日
- 共有、プロバイダー、および受信者は、所有者の変更、コメント、名前の変更を行う SQL コマンドをサポートするようになりました
- [SPARK-39983][CORE][SQL] ドライバーに非直列化ブロードキャスト関係をキャッシュしない
- [SPARK-39912][SPARK-39828][SQL] CatalogImpl を改善
- [SPARK-39775][CORE][AVRO] Avro スキーマの解析時に既定値の検証を無効にする
- [SPARK-39806] パーティションテーブルで METADATA 構造体にアクセスするクエリがクラッシュする問題を修正
- [SPARK-39867][SQL] グローバル制限が OrderPreservingUnaryNode を継承しないようにする
- [SPARK-39962][PYTHON][SQL] グループ属性が空の場合にプロジェクションを適用
- [SPARK-39839][SQL] UnsafeRow 構造整合性チェックで、offsetAndSize が 0 以外の、null 可変長 Decimal の特殊なケースを処理する
- [SPARK-39713][SQL] ANSI モード: INVALID_ARRAY_INDEX エラーの場合に try_element_at を使用する提案を追加
- [SPARK-39847][SS] 呼び出し元スレッドが中断された場合の RocksDBLoader.loadLibrary() の競合状態を修正
- [SPARK-39731][SQL] CORRECTED time parser ポリシーを使用して “yyyyMMdd” 形式で日付を解決する際の CSV および JSON データソースの問題を修正
- オペレーティングシステムのセキュリティを更新。
2022 年 8 月 10 日
- テーブルアクセス制御を使用する Delta テーブルの場合、このようなテーブルに対する INSERT アクセス許可を持つすべてのユーザーが、MERGE や MODIFY などの DML ステートメントを使用してスキーマを自動的に進化できるようになりました。さらに、COPY INTO を使用してスキーマの進化を実行するために必要なアクセス許可が、他のコマンドとの一貫性を保つために OWNER から MODIFY に下げられました。これらの変更により、テーブルの ACL セキュリティモデルは、Unity Catalog のセキュリティモデルだけでなく、テーブルの置き換えなどの他の操作とも整合性が高くなります。
- [SPARK-39889] 0 による除算のエラーメッセージを改善
- [SPARK-39795] [SQL] 新しい SQL 関数: try_to_timestamp
- [SPARK-39749] ANSI モードで decimal を文字列としてキャストする場合に常にプレーン文字列表現を使用
- [SPARK-39625] df.as の名前を df.to に変更
- [SPARK-39787] [SQL] 関数 to_timestamp の解析エラーでエラークラスを使用します
- [SPARK-39625] [SQL] Dataset.as(StructType) を追加
- [SPARK-39689] CSV データソースで 2 文字 lineSep をサポート
- [SPARK-39579] [SQL][python][R] ListFunctions/getFunction/functionExists を 3 つのレイヤー名前空間と互換性のあるものにする
- [SPARK-39702] [CORE] 共有 byteRawChannel を使用して TransportCipher$EncryptedMessage のメモリオーバーヘッドを削減
- [SPARK-39575] [AVRO] AvroDeserializer で ByteBuffer#get の後に ByteBuffer#rewind を追加
- [SPARK-39265] [SQL] SPARK_ANSI_SQL_MODE が有効になっている場合のテストエラーを修正
- [SPARK-39441] [SQL] DeduplicateRelations を高速化
- [SPARK-39497] [SQL] マップキー列が見つからない場合の分析例外を改善
- [SPARK-39476] [SQL] Long から Float か Double、または Integer から Float へのキャスト時に、アンラップキャストの最適化を無効にする
- [SPARK-39434] [SQL] 配列インデックスが境界外の場合にランタイムエラークエリコンテキストを提供する

Databricks Runtime 11.0

「Databricks Runtime 11.0 (EoS)」を参照してください。

2022 年 11 月 29 日
- ユーザーは、Redshift コネクタを使用してデータを書き込むときに、先頭と末尾の空白の動作を構成できます。空白の処理をコントロールするために、次のオプションが追加されました:
  - csvignoreleadingwhitespace に設定されると、true、tempformat が、 CSV または CSV GZIP に設定されると、書き込み中に先頭の空白文字が値から削除されます。空白は、構成がfalse に設定されている場合に保持されます。既定値は true です。
  - csvignoretrailingwhitespaceに設定されると、true、tempformat がCSV または CSV GZIP に設定されると、書き込み中に末尾のの空白文字が値から削除されます。空白は、構成がfalse に設定されている場合に保持されます。既定値は true です。
- すべての列が文字列 (cloudFiles.inferColumnTypes はfalseに設定または設定されていない) として残され、JSON に入れ子になったオブジェクトが含まれている場合、自動ローダーでの JSON 解析のバグを修正しました。
- [SPARK-39650] [SS] 下位互換性のあるストリーミング重複除去に含まれる不適切な値スキーマを修正
- オペレーティングシステムのセキュリティを更新。
2022 年 11 月 15 日
- [SPARK-40646] 構造体、マップ、配列の JSON 解析は修正されているため、レコードの一部がスキーマと一致しない場合でも、残りのレコードは null 値を返す代わりに正しく解析できます。改善された動作をオプトインするには、spark.sql.json.enablePartialResults を true に設定します。フラグは、元の動作を保持するために既定で無効になっています。
2022 年 11 月 1 日
- Apache commons-text を 1.10.0 にアップグレードしました。
- Delta テーブルに _change_typeという名前のユーザー定義列があるが、そのテーブルで 変更データフィード が無効になっている場合、その列のデータがMERGE の実行時に NULL 値で誤って入力される問題を修正しました。
- allowOverwrites が有効になっている場合に、同じマイクロバッチでファイルを複製できる自動ローダーの問題を修正しました
- [SPARK-40697][SQL] 外部データファイルをカバーする読み取り側の char パディングを追加
- [SPARK-40596][CORE] ExecutorDecommission に ExecutorDecommissionInfo のメッセージを設定
- オペレーティングシステムのセキュリティを更新。
2022 年 10 月 18 日
- [SPARK-40213][SQL] ラテン 1 文字の ASCII 値変換をサポート
- オペレーティングシステムのセキュリティを更新。
2022 年 10 月 5 日
- ユーザーは spark.conf.set("spark.databricks.io.listKeysWithPrefix.azure.enabled", "true") を設定して、ADLS の自動ローダーのネイティブ登録情報を再び有効にすることができます。ネイティブリストは、以前はパフォーマンスの問題のために無効にされていましたが、顧客のストレージコストの増加につながっている可能性があります。この変更は、以前のメンテナンス更新プログラムで Databricks Runtime 10.4 および 9.1 にロールアウトされました。
- [SPARK-40169] データスキーマへの参照がない Parquet フィルターをプッシュダウンしない
- [SPARK-40460][SS] _metadata 選択時のストリーミングメトリックを修正
- [SPARK-40468][SQL] _corrupt_record が選択されている場合の CSV での列の削除を修正
- オペレーティングシステムのセキュリティを更新。
2022 年 9 月 22 日
- [SPARK-40315][SQL] ArrayBasedMapData のリテラルに hashCode() を追加
- [SPARK-40380][SQL] プランにシリアル化不可能なリテラルが埋め込まれるのを避けるために InvokeLike の定数フォールディングを修正
- [SPARK-40089][SQL] 一部の Decimal 型の並べ替えを修正
- [SPARK-39887][SQL] RemoveRedundantAliases は、プロジェクションノードの出力を一意にするエイリアスを保持する必要がある
- [SPARK-40152][SQL] split_part codegen コンパイルの問題を修正
2022 年 9 月 6 日
- [SPARK-40235][CORE] Executor.updateDependencies() で同期ではなく割り込み可能なロックを使用
- [SPARK-40212][SQL] SparkSQL castPartValue が byte、short、または float を適切に処理しない
- [SPARK-40218][SQL] GROUPING SETS がグループ化列を保持する必要がある
- [SPARK-39976][SQL] ArrayIntersect で左側の式に含まれる null を正しく処理する
- [SPARK-40053][CORE][SQL][TESTS] ランタイム環境を必要とする動的キャンセルケースに assume を追加Python
- [SPARK-35542][CORE][ML] 修正: パラメーター splitsArray、inputCols、および outputCols を指定して複数の列に対して作成された Bucketizer を保存後に読み込めない
- [SPARK-40079][CORE] 空の入力ケースに対する Imputer inputCols 検証を追加
2022 年 8 月 24 日
- [SPARK-39983][CORE][SQL] ドライバーに非直列化ブロードキャスト関係をキャッシュしない
- [SPARK-39775][CORE][AVRO] Avro スキーマの解析時に既定値の検証を無効にする
- [SPARK-39806] パーティションテーブルで METADATA 構造体にアクセスするクエリがクラッシュする問題を修正
- [SPARK-39867][SQL] グローバル制限が OrderPreservingUnaryNode を継承しないようにする
- [SPARK-39962][PYTHON][SQL] グループ属性が空の場合にプロジェクションを適用
- オペレーティングシステムのセキュリティを更新。
2022 年 8 月 9 日
- [SPARK-39713][SQL] ANSI モード: INVALID_ARRAY_INDEX エラーの場合に try_element_at を使用する提案を追加
- [SPARK-39847] 呼び出し元スレッドが中断された場合の RocksDBLoader.loadLibrary() の競合状態を修正
- [SPARK-39731][SQL] CORRECTED time parser ポリシーを使用して “yyyyMMdd” 形式で日付を解決する際の CSV および JSON データソースの問題を修正
- [SPARK-39889] 0 による除算のエラーメッセージを改善
- [SPARK-39795][SQL] 新しい SQL 関数: try_to_timestamp
- [SPARK-39749] ANSI モードで decimal を文字列としてキャストする場合に常にプレーン文字列表現を使用
- [SPARK-39625][SQL] Dataset.to(StructType) を追加
- [SPARK-39787][SQL] 関数 to_timestamp の解析エラーでエラークラスを使用
- オペレーティングシステムのセキュリティを更新。
2022 年 7 月 27 日
- [SPARK-39689] CSV データソースで 2 文字 lineSep をサポート
- [SPARK-39104][SQL] InMemoryRelation#isCachedColumnBuffersLoaded はスレッドセーフである必要がある
- [SPARK-39702][CORE] 共有 byteRawChannel を使用して TransportCipher$EncryptedMessage のメモリオーバーヘッドを削減
- [SPARK-39575][AVRO] AvroDeserializer で ByteBuffer#get の後に ByteBuffer#rewind を追加
- [SPARK-39497][SQL] マップキー列が見つからない場合の分析例外を改善
- [SPARK-39441][SQL] DeduplicateRelations を高速化
- [SPARK-39476][SQL] Long から Float か Double、または Integer から Float へのキャスト時に、アンラップキャストの最適化を無効にする
- [SPARK-39434][SQL] 配列インデックスが境界外の場合にランタイムエラークエリコンテキストを提供
- [SPARK-39570][SQL] インラインテーブルで、エイリアスが設定された式を許可する必要がある
- オペレーティングシステムのセキュリティを更新。
2022 年 7 月 13 日
- ソースが決定論的でない場合は、Delta MERGE 操作の結果を一貫性のあるものにします。
- DBFS 以外のパスでの実行時の cloud_files_state TVF の問題を修正しました。
- Azureでのディレクトリ一覧に対する自動ローダーによるネイティブクラウド API の使用を無効にしました。
- [SPARK-38796][SQL] 正の数値を持つ PR を許可するように to_number 関数と try_to_number 関数を更新
- [SPARK-39272][SQL] クエリコンテキストの開始位置を 1 つ大きくする
- [SPARK-39419][SQL] 比較子が null を返したときに例外をスローするように ArraySort を修正する
- オペレーティングシステムのセキュリティを更新。
2022 年 7 月 5 日
- さまざまなエラークラスのエラーメッセージの改善。
- [SPARK-39451][SQL] ANSI モードでの整数へのキャスト間隔をサポートする
- [SPARK-39361] 既定のログ構成では、Log4J2 の拡張スロー可能変換パターンを使わない
- [SPARK-39354][SQL] Table or view not found に関連する dataTypeMismatchError が同時にあった場合でも、Filter が表示されるようにする
- [SPARK-38675][CORE] BlockInfoManager でのロック解除中の競合を修正
- [SPARK-39392][SQL] try_* 関数ヒントの ANSI エラーメッセージを改善
- [SPARK-39214][SQL][3.3] CAST に関連するエラーを改善
- [SPARK-37939] [SQL] プロパティの解析エラーでエラークラスを使用
- [SPARK-39085][SQL] INCONSISTENT_BEHAVIOR_CROSS_VERSION のエラーメッセージを error-classes.json に移動する
- [SPARK-39376][SQL] NATURAL/USING JOIN からのサブクエリエイリアスの star 式で重複する列を非表示
- [SPARK-39283][CORE] TaskMemoryManager と UnsafeExternalSorter.SpillableIterator の間のデッドロックを修正
- [SPARK-39285][SQL] ファイルの読み取り時に Spark でフィールド名を確認しない
- オペレーティングシステムのセキュリティを更新。

Databricks Runtime 10.5

「Databricks Runtime 10.5 (EoS)」を参照してください。

2022 年 11 月 1 日
- Delta テーブルに _change_typeという名前のユーザー定義列があるが、そのテーブルで 変更データフィード が無効になっている場合、その列のデータがMERGE の実行時に NULL 値で誤って入力される問題を修正しました。
- [SPARK-40697][SQL] 外部データファイルをカバーする読み取り側の char パディングを追加
- [SPARK-40596][CORE] ExecutorDecommission に ExecutorDecommissionInfo のメッセージを設定
- オペレーティングシステムのセキュリティを更新。
2022 年 10 月 18 日
- オペレーティングシステムのセキュリティを更新。
2022 年 10 月 5 日
- ユーザーは spark.conf.set("spark.databricks.io.listKeysWithPrefix.azure.enabled", "true") を設定して、ADLS の自動ローダーのネイティブ登録情報を再び有効にすることができます。ネイティブリストは、以前はパフォーマンスの問題のために無効にされていましたが、顧客のストレージコストの増加につながっている可能性があります。この変更は、以前のメンテナンス更新プログラムで Databricks Runtime 10.4 および 9.1 にロールアウトされました。
- reload4j は1.2.19 にアップグレードされ、脆弱性が修正されました。
- [SPARK-40460][SS] _metadata 選択時のストリーミングメトリックを修正
- [SPARK-40468][SQL] _corrupt_record が選択されている場合の CSV での列の削除を修正
- オペレーティングシステムのセキュリティを更新。
2022 年 9 月 22 日
- [SPARK-40315][SQL] ArrayBasedMapData のリテラルに hashCode() を追加
- [SPARK-40213][SQL] ラテン 1 文字の ASCII 値変換をサポート
- [SPARK-40380][SQL] プランにシリアル化不可能なリテラルが埋め込まれるのを避けるために InvokeLike の定数フォールディングを修正
- [SPARK-38404][SQL] 入れ子になった CTE が外部 CTE を参照する場合の CTE 解決を改善
- [SPARK-40089][SQL] 一部の Decimal 型の並べ替えを修正
- [SPARK-39887][SQL] RemoveRedundantAliases は、プロジェクションノードの出力を一意にするエイリアスを保持する必要がある
- オペレーティングシステムのセキュリティを更新。
2022 年 9 月 6 日
- [SPARK-40235][CORE] Executor.updateDependencies() で同期ではなく割り込み可能なロックを使用
- [SPARK-39976][SQL] ArrayIntersect で左側の式に含まれる null を正しく処理する
- [SPARK-40053][CORE][SQL][TESTS] ランタイム環境を必要とする動的キャンセルケースに assume を追加Python
- [SPARK-35542][CORE][ML] 修正: パラメーター splitsArray、inputCols、および outputCols を指定して複数の列に対して作成された Bucketizer を保存後に読み込めない
- [SPARK-40079][CORE] 空の入力ケースに対する Imputer inputCols 検証を追加
2022 年 8 月 24 日
- [SPARK-39983][CORE][SQL] ドライバーに非直列化ブロードキャスト関係をキャッシュしない
- [SPARK-39775][CORE][AVRO] Avro スキーマの解析時に既定値の検証を無効にする
- [SPARK-39806] パーティションテーブルで METADATA 構造体にアクセスするクエリがクラッシュする問題を修正
- [SPARK-39962][PYTHON][SQL] グループ属性が空の場合にプロジェクションを適用
- [SPARK-37643][SQL] charVarcharAsString が true の場合、char データ型述語クエリでは rpadding ルールをスキップする必要がある
- オペレーティングシステムのセキュリティを更新。
2022 年 8 月 9 日
- [SPARK-39847] 呼び出し元スレッドが中断された場合の RocksDBLoader.loadLibrary() の競合状態を修正
- [SPARK-39731][SQL] CORRECTED time parser ポリシーを使用して “yyyyMMdd” 形式で日付を解決する際の CSV および JSON データソースの問題を修正
- オペレーティングシステムのセキュリティを更新。
2022 年 7 月 27 日
- [SPARK-39625][SQL] Dataset.as(StructType) を追加
- [SPARK-39689] CSV データソースで 2 文字 lineSep をサポート
- [SPARK-39104][SQL] InMemoryRelation#isCachedColumnBuffersLoaded はスレッドセーフである必要がある
- [SPARK-39570][SQL] インラインテーブルで、エイリアスが設定された式を許可する必要がある
- [SPARK-39702][CORE] 共有 byteRawChannel を使用して TransportCipher$EncryptedMessage のメモリオーバーヘッドを削減
- [SPARK-39575][AVRO] AvroDeserializer で ByteBuffer#get の後に ByteBuffer#rewind を追加
- [SPARK-39476][SQL] Long から Float か Double、または Integer から Float へのキャスト時に、アンラップキャストの最適化を無効にする
- オペレーティングシステムのセキュリティを更新。
2022 年 7 月 13 日
- ソースが決定論的でない場合は、Delta MERGE 操作の結果を一貫性のあるものにします。
- [SPARK-39355][SQL] 単一列で引用符を使用して UnresolvedAttribute を構築する
- [SPARK-39548][SQL] window 句クエリを使用した CreateView コマンドで、誤ったウィンドウ定義が見つからない問題が発生する
- [SPARK-39419][SQL] 比較子が null を返したときに例外をスローするように ArraySort を修正する
- Azureでのディレクトリ一覧に対する自動ローダーによるネイティブクラウド API の使用を無効にしました。
- オペレーティングシステムのセキュリティを更新。
2022 年 7 月 5 日
- [SPARK-39376][SQL] NATURAL/USING JOIN からのサブクエリエイリアスの star 式で重複する列を非表示
- オペレーティングシステムのセキュリティを更新。
2022 年 6 月 15 日
- [SPARK-39283][CORE] TaskMemoryManager と UnsafeExternalSorter.SpillableIterator の間のデッドロックを修正
- [SPARK-39285][SQL] ファイルの読み取り時に Spark でフィールド名を確認しない
- [SPARK-34096][SQL] オフセットウィンドウでの nth_value ignore nulls のパフォーマンスを改善
- [SPARK-36718][SQL][FOLLOWUP] CollapseProject の isExtractOnly チェックを修正
2022 年 6 月 2 日
- [SPARK-39166][SQL] WSCG がオフのときにバイナリ算術演算のランタイムエラーのクエリコンテキストを提供
- [SPARK-39093][SQL] 年月の間隔または日時の間隔を整数で除算するときの codegen コンパイルエラーを回避
- [SPARK-38990][SQL] バインドされた参照として date_trunc/trunc 形式を評価するときの NullPointerException を回避
- オペレーティングシステムのセキュリティを更新。
2022 年 5 月 18 日
- 自動ローダーでネイティブメモリリークが発生する可能性がある問題を修正しました。
- [SPARK-38868][SQL]外部結合を最適化するときにフィルター述語から例外を伝達しない
- [SPARK-38796][SQL] 新しい仕様に従って to_number および try_to_number という SQL 関数を実装
- [SPARK-38918][SQL] 入れ子になった列の排除で、現在のリレーションシップに属していない属性を除外する必要がある
- [SPARK-38929] [SQL] ANSI でのキャスト障害のエラーメッセージを改善
- [SPARK-38926][SQL] SQL スタイルのエラーメッセージの出力の種類
- [SPARK-39084][PYSPARK] TaskContext を使用して df.rdd.isEmpty() を修正し、タスクの完了時に反復子を停止する
- [SPARK-32268][SQL] injectBloomFilter に ColumnPruning を追加
- [SPARK-38908][SQL] String から Number/Date/Timestamp/Boolean へのキャストの実行時エラーについて、クエリコンテキストを提供
- [SPARK-39046][SQL] TreeNode.origin が正しく設定されていない場合に、空のコンテキスト文字列を返す
- [SPARK-38974][SQL] リスト関数で指定されたデータベース名を使用して、登録されている関数をフィルター処理
- [SPARK-38762][SQL] 10 進数オーバーフローエラーについて、クエリコンテキストを提供
- [SPARK-38931][SS] 第 1 チェックポイントのキー数が不明な RocksDBFileManager のルート dfs ディレクトリを作成
- [SPARK-38992][CORE] ShellBasedGroupsMappingProvider で bash -c を使用しないようにする
- [SPARK-38716][SQL] マップキーが存在しないエラーでクエリコンテキストを提供
- [SPARK-38889][SQL] ブール型の列フィルターをコンパイルして MSSQL データソースにビット型を使用する
- [SPARK-38698][SQL] Divide/Div/Reminder/Pmod の実行時エラーについて、クエリコンテキストを提供
- [SPARK-38823][SQL] 集計バッファーの破損の問題を修正するために NewInstance を折りたたみ不可にする
- [SPARK-38809][SS] ストリーム間の結合の対称ハッシュ実装で null 値をスキップするオプションを実装
- [SPARK-38676][SQL] Add/Subtract/Multiply の実行時エラーメッセージで、SQL クエリコンテキストを提供
- [SPARK-38677][PYSPARK] Python MonitorThread は、I/O のブロックによるデッドロックを検出する必要があります
- オペレーティングシステムのセキュリティを更新。

フィードバック

このページはお役に立ちましたか?

Last updated on 2026-04-21