Catatan rilis Databricks SQL 2026

Fitur dan peningkatan Databricks SQL berikut dirilis pada tahun 2026.

April 2026

`agg` Fungsi SQL sebagai sinonim untuk `measure`

30 April 2026

Fungsi agregat baru agg adalah sinonim untuk measure. Gunakan agg(measure_column) sebagai alternatif yang lebih singkat saat mengkueri pengukuran dalam tampilan metrik.

Maret 2026

Databricks SQL versi 2026.10 sekarang tersedia dalam Versi Pratinjau

26 Maret 2026

Databricks SQL versi 2026.10 sekarang tersedia di saluran Pratinjau . Tinjau bagian berikut untuk mempelajari tentang fitur baru, perubahan perilaku, dan perbaikan bug.

Kesalahan metrik pengamatan tidak lagi menyebabkan kueri gagal

Kesalahan selama pengumpulan metrik pengamatan tidak lagi menyebabkan kegagalan eksekusi kueri. Sebelumnya, kesalahan dalam OBSERVE klausa (seperti pembagian dengan nol) dapat memblokir atau gagal seluruh kueri. Sekarang, kueri berhasil dijalankan dan kesalahan muncul saat Anda memanggil observation.get.

Optimisasi penulisan untuk operasi CRTAS Katalog Unity

MEMBUAT ATAU MENGGANTI TABLE Operasi AS SELECT (CRTAS) pada tabel Unity Catalog yang dipartisi sekarang menerapkan penulisan yang dioptimalkan secara default, menghasilkan lebih sedikit file yang lebih besar. Untuk menonaktifkan, atur spark.databricks.delta.optimizeWrite.UCTableCRTAS.enabled ke false.

Nilai partisi tanda waktu menggunakan zona waktu sesi

Nilai partisi tanda waktu sekarang menggunakan zona waktu sesi gudang SQL. Jika Anda memiliki partisi tanda waktu yang ditulis sebelum Databricks SQL versi 2025.40, jalankan SHOW PARTITIONS untuk memverifikasi metadata partisi Anda sebelum menulis data baru.

Kata kunci yang dicadangkan DESCRIBE FLOW

Perintah DESCRIBE FLOW sekarang tersedia. Jika Anda memiliki tabel bernama flow, gunakan DESCRIBE schema.flow, DESCRIBE TABLE flow, atau DESCRIBE `flow` dengan backticks.

Operasi himpunan boolean SpatialSQL

ST_Difference, ST_Intersection, dan ST_Union gunakan implementasi baru dengan peningkatan berikut:

Geometri input yang valid selalu menghasilkan hasil dan tidak lagi menimbulkan kesalahan. Input yang tidak valid tidak menimbulkan kesalahan tetapi mungkin tidak menghasilkan hasil yang valid.
Performa sekitar 2x lebih cepat.
Hasil dapat berbeda setelah tempat desimal ke-15 untuk persimpangan segmen garis karena rumus dan urutan operasi yang berbeda.
Hasil dinormalisasi untuk output yang konsisten dan sebanding:
- Titik diurutkan berdasarkan nilai koordinat.
- Linestring dibangun dari jalur terpanjang yang mungkin.
- Cincin poligon diputar sehingga titik pertama memiliki nilai koordinat terkecil.
Normalisasi ini berlaku dalam semua kasus kecuali saat memanggil ST_Difference dengan dua geometri yang tidak tumpang tindih, di mana geometri pertama dikembalikan tanpa dimodifikasi.

Jenis pengecualian untuk SQLSTATE

Jenis pengecualian sekarang mendukung SQLSTATE. Jika kode Anda menguraikan pengecualian dengan pencocokan string atau menangkap jenis pengecualian tertentu, perbarui logika penanganan kesalahan Anda.

Dukungan jenis data DATETIMEOFFSET untuk Microsoft Azure Synapse

Jenis DATETIMEOFFSET data sekarang tersedia untuk koneksi Microsoft Azure Synapse.

Komentar tabel Google BigQuery

Deskripsi tabel Google BigQuery diselesaikan dan diekspos sebagai komentar tabel.

Evolusi skema dengan INSERT perintah

WITH SCHEMA EVOLUTION Gunakan klausa dengan pernyataan SQL INSERT untuk secara otomatis mengembangkan skema tabel target selama operasi penyisipan. Klausul ini didukung untuk INSERT INTO, INSERT OVERWRITE, dan INSERT INTO ... REPLACE jenis. Contohnya:

INSERT WITH SCHEMA EVOLUTION INTO students TABLE visiting_students_with_additional_id;

Skema tabel Delta Lake target diperbarui untuk mengakomodasi kolom tambahan atau tipe yang diperluas dari sumbernya. Untuk detailnya, lihat evolusi skema dan INSERT sintaks pernyataan.

Nilai struct NULL dipertahankan dalam operasi INSERT

INSERT operasi dengan evolusi skema atau transmisi implisit NULL sekarang mempertahankan nilai struktur ketika tabel sumber dan target memiliki urutan bidang struct yang berbeda.

fungsi SQL parse_timestamp

Fungsi SQL parse_timestamp mengurai string tanda waktu menggunakan beberapa pola dan berjalan pada mesin Photon untuk meningkatkan performa saat mengurai tanda waktu dalam beberapa format. Lihat Pola tanggalwaktu untuk informasi tentang pemformatan pola tanggalwaktu.

max_by dan min_by dengan batas opsional

Fungsi agregat max_by dan min_by sekarang menerima argumen limit ketiga opsional (hingga 100.000). Saat diberikan, fungsi tersebut mengembalikan array hingga limit nilai yang sesuai dengan nilai terbesar (atau terkecil) dari ekspresi pengurutan, yang menyederhanakan kueri top-K dan bottom-K tanpa memerlukan fungsi jendela atau CTE.

Fungsi agregat vektor dan skalar

Fungsi SQL baru beroperasi pada ARRAY<FLOAT> vektor untuk beban kerja penyematan dan kesamaan:

Fungsi agregat:

vector_avg: Mengembalikan rata-rata elemen dari vektor-vektor dalam grup.
vector_sum: Mengembalikan penjumlahan vektor per elemen dalam sebuah kelompok.

Fungsi skalar:

vector_cosine_similarity: Mengembalikan kesamaan kosinus dari dua vektor.
vector_inner_product: Mengembalikan produk dalam (titik) dari dua vektor.
vector_l2_distance: Mengembalikan jarak Euclidean (L2) antara dua vektor.
vector_norm: Mengembalikan norma Lp dari vektor (1, 2, atau tak terbatas).
vector_normalize: Mengembalikan vektor yang dinormalisasi ke panjang unit.

Lihat Fungsi bawaan.

Dukungan kursor SQL dalam pernyataan majemuk

Pernyataan gabungan skrip SQL sekarang mendukung pemrosesan kursor. Gunakan KURSOR DECLARE untuk menentukan kursor, lalu pernyataan OPEN, pernyataan FETCH, dan pernyataan CLOSE untuk menjalankan kueri dan menggunakan baris satu per satu. Kursor dapat menggunakan penanda parameter dan penangan kondisi seperti NOT FOUND untuk pemrosesan baris demi baris.

Perkiraan fungsi sketsa top-k

Fungsi baru memungkinkan pembuatan dan penggabungan sketsa perkiraan top-K untuk agregasi top-K yang terdistribusi.

approx_top_k_accumulate: Membuat sketsa tiap grup.
approx_top_k_combine: Menggabungkan sketsa.
approx_top_k_estimate: Mengembalikan item K teratas dengan perkiraan jumlah.

Untuk informasi selengkapnya, lihat approx_top_k fungsi agregat dan Fungsi bawaan.

Fungsi sketsa tuple

Fungsi agregat dan skalar baru untuk sketsa tuple mendukung penghitungan dan agregasi yang berbeda atas pasangan ringkasan kunci.

Fungsi agregat:

Fungsi skalar:

Lihat Fungsi bawaan.

Dependensi kustom untuk Unity Catalog Python UDTFs

Fungsi tabel yang ditentukan pengguna (UDTF) Unity Catalog Python sekarang dapat menggunakan dependensi kustom untuk pustaka eksternal, sehingga Anda dapat menggunakan paket di luar apa yang tersedia di lingkungan gudang SQL default. Lihat Memperluas UDF menggunakan dependensi kustom.

Fungsi geospasial baru

Fungsi geospasial berikut sekarang tersedia:

st_estimatesrid fungsi: Memperkirakan pengidentifikasi referensi spasial (SRID) terbaik yang diproyeksikan untuk geometri input.
st_force2d fungsi: Mengonversi geografi atau geometri ke representasi 2D-nya.
st_nrings fungsi: Menghitung jumlah total cincin dalam poligon atau multipoligon, termasuk cincin eksterior dan interior.
st_numpoints fungsi: Menghitung jumlah titik yang tidak kosong dalam geografi atau geometri.

Dukungan foton untuk fungsi geospasial

Fungsi geospasial berikut sekarang berjalan pada mesin Photon untuk performa yang lebih cepat:

Februari 2026

Databricks SQL versi 2025.40 sedang diluncurkan saat ini

23 Februari 2026

Databricks SQL versi 2025.40 sedang diluncurkan ke saluran Current. Lihat fitur di 2025.40.

Databricks SQL versi 2025.40 sekarang tersedia dalam Versi Pratinjau

11 Februari 2026

Databricks SQL versi 2025.40 sekarang tersedia di saluran Pratinjau . Tinjau bagian berikut untuk mempelajari tentang fitur baru, perubahan perilaku, dan perbaikan bug.

Pembuatan skrip SQL umumnya tersedia

Pembuatan skrip SQL sekarang tersedia secara umum. Tulis logika prosedural dengan SQL, termasuk pernyataan kondisional, perulangan, variabel lokal, dan penanganan pengecualian.

Penanda parameter sekarang didukung dalam konteks SQL lainnya

Anda sekarang dapat menggunakan penanda parameter bernama (:param) dan yang tidak disebutkan namanya (?) di mana saja nilai harfiah dari jenis yang sesuai diizinkan. Ini termasuk pernyataan DDL seperti CREATE VIEW v AS SELECT ? AS c1, jenis kolom seperti DECIMAL(:p, :s), dan komentar seperti COMMENT ON t IS :comment. Ini memungkinkan Anda untuk membuat parameter berbagai pernyataan SQL tanpa mengekspos kode Anda ke serangan injeksi SQL. Lihat Penanda parameter.

IDENTIFIER klausa diperluas ke lebih banyak konteks SQL

Klausa IDENTIFIER , yang melemparkan string ke nama objek SQL, sekarang didukung dalam hampir setiap konteks di mana pengidentifikasi diizinkan. Dikombinasikan dengan dukungan penggabungan string literal dan penanda parameter yang diperluas, Anda dapat memparametrisasi apa pun mulai dari alias kolom (AS IDENTIFIER(:name)) hingga definisi kolom (IDENTIFIER(:pk) BIGINT NOT NULL). Lihat klausa IDENTIFIER.

Penggabungan string literal didukung secara menyeluruh

Literal string berurutan seperti 'Hello' ' World' sekarang bersatu dalam 'Halo Dunia' konteks apa pun di mana literal string diizinkan, termasuk COMMENT 'This' ' is a ' 'comment'. Lihat STRING jenis.

Fungsi BITMAP_AND_AGG baru

Fungsi BITMAP_AND_AGG baru sekarang tersedia untuk melengkapi pustaka BITMAP fungsi yang ada.

Fungsi Sketsa Theta baru untuk perkiraan jumlah yang berbeda

Pustaka fungsi baru untuk perkiraan jumlah yang berbeda dan operasi himpunan menggunakan Sketsa Datasketches Theta sekarang tersedia:

Fungsi Sketsa KLL baru untuk perkiraan kuantil

Sebuah perpustakaan fungsi baru untuk membangun Sketsa KLL untuk komputasi kuantil secara perkiraan telah tersedia.

Anda dapat menggabungkan beberapa sketsa KLL dalam konteks agregasi menggunakan kll_merge_agg_bigint, kll_merge_agg_double, dan kll_merge_agg_float.

Fungsi jendela SQL dalam tampilan metrik

Anda sekarang dapat menggunakan fungsi jendela SQL dalam tampilan metrik untuk menghitung total yang berjalan, peringkat, dan perhitungan berbasis jendela lainnya.

Fungsi geospasial baru

Fungsi geospasial baru berikut ini sekarang tersedia:

st_azimuth fungsi: Mengembalikan azimuth berbasis utara dari titik pertama ke titik kedua dalam radian di [0, 2π).
st_boundary fungsi: Mengembalikan batas geometri input.
st_closestpoint fungsi: Mengembalikan proyeksi 2D titik pada geometri pertama yang paling dekat dengan geometri kedua.
st_geogfromewkt fungsi: Mengurai deskripsi Extended Well-Known Text (EWKT) tentang geografi.
st_geomfromewkt fungsi: Menganalisis deskripsi Extended Well-Known Text (EWKT) mengenai geometri.

Dukungan input EWKT untuk fungsi geometri dan geografi yang ada

Fungsi berikut sekarang menerima Extended Well-Known Text (EWKT) sebagai input:

Peningkatan performa untuk kueri berulang di atas tabel dengan filter baris dan masker kolom

Kueri berulang yang memenuhi syarat pada tabel dengan filter baris dan masker kolom sekarang mendapat manfaat dari peningkatan caching hasil kueri, menghasilkan waktu eksekusi yang lebih cepat.

Peningkatan performa fungsi geospasial

Performa gabungan spasial ditingkatkan dengan dukungan pengelompokan ulang gabungan spasial. Fungsi ST berikut sekarang memiliki implementasi Photon:

FSCK REPAIR TABLE menyertakan perbaikan metadata secara default

FSCK REPAIR TABLE sekarang menyertakan langkah perbaikan metadata awal sebelum memeriksa file data yang hilang, memungkinkannya untuk mengerjakan tabel dengan titik pemeriksaan yang rusak atau nilai partisi yang tidak valid. Selain itu, dataFilePath kolom dalam FSCK REPAIR TABLE DRY RUN skema output sekarang dapat diubah ke null untuk mendukung jenis masalah baru di mana jalur file data tidak berlaku.

DESCRIBE TABLE output mencakup kolom metadata

DESCRIBE TABLE [EXTENDED] sekarang mencakup kolom metadata pada semua jenis tabel. Kolom ini berisi metadata semantik (nama tampilan, format, dan sinonim) yang ditentukan pada tabel sebagai string JSON.

Struktur NULL dipertahankan dalam operasi penulisan MERGE, UPDATE, dan streaming

Struktur NULL sekarang dipertahankan sebagai NULL di Delta Lake MERGE, UPDATE, dan operasi penulisan streaming yang mencakup pengubahan tipe struct. Sebelumnya, struktur NULL diperluas menjadi struktur dengan semua bidang yang ditetapkan ke NULL.

Kolom partisi terwujud dalam file Parquet

Tabel Delta Lake terpartisi kini mematerialisasi kolom partisi dalam file data Parquet yang baru saja ditulis. Sebelumnya, nilai partisi hanya disimpan dalam metadata log transaksi Delta Lake. Beban kerja yang membaca langsung file Parquet yang dihasilkan oleh Delta Lake akan mendeteksi kolom partisi tambahan pada file yang baru ditulis.

Nilai partisi tanda waktu menghormati zona waktu sesi

Nilai partisi tanda waktu sekarang disesuaikan dengan benar menggunakan konfigurasi spark.sql.session.timeZone. Sebelumnya, mereka salah dikonversi ke UTC menggunakan zona waktu JVM.

Pembatasan perjalanan waktu diperbarui

Azure Databricks sekarang memblokir kueri perjalanan waktu di luar deletedFileRetentionDuration ambang batas untuk semua tabel. Perintah VACUUM mengabaikan argumen durasi retensi kecuali ketika nilainya adalah 0 jam. Anda tidak dapat mengatur deletedFileRetentionDuration lebih besar dari logRetentionDuration.

SHOW TABLES DROPPEDmenghormati klausul LIMIT

SHOW TABLES DROPPED sekarang dengan benar menghormati klausul LIMIT .

Januari 2026

Saran dan Komentar

Apakah halaman ini membantu?

Last updated on 2026-04-30

Catatan rilis Databricks SQL 2026

April 2026

agg Fungsi SQL sebagai sinonim untuk measure

Maret 2026

Databricks SQL versi 2026.10 sekarang tersedia dalam Versi Pratinjau

Kesalahan metrik pengamatan tidak lagi menyebabkan kueri gagal

Optimisasi penulisan untuk operasi CRTAS Katalog Unity

Nilai partisi tanda waktu menggunakan zona waktu sesi

Kata kunci yang dicadangkan DESCRIBE FLOW

Operasi himpunan boolean SpatialSQL

Jenis pengecualian untuk SQLSTATE

Dukungan jenis data DATETIMEOFFSET untuk Microsoft Azure Synapse

Komentar tabel Google BigQuery

Evolusi skema dengan INSERT perintah

Nilai struct NULL dipertahankan dalam operasi INSERT

fungsi SQL parse_timestamp

max_by dan min_by dengan batas opsional

Fungsi agregat vektor dan skalar

Dukungan kursor SQL dalam pernyataan majemuk

Perkiraan fungsi sketsa top-k

Fungsi sketsa tuple

Dependensi kustom untuk Unity Catalog Python UDTFs

Fungsi geospasial baru

Dukungan foton untuk fungsi geospasial

Februari 2026

Databricks SQL versi 2025.40 sedang diluncurkan saat ini

Databricks SQL versi 2025.40 sekarang tersedia dalam Versi Pratinjau

Pembuatan skrip SQL umumnya tersedia

Penanda parameter sekarang didukung dalam konteks SQL lainnya

IDENTIFIER klausa diperluas ke lebih banyak konteks SQL

Penggabungan string literal didukung secara menyeluruh

Fungsi BITMAP_AND_AGG baru

Fungsi Sketsa Theta baru untuk perkiraan jumlah yang berbeda

Fungsi Sketsa KLL baru untuk perkiraan kuantil

Fungsi jendela SQL dalam tampilan metrik

Fungsi geospasial baru

Dukungan input EWKT untuk fungsi geometri dan geografi yang ada

Peningkatan performa untuk kueri berulang di atas tabel dengan filter baris dan masker kolom

Peningkatan performa fungsi geospasial

FSCK REPAIR TABLE menyertakan perbaikan metadata secara default

DESCRIBE TABLE output mencakup kolom metadata

Struktur NULL dipertahankan dalam operasi penulisan MERGE, UPDATE, dan streaming

Kolom partisi terwujud dalam file Parquet

Nilai partisi tanda waktu menghormati zona waktu sesi

Pembatasan perjalanan waktu diperbarui

SHOW TABLES DROPPEDmenghormati klausul LIMIT

Januari 2026

Saran dan Komentar

Sumber Daya Tambahan:

`agg` Fungsi SQL sebagai sinonim untuk `measure`