Notas de versão do Databricks SQL 2026

Os recursos e melhorias do SQL do Databricks a seguir foram lançados em 2026.

Maio de 2026

O Databricks SQL versão 2026.15 já está disponível na versão prévia

26 de maio de 2026

O Databricks SQL versão 2026.15 agora está disponível no canal versão prévia . Examine a seção a seguir para saber mais sobre novos recursos, alterações comportamentais e correções de bugs.

O XPath não busca mais DTDs externos

Quando você avalia xpath em XML, Azure Databricks não carrega mais DTDs (Definições de Tipo de Documento) externas declaradas no documento. Anteriormente, o XPath podia falhar quando o XML continha uma referência DTD externa que apontava para uma URL malformada ou um ponto de extremidade inacessível. Como a validação de DTD é separada da avaliação do XPath, as consultas que já obtiveram êxito retornam os mesmos resultados de antes. Agora, as consultas que falharam anteriormente somente durante a recuperação de DTD externo podem ser bem-sucedidas.

Preservação de struct NULL em INSERT, MERGE e gravações de streaming com evolução do esquema

Para INSERT, MERGE e gravações de streaming que usam a evolução do esquema, um struct NULL na origem agora é armazenado como NULL no destino. Anteriormente, esse valor era materializado incorretamente como um struct não nulo com cada campo definido como NULL, enquanto as mesmas operações sem evolução de esquema preservavam corretamente os structs NULL. Se seu código dependesse de receber um struct não nulo cujos campos eram todos NULL, atualize seu código para manipular um struct NULL.

Suporte a NullType (VOID) em tabelas Delta

As tabelas Delta Lake agora dão suporte VOID a colunas. Anteriormente, as colunas VOID eram silenciosamente ignoradas por leituras de DataFrame baseadas no caminho e consultas de viagem temporal. Essas consultas agora incluem VOID colunas na saída. As gravações não são afetadas. Consulte o VOID tipo para restrições sobre onde VOID colunas podem aparecer no esquema.

Revise todas as consultas que leem tabelas do Delta Lake com VOID colunas para verificar se elas lidam corretamente com as colunas adicionais. Consultas que dependem da contagem ou posição de colunas, como, por INSERT INTO ... SELECT *exemplo, podem começar a falhar após a atualização. Em particular, determinadas INSERT consultas com a evolução do esquema habilitada podem mudar silenciosamente os dados para as colunas erradas.

SHOW CREATE TABLE suporta exibições de métrica

SHOW CREATE TABLE agora dá suporte a exibições de métrica. Anteriormente, a execução desse comando em uma exibição de métrica gerava um erro. A saída para exibições de métrica inclui o nome de três partes totalmente qualificado com catálogo (por exemplo, CREATE VIEW catalog.db.my_metric_view ...), facilitando a recriação da exibição de métrica no local correto.

Correção para linhas de remoção LEFT OUTER JOIN LATERAL

Um bug que retirou incorretamente linhas de LEFT OUTER JOIN LATERAL consultas agora é corrigido. As consultas que usam esse constructo agora retornam os resultados corretos. Para reverter temporariamente para o comportamento anterior, defina spark.databricks.sql.optimizer.lateralJoinPreserveOuterSemantic como true.

Natural JOIN respeita correspondência de colunas que não diferenciam maiúsculas de minúsculas

NATURAL JOIN agora usa corretamente a correspondência de colunas que não diferencia maiúsculas de minúsculas quando spark.sql.caseSensitive é definido como false (o padrão). Anteriormente, NATURAL JOIN usava comparação sensível a maiúsculas e minúsculas para identificar colunas comuns, fazendo com que colunas que diferem apenas nas letras maiúsculas e minúsculas (por exemplo, ID versus id) não fossem reconhecidas como correspondentes. Isso causou NATURAL JOIN a gerar silenciosamente resultados de junção cruzada. As consultas afetadas por esse bug agora retornam resultados corretos com colunas unidas corretamente.

Validação de dependência do UDF do SQL no Catálogo do Unity

O Unity Catalog agora impõe a validação de dependência para UDFs (funções definidas pelo usuário) do SQL para impedir o bypass de controles de acesso. Anteriormente, as funções SQL criadas por meio da API REST podiam referenciar dependências às quais o usuário não tinha acesso. UDFs do SQL com configurações de dependência inválidas agora estão bloqueadas da execução.

Gravações otimizadas para tabelas particionadas no Unity Catalog criadas com CRTAS

Gravações otimizadas agora são aplicadas corretamente às tabelas particionadas do Unity Catalog criadas com CREATE OR REPLACE TABLE ... AS SELECT (CRTAS). Anteriormente, o CRTAS em novas tabelas particionadas do Catálogo do Unity não aplicava gravações otimizadas, resultando em um número maior de arquivos pequenos por partição. Essa correção pode aumentar a latência de gravação. Para reverter para o comportamento anterior, defina spark.databricks.delta.optimizeWrite.UCTableCRTAS.enabled como false.

Corrigir a autoridade de EPSG incorreta para o SRID 102100 definido por ESRI

O mapeamento crs (sistema de referência de coordenadas) para SRID 102100 agora usa ESRI:102100 corretamente em vez do incorreto EPSG:102100. Essa correção garante que os dados geoespaciais sejam armazenados com a autoridade correta para melhor interoperabilidade com outros sistemas.

SUPORTE PARA CRIAR OU SUBSTITUIR tabelas temporárias

CREATE OR REPLACE TEMP TABLE A sintaxe agora tem suporte, permitindo que você crie ou substitua tabelas temporárias em uma única instrução. Isso elimina a necessidade de descartar e recriar explicitamente tabelas temporárias.

O histórico da tabela Delta inclui sinalizadores de opção de gravação

O histórico da tabela Delta Lake (DESCRIBE HISTORY) agora inclui flags de opção de gravação na coluna operationParameters para as operações WRITE e REPLACE TABLE. Quando as opções a seguir estão explicitamente habilitadas, elas aparecem como sinalizadores boolianos no histórico (incluídos somente quando true):

Para WRITE e REPLACE TABLE operações:

  • isDynamicPartitionOverwrite: presente quando o modo dinâmico de substituição de partição foi usado
  • canOverwriteSchema: presente quando a substituição de esquema (overwriteSchema) foi habilitada
  • canMergeSchema: presente quando a mesclagem de esquema (mergeSchema) foi habilitada

Para REPLACE TABLE operações:

  • predicate: presente quando replaceWhere foi usado
  • isV1WriterSaveAsTableOverwrite: presente quando a substituição foi disparada por uma .saveAsTable sobrescrita

Novas funções geoespaciais

As seguintes funções geoespaciais agora estão disponíveis:

  • st_makepoint função: retorna um ponto GEOMETRY com as coordenadas fornecidas.
  • st_makeenvelope função: Retorna um GEOMETRY valor que representa o envelope alinhado ao eixo (caixa delimitadora) definido pelas coordenadas de canto fornecidas.

Suporte de junção espacial aprimorado

O predicado ST_DWithin (distância interna) agora tem suporte como condição de junção em junções espaciais. As conjunções de predicados agora são qualificadas para junções espaciais, por exemplo condition AND st_predicate.

Criação de perfil de dados nativos para tabelas de resultados no editor do SQL

1º de maio de 2026

Agora você pode visualizar estatísticas de perfilamento para colunas em tabelas de resultados no novo editor SQL do Databricks. Selecione cabeçalhos de coluna e clique no ícone barra lateral.Abra os detalhes da seleção para exibir estatísticas de criação de perfil.

Abril de 2026

agg Função SQL como sinônimo para measure

30 de abril de 2026

A nova função agg é um sinônimo de medida. Use agg(measure_column) como uma alternativa mais curta ao consultar medidas em uma visão de métrica.

O Databricks SQL versão 2026.10 está sendo implantado no Current

23 de abril de 2026

A versão 2026.10 do Databricks SQL está sendo lançada no canal Current. Confira os recursos em 2026.10.

Março de 2026

O Databricks SQL versão 2026.10 agora está disponível na versão prévia

26 de março de 2026

O Databricks SQL versão 2026.10 agora está disponível no canal versão prévia . Examine a seção a seguir para saber mais sobre novos recursos, alterações comportamentais e correções de bugs.

Erros de métrica de observação não causam mais falhas em consultas

Erros durante a coleta de métricas de observação não causam mais falhas de execução de consulta. Anteriormente, erros em OBSERVE cláusulas (como divisão por zero) podiam bloquear ou falhar a consulta inteira. Agora, a consulta é concluída com êxito e o erro é gerado quando você chama observation.get.

Operações de gravações otimizadas para CRTAS do Unity Catalog

CRIAR OU SUBSTITUIR TABLE As operações do AS SELECT (CRTAS) em tabelas particionadas do Catálogo do Unity agora aplicam gravações otimizadas por padrão, produzindo menos arquivos maiores. Para desabilitar, defina spark.databricks.delta.optimizeWrite.UCTableCRTAS.enabled como false.

Valores de partição de timestamp usam o fuso horário da sessão

Os valores de partição de carimbo de data/hora agora usam o fuso horário da sessão do SQL Warehouse. Se você tiver partições de carimbo de data/hora gravadas antes do Databricks SQL versão 2025.40, execute SHOW PARTITIONS para verificar os metadados de partição antes de gravar novos dados.

Palavra-chave reservada DESCRIBE FLOW

O DESCRIBE FLOW comando agora está disponível. Se você tiver uma tabela chamada flow, use DESCRIBE schema.flow, DESCRIBE TABLE flow, ou DESCRIBE `flow` com backticks.

Operações de conjunto booleanas do SpatialSQL

ST_Difference, ST_Intersection, e ST_Union use uma nova implementação com as seguintes melhorias:

  • Geometrias de entrada válidas sempre produzem um resultado e não geram mais erros. Entradas inválidas não geram erros, mas podem não produzir resultados válidos.
  • Desempenho aproximadamente 2x mais rápido.
  • Os resultados podem diferir após o 15º local decimal para interseções de segmento de linha devido a fórmulas e ordem de operações diferentes.
  • Os resultados são normalizados para uma saída consistente e comparável:
    • Os pontos são classificados por valores de coordenadas.
    • As linhas de linha são criadas a partir dos caminhos mais longos possíveis.
    • Os anéis de polígono são girados para que o primeiro ponto tenha os menores valores de coordenadas.
  • Essa normalização se aplica em todos os casos, exceto ao chamar ST_Difference com duas geometrias não sobrepostas, em que a primeira geometria é retornada sem modificação.

Tipos de exceção para SQLSTATE

Os tipos de exceção agora dão suporte a SQLSTATE. Se o seu código analisar exceções por comparação de strings ou capturar tipos de exceção específicos, atualize a lógica de tratamento de erros.

Suporte ao tipo de dados DATETIMEOFFSET para o Microsoft Azure Synapse

O DATETIMEOFFSET tipo de dados agora está disponível para conexões do Microsoft Azure Synapse.

Comentários da tabela do Google BigQuery

As descrições da tabela do Google BigQuery são resolvidas e expostas como comentários de tabela.

Evolução do esquema com INSERT declarações

Use a WITH SCHEMA EVOLUTION cláusula com instruções SQL INSERT para evoluir automaticamente o esquema da tabela de destino durante as operações de inserção. Há suporte para INSERT INTO, INSERT OVERWRITE e INSERT INTO ... REPLACE formas. Por exemplo:

INSERT WITH SCHEMA EVOLUTION INTO students TABLE visiting_students_with_additional_id;

O esquema da tabela Delta Lake de destino é atualizado para acomodar colunas adicionais ou tipos expandidos da origem. Para obter detalhes, consulte a evolução do esquema e INSERT a sintaxe da instrução.

Valores de struct preservados como NULL em operações INSERT

INSERT as operações com evolução de esquema ou conversão implícita agora preservam NULL valores de struct quando as tabelas de origem e destino apresentam ordens diferentes nos campos de struct.

função SQL parse_timestamp

A função SQL parse_timestamp analisa cadeias de caracteres de carimbo de data/hora usando vários padrões e é executada no mecanismo Photon para melhorar o desempenho ao analisar carimbos de data/hora em vários formatos. Consulte padrões datetime para obter informações sobre a formatação de padrão datetime.

max_by e min_by com limite opcional

As funções de agregação max_by e min_by agora aceitam um terceiro argumento limit opcional (até 100.000). Quando fornecidas, as funções retornam uma matriz de até limit valores correspondentes aos maiores (ou menores) valores da expressão de ordenação, simplificando as consultas top-K e bottom-K sem funções de janela ou CTEs.

Medidas de janela de período a período com offset

As medidas de janela em visualizações métricas oferecem suporte a um campo offset que desloca a janela para trás ou para frente na dimensão order por um intervalo fixo. Use offset para definir medidas de período a período, como ano a ano ou mês a mês. Veja Como offset desloca o quadro da janela.

Incluir ou excluir a linha âncora nas medidas de janela em trailing e leading

Os valores de intervalo trailing e leading para medidas de janela aceitam um modificador opcional inclusive ou exclusive que controla se a linha âncora faz parte da janela móvel. O padrão é exclusive, que corresponde ao comportamento anterior. Consulte Incluir ou excluir a linha de âncora.

Agregação de vetor e funções escalares

Novas funções SQL operam em ARRAY<FLOAT> vetores para cargas de trabalho de incorporação e similaridade.

Funções de agregação:

  • vector_avg: retorna a média de vetores em termos de elemento em um grupo.
  • vector_sum: retorna a soma de vetores em termos de elemento em um grupo.

Funções escalares:

Consulte funções internas.

Suporte ao cursor SQL em instruções compostas

As declarações compostas de script SQL agora oferecem suporte para o processamento de cursores. Use DECLARE CURSOR para definir um cursor e então utilize uma instrução OPEN, uma instrução FETCH e uma instrução CLOSE para executar a consulta e consumir as linhas uma de cada vez. Os cursores podem usar marcadores de parâmetro e manipuladores de condição, como NOT FOUND para processamento linha por linha.

Funções de esboço aproximadas top-k

As novas funções permitem a criação e a combinação de esboços top-K aproximados para agregação distribuída top-K:

Para obter mais informações, consulte approx_top_k a função de agregação e as funções internas.

Funções de esboço de tupla

Novas funções agregadas e escalares para esboço de tupla dão suporte a contagem e agregação distintas em pares de resumo de chave.

Funções de agregação:

Funções escalares:

Consulte funções internas.

Dependências personalizadas para Python UDTFs do Unity Catalog

As funções de tabela definidas pelo usuário (UDTFs) do Python no Unity Catalog agora podem usar dependências personalizadas para bibliotecas externas, permitindo o uso de pacotes além dos disponíveis no ambiente padrão do SQL Warehouse. Consulte Estender UDFs usando dependências personalizadas.

Novas funções geoespaciais

As seguintes funções geoespaciais agora estão disponíveis:

  • st_estimatesrid função: Estima o melhor identificador de referência espacial projetado (SRID) para uma geometria de entrada.
  • st_force2d função: converte uma geografia ou geometria em sua representação 2D.
  • st_nrings função: conta o número total de anéis em um polígono ou multipolígono, incluindo anéis externos e interiores.
  • st_numpoints função: conta o número de pontos não vazios em uma geografia ou geometria.

Suporte a fótons para funções geoespaciais

As seguintes funções geoespaciais agora são executadas no mecanismo photon para obter um desempenho mais rápido:

Fevereiro de 2026

O Databricks SQL versão 2025.40 está sendo implantado no Current

23 de fevereiro de 2026

O Databricks SQL versão 2025.40 está sendo distribuído para o canal Atual . Confira os recursos em 2025.40.

O Databricks SQL versão 2025.40 agora está disponível na versão prévia

11 de fevereiro de 2026

O Databricks SQL versão 2025.40 agora está disponível no canal versão prévia . Examine a seção a seguir para saber mais sobre novos recursos, alterações comportamentais e correções de bugs.

O script SQL está amplamente disponível.

O script SQL agora está disponível em geral. Escreva lógica de procedimento com SQL, incluindo instruções condicionais, loops, variáveis locais e tratamento de exceções.

Os marcadores de parâmetro agora têm suporte em mais contextos SQL

Agora você pode usar marcadores de parâmetro nomeados (:param) e não nomeados (?) em qualquer lugar em que um valor literal do tipo apropriado é permitido. Isso inclui instruções DDL, como CREATE VIEW v AS SELECT ? AS c1, tipos de coluna, como DECIMAL(:p, :s), e comentários, como COMMENT ON t IS :comment. Isso permite que você parametrize uma grande variedade de instruções SQL sem expor seu código a ataques de injeção de SQL. Consulte marcadores de parâmetros.

IDENTIFIER cláusula expandida para mais contextos SQL

A IDENTIFIER cláusula, que converte cadeias de caracteres em nomes de objeto SQL, agora tem suporte em quase todos os contextos em que um identificador é permitido. Combinado com o marcador de parâmetro expandido e o suporte à associação de cadeia de caracteres literal, você pode parametrizar qualquer coisa, desde aliases de coluna (AS IDENTIFIER(:name)) até definições de coluna (IDENTIFIER(:pk) BIGINT NOT NULL). Consulte a cláusula IDENTIFIER.

Mesclagem de cadeia de caracteres literal com suporte em todas as plataformas

Literais de cadeia de caracteres sequenciais, como 'Hello' ' World', agora se agrupam em 'Olá, Mundo' em qualquer contexto em que literais de cadeia de caracteres são permitidos, incluindo COMMENT 'This' ' is a ' 'comment'. Consulte STRING tipo.

Nova função de BITMAP_AND_AGG

Uma nova função BITMAP_AND_AGG agora está disponível para complementar a biblioteca de BITMAP funções existente.

Novas funções Theta Sketch para contagens distintas aproximadas

Uma nova biblioteca de funções para operações aproximadas de contagem distinta e de conjunto, usando o Theta Sketch do Datasketches, agora está disponível.

Novas funções de esboço kll para quantiles aproximados

Uma nova biblioteca de funções para a criação de Esboços KLL para cálculo de quantis aproximados agora está disponível.

Você pode mesclar vários esboços KLL em um contexto de agregação usando kll_merge_agg_bigint, kll_merge_agg_double e kll_merge_agg_float.

Funções da janela SQL em exibições de métrica

Agora você pode usar funções de janela SQL em exibições de métrica para calcular totais em execução, classificações e outros cálculos baseados em janela.

Novas funções geoespaciais

As seguintes novas funções geoespaciais agora estão disponíveis:

Suporte de entrada EWKT para funções de geometria e geografia existentes

As seguintes funções agora aceitam Texto Bem-Conhecido Estendido (EWKT) como entrada:

Desempenho aprimorado para consultas repetidas em tabelas com filtros de linha e máscaras de coluna

Consultas qualificadas repetidas em tabelas com filtros de linha e máscaras de coluna agora se beneficiam de um cache de resultados de consulta aprimorado, resultando em tempos de execução mais rápidos.

Desempenho aprimorado da função geoespacial

O desempenho de junção espacial é aprimorado com suporte para junção espacial com embaralhamento. As seguintes funções ST agora têm implementações de Photon:

FSCK REPAIR TABLE inclui reparo de metadados por padrão

FSCK REPAIR TABLE agora inclui uma etapa inicial de reparo de metadados antes de verificar se há arquivos de dados ausentes, permitindo que ele funcione em tabelas com pontos de verificação corrompidos ou valores de partição inválidos. Além disso, a dataFilePath coluna no FSCK REPAIR TABLE DRY RUN esquema de saída agora aceita valor nulo para dar suporte a novos tipos de questões em que o caminho do arquivo de dados não é aplicável.

DESCRIBE TABLE a saída inclui a coluna de metadados

A saída de DESCRIBE TABLE [EXTENDED] agora inclui uma coluna de metadata para todos os tipos de tabela. Esta coluna contém metadados semânticos (nome de exibição, formato e sinônimos) definidos na tabela como uma cadeia de caracteres JSON.

Structs NULL preservadas em operações de mesclagem, UPDATE, e operações de escrita em fluxo

Os structs NULL agora são mantidos como NULL no Delta Lake MERGE, UPDATE e operações de gravação de streaming que incluem conversões para o tipo struct. Anteriormente, os structs NULL eram expandidos para structs com todos os campos definidos como NULL.

Colunas de partição materializadas em arquivos Parquet

As tabelas particionadas do Delta Lake agora materializam colunas de partições em arquivos de dados Parquet recém-gravados. Anteriormente, os valores de partição eram armazenados apenas nos metadados do log de transações do Delta Lake. As cargas de trabalho que leem diretamente arquivos Parquet gravados pelo Delta Lake veem colunas de partição adicionais em arquivos gravados recentemente.

Valores de partição de carimbo de data/hora respeitam o fuso horário da sessão

Agora, os valores de partição de carimbo de data/hora são ajustados corretamente usando a configuração spark.sql.session.timeZone. Anteriormente, eles eram convertidos incorretamente em UTC usando o fuso horário JVM.

Restrições de viagem no tempo atualizadas

O Azure Databricks agora bloqueia consultas de viagem no tempo que excedam o deletedFileRetentionDuration limite para todas as tabelas. O VACUUM comando ignora o argumento de duração de retenção, exceto quando o valor é de 0 horas. Você não pode definir deletedFileRetentionDuration maior que logRetentionDuration.

SHOW TABLES DROPPED respeita a cláusula LIMIT

SHOW TABLES DROPPED agora respeita corretamente a LIMIT cláusula.

Janeiro de 2026