Partilhar via


Suporte a variantes no Delta Lake

Importante

Esta funcionalidade está em Pré-visualização Pública.

Você pode usar o VARIANT tipo de dados para armazenar dados semiestruturados no Delta Lake. Para obter exemplos sobre como trabalhar com VARIANT, consulte Dados de variantes de consulta.

Você deve usar o Databricks Runtime 15.3 ou superior para ler e gravar tabelas com suporte a variantes habilitado.

Ativar variante em uma tabela Delta

Para habilitar a variante, crie uma nova tabela com uma coluna de tipo VARIANT, por exemplo:

CREATE TABLE table_name (variant_column VARIANT)

Você também pode habilitar o suporte para VARIANT em uma tabela existente usando a seguinte sintaxe:

ALTER TABLE table_name SET TBLPROPERTIES('delta.feature.variantType-preview' = 'supported')

Aviso

Quando você habilita a variante, o protocolo de tabela é atualizado. Após a atualização, a tabela não será legível pelos clientes Delta Lake que não suportam variantes. Consulte Compatibilidade de recursos e protocolos do Delta Lake.

Limitações

As seguintes limitações existem:

  • Não é possível usar colunas variantes para particionar uma tabela.
  • Uma coluna variante não pode ser uma chave de agrupamento para uma tabela.
  • Não é possível usar colunas variantes com cláusulas GROUP BY ou ORDER BY.
  • Não é possível chamar DISTINCT em uma coluna variante.
  • Não é possível usar operadores de conjunto SQL (INTERSECT, UNION, EXCEPT) com colunas variantes.
  • Não é possível usar a geração de colunas para criar uma coluna variante.
  • A Delta não coleta estatísticas de minValues ou maxValues para colunas variantes.
  • Uma coluna variante não pode conter um valor maior que 128 MiB (16 MiB no Databricks Runtime 17.1 e inferior).