Freigeben über


Unterstützung von Varianten im Delta Lake

Wichtig

Dieses Feature befindet sich in der Public Preview.

Sie können den Datentyp VARIANT verwenden, um halbstrukturierte Daten im Delta Lake zu speichern. Beispiele zum Arbeiten mit VARIANT finden Sie unter Variantendaten abfragen.

Sie müssen Databricks Runtime 15.3 oder höher verwenden, um Tabellen mit Variantenunterstützung zu lesen und darin zu schreiben.

Aktivieren einer Variante für eine Delta-Tabelle

Erstellen Sie zum Aktivieren der Variante eine neue Tabelle mit einer VARIANT Typspalte, z. B.:

CREATE TABLE table_name (variant_column VARIANT)

Sie können auch die Unterstützung für VARIANT in einer vorhandenen Tabelle mithilfe der folgenden Syntax aktivieren:

ALTER TABLE table_name SET TBLPROPERTIES('delta.feature.variantType-preview' = 'supported')

Warnung

Wenn Sie die Variante aktivieren, wird ein Upgrade für das Tabellenprotokoll durchgeführt. Nach dem Upgrade ist die Tabelle für Delta Lake-Clients, die keine Varianten unterstützen, nicht mehr lesbar. Siehe Delta Lake Featurekompatibilität und Protokolle.

Begrenzungen

Es gelten die folgenden Einschränkungen:

  • Sie können keine Variantenspalten verwenden, um eine Tabelle zu partitionieren.
  • Eine Variantenspalte kann kein Clusteringschlüssel für eine Tabelle sein.
  • Sie können keine Variantenspalten mit GROUP BY oder ORDER BY Klauseln verwenden.
  • Sie können DISTINCT nicht auf eine Variantenspalte aufrufen.
  • Sql-Satzoperatoren (INTERSECT, UNION, EXCEPT) können nicht mit Variant-Spalten verwendet werden.
  • Sie können die Spaltengenerierung nicht verwenden, um eine Variantenspalte zu erstellen.
  • Das Delta erfasst keine minValues- oder maxValues-Statistiken für Variantenspalten.
  • Eine Variant-Spalte darf keinen Wert enthalten, der größer als 16 MiB ist.