Remarque
L’accès à cette page nécessite une autorisation. Vous pouvez essayer de vous connecter ou de modifier des répertoires.
L’accès à cette page nécessite une autorisation. Vous pouvez essayer de modifier des répertoires.
Important
Cette fonctionnalité est disponible en préversion publique.
Vous pouvez utiliser le VARIANT type de données pour stocker des données semi-structurées dans Delta Lake. Pour obtenir des exemples sur l’utilisation de VARIANT, consultez les données de variante de requête.
Vous devez utiliser Databricks Runtime 15.3 ou une version ultérieure pour lire et écrire des tables avec la prise en charge des variantes activée.
Activer la variante sur une table Delta
Pour activer la variante, créez une table avec une VARIANT colonne de type, par exemple :
CREATE TABLE table_name (variant_column VARIANT)
Vous pouvez également activer la prise en charge pour VARIANT sur une table existante à l’aide de la syntaxe suivante :
ALTER TABLE table_name SET TBLPROPERTIES('delta.feature.variantType-preview' = 'supported')
Avertissement
Lorsque vous activez la variante, le protocole de table est mis à niveau. Après la mise à niveau, la table ne sera pas lisible par les clients Delta Lake qui ne prennent pas en charge la variante. Consultez les protocoles et la compatibilité des fonctionnalités Delta Lake.
Limites
Les limites suivantes existent :
- Vous ne pouvez pas utiliser de colonnes de variante pour partitionner une table.
- Une colonne de variante ne peut pas être une clé de clustering pour une table.
- Vous ne pouvez pas utiliser de colonnes variant avec des clauses
GROUP BYouORDER BY. - Vous ne pouvez pas appeler
DISTINCTsur une colonne variante. - Vous ne pouvez pas utiliser les opérateurs de jeu SQL (
INTERSECT,UNION,EXCEPT) avec des colonnes variantes. - Vous ne pouvez pas utiliser la génération de colonnes pour créer une colonne de variante.
- Delta ne collecte pas
minValuesoumaxValuesles statistiques pour les colonnes de variantes. - Une colonne variant ne peut pas contenir une valeur supérieure à 128 Mo (16 Mo dans Databricks Runtime 17.1 et versions antérieures).