Partager via


Application du schéma

Azure Databricks valide la qualité des données en appliquant le schéma lors de l’écriture.

Remarque

Cet article décrit le comportement par défaut des tables associées à Delta Lake sur Azure Databricks. L’application du schéma ne s’applique pas aux tables associées à des données externes.

Application du schéma pour les opérations d’insertion

Azure Databricks applique les règles suivantes lors de l’insertion de données dans une table :

  • Toutes les colonnes insérées doivent exister dans la table cible.
  • Tous les types de données de colonne doivent correspondre aux types de données de colonne de la table cible.

Remarque

Azure Databricks tente de caster en toute sécurité les types de données de colonne pour qu’ils correspondent à ceux de la table cible.

Validation du schéma pendant les opérations MERGE

Azure Databricks applique les règles suivantes lors de l’insertion ou de la mise à jour de données dans le cadre d’une opération MERGE :

  • Si le type de données de l’instruction source ne correspond pas à la colonne cible, MERGE tente de caster en toute sécurité les types de données de colonne pour qu’ils correspondent à ceux de la table cible.
  • Les colonnes qui sont la cible d’une action UPDATE ou INSERT doivent exister dans la table cible.
  • Lorsque vous utilisez la syntaxe INSERT * ou UPDATE SET * :
    • Les colonnes du jeu de données source non présentes dans la table cible sont ignorées.
    • Toutes les colonnes du jeu de données source doivent être présentes dans la table cible.

Modifier le schéma d’une table

Vous pouvez mettre à jour le schéma d’une table en utilisant des instructions ALTER TABLE explicites ou l’évolution automatique du schéma. Consultez Mettre à jour un schéma de table Delta Lake.

L’évolution du schéma a une sémantique spéciale pour les opérations MERGE. Consultez Évolution automatique du schéma pour la fusion Delta Lake.