Freigeben über


ALTER TABLE

Gilt für:mit Häkchen ja markiert Databricks SQL mit Häkchen ja markiert Databricks Runtime

Ändert das Schema oder die Eigenschaften einer Tabelle.

Informationen zu Typänderungen oder zur Umbenennung von Spalten in Delta Lake finden Sie unter Umschreiben der Daten.

Um den Kommentar in einer Tabelle oder Spalte zu ändern, können Sie auch COMMENT ONverwenden.

Um STREAMING TABLE zu ändern, verwenden Sie ALTER STREAMING TABLE.

Wenn die Tabelle zwischengespeichert wurde, löscht der Befehl zwischengespeicherte Daten der Tabelle und alle abhängigen Daten, die darauf verweisen. Der Cache wird beim nächsten Zugriff auf die Tabelle oder die abhängigen Daten verzögert gefüllt.

Hinweis

Wenn Sie einer vorhandenen Delta-Tabelle eine Spalte hinzufügen, können Sie keinen DEFAULT-Wert definieren. Alle Spalten, die den Delta-Tabellen hinzugefügt werden, werden für vorhandene Zeilen als NULL behandelt. Nachdem Sie eine Spalte hinzugefügt haben, können Sie optional einen Standardwert für die Spalte definieren, dies wird jedoch nur für neue Zeilen angewendet, die in die Tabelle eingefügt wurden. Verwenden Sie die folgende Syntax:

ALTER TABLE table_name ALTER COLUMN column_name SET DEFAULT default_expression

Bei Fremdtabellen können Sie nur ALTER TABLE SET OWNER und ALTER TABLE RENAME TO ausführen.

Erforderliche Berechtigungen

Wenn Sie Unity Catalog verwenden, müssen Sie über die MODIFY-Berechtigung für Folgendes verfügen:

  • ALTER COLUMN
  • ADD COLUMN
  • DROP COLUMN
  • SET TBLPROPERTIES
  • UNSET TBLPROPERTIES
  • modifizieren PREDICTIVE OPTIMIZATION

Wenn Sie Unity Catalog verwenden, müssen Sie über die MANAGE-Berechtigung oder den Besitz verfügen für:

  • SET OWNER TO

Für alle anderen Vorgänge müssen Sie Eigentümer der Tabelle sein.

Syntax

ALTER TABLE table_name
    { RENAME TO clause |
      ADD COLUMN clause |
      ALTER COLUMN clause |
      DROP COLUMN clause |
      RENAME COLUMN clause |
      DEFAULT COLLATION clause |
      ADD CONSTRAINT clause |
      DROP CONSTRAINT clause |
      DROP FEATURE clause |
      ADD PARTITION clause |
      DROP PARTITION clause |
      PARTITION SET LOCATION clause |
      RENAME PARTITION clause |
      RECOVER PARTITIONS clause |
      SET { ROW FILTER clause } |
      DROP ROW FILTER |
      SET TBLPROPERTIES clause |
      UNSET TBLPROPERTIES clause |
      SET SERDE clause |
      SET LOCATION clause |
      SET OWNER TO clause |
      SET SERDE clause |
      SET TAGS clause |
      UNSET TAGS clause |
      CLUSTER BY clause |
      PREDICTIVE OPTIMIZATION clause}

Parameter

  • ÄNDERN COLUMN

    Ändert eine Eigenschaft oder die Position einer Spalte.

  • LÖSCHEN COLUMN

    Entfernen Sie eine oder mehrere Spalten oder Felder aus einer Delta Lake-Tabelle.

  • UMBENENNEN COLUMN

    Benennt eine Spalte oder ein Feld in einer Delta Lake-Tabelle um.

  • ADD CONSTRAINT

    Fügt der Tabelle eine Prüfbedingung, eine informationsbasierte Fremdschlüsseleinschränkung oder eine informationsbasierte Primärschlüsseleinschränkung hinzu.

    Fremdschlüssel und Primärschlüssel werden nur für Tabellen in Unity Catalog unterstützt, nicht im hive_metastore-Katalog.

  • DEFAULT COLLATION collation_name

    Gilt für:ja markiert Databricks SQL ja markiert Databricks Runtime 16.3 und höher

    Ändert die Standardsortierung der Tabelle für neue STRING Spalten. Vorhandene Spalten sind von dieser Klausel nicht betroffen. Um die Sortierung einer vorhandenen Spalte zu ändern, verwenden Sie ALTER TABLE ... ALTER COLUMN ... COLLATE collation_name.

  • DROP CONSTRAINT

    Entfernt einen Primärschlüssel, Fremdschlüssel oder CHECK-Constraint von der Tabelle.

  • DROP FEATURE feature_name [ TRUNCATE HISTORY ]

    Gilt für:mit Häkchen markiert: Ja Databricks Runtime 14.3 LTS und höher

    Legacyunterstützung für DROP FEATURE ist ab Databricks Runtime 14.3 LTS verfügbar. Dokumentation zur Legacyfunktionalität finden Sie unter Entfernen von Delta-Tabellenfeatures (Legacy).

    Gilt für:ja markiert Databricks SQL ja markiert Databricks Runtime 16.3 und höher

  • Azure Databricks empfiehlt die Verwendung von Databricks Runtime 16.3 und höher für alle DROP FEATURE Befehle, die das Legacyverhalten ersetzen.

    Entfernt ein Feature aus einer Delta Lake-Tabelle.

    Das Entfernen eines Features kann dazu führen, dass das checkpointProtection Writer-Feature im Tabellenprotokoll hinzugefügt wird. Weitere Informationen finden Sie unter Drop Delta-Tabellenfeatures und Tabellenfeatures zur Protokollkompatibilität.

    • feature_name

      Der Name eines Features in Form eines STRING-Literals oder Bezeichners, der von Azure Databricks verstanden und in der Tabelle unterstützt werden muss.

      Wenn das Feature nicht in der Tabelle vorhanden ist, löst Azure Databricks DELTA_FEATURE_DROP_FEATURE_NOT_PRESENT aus.

    • VERLAUF ABSCHNEIDEN

      Entfernen von Features durch Abschneiden des Verlaufs. Dies erfordert einen zweistufigen Prozess:

Das Entfernen von Features durch Abschneiden des Verlaufs erfordert einen zweistufigen Prozess:

  • Der erste Aufruf löscht Spuren des Features und informiert Sie über teilweiser Erfolg.

  • Warten Sie dann, bis der Aufbewahrungszeitraum endet, bevor Sie die Anweisung erneut ausführen, um die Entfernung abzuschließen.

    Wenn Sie den zweiten Aufruf zu früh initiieren, löst Azure Databricks DELTA_FEATURE_DROP_WAIT_FOR_RETENTION_PERIOD oder DELTA_FEATURE_DROP_HISTORICAL_VERSIONS_EXIST aus.

    Durch das Abschneiden des Tabellenverlaufs können Sie DESCRIBE HISTORY ausführen und Zeitreisenabfragen ausführen.

  • HINZUFÜGEN PARTITION

    Fügt der Tabelle eine oder mehrere Partitionen hinzu.

  • LÖSCHEN PARTITION

    Entfernt eine oder mehrere Partitionen aus der Tabelle.

  • PARTITION ... SET ORT

    Legt den Ort einer Partition fest.

  • UMBENENNEN PARTITION

    Ersetzt die Schlüssel einer Partition.

  • WIEDERHERSTELLEN VON PARTITIONEN

    Weist Azure Databricks an, den Speicherort der Tabelle zu scannen und alle Dateien zur Tabelle hinzuzufügen, die direkt zum Dateisystem hinzugefügt wurden.

  • SET ROW FILTER Klausel

    Gilt für:mit Häkchen markiert 'Ja' Databricks SQL mit Häkchen markiert 'Ja' Databricks Runtime 12.2 LTS und höher mit Häkchen markiert 'Ja' nur Unity Catalog

    Fügt der Tabelle eine Zeilenfilterfunktion hinzu. Alle nachfolgenden Abfragen der Tabelle erhalten eine Teilmenge der Zeilen, in denen die Funktion als Boolescher Wert TRUE ausgewertet wird. Dies kann für eine fein abgestufte Zugriffssteuerung nützlich sein, bei der die Funktion die Identität oder Gruppenmitgliedschaften der aufrufenden Benutzer überprüfen kann, um zu entscheiden, ob bestimmte Spalten gefiltert werden sollen.

  • DROP ROW FILTER

    Gilt für:Grünes Häkchen für „Ja“ Nur Unity Catalog

    Löscht den Zeilenfilter aus der Tabelle, sofern vorhanden. Zukünftige Abfragen geben alle Zeilen aus der Tabelle ohne automatische Filterung zurück.

  • SET TBLPROPERTIES

    Legt eine oder mehrere benutzerdefinierte Eigenschaften fest oder setzt diese zurück.

  • UNSET TBLPROPERTIES

    Entfernt eine oder mehrere benutzerdefinierte Eigenschaften.

  • SET LOCATION

    Verschiebt den Speicherort einer Tabelle.

    SET LOCATION path
    
    • LOCATION path

      path muss ein STRING-Literal sein. Gibt den neuen Speicherort für die Tabelle an.

      Dateien am ursprünglichen Speicherort werden nicht an den neuen Speicherort verschoben.

  • [ SET ] OWNER TO Haupt

    Überträgt den Besitz der Tabelle an principal.

    Gilt für:Grünes Häkchen für „Ja“ Databricks SQL Grünes Häkchen für „Ja“ Databricks Runtime 11.3 LTS und höher

    SET ist als optionales Schlüsselwort zulässig.

  • SET TAGS ( { tag_name = tag_value } [, ...] )

    Gilt für:Grünes Häkchen für „Ja“ Databricks SQL Grünes Häkchen für „Ja“ Databricks Runtime 13.3 LTS und höher

    Wenden Sie Tags auf die Tabelle an. Sie benötigen die Berechtigung APPLY TAG, um Tags zur Tabelle hinzufügen zu können.

    • tag_name

      Ein STRING-Literal. tag_name muss innerhalb der Tabelle oder Spalte eindeutig sein.

    • tag_value

      Ein STRING-Literal.

  • UNSET TAGS ( tag_name [, ...] )

    Gilt für:Grünes Häkchen für „Ja“ Databricks SQL Grünes Häkchen für „Ja“ Databricks Runtime 13.3 LTS und höher

    Entfernen Sie Tags aus der Tabelle. Sie benötigen die Berechtigung APPLY TAG, um Tags aus der Tabelle entfernen zu können.

    • tag_name

      Ein STRING-Literal. tag_name muss innerhalb der Tabelle oder Spalte eindeutig sein.

  • CLUSTER BY Klausel

    Gilt für:Grünes Häkchen für „Ja“ Databricks SQL Grünes Häkchen für „Ja“ Databricks Runtime 13.3 LTS und höher

    Fügt die Gruppierungstrategie für eine Delta Lake-Tabelle hinzu, ändert sie oder verwirft sie.

  • { ENABLE | DISABLE | INHERIT } PREDICTIVE OPTIMIZATION

    Gilt für:mit Häkchen markiert 'Ja' Databricks SQL mit Häkchen markiert 'Ja' Databricks Runtime 12.2 LTS und höher mit Häkchen markiert 'Ja' nur Unity Catalog

    Ändert die verwaltete Delta Lake-Tabelle in die gewünschte Einstellung für die prädiktive Optimierung.

    Wenn Tabellen erstellt werden, wird standardmäßig aus dem Schema geerbt (INHERIT).

    Wenn die prädiktive Optimierung explizit aktiviert oder als aktiviert vererbt wird, werden OPTIMIZE und VACUUM automatisch für die Tabelle aufgerufen, wenn Azure Databricks dies für angemessen hält. Weitere Details finden Sie unter: Predictive Optimierung für Unity Catalog verwaltete Tabellen.

Beispiele

Beispiele zum Hinzufügen von Einschränkungen und zum Ändern von Spalten in Delta Lake finden Sie hier:

-- RENAME table
> DESCRIBE student;
                col_name data_type comment
 ----------------------- --------- -------
                    name    string    NULL
                  rollno       int    NULL
                     age       int    NULL
 # Partition Information
              # col_name data_type comment
                     age       int    NULL

> ALTER TABLE Student RENAME TO StudentInfo;

-- After Renaming the table
> DESCRIBE StudentInfo;
                col_name data_type comment
 ----------------------- --------- -------
                    name    string    NULL
                  rollno       int    NULL
                     age       int    NULL
 # Partition Information
              # col_name data_type comment
                     age       int    NULL

-- RENAME partition
> SHOW PARTITIONS StudentInfo;
 partition
 ---------
    age=10
    age=11
    age=12

> ALTER TABLE default.StudentInfo PARTITION (age='10') RENAME TO PARTITION (age='15');

-- After renaming Partition
> SHOW PARTITIONS StudentInfo;
 partition
 ---------
    age=11
    age=12
    age=15

-- Add new columns to a table
> DESCRIBE StudentInfo;
                col_name data_type comment
 ----------------------- --------- -------
                    name    string    NULL
                  rollno       int    NULL
                     age       int    NULL
 # Partition Information
              # col_name data_type comment
                     age       int    NULL

> ALTER TABLE StudentInfo ADD columns (LastName string, DOB timestamp);

-- After Adding New columns to the table
> DESCRIBE StudentInfo;
                col_name data_type comment
 ----------------------- --------- -------
                    name    string    NULL
                  rollno       int    NULL
                LastName    string    NULL
                     DOB timestamp    NULL
                     age       int    NULL
 # Partition Information
              # col_name data_type comment
                     age       int    NULL

-- Add a new partition to a table
> SHOW PARTITIONS StudentInfo;
 partition
 ---------
    age=11
    age=12
    age=15

> ALTER TABLE StudentInfo ADD IF NOT EXISTS PARTITION (age=18);

-- After adding a new partition to the table
> SHOW PARTITIONS StudentInfo;
 partition
 ---------
    age=11
    age=12
    age=15
    age=18

-- Drop a partition from the table
> SHOW PARTITIONS StudentInfo;
 partition
 ---------
    age=11
    age=12
    age=15
    age=18

> ALTER TABLE StudentInfo DROP IF EXISTS PARTITION (age=18);

-- After dropping the partition of the table
> SHOW PARTITIONS StudentInfo;
 partition
 ---------
    age=11
    age=12
    age=15

-- Adding multiple partitions to the table
> SHOW PARTITIONS StudentInfo;
 partition
 ---------
    age=11
    age=12
    age=15

> ALTER TABLE StudentInfo ADD IF NOT EXISTS PARTITION (age=18) PARTITION (age=20);

-- After adding multiple partitions to the table
> SHOW PARTITIONS StudentInfo;
 partition
 ---------
    age=11
    age=12
    age=15
    age=18
    age=20

-- ALTER or CHANGE COLUMNS
> DESCRIBE StudentInfo;
                col_name data_type comment
+-----------------------+---------+-------
                    name    string    NULL
                  rollno       int    NULL
                LastName    string    NULL
                     DOB timestamp    NULL
                     age       int    NULL
 # Partition Information
              # col_name data_type comment
                     age       int    NULL

ALTER TABLE StudentInfo ALTER COLUMN name COMMENT "new comment";

--After ALTER or CHANGE COLUMNS
> DESCRIBE StudentInfo;
                col_name data_type     comment
 ----------------------- --------- -----------
                    name    string new comment
                  rollno       int        NULL
                LastName    string        NULL
                     DOB timestamp        NULL
                     age       int        NULL
 # Partition Information
              # col_name data_type     comment
                     age       int        NULL

-- RENAME COLUMN
> ALTER TABLE StudentInfo RENAME COLUMN name TO FirstName;

--After RENAME COLUMN
> DESCRIBE StudentInfo;
                col_name data_type     comment
 ----------------------- --------- -----------
               FirstName    string new comment
                  rollno       int        NULL
                LastName    string        NULL
                     DOB timestamp        NULL
                     age       int        NULL
 # Partition Information
              # col_name data_type     comment
                     age       int        NULL

-- Change the file Location
> ALTER TABLE dbx.tab1 PARTITION (a='1', b='2') SET LOCATION '/path/to/part/ways';

-- SET SERDE/ SERDE Properties (DBR only)
> ALTER TABLE test_tab SET SERDE 'org.apache.hadoop.hive.serde2.columnar.LazyBinaryColumnarSerDe';

> ALTER TABLE dbx.tab1 SET SERDE 'org.apache.hadoop' WITH SERDEPROPERTIES ('k' = 'v', 'kay' = 'vee');

-- SET TABLE PROPERTIES
> ALTER TABLE dbx.tab1 SET TBLPROPERTIES ('winner' = 'loser');

-- DROP TABLE PROPERTIES
> ALTER TABLE dbx.tab1 UNSET TBLPROPERTIES ('winner');

-- Drop the "deletion vectors" from a Delta table
> ALTER TABLE my_table DROP FEATURE deletionVectors;

-- 24 hours later
> ALTER TABLE my_table DROP FEATURE deletionVectors TRUNCATE HISTORY;

-- Applies three tags to the table named `test`.
> ALTER TABLE test SET TAGS ('tag1' = 'val1', 'tag2' = 'val2', 'tag3' = 'val3');

-- Removes three tags from the table named `test`.
> ALTER TABLE test UNSET TAGS ('tag1', 'tag2', 'tag3');

-- Applies three tags to table `main.schema1.test` column `col1`.
> ALTER TABLE main.schema1.test ALTER COLUMN col1 SET TAGS ('tag1' = 'val1', 'tag2' = 'val2', 'tag3' = 'val3');

-- Removes three tags from table `main.schema1.test` column `col1`.
> ALTER TABLE main.schema1.test ALTER COLUMN col1 UNSET TAGS ('tag1', 'tag2', 'tag3');

-- Enables predictive optimization for my_table
> ALTER TABLE my_table ENABLE PREDICTIVE OPTIMIZATION;

-- Alter multiple columns in a single statement
-- Create a table with 3 columns
> CREATE TABLE my_table (num INT, str STRING, bool BOOLEAN) TBLPROPERTIES('delta.feature.allowColumnDefaults' = 'supported')
> DESCRIBE TABLE my_table;
  col_name    data_type     comment
  --------    ---------     -------
       num          int        null
       str       string        null
       bool      boolean       null

-- Update comments on multiple columns
> ALTER TABLE table ALTER COLUMN
   num COMMENT 'number column',
   str COMMENT 'string column';

> DESCRIBE TABLE my_table;
  col_name    data_type      comment
  --------    ---------   -------------
       num          int   number column
       str       string   string column
      bool      boolean            null

-- Can mix different types of column alter
> ALTER TABLE table ALTER COLUMN
   bool COMMENT 'boolean column',
   num AFTER bool,
   str AFTER num,
   bool SET DEFAULT true;

> DESCRIBE TABLE my_table;
  col_name    data_type      comment
  --------    ---------   --------------
      bool      boolean   boolean column
       num          int    number column
       str       string    string column