Partições

Aplica-se a: assinalado como sim Databricks SQL Databricks Runtime

Observação

Nas tabelas do Apache Iceberg geridas pelo Unity Catalog, este apenas suporta clustering líquido e interpreta as partições especificadas na cláusula como chaves de clustering para clustering líquido.

A Databricks recomenda clustering líquido para todas as novas tabelas Delta Lake e tabelas Iceberg geridas. Consulte tabelas geridas do Unity Catalog para Delta Lake e Apache Iceberg e Use agrupamento líquido para tabelas.

Para converter uma tabela Delta Lake particionada existente em clustering líquido, use ALTER TABLE ... REPLACE PARTITIONED BY WITH CLUSTER BY. Veja Converter uma tabela particionada em clustering líquido.

Uma partição é composta por um subconjunto de linhas numa tabela que compartilham o mesmo valor para um subconjunto predefinido de colunas chamadas colunas de particionamento. O uso de partições pode acelerar consultas na tabela, bem como a manipulação de dados.

Para usar partições, defina o conjunto de colunas de particionamento ao criar uma tabela incluindo a cláusula PARTITIONED BY.

Ao inserir ou manipular linhas em uma tabela, o Azure Databricks despacha automaticamente as linhas para as partições apropriadas.

Você também pode especificar a partição diretamente usando uma cláusula PARTITION.

Essa sintaxe também está disponível para tabelas que não usam o formato Delta Lake, para DROP, ADD ou RENAME partições rapidamente usando a ALTER TABLE instrução.

PARTICIONADO POR

A cláusula PARTITIONED BY especificou uma lista de colunas ao longo das quais a nova tabela é particionada.

Sintaxe

PARTITIONED BY ( { partition_column [ column_type ] } [, ...] )

Parâmetros

coluna_de_partição

Um identificador pode fazer referência a um column_identifier na tabela. Se você especificar mais de uma coluna, não deve haver duplicatas. Se você fizer referência a todas as colunas da tabela, column_specification um erro será gerado.
tipo_de_coluna

A menos que partition_column refira a um column_identifier na column_specification da tabela, column_type define o tipo de dados do partition_column.

Nem todos os tipos de dados suportados pelo Databricks SQL são suportados por todas as fontes de dados.

Notas

A menos que você defina uma tabela Delta Lake, as colunas de particionamento que fazem referência às colunas na especificação da coluna são sempre movidas para o final da tabela.

PARTITION

Use a cláusula PARTITION para identificar uma partição a ser consultada ou manipulada.

Uma partição é identificada nomeando todas as suas colunas e associando cada uma a um valor. Você não precisa especificá-los em uma ordem específica.

A menos que você esteja adicionando uma nova partição a uma tabela existente, você pode omitir colunas ou valores para indicar que a operação se aplica a todas as partições correspondentes correspondentes ao subconjunto de colunas.

PARTITION ( { partition_column  [ = partition_value | LIKE pattern ] } [ , ... ] )

Parâmetros

coluna_de_partição

Uma coluna designada como coluna de partição da tabela. Não é possível especificar a mesma coluna duas vezes.
= partition_value

Um literal de um tipo de dados que corresponde ao tipo da coluna de partição. Se você omitir um valor de partição, a especificação corresponderá a todos os valores dessa coluna de partição.
LIKE pattern

Este formulário só é permitido em ALTER SHARE ADD TABLE.

Compara a representação de cadeia de caracteres de partition_column com pattern. patterndeve ser um literal de cadeia de caracteres como usado em LIKE.

Exemplos

-- Use the PARTTIONED BY clause in a table definition
> CREATE TABLE student(university STRING,
                       major      STRING,
                       name       STRING)
         PARTITIONED BY(university, major)

> CREATE TABLE professor(name STRING)
         PARTITIONED BY(university STRING,
                        department STRING);

-- Use the PARTITION specification to INSERT into a table
> INSERT INTO student
         PARTITION(university= 'TU Kaiserslautern') (major, name)
         SELECT major, name FROM freshmen;

-- Use the partition specification to add and drop a partition
> CREATE TABLE log(date DATE, id INT, event STRING)
     USING CSV
     PARTITIONED BY (date);

> ALTER TABLE log ADD PARTITION(date = DATE'2021-09-10');

> ALTER TABLE log DROP PARTITION(date = DATE'2021-09-10');

-- Drop all partitions from the named university, independent of the major.
> ALTER TABLE student DROP PARTITION(university = 'TU Kaiserslautern');

Comentários

Esta página foi útil?

Last updated on 2026-06-29

Partições

PARTICIONADO POR

Sintaxe

Parâmetros

Notas

PARTITION

Parâmetros

Exemplos

Comentários

Recursos adicionais