Columnstore indexes: visão geral

Aplica-se a:SQL Server Azure SQL Database Azure SQL Managed Instance Azure Synapse Analytics Sistema de Plataforma de Análise (PDW)Base de dados SQL no Microsoft Fabric

Os índices Columnstore são o padrão para armazenar e consultar grandes tabelas factuais de armazém de dados. Esse índice usa armazenamento de dados baseado em colunas e processamento de consultas para obter ganhos de até 10 vezes o desempenho da consulta em seu data warehouse em relação ao armazenamento tradicional orientado a linhas. Você também pode obter ganhos de até 10 vezes a compactação de dados em relação ao tamanho de dados não compactados. A partir do SQL Server 2016 (13.x) SP1, os índices columnstore permitem análises operacionais: a capacidade de executar análises de desempenho em tempo real em uma carga de trabalho transacional.

Saiba mais sobre um cenário relacionado:

O que é um índice columnstore?

Um índice de armazenamento em colunas é uma tecnologia para armazenar, recuperar e gerir dados usando um formato de dados colunar, chamado columnstore.

Palavras-chave e conceitos

Os seguintes termos-chave e conceitos estão associados aos índices columnstore.

Columnstore

Um columnstore é um conjunto de dados organizados logicamente como uma tabela com linhas e colunas, e armazenado fisicamente num formato de dados em colunas.

Rowstore

Um rowstore é um conjunto de dados organizados logicamente como uma tabela com linhas e colunas e armazenados fisicamente no formato de dados por linha. Esse formato é a maneira tradicional de armazenar dados de tabelas relacionais. No SQL Server, rowstore refere-se a uma tabela em que o formato de armazenamento de dados subjacente é um heap, um índice clusterizado ou uma tabela com otimização de memória.

Note

Nas discussões sobre índices columnstore, utilizam-se os termos rowstore e columnstore para enfatizar o formato de armazenamento dos dados.

Rowgroup

Um rowgroup é um agregado de linhas que são compactadas no formato columnstore ao mesmo tempo. Um grupo de linhas geralmente contém o número máximo de linhas por grupo de linhas, que é de 1.048.576 linhas.

Para obter alto desempenho e altas taxas de compactação, o índice columnstore divide a tabela em grupos de linhas (rowgroups) e, em seguida, compacta cada grupo de linhas de forma orientada por coluna. O número de linhas no grupo de linhas deve ser grande o suficiente para melhorar as taxas de compressão e pequeno o suficiente para se beneficiar de operações em memória.

Um grupo de linhas de onde todos os dados foram excluídos transita do estado COMPRESSED para o estado TOMBSTONE e, posteriormente, é removido por um processo em segundo plano chamado tuple-mover. Para obter mais informações sobre os estados do grupo de linhas, consulte sys.dm_db_column_store_row_group_physical_stats (Transact-SQL).

Tip

Ter demasiados grupos de linhas pequenos diminui a qualidade do índice columnstore. Até o SQL Server 2017 (14.x), uma operação de reorganização é necessária para mesclar grupos de linhas COMPRESSED menores, seguindo uma política de limite interno que determina como remover linhas excluídas e combinar os grupos de linhas compactados.
A partir do SQL Server 2019 (15.x), uma tarefa de mesclagem em segundo plano também funciona para mesclar grupos de linhas COMPACTADOS de onde um grande número de linhas foi excluído.
Depois de mesclar grupos de linhas menores, a qualidade do índice deve ser melhorada.

Note

A partir do SQL Server 2019 (15.x), da Base de Dados SQL do Azure, da Instância Gerida SQL do Azure e de pools SQL dedicados no Azure Synapse Analytics, o tuple-mover é auxiliado por uma tarefa de mesclagem em segundo plano que compacta automaticamente grupos de linhas delta OPEN menores que existem há algum tempo, conforme determinado por um limite interno, ou mescla grupos de linhas COMPACTADOS de onde se eliminou um grande número de linhas. Isso melhora a qualidade do índice columnstore ao longo do tempo.

Segmento da coluna

Um segmento de coluna é uma coluna de dados de dentro do grupo de linhas.

Cada grupo de linhas contém um segmento de coluna para cada coluna da tabela.
Cada segmento de coluna é compactado em conjunto e armazenado em mídia física.
Há metadados com cada segmento para permitir a eliminação rápida de segmentos sem lê-los.

Diagrama lógico do segmento da coluna. Cada coluna tem um segmento de coluna por grupo de linhas.

Índice columnstore agrupado

Um índice columnstore clusterizado representa o armazenamento físico de toda a tabela.

Diagrama lógico de um índice columnstore clusterizado. Inclui segmentos de coluna compactados, além de linhas no índice, mas não no columnstore.

Para reduzir a fragmentação dos segmentos de coluna e melhorar o desempenho, o índice columnstore pode armazenar alguns dados temporariamente em um índice clusterizado chamado deltastore e uma lista de árvore B de IDs para linhas excluídas. As operações da deltastore são geridas nos bastidores. Para retornar os resultados corretos da consulta, o índice columnstore clusterizado combina os resultados da consulta do columnstore e do deltastore.

Note

A documentação usa o termo árvore B geralmente em referência a índices. Em índices rowstore, o Mecanismo de Banco de Dados implementa uma árvore B+. Isto não se aplica a índices em columnstore ou a índices em tabelas otimizadas para memória. Para obter mais informações, consulte o guia de arquitetura e design de índices do SQL Server e Azure SQL .

Grupo de linhas Delta

Um grupo de linhas delta é um índice B-tree clusterizado que é utilizado apenas com índices columnstore. Ele melhora a compactação e o desempenho do armazenamento em coluna armazenando linhas até que o número de linhas atinja um limite de 1.048.576, momento em que são então movidas para o armazenamento em coluna.

Quando um grupo de linhas delta atinge o número máximo de linhas, ele passa de um estado OPEN para CLOSED. Um processo em segundo plano chamado movedor de tuplas verifica grupos de linhas fechados. Se o processo encontrar um grupo de linhas fechado, ele compacta o grupo de linhas delta e o armazena no columnstore como um grupo de linhas COMPACTADO.

Quando um grupo de linhas delta é compactado, o grupo de linhas delta existente transita para o estado TOMBSTONE para ser removido posteriormente pelo tuple-mover quando já não há referências a ele.

Para obter mais informações sobre os estados do grupo de linhas, consulte sys.dm_db_column_store_row_group_physical_stats (Transact-SQL).

Note

A partir do SQL Server 2019 (15.x), o tuple-mover é ajudado por uma tarefa de mesclagem em segundo plano que compacta automaticamente grupos de linhas delta OPEN menores que existem há algum tempo, conforme determinado por um limite interno, ou mescla grupos de linhas COMPACTADAS de onde um grande número de linhas foi excluído. Isso melhora a qualidade do índice columnstore ao longo do tempo.

Deltastore

Um índice columnstore pode ter mais de um grupo de linhas delta. Todos os grupos de linhas delta são chamados coletivamente de deltastore.

Durante uma carga em massa, a maioria das linhas vai diretamente para o columnstore sem passar pelo deltastore. Algumas linhas no final da carga em massa podem ser muito poucas em número para atender ao tamanho mínimo de um grupo de linhas, que é de 102.400 linhas. Como resultado, as linhas finais são enviadas para o deltastore em vez do columnstore. Para pequenas cargas a granel com menos de 102.400 linhas, todas as linhas vão diretamente para o deltastore.

Índice columnstore não agrupado

Um índice de armazenamento em colunas não clusterizado e um índice de armazenamento em colunas clusterizado funcionam da mesma maneira. A diferença é que um índice não clusterizado é um índice secundário criado em uma tabela rowstore, mas um índice columnstore clusterizado é o armazenamento primário para toda a tabela.

O índice não clusterizado contém uma cópia de parte ou de todas as linhas e colunas na tabela subjacente. O índice é definido como uma ou mais colunas da tabela e tem uma condição opcional que filtra as linhas.

Um índice columnstore não clusterizado permite análises operacionais em tempo real em que a carga de trabalho OLTP usa o índice clusterizado subjacente enquanto a análise é executada simultaneamente no índice columnstore. Para obter mais informações, consulte Introdução ao columnstore para análise operacional em tempo real.

Execução em modo de lote

A execução em modo de lote é um método de processamento de consulta usado para processar várias linhas juntas. A execução do modo de lote é estreitamente integrada e otimizada em torno do formato de armazenamento columnstore. A execução em modo de lote é às vezes conhecida como execução baseada em vetor ou execução vetorizada . As consultas em índices columnstore usam a execução em modo de lote, o que melhora o desempenho da consulta normalmente em duas a quatro vezes. Para obter mais informações, consulte o guia de arquitetura de processamento de consultas .

Por que devo usar um índice columnstore?

Um índice columnstore pode fornecer um nível muito alto de compactação de dados, normalmente até 10 vezes, para reduzir significativamente os custos de armazenamento do seu data warehouse. Para análises, um índice columnstore oferece um desempenho de ordem de magnitude melhor do que um índice B-tree. Os índices Columnstore são o formato de armazenamento de dados preferido para cargas de trabalho de armazenamento de dados e análise. A partir do SQL Server 2016 (13.x), você pode usar índices columnstore para análises em tempo real sobre sua carga de trabalho operacional.

Razões pelas quais os índices columnstore são tão rápidos:

As colunas armazenam valores do mesmo domínio e geralmente têm valores semelhantes, o que resulta em altas taxas de compactação. Os gargalos de E/S em seu sistema são minimizados ou eliminados, e o espaço ocupado pela memória é reduzido significativamente.
Altas taxas de compactação melhoram o desempenho da consulta usando um menor espaço na memória. Por sua vez, o desempenho da consulta pode melhorar porque o SQL Server pode executar mais operações de consulta e dados na memória.
A execução em lote melhora o desempenho da consulta, normalmente em duas a quatro vezes, processando várias linhas juntas.
As consultas geralmente selecionam apenas algumas colunas de uma tabela, o que reduz a entrada/saída total dos suportes físicos.

Quando é que devo usar um índice de columnstore?

Casos de uso recomendados:

Utilize um índice columnstore agrupado para guardar tabelas de fatos e tabelas de grandes dimensões para cargas de trabalho de armazenamento de dados. Esse método melhora o desempenho da consulta e a compactação de dados em até 10 vezes. Para obter mais informações, consulte índices Columnstore para armazenamento de dados.
Use um índice columnstore não clusterizado para executar análises em tempo real em uma carga de trabalho OLTP. Para obter mais informações, consulte Introdução ao columnstore para análise operacional em tempo real.
Para obter mais cenários de uso para índices columnstore, consulte Escolha o melhor índice columnstore para suas necessidades.

Como faço para escolher entre um índice rowstore e um índice columnstore?

Os índices de armazenamento de linhas têm melhor desempenho em consultas que buscam os dados, ao pesquisar um determinado valor ou em consultas em um pequeno intervalo de valores. Use índices de armazenamento em linha com cargas de trabalho transacionais porque tendem a exigir principalmente buscas em tabelas em vez de varrimentos de tabelas.

Os índices Columnstore oferecem altos ganhos de desempenho para consultas analíticas que examinam grandes quantidades de dados, especialmente em tabelas grandes. Use índices de armazenamento em colunas em cenários de armazenamento de dados e análise, especialmente em tabelas de fatos, porque tendem a exigir varreduras completas de tabelas em vez de buscas nas tabelas.

Os índices columnstore agrupados ordenados melhoram o desempenho de consultas com base em predicados de coluna ordenados. Os índices columnstore ordenados podem melhorar a eliminação de grupos de linhas, o que pode oferecer melhorias de desempenho ignorando completamente os grupos de linhas. Para obter mais informações, consulte Otimização de desempenho com índices columnstore ordenados. Para ver a disponibilidade do índice columnstore ordenado, consulte Disponibilidade do índice columnstore ordenado.

Posso combinar rowstore e columnstore na mesma tabela?

Yes. A partir do SQL Server 2016 (13.x), você pode criar um índice columnstore não clusterizado atualizável em uma tabela rowstore. O índice columnstore armazena uma cópia das colunas selecionadas, portanto, você precisa de espaço extra para esses dados, mas os dados selecionados são compactados em média 10 vezes. Você pode executar análises no índice columnstore e transações no índice rowstore ao mesmo tempo. O columnstore é atualizado quando os dados são alterados na tabela rowstore, portanto, ambos os índices funcionam em relação aos mesmos dados.

A partir do SQL Server 2016 (13.x), você pode ter um ou mais índices de armazenamento de linha não clusterizados em um índice columnstore e executar pesquisas de tabela eficientes no columnstore subjacente. Outras opções também ficam disponíveis. Por exemplo, você pode impor uma restrição de chave primária usando uma restrição UNIQUE na tabela rowstore. Como um valor não exclusivo não é inserido na tabela rowstore, o SQL Server não pode inserir o valor no columnstore.

Índices columnstore ordenados

Ao permitir a eliminação eficiente de segmentos, os índices columnstore ordenados fornecem um desempenho mais rápido ignorando grandes quantidades de dados ordenados que não correspondem ao predicado de consulta. O carregamento de dados em um índice columnstore ordenado pode levar mais tempo do que em um índice não ordenado devido à operação de classificação de dados, no entanto, com índices columnstore ordenados, as consultas podem ser executadas mais rapidamente depois.

Para obter mais informações sobre o ajuste de desempenho de cargas de trabalho de armazenamento de dados no Mecanismo de Banco de Dados SQL com índices columnstore ordenados, consulte Ajuste de desempenho com índices columnstore ordenados.
Para obter mais informações sobre quando usar qual tipo de índice columnstore, consulte Escolha o melhor índice columnstore para suas necessidades.

Disponibilidade ordenada do índice columnstore

Os índices columnstore ordenados estão disponíveis nas seguintes plataformas:

Platform	Índices ordenados por coluna em clustered	Índices columnstore não agrupados ordenados
Base de Dados SQL do Azure	Yes	Yes
Azure SQL Managed Instance^AUTD	Yes	Yes
Instância SQL Gerenciada do Azure²⁰²⁵	Yes	Yes
Instância Gerenciada SQL do Azure²⁰²²	Yes	No
Banco de dados SQL no Microsoft Fabric	Yes¹	Yes
SQL Server 2025 (17.x)	Yes	Yes
SQL Server 2022 (16.x)	Yes	No
Pool SQL dedicado no Azure Synapse Analytics	Yes	No

^AUTD Aplica-se à Instância Gerida do Azure SQL configurada com a política de atualização Sempre Atualizada.
²⁰²⁵ Aplica-se à Instância Gerenciada SQL do Azure configurada com a política de atualização do SQL Server 2025.
²⁰²² Aplica-se à Instância Gerenciada SQL do Azure configurada com a política de atualização do SQL Server 2022 .
¹No banco de dados SQL Fabric, as tabelas com índices de armazém de coluna clusterizados não são espelhadas para o Fabric OneLake.

Metadata

Todas as colunas em um índice columnstore são armazenadas nos metadados como colunas incluídas. O índice columnstore não tem colunas-chave.

sys.indexes (Transact-SQL)

sys.index_columns (Transact-SQL)

sys.partitions (Transact-SQL)

sys.internal_partitions (Transact-SQL)

sys.column_store_segments (Transact-SQL)

sys.column_store_dictionaries (Transact-SQL)

sys.column_store_row_groups (Transact-SQL)

sys.dm_db_column_store_row_group_operational_stats (Transact-SQL)

sys.dm_db_column_store_row_group_physical_stats (Transact-SQL)

sys.dm_column_store_object_pool (Transact-SQL)

sys.dm_db_column_store_row_group_operational_stats (Transact-SQL)

sys.dm_db_index_operational_stats (Transact-SQL)

sys.dm_db_index_physical_stats (Transact-SQL)

Task	Artigos de referência	Notes
Crie uma tabela como um "columnstore" (armazenamento em colunas).	CRIAR TABELA (Transact-SQL)	Por padrão, quando você cria uma tabela, ela usa rowstore como o formato de dados subjacente. A partir do SQL Server 2016 (13.x), você pode criar a tabela com um índice columnstore clusterizado especificando a `INDEX ... CLUSTERED COLUMNSTORE` opção. Você não precisa primeiro criar uma tabela rowstore e, em seguida, convertê-la em columnstore.
Converter uma tabela rowstore em columnstore.	CRIAR COLUMNSTORE ÍNDICE (Transact-SQL)	Converta uma pilha ou uma árvore B existente num armazém de colunas. Os exemplos mostram como lidar com índices existentes e também o nome do índice ao executar essa conversão.
Crie um índice colunar não-clusterizado numa tabela rowstore.	CRIAR COLUMNSTORE ÍNDICE (Transact-SQL)	Uma tabela rowstore pode ter um único índice columnstore não clusterizado. A partir do SQL Server 2016 (13.x), o índice columnstore não clusterizado pode ter uma condição filtrada. Os exemplos mostram a sintaxe básica.
Converter uma tabela columnstore em um rowstore.	CRIAR ÍNDICE CLUSTERIZADO (Transact-SQL) ou Converter uma tabela de armazenamento em colunas de volta para um heap de armazenamento em linhas	Normalmente, essa conversão não é necessária, mas pode haver momentos em que você precisa converter. Os exemplos mostram como converter uma columnstore num heap ou num índice clusterizado.
Crie índices columnstore para armazenamento de dados.	Índices de armazenamento em coluna para armazenamento de dados	Descreve como usar índices columnstore para consultas rápidas de armazenamento de dados.
Crie índices para análise operacional.	Introdução ao columnstore para análise operacional em tempo real	Descreve como criar índices complementares B-tree e columnstore, para que as consultas OLTP usem índices B-tree e as consultas de análise usem índices columnstore.
Utilize um índice B-tree para enforçar uma restrição de chave primária num índice columnstore.	Índices de armazenamento em coluna para armazenamento de dados	Mostra como combinar índices de árvore B e columnstore para impor a restrição de chave primária numa tabela columnstore.
Crie uma tabela com otimização de memória com um índice columnstore.	CRIAR TABELA (Transact-SQL)	A partir do SQL Server 2016 (13.x), você pode criar uma tabela com otimização de memória com um índice columnstore. O índice columnstore também pode ser adicionado depois que a tabela é criada usando a sintaxe `ALTER TABLE ADD INDEX`.
Carregue dados num índice de armazenamento por coluna.	Columnstore indexa o carregamento de dados
Remover um índice de columnstore.	ELIMINAR ÍNDICE (Transact-SQL)	Remover um índice columnstore utiliza a sintaxe padrão `DROP INDEX` que os índices B-tree utilizam. Retirar um índice columnstore clusterizado converte a tabela columnstore num heap.
Exclua uma linha de dados de um índice columnstore.	SUPRIMIR (Transact-SQL)	Use DELETE (Transact-SQL) para excluir uma linha. linha columnstore: o SQL Server marca a linha como excluída logicamente, mas não recupera o armazenamento físico da linha até que o índice seja reconstruído. linha deltastore: o SQL Server elimina lógica e fisicamente a linha.
Atualizar uma linha no índice columnstore.	ATUALIZAÇÃO (Transact-SQL)	Use UPDATE (Transact-SQL) para atualizar uma linha. linha columnstore: o SQL Server marca a linha como excluída logicamente e insere a linha atualizada no deltastore. linha deltastore: o SQL Server atualiza a linha no deltastore.
Manter um índice de armazenamento em colunas.	ALTER ÍNDICE ... RECONSTRUIR REORGANIZAR um índice columnstore Métodos de manutenção do índice: reorganizar e reconstruir	Na maioria das vezes, `ALTER INDEX ... REORGANIZE` fornece resultados semelhantes a `ALTER INDEX ... REBUILD`, mas com menor consumo de recursos. `ALTER INDEX ... REORGANIZE` Funciona sempre online. Ambas as opções desfragmentam um índice columnstore e obrigam as linhas do deltastore a serem transferidas para o columnstore. A partir do SQL Server 2019 (15.x), no Banco de Dados SQL do Azure e na Instância Gerenciada SQL do Azure, a qualidade do índice columnstore é mantida automaticamente, eliminando a necessidade de manutenção periódica do índice na maioria dos casos.

Comentários

Esta página foi útil?

Last updated on 2025-11-18

Columnstore indexes: visão geral

O que é um índice columnstore?

Palavras-chave e conceitos

Columnstore

Rowstore

Rowgroup

Segmento da coluna

Índice columnstore agrupado

Grupo de linhas Delta

Deltastore

Índice columnstore não agrupado

Execução em modo de lote

Por que devo usar um índice columnstore?

Quando é que devo usar um índice de columnstore?

Como faço para escolher entre um índice rowstore e um índice columnstore?

Posso combinar rowstore e columnstore na mesma tabela?

Índices columnstore ordenados

Disponibilidade ordenada do índice columnstore

Metadata

Tarefas relacionadas

Conteúdo relacionado

Comentários

Recursos adicionais