Indici columnstore: panoramica

2025-04-14

Si applica a:SQL Server Database SQL di Azure Istanza gestita di SQL di Azure Piattaforma di analisi di Azure Synapse Sistema di piattaforma analitica (PDW)Database SQL in Microsoft Fabric

Gli indici columnstore rappresentano lo standard per l'archiviazione di grandi tabelle di fatto di data warehousing e per l'esecuzione di query su queste tabelle. Questo indice usa l'archiviazione dei dati basata su colonne e l'elaborazione di query per ottenere miglioramenti fino a 10 volte per le prestazioni delle query nel data warehouse rispetto all'archiviazione tradizionale orientata alle righe. È anche possibile migliorare fino a 10 volte la compressione dei dati rispetto alla dimensione dei dati non compressi. A partire da SQL Server 2016 (13.x) SP1, gli indici columnstore consentono l'analisi operativa, rendendo possibile l'esecuzione di analisi in tempo reale ad alte prestazioni su carichi di lavoro transazionali.

Informazioni su uno scenario correlato:

Che cos'è l'indice columnstore?

L'indice columnstore è una tecnologia per l'archiviazione, il recupero e la gestione dei dati tramite un formato di dati in colonna, detto columnstore.

Termini e concetti chiave

I seguenti concetti e termini chiave sono associati agli indici columnstore.

Columnstore

Un columnstore consiste in dati organizzati logicamente come una tabella con righe e colonne, e fisicamente archiviati in un formato di dati per colonne.

Rowstore

Un rowstore è costituito da dati organizzati logicamente come una tabella con righe e colonne e archiviati fisicamente in un formato di dati per riga. Questo formato ha rappresentato il metodo tradizionale per archiviare dati relazionali di tabella. In SQL Server, rowstore fa riferimento alla tabella in cui il formato di archiviazione dati sottostante è un heap, un indice cluster o una tabella ottimizzata per la memoria.

Nota

Quando si parla di indici columnstore, i termini rowstore e columnstore vengono usati per sottolineare il formato per l'archiviazione dei dati.

Rowgroup

Un rowgroup è un gruppo di righe che vengono compresse contemporaneamente nel formato columnstore. Un rowgroup contiene in genere il numero massimo di righe per rowgroup, pari a 1.048.576 righe.

Per garantire prestazioni elevate e un alto tasso di compressione, l'indice columnstore suddivide la tabella in rowgroup, quindi comprime ogni rowgroup per colonne. Il numero di righe nel rowgroup deve essere sufficientemente grande da migliorare il tasso di compressione e sufficientemente ridotto da poter trarre vantaggio dall'esecuzione delle operazioni in memoria.

Un rowgroup da cui tutti i dati sono stati eliminati passa dallo stato COMPRESSED a quello TOMBSTONE e viene successivamente rimosso da un processo in background denominato spostatore di tuple. Per altre informazioni sugli stati dei rowgroup, vedere sys.dm_db_column_store_row_group_physical_stats (Transact-SQL).

Suggerimento

La presenza di un numero eccessivo di rowgroup di piccole dimensioni riduce la qualità dell'indice columnstore. Fino a SQL Server 2017 (14.x), è necessaria un'operazione di riorganizzazione per unire i rowgroup compressi più piccoli in base a un criterio di soglia interna, che determina come rimuovere le righe eliminate e combinare i rowgroup compressi.
A partire da SQL Server 2019 (15.x), un'attività di unione in background funziona anche per unire i rowgroup compressi da cui è stato eliminato un numero elevato di righe.
Dopo l'unione di rowgroup di dimensioni minori, è necessario migliorare la qualità dell'indice.

Nota

A partire da SQL Server 2019 (15.x), database SQL di Azure, Istanza gestita di SQL di Azure e i pool SQL dedicati in Azure Synapse Analytics, il motore di tuple viene aiutato da un'attività di unione in background, che comprime automaticamente i rowgroup delta aperti più piccoli che sono esistiti per un dato periodo di tempo (come determinato da una soglia interna) oppure unisce i rowgroup compressi da cui è stato eliminato un numero elevato di righe. In questo modo viene migliorata la qualità dell'indice columnstore nel tempo.

Segmento di colonna

Un segmento di colonna è una colonna di dati all'interno del rowgroup.

Ogni rowgroup contiene un segmento di colonna per ogni colonna della tabella.
Ogni segmento di colonna è compresso e archiviato su un supporto fisico.
Sono presenti metadati con ogni segmento per consentire l'eliminazione rapida dei segmenti senza leggerli.

Diagramma logico del segmento di colonna. Ogni colonna ha un segmento di colonna per ogni rowgroup.

Indice columnstore clusterizzato

Un indice columnstore raggruppato è l'archiviazione fisica dell'intera tabella.

Diagramma logico di un indice columnstore cluster. Include segmenti di colonna compressi e righe nell'indice, ma non nel columnstore.

Per ridurre la frammentazione dei segmenti di colonna e migliorare le prestazioni, l'indice columnstore può archiviare temporaneamente alcuni dati in un indice cluster, detto deltastore, e in un elenco ad albero B di ID per le righe eliminate. Le operazioni deltastore sono gestite dietro le quinte. Per restituire i risultati della query corretti, l'indice columnstore clusterizzato combina i risultati della query dal columnstore e dal deltastore.

Nota

Nella documentazione viene usato in modo generico il termine albero B in riferimento agli indici. Negli indici rowstore, il motore di database implementa un albero B+. Ciò non si applica a indici columnstore o a indici in tabelle ottimizzate per la memoria. Per altre informazioni, vedere Architettura e guida per la progettazione degli indici di SQL Server e Azure SQL.

Rowgroup differenziale

Un rowgroup delta è un indice B-tree clusterizzato che viene utilizzato solo con gli indici columnstore. Migliora la compressione e le prestazioni dei columnstore archiviando le righe finché il numero di queste non raggiunge una soglia specifica (1.048.576 righe) e spostandole quindi nel columnstore.

Quando un rowgroup delta raggiunge il numero massimo di righe, passa dallo stato OPEN allo stato CLOSED. Un processo in background denominato spostatore di tuple controlla la presenza di gruppi di righe chiusi. Se il processo trova un rowgroup chiuso, comprime il rowgroup delta e lo archivia nel columnstore come rowgroup COMPRESSED.

Quando un rowgroup delta è stato compresso, il rowgroup delta esistente passa allo stato TOMBSTONE per essere successivamente rimosso dal tuple-mover quando non ci sono più riferimenti ad esso.

Per altre informazioni sugli stati dei rowgroup, vedere sys.dm_db_column_store_row_group_physical_stats (Transact-SQL).

Nota

A partire da SQL Server 2019 (15.x), il motore di tuple viene aiutato da un'attività di unione in background, che comprime automaticamente i rowgroup delta aperti più piccoli che sono esistiti per un dato periodo di tempo (come determinato da una soglia interna) oppure unisce i rowgroup compressi da cui è stato eliminato un numero elevato di righe. In questo modo viene migliorata la qualità dell'indice columnstore nel tempo.

Deltastore

Un indice columnstore può avere più di un rowgroup delta. Tutti i rowgroup delta sono chiamati collettivamente deltastore.

Durante un caricamento massivo, la maggior parte delle righe viene indirizzata direttamente al columnstore senza passare per il deltastore. È possibile che alcune righe alla fine del caricamento in blocco siano troppo poche per soddisfare le dimensioni minime di un rowgroup, pari a 102.400 righe. Ne consegue che le righe finali vengono indirizzate al deltastore anziché al columnstore. Per i carichi in blocco di piccole dimensioni, con meno di 102.400 righe, tutte le righe passano direttamente al deltastore.

indice columnstore non clusterizzato

Un indice columnstore non clusterizzato e un indice columnstore clusterizzato funzionano nello stesso modo. La differenza è che un indice non-clustered è un indice secondario creato per una tabella di tipo rowstore, mentre un indice columnstore clusterizzato rappresenta l'archiviazione primaria per l'intera tabella.

L'indice non cluster contiene una copia totale o parziale delle righe e delle colonne della tabella sottostante. L'indice è definito sotto forma di una o più colonne della tabella e ha una condizione facoltativa che consente di filtrare le righe.

Un indice columnstore non cluster consente l'analisi operativa in tempo reale, durante la quale il carico di lavoro OLTP usa l'indice cluster sottostante, mentre l'analisi viene eseguita simultaneamente sull'indice columnstore. Per altre informazioni, vedere Introduzione a columnstore per l'analisi operativa in tempo reale.

Esecuzione in modalità batch

L'esecuzione in modalità batch è un metodo di elaborazione delle query utilizzato per elaborare più righe contemporaneamente. L'esecuzione in modalità batch è strettamente integrata nel formato di archiviazione columnstore, per il quale è ottimizzata. L'esecuzione in modalità batch talvolta è detta esecuzione basata su vettore o vettorizzata. Le query sugli indici columnstore usano l'esecuzione in modalità batch, che migliora le prestazioni delle query in genere da due a quattro volte. Per altre informazioni, vedere Guida sull'architettura di elaborazione delle query.

Perché dovrei usare un indice columnstore?

Un indice columnstore può garantire un livello di compressione dei dati molto elevato, in genere di 10 volte, riducendo in modo significativo i costi di archiviazione del data warehouse. Per l'analisi, gli indici columnstore offrono anche prestazioni decisamente migliori rispetto agli indici dell'albero B. Gli indici columnstore rappresentano il formato di archiviazione dati preferito per i carichi di lavoro di data warehousing e analisi. A partire da SQL Server 2016 (13.x), è possibile usare gli indici columnstore per l'analisi in tempo reale del carico di lavoro operativo.

Ecco perché gli indici columnstore sono così rapidi:

Le colonne archiviano valori provenienti dallo stesso dominio. Si tratta in genere di valori simili, il che consente un tasso di compressione elevato. I colli di bottiglia per le operazioni di I/O nel sistema sono ridotti al minimo o eliminati e il footprint di memoria viene ridotto significativamente.
Le frequenze di compressione elevate migliorano le prestazioni delle query utilizzando un footprint di memoria più piccolo. A loro volta, le prestazioni delle query costituiscono un miglioramento perché SQL Server può eseguire un numero maggiore di operazioni di dati e query in memoria.
L'esecuzione batch migliora le prestazioni delle query, in genere, da due a quattro volte grazie all'elaborazione di più righe contemporaneamente.
Le query spesso selezionano solo alcune colonne di una tabella, riducendo il totale delle operazioni di I/O su un supporto fisico.

Quando è opportuno usare un indice columnstore?

Usi consigliati:

Usare un indice columnstore clusterizzato per archiviare le tabelle dei fatti e grandi tabelle di dimensioni per i carichi di lavoro di data warehousing. Questo metodo migliora le prestazioni delle query e la compressione dei dati fino a 10 volte. Per ulteriori informazioni, vedere Indici columnstore per l'archiviazione di dati.
Usare un indice columnstore non clusterizzato per eseguire l'analisi in tempo reale di un carico di lavoro OLTP. Per altre informazioni, vedere Introduzione a columnstore per l'analisi operativa in tempo reale.
Per altri scenari di utilizzo per gli indici columnstore, vedere Scegliere l'indice columnstore migliore per le proprie esigenze.

Come scegliere tra un indice rowstore e un indice columnstore?

Gli indici rowstore offrono prestazioni ottimali con le query che eseguono la ricerca di un valore specifico o all'interno di un intervallo di valori di piccole dimensioni. Usare gli indici rowstore con carichi di lavoro transazionali, poiché per i carichi di lavoro di questo tipo sono in genere necessarie ricerche all'interno delle tabelle anziché scansioni di queste.

Gli indici columnstore garantiscono prestazioni notevolmente elevate per le query analitiche su grandi quantità di dati, soprattutto per le tabelle di grandi dimensioni. Usare gli indici columnstore per i carichi di lavoro di data warehousing e analisi, soprattutto sulle tabelle dei fatti, poiché in genere questi carichi di lavoro richiedono scansioni complete delle tabelle anziché ricerche all'interno di queste.

Gli indici columnstore clusterizzati ordinati migliorano le prestazioni per le query basate su predicati di colonna ordinati. Gli indici columnstore ordinati possono migliorare l'eliminazione di gruppi di righe, offrendo miglioramenti delle prestazioni ignorando completamente i gruppi di righe. Per altre informazioni, vedere Ottimizzazione delle prestazioni con indici columnstore ordinati. Per la disponibilità dell'indice columnstore ordinato, vedere Disponibilità dell'indice columnstore ordinato.

È possibile combinare gli indici rowstore e columnstore nella stessa tabella?

Sì. A partire da SQL Server 2016 (13.x), è possibile creare un indice columnstore non cluster aggiornabile in una tabella rowstore. L'indice columnstore archivia una copia delle colonne selezionate. È quindi necessario spazio aggiuntivo per questi dati, ma la compressione applicata ai dati selezionati è in media di 10 volte. È possibile eseguire allo stesso tempo analisi sull'indice columnstore e transazioni sull'indice rowstore. Il columnstore viene aggiornato quando i dati nella tabella rowstore vengono modificati. In questo modo entrambi gli indici possono usare gli stessi dati.

A partire da SQL Server 2016 (13.x), è possibile avere uno o più indici rowstore non cluster su un indice columnstore ed eseguire ricerche efficienti in tabelle nel columnstore sottostante. Sono disponibili anche altre opzioni. È possibile, ad esempio, applicare un vincolo di chiave primaria tramite un vincolo UNIQUE nella tabella rowstore. Dato che non è possibile inserire un valore non univoco nella tabella rowstore, SQL Server non può inserire il valore nel columnstore.

Indici columnstore ordinati

Abilitando l'eliminazione efficiente dei segmenti, gli indici columnstore ordinati offrono prestazioni più veloci ignorando grandi quantità di dati ordinati che non corrispondono al predicato di query. Il caricamento di dati in un indice columnstore ordinato può richiedere più tempo rispetto a un indice non ordinato a causa dell'operazione di ordinamento dei dati, ma con le query sugli indici columnstore ordinati può essere eseguita più velocemente in seguito.

Per altre informazioni sull'ottimizzazione delle prestazioni dei carichi di lavoro di data warehousing nel motore di database SQL con indici columnstore ordinati, vedere Ottimizzazione delle prestazioni con indici columnstore ordinati.
Per altre informazioni su quando usare il tipo di indice columnstore, vedere Scegliere l'indice columnstore migliore per le proprie esigenze.

Disponibilità dell'indice columnstore ordinato

Gli indici columnstore ordinati sono disponibili nelle piattaforme seguenti:

Piattaforma	Indici columnstore ordinati clusterizzati	Indici columnstore non cluster ordinati
Database SQL di Azure	Sì	Sì
Istanza SQL gestita di Azure^AUTD	Sì	Sì
Istanza gestita di SQL di Azure²⁰²²	Sì	NO
Database di SQL in Microsoft Fabric	Sì¹	Sì
Anteprima di SQL Server 2025 (17.x)	Sì	Sì
SQL Server 2022 (16.x)	Sì	NO
Pool SQL dedicato in Azure Synapse Analytics	Sì	NO

^AUTD si applica all'istanza gestita di SQL di Azure configurata con i criteri di aggiornamento sempre aggiornati.
²⁰²² Si applica a Istanza gestita di SQL di Azure configurata con i criteri di aggiornamento di SQL Server 2022 .
¹Nel database SQL di Fabric, le tabelle con indici columnstore raggruppati non vengono replicate in Fabric OneLake.

Metadati

Tutte le colonne di un indice columnstore vengono archiviate nei metadati come colonne incluse. L'indice columnstore non contiene colonne chiave.

sys.indexes (Transact-SQL)

sys.index_columns (Transact-SQL)

sys.partitions (Transact-SQL)

sys.internal_partitions (Transact-SQL)

sys.column_store_segments (Transact-SQL)

sys.column_store_dictionaries (Transact-SQL)

sys.column_store_row_groups (Transact-SQL)

sys.dm_db_column_store_row_group_operational_stats (Transact-SQL)

sys.dm_db_column_store_row_group_physical_stats (Transact-SQL)

sys.dm_column_store_object_pool (Transact-SQL)

sys.dm_db_column_store_row_group_operational_stats (Transact-SQL)

sys.dm_db_index_operational_stats (Transact-SQL)

sys.dm_db_index_physical_stats (Transact-SQL)

Attività	Articoli di riferimento	Note
Creare una tabella come archiviazione per colonne.	CREATE TABLE (Transact-SQL)	Per impostazione predefinita, quando si crea una tabella, viene usato rowstore come formato dati sottostante. A partire da SQL Server 2016 (13.x), è possibile creare la tabella con un indice columnstore cluster specificando l'opzione `INDEX ... CLUSTERED COLUMNSTORE` . Non è necessario creare prima una tabella rowstore e quindi convertirla in columnstore.
Convertire una tabella di tipo rowstore in una di tipo columnstore.	CREATE COLUMNSTORE INDEX (Transact-SQL)	Convertire un heap o un albero B esistente in un archivio a colonne. Gli esempi illustrano come gestire gli indici esistenti e il nome dell'indice quando si esegue questa conversione.
Creare un indice columnstore non cluster in una tabella rowstore.	CREATE COLUMNSTORE INDEX (Transact-SQL)	Una tabella rowstore può avere un solo indice columnstore non clusterizzato. A partire da SQL Server 2016 (13.x), l'indice columnstore non cluster può avere una condizione filtrata. Gli esempi illustrano la sintassi di base.
Convertire una tabella "columnstore" in un "rowstore".	CREATE CLUSTERED INDEX (Transact-SQL) oppure Convertire una tabella columnstore di nuovo in un heap rowstore	Di solito non è necessario eseguire questa conversione, ma talvolta potrebbe presentarsene la necessità. Gli esempi illustrano come convertire un columnstore in un heap o in un indice cluster.
Creare indici columnstore per il data warehousing.	Indici columnstore per l'archiviazione dati	Viene descritto come usare gli indici columnstore per query di data warehousing veloci.
Creare indici per l'analisi operativa.	Introduzione a columnstore per l'analisi operativa in tempo reale	Descrive come creare indici columnstore e indici albero B complementari in modo che le query OLTP usino gli indici albero B e le query di analisi usino gli indici columnstore.
Usare un indice B-tree per imporre un vincolo di chiave primaria su un indice columnstore.	Indici columnstore per l'archiviazione dati	Illustra come combinare indici albero B e columnstore per applicare il vincolo di chiave primaria in una tabella columnstore.
Creare una tabella ottimizzata per la memoria con un indice columnstore.	CREATE TABLE (Transact-SQL)	A partire da SQL Server 2016 (13.x), è possibile creare una tabella ottimizzata per la memoria con un indice columnstore. L'indice columnstore può anche essere aggiunto dopo aver creato la tabella, usando la sintassi `ALTER TABLE ADD INDEX`.
Caricare i dati in un indice di tipo columnstore.	Caricamento dei dati degli indici columnstore
Eliminare l'indice columnstore.	DROP INDEX (Transact-SQL)	Per rimuovere un indice columnstore si usa la sintassi `DROP INDEX` standard usata dagli indici B-tree. La rimozione di un indice columnstore raggruppato converte la tabella columnstore in un heap.
Eliminare una riga da un indice colonnare.	DELETE (Transact-SQL)	Usare DELETE (Transact-SQL) per eliminare una riga. Riga columnstore: SQL Server contrassegna la riga come eliminata logicamente ma recupera lo spazio di archiviazione fisico della riga solo dopo che l'indice è stato ricompilato. Riga deltastore: SQL Server elimina la riga logicamente e fisicamente.
Aggiorna una riga nell'indice di columnstore.	UPDATE (Transact-SQL)	Usare UPDATE (Transact-SQL) per aggiornare una riga. Riga columnstore: SQL Server contrassegna la riga come eliminata logicamente e quindi inserisce la riga aggiornata nel deltastore. Riga deltastore: SQL Server aggiorna la riga nel deltastore.
Mantenere un indice columnstore.	ALTER INDEX ... RICOSTRUIRE REORGANIZE un indice columnstore Metodi di manutenzione dell'indice: riorganizzare e ricompilare	Nella maggior parte dei casi, `ALTER INDEX ... REORGANIZE` fornisce risultati simili ma `ALTER INDEX ... REBUILD` con un consumo di risorse inferiore. `ALTER INDEX ... REORGANIZE` viene sempre eseguito online. Entrambe le opzioni deframmentare un indice columnstore e forzare le righe nell'archivio differenziale per accedere al columnstore. A partire da SQL Server 2019 (15.x), nel database SQL di Azure e in Istanza gestita di SQL di Azure, la qualità dell'indice columnstore viene mantenuta automaticamente, eliminando la necessità di manutenzione periodica degli indici nella maggior parte dei casi.

Condividi tramite

Indici columnstore: panoramica

Che cos'è l'indice columnstore?

Termini e concetti chiave

Columnstore

Rowstore

Rowgroup

Segmento di colonna

Indice columnstore clusterizzato

Rowgroup differenziale

Deltastore

indice columnstore non clusterizzato

Esecuzione in modalità batch

Perché dovrei usare un indice columnstore?

Quando è opportuno usare un indice columnstore?

Come scegliere tra un indice rowstore e un indice columnstore?

È possibile combinare gli indici rowstore e columnstore nella stessa tabella?

Indici columnstore ordinati

Disponibilità dell'indice columnstore ordinato

Metadati

Attività correlate

Contenuto correlato

Commenti e suggerimenti

Risorse aggiuntive