Compressione dei dati
Si applica a: SQL Server Database SQL di Azure Istanza gestita di SQL di Azure
SQL Server, database SQL di Azure e Istanza gestita di SQL di Azure supportano la compressione delle righe e delle pagine per gli indici e le tabelle rowstore e la compressione dell'archivio columnstore e columnstore per le tabelle e gli indici columnstore.
Per le tabelle e gli indici rowstore, utilizzare la funzionalità di compressione dei dati per ridurre le dimensioni del database. Oltre a risparmiare spazio, la compressione dei dati migliora le prestazioni dei carichi di lavoro di I/O a utilizzo elevato di memoria perché i dati vengono archiviati in un numero inferiore di pagine e le query devono leggere un numero inferiore di pagine dal disco. Sono tuttavia necessarie risorse della CPU aggiuntive nel server di database per comprimere e decomprimere i dati, mentre i dati vengono scambiati con l'applicazione. È possibile configurare la compressione di righe e pagine sugli oggetti di database seguenti:
- Un'intera tabella archiviata come heap.
- Un'intera tabella archiviata come indice cluster.
- Un intero indice non cluster.
- Un'intera vista indicizzata.
- Per gli indici e le tabelle partizionati, è possibile configurare l'opzione di compressione per ogni partizione. Non è inoltre necessario che per le varie partizioni di un oggetto sia configurata la stessa impostazione di compressione.
Per gli indici e le tabelle columnstore, tutti gli indici e le tabelle columnstore usano sempre la compressione columnstore che non è configurabile dall'utente. Utilizzare la compressione dell'archivio columnstore per ridurre ulteriormente le dimensioni dei dati in situazioni in cui è possibile concedere altro tempo e altre risorse della CPU per archiviare e recuperare i dati. È possibile configurare la compressione dell'archivio columnstore sugli oggetti di database seguenti:
- Un'intera tabella columnstore o un intero indice columnstore cluster. Poiché una tabella columnstore viene archiviata come indice columnstore cluster, entrambi gli approcci producono gli stessi risultati.
- Un intero indice columnstore non cluster.
- Per gli indici columnstore e le tabelle columnstore partizionati, è possibile configurare l'opzione di compressione dell'archivio per ogni partizione. Non è inoltre necessario che per le varie partizioni sia configurata la stessa impostazione di compressione dell'archivio.
Nota
È anche possibile comprimere i dati usando il formato di algoritmo GZIP. Si tratta di un passaggio aggiuntivo ed è particolarmente adatto per comprimere porzioni di dati durante l'archiviazione di vecchi dati per l'archiviazione a lungo termine. I dati compressi usando la funzione COMPRESS
non possono essere indicizzati. Per altre informazioni, vedere COMPRESS (Transact-SQL).
Compressione di riga e pagina
Quando si utilizza la compressione di riga e di pagina, tenere presente le considerazioni seguenti:
I dettagli relativi alla compressione dei dati sono soggetti a modifiche senza preavviso nei Service Pack o nelle versioni successive.
La compressione è disponibile nel database SQL di Azure
La compressione non è disponibile in ogni edizione di SQL Server. Per altre informazioni, vedere l’elenco delle versioni e delle funzionalità supportate al termine di questa sezione.
La compressione non è disponibile per le tabelle di sistema.
La compressione consente di archiviare più righe in una pagina, ma non di modificare le dimensioni massime delle righe di una tabella o di un indice.
Una tabella non può essere abilitata per la compressione quando la somma delle dimensioni massime delle righe e dell'overhead relativo alla compressione supera le dimensioni massime di 8.060 byte delle righe. Ad esempio, una tabella in cui sono presenti le colonne
c1 CHAR(8000)
ec2 CHAR(53)
non può essere compressa a causa dell'overhead aggiuntivo relativo alla compressione. Se usi il formato di archiviazione vardecimal, il controllo delle dimensioni delle righe viene eseguito al momento dell'abilitazione del formato stesso. Per la compressione di riga e di pagina, il controllo delle dimensioni delle righe viene eseguito quando l'oggetto viene compresso inizialmente e successivamente in occasione dell'inserimento o della modifica di ogni riga. Quando viene utilizzata la compressione, vengono applicate le due regole seguenti:- Un aggiornamento a un tipo a lunghezza fissa deve sempre avere esito positivo.
- La disabilitazione della compressione dei dati deve sempre avere esito positivo. Anche se la riga compressa rientra nella pagina, ovvero se le dimensioni della riga sono minori di 8.060 byte, in SQL Server vengono impediti gli aggiornamenti che non sarebbe possibile includere nella riga non compressa.
I dati all’esterno delle righe non vengono compressi quando si abilita la compressione dei dati. Ad esempio, un record XML di dimensioni superiori a 8.060 byte usa pagine esterne alle righe, che non sono compresse.
Diversi tipi di dati non sono interessati dalla compressione dei dati. Per altri dettagli, vedi Impatto della compressione delle righe sull'archiviazione.
Quando viene specificato un elenco di partizioni, il tipo di compressione può essere impostato su
ROW
,PAGE
, oNONE
per ogni singola partizione. Se l'elenco di partizioni non è specificato, tutte le partizioni vengono impostate in base alla proprietà di compressione dei dati specificata nell'istruzione. Quando viene creato un indice o una tabella, la compressione dei dati viene impostata su NONE se non specificato diversamente. Quando una tabella viene modificata, viene mantenuta la compressione esistente se non specificato diversamente.Se si specifica un elenco di partizioni o una partizione non compresa nell'intervallo, viene generato un errore.
Gli indici non cluster non ereditano la proprietà di compressione della tabella. Per comprimere gli indici, è necessario impostarne in modo esplicito la proprietà di compressione. Per impostazione predefinita, al momento della creazione dell'indice la compressione è impostata su NONE.
Quando un indice cluster viene creato in un heap, tale indice eredita lo stato di compressione dell'heap, a meno che non venga specificato uno stato di compressione alternativo.
Quando un heap è configurato per la compressione a livello di pagina, le pagine vengono compresse solo nelle modalità seguenti:
- Viene eseguita l'importazione bulk dei dati con l'ottimizzazione delle operazioni bulk abilitata.
- I dati vengono inseriti usando la sintassi
INSERT INTO ... WITH (TABLOCK)
e la tabella non contiene un indice non cluster. - Una tabella viene ricompilata eseguendo l'istruzione
ALTER TABLE ... REBUILD
con l'opzione di compressionePAGE
.
Le nuove pagine allocate in un heap nel corso di operazioni DML non usano la compressione
PAGE
finché l'heap non viene ricompilato. Ricompilare l'heap rimuovendo e riapplicando la compressione oppure creando e rimuovendo un indice cluster.Per modificare l'impostazione di compressione di un heap, è necessario ricompilare tutti gli indici non cluster della tabella in modo che dispongano di puntatori ai nuovi percorsi delle righe nell'heap.
È possibile abilitare o disabilitare la compressione
ROW
oPAGE
online oppure offline. L'abilitazione della compressione in un heap è un'operazione a thread singolo se eseguita online.I requisiti di spazio su disco per l'abilitazione o la disabilitazione della compressione di riga o di pagina sono gli stessi necessari per la creazione o la ricompilazione di un indice. Per i dati partizionati, è possibile ridurre lo spazio richiesto abilitando o disabilitando la compressione per una partizione alla volta.
Per determinare lo stato della compressione delle partizioni in una tabella partizionata, esegui una query sulla colonna
data_compression
della vista del catalogosys.partitions
.Durante la compressione di indici, alle pagine a livello foglia è possibile applicare sia la compressione di riga che quella di pagina. mentre alle pagine a livello non foglia non è possibile applicare la compressione di pagina.
A causa della dimensione, i tipi di dati per valori di grandi dimensioni vengono a volte archiviati separatamente rispetto ai dati delle righe normali in pagine specifiche. La compressione dei dati non è disponibile per i dati archiviati separatamente.
Le tabelle in cui era implementato il formato di archiviazione vardecimal in SQL Server 2005 (9.x) mantengono questa impostazione anche dopo l'aggiornamento. Puoi applicare la compressione di riga a una tabella che utilizza il formato di archiviazione vardecimal. Tuttavia, poiché la compressione di riga è un superset del formato di archiviazione vardecimal, non è necessario mantenere quest'ultimo. Quando usi il formato di archiviazione vardecimal con la compressione di riga, per i valori decimali non ottieni alcun miglioramento in termini di compressione. Sebbene sia possibile inoltre applicare la compressione di pagina a una tabella per cui è implementato il formato di archiviazione vardecimal, per le colonne che utilizzano tale formato probabilmente non è possibile ottenere compressione aggiuntiva.
Nota
Tutte le versioni supportate di SQL Server supportano il formato di archiviazione vardecimal. Poiché la compressione a livello di riga consente di ottenere gli stessi risultati, tale formato è tuttavia deprecato. Questa funzionalità verrà rimossa nelle versioni future di SQL Server. Evitare di usare questa funzionalità in un nuovo progetto di sviluppo e prevedere interventi di modifica nelle applicazioni in cui è attualmente implementata.
Per un elenco delle caratteristiche supportate dalle edizioni di SQL Server su Windows, vedi:
- Edizioni e funzionalità supportate di SQL Server 2022
- Edizioni e funzionalità supportate di SQL Server 2019
- Edizioni e funzionalità supportate di SQL Server 2017
- Edizioni e le funzionalità supportate di SQL Server 2016
Compressione dell'archivio Columnstore e Columnstore
Gli indici e le tabelle columnstore vengono sempre archiviati con la compressione columnstore. È possibile ridurre ulteriormente le dimensioni dei dati columnstore configurando una compressione aggiuntiva denominata compressione dell'archivio. Per eseguire la compressione dell'archivio, in SQL Server viene eseguito l'algoritmo di compressione XPress di Microsoft sui dati. Aggiungere o rimuovere la compressione dell'archivio utilizzando i tipi di compressione dati seguenti:
- Utilizzare la compressione dei dati
COLUMNSTORE_ARCHIVE
per comprimere i dati columnstore con la compressione dell'archivio. - Usa la compressione dati
COLUMNSTORE
per decomprimere la compressione dell'archivio. I dati risultanti verranno compressi con la compressione columnstore.
Per aggiungere la compressione dell'archivio, usa ALTER TABLE (Transact-SQL) o ALTER INDEX (Transact-SQL) con l'opzione REBUILD
e DATA COMPRESSION = COLUMNSTORE_ARCHIVE
.
Ad esempio:
ALTER TABLE ColumnstoreTable1
REBUILD PARTITION = 1 WITH (
DATA_COMPRESSION = COLUMNSTORE_ARCHIVE
);
ALTER TABLE ColumnstoreTable1
REBUILD PARTITION = ALL WITH (
DATA_COMPRESSION = COLUMNSTORE_ARCHIVE
);
ALTER TABLE ColumnstoreTable1
REBUILD PARTITION = ALL WITH (
DATA_COMPRESSION = COLUMNSTORE_ARCHIVE ON PARTITIONS (2, 4)
);
Per rimuovere la compressione dell'archivio e ripristinare i dati nella compressione columnstore, usa ALTER TABLE (Transact-SQL) o ALTER INDEX (Transact-SQL) con l'opzione REBUILD
e DATA COMPRESSION = COLUMNSTORE
.
Ad esempio:
ALTER TABLE ColumnstoreTable1
REBUILD PARTITION = 1 WITH (
DATA_COMPRESSION = COLUMNSTORE
);
ALTER TABLE ColumnstoreTable1
REBUILD PARTITION = ALL WITH (
DATA_COMPRESSION = COLUMNSTORE
);
ALTER TABLE ColumnstoreTable1
REBUILD PARTITION = ALL WITH (
DATA_COMPRESSION = COLUMNSTORE ON PARTITIONS (2, 4)
);
Nell'esempio seguente la compressione dei dati viene impostata su columnstore in alcune partizioni e su archivio columnstore in altre.
ALTER TABLE ColumnstoreTable1
REBUILD PARTITION = ALL WITH (
DATA_COMPRESSION = COLUMNSTORE
ON PARTITIONS (4, 5),
DATA COMPRESSION = COLUMNSTORE_ARCHIVE
ON PARTITIONS (1, 2, 3)
);
Prestazioni
La compressione degli indici columnstore con la compressione dell'archivio comporta un calo delle prestazioni dell'indice rispetto agli indici columnstore compressi con un altro tipo di compressione. Utilizzare la compressione dell'archivio solo quando è possibile concedere altro tempo e altre risorse della CPU per comprimere e recuperare i dati.
Il vantaggio della compressione dell'archivio è uno spazio di archiviazione ridotto, utile per i dati a cui non si accede di frequente. Se ad esempio si dispone di una partizione per ogni mese di dati e la maggior parte dell'attività è relativa ai mesi più recenti, è possibile archiviare i mesi precedenti per ridurre i requisiti di archiviazione.
Metadati UFX
Nelle viste di sistema seguenti sono contenute informazioni sulla compressione dei dati per gli indici cluster:
- sys.indexes (Transact-SQL): le colonne
type
etype_desc
includonoCLUSTERED COLUMNSTORE
eNONCLUSTERED COLUMNSTORE
. - sys.partitions (Transact-SQL): le colonne
data_compression
edata_compression_desc
includonoCOLUMNSTORE
eCOLUMNSTORE_ARCHIVE
.
La procedura sp_estimate_data_compression_savings (Transact-SQL) si applica anche agli indici columnstore.
Impatto su tabelle e indici partizionati
Quando si utilizza la compressione dei dati con tabelle e indici partizionati, tenere presente le considerazioni seguenti:
Quando le partizioni vengono suddivise usando l'istruzione
ALTER PARTITION
, entrambe le partizioni ereditano l'attributo di compressione dei dati della partizione originale.Quando due partizioni vengono unite, la partizione risultante eredita l'attributo di compressione dei dati della partizione di destinazione.
Per cambiare una partizione, è necessario che la relativa proprietà di compressione dei dati corrisponda a quella della tabella.
Per modificare la compressione di una tabella o di un indice partizionato, è possibile utilizzare due sintassi diverse:
La sintassi seguente consente di ricompilare solo la partizione cui si fa riferimento:
ALTER TABLE <table_name> REBUILD PARTITION = 1 WITH ( DATA_COMPRESSION = <option> );
La sintassi seguente consente di ricompilare l'intera tabella usando l'impostazione di compressione esistente per qualsiasi partizione cui non si fa riferimento:
ALTER TABLE <table_name> REBUILD PARTITION = ALL WITH ( DATA_COMPRESSION = PAGE ON PARTITIONS(<range>), ... );
Per gli indici partizionati viene seguito lo stesso principio usando l'istruzione
ALTER INDEX
.Quando un indice cluster viene eliminato, le partizioni di heap corrispondenti mantengono l'impostazione di compressione dei dati, a meno che lo schema di partizione non venga modificato. Se lo schema di partizionamento viene modificato, tutte le partizioni vengono ricompilate in un stato non compresso. Per eliminare un indice cluster e modificare lo schema di partizionamento, è necessario effettuare le operazioni descritte nei passaggi seguenti:
- Eliminare l'indice cluster.
- Modificare la tabella usando l'opzione
ALTER TABLE ... REBUILD
che specifica l'opzione di compressione.
L'esclusione
OFFLINE
di un indice cluster è un'operazione di rapida esecuzione, poiché vengono rimossi solo i livelli superiori degli indici cluster. Quando un indice cluster viene esclusoONLINE
, SQL Server ricompila l'heap due volte, una volta per il passaggio 1 e una volta per il passaggio 2.
Impatto della compressione sulla replica
Quando usi la compressione dei dati con la replica, tieni presente le considerazioni seguenti:
Quando l'agente snapshot genera lo script dello schema iniziale, il nuovo schema usa le stesse impostazioni di compressione sia per la tabella che per i relativi indici. Non è possibile abilitare la compressione solo sulla tabella e non sull'indice.
Per la replica transazionale, l'opzione dello schema dell'articolo determina gli oggetti e le proprietà dipendenti da inserire nello script. Per altre informazioni, vedere sp_addarticle.
Quando applica gli script, l'agente di distribuzione non verifica la presenza di Sottoscrittori legacy. Se la replica della compressione è selezionata, la creazione della tabella in Sottoscrittori legacy non riesce. Per una topologia mista, non abilitare la replica della compressione.
Per la replica di tipo merge, il livello di compatibilità della pubblicazione prevale sulle opzioni dello schema e determina gli oggetti dello schema per i quali viene generato uno script.
Per una topologia mista, se non è necessario per supportare le nuove opzioni di compressione, il livello di compatibilità della pubblicazione deve essere impostato sulla versione Sottoscrittore legacy. Se necessario, comprimere le tabelle nel Sottoscrittore dopo che sono state create.
Nella tabella seguente vengono illustrate le impostazioni di replica che controllano la compressione durante la replica stessa.
Intenzione dell'utente | Replica dello schema di partizione per una tabella o un indice | Replica delle impostazioni di compressione | Comportamento a livello di script |
---|---|---|---|
Replicare lo schema di partizione e abilitare la compressione sulla partizione nel Sottoscrittore. | Vero | Vero | Inserisce nello script lo schema di partizione e le impostazioni di compressione. |
Replicare lo schema di partizione senza comprimere i dati nel Sottoscrittore. | Vero | False | Inserimento nello script dello schema di partizione, ma non delle impostazioni di connessione per la partizione. |
Non replicare lo schema di partizione né comprimere i dati nel Sottoscrittore. | Falso | Falso | Non inserisce nello script né la partizione né le impostazioni di compressione. |
Comprimere la tabella nel Sottoscrittore se tutte le partizioni sono compresse nel server di pubblicazione, senza replicare lo schema di partizione. | Falso | Vero | Controlla se tutte le partizioni sono abilitate per la compressione. Inserisce nello script la compressione a livello di tabella. |
Effetto su altri componenti di SQL Server
Si applica a: SQL Server Database SQL di Azure Istanza gestita di SQL di Azure
La compressione viene eseguita nel motore di database e i dati vengono presentati alla maggior parte degli altri componenti di SQL Server in uno stato non compresso, limitando gli effetti della compressione negli altri componenti in relazione agli aspetti seguenti:
- Operazioni di importazione ed esportazione in blocco
- Quando i dati vengono esportati, anche in formato nativo, il relativo output è in formato di riga non compresso. In questo modo le dimensioni del file di dati esportato potrebbero risultare molto più elevate rispetto ai dati di origine.
- Quando i dati vengono importati, se la tabella di destinazione è stata abilitata per la compressione i dati vengono convertiti dal motore di database in formato di riga compresso. In questo modo l'utilizzo della CPU potrebbe aumentare rispetto a una situazione in cui i dati vengono importati in una tabella non compressa.
- Quando i dati vengono importati in blocco in un heap con compressione di pagina, al momento dell'inserimento dei dati l'operazione di importazione in blocco tenta di comprimerli mediante la compressione di pagina.
- La compressione non influisce sulle operazioni di backup e ripristino.
- La compressione non influisce sul log shipping.
- La compressione dei dati è incompatibile con le colonne di tipo sparse. Non è pertanto possibile comprimere le tavole contenenti colonne di tipo sparse, né aggiungere le colonne di questo tipo a una tabella compressa.
- L'abilitazione della compressione può provocare la modifica dei piani di query, in quanto i dati vengono archiviati tramite un numero diverso di pagine e un numero diverso di righe per pagina.
Contenuto correlato
- Implementazione della compressione di riga
- Implementazione della compressione di pagina
- Implementazione della compressione Unicode
- CREATE PARTITION SCHEME (Transact-SQL)
- CREATE PARTITION FUNCTION (Transact-SQL)
- CREATE TABLE (Transact-SQL)
- ALTER TABLE (Transact-SQL)
- CREATE INDEX (Transact-SQL)
- ALTER INDEX (Transact-SQL)