Stima delle dimensioni di un indice cluster
Data aggiornamento: 15 settembre 2007
Per stimare la quantità di spazio necessario per archiviare dati in un indice cluster, è possibile utilizzare la procedura seguente:
- Calcolare lo spazio utilizzato per archiviare dati nel livello foglia dell'indice cluster.
- Calcolare lo spazio utilizzato per archiviare le informazioni sugli indici per l'indice cluster.
- Effettuare il totale dei valori calcolati.
Passaggio 1. Calcolare lo spazio utilizzato per archiviare i dati nel livello foglia
Specificare il numero di righe che verranno incluse nella tabella:
Num_Rows = numero di righe nella tabellaSpecificare il numero di colonne di lunghezza fissa e e variabile e calcolare lo spazio necessario per la loro archiviazione:
Calcolare lo spazio occupato da ognuno di questi gruppi di colonne all'interno della riga di dati. Le dimensioni di una colonna dipendono dal tipo di dati e dalla lunghezza specificata. Per ulteriori informazioni, vedere Tipi di dati (Motore di database).
Num_Cols = numero totale di colonne (a lunghezza fissa e a lunghezza variabile)
Fixed_Data_Size = dimensioni totali in byte di tutte le colonne a lunghezza fissa
Num_Variable_Cols = numero di colonne a lunghezza variabile
Max_Var_Size = dimensioni massime in byte di tutte le colonne a lunghezza variabileSe l'indice cluster è non univoco, considerare la colonna uniqueifier:
La colonna uniqueifier è una colonna a lunghezza variabile che supporta valori Null. Sarà una colonna non Null da 4 byte nelle righe che includono valori chiave non univoci. Questo valore fa parte della chiave di indice ed è necessario per garantire che ogni riga includa un valore di chiave univoca.
Num_Cols = Num_Cols + 1
Num_Variable_Cols = Num_Variable_Cols + 1
Max_Var_Size = Max_Var_Size + 4
In queste modifiche si presuppone che tutti i valori siano non univoci.Parte della riga, nota come mappa di bit Null, è riservata alla gestione del supporto di valori NULL per la colonna. Calcolarne le dimensioni:
Null_Bitmap = 2 + ((Num_Cols + 7) / 8)
Utilizzare solo la parte intera del risultato dell'espressione indicata in precedenza, eliminando eventuali resti.Calcolare le dimensioni dei dati a lunghezza variabile:
Se la tabella include colonne di lunghezza variabile, determinare la quantità di spazio utilizzata per l'archiviazione delle colonne nella riga:
Variable_Data_Size* = 2 + (Num_Variable_Cols x 2) + *Max_Var_Size Questa formula si basa sul presupposto che tutte le colonne di lunghezza variabile siano piene al 100%. Se si prevede una percentuale inferiore di utilizzo dello spazio di archiviazione delle colonne di lunghezza variabile, è possibile modificare il valore Max_Var_Size in base a tale percentuale per ottenere una stima più precisa delle dimensioni complessive della tabella.[!NOTA] In SQL Server 2005 è possibile combinare colonne varchar, nvarchar, varbinary o sql_variant in modo che la larghezza totale definita della tabella superi 8.060 byte. La lunghezza di ogni colonna deve essere compresa nel limite di 8.000 byte per una colonna varchar, varbinary o sql_variant e di 4.000 byte per le colonne nvarchar. Le larghezze combinate di tali colonne possono tuttavia superare il limite di 8.060 byte in una tabella. Per ulteriori informazioni, vedere Dati di overflow della riga che superano 8 KB.
Se non sono disponibili colonne di lunghezza variabile, impostare Variable_Data_Size su 0.
Calcolare le dimensioni totali della riga:
Row_Size = Fixed_Data_Size + Variable_Data_Size + Null_Bitmap + 4
Il valore 4 rappresenta l'overhead dell'intestazione di riga di una riga di dati.Calcolare il numero di righe per pagina (8096 byte liberi per pagina):
Rows_Per_Page = 8096 / (Row_Size + 2)
Poiché le righe non si estendono su più pagine, il numero di righe per pagina deve essere arrotondato alla riga completa più vicina. Il valore 2 nella formula rappresenta la voce della riga nella matrice di slot della pagina.Calcolare il numero di righe libere riservate per pagina, in base al fattore di riempimento specificato:
Free_Rows_Per_Page = 8096 x ((100 - Fill_Factor) / 100) / (Row_Size + 2)
Il fattore di riempimento utilizzato nel calcolo è un valore intero, non una percentuale. Poiché le righe non si estendono su più pagine, il numero di righe per pagina deve essere arrotondato alla riga completa più vicina. Con l'aumentare del fattore di riempimento, in ogni pagina verrà archiviata una maggiore quantità di dati e il numero di pagine diminuirà. Il valore 2 nella formula rappresenta la voce della riga nella matrice di slot della pagina.Calcolare il numero di pagine necessario per archiviare tutte le righe:
Num_Pages = Num_Rows / (Rows_Per_Page - Free_Rows_Per_Page)
Il numero di pagine stimato deve essere arrotondato alla pagina intera più vicina.Calcolare la quantità di spazio necessaria per archiviare i dati nel livello foglia (8192 byte totali per pagina):
Leaf_space_used* = 8192 x *Num_Pages
Passaggio 2. Calcolare lo spazio utilizzato per archiviare le informazioni sull'indice
Per stimare la quantità di spazio necessario per archiviare i livelli superiori dell'indice, è possibile utilizzare la procedura seguente:
- Specificare il numero di colonne a lunghezza fissa e a lunghezza variabile nella chiave di indice e calcolare lo spazio necessario per la relativa archiviazione:
Le colonne chiave di un indice possono includere colonne a lunghezza fissa e a lunghezza variabile. Per stimare le dimensioni delle righe di indice di livello interno, calcolare lo spazio occupato da ognuno di questi gruppi di colonne all'interno della riga di indice. Le dimensioni di una colonna dipendono dal tipo di dati e dalla lunghezza specificata. Per ulteriori informazioni, vedere Tipi di dati (Motore di database).
Num_Key_Cols = numero totale di colonne chiave (a lunghezza fissa e a lunghezza variabile)
Fixed_Key_Size = dimensioni totali in byte di tutte le colonne chiave a lunghezza fissa
Num_Variable_Key_Cols = numero di colonne chiave a lunghezza variabile
Max_Var_Key_Size = dimensioni massime in byte di tutte le colonne chiave a lunghezza variabile - Considerare le eventuali colonne uniqueifier necessarie se l'indice è non univoco:
La colonna uniqueifier è una colonna a lunghezza variabile che supporta valori Null. Sarà una colonna non Null da 4 byte nelle righe che includono valori chiave di indice non univoci. Questo valore fa parte della chiave di indice ed è necessario per garantire che ogni riga includa un valore di chiave univoca.
Num_Key_Cols = Num_Key_Cols + 1
Num_Variable_Key_Cols = Num_Variable_Key_Cols + 1
Max_Var_Key_Size = Max_Var_Key_Size + 4
In queste modifiche si presuppone che tutti i valori siano non univoci. - Calcolare le dimensioni della mappa di bit Null:
Se nella chiave di indice sono incluse colonne che supportano valori Null, una parte della riga di indice viene riservata per la mappa di bit Null. Calcolarne le dimensioni:
Index_Null_Bitmap = 2 + ((numero di colonne chiave che supportano valori Null + 7) / 8)
Deve essere utilizzata solo la parte intera dell'espressione precedente. Eliminare l'eventuale resto.
Se non vi sono colonne chiave che supportano valori Null, impostare Index_Null_Bitmap su 0. - Calcolare le dimensioni dei dati a lunghezza variabile:
Se l'indice include colonne a lunghezza variabile, determinare la quantità di spazio utilizzata per l'archiviazione delle colonne nella riga di indice:
Variable_Key_Size* = 2 + (Num_Variable_Key_Cols x 2) + *Max_Var_Key_Size Questa formula si basa sul presupposto che tutte le colonne a lunghezza variabile siano piene al 100%. Se si prevede una percentuale inferiore di utilizzo dello spazio di archiviazione delle colonne a lunghezza variabile, è possibile modificare il valore di Max_Var_Key_Size in base a tale percentuale per ottenere una stima più accurata delle dimensioni complessive della tabella.
Se non sono disponibili colonne a lunghezza variabile, impostare Variable_Key_Size su 0. - Calcolare le dimensioni della riga di indice:
Index_Row_Size = Fixed_Key_Size + Variable_Key_Size + Index_Null_Bitmap + 1 (per l'overhead dell'intestazione di una riga di indice) + 6 (per il puntatore ID della pagina figlio) - Calcolare il numero di righe di indice per pagina (8096 byte liberi per pagina):
Index_Rows_Per_Page = 8096 / (Index_Row_Size + 2)
Poiché le righe di indice non si estendono su più pagine, il numero di righe di indice per pagina deve essere arrotondato alla riga completa più vicina. Il valore 2 nella formula rappresenta la voce della riga nella matrice di slot della pagina. - Calcolare il numero di livelli nell'indice:
Livelli = 1 + log Index_Rows_Per_Page (Num_Rows / Index_Rows_Per_Page)
Arrotonda questo valore per eccesso al numero intero più prossimo. Nel valore non è incluso il livello foglia dell'indice cluster. - Calcolare il numero di pagine nell'indice:
Num_Index_Pages =∑Level (Num_Rows / (Index_Rows_Per_PageLevel)) dove 1 <= Livello <= Levels
Quale esempio semplice, considerare un indice in cui il numero totale di righe di indice necessario al livello superiore rispetto al livello foglia è 1000, e in cui in ogni pagina possono essere incluse 25 righe di indice. Ciò significa che per archiviare le 1000 righe sono necessarie 40 pagine. Nel livello successivo dell'indice devono essere archiviate 40 righe. Sono pertanto necessarie 2 pagine. Nel livello finale dell'indice devono essere archiviate 2 righe. È pertanto necessaria una pagina. Se nella formula precedente si utilizzano questi numeri, il risultato sarà il seguente:
Height = 1 + log25 (1000 / 25) = 3
Num_Index_Pages = (1000/(25)3) + (1000/(25)2) + (1000/(25)1) = 43, che rappresenta il numero di pagine descritto nell'esempio. - Calcolare le dimensioni dell'indice (8192 byte totali per pagina):
Index_Space_Used* = 8192 x *Num_Index_Pages
Passaggio 3. Effettuare il totale dei valori calcolati
Calcolare il totale dei valori ottenuti dai due passaggi precedenti:
Dimensioni indice cluster (byte) = Leaf_Space_Used + Index_Space_used
Nel calcolo non vengono considerati i fattori seguenti:
- Partizionamento
L'overhead dello spazio derivante dal partizionamento è minimo, ma difficile da calcolare. Non è fondamentale includerlo. - Pagine di allocazione
Esiste almeno una pagina IAM utilizzata per tenere tracca delle pagine allocate su un heap, ma l'overhead dello spazio è minimo e non è presente alcun algoritmo per calcolare in modo deterministico l'esatto numero di pagine IAM che verranno utilizzate. - Valori LOB
L'algoritmo per determinare esattamente la quantità di spazio utilizzata per archiviare i tipi di dati LOB varchar(max), varbinary(max), nvarchar(max), text, ntext, xml e image è complesso. È sufficiente aggiungere le dimensioni medie dei valori LOB previste, moltiplicare per Num_Rows e quindi aggiungere il valore ottenuto alle dimensioni totali dell'indice cluster.
Vedere anche
Concetti
Linee guida per la progettazione di indici cluster
Creazione di indici (Motore di database)
Linee guida per la progettazione di un indice non cluster
Stima delle dimensioni di una tabella
Stima delle dimensioni di un indice non cluster
Stima delle dimensioni di un heap
Altre risorse
Stima delle dimensioni di un database
Guida in linea e informazioni
Cronologia modifiche
Versione | Cronologia |
---|---|
15 settembre 2007 |
|