Artículo
03/30/2012

Estimar el tamaño de un índice clúster

Los siguientes pasos pueden utilizarse para calcular el espacio necesario para almacenar datos en un índice clúster:

Calcule el espacio utilizado para almacenar datos en el nivel hoja del índice clúster.
Calcule el espacio utilizado para almacenar información del índice clúster.
Sume los valores calculados.

Paso 1. Calcular el espacio utilizado para almacenar datos en el nivel hoja

Especifique el número de filas que habrá en la tabla:

Num_Rows = número de filas de la tabla
Especifique el número de columnas de longitud fija y de longitud variable, y calcule el espacio necesario para su almacenamiento:

Calcule el espacio que ocupa cada uno de estos grupos de columnas en la fila de datos. El tamaño de una columna depende del tipo y la longitud especificados para los datos. Para obtener más información, vea Tipos de datos (motor de base de datos).

Num_Cols = número total de columnas (de longitud fija y variable)

Fixed_Data_Size = tamaño total en bytes de todas las columnas de longitud fija

Num_Variable_Cols = número de columnas de longitud variable

Max_Var_Size = tamaño máximo en bytes de todas las columnas de longitud variable
Si el índice clúster no es único, tenga en cuenta la columna de valor de unicidad:

La columna de valor de unicidad es una columna de longitud variable que admite valores NULL. No será NULL y tendrá 4 bytes de tamaño en filas que tienen valores de clave no únicos. Este valor forma parte de la clave de índice y es necesario para asegurarse de que cada fila tiene un valor de clave único.

Num_Cols = Num_Cols + 1

Num_Variable_Cols = Num_Variable_Cols + 1

Max_Var_Size = Max_Var_Size + 4

Estas modificaciones presuponen que todos los valores no serán únicos.
Una parte de la fila, conocida como el mapa de bits NULL, se reserva para administrar la nulabilidad de las columnas. Calcule el tamaño:

Null_Bitmap = 2 + ((Num_Cols + 7) / 8)

Sólo debe utilizarse la parte entera de la expresión anterior; descarte el resto.
Calcule el tamaño de los datos de longitud variable:

Si hay columnas de longitud variable en la tabla, determine cuánto espacio se utiliza para almacenar las columnas en la fila:

Variable_Data_Size* = 2 + (Num_Variable_Cols x 2) + *Max_Var_Size

Los bytes agregados a ***Max_Var_Size*** son para el seguimiento de cada columna de longitud variable. En esta fórmula se supone que todas las columnas de longitud variable están llenas al 100%. Si prevé que va a utilizarse un porcentaje inferior del espacio de almacenamiento de columnas de longitud variable, puede ajustar el valor de ***Max_Var_Size*** en función de ese porcentaje para obtener una estimación más precisa del tamaño global de la tabla.

<div class="alert">


> [!NOTE]
> <P>Puede combinar las columnas varchar, nvarchar, varbinary o sql_variant de forma que el ancho de tabla total definido supere los 8.060 bytes. La longitud de cada una de estas columnas debe ajustarse al límite de 8.000 bytes en columnas varchar, varbinary o sql_variant y de 4.000 bytes en columnas nvarchar. Sin embargo, el ancho combinado puede superar el límite de 8.060 bytes de una tabla. Para obtener más información, vea <A href="ms186981(v=sql.105).md">Datos de desbordamiento de fila superiores a 8 KB</A>.</P>


</div>

Si no hay columnas de longitud variable, seleccione el valor 0 para ***Variable_Data_Size***.

Calcule el tamaño total de la fila:

Row_Size = Fixed_Data_Size + Variable_Data_Size + Null_Bitmap + 4

El valor 4 representa la sobrecarga del encabezado de una fila de datos.
Calcule el número de filas por página (8.096 bytes libres por página):

Rows_Per_Page = 8096 / (Row_Size + 2)

Dado que las filas no abarcan varias páginas, el número de filas por página debe redondearse hacia abajo a la fila completa más cercana. El valor 2 de la fórmula representa la entrada de la fila en la matriz de zonas de la página.
Calcule el número de filas libres reservadas por página, según el factor de relleno especificado:

Free_Rows_Per_Page = 8096 x ((100 - Fill_Factor) / 100) / (Row_Size + 2)

El factor de relleno que se utiliza en el cálculo es un valor entero, en vez de un porcentaje. Dado que las filas no abarcan varias páginas, el número de filas por página debe redondearse hacia abajo a la fila completa más cercana. A medida que aumenta el factor de relleno, más datos se almacenan en cada página y menos páginas habrá. El valor 2 de la fórmula representa la entrada de la fila en la matriz de zonas de la página.
Calcule el número de páginas necesarias para almacenar todas las filas:

Num_Leaf_Pages = Num_Rows / (Rows_Per_Page - Free_Rows_Per_Page)

El número de páginas estimado debe redondearse hacia arriba a la página completa más cercana.
Calcule la cantidad de espacio necesario para almacenar los datos en el nivel hoja (8.192 bytes por página):

Leaf_space_used* = 8192 x *Num_Leaf_Pages

Paso 2. Calcular el espacio utilizado para almacenar información de índice

Los siguientes pasos pueden utilizarse para calcular el espacio necesario para almacenar los niveles superiores del índice:

Especifique el número de columnas de longitud fija y de longitud variable de la clave de índice y calcule el espacio necesario para su almacenamiento:

Las columnas de clave de un índice pueden incluir columnas de longitud fija y de longitud variable. Para estimar el tamaño de las filas de índice de nivel interior, calcule el espacio que ocupa cada uno de estos grupos de columnas en la fila de índice. El tamaño de una columna depende del tipo y la longitud especificados para los datos. Para obtener más información, vea Tipos de datos (motor de base de datos).

Num_Key_Cols = número total de columnas de clave (de longitud fija y variable)

Fixed_Key_Size = tamaño total en bytes de todas las columnas de clave de longitud fija

Num_Variable_Key_Cols = número de columnas de clave de longitud variable

Max_Var_Key_Size = tamaño máximo en bytes de todas las columnas de clave de longitud variable
Tenga en cuenta cualquier columna de valor de unicidad si el índice no es único:

La columna de valor de unicidad es una columna de longitud variable que admite valores NULL. No será NULL y tendrá 4 bytes de tamaño en filas que tienen valores de clave de índice no únicos. Este valor forma parte de la clave de índice y es necesario para asegurarse de que cada fila tiene un valor de clave único.

Num_Key_Cols = Num_Key_Cols + 1

Num_Variable_Key_Cols = Num_Variable_Key_Cols + 1

Max_Var_Key_Size = Max_Var_Key_Size + 4

Estas modificaciones presuponen que todos los valores no serán únicos.
Calcule el tamaño del mapa de bits NULL:

Si hay columnas que admiten valores NULL en la clave de índice, una parte de la fila de índice se reserva para el mapa de bits NULL. Calcule el tamaño:

Index_Null_Bitmap = 2 + ((número de columnas de la fila de índice + 7) / 8)

Solamente debe utilizarse la parte entera de la expresión anterior. Descarte el resto.

Si no hay columnas de claves que admitan valores NULL, seleccione el valor 0 para Index_Null_Bitmap.
Calcule el tamaño de los datos de longitud variable:

Si hay columnas de longitud variable en el índice, determine cuánto espacio se utiliza para almacenar las columnas en la fila de índice:

Variable_Key_Size* = 2 + (Num_Variable_Key_Cols x 2) + *Max_Var_Key_Size

Los bytes agregados a ***Max_Var_Key_Size*** son para el seguimiento de cada columna de longitud variable. En esta fórmula se supone que todas las columnas de longitud variable están llenas al 100%. Si prevé que va a utilizarse un porcentaje inferior del espacio de almacenamiento de columnas de longitud variable, puede ajustar el valor de ***Max_Var_Key_Size*** en función de ese porcentaje para obtener una estimación más precisa del tamaño global de la tabla.

Si no hay columnas de longitud variable, seleccione el valor 0 para ***Variable_Key_Size***.

Calcule el tamaño de la fila del índice:

Index_Row_Size = Fixed_Key_Size + Variable_Key_Size + Index_Null_Bitmap + 1 (para la sobrecarga de encabezado de una fila de índice) + 6 (para el puntero de identificador de página secundaria)
Calcule el número de filas de índice por página (8.096 bytes disponibles por página):

Index_Rows_Per_Page = 8096 / (Index_Row_Size + 2)

Dado que las filas de índice no abarcan varias páginas, el número de filas de índice por página debe redondearse hacia abajo a la fila completa más cercana. El valor 2 de la fórmula representa la entrada de la fila en la matriz de zonas de la página.
Calcule el número de niveles del índice:

Non-leaf_Levels = 1 + log Index_Rows_Per_Page (Num_Leaf_Pages / Index_Rows_Per_Page)

Redondee este valor al número entero más próximo. Este valor no incluye el nivel hoja del índice clúster.
Calcule el número de páginas no hoja del índice:

Num_Index_Pages =∑Level (Num_Leaf_Pages / (Index_Rows_Per_PageLevel))

donde 1 \<= Level \<= ***Non-leaf_Levels***

Redondee cada sumando al número entero más próximo. Como ejemplo sencillo, considere un índice en el que ***Num_Leaf_Pages*** = 1000 e ***Index_Rows_Per_Page*** = 25. El primer nivel de índice por encima del nivel hoja almacena 1000 filas de índice, lo que equivale a una fila de índice por página hoja, y en cada página caben 25 filas de índice. Esto significa que se necesitan 40 páginas para almacenar las 1000 filas de índice. El siguiente nivel del índice debe almacenar 40 filas. Esto significa que necesita 2 páginas. El nivel final del índice debe almacenar 2 filas. Esto significa que necesita 1 página. Todo ello supone 43 páginas de índice no hoja. Si se utilizan estos números en las fórmulas anteriores, el resultado será el siguiente:

***Non-leaf_Levels*** = 1 + log25 (1000 / 25) = 3

***Num_Index_Pages*** = 1000/(253)+ 1000/(252) + 1000/(251) = 1 + 2 + 40 = 43, que es el número de páginas que se describe en el ejemplo.

Calcule el tamaño del índice (8.192 bytes por página):

Index_Space_Used* = 8192 x *Num_Index_Pages

Paso 3. Sumar los valores calculados

Sume los valores obtenidos en los dos pasos anteriores:

Tamaño del índice clúster (bytes) = Leaf_Space_Used + Index_Space_used

Este cálculo no tiene en cuenta lo siguiente:

Particiones

La sobrecarga de espacio de la creación de particiones es mínima, pero resulta difícil de calcular. No es importante incluirla.
Páginas de asignación

Se utiliza al menos una página IAM para realizar un seguimiento de las páginas asignadas a un montón, pero la sobrecarga de espacio es mínima y no existe ningún algoritmo para calcular de forma determinista el número exacto de páginas IAM que se utilizarán.
Valores de objetos grandes (LOB)

El algoritmo para determinar exactamente la cantidad de espacio que se utilizará para almacenar los tipos de datos LOB y los valores varchar(max), varbinary(max), nvarchar(max), text, ntext, xml y image es complejo. Basta con agregar solo el tamaño medio de los valores LOB que se esperan, multiplicarlo por Num_Rows y agregarlo al tamaño total del índice clúster.
Compresión

No se puede calcular previamente el tamaño de un índice comprimido.
Columnas dispersas

Para obtener información sobre los requisitos de espacio de las columnas dispersas, vea Usar columnas dispersas.