Tamaño de tabla y fila de las tablas con optimización para memoria

Artículo
10/18/2019

Una tabla optimizada para memoria consta de una colección de filas e índices que contienen punteros a las filas. En una tabla optimizada para memoria, las filas no pueden ser mayores de 8060 bytes. Conocer el tamaño de una tabla optimizada para memoria le ayudará a saber si el equipo tiene memoria suficiente.

Hay dos motivos para calcular el tamaño de tabla y fila:

¿Cuánta memoria usa una tabla?
- La cantidad de memoria utilizada por la tabla no se puede calcular con precisión. Muchos factores afectan a la cantidad de memoria utilizada. Factores como la asignación de memoria basada en páginas, localidad, almacenamiento en caché y relleno. Además, varias versiones de fila que tengan transacciones activas asociadas o que estén esperando para la recolección de elementos no utilizados.
- El tamaño mínimo necesario para los datos y los índices de la tabla viene proporcionado por el cálculo del [tamaño de la tabla], descrito a continuación.
- El cálculo del uso de memoria es, en el mejor caso, una aproximación y es preferible incluir el planeamiento de la capacidad en los planes de implementación.
El tamaño de los datos de una fila y si cabe en la limitación de tamaño de fila de 8.060 bytes. Para responder a estas preguntas, utilice el cálculo del [tamaño del texto de la fila], descrito a continuación.

La ilustración siguiente muestra una tabla con índices y filas, que a su vez tienen encabezados de fila y cuerpos:

Tabla optimizada para memoria.
La tabla con optimización para memoria, que consta de índices y filas.

El tamaño en memoria de una tabla, en bytes, se calcula de la forma siguiente:

[table size] = [size of index 1] + ... + [size of index n] + ([row size] * [row count])

El tamaño de un índice hash se fija en el momento de creación de la tabla y depende del número real de cubos. El bucket_count especificado con la especificación de índice se redondea a la potencia más cercana de 2 para obtener el [número real de cubos]. Por ejemplo, si el bucket_count especificado es 100000, el [número real de cubos] para el índice es 131072.

[hash index size] = 8 * [actual bucket count]

El tamaño de fila se calcula agregando el encabezado y el cuerpo:

[row size] = [row header size] + [actual row body size]  
[row header size] = 24 + 8 * [number of indices]

Tamaño del cuerpo de la fila

El recálculo de [tamaño del cuerpo de la fila] se describe en la siguiente tabla.

Hay dos cálculos diferentes para el tamaño del cuerpo de la fila: el tamaño calculado y el tamaño real:

El tamaño calculado, indicado mediante el [tamaño del cuerpo calculado de la fila], se utiliza para determinar si la limitación de tamaño de fila de 8.060 bytes se supera.
El tamaño real se indica con [tamaño del texto real de la fila], es el tamaño de almacenamiento real del cuerpo de la fila en memoria y en los archivos de puntos de comprobación.

Ambos [tamaño del cuerpo calculado de la fila] y [tamaño del texto real de la fila] se calculan de igual forma. La única diferencia es el cálculo de tamaño de las columnas (n)varchar(i) y varbinary(i), como se refleja en la parte inferior de la tabla siguiente. El tamaño del cuerpo calculado de la fila utiliza el tamaño i declarado como tamaño de columna, mientras que el tamaño del cuerpo real de la fila utiliza el tamaño real de los datos.

En la tabla siguiente se describe el cálculo del tamaño del cuerpo de fila, indicado como [tamaño real del cuerpo de fila] = SUM([tamaño de tipos superficiales]) + 2 + 2 * [número de columnas de tipo profundo].

Sección	Size	Comentarios
Columnas de tipo superficial	SUM([tamaño de tipos poco profundos]) El tamaño de los tipos individuales es el siguiente: Bit \| 1 Tinyint \| 1 Smallint \| 2 Int \| 4 Real \| 4 Smalldatetime \| 4 Smallmoney \| 4 Bigint \| 8 Datetime \| 8 Datetime2 \| 8 Float 8 Money 8 Numérico (precisión <=18) \| 8 Hora \| 8 Numeric(precision>18) \| 16 Uniqueidentifier \| 16
Relleno superficial de la columna	Los valores posibles son: 1, si hay columnas de tipo profundo y el tamaño total de datos de las columnas superficiales es un número impar. De lo contrario, es 0	Los tipos profundos son (var)binary y (n)(var)char.
Matriz de desplazamiento para las columnas de tipo profundo	Los valores posibles son: 0, si no hay columnas de tipos profundos 2 + 2 * [número de columnas de tipo profundo], en caso contrario	Los tipos profundos son (var)binary y (n)(var)char.
Matriz NULL	[número de columnas que admiten valores NULL] / 8, redondeado a bytes completos.	La matriz tiene un bit por cada columna que admite valores NULL. Se redondea a bytes completos.
Relleno de matriz NULL	Los valores posibles son: 1, si hay columnas de tipo profundo y el tamaño de la matriz NULL es un número de bytes impar. De lo contrario, es 0	Los tipos profundos son (var)binary y (n)(var)char.
Relleno	Si no hay columnas de tipos profundos: 0 Si hay columnas de tipo profundo, se agregan los bytes de relleno 0-7, según la alineación mayor requerida por una columna superficial. Cada columna superficial requiere una alineación igual a su tamaño según se documentó anteriormente, salvo en que las columnas GUID necesitan la alineación de 1 byte (no 16) y las columnas numéricas necesitan siempre la alineación de 8 bytes (nunca 16). Se usa el requisito de alineación mayor entre todas las columnas superficiales y se agregan los bytes 0 a 7 de relleno de forma que el tamaño total (sin las columnas de tipo profundo) sea un múltiplo de la alineación requerida.	Los tipos profundos son (var)binary y (n)(var)char.
Columnas de tipo profundo de longitud fija	SUM([tamaño de columnas de tipo profundo de longitud fija]) El tamaño de cada columna es el siguiente: i para char(i) y binary(i). 2 * i para nchar(i)	Las columnas de tipo profundo de longitud fija son de tipo char(i), nchar(i) o binary(i).
Columnas de tipo profundo de longitud variable [tamaño calculado]	SUM([tamaño calculado de columnas de tipo profundo de longitud variable]) El tamaño calculado de cada columna es el siguiente: i para varchar(i) y varbinary(i) 2 * i para nvarchar(i)	Esta fila solo se aplica al [tamaño del texto calculado de la fila]. Las columnas de tipo profundo de longitud variable son de tipo varchar(i), nvarchar(i) o varbinary(i). El tamaño calculado se determina mediante la longitud máxima (i) de la columna.
Columnas de tipo profundo de longitud variable [tamaño real]	SUM([tamaño real de columnas de tipo profundo de longitud variable]) El tamaño real de cada columna es el siguiente: n, donde n es el número de caracteres almacenados en la columna, para varchar(i). 2 * n, donde n es el número de caracteres almacenados en la columna, para nvarchar(i). n, donde n es el número de bytes almacenados en la columna, para varbinary(i).	Esta fila solo se aplica al [tamaño del texto real de la fila]. El tamaño real se determina con los datos almacenados en las columnas de la fila.

Estructura de filas

Las filas de una tabla optimizada para memoria tienen los siguientes componentes:

El encabezado de fila contiene la marca de tiempo necesaria para implementar las versiones de fila. El encabezado de fila también contiene el puntero de índice para implementar el encadenamiento de filas en cubos de hash (descritos arriba).
El cuerpo de la fila contiene los datos de columna reales, lo que incluye cierta información auxiliar como la matriz NULL para las columnas que aceptan valores NULL y la matriz de desplazamiento para los tipos de datos de longitud variable.

La ilustración siguiente muestra la estructura de la fila de una tabla que tenga dos índices:

Estructura de fila de una tabla que tiene dos índices.

Las marcas de tiempo de inicio y fin indican el periodo en el que una determinada versión de fila es válida. Las transacciones que se inician en este intervalo pueden ver esta versión de fila. Para obtener más detalles, consulte Transacciones en tablas con optimización para memoria.

Los punteros de índice señalan a la siguiente fila de la cadena que pertenece al cubo de hash. La ilustración siguiente muestra la estructura de una tabla con dos columnas (name, city) y dos índices, uno en el nombre de columna y en otro en la ciudad de la columna.

Estructura de una tabla con dos columnas e índices.

En esta ilustración, se aplica un algoritmo hash a los nombres John y Jane para el primer cubo. Se aplica el algoritmo hash a Susan para el segundo cubo. Se aplica el algoritmo hash a las ciudades Beijing y Bogotá para el primer cubo. Se aplica el algoritmo hash a París y Praga para el segundo cubo.

Por tanto, las cadenas para el índice hash en el nombre son las siguientes:

Primer cubo: (John, Beijing); (John, París); (Jane, Praga)
Segundo cubo: (Susan, Bogotá)

Las cadenas para el índice de la ciudad son las siguientes:

Primer cubo: (John, Beijing), (Susan, Bogotá)
Segundo cubo: (John, París), (Jane, Praga)

Una marca de tiempo de extremo ∞ (infinito) indica que esta es la versión no válida de la fila. La fila no se ha actualizado ni se ha eliminado desde que esta versión de fila se escribió.

Para un tiempo mayor que 200, la tabla contiene las filas siguientes:

Nombre	City
John	Beijing
Julia	Praga

Sin embargo, cualquier transacción activa con el tiempo de inicio 100 verá la versión siguiente de la tabla:

Nombre	City
John	Paris
Julia	Praga
Susan	Bogotá

Ejemplo: Cálculo del tamaño de fila y tabla

Para los índices hash, el número de cubos real se redondea a la potencia más cercana de 2. Por ejemplo, si el bucket_count especificado es 100000, el número real de cubos para el índice es 131072.

Considere una tabla Orders con la definición siguiente:

CREATE TABLE dbo.Orders (  
     OrderID int NOT NULL   
           PRIMARY KEY NONCLUSTERED,  
     CustomerID int NOT NULL   
           INDEX IX_CustomerID HASH WITH (BUCKET_COUNT=10000),  
     OrderDate datetime NOT NULL,  
     OrderDescription nvarchar(1000)  
) WITH (MEMORY_OPTIMIZED=ON)  
GO

Observe que esta tabla tiene un índice hash y un índice no clúster (la clave principal). También tiene tres columnas de longitud fija y una columna de longitud variable, con una de las columnas que admiten valores NULL (OrderDescription). Supongamos que la tabla Orders tiene 8379 filas y la longitud media de los valores de la columna OrderDescription tiene 78 caracteres.

Para determinar el tamaño de la tabla, primero determine el tamaño de los índices. El bucket_count para ambos índices se especifica como 10000. Se redondea a la potencia más cercana de 2: 16384. Por consiguiente, el tamaño total de los índices de la tabla Orders es:

8 * 16384 = 131072 bytes

Lo que permanece en el tamaño de los datos de la tabla, que es

[row size] * [row count] = [row size] * 8379

(La tabla de ejemplo tiene 8379 filas.) Ahora, tenemos:

[row size] = [row header size] + [actual row body size]  
[row header size] = 24 + 8 * [number of indices] = 24 + 8 * 1 = 32 bytes

A continuación, vamos a calcular [tamaño del cuerpo real de la fila]:

Columnas de tipo superficial:

SUM([size of shallow types]) = 4 [int] + 4 [int] + 8 [datetime] = 16

El relleno superficial de la columna es 0, ya que el tamaño total de la columna es uniforme.
Matriz de desplazamiento para las columnas de tipo profundo:
```
2 + 2 * [number of deep type columns] = 2 + 2 * 1 = 4  
```
Matriz NULL = 1
El relleno NULL de matriz = 1, como el tamaño de la matriz NULL es impar y hay una columna de tipo profundo.
Relleno
- 8 es el requisito mayor de alineación.
- El tamaño es hasta ahora 16 + 0 + 4 + 1 + 1 = 22.
- El múltiplo más cercano de 8 es 24.
- El relleno total es 24 - 22 = 2 bytes.
No hay columnas de tipo profundo de longitud fija (columnas de tipo profundo de longitud fija: 0.).
El tamaño real de la columna de tipo profundo es 2 * 78 = 156. La única columna de tipo profundo OrderDescription tiene el tipo nvarchar.

[actual row body size] = 24 + 156 = 180 bytes

Para completar el cálculo:

[row size] = 32 + 180 = 212 bytes  
[table size] = 8 * 16384 + 212 * 8379 = 131072 + 1776348 = 1907420

El tamaño total de la tabla en memoria es de aproximadamente 2 megabytes. Esto no tiene en cuenta la sobrecarga potencial provocada por la asignación de memoria junto con las versiones de fila necesarias para las transacciones que tienen acceso a esta tabla.

La memoria real asignada a esta tabla y usada por ella y sus índices se pueden obtener con la consulta siguiente:

select * from sys.dm_db_xtp_table_memory_stats  
where object_id = object_id('dbo.Orders')

Consulte también

Tablas optimizadas para la memoria

Compartir a través de

Tamaño de tabla y fila de las tablas con optimización para memoria

Estructura de filas

Ejemplo: Cálculo del tamaño de fila y tabla

Consulte también

Recursos adicionales