估计堆的大小
适用于: SQL Server Azure SQL 数据库 Azure SQL 托管实例 Azure Synapse Analytics 分析平台系统 (PDW)
可以使用以下步骤估计在堆中存储数据所需的空间量:
指定表中显示的行数:
Num_Rows = 表中的行数
指定固定长度和可变长度列的数量,并计算存储所需的空间:
计算每组列在数据行中所占据的空间。 列的大小取决于数据类型和长度规定。
Num_Cols = 总列数(固定长度和可变长度)
Fixed_Data_Size = 所有固定长度列的总字节大小
Num_Variable_Cols = 可变长度列数
Max_Var_Size = 所有可变长度列的最大总字节大小
保留行中称为 Null 位图的部分以管理列的为空性。 计算其大小:
Null_Bitmap = 2 + ((Num_Cols + 7) / 8)
只应使用该表达式的整数部分。 而放弃所有余数。
计算可变长度数据的大小:
如果表中有可变长度列,请确定在行中存储这些列需使用的空间:
Variable_Data_Size = 2 + (Num_Variable_Cols x 2) + Max_Var_Size
添加到 Max_Var_Size 中的字节用于跟踪每个可变长度列。 此公式假设所有可变长度列均百分之百充满。 如果预计可变长度列占用的存储空间比例较低,则可以按照该比例调整 Max_Var_Size 值,从而对整个表大小得出一个更准确的估计。
注意
你可以组合 varchar、 nvarchar、 varbinary或 sql_variant 列,使定义的表的总宽度超过 8,060 字节。 对于 varchar、nvarchar、varbinary 或 sql_variant 列,每列的长度仍不得超过 8,000 字节。 但是,表中这些列的组合宽度可超过 8,060 字节的限制。
如果没有可变长度列,请将 Variable_Data_Size 设置为 0。
计算总的行大小:
Row_Size = Fixed_Data_Size + Variable_Data_Size + Null_Bitmap + 4
公式中的值 4 是数据行的行标题开销。
下一步,计算每页的行数(每页有 8096 个可用字节):
Rows_Per_Page = 8096 / (Row_Size + 2)
因为行不跨页,所以每页的行数应向下舍入到最接近的整数。 公式中的数值 2 是计算行数时引入的行大小余量。
计算存储所有行所需的页数:
Num_Pages = Num_Rows / Rows_Per_Page
估计的页数应向上舍入到最接近的整数。
计算在堆中存储数据所需的空间量(每页的总字节为 8192):
堆大小(字节)= 8192 x Num_Pages
此计算不考虑以下因素:
分区
分区的空间开销很小,但是计算复杂。 是否包括它并不重要。
分配页
至少有一个 IAM 页用于跟踪为堆分配的页,但是空间开销很小,并且没有算法可以精确地计算出要使用的 IAM 页数。
大型对象 (LOB) 值
精确确定存储 LOB 数据类型 varchar(max)、 varbinary(max)、 nvarchar(max)、 text、 ntextxml和 image 值所用的空间量的算法非常复杂。 只添加所期望的 LOB 值的平均大小就足够了,然后将其添加至总的堆大小中。
压缩
无法预先计算压缩堆的大小。
稀疏列
有关稀疏列的空间要求的信息,请参阅 Use Sparse Columns。
另请参阅
堆(没有聚集索引的表)
描述的聚集索引和非聚集索引
创建聚集索引
创建非聚集索引
估计表的大小
估计聚集索引的大小
估计非聚集索引的大小
估计数据库的大小